
Polémica en el VAR: Mitos y realidades al descubierto
Polémica en el VAR: Mitos y realidades al descubierto
La polémica en torno al VAR ha provocado un gran debate entre los aficionados al fútbol, especialmente ahora que acabamos de transitar la Copa del Mundo.
Muchos creen que su uso ha afectado negativamente la emoción y el entusiasmo de los partidos al interrumpir con frecuencia la fluidez del juego o que no es lo suficientemente imparcial y que los errores pueden afectar al resultado final. Por otro lado, se encuentran quienes ven su uso como una herramienta útil para que los árbitros tomen decisiones correctas que de otro modo serían difíciles de conseguir.
Sin duda, las controversias sobre la utilización del VAR seguirán acompañando al fútbol hasta que se encuentre un equilibrio entre la imparcialidad y la emoción del juego. Sin embargo desde Intermedia, empresa especializada en el desarrollo de productos digitales y expertos en soluciones móviles, web, IA e IoT, hemos decidido hacer hincapié en el trasfondo de este tipo de tecnología de una manera objetiva, explicando cuestiones como sus antecedentes, algunas de sus curiosidades y otros temas que no suelen ser de dominio público.
Qué es el VAR y su llegada al fútbol
El VAR (Video Assistant Referee) es un sistema de árbitro asistente por vídeo utilizado en el fútbol. Consiste en una serie de cámaras colocadas estratégicamente en el campo para captar imágenes en todo momento y repeticiones a cámara lenta para situaciones específicas, como identificar el punto de contacto de una infracción física o la posición de una infracción. Se utiliza principalmente para juicios subjetivos, como determinar la intensidad de una transgresión o si una mano fue deliberada.
El VAR se aprobó en el Mundial 2018, limitando su uso a cuatro situaciones concretas: validación de gol, expulsión, penal y corroboración de la identidad de un amonestado, teniendo una métrica de precisión arbitral del 99,3%. Por su parte, en Argentina, hizo su debut oficial el jueves 31 de marzo de 2022, en la fecha 8 de la Liga Profesional. Sin embargo, éste ha tenido problemas en la determinación del fuera de juego por problemas de perspectiva y detección del momento de impacto del balón.
Según un estudio realizado por la Premier League en el 2021, de los 120 llamados al VAR, 44 involucraron posiciones fuera de juego (37%), y de 43 goles anulados, 32 fueron por fuera de juegos (73%). Por lo que solucionar o atacar un problema como la asistencia en la detección del fuera de juego, ha sido un gran avance.
Por otro lado, y en relación con algunos errores del VAR, aparece el sistema SAOT (Semi Automated Offside Technology) como una mejora de la tecnología que se venía utilizado en el fútbol. Éste fue desarrollado por Hawkeye Innovations, la empresa que popularizó el ojo de halcón en el tenis y pretende reducir los errores involuntarios e imponer objetividad en el proceso de decisión sobre el fuera de juego (con el SAOT) o el gol (con el GoalLine, tecnología para la detección de goles por imágenes). Esta tecnología ha sido probada durante casi dos años por prestigiosas universidades y grupos de investigación, y si bien se habla de precisión en milímetros, no se han encontrado valores publicados sobre la eficacia real del sistema, que lleva asociada una tasa de error.
¿Cómo funciona el VAR?
El equipo de VAR observa constantemente el partido para detectar posibles errores y se pone en contacto con el árbitro únicamente en caso de que se produzcan errores claros o se pasen por alto incidentes graves, ayudando al árbitro desde una sala de vídeo (VOR).
El equipo está compuesto por el asistente de vídeo y tres asistentes (denominados AVAR 1, AVAR 2 y AVAR 3). Además de ellos, participan tres técnicos de repeticiones que seleccionan y ofrecen las mejores tomas.
Por su parte, el SAOT (Semi Automated Offside Technology), utiliza 12 cámaras montadas en el techo de los estadios de fútbol que recopilan hasta 29 puntos de datos de cada uno de los 22 jugadores en el campo y la posición de la pelota, 50 veces por segundo.
Para lograr esto, se utilizan técnicas de Machine Learning y Computer Vision correspondientes a dos problemáticas generales. Por un lado, la detección y el trackeo de objetos, una de las más conocidas y divulgadas en la actualidad, en donde tiene como funcion principal identificar y localizar objetos en una imágen y/o video (en este caso personas/jugadores y pelota). Y por otra parte, se encuentra la estimación de pose que se encarga de inferir la postura de una persona en una imágen o video. Esto se logra, generalmente, identificando, localizando y trackeando una cierta cantidad de puntos clave en una persona determinada, que en los humanos representan articulaciones importantes, como un codo o una rodilla.Este último tipo de modelo toma una imágen procesada como entrada y luego genera como salida información sobre puntos clave indexados mediante un ID de pieza o parte predefinido, con una puntuación de confianza entre el 0.0 y 1.0, que indica la probabilidad de que exista un marcador de referencia en esa posición.
Relacionado a las técnicas mencionadas anteriormente, resulta un hecho que aunque existen conjuntos de datos de base como “COCO”, que se utilizan como punto de partida para entrenar y validar modelos de visión por computadora, a veces no se adaptan completamente al problema específico que se quiere resolver. Esto fue el caso con los modelos de Google y TensorFlow para aplicaciones de fitness y baile, que tenían dificultad en detectar poses desafiantes y movimientos borrosos. Para solucionar esto, Google amplió el conjunto de datos “COCO” con uno propio llamado “Active”, que se construyó etiquetando puntos clave en videos de yoga, fitness y baile de YouTube. Asimismo, para fomentar la diversidad de escenas e individuos (como pasa intrínsecamente con el dataset de COCO), se seleccionaron solamente tres cuadros de cada video para el entrenamiento de los modelos.
Consideramos, según los datos que hemos recopilado del tema y los conocimientos que tenemos al respecto, que algo similar a lo explicado anteriormente debe haber realizado la empresa encargada de desarrollar el SAOT, tomando como base imágenes y avances o desarrollos del estado del arte, y construyendo y adaptando un conjunto de datos y modelo específico para este problema, con diversas situaciones de juego de partidos de fútbol.
Por su parte, continuando con el funcionamiento del SAOT, los puntos de datos de los jugadores tomados por cada una de las cámaras, comentadas anteriormente, son posteriormente procesados empleando la triangulación de imágenes para calcular la posición en 3D de cada uno de ellos y generar un mapa 3D de la cancha. En el contexto de computer vision el proceso de triangulación refiere a la determinación de la posición de un punto en el espacio tridimensional a partir de su proyección en dos o más imágenes en dos dimensiones.
De esta manera, esto le permite al SOAT detectar una posición de offside dentro de los 15 a 25 segundos de acción durante el juego, mientras que el VAR tradicional (aquel que no tiene aún incorporado esta nueva tecnología, y basa su funcionamiento en el análisis de repeticiones de vídeo) puede tardar hasta 70 segundos.
Adicionalmente a lo explicado, la pelota utilizada en los partidos está equipada con un sensor de medida inercial (IMU) que proporciona la detección precisa del movimiento del balón a la sala de operación de video del VAR a una tasa de 500 veces por segundo. Su función principal es identificar el momento preciso en el que el jugador impacta el balón.
‘Al Rihla’ la pelota oficial del Mundial de Fútbol 2022 en Qatar, con un sensor en su interior. Créditos: Adidas.
En este caso, los oficiales verificarán manualmente si los datos son válidos antes de que sean comunicados a los árbitros en el campo. Puntualmente chequearán el momento de impacto propuesto y la línea de fuera de juego creada automáticamente, que se basa en la posición de las extremidades calculada de los jugadores.
De esta manera, SAOT pretende reducir el error involuntario e imponer objetividad en el proceso de decisión de un fuera de juego en un menor tiempo y con mayor precisión .
En este sentido, se considera que el SAOT y el Goal-Line (la tecnología de detección automática de goles) son grandes avances más justos y en teoría eficaces en varios aspectos. Se habla que ambos tienen precisiones del orden de los milímetros, por debajo del centímetro. El primero en la determinación del momento del impacto del impacto de la pelota y la detección de las partes del cuerpo de los jugadores involucrados en las jugadas, mientras que el segundo en la detección de la posición de la pelota y la línea de meta.
En este punto están involucrados dos problemas de Machine Learning y Computer Vision en particular. Por un lado, la detección y trackeo de objetos, que es una problemática bastante divulgada y conocida en la actualidad, y cuya función principal es identificar y localizar objetos en una imagen y/o vídeo (en este caso personas/jugadores, pelota). Por otro lado, la estimación de pose, que infiere la pose de una persona en una imagen o video. Esto generalmente se hace identificando, localizando y trackeando una cierta cantidad de puntos clave en una persona determinada. En los humanos, estos puntos representan articulaciones importantes, como un codo o una rodilla. Estos modelos entonces toman una imagen procesada como entrada y generan como salida información sobre puntos clave que se indexan mediante un ID de pieza o parte predefinido, con una puntuación de confianza entre 0.0 y 1.0, que indica la probabilidad de que exista un punto clave en esa posición.
Si bien existen conjuntos de datos de referencia o estándares para tomar como punto de partida para entrenar y validar este tipo de modelos (como por ejemplo COCO) puede no ser del todo adecuado o adaptarse completamente al problema que se quiere resolver, resultando conveniente ajustar el conjunto de datos o los casos disponibles.
Esto sucede por ejemplo con los modelos desarrollados por Google y Tensorflow para aplicaciones de fitness y baile, que exhiben poses desafiantes y un desenfoque de movimiento significativo. En este sentido Google extendió el conjunto de datos de COCO con uno propio denominado Active, que produjo etiquetando puntos clave (adoptando los 17 puntos clave corporales estándar de COCO) en videos de yoga, fitness y baile de YouTube. No se seleccionan más de tres cuadros de cada video para capacitación, Inclusive para promover la diversidad de escenas e individuos (como pasa intrínsecamente con el dataset de COCO), no se seleccionan más de tres cuadros de cada video para el entrenamiento de los modelos. Algo similar debe haber realizado la empresa encargada de desarrollar el SAOT, tomando como base imágenes y avances o desarrollos del estado del arte, y construyendo y adaptando un conjunto de datos y modelo específico para este problema, con diversas imágenes de situaciones de juego de partidos de fútbol.
Los puntos de datos de los jugadores tomados por cada una de las cámaras son posteriormente procesados empleando la triangulación de imágenes para calcular la posición en 3D de cada uno de ellos y generar un mapa 3D de la cancha. En el contexto de computer vision el proceso de triangulación refiere a la determinación de la posición de un punto en el espacio tridimensional a partir de su proyección en dos o más imágenes en dos dimensiones.
Algunos cuestionamientos sobre el VAR
Aunque el VAR ha sido implementado con el objetivo de mejorar la precisión de las decisiones tomadas por los árbitros y reducir el número de errores, hay algunos argumentos negativos que se han presentado en su contra:
- Interrupción del juego: Algunas personas argumentan que el VAR interrumpe el flujo del juego y puede distraer a los jugadores y espectadores.
- Demora en la toma de decisiones: A veces, la revisión del VAR puede tomar un tiempo significativo, lo que puede ser frustrante para los jugadores y espectadores.
- Falta de transparencia: Algunos críticos argumentan que el proceso de revisión del VAR no es suficientemente transparente y que los árbitros no explican adecuadamente sus decisiones.
- Costo: Implementar y mantener el VAR puede ser costoso para los clubes y ligas deportivas.
- Falta de consenso: Aunque el VAR ha sido adoptado en algunos deportes, todavía hay mucha controversia y falta de consenso sobre su uso y efectividad.
Además de los argumentos mencionados anteriormente, hay algunos otros aspectos técnicos del VAR que han sido criticados:
- La calidad de la imagen: A veces, la calidad de la imagen utilizada para revisar una jugada puede no ser suficientemente clara o precisa, lo que puede dificultar la toma de decisiones precisas por parte del árbitro.
- La subjetividad en la interpretación: Aunque el VAR se supone que debe ayudar a los árbitros a tomar decisiones más justas, la interpretación de las reglas y los límites del juego puede ser subjetiva y depender de la perspectiva del árbitro.
- La falta de claridad en las reglas: En algunos casos, las reglas del VAR pueden ser confusas o ambiguas, lo que puede llevar a interpretaciones diferentes de una misma situación.
Como mencionamos anteriormente, el VAR siempre va a tener una cuota de error asociado, o al menos de discrepancia en interpretaciones, porque al fin y al cabo la decisión final recae sobre el criterio de una persona o un grupo de personas. Esto considerando las jugadas que involucren o necesiten tener en cuenta el contexto o impliquen un grado de interpretación sobre lo sucedido.
En cuanto al SAOT ha demostrado tener mayor eficiencia en la detección de fuera de juegos que tienen en cuenta el tren superior y puntualmente el hombro o parte del mismo de los jugadores. Algo que pasó puntualmente en la jugada de Lautaro Martinez, donde al menos considerando los 2 jugadores involucrados en la reconstrucción 3D, la decisión demostró ser la correcta, ya que es parte del hombro (y no el brazo) el que se considera que está fuera de juego.
Sin embargo, como posibles argumentos en contra de este se pueden mencionar pequeños errores en la detección de los puntos anatómicos de los jugadores (su posición relativa en la imagen), y en la triangulación o proyección de estos valores en el espacio 3D, que abarca la unificación de los valores de las distintas cámaras involucradas.
Estudio realizado por la Universidad de Bath
El estudio realizado en Inglaterra, reveló detalles de la potencial eficacia del SAOT, o al menos el grado de error que puede llegar a tener en comparación con la de un humano. Analizaron cuánto tardaban los participantes en señalar el momento exacto en el que un jugador patea la pelota (simulando el pase que inicia la situación de fuera de juego), descubriendo que en promedio percibían que la pelota se pateaba 132 milisegundos después de lo que realmente era el momento exacto de impacto, tiempo que puede influir notoriamente en la localización de los jugadores y cambiar potencialmente las decisión de un fuera de juego.
Utilizando como referencia las velocidades máximas registradas por jugadores en la última copa del mundo, competidores como Mbappé alcanzaron los 35 km/h, lo que representa que en 132 milisegundos podría recorrer aproximadamente 1,28 metros. Es decir que los participantes hubieran tomado como punto de referencia la posición de Mbappé 1,28 metros más adelante de lo que realmente debería haber sido.
Conclusiones
La implementación del VAR (y el SAOT en particular) ha sido un paso muy importante para mejorar la precisión de las decisiones arbitrales en el fútbol. Sin embargo, todavía quedan algunos aspectos en los que se puede mejorar. Uno de ellos es la falta de transparencia en cuanto a la tasa de error del sistema.
Tomando como referencia tecnologías similares aplicadas en otros deportes, hemos comprobado cómo en el ojo de halcón, por ejemplo, se publican sus márgenes de error, que se estiman en 2.6 mm, lo que permite tener datos precisos y garantías sobre su uso en el campo de juego.
Por este motivo, creemos que sería de gran utilidad proporcionar información detallada sobre el funcionamiento del VAR para garantizar su uso óptimo en el fútbol. Sin esta claridad, es difícil evaluar su eficacia y determinar las áreas de mejora. Asimismo, esta situación puede generar confusión y desconfianza entre aficionados, jugadores y entrenadores.
Entendemos que un sistema tan importante requiere un enfoque continuo y crítico para maximizar su eficacia, lo que sin duda proporcionará la información que actualmente escasea. Esto, por consiguiente, permitirá aumentar la confianza en el mismo, y garantizar una toma de decisiones lo más justa y precisa posible.
El Var en otros deportes
La revisión por video (VAR) se utiliza también en varios deportes. Entre los más populares podemos nombrar el rugby, básquet, vóley, fútbol americano y el hockey sobre césped.
Hay algunas diferencias con respecto a las situaciones en las que se puede utilizar esta tecnología que de la disciplina. Por ejemplo en el básquet, vóley, fútbol americano y hockey sobre césped los entrenadores (o éstos por pedido de los jugadores) pueden adicionalmente solicitar la revisión por video. En estos casos, se tiene un número limitado de pedidos, que en general se mantienen si las revisiones fueron exitosas y cambiaron la postura inicial del árbitro. En el caso que el pedido sea iniciado por los propios árbitros para despejar una duda puntual, no se ven afectados los retos disponibles por cada equipo.
Otra diferencia es que en deportes como el básquet, voley y fútbol americano son los mismos jueces del campo de juego quienes revisan las jugadas y toman las decisiones, sin árbitros especiales o asistentes que vean las imágenes en otro lugar.
En el tenis no hay revisiones por vídeo, pero sí se utiliza el conocido Ojo de Halcón, que utiliza una tecnología similar a la que usa para la detección de goles y ahora para la detección de los fuera de juego. Este tipo de revisiones son solicitadas por los jugadores, que también tienen un número limitado de retos (o challenges) por set (3) y que los van perdiendo en caso que no haya habido error por parte de los jueces. En caso que el set vaya a tie-break se les adiciona un reto más.
No obstante, algo que se comparte en todos los deportes, es el criterio macro sobre la utilización del VAR. El árbitro solamente cambiará su decisión si la evidencia de la revisión es contundente, es decir que demuestra un “error claro y obvio”.
¿Qué opinas de la utilización del VAR en el fútbol? ¿Crees que es útil para mejorar la precisión de las decisiones o piensas que debería ser evitada? Deja tus comentarios a continuación y comparte tu perspectiva con nosotros.