mayo 28, 2022

Blog de Habeas Data

Encuentra toda la información nacional e internacional sobre españa. Seleccione los temas sobre los que desea saber más

Databriks trabaja en la analítica para la Liga Española de Fútbol

LaLiga es una de esas organizaciones que están totalmente comprometidas con la analítica.

La Liga, sede de clubes famosos como el Real Madrid y el Barcelona, ​​y de jugadores como el actual máximo goleador Karim Benzema y la estrella Luis Suárez, adoptó la plataforma Databriks Lakehouse en 2018. La liga ahora se utiliza para informar a cada uno de sus 20 clubes sobre jugar en el campo, así como sus aficionados mientras ven los partidos en los televisores y sus dispositivos móviles.

Databricks, fundada en 2013 y con sede en San Francisco, es un proveedor de lagos de datos cuya plataforma basada en la nube combina las ventajas de los almacenes de datos y los lagos de datos. Dentro de sus repositorios de lagos, los usuarios pueden consultar y analizar datos estructurados utilizando SQL como con el almacén de datos y los datos no estructurados dentro de la arquitectura flexible del lago de datos.

Mientras tanto, LaLiga ha estado en funcionamiento desde 1929 y es la liga de fútbol más importante de España. El Real Madrid fue el club más dominante, con 34 trofeos, mientras que estrellas recientes incluyen a Cristiano Ronaldo y Lionel Messi.

Pasando a la analítica

Hace poco menos de una década, la liga se sentía atrasada en cuanto a análisis, según Tom Woods, director de marketing y comunicaciones de LaLiga Tech.

Muchas de las empresas más grandes del mundo han estado utilizando análisis para guiar las decisiones comerciales durante años. Las organizaciones deportivas, incluidas las Grandes Ligas de Béisbol de los Estados Unidos y los órganos rectores del tenis en todo el mundo, la Asociación de Tenis Profesional y la Asociación de Tenis de Mujeres, han utilizado análisis durante algunas décadas para aumentar el rendimiento de los jugadores e informar a sus fanáticos.

Por ejemplo, como se documenta en el libro, y en la película posterior, bola de dineroEl equipo de béisbol de Oakland fue uno de los primeros pioneros en el análisis de los deportes, utilizando datos a principios del siglo XXI para encontrar valor en los jugadores que otros equipos ignoran y compiten por campeonatos a pesar de tener una de las nóminas más pequeñas.

Pero en la segunda década del siglo XXI, la Liga Española de Fútbol aún no había empezado a utilizar la analítica.

Finalmente, cuando Javier Tebas asumió la presidencia de la liga en 2013 y Haga del análisis una prioridadEso ha cambiado, según Rafael Zambrano López, responsable de ciencia de datos de LaLiga.

“Nuestro jefe decidió… hizo que nos orientáramos más a los datos, y nuestro departamento comenzó [at that time]»Comenzamos a construir todo desde cero, y hemos ido desde allí hasta ahora», dijo.

Woods agregó que el ímpetu para que el movimiento se volviera más dependiente de los datos provino de un sentido de responsabilidad hacia los clubes de la liga. Señaló que, si bien muchas organizaciones deportivas están comenzando a darse cuenta del valor de la analítica, el fútbol europeo en su conjunto aún no se basa en datos.

Ahora, entre otras grandes ligas europeas, la Bundesliga alemana utiliza AWS para análisis y La Premier League inglesa utiliza Oracle Cloud.

«Somos responsables de guiar a nuestros clubes y vimos una responsabilidad como la liga para ayudar a estos clubes a adaptarse a nuevas formas de hacer las cosas», dijo Woods. «Hemos visto que es necesario mantener las cosas funcionando de manera eficiente y atraer a los fanáticos».

Continuó diciendo que esto significa desarrollar un ecosistema de toma de decisiones que pueda ayudar al producto en el campo, la experiencia de los fanáticos e incluso ayudar a los clubes con cosas como detectar fraudes y prevenir amaños de partidos.

Inicialmente, LaLiga desarrolló sus propios sistemas de gestión y análisis de datos. Al final, la Liga decidió adoptar una plataforma de datos y análisis e integrar las capacidades existentes de la Liga de Fútbol con las del proveedor.

Según Zambrano López, LaLiga conoció Databricks a través de su relación con Microsoft y se eligió Databricks por su velocidad, facilidad de uso y bajo costo.

LaLiga de España utiliza Databriks para ayudar a capturar datos y brindar información a sus equipos y aficionados.

Haz más con los datos

Ahora, habiendo adoptado Databriks después de algunos años de su compromiso con el análisis, LaLiga captura más de 3 millones de filas de datos por partido. Pone estos datos en acción al informar a los equipos y proporcionar estadísticas a los fanáticos en segundos mientras juegan partidos en el campo de fútbol.

Las cámaras recogen la ubicación de los jugadores y el balón, y combinamos estos datos con datos de eventos (pases, goles, tarjetas rojas, tarjetas amarillas, etc.) y esto nos permite crear nuestras propias métricas. Hay alrededor de 25 escalas y podemos compartirlas con todos los clubes para que puedan mejorar.

Rafael Zambrano LópezResponsable de Ciencia de Datos, LaLiga

LaLiga coloca estratégicamente cámaras en cada uno de sus estadios, y es a través de esas cámaras que la liga captura todos esos datos de cada partido. Las cámaras rastrean cada movimiento de un jugador, toman 25 cuadros por segundo y envían esos datos a Databricks, donde se alimentan automáticamente a modelos de datos desarrollados por Zambrano López y su equipo para análisis en tiempo real.

“Las cámaras recopilan la posición de los jugadores y el balón, y combinamos esos datos con los datos del evento: pases, goles, tarjetas rojas, tarjetas amarillas, etc., y eso nos permite crear nuestras métricas”, dijo Zambrano. «Hay alrededor de 25 métricas y podemos compartirlas con todos los clubes para que puedan mejorar».

Una de esas métricas es la probabilidad objetivo.

Cuando un jugador realiza un tiro, ya sea que conduzca a gol o no, en aproximadamente 30 segundos, la combinación de Databriks y modelos de datos desarrollados por LaLiga puede determinar la probabilidad de que el tiro resulte en gol y compartir esa información con los equipos. locutores y fanáticos mientras el partido está en progreso.

Los equipos pueden usar dicha información en el acto para determinar si los jugadores están ayudando o perjudicando al equipo en un juego inteligente, por ejemplo, al hacer tiros que tienen pocas posibilidades de entrar cuando un pase podría haber resultado en una mejor oportunidad de anotar. Mientras tanto, los fanáticos están mejor informados durante la duración del partido.

Pero las capacidades de análisis de Databriks permiten que los equipos de la liga aprendan mucho más que la probabilidad de un gol durante un partido de fútbol.

Mediante el seguimiento del movimiento de los jugadores (cuánto corren durante un partido, cómo cambia su velocidad y cómo su modo de andar puede diferir de un partido a otro debido a la fatiga), los clubes pueden intentar predecir y prevenir las lesiones de los jugadores antes de que sucedan.

Generalmente, con Databriks, LaLiga entrega a cada equipo un informe de 150 páginas después de cada partido.

“Obtuvieron una gran cantidad de datos que luego pueden analizar internamente”, dijo Woods. «Les brindamos ayuda sobre cómo analizar bien la información, pero muchos clubes ahora están invirtiendo en sus equipos de análisis. Muchos de ellos ahora atribuyen victorias o temporadas particularmente buenas a una mejor comprensión de la competencia».

Agregó que si bien todos los clubes aceptaban análisis, alrededor de cinco de ellos han invertido agresivamente. Un ejemplo es el Sevilla, que actualmente es segundo en la clasificación por detrás del Real Madrid.

Viene más

En septiembre de 2021, la liga LaLiga Tech. lanzada Dotar a otras organizaciones deportivas, no solo del fútbol, ​​de las capacidades analíticas desarrolladas en LaLiga en coordinación con Databriks y sus otros socios tecnológicos, incluido Microsoft.

“Estamos comenzando a implementar un negocio completamente nuevo desde dentro de LaLiga, donde todo lo que hemos construido hasta este punto está aprobado por terceros en todo el mundo. [sports] «Ahora estamos viendo más conciencia sobre la transición a un modelo digital, pero está fragmentado”, dijo Woods. «Estamos en posición de brindar estos servicios al resto de la industria, y Databriks es una parte esencial de eso. ”

Mientras tanto, el equipo central de datos de la liga se reúne con los clubes cada dos semanas para obtener comentarios sobre los datos que les proporciona, y está trabajando para agregar nuevas herramientas para analizar el juego. Según Zambrano López, LaLiga está experimentando con herramientas de Databriks como MLflow y Delta Lake.

«Siempre estamos explorando cosas nuevas que hacer con Databriks», dijo.

READ  La Liga pospuso dos partidos por eliminatorias Deportes