Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las oportunidades de ganar mediante el aprendizaje automático en AWS PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las posibilidades de ganar mediante el aprendizaje automático en AWS

Dentro de diez años, la aptitud tecnológica de los clubes será un factor clave para su éxito. Hoy ya somos testigos del potencial de la tecnología para revolucionar la comprensión del fútbol. xObjetivos cuantifica y permite la comparación del potencial de gol de cualquier situación de tiro, mientras que xAmenaza y EPV los modelos predicen el valor de cualquier momento del juego. En última instancia, estas y otras estadísticas avanzadas tienen un propósito: mejorar la comprensión de quién ganará y por qué. Ingrese el nuevo dato del partido de la Bundesliga: Probabilidad de ganar.

En el segundo partido del Bayern contra el Bochum la temporada pasada, las tornas cambiaron inesperadamente. Temprano en el partido, Lewandowski anota 1:0 después de solo 9 minutos. El "Ratón Gris" de la liga recuerda instantáneamente su desastre por 7:0 cuando se enfrentó al Bayern por primera vez esa temporada. Pero no esta vez: Christopher Antwi-Adjei marca su primer gol para el club solo 5 minutos después. Después de concebir un gol de penal en el minuto 38, el equipo de Monaco di Bavaria parece paralizado y las cosas comenzaron a estallar: Gamboa golpea a Coman y remata con un corker absoluto de gol, y Holtmann hace el 4: 1 cerca del medio tiempo con un cucharón desde la izquierda. El Bayern no había concebido tantos goles en la primera mitad desde 1975, y apenas pudo irse con un resultado de 4:2. ¿Quién podría haberlo adivinado? Ambos equipos jugaron sin sus primeros porteros, lo que para el Bayern supuso perderse a su capitán Manuel Neuer. ¿Podría su presencia haberlos salvado de este resultado inesperado?

Del mismo modo, Colonia logró dos zingers extraordinarios en la temporada 2020/2021. Cuando se enfrentó al Dortmund, llevaba 18 partidos sin ganar, mientras que Haaland, del BVB, estaba dando una clase magistral de goles esa temporada (23 en 22 partidos). El papel de favorito era claro, pero el Colonia se adelantó temprano con solo 9 minutos en el reloj. Al comienzo de la segunda mitad, Skhiri anotó un gol al carbón de su primera: 0:2. El Dortmund sustituyó en fuerza de ataque, creó grandes oportunidades y anotó 1:2. De todos los jugadores, Haaland falló un canguro a los 5 minutos de la prórroga y coronó al Colonia con los primeros 3 puntos en Dortmund después de casi 30 años.

Más adelante en esa temporada, Colonia, siendo el último en la tabla de locales, sorprendió al RB Leipzig, quien tenía toda la motivación para acercarse al líder del campeonato, el Bayern. El oponente Leipzig presionó a los "Billy Goats" con un récord de temporada del equipo de 13 tiros a puerta en la primera mitad, aumentando sus ya altas posibilidades de ganar. Irónicamente, Colonia anotó el 1:0 con el primer tiro al arco en el minuto 46. Después de que los “Red Bulls” anotaran un merecido empate, se durmieron en un saque de banda solo 80 segundos después, lo que llevó a Jonas Hector a anotar para Colonia. otra vez. Al igual que el Dortmund, el Leipzig ahora puso toda su energía en la ofensiva, pero lo mejor que logró fue golpear el poste en la prórroga.

Para todos estos partidos, tanto los expertos como los novatos habrían adivinado erróneamente el ganador, incluso en el partido. Pero, ¿cuáles son los eventos que llevaron a estos sorprendentes cambios en la probabilidad de ganar en el juego? ¿En qué minuto la oportunidad de ganar del desvalido superó a la del favorito cuando se quedó sin tiempo? Bundesliga y AWS han trabajado juntos para calcular e ilustrar el desarrollo en vivo de las oportunidades de ganar a lo largo de los partidos, lo que permite a los fanáticos ver los momentos clave de los cambios de probabilidad. El resultado es el nuevo Bundesliga Match Fact: Win Probability, impulsado por aprendizaje automático (ML).

¿Cómo funciona?

La nueva Bundesliga Match Fact Win Probability se desarrolló mediante la creación de modelos ML que analizaron más de 1,000 juegos históricos. El modelo en vivo toma las estimaciones previas al partido y las ajusta de acuerdo con los procedimientos del partido en función de las características que afectan el resultado, incluidas las siguientes:

  • Goals
  • Multas
  • Tarjetas rojas
  • Sustituciones
  • Pasó el tiempo
  • Oportunidades de gol creadas
  • Situaciones a balón parado

El modelo en vivo se entrena utilizando una arquitectura de red neuronal y utiliza un enfoque de distribución de Poisson para predecir una tasa de goles por minuto. r para cada equipo, como se describe en la siguiente ecuación:

Esas tasas se pueden ver como una estimación de la fuerza de un equipo y se calculan utilizando una serie de capas densas basadas en las entradas. Con base en estas tasas y la diferencia entre los oponentes, las probabilidades de ganar y empatar se calculan en tiempo real.

La entrada al modelo es una tupla de 3 de características de entrada, diferencia de goles actual y tiempo de juego restante en minutos.

El primer componente de las tres dimensiones de entrada consiste en un conjunto de funciones que describe la acción actual del juego en tiempo real para ambos equipos en métricas de rendimiento. Estos incluyen varios valores xG agregados basados ​​en equipos, con especial atención a los tiros realizados en los últimos 15 minutos antes de la predicción. También procesamos las tarjetas rojas, los penaltis, los saques de esquina y el número de tiros libres peligrosos. Un tiro libre peligroso se clasifica como un tiro libre a menos de 25 m de la portería contraria. Durante el desarrollo del modelo, además de la influencia del anterior Bundesliga Match Fact xGoals, también evaluamos el impacto de Bundesliga Match Fact Skill en el modelo. Esto significa que el modelo reacciona a la sustitución de los mejores jugadores: jugadores con insignias en las habilidades Finalizador, Iniciador o Ganador de la pelota.

Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las oportunidades de ganar mediante el aprendizaje automático en AWS PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Ejemplo de probabilidad de ganar

Veamos un partido de la temporada actual (2022/2023). El siguiente gráfico muestra la probabilidad de victoria para el partido entre el Bayern de Múnich y el Stuttgart de la jornada 6.

Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las oportunidades de ganar mediante el aprendizaje automático en AWS PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

El modelo previo al partido calculó una probabilidad de victoria del 67 % para el Bayern, del 14 % para el Stuttgart y del 19 % para un empate. Cuando miramos el transcurso del partido, vemos un gran impacto de goles marcados en el minuto 36', 57' y 60'. Hasta el primer minuto de la prórroga, el marcador era 2:1 para el Bayern. Sólo un penalti acertado de S. Grassy en el minuto 90+2 aseguró el empate. Por lo tanto, el Win Probability Live Model corrigió el pronóstico de sorteo del 5% a más del 90%. El resultado es un giro tardío inesperado, con la probabilidad de victoria del Bayern disminuyendo del 90 % al 8 % en el minuto 90+2. El gráfico es representativo del cambio de ambiente en el Allianz Arena ese día.

¿Cómo se implementa?

Win Probability consume datos de eventos de un partido en curso (eventos de goles, faltas, tarjetas rojas y más), así como datos producidos por otros Match Facts, como xGoals. Para actualizaciones en tiempo real de probabilidades, usamos Streaming gestionado por Amazon Kafka (Amazon MSK) como una solución central de mensajería y transmisión de datos. De esta manera, los datos de eventos, datos de posiciones y salidas de diferentes Bundesliga Match Facts se pueden comunicar entre contenedores en tiempo real.

El siguiente diagrama ilustra el flujo de trabajo de extremo a extremo para Win Probability.

Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las oportunidades de ganar mediante el aprendizaje automático en AWS PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Los datos recopilados relacionados con las coincidencias se ingieren a través de un proveedor externo (DataHub). Los metadatos del partido se ingieren y procesan en un AWS Lambda función. Los datos de posiciones y eventos se ingieren a través de un AWS Fargate contenedor (MatchLink). Luego, todos los datos ingeridos se publican para su consumo en los respectivos temas de MSK. El corazón de Win Probability Match Fact se encuentra en un contenedor Fargate dedicado (BMF WinProbability), que se ejecuta durante la duración de la coincidencia respectiva y consume todos los datos necesarios obtenidos a través de Amazon MSK. Los modelos ML (en vivo y previos al partido) se implementan en Amazon SageMaker Puntos finales de inferencia sin servidor. Los puntos finales sin servidor lanzan automáticamente recursos informáticos y escalan esos recursos informáticos según el tráfico entrante, lo que elimina la necesidad de elegir tipos de instancias o administrar políticas de escalado. Con este modelo de pago por uso, Serverless Inference es ideal para cargas de trabajo que tienen períodos de inactividad entre picos de tráfico. Cuando no hay partidos de Bundesliga, no hay costo por recursos inactivos.

Poco antes del inicio, generamos nuestro conjunto inicial de funciones y calculamos las probabilidades de ganar antes del partido llamando al punto final PreMatch SageMaker. Con esas probabilidades previas al partido, inicializamos el modelo en vivo, que reacciona en tiempo real a los eventos relevantes del juego y se consulta continuamente para recibir las probabilidades de ganar actuales.

Luego, las probabilidades calculadas se envían de vuelta a DataHub para que se proporcionen a otros consumidores de MatchFacts. Las probabilidades también se envían al clúster de MSK a un tema dedicado, para que las consuman otros datos de partidos de la Bundesliga. Una función Lambda consume todas las probabilidades del tema respectivo de Kafka y las escribe en un Aurora amazónica base de datos. Estos datos luego se usan para visualizaciones interactivas casi en tiempo real usando Amazon QuickSight.

Bundesliga Match Fact Win Probability: Cuantificación del efecto de los eventos del juego en las oportunidades de ganar mediante el aprendizaje automático en AWS PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Resumen

En esta publicación, demostramos cómo la nueva Bundesliga Match Fact Win Probability muestra el impacto de los eventos del juego en las posibilidades de que un equipo gane o pierda un partido. Para hacerlo, nos basamos en y combinamos Bundesliga Match Facts publicados anteriormente en tiempo real. Esto permite a los comentaristas y fanáticos descubrir momentos de cambios de probabilidad y más durante los partidos en vivo.

El nuevo Bundesliga Match Fact es el resultado de un análisis en profundidad realizado por expertos en fútbol de la Bundesliga y científicos de datos de AWS. Las probabilidades de ganar se muestran en el teletipo en vivo de los partidos respectivos en la aplicación oficial de la Bundesliga. Durante una transmisión, las probabilidades de ganar se proporcionan a los comentaristas a través del buscador de historias de datos y se muestra visualmente a los fanáticos en momentos clave, como cuando el desvalido toma la delantera y ahora es más probable que gane el juego.

Esperamos que disfrute de este nuevo Bundesliga Match Fact y que le brinde nuevos conocimientos sobre el juego. Para obtener más información sobre la asociación entre AWS y la Bundesliga, visite Bundesliga en AWS!

Estamos emocionados de saber qué patrones descubrirás. Comparta sus ideas con nosotros: @AWScloud en Twitter, con el hashtag #BundesligaMatchFacts.


Acerca de los autores

Simón Rolfes Jugó 288 partidos de la Bundesliga como mediocampista central, marcó 41 goles y ganó 26 partidos con Alemania. Actualmente, Rolfes se desempeña como Director General Deportivo en Bayer 04 Leverkusen, donde supervisa y desarrolla la lista de jugadores profesionales, el departamento de exploración y el desarrollo juvenil del club. Simon también escribe columnas semanales sobre Bundesliga.com sobre los datos más recientes de los partidos de la Bundesliga impulsados ​​por AWS. Allí ofrece su experiencia como exjugador, capitán y analista de televisión para resaltar el impacto de las estadísticas avanzadas y el aprendizaje automático en el mundo del fútbol.

Tarek Haschemi es consultor de AWS Professional Services. Sus habilidades y áreas de especialización incluyen desarrollo de aplicaciones, ciencia de datos, aprendizaje automático y big data. Apoya a los clientes en el desarrollo de aplicaciones basadas en datos dentro de la nube. Antes de unirse a AWS, también fue consultor en varias industrias, como la aviación y las telecomunicaciones. Le apasiona ayudar a los clientes en su viaje de datos/IA a la nube.

Javier Poveda Panter es científico de datos para clientes deportivos de EMEA dentro del equipo de servicios profesionales de AWS. Permite a los clientes en el área de los deportes para espectadores innovar y capitalizar sus datos, brindando experiencias de alta calidad para usuarios y fanáticos a través del aprendizaje automático y la ciencia de datos. Sigue su pasión por una amplia gama de deportes, música e inteligencia artificial en su tiempo libre.

Luuk Figdor es asesor de tecnología deportiva en el equipo de servicios profesionales de AWS. Trabaja con jugadores, clubes, ligas y empresas de medios como la Bundesliga y la Fórmula 1 para ayudarlos a contar historias con datos mediante el aprendizaje automático. En su tiempo libre, le gusta aprender todo sobre la mente y la intersección entre psicología, economía e IA.

gabriel zylka es un ingeniero de aprendizaje automático dentro de los servicios profesionales de AWS. Trabaja en estrecha colaboración con los clientes para acelerar su proceso de adopción de la nube. Especializado en el dominio MLOps, se enfoca en la producción de cargas de trabajo de aprendizaje automático mediante la automatización de los ciclos de vida de aprendizaje automático de extremo a extremo y ayuda a lograr los resultados comerciales deseados.

Jakub Michalczyk es científico de datos en Sportec Solutions AG. Hace varios años, eligió estudiar matemáticas en lugar de jugar al fútbol, ​​ya que llegó a la conclusión de que no era lo suficientemente bueno en este último. Ahora combina ambas pasiones en su carrera profesional mediante la aplicación de métodos de aprendizaje automático para obtener una mejor visión de este hermoso juego. En su tiempo libre, todavía le gusta jugar al fútbol siete, ver películas policíacas y escuchar música de cine.

Sello de tiempo:

Mas de Aprendizaje automático de AWS