Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina no AWS PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina na AWS

Daqui a dez anos, a aptidão tecnológica dos clubes será um fator chave para o seu sucesso. Hoje já estamos testemunhando o potencial da tecnologia para revolucionar a compreensão do futebol. x Gols quantifica e permite a comparação do potencial de golo de qualquer situação de remate, enquanto xAmeaça e EPV os modelos preveem o valor de qualquer momento no jogo. Em última análise, essas e outras estatísticas avançadas servem a um propósito: melhorar a compreensão de quem vencerá e por quê. Digite o novo Fato da partida da Bundesliga: Probabilidade de vitória.

No segundo jogo do Bayern contra o Bochum na temporada passada, as coisas mudaram inesperadamente. No início da partida, Lewandowski marca 1:0 depois de apenas 9 minutos. O "Rato Cinzento" da liga é instantaneamente lembrado de seu desastre de 7:0 ao enfrentar o Bayern pela primeira vez naquela temporada. Mas não desta vez: Christopher Antwi-Adjei marca seu primeiro gol pelo clube apenas 5 minutos depois. Depois de conceber um gol de pênalti aos 38 minutos, o time de Mônaco di Baviera parece paralisado e as coisas começaram a explodir: Gamboa noz-moscada Coman e finaliza com um arrolhador absoluto de gol, e Holtmann faz 4 a 1 perto do intervalo com um dipper da esquerda. O Bayern não concebia tantos gols no primeiro tempo desde 1975 e mal conseguiu sair com um resultado de 4:2. Quem poderia adivinhar isso? Ambas as equipas jogaram sem os seus primeiros guarda-redes, o que para o Bayern significou perder o seu capitão Manuel Neuer. Sua presença poderia tê-los salvado desse resultado inesperado?

Da mesma forma, o Colônia conseguiu duas vitórias extraordinárias na temporada 2020/2021. Quando enfrentou o Dortmund, havia 18 partidas sem vencer, enquanto Haaland, do BVB, dava uma aula de mestre em marcar gols naquela temporada (23 em 22 partidas). O papel do favorito era claro, mas o Colônia abriu vantagem cedo com apenas 9 minutos no relógio. No início do segundo tempo, Skhiri marcou um gol de cópia carbono do seu primeiro: 0:2. O Dortmund substituiu na força ofensiva, criou grandes chances e marcou 1:2. De todos os jogadores, Haaland perdeu um assistente aos 5 minutos da prorrogação e coroou o Colônia com os primeiros 3 pontos em Dortmund após quase 30 anos.

Mais tarde naquela temporada, o Colônia – sendo o último da tabela em casa – surpreendeu o RB Leipzig, que tinha toda a motivação para se aproximar do líder do campeonato, o Bayern. O adversário Leipzig pressionou o “Billy Goats” com um recorde da temporada da equipe de 13 chutes a gol no primeiro tempo, aumentando suas já altas chances de vitória. Ironicamente, o Colônia marcou o 1 a 0 com o primeiro chute a gol aos 46 minutos. Depois que os "Red Bulls" marcaram um merecido empate, eles dormiram em uma reposição apenas 80 segundos depois, levando Jonas Hector a marcar para o Colônia novamente. Assim como o Dortmund, o Leipzig agora colocou toda a energia no ataque, mas o melhor que conseguiu foi acertar a trave na prorrogação.

Para todas essas partidas, especialistas e novatos teriam adivinhado erroneamente o vencedor, mesmo no início da partida. Mas quais são os eventos que levaram a essas surpreendentes oscilações de probabilidade de vitória no jogo? Em que minuto a chance do azarão de vencer ultrapassou a do favorito quando o tempo acabou? A Bundesliga e a AWS trabalharam juntas para calcular e ilustrar o desenvolvimento ao vivo das chances de vitória ao longo das partidas, permitindo que os torcedores vejam os principais momentos de oscilações de probabilidade. O resultado é o novo Fato da partida da Bundesliga com aprendizado de máquina (ML): Probabilidade de vitória.

Como funciona o Tech & Data Studio:

A nova Probabilidade de Vitória de Fatos de Partida da Bundesliga foi desenvolvida construindo modelos de ML que analisaram mais de 1,000 jogos históricos. O modelo ao vivo pega as estimativas pré-jogo e as ajusta de acordo com os procedimentos da partida com base nos recursos que afetam o resultado, incluindo o seguinte:

  • Objetivos
  • Penalidades
  • Cartões vermelhos
  • substituições
  • Tempo passou
  • Oportunidades de gol criadas
  • Situações de bola parada

O modelo ao vivo é treinado usando uma arquitetura de rede neural e usa uma abordagem de distribuição de Poisson para prever uma taxa de metas por minuto r para cada equipe, conforme descrito na equação a seguir:

Essas taxas podem ser vistas como uma estimativa da força de uma equipe e são calculadas usando uma série de camadas densas com base nas entradas. Com base nessas taxas e na diferença entre os adversários, as probabilidades de uma vitória e um empate são calculadas em tempo real.

A entrada para o modelo é uma tupla de 3 recursos de entrada, diferença de gols atual e tempo de jogo restante em minutos.

O primeiro componente das três dimensões de entrada consiste em um conjunto de recursos que descreve a ação atual do jogo em tempo real para ambas as equipes nas métricas de desempenho. Isso inclui vários valores de xG agregados por equipe, com atenção especial para os chutes feitos nos últimos 15 minutos antes da previsão. Também processamos cartões vermelhos, pênaltis, escanteios e o número de cobranças de faltas perigosas. Um tiro livre perigoso é classificado como um tiro livre a menos de 25m do gol adversário. Durante o desenvolvimento do modelo, além da influência da antiga Bundesliga Match Fact xGoals, também avaliamos o impacto da Bundesliga Match Fact Skill no modelo. Isso significa que o modelo reage à substituição dos melhores jogadores – jogadores com distintivos nas habilidades Finalizador, Iniciador ou Vencedor da Bola.

Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina no AWS PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Exemplo de probabilidade de vitória

Vejamos um jogo da temporada atual (2022/2023). O gráfico a seguir mostra a probabilidade de vitória para o jogo Bayern de Munique e Stuttgart da 6ª rodada.

Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina no AWS PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

O modelo pré-jogo calculou uma probabilidade de vitória de 67% para o Bayern, 14% para Stuttgart e 19% para um empate. Quando olhamos para o desenrolar do jogo, vemos um grande impacto dos golos marcados aos 36', 57' e 60'. Até o primeiro minuto da prorrogação, o placar era de 2 a 1 para o Bayern. Apenas um pênalti bem-sucedido de S. Grassy aos 90+2 minutos garantiu o empate. Assim, o Win Probability Live Model corrigiu a previsão de empate de 5% para mais de 90%. O resultado é uma reviravolta inesperada, com a probabilidade de vitória do Bayern diminuindo de 90% para 8% nos 90+2 minutos. O gráfico é representativo da oscilação da atmosfera na Allianz Arena naquele dia.

Como é implementado?

A probabilidade de vitória consome dados de eventos de uma partida em andamento (eventos de gol, faltas, cartões vermelhos e mais), bem como dados produzidos por outros fatos da partida, como xGoals. Para atualizações de probabilidades em tempo real, usamos Kafka de streaming gerenciado da Amazon (Amazon MSK) como uma solução central de transmissão de dados e mensagens. Dessa forma, dados de eventos, dados de posições e saídas de diferentes fatos da partida da Bundesliga podem ser comunicados entre os contêineres em tempo real.

O diagrama a seguir ilustra o fluxo de trabalho de ponta a ponta para Win Probability.

Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina no AWS PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Os dados relacionados à correspondência coletados são ingeridos por meio de um provedor externo (DataHub). Os metadados da partida são ingeridos e processados ​​em um AWS Lambda função. Os dados de posições e eventos são ingeridos por meio de um AWS Fargate recipiente (MatchLink). Todos os dados ingeridos são publicados para consumo nos respectivos tópicos do MSK. O coração do Win Probability Match Fact fica em um contêiner Fargate dedicado (BMF WinProbability), que é executado durante a respectiva correspondência e consome todos os dados necessários obtidos por meio do Amazon MSK. Os modelos de ML (ao vivo e pré-jogo) são implantados em Amazon Sage Maker Pontos de extremidade de inferência sem servidor. Os endpoints sem servidor iniciam automaticamente os recursos de computação e dimensionam esses recursos de computação dependendo do tráfego de entrada, eliminando a necessidade de escolher tipos de instância ou gerenciar políticas de dimensionamento. Com esse modelo de pagamento por uso, o Serverless Inference é ideal para cargas de trabalho que têm períodos ociosos entre picos de tráfego. Quando não há partidas da Bundesliga, não há custo para recursos ociosos.

Pouco antes do início, geramos nosso conjunto inicial de recursos e calculamos as probabilidades de vitória antes da partida chamando o endpoint PreMatch SageMaker. Com essas probabilidades de pré-jogo, inicializamos o modelo ao vivo, que reage em tempo real a eventos relevantes no jogo e é continuamente consultado para receber as probabilidades de vitória atuais.

As probabilidades calculadas são então enviadas de volta ao DataHub para serem fornecidas a outros consumidores do MatchFacts. As probabilidades também são enviadas ao cluster MSK para um tópico dedicado, para ser consumido por outros fatos da partida da Bundesliga. Uma função Lambda consome todas as probabilidades do respectivo tópico Kafka e as grava em um Aurora Amazônica base de dados. Esses dados são então usados ​​para visualizações interativas em tempo quase real usando AmazonQuickSight.

Probabilidade de vitória do fato de partida da Bundesliga: quantificando o efeito de eventos no jogo nas chances de vitória usando aprendizado de máquina no AWS PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Resumo

Neste post, demonstramos como a nova Probabilidade de Vitória do Fato de Partida da Bundesliga mostra o impacto dos eventos do jogo nas chances de um time vencer ou perder uma partida. Para fazer isso, criamos e combinamos em tempo real os fatos de partidas da Bundesliga publicados anteriormente. Isso permite que comentaristas e fãs descubram momentos de oscilações de probabilidade e muito mais durante as partidas ao vivo.

O novo Bundesliga Match Fact é o resultado de uma análise aprofundada dos especialistas em futebol da Bundesliga e dos cientistas de dados da AWS. As probabilidades de vitória são mostradas no live ticker das respectivas partidas no aplicativo oficial da Bundesliga. Durante uma transmissão, as probabilidades de vitória são fornecidas aos comentaristas através do localizador de história de dados e mostrado visualmente aos fãs em momentos importantes, como quando o azarão assume a liderança e agora tem mais chances de vencer o jogo.

Esperamos que você goste deste novíssimo Fato de Jogo da Bundesliga e que ele forneça novas informações sobre o jogo. Para saber mais sobre a parceria entre AWS e Bundesliga, visite Bundesliga na AWS!

Estamos ansiosos para saber quais padrões você descobrirá. Compartilhe seus insights conosco: @AWScloud no Twitter, com a hashtag #BundesligaMatchFacts.


Sobre os autores

simon rofes jogou 288 jogos da Bundesliga como meio-campista central, marcou 41 gols e ganhou 26 partidas pela Alemanha. Atualmente, Rolfes atua como Diretor Administrativo de Esportes no Bayer 04 Leverkusen, onde supervisiona e desenvolve a lista de jogadores profissionais, o departamento de scouting e o desenvolvimento juvenil do clube. Simon também escreve colunas semanais sobre Bundesliga. com sobre os fatos mais recentes da Bundesliga com tecnologia da AWS. Lá, ele oferece sua experiência como ex-jogador, capitão e analista de TV para destacar o impacto das estatísticas avançadas e do aprendizado de máquina no mundo do futebol.

Tareq Haschemi é consultor da AWS Professional Services. Suas habilidades e áreas de especialização incluem desenvolvimento de aplicativos, ciência de dados, aprendizado de máquina e big data. Ele oferece suporte aos clientes no desenvolvimento de aplicativos orientados a dados na nuvem. Antes de ingressar na AWS, ele também foi consultor em vários setores, como aviação e telecomunicações. Ele é apaixonado por capacitar os clientes em sua jornada de dados/IA para a nuvem.

Javier Poveda-Panter é um cientista de dados para clientes de esportes da EMEA na equipe de serviços profissionais da AWS. Ele permite que os clientes da área de esportes de espectadores inovem e capitalizem seus dados, oferecendo experiências de alta qualidade para usuários e fãs por meio de aprendizado de máquina e ciência de dados. Ele segue sua paixão por uma ampla gama de esportes, música e IA em seu tempo livre.

Luuk Figdor é consultor de tecnologia esportiva na equipe de serviços profissionais da AWS. Ele trabalha com jogadores, clubes, ligas e empresas de mídia, como a Bundesliga e a Fórmula 1, para ajudá-los a contar histórias com dados usando aprendizado de máquina. Em seu tempo livre, ele gosta de aprender tudo sobre a mente e a interseção entre psicologia, economia e IA.

Gabriel Zylka é engenheiro de aprendizado de máquina nos serviços profissionais da AWS. Ele trabalha em estreita colaboração com os clientes para acelerar sua jornada de adoção da nuvem. Especializado no domínio MLOps, ele se concentra na produção de cargas de trabalho de machine learning, automatizando os ciclos de vida de machine learning de ponta a ponta e ajudando a alcançar os resultados de negócios desejados.

Jakub Michalczyk é Cientista de Dados na Sportec Solutions AG. Vários anos atrás, ele escolheu os estudos de matemática em vez de jogar futebol, pois chegou à conclusão de que não era bom o suficiente no último. Agora, ele combina essas duas paixões em sua carreira profissional, aplicando métodos de aprendizado de máquina para obter uma visão melhor desse belo jogo. Em seu tempo livre, ele ainda gosta de jogar futebol de sete, assistir a filmes de crime e ouvir músicas de filmes.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS