Probabilité de victoire des faits de match de Bundesliga : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Bundesliga Match Fact Win Probability : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS

Dans dix ans, l'adéquation technologique des clubs sera un facteur clé de leur succès. Aujourd'hui, nous sommes déjà témoins du potentiel de la technologie pour révolutionner la compréhension du football. xObjectifs quantifie et permet de comparer le potentiel de but de n'importe quelle situation de tir, tandis que x Menace ainsi que EPV les modèles prédisent la valeur de n'importe quel moment dans le jeu. En fin de compte, ces statistiques avancées et d'autres ont un seul objectif : améliorer la compréhension de qui va gagner et pourquoi. Entrez le nouveau Bundesliga Match Fact: Win Probability.

Lors du deuxième match du Bayern contre Bochum la saison dernière, les tables ont tourné de manière inattendue. Au début du match, Lewandowski marque 1-0 après seulement 9 minutes. La "Grey Mouse" de la ligue se souvient instantanément de son désastre 7:0 lorsqu'elle affronte le Bayern pour la première fois cette saison. Mais pas cette fois : Christopher Antwi-Adjei marque son premier but pour le club à peine 5 minutes plus tard. Après avoir conçu un but sur penalty à la 38e minute, l'équipe de Monaco di Bavaria semble paralysée et les choses ont commencé à éclater: Gamboa muscade Coman et termine avec un bouchon absolu d'un but, et Holtmann fait 4: 1 près de la mi-temps avec une louche à partir de la gauche. Le Bayern n'avait pas conçu autant de buts en première mi-temps depuis 1975 et était à peine capable de repartir avec un résultat de 4:2. Qui aurait pu le deviner ? Les deux équipes ont joué sans leurs premiers gardiens, ce qui pour le Bayern signifiait manquer leur capitaine Manuel Neuer. Sa présence aurait-elle pu les sauver de ce résultat inattendu ?

De même, Cologne a réussi deux zingers extraordinaires lors de la saison 2020/2021. Lorsqu'ils ont affronté Dortmund, ils avaient disputé 18 matches sans victoire, tandis que Haaland du BVB offrait une classe de maître pour marquer des buts cette saison (23 en 22 matches). Le rôle du favori était clair, pourtant Cologne a pris les devants avec seulement 9 minutes au compteur. Au début de la seconde mi-temps, Skhiri a marqué un but en copie conforme de son premier : 0-2. Dortmund a remplacé sa force offensive, s'est créé de grandes occasions et a marqué 1:2. De tous les joueurs, Haaland a raté un gardien 5 minutes après la prolongation et a couronné Cologne avec les 3 premiers points à Dortmund après près de 30 ans.

Plus tard dans la saison, Cologne - étant le dernier du classement à domicile - a surpris le RB Leipzig, qui avait toute la motivation pour se rapprocher du leader du championnat, le Bayern. L'adversaire de Leipzig a fait pression sur les "Billy Goats" avec un record de la saison par équipe de 13 tirs au but en première mi-temps, augmentant leurs chances de victoire déjà élevées. Ironiquement, Cologne a marqué le 1-0 avec le premier tir au but à la minute 46. Après que les "Red Bulls" aient marqué un égaliseur bien mérité, ils se sont endormis sur une remise en jeu à peine 80 secondes plus tard, ce qui a conduit Jonas Hector à marquer pour Cologne. encore. Tout comme Dortmund, Leipzig a maintenant mis toute son énergie dans l'attaque, mais le mieux qu'ils ont réussi à faire a été de frapper le poteau en prolongation.

Pour tous ces matchs, les experts comme les novices auraient deviné à tort le vainqueur, même bien avant le match. Mais quels sont les événements qui ont conduit à ces variations surprenantes de probabilité de gain dans le jeu ? À quelle minute les chances de victoire de l'outsider ont-elles dépassé celles du favori car il manquait de temps ? La Bundesliga et AWS ont travaillé ensemble pour calculer et illustrer le développement en direct des chances de gagner tout au long des matchs, permettant aux fans de voir les moments clés des fluctuations de probabilité. Le résultat est le nouveau Bundesliga Match Fact: Win Probability basé sur l'apprentissage automatique.

Comment cela fonctionne ? 

Le nouveau Bundesliga Match Fact Win Probability a été développé en créant des modèles ML qui ont analysé plus de 1,000 XNUMX matchs historiques. Le modèle en direct prend les estimations d'avant-match et les ajuste en fonction du déroulement du match en fonction des caractéristiques qui affectent le résultat, notamment :

  • Objectifs
  • Pénalités
  • Cartes rouges
  • remplacements
  • Le temps s'est écoulé
  • Occasions de marquer des buts créées
  • Situations de coup franc

Le modèle en direct est formé à l'aide d'une architecture de réseau neuronal et utilise une approche de distribution de Poisson pour prédire un taux d'objectifs par minute r pour chaque équipe, comme décrit dans l'équation suivante :

Ces taux peuvent être considérés comme une estimation de la force d'une équipe et sont calculés à l'aide d'une série de couches denses basées sur les entrées. Sur la base de ces taux et de la différence entre les adversaires, les probabilités de victoire et de match nul sont calculées en temps réel.

L'entrée du modèle est un triplet de caractéristiques d'entrée, la différence de buts actuelle et le temps de jeu restant en minutes.

Le premier composant des trois dimensions d'entrée consiste en un ensemble de fonctionnalités qui décrit l'action de jeu en cours en temps réel pour les deux équipes dans les mesures de performance. Celles-ci incluent diverses valeurs xG agrégées basées sur l'équipe, avec une attention particulière aux tirs pris au cours des 15 dernières minutes avant la prédiction. Nous traitons également les cartons rouges, les pénalités, les corners et le nombre de coups francs dangereux. Un coup franc dangereux est classé comme un coup franc à moins de 25 m du but adverse. Au cours du développement du modèle, outre l'influence des anciens Bundesliga Match Fact xGoals, nous avons également évalué l'impact de Bundesliga Match Fact Skill dans le modèle. Cela signifie que le modèle réagit à la substitution des meilleurs joueurs, c'est-à-dire les joueurs avec des badges dans les compétences Finisseur, Initiateur ou Vainqueur du ballon.

Probabilité de victoire des faits de match de Bundesliga : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Exemple de probabilité de victoire

Regardons un match de la saison en cours (2022/2023). Le graphique suivant montre la probabilité de victoire pour le match Bayern Munich et Stuttgart à partir de la 6e journée.

Probabilité de victoire des faits de match de Bundesliga : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Le modèle d'avant-match a calculé une probabilité de victoire de 67 % pour le Bayern, 14 % pour Stuttgart et 19 % pour un match nul. Quand on regarde le déroulement du match, on voit un gros impact des buts marqués aux minutes 36′, 57′ et 60′. Jusqu'à la première minute des prolongations, le score était de 2 à 1 pour le Bayern. Seul un penalty réussi par S. Grassy à la minute 90 + 2 a assuré le match nul. Le Win Probability Live Model a donc corrigé la prévision de tirage de 5 % à plus de 90 %. Le résultat est un swing tardif inattendu, la probabilité de victoire du Bayern passant de 90% à 8% en 90 + 2 minutes. Le graphique est représentatif de l'ambiance dans l'Allianz Arena ce jour-là.

Comment est-il mis en œuvre ?

Win Probability utilise les données d'événement d'un match en cours (événements de but, fautes, cartons rouges, etc.) ainsi que les données produites par d'autres faits de match, tels que xGoals. Pour les mises à jour en temps réel des probabilités, nous utilisons Kafka de streaming géré par Amazon (Amazon MSK) en tant que solution centrale de diffusion de données et de messagerie. De cette façon, les données d'événement, les données de position et les sorties de différents faits de match de Bundesliga peuvent être communiquées entre les conteneurs en temps réel.

Le diagramme suivant illustre le workflow de bout en bout pour Win Probability.

Probabilité de victoire des faits de match de Bundesliga : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les données collectées liées aux correspondances sont ingérées via un fournisseur externe (DataHub). Les métadonnées du match sont ingérées et traitées dans un AWS Lambda fonction. Les données de positions et d'événements sont ingérées via un AWSFargate conteneur (MatchLink). Toutes les données ingérées sont ensuite publiées pour être consommées dans les rubriques MSK respectives. Le cœur du Win Probability Match Fact se trouve dans un conteneur Fargate dédié (BMF WinProbability), qui s'exécute pendant la durée de la correspondance respective et consomme toutes les données requises obtenues via Amazon MSK. Les modèles ML (live et pré-match) sont déployés sur Amazon Sage Maker Points de terminaison d'inférence sans serveur. Les points de terminaison sans serveur lancent automatiquement les ressources de calcul et les mettent à l'échelle en fonction du trafic entrant, éliminant ainsi le besoin de choisir des types d'instance ou de gérer des politiques de mise à l'échelle. Avec ce modèle de paiement à l'utilisation, l'inférence sans serveur est idéale pour les charges de travail qui ont des périodes d'inactivité entre les pics de trafic. Lorsqu'il n'y a pas de matches de Bundesliga, il n'y a pas de coût pour les ressources inutilisées.

Peu de temps avant le coup d'envoi, nous générons notre ensemble initial de fonctionnalités et calculons les probabilités de victoire d'avant-match en appelant le point de terminaison PreMatch SageMaker. Avec ces probabilités PreMatch, nous initialisons ensuite le modèle en direct, qui réagit en temps réel aux événements pertinents du jeu et est continuellement interrogé pour recevoir les probabilités de gain actuelles.

Les probabilités calculées sont ensuite renvoyées à DataHub pour être fournies aux autres consommateurs MatchFacts. Les probabilités sont également envoyées au cluster MSK vers un sujet dédié, pour être consommées par d'autres faits de match de Bundesliga. Une fonction Lambda consomme toutes les probabilités du sujet Kafka respectif et les écrit dans un Amazon Aurora base de données. Ces données sont ensuite utilisées pour des visualisations interactives en temps quasi réel à l'aide de Amazon QuickSight.

Probabilité de victoire des faits de match de Bundesliga : quantification de l'effet des événements en jeu sur les chances de gagner à l'aide de l'apprentissage automatique sur AWS PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Résumé

Dans cet article, nous avons démontré comment la nouvelle probabilité de victoire des faits de match de Bundesliga montre l'impact des événements en jeu sur les chances qu'une équipe gagne ou perde un match. Pour ce faire, nous nous appuyons sur et combinons les faits de match de Bundesliga précédemment publiés en temps réel. Cela permet aux commentateurs et aux fans de découvrir des moments de fluctuations de probabilité et plus encore lors des matchs en direct.

Le nouveau Bundesliga Match Fact est le résultat d'une analyse approfondie par les experts du football de la Bundesliga et les data scientists d'AWS. Les probabilités de victoire sont affichées dans le téléscripteur en direct des matchs respectifs dans l'application officielle de la Bundesliga. Lors d'une émission, les probabilités de gain sont fournies aux commentateurs via le chercheur d'histoires de données et montré visuellement aux fans à des moments clés, comme lorsque l'outsider prend la tête et est maintenant le plus susceptible de gagner le match.

Nous espérons que vous apprécierez ce tout nouveau Bundesliga Match Fact et qu'il vous fournira de nouvelles informations sur le jeu. Pour en savoir plus sur le partenariat entre AWS et la Bundesliga, visitez Bundesliga sur AWS!

Nous sommes ravis d'apprendre quels modèles vous découvrirez. Partagez vos idées avec nous : @AWScloud sur Twitter, avec le hashtag #BundesligaMatchFacts.


À propos des auteurs

Simon Rolfès a disputé 288 matchs de Bundesliga en tant que milieu de terrain central, a marqué 41 buts et remporté 26 sélections pour l'Allemagne. Actuellement, Rolfes est directeur général du sport au Bayer 04 Leverkusen, où il supervise et développe la liste des joueurs professionnels, le département de dépistage et le développement des jeunes du club. Simon écrit également des chroniques hebdomadaires sur Bundesliga.com sur les derniers faits de match de Bundesliga fournis par AWS. Il y offre son expertise en tant qu'ancien joueur, capitaine et analyste de télévision pour souligner l'impact des statistiques avancées et de l'apprentissage automatique dans le monde du football.

Tarek Haschemi est consultant au sein d'AWS Professional Services. Ses compétences et domaines d'expertise incluent le développement d'applications, la science des données, l'apprentissage automatique et le big data. Il assiste les clients dans le développement d'applications basées sur les données dans le cloud. Avant de rejoindre AWS, il a également été consultant dans diverses industries telles que l'aviation et les télécommunications. Il est passionné par l'accompagnement des clients dans leur parcours de données/IA vers le cloud.

Javier Poveda-Panter est Data Scientist pour les clients sportifs EMEA au sein de l'équipe AWS Professional Services. Il permet aux clients du domaine des sports-spectacles d'innover et de capitaliser sur leurs données, en offrant des expériences utilisateur et fan de haute qualité grâce à l'apprentissage automatique et à la science des données. Il suit sa passion pour un large éventail de sports, de musique et d'intelligence artificielle pendant son temps libre.

Luuk Figdor est conseiller en technologie sportive au sein de l'équipe AWS Professional Services. Il travaille avec des joueurs, des clubs, des ligues et des sociétés de médias telles que la Bundesliga et la Formule 1 pour les aider à raconter des histoires avec des données à l'aide de l'apprentissage automatique. Pendant son temps libre, il aime tout apprendre sur l'esprit et l'intersection entre la psychologie, l'économie et l'IA.

Gabriel Zylka est ingénieur en apprentissage machine au sein des services professionnels AWS. Il travaille en étroite collaboration avec les clients pour accélérer leur parcours d'adoption du cloud. Spécialisé dans le domaine MLOps, il se concentre sur la production de charges de travail d'apprentissage automatique en automatisant les cycles de vie d'apprentissage automatique de bout en bout et en aidant à atteindre les résultats commerciaux souhaités.

Jakub Michalczyk est Data Scientist chez Sportec Solutions AG. Il y a plusieurs années, il a choisi des études de mathématiques plutôt que de jouer au football, car il en est venu à la conclusion qu'il n'était pas assez bon pour ce dernier. Maintenant, il combine ces deux passions dans sa carrière professionnelle en appliquant des méthodes d'apprentissage automatique pour mieux comprendre ce beau jeu. Pendant son temps libre, il aime toujours jouer au football à sept, regarder des films policiers et écouter de la musique de film.

Horodatage:

Plus de Apprentissage automatique AWS