Bundesliga Match Fact Win Kans: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Bundesliga Match Fact Win Probability: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS

Over tien jaar zal de technologische fitheid van clubs een belangrijke bijdrage leveren aan hun succes. Vandaag zijn we al getuige van het potentieel van technologie om een โ€‹โ€‹revolutie teweeg te brengen in het begrip van voetbal. xDoelen kwantificeert en maakt vergelijking mogelijk van het scoringspotentieel van elke schietsituatie, terwijl xBedreiging en EPV modellen voorspellen de waarde van elk in-game moment. Uiteindelijk hebben deze en andere geavanceerde statistieken maar รฉรฉn doel: beter begrijpen wie er zal winnen en waarom. Voer het nieuwe Bundesliga-wedstrijdfeit in: Winkans.

In de tweede wedstrijd van Bayern vorig seizoen tegen Bochum draaiden de rollen onverwacht om. Al vroeg in de wedstrijd scoort Lewandowski al na 1 minuten 0:9. De 'grijze muis' van de competitie wordt onmiddellijk herinnerd aan hun 7:0-ramp toen ze voor het eerst dat seizoen tegenover Bayern stonden. Maar deze keer niet: Christopher Antwi-Adjei scoort slechts 5 minuten later zijn eerste doelpunt voor de club. Na het bedenken van een penalty in de 38e minuut, lijkt het team uit Monaco di Bavaria verlamd en begon de zaak uit te barsten: Gamboa nootmuskaat Coman en eindigt met een absoluut doelpunt, en Holtmann maakt het 4:1 dicht bij rust met een dipper van links. Bayern had sinds 1975 niet zoveel doelpunten in de eerste helft gemaakt en kon amper weglopen met een 4:2 resultaat. Wie had dat kunnen raden? Beide teams speelden zonder hun eerste keepers, wat voor Bayern betekende dat ze hun aanvoerder Manuel Neuer misliepen. Had zijn aanwezigheid hen kunnen redden van dit onverwachte resultaat?

Evenzo trok Keulen twee buitengewone zingers in het seizoen 2020/2021. Toen ze tegenover Dortmund stonden, hadden ze 18 wedstrijden gewonnen zonder te winnen, terwijl Haaland van BVB dat seizoen een masterclass in het maken van doelpunten gaf (23 in 22 wedstrijden). De rol van de favoriet was duidelijk, toch kwam Keulen al vroeg op voorsprong met slechts 9 minuten op de klok. In het begin van de tweede helft scoorde Skhiri een kopie van zijn eerste doelpunt: 0:2. Dortmund zakte in aanvalskracht in, creรซerde grote kansen en scoorde 1:2. Van alle spelers miste Haaland een sitter 5 minuten in extra tijd en kroonde Keulen met de eerste 3 punten in Dortmund na bijna 30 jaar.

Later in dat seizoen verraste Keulen - als laatste in de thuistafel - RB Leipzig, die alle motivatie had om de kampioensleider Bayern te benaderen. De tegenstander Leipzig zette de "Billy Goats" onder druk met een teamseizoenrecord van 13 schoten op doel in de eerste helft, waardoor hun toch al grote kansen op een overwinning werden vergroot. Ironisch genoeg scoorde Keulen de 1:0 met het eerste schot op doel in minuut 46. Nadat de "Red Bulls" een welverdiende gelijkmaker scoorden, sliepen ze slechts 80 seconden later in een inworp, wat ertoe leidde dat Jonas Hector scoorde voor Keulen opnieuw. Net als Dortmund stak Leipzig nu alle energie in de aanval, maar het beste wat ze wisten te bereiken, was in de verlenging de paal raken.

Voor al deze wedstrijden zouden zowel experts als beginners de winnaar verkeerd hebben geraden, zelfs tot ver in de wedstrijd. Maar wat zijn de gebeurtenissen die hebben geleid tot deze verrassende in-game schommelingen van de winkans? Op welk moment overtrof de kans van de underdog om te winnen die van de favorieten toen ze geen tijd meer hadden? Bundesliga en AWS hebben samengewerkt om de live ontwikkeling van winkansen tijdens wedstrijden te berekenen en te illustreren, waardoor fans belangrijke momenten van kansschommelingen kunnen zien. Het resultaat is het nieuwe door machine learning (ML) aangedreven Bundesliga Match Fact: Win Probability.

Hoe werkt het?

De nieuwe Bundesliga Match Fact Win Probability is ontwikkeld door ML-modellen te bouwen die meer dan 1,000 historische games analyseerden. Het live-model neemt de schattingen voor de wedstrijd en past deze aan volgens de wedstrijdprocedures op basis van kenmerken die de uitkomst beรฏnvloeden, waaronder de volgende:

  • Doelen
  • Sancties
  • Rode kaarten
  • Vervangingen
  • Verstreken tijd
  • Doelkansen gecreรซerd
  • Set-piece situaties

Het live-model is getraind met behulp van een neurale netwerkarchitectuur en gebruikt een Poisson-distributiebenadering om een โ€‹โ€‹snelheid per minuut te voorspellen r voor elk team, zoals beschreven in de volgende vergelijking:

Die snelheden kunnen worden gezien als een schatting van de sterkte van een team en worden berekend met behulp van een reeks dichte lagen op basis van de invoer. Op basis van deze tarieven en het verschil tussen de tegenstanders worden de kansen op winst en gelijkspel in realtime berekend.

De invoer voor het model is een drietal invoerfuncties, het huidige doelsaldo en de resterende speeltijd in minuten.

Het eerste onderdeel van de drie invoerdimensies bestaat uit een functieset die de huidige spelactie voor beide teams in realtime beschrijft in prestatiestatistieken. Deze omvatten verschillende geaggregeerde teamgebaseerde xG-waarden, met bijzondere aandacht voor de opnamen die in de laatste 15 minuten vรณรณr de voorspelling zijn gemaakt. We verwerken ook rode kaarten, penalty's, hoekschoppen en het aantal gevaarlijke vrije trappen. Een gevaarlijke vrije schop wordt geclassificeerd als een vrije schop die zich dichter dan 25 meter van het doel van de tegenstander bevindt. Tijdens de ontwikkeling van het model hebben we naast de invloed van de voormalige Bundesliga Match Fact xGoals ook de impact van Bundesliga Match Fact Skill in het model geรซvalueerd. Dit betekent dat het model reageert op vervanging van topspelers: spelers met badges in de vaardigheden Afmaker, Initiator of Balwinnaar.

Bundesliga Match Fact Win Kans: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Win kans voorbeeld

Laten we eens kijken naar een wedstrijd uit het huidige seizoen (2022/2023). De volgende grafiek toont de winstkans voor de wedstrijd Bayern Mรผnchen en Stuttgart vanaf speeldag 6.

Bundesliga Match Fact Win Kans: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Het pre-match model berekende een winkans van 67% voor Bayern, 14% voor Stuttgart en 19% voor een gelijkspel. Als we naar het verloop van de wedstrijd kijken, zien we een grote impact van doelpunten in minuut 36โ€ฒ, 57โ€ฒ en 60โ€ฒ. Tot de eerste minuut van de verlenging was de stand 2:1 voor Bayern. Alleen een geslaagd penaltyschot van S. Grassy in minuut 90+2 zorgde voor een gelijkspel. Het Win Probability Live Model corrigeerde daarom de trekkingsvoorspelling van 5% naar meer dan 90%. Het resultaat is een onverwachte late swing, waarbij de winstkans van Bayern in de 90+8 minuut afnam van 90% naar 2%. De grafiek is representatief voor de schommelende atmosfeer in de Allianz Arena die dag.

Hoe wordt het geรฏmplementeerd?

Winkans gebruikt gebeurtenisgegevens van een lopende wedstrijd (doelgebeurtenissen, fouten, rode kaarten en meer) evenals gegevens die zijn geproduceerd door andere Match Facts, zoals xGoals. Voor realtime updates van kansen gebruiken we Amazon beheerde streaming Kafka (Amazon MSK) als centrale datastreaming- en messaging-oplossing. Op deze manier kunnen evenementgegevens, positiegegevens en outputs van verschillende Bundesliga Match Facts realtime tussen containers worden gecommuniceerd.

Het volgende diagram illustreert de end-to-end-workflow voor Winkans.

Bundesliga Match Fact Win Kans: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Verzamelde wedstrijdgerelateerde gegevens worden opgenomen via een externe provider (DataHub). Metadata van de wedstrijd wordt opgenomen en verwerkt in een AWS Lambda functie. Positie- en gebeurtenisgegevens worden opgenomen via een AWS Fargate container (MatchLink). Alle opgenomen gegevens worden vervolgens gepubliceerd voor consumptie in respectievelijke MSK-onderwerpen. Het hart van het Win Probability Match Fact bevindt zich in een speciale Fargate-container (BMF WinProbability), die gedurende de betreffende wedstrijd loopt en alle vereiste gegevens verbruikt die via Amazon MSK zijn verkregen. De ML-modellen (live en pre-match) worden ingezet op Amazon Sage Maker Serverloze inferentie-eindpunten. Serverloze eindpunten starten automatisch computerbronnen en schalen die computerbronnen afhankelijk van binnenkomend verkeer, waardoor het niet meer nodig is om instantietypen te kiezen of schaalbeleid te beheren. Met dit pay-per-use-model is Serverless Inference ideaal voor workloads met inactieve perioden tussen verkeersspurts. Als er geen Bundesliga-wedstrijden zijn, zijn er geen kosten voor inactieve middelen.

Kort voor de aftrap genereren we onze eerste set functies en berekenen we de winkansen vรณรณr de wedstrijd door het PreMatch SageMaker-eindpunt aan te roepen. Met die PreMatch-kansen initialiseren we vervolgens het live-model, dat in realtime reageert op relevante in-game-evenementen en continu wordt gevraagd om de huidige winkansen te ontvangen.

De berekende kansen worden vervolgens teruggestuurd naar DataHub om aan andere MatchFacts-consumenten te worden verstrekt. Waarschijnlijkheden worden ook naar het MSK-cluster gestuurd voor een speciaal onderwerp, om te worden gebruikt door andere Bundesliga Match Facts. Een Lambda-functie verbruikt alle kansen van het respectievelijke Kafka-onderwerp en schrijft ze naar een Amazon Aurora databank. Deze gegevens worden vervolgens gebruikt voor interactieve bijna-realtime visualisaties met behulp van Amazon QuickSight.

Bundesliga Match Fact Win Kans: kwantificeren van het effect van in-game-evenementen op winstkansen met behulp van machine learning op AWS PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Samengevat

In dit bericht hebben we laten zien hoe de nieuwe Bundesliga Match Fact Win Probability de impact laat zien van in-game-evenementen op de kansen van een team om een โ€‹โ€‹wedstrijd te winnen of te verliezen. Om dit te doen, bouwen we voort op en combineren we eerder gepubliceerde Bundesliga Match Facts in realtime. Hierdoor kunnen commentatoren en fans tijdens live wedstrijden momenten van waarschijnlijkheidsschommelingen en meer ontdekken.

Het nieuwe Bundesliga Match Fact is het resultaat van een diepgaande analyse door de voetbalexperts van de Bundesliga en datawetenschappers van AWS. Winkansen worden weergegeven in de live-ticker van de respectievelijke wedstrijden in de officiรซle Bundesliga-app. Tijdens een uitzending worden winkansen aan commentatoren gegeven via de gegevensverhaalzoeker en visueel getoond aan fans op belangrijke momenten, zoals wanneer de underdog de leiding neemt en nu de meeste kans heeft om de wedstrijd te winnen.

We hopen dat je geniet van dit gloednieuwe Bundesliga Match Fact en dat het je nieuwe inzichten in het spel geeft. Ga voor meer informatie over de samenwerking tussen AWS en de Bundesliga naar Bundesliga op AWS!

We zijn benieuwd welke patronen je zult ontdekken. Deel uw inzichten met ons: @AWScloud op Twitter, met de hashtag #BundesligaMatchFacts.


Over de auteurs

Simon Rolfes speelde 288 Bundesliga-wedstrijden als centrale middenvelder, scoorde 41 doelpunten en won 26 interlands voor Duitsland. Momenteel is Rolfes Managing Director Sport bij Bayer 04 Leverkusen, waar hij toezicht houdt op en de ontwikkeling van de selectie van profspelers, de scoutingafdeling en de jeugdontwikkeling van de club. Simon schrijft ook wekelijkse columns over Bundesliga.com over de nieuwste Bundesliga Match Facts powered by AWS. Daar biedt hij zijn expertise aan als voormalig speler, aanvoerder en tv-analist om de impact van geavanceerde statistieken en machine learning in de voetbalwereld te benadrukken.

Tarek Haschemi is een consultant binnen AWS Professional Services. Zijn vaardigheden en expertisegebieden omvatten applicatieontwikkeling, datawetenschap, machine learning en big data. Hij ondersteunt klanten bij het ontwikkelen van datagedreven applicaties binnen de cloud. Voordat hij bij AWS kwam, was hij ook consultant in verschillende sectoren, zoals luchtvaart en telecommunicatie. Hij is gepassioneerd om klanten te helpen bij hun data/AI-reis naar de cloud.

Javier Poveda-Panter is een Data Scientist voor EMEA-sportklanten binnen het AWS Professional Services-team. Hij stelt klanten op het gebied van kijksporten in staat om te innoveren en te profiteren van hun data, door hoogwaardige gebruikers- en fanervaringen te leveren door middel van machine learning en datawetenschap. Zijn passie voor een breed scala aan sport, muziek en AI volgt hij in zijn vrije tijd.

Luuk Figdor is een Sports Technology Advisor in het AWS Professional Services-team. Hij werkt samen met spelers, clubs, competities en mediabedrijven zoals de Bundesliga en de Formule 1 om hen te helpen verhalen te vertellen met data met behulp van machine learning. In zijn vrije tijd leert hij graag alles over de geest en het snijvlak tussen psychologie, economie en AI.

Gabriรซl Zylka is een Machine Learning Engineer binnen AWS Professional Services. Hij werkt nauw samen met klanten om hun reis naar de cloud te versnellen. Hij is gespecialiseerd in het MLOps-domein en richt zich op het produceren van machine learning-workloads door end-to-end machine learning-levenscycli te automatiseren en de gewenste bedrijfsresultaten te helpen bereiken.

Jakub Michalczyk is een datawetenschapper bij Sportec Solutions AG. Een aantal jaren geleden verkoos hij wiskunde boven voetbal, omdat hij tot de conclusie kwam dat hij in dat laatste niet goed genoeg was. Nu combineert hij beide passies in zijn professionele carriรจre door machine learning methoden toe te passen om een โ€‹โ€‹beter inzicht te krijgen in dit prachtige spel. In zijn vrije tijd speelt hij nog steeds graag zeven tegen zeven, kijkt hij naar misdaadfilms en luistert hij naar filmmuziek.

Tijdstempel:

Meer van AWS-machine learning