Bundesliga-kampfakta vinnersannsynlighet: Kvantifisere effekten av hendelser i spillet på vinnersjansene ved hjelp av maskinlæring på AWS PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Bundesliga kampfakta vinnersannsynlighet: Kvantifisere effekten av begivenheter i spillet på vinnersjansene ved hjelp av maskinlæring på AWS

Om ti år vil klubbens teknologiske form være en viktig bidragsyter til deres suksess. I dag er vi allerede vitne til teknologiens potensial for å revolusjonere forståelsen av fotball. xMål kvantifiserer og tillater sammenligning av målscoringspotensial for enhver skuddsituasjon, mens xTrussel og EPV modeller forutsier verdien av ethvert øyeblikk i spillet. Til syvende og sist tjener disse og andre avanserte statistikker ett formål: å forbedre forståelsen av hvem som vinner og hvorfor. Gå inn i den nye Bundesliga Match Fact: Win Probability.

I Bayerns andre kamp mot Bochum forrige sesong snudde tabellen uventet. Tidlig i kampen scorer Lewandowski 1:0 etter bare 9 minutter. "Grå musen" i ligaen blir øyeblikkelig minnet om deres 7:0-katastrofe da de møtte Bayern for første gang den sesongen. Men ikke denne gangen: Christopher Antwi-Adjei scorer sitt første mål for klubben bare 5 minutter senere. Etter å ha lurt på seg et straffemål i det 38. minutt, virker laget fra Monaco di Bavaria paralysert og ting begynte å rase: Gamboa muskatnøtt Coman og avslutter med en absolutt korker av et mål, og Holtmann sørger for 4:1 nær pause med en dipper fra venstre. Bayern hadde ikke tenkt så mange mål i første omgang siden 1975, og klarte knapt å stikke av med et 4:2-resultat. Hvem kunne gjette det? Begge lag spilte uten sine førstekeepere, noe som for Bayern betydde å gå glipp av kapteinen Manuel Neuer. Kan hans nærvær ha reddet dem fra dette uventede resultatet?

På samme måte dro Köln to ekstraordinære zingers i 2020/2021-sesongen. Da de møtte Dortmund, hadde de gått 18 kamper uten seier, mens BVBs Haaland ga en mesterklasse i å score mål den sesongen (23 på 22 kamper). Favorittens rolle var klar, likevel tok Köln en tidlig ledelse med bare 9 minutter på klokken. I begynnelsen av andre omgang scoret Skhiri et kopimål av sitt første: 0:2. Dortmund satte inn angrepsstyrke, skapte store sjanser og scoret 1:2. Av alle spillere bommet Haaland en oppsitter 5 minutter på ekstraomganger og kronet Köln med de første 3 poengene i Dortmund etter nesten 30 år.

Senere i den sesongen overrasket Köln – som var sist på hjemmetabellen – RB Leipzig, som hadde all motivasjon til å nærme seg mesterskapslederen Bayern. Motstanderen Leipzig presset "Billy Goats" med en lagsesongrekord på 13 skudd på mål i første omgang, noe som økte deres allerede høye vinnersjanser. Ironisk nok scoret Köln 1:0 med det første skuddet på mål i minutt 46. Etter at "Red Bulls" scoret en velfortjent utligning, sov de på et innkast bare 80 sekunder senere, noe som førte til at Jonas Hector scoret for Köln. en gang til. Akkurat som Dortmund la Leipzig nå all energi i offensiven, men det beste de klarte var å treffe stolpen på overtid.

For alle disse kampene ville både eksperter og nybegynnere feilaktig gjettet vinneren, selv langt ut i kampen. Men hva er hendelsene som førte til disse overraskende svingningene i spillet med vinnersannsynlighet? På hvilket minutt passerte underdogens sjanse til å vinne favorittens da de gikk tom for tid? Bundesliga og AWS har jobbet sammen for å beregne og illustrere live-utviklingen av vinnersjanser gjennom kamper, slik at fans kan se viktige øyeblikk av sannsynlighetssvingninger. Resultatet er den nye maskinlæring (ML)-drevne Bundesliga Match Fact: Win Probability.

Hvordan virker det?

Den nye Bundesliga Match Fact Win Probability ble utviklet ved å bygge ML-modeller som analyserte over 1,000 historiske spill. Live-modellen tar estimatene før kampen og justerer dem i henhold til kampforløpet basert på funksjoner som påvirker resultatet, inkludert følgende:

  • Mål
  • Straff
  • Røde kort
  • Innbyttere
  • Tiden gikk
  • Det ble skapt målsjanser
  • Dødballsituasjoner

Live-modellen trenes opp ved hjelp av en nevral nettverksarkitektur og bruker en Poisson-distribusjonsmetode for å forutsi en mål-per-minutt-rate r for hvert lag, som beskrevet i følgende ligning:

Disse ratene kan sees på som et estimat av et teams styrke og beregnes ved hjelp av en serie tette lag basert på inngangene. Basert på disse ratene og forskjellen mellom motstanderne, beregnes sannsynlighetene for en seier og uavgjort i sanntid.

Inngangen til modellen er en 3-tuppel av input-funksjoner, nåværende målforskjell og gjenværende spilletid i minutter.

Den første komponenten av de tre inndatadimensjonene består av et funksjonssett som beskriver gjeldende spillhandling i sanntid for begge lag i ytelsesmålinger. Disse inkluderer ulike aggregerte lagbaserte xG-verdier, med spesiell oppmerksomhet til skuddene tatt de siste 15 minuttene før spådommen. Vi behandler også røde kort, straffer, hjørnespark og antall farlige frispark. Et farlig frispark klassifiseres som et frispark nærmere enn 25m motstanderens mål. Under utviklingen av modellen, i tillegg til innflytelsen fra tidligere Bundesliga Match Fact xGoals, evaluerte vi også effekten av Bundesliga Match Fact Skill i modellen. Dette betyr at modellen reagerer på utskifting av toppspillere – spillere med merker i ferdighetene Finisher, Initiator eller Ball winner.

Bundesliga-kampfakta vinnersannsynlighet: Kvantifisere effekten av hendelser i spillet på vinnersjansene ved hjelp av maskinlæring på AWS PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Eksempel på vinnersannsynlighet

La oss se på en kamp fra inneværende sesong (2022/2023). Følgende graf viser vinnersannsynligheten for Bayern München og Stuttgart-kampen fra kampdag 6.

Bundesliga-kampfakta vinnersannsynlighet: Kvantifisere effekten av hendelser i spillet på vinnersjansene ved hjelp av maskinlæring på AWS PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Modellen før kampen beregnet en vinnersannsynlighet på 67 % for Bayern, 14 % for Stuttgart og 19 % for uavgjort. Når vi ser på kampens gang, ser vi en stor effekt av mål scoret i minuttene 36′, 57′ og 60′. Frem til første minutt av overtid var stillingen 2:1 til Bayern. Kun et vellykket straffeskudd av S. Grassy i minutt 90+2 sikret uavgjort. Win Probability Live Model korrigerte derfor trekningsprognosen fra 5 % til over 90 %. Resultatet er en uventet sen sving, med Bayerns vinnersannsynlighet som synker fra 90 % til 8 % i løpet av 90+2 minutter. Grafen er representativ for svingningen i atmosfæren i Allianz Arena den dagen.

Hvordan implementeres det?

Vinnsannsynlighet bruker hendelsesdata fra en pågående kamp (målhendelser, feil, røde kort og mer) samt data produsert av andre kampfakta, for eksempel xGoals. For sanntidsoppdateringer av sannsynligheter bruker vi Amazon administrerte streaming Kafka (Amazon MSK) som en sentral datastrømming og meldingsløsning. På denne måten kan hendelsesdata, posisjonsdata og utdata fra forskjellige Bundesliga-kampfakta kommuniseres mellom containere i sanntid.

Følgende diagram illustrerer ende-til-ende arbeidsflyten for vinnersannsynlighet.

Bundesliga-kampfakta vinnersannsynlighet: Kvantifisere effekten av hendelser i spillet på vinnersjansene ved hjelp av maskinlæring på AWS PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Innsamlede matchrelaterte data blir innlemmet gjennom en ekstern leverandør (DataHub). Metadata for kampen inntas og behandles i en AWS Lambda funksjon. Posisjons- og hendelsesdata inntas gjennom en AWS Fargate container (MatchLink). Alle inntatte data publiseres deretter for forbruk i respektive MSK-emner. Hjertet av Win Probability Match Fact ligger i en dedikert Fargate-beholder (BMF WinProbability), som kjører under varigheten av den respektive kampen og bruker all nødvendig data innhentet gjennom Amazon MSK. ML-modellene (live og pre-match) er utplassert på Amazon SageMaker Serverløse sluttpunkter. Serverløse endepunkter starter automatisk dataressurser og skalerer disse dataressursene avhengig av innkommende trafikk, noe som eliminerer behovet for å velge forekomsttyper eller administrere skaleringspolicyer. Med denne betal-per-bruk-modellen er Serverless Inference ideell for arbeidsbelastninger som har inaktive perioder mellom trafikkspurtene. Når det ikke er noen Bundesliga-kamper, er det ingen kostnad for ledige ressurser.

Kort tid før avspark genererer vi vårt første sett med funksjoner og beregner vinnersannsynlighetene før kampen ved å ringe PreMatch SageMaker-endepunktet. Med disse PreMatch-sannsynlighetene initialiserer vi live-modellen, som reagerer i sanntid på relevante hendelser i spillet og kontinuerlig spørres for å motta gjeldende vinnersannsynligheter.

De beregnede sannsynlighetene sendes deretter tilbake til DataHub for å bli gitt til andre MatchFacts-forbrukere. Sannsynligheter sendes også til MSK-klyngen til et dedikert emne, for å bli konsumert av andre Bundesliga-kampfakta. En Lambda-funksjon bruker alle sannsynligheter fra det respektive Kafka-emnet, og skriver dem til en Amazonas Aurora database. Disse dataene brukes deretter til interaktive visualiseringer i nesten sanntid ved hjelp av Amazon QuickSight.

Bundesliga-kampfakta vinnersannsynlighet: Kvantifisere effekten av hendelser i spillet på vinnersjansene ved hjelp av maskinlæring på AWS PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Oppsummering

I dette innlegget demonstrerte vi hvordan den nye Bundesliga Match Fact Win Probability viser virkningen av hendelser i spillet på sjansene for at et lag vinner eller taper en kamp. For å gjøre det bygger vi på og kombinerer tidligere publiserte Bundesliga-kampfakta i sanntid. Dette lar kommentatorer og fans avdekke øyeblikk med sannsynlighetssvingninger og mer under direktesendte kamper.

Det nye Bundesliga Match Fact er resultatet av en dybdeanalyse av Bundesligas fotballeksperter og AWS-dataforskere. Vinnersannsynlighetene vises i live-tickeren til de respektive kampene i den offisielle Bundesliga-appen. Under en sending gis vinnersannsynligheter til kommentatorer gjennom datahistoriefinner og visuelt vist til fansen i viktige øyeblikk, for eksempel når underdogen tar ledelsen og nå er mest sannsynlig å vinne kampen.

Vi håper at du liker dette splitter nye Bundesliga Match Fact og at det gir deg ny innsikt i spillet. For å lære mer om partnerskapet mellom AWS og Bundesliga, besøk Bundesliga på AWS!

Vi er spente på å lære hvilke mønstre du vil avdekke. Del din innsikt med oss: @AWScloud på Twitter, med hashtaggen #BundesligaMatchFacts.


Om forfatterne

simon rolfes spilte 288 Bundesliga-kamper som sentral midtbanespiller, scoret 41 mål og vant 26 landskamper for Tyskland. For tiden fungerer Rolfes som administrerende direktør Sport i Bayer 04 Leverkusen, hvor han overvåker og utvikler pro-spillerlisten, speideravdelingen og klubbens ungdomsutvikling. Simon skriver også ukentlige spalter på Bundesliga.com om de siste Bundesliga-kampfakta drevet av AWS. Der tilbyr han sin ekspertise som tidligere spiller, kaptein og TV-analytiker for å synliggjøre virkningen av avansert statistikk og maskinlæring i fotballens verden.

Tareq Haschemi er konsulent innen AWS Professional Services. Hans ferdigheter og ekspertiseområder inkluderer applikasjonsutvikling, datavitenskap, maskinlæring og big data. Han støtter kunder med å utvikle datadrevne applikasjoner i skyen. Før han begynte i AWS var han også konsulent i ulike bransjer som luftfart og telekommunikasjon. Han brenner for å muliggjøre kunder på deres data/AI-reise til skyen.

Javier Poveda-Panter er en Data Scientist for EMEA sportskunder innenfor AWS Professional Services-teamet. Han gjør det mulig for kunder innen tilskuersport å innovere og utnytte dataene sine, og levere høykvalitets bruker- og fanopplevelser gjennom maskinlæring og datavitenskap. Han følger lidenskapen sin for et bredt spekter av sport, musikk og AI på fritiden.

Luuk Figdor er sportsteknologirådgiver i AWS Professional Services-teamet. Han jobber med spillere, klubber, ligaer og medieselskaper som Bundesliga og Formel 1 for å hjelpe dem å fortelle historier med data ved hjelp av maskinlæring. På fritiden liker han å lære alt om sinnet og skjæringspunktet mellom psykologi, økonomi og AI.

Gabriel Zylka er en maskinlæringsingeniør innen AWS Professional Services. Han jobber tett med kunder for å akselerere deres skyadopsjonsreise. Spesialisert seg på MLOps-domenet, fokuserer han på produksjon av maskinlæringsarbeidsbelastninger ved å automatisere ende-til-ende maskinlæringslivssykluser og bidra til å oppnå ønskede forretningsresultater.

Jakub Michalczyk er dataforsker ved Sportec Solutions AG. For flere år siden valgte han mattestudier fremfor å spille fotball, da han kom til at han ikke var god nok på det siste. Nå kombinerer han begge disse lidenskapene i sin profesjonelle karriere ved å bruke maskinlæringsmetoder for å få et bedre innblikk i dette vakre spillet. På fritiden liker han fortsatt å spille syvmannsfotball, se krimfilmer og høre på filmmusikk.

Tidstempel:

Mer fra AWS maskinlæring