Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na možnosti za zmago z uporabo strojnega učenja na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na zmagovalne možnosti z uporabo strojnega učenja na AWS

Čez deset let bo tehnološka pripravljenost klubov ključno prispevala k njihovemu uspehu. Danes smo že priča potencialu tehnologije, da spremeni razumevanje nogometa. xCilji kvantificira in omogoča primerjavo potenciala doseganja zadetkov katere koli strelske situacije, medtem ko xThreat in EPV modeli napovedujejo vrednost katerega koli trenutka v igri. Konec koncev imajo te in druge napredne statistike en sam namen: izboljšati razumevanje, kdo bo zmagal in zakaj. Vnesite novo dejstvo o tekmi bundeslige: verjetnost zmage.

Na drugi tekmi Bayerna proti Bochumu v lanski sezoni se je plošča nepričakovano obrnila. Na začetku tekme Lewandowski že po 1 minutah zadene za 0:9. "Siva miška" lige se takoj spomni na svojo katastrofo s 7:0, ko se je prvič v tej sezoni pomerila z Bayernom. A ne tokrat: Christopher Antwi-Adjei doseže svoj prvi gol za klub le 5 minut kasneje. Po zaslugi enajstmetrovke v 38. minuti se moštvo iz Monaca di Bavaria zdi paralizirano in stvari so začele izbruhniti: Gamboa nutmegs Coman in zaključi z absolutnim strelcem gola, Holtmann pa je blizu polčasa z dipperjem povišal na 4:1. z leve. Toliko golov Bayern v prvem polčasu ni dosegel vse od leta 1975 in se je komajda umaknil izidu 4:2. Kdo bi lahko to uganil? Obe ekipi sta igrali brez svojih prvih vratarjev, kar je za Bayern pomenilo, da ni igral svojega kapetana Manuela Neuerja. Bi jih njegova prisotnost lahko rešila tega nepričakovanega rezultata?

Podobno je Kölnu v sezoni 2020/2021 uspel dva izjemna zingerja. Ko so se pomerili z Dortmundom, so imeli 18 tekem brez zmage, medtem ko je Haaland iz BVB v tej sezoni zagotavljal mojstrski razred doseganja golov (23 na 22 tekmah). Vloga favorita je bila jasna, kljub temu pa je Köln zgodaj povedel s samo 9 minutami na semaforju. V začetku drugega polčasa je Skhiri dosegel karbonsko kopijo svojega prvega: 0:2. Dortmund je zmanjšal moč napada, si ustvaril lepe priložnosti in zadel za 1:2. Od vseh igralcev je Haaland v 5 minutah podaljška zgrešil igralca in Köln okronal s prvimi tremi točkami v Dortmundu po skoraj 3 letih.

Kasneje v tej sezoni je Köln – zadnji na domači lestvici – presenetil RB Leipzig, ki je imel vso motivacijo, da se približa vodilnemu v prvenstvu Bayernu. Nasprotnik Leipzig je pritiskal na "Billy Goats" s 13 streli proti vratom ekipe v prvem polčasu, kar je povečalo njihove že tako visoke možnosti za zmago. Ironično, Köln je s prvim strelom na gol dosegel 1:0 v 46. minuti. Potem ko so "Rdeči biki" dosegli zasluženo izenačenje, so le 80 sekund kasneje zaspali na izločitvi, nato pa je za Köln zadel Jonas Hector. ponovno. Tako kot Dortmund je tudi Leipzig zdaj vso energijo usmeril v napad, a največ, kar jim je uspelo doseči, je zadetek vratnice v podaljšku.

Za vse te dvoboje bi tako strokovnjaki kot novinci napačno uganili zmagovalca, celo daleč v dvoboju. Toda kateri so dogodki, ki so privedli do teh presenetljivih nihanj verjetnosti zmage v igri? V kateri minuti so možnosti za zmago favorita prehitele možnosti favorita, saj jim je zmanjkalo časa? Bundesliga in AWS sta sodelovala pri izračunu in ponazoritvi razvoja priložnosti za zmago v živo med tekmami, kar navijačem omogoča, da vidijo ključne trenutke nihanj verjetnosti. Rezultat je novo, strojno učenje (ML), ki temelji na Bundesliga Match Fact: Win Probability.

Kako deluje?

Nova Bundesliga Match Fact Win Probability je bila razvita z izdelavo modelov ML, ki so analizirali več kot 1,000 zgodovinskih iger. Model v živo vzame ocene pred tekmo in jih prilagodi glede na potek tekme na podlagi značilnosti, ki vplivajo na izid, vključno z naslednjim:

  • Cilji
  • kazni
  • Rdeči kartoni
  • Zamenjave
  • Čas je minil
  • Ustvarjene priložnosti za gol
  • Nastavljene situacije

Model v živo se usposablja z uporabo arhitekture nevronske mreže in uporablja pristop Poissonove porazdelitve za napovedovanje stopnje golov na minuto r za vsako ekipo, kot je opisano v naslednji enačbi:

Na te stopnje je mogoče gledati kot na oceno moči ekipe in se izračunajo z uporabo niza gostih plasti na podlagi vnosov. Na podlagi teh stopenj in razlike med nasprotniki se verjetnosti zmage in remija izračunajo v realnem času.

Vhodni podatki za model so 3 vhodne funkcije, trenutna gol razlika in preostali čas igre v minutah.

Prva komponenta treh vhodnih razsežnosti je sestavljena iz nabora funkcij, ki opisuje trenutno dejanje igre v realnem času za obe ekipi v meritvah uspešnosti. Ti vključujejo različne agregirane vrednosti xG na podlagi ekipe, s posebnim poudarkom na posnetkih, posnetih v zadnjih 15 minutah pred napovedjo. Obdelujemo tudi rdeče kartone, enajstmetrovke, udarce iz kota in število nevarnih prostih strelov. Nevaren prosti strel je klasificiran kot prosti strel bližje kot 25 m od nasprotnikovih vrat. Med razvojem modela smo poleg vpliva prejšnjih Bundesliga Match Fact xGoals ocenili tudi vpliv Bundesliga Match Fact Skill v modelu. To pomeni, da se model odzove na zamenjavo vrhunskih igralcev – igralcev z značkami v spretnostih Finišer, Pobudnik ali Zmagovalec žoge.

Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na možnosti za zmago z uporabo strojnega učenja na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Primer verjetnosti zmage

Poglejmo tekmo iz tekoče sezone (2022/2023). Naslednji graf prikazuje verjetnost zmage za tekmo Bayern München in Stuttgart od 6. tekme.

Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na možnosti za zmago z uporabo strojnega učenja na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Model pred tekmo je izračunal verjetnost zmage 67 % za Bayern, 14 % za Stuttgart in 19 % za remi. Ko pogledamo potek tekme, opazimo velik vpliv zadetkov v 36′, 57′ in 60′ minuti. Do prve minute podaljška je bilo 2:1 za Bayern. Le uspešna enajstmetrovka S. Grassyja v 90+2 minuti je zagotovila remi. Model verjetnosti zmage v živo je zato popravil napoved žrebanja s 5 % na več kot 90 %. Rezultat je nepričakovan pozni nihaj, pri čemer se je verjetnost Bayernove zmage zmanjšala z 90 % na 8 % v 90+2 minutah. Graf predstavlja nihanje ozračja v Allianz Areni tistega dne.

Kako se izvaja?

Verjetnost zmage porablja podatke o dogodkih iz tekoče tekme (dogodki z goli, prekrški, rdeči kartoni in drugo) ter podatke, ki jih ustvarijo druge funkcije Match Facts, kot je xGoals. Za posodobitve verjetnosti v realnem času uporabljamo Amazon Managed Streaming Kafka (Amazon MSK) kot osrednja rešitev za pretakanje podatkov in sporočanje. Na ta način se lahko podatki o dogodkih, podatki o položajih in izhodi različnih dejstev Bundesliga Match Facts sporočajo med vsebniki v realnem času.

Naslednji diagram prikazuje potek dela od konca do konca za verjetnost zmage.

Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na možnosti za zmago z uporabo strojnega učenja na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Zbrani podatki, povezani z ujemanjem, se zaužijejo prek zunanjega ponudnika (DataHub). Metapodatki o ujemanju so zaužiti in obdelani v AWS Lambda funkcijo. Podatki o položajih in dogodkih se zaužijejo prek an AWS Fargate vsebnik (MatchLink). Vsi zaužiti podatki so nato objavljeni za uporabo v ustreznih temah MSK. Srce dejstva o ujemanju verjetnosti zmage je v namenskem vsebniku Fargate (BMF WinProbability), ki teče ves čas trajanja posameznega ujemanja in porabi vse potrebne podatke, pridobljene prek Amazon MSK. Modeli ML (v živo in pred tekmo) so razporejeni na Amazon SageMaker Končne točke sklepanja brez strežnika. Brezstrežniške končne točke samodejno zaženejo računalniške vire in te računalniške vire prilagodijo glede na dohodni promet, s čimer odpravijo potrebo po izbiri vrst primerkov ali upravljanju pravilnikov o skaliranju. S tem modelom plačila na uporabo je sklepanje brez strežnika idealno za delovne obremenitve, ki imajo obdobja nedejavnosti med skoki prometa. Ko ni tekem Bundeslige, ni stroškov za neuporabne vire.

Tik pred začetkom generiramo naš začetni nabor funkcij in izračunamo verjetnosti zmage pred tekmo s klicem končne točke PreMatch SageMaker. S temi verjetnostmi PreMatch nato inicializiramo model v živo, ki se v realnem času odziva na ustrezne dogodke v igri in se nenehno poizveduje za prejemanje trenutnih verjetnosti zmage.

Izračunane verjetnosti se nato pošljejo nazaj v DataHub, da se zagotovijo drugim uporabnikom MatchFacts. Verjetnosti se prav tako pošljejo v gručo MSK na namensko temo, ki jo uporabijo drugi podatki o tekmah Bundeslige. Lambda funkcija porabi vse verjetnosti iz zadevne Kafkove teme in jih zapiše v Amazonska Aurora zbirka podatkov. Ti podatki se nato uporabijo za interaktivne vizualizacije v skoraj realnem času Amazon QuickSight.

Bundesliga Match Fact Verjetnost zmage: Kvantificiranje učinka dogodkov v igri na možnosti za zmago z uporabo strojnega učenja na AWS PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Povzetek

V tem prispevku smo prikazali, kako nova verjetnost zmage na tekmi bundeslige prikazuje vpliv dogodkov v igri na možnosti, da ekipa zmaga ali izgubi tekmo. Da bi to naredili, nadgrajujemo in združujemo predhodno objavljena dejstva o tekmah Bundeslige v realnem času. To omogoča komentatorjem in navijačem, da med tekmami v živo odkrijejo trenutke nihanj verjetnosti in več.

Novo Bundesliga Match Fact je rezultat poglobljene analize nogometnih strokovnjakov Bundeslige in podatkovnih znanstvenikov AWS. Verjetnosti zmage so prikazane v živo na tickerju ustreznih tekem v uradni aplikaciji Bundeslige. Med oddajo so verjetnosti zmage komentatorjem na voljo prek iskalnik podatkovnih zgodb in vizualno prikazan navijačem v ključnih trenutkih, na primer, ko podcenjeni prevzame vodstvo in je zdaj najverjetneje, da zmaga.

Upamo, da boste uživali v tem povsem novem dejstvu o tekmah Bundeslige in da vam nudi nov vpogled v igro. Če želite izvedeti več o partnerstvu med AWS in Bundesligo, obiščite Bundesliga na AWS!

Z veseljem bomo izvedeli, katere vzorce boste odkrili. Delite svoje vpoglede z nami: @AWScloud na Twitterju, z oznako #BundesligaMatchFacts.


O avtorjih

Simon Rolfes odigral 288 tekem bundeslige kot osrednji vezist, dosegel 41 golov in 26 nastopov za Nemčijo. Trenutno je Rolfes generalni direktor športa pri Bayerju 04 Leverkusen, kjer nadzira in razvija seznam profesionalnih igralcev, skavtski oddelek in razvoj mladih v klubu. Simon piše tudi tedenske kolumne Bundesliga.com o najnovejših dejstvih o tekmah Bundeslige, ki jih uporablja AWS. Tam ponuja svoje strokovno znanje kot nekdanji igralec, kapetan in televizijski analitik, da bi izpostavil vpliv napredne statistike in strojnega učenja na svet nogometa.

Tareq Haschemi je svetovalec znotraj AWS Professional Services. Njegove veščine in strokovna področja vključujejo razvoj aplikacij, podatkovno znanost, strojno učenje in velike podatke. Podpira stranke pri razvoju podatkovno vodenih aplikacij v oblaku. Preden se je pridružil AWS, je bil tudi svetovalec v različnih panogah, kot sta letalstvo in telekomunikacije. Strastno ga zanima omogočanje strankam na njihovem potovanju podatkov/AI v oblak.

Javier Poveda-Panter je Data Scientist za športne stranke v regiji EMEA v skupini AWS Professional Services. Strankam na področju gledaliških športov omogoča inovacije in izkoriščanje njihovih podatkov, s pomočjo strojnega učenja in podatkovne znanosti zagotavlja visokokakovostne izkušnje uporabnikov in navijačev. V prostem času sledi svoji strasti do širokega nabora športov, glasbe in umetne inteligence.

Luuk Figdor je svetovalec za športno tehnologijo v skupini AWS Professional Services. Sodeluje z igralci, klubi, ligami in medijskimi podjetji, kot sta Bundesliga in Formula 1, da bi jim pomagal pripovedovati zgodbe s podatki z uporabo strojnega učenja. V prostem času se rad uči vse o umu in presečišču med psihologijo, ekonomijo in umetno inteligenco.

Gabriel Zylka je inženir strojnega učenja znotraj AWS Professional Services. Tesno sodeluje s strankami, da bi pospešil njihovo pot sprejemanja oblaka. Specializiran je za področje MLOps in se osredotoča na proizvodnjo delovnih obremenitev strojnega učenja z avtomatizacijo življenjskih ciklov strojnega učenja od konca do konca in pomaga pri doseganju želenih poslovnih rezultatov.

Jakub Michalczyk je podatkovni znanstvenik pri Sportec Solutions AG. Pred leti je namesto nogometa izbral študij matematike, saj je ugotovil, da mu slednje ne gre dovolj dobro. Zdaj združuje obe strasti v svoji poklicni karieri z uporabo metod strojnega učenja, da bi pridobil boljši vpogled v to čudovito igro. V prostem času še vedno rad igra mali nogomet, gleda kriminalke in posluša filmsko glasbo.

Časovni žig:

Več od Strojno učenje AWS