Bundesliga Match Fact võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades masinõpet AWS PlatoBlockchain Data Intelligence'is. Vertikaalne otsing. Ai.

Bundesliga mängu fakti võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades AWS-is masinõpet

Kümne aasta pärast on klubide tehnoloogiline sobivus nende edu peamine panus. Täna oleme juba tunnistajaks tehnoloogia potentsiaalile jalgpallist arusaamise muutmisel. xGoals kvantifitseerib ja võimaldab võrrelda mis tahes löögisituatsiooni väravalöömise potentsiaali x Oht ja EPV mudelid ennustavad mis tahes mängusisese hetke väärtust. Lõppkokkuvõttes on sellel ja muul täiustatud statistikal üks eesmärk: parandada arusaamist, kes võidab ja miks. Sisestage uus Bundesliga mängu fakt: võidu tõenäosus.

Bayerni eelmise hooaja teises kohtumises Bochumi vastu pöörasid tabelid ootamatult. Mängu alguses lõi Lewandowski juba 1 minuti järel 0:9. Liiga “Hallile Hiirele” meenub hetkega nende 7:0 katastroof, kui ta kohtus sel hooajal esimest korda Bayerniga. Aga mitte seekord: Christopher Antwi-Adjei lööb oma esimese värava klubi eest vaid 5 minutit hiljem. Pärast 38. minutil penaltit tabanud Monaco di Bavaria meeskond näib olevat halvatud ja asjad hakkasid lahvatama: Gamboa muskaatpälvis Comani ja lõpetab absoluutse tabamusega ning Holtmann teeb kannuga seisuks 4:1 poolajale. vasakult. Bayern polnud esimesel poolajal nii palju väravaid löönud alates 1975. aastast ja suutis napilt 4:2 tulemusega minema lüüa. Kes oleks võinud seda arvata? Mõlemad meeskonnad mängisid ilma oma esimeste väravavahtideta, mis Bayerni jaoks tähendas oma kapten Manuel Neuerist ilmajäämist. Kas tema kohalolek oleks võinud neid sellest ootamatust tulemusest päästa?

Samamoodi tõmbas Köln hooajal 2020/2021 välja kaks erakordset lööki. Kui Dortmundiga vastamisi läks, olid nad 18 kohtumist võiduta, samal ajal kui BVB Haaland pakkus sel hooajal väravate löömise meistriklassi (23 mängust 22). Favoriidi roll oli selge, kuid Köln asus varakult juhtima, kui kella oli mängitud vaid 9 minutit. Teise poolaja alguses lõi Skhiri oma esimesest koopiavärava: 0:2. Dortmund alistas ründejõu, lõi suured võimalused ja lõi 1:2. Kõigist mängijatest jättis Haaland lisaajal 5 minutil vahele ühe istuja ja kroonis Kölni Dortmundis peaaegu 3 aasta pärast esimese 30 punktiga.

Hiljem samal hooajal üllatas Köln, olles kodutabelis viimane, RB Leipzigi, kellel oli kogu motivatsioon meistrivõistluste liidrile Bayernile läheneda. Vastane Leipzig survestas “Billy Goatsi” esimesel poolajal koondisehooaja rekordiga 13 pealelööki, suurendades niigi kõrgeid võiduvõimalusi. Iroonilisel kombel lõi Köln 1. minutil esimese löögiga 0:46. Pärast seda, kui "Red Bulls" lõi teenitud viigivärava, magasid nad vaid 80 sekundit hiljem sisseviske, mille tulemusel lõi Jonas Hector Kölni värava. uuesti. Nii nagu Dortmund, pani Leipzig nüüd kogu energia rünnakule, kuid parim, mis neil õnnestus, oli lisaajal posti tabamine.

Kõigi nende matšide puhul oleksid nii eksperdid kui ka algajad võitja valesti arvanud, isegi matši alguses. Kuid millised on sündmused, mis viisid nende üllatavate mängusisese võidu tõenäosuse kõikumiseni? Mis minutil ületas allajääjate võiduvõimalus favoriidi oma, kuna aeg sai otsa? Bundesliga ja AWS on teinud koostööd, et arvutada ja illustreerida võiduvõimaluste reaalajas arengut kogu matšide jooksul, võimaldades fännidel näha tõenäosuse kõikumise võtmehetki. Tulemuseks on uus masinõppe (ML) toega Bundesliga Match Fact: Win Probability.

Kuidas see toimib?

Uus Bundesliga Match Fact Win Probability töötati välja ML mudelite ehitamisel, mis analüüsisid üle 1,000 ajaloolise mängu. Reaalajas mudel võtab mängueelsed hinnangud ja kohandab neid vastavalt matši protsessile, võttes aluseks funktsioonid, mis mõjutavad tulemust, sealhulgas järgmist.

  • Eesmärgid
  • Karistused
  • Punased kaardid
  • Vahetused
  • Aeg möödus
  • Väravalöömise võimalused loodud
  • Määratud olukorrad

Reaalajas mudelit treenitakse närvivõrgu arhitektuuri abil ja see kasutab Poissoni jaotusmeetodit, et ennustada väravate minutis määra. r iga meeskonna jaoks, nagu on kirjeldatud järgmises võrrandis:

Neid määrasid võib vaadelda kui meeskonna tugevuse hinnangut ja need arvutatakse sisendite põhjal tihedate kihtide seeria abil. Nende määrade ja vastaste vahe põhjal arvutatakse reaalajas võidu ja viigi tõenäosus.

Mudeli sisendiks on 3 sisendfunktsiooni, praegune väravate vahe ja järelejäänud mänguaeg minutites.

Kolme sisenddimensiooni esimene komponent koosneb funktsioonide komplektist, mis kirjeldab reaalajas mõlema meeskonna praegust mängutoimingut tulemuslikkuse mõõdikutes. Nende hulka kuuluvad erinevad meeskonnapõhised xG koondväärtused, pöörates erilist tähelepanu kaadritele, mis on tehtud viimase 15 minuti jooksul enne ennustust. Samuti töötleme punaseid kaarte, penalteid, nurgalööke ja ohtlike karistuslöökide arvu. Ohtlik karistuslöök klassifitseeritakse kui vastase väravale lähemal kui 25 m sooritatud karistuslöök. Mudeli väljatöötamise käigus hindasime lisaks endise Bundesliga Match Fact xGoalsi mõjule ka Bundesliga Match Fact Skill mõju mudelis. See tähendab, et mudel reageerib tippmängijate väljavahetamisele – mängijad, kellel on oskuste lõpetaja, algataja või palli võitja märgid.

Bundesliga Match Fact võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades masinõpet AWS PlatoBlockchain Data Intelligence'is. Vertikaalne otsing. Ai.

Võidutõenäosuse näide

Vaatame jooksva hooaja (2022/2023) matši. Järgmine graafik näitab Müncheni Bayerni ja Stuttgarti mängu võidu tõenäosust alates 6. mängupäevast.

Bundesliga Match Fact võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades masinõpet AWS PlatoBlockchain Data Intelligence'is. Vertikaalne otsing. Ai.

Mängueelne mudel arvutas Bayerni võidu tõenäosuseks 67%, Stuttgarti jaoks 14% ja viigi puhul 19%. Kui vaatame mängu kulgu, näeme 36′, 57′ ja 60′ minutil löödud väravate suurt mõju. Kuni lisaaja esimese minutini oli seis Bayerni kasuks 2:1. Viigi tagas vaid S. Grassy õnnestunud penalti 90+2 minutil. Win Probability Live Model korrigeeris seetõttu viigiprognoosi 5% pealt üle 90%. Tulemuseks on ootamatu hiline kõikumine, kus Bayerni võidutõenäosus vähenes 90+8 minutiga 90%-lt 2%-le. Graafik esindab atmosfääri kõikumist Allianz Arena sellel päeval.

Kuidas seda rakendatakse?

Võidutõenäosus kasutab käimasoleva matši sündmuste andmeid (väravasündmused, vead, punased kaardid ja palju muud) ning ka muude mängufaktide (nt xGoals) loodud andmeid. Tõenäosuste reaalajas värskendamiseks kasutame Amazoni hallatav voogesitus Kafka (Amazon MSK) keskse andmevoogesituse ja sõnumside lahendusena. Nii saab konteinerite vahel reaalajas edastada sündmuste andmeid, positsioonide andmeid ja erinevate Bundesliga mängufaktide väljundeid.

Järgmine diagramm illustreerib võitmise tõenäosuse täielikku töövoogu.

Bundesliga Match Fact võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades masinõpet AWS PlatoBlockchain Data Intelligence'is. Vertikaalne otsing. Ai.

Kogutud vastetega seotud andmed hangitakse välise pakkuja (DataHub) kaudu. Vaste metaandmed võetakse sisse ja töödeldakse AWS Lambda funktsiooni. Positsioonide ja sündmuste andmed neelatakse läbi an AWS Fargate konteiner (MatchLink). Seejärel avaldatakse kõik allaneelatud andmed tarbimiseks vastavates MSK teemades. Win Probability Match Facti süda asub spetsiaalses Fargate'i konteineris (BMF WinProbability), mis töötab vastava matši jooksul ja tarbib kõiki Amazon MSK kaudu saadud andmeid. ML-mudelid (otse- ja mängueelsed) on kasutusele võetud Amazon SageMaker Serverita järelduste lõpp-punktid. Serverita lõpp-punktid käivitavad automaatselt arvutusressursse ja skaleerivad neid arvutusressursse sõltuvalt sissetulevast liiklusest, välistades vajaduse valida eksemplaritüüpe või hallata skaleerimispoliitikaid. Selle tasulise kasutamise mudeliga on serverita järeldus ideaalne töökoormuste jaoks, mille liiklusspurtide vahel on jõudeperioode. Kui Bundesliga mänge pole, pole tühiste ressursside eest kulusid.

Vahetult enne algust loome oma esialgse funktsioonide komplekti ja arvutame välja mängueelse võidu tõenäosuse, kutsudes esile PreMatch SageMakeri lõpp-punkti. Nende PreMatchi tõenäosustega initsialiseerime reaalajas mudeli, mis reageerib reaalajas asjakohastele mängusisestele sündmustele ja mille kohta esitatakse pidevalt päringuid, et saada praeguse võidu tõenäosus.

Arvutatud tõenäosused saadetakse seejärel tagasi DataHubi, et need edastada teistele MatchFactsi tarbijatele. Tõenäosused saadetakse ka MSK klastrisse spetsiaalsele teemale, et neid saaks kasutada teised Bundesliga mängufaktid. Lambda funktsioon tarbib kõik vastava Kafka teema tõenäosused ja kirjutab need an Amazonase Aurora andmebaasi. Neid andmeid kasutatakse seejärel interaktiivsetes peaaegu reaalajas visualiseerimiseks Amazon QuickSight.

Bundesliga Match Fact võidu tõenäosus: mängusiseste sündmuste mõju võiduvõimalustele kvantifitseerimine, kasutades masinõpet AWS PlatoBlockchain Data Intelligence'is. Vertikaalne otsing. Ai.

kokkuvõte

Selles postituses demonstreerisime, kuidas uus Bundesliga mängu fakti võidu tõenäosus näitab mängusiseste sündmuste mõju meeskonna võiduvõimalustele või kaotustele. Selleks tugineme ja kombineerime reaalajas varem avaldatud Bundesliga mängufakte. See võimaldab kommentaatoritel ja fännidel reaalajas matšide ajal avastada tõenäosuse kõikumise hetki ja palju muud.

Uus Bundesliga Match Fact on Bundesliga jalgpalliekspertide ja AWS-i andmeteadlaste põhjaliku analüüsi tulemus. Võidutõenäosused on näidatud vastavate matšide otsepildis ametlikus Bundesliga rakenduses. Saate ajal edastatakse kommentaatoritele võidu tõenäosused andmelugude leidja ja seda näidatakse visuaalselt fännidele võtmehetkedel, näiteks siis, kui allajääja läheb juhtima ja on nüüd kõige tõenäolisemalt mängu võitnud.

Loodame, et teile meeldib see uhiuus Bundesliga mängu fakt ja see annab teile mängu kohta uusi teadmisi. AWS-i ja Bundesliga vahelise partnerluse kohta lisateabe saamiseks külastage Bundesliga AWS-is!

Meil on hea meel teada saada, milliseid mustreid te avastate. Jagage meiega oma teadmisi: @AWScloud Twitteris, hashtagiga #BundesligaMatchFacts.


Autoritest

Simon Rolfes mängis keskpoolkaitsjana 288 Bundesliga mängu, lõi 41 väravat ja võitis Saksamaa koondises 26 mängu. Praegu töötab Rolfes Bayer 04 Leverkuseni spordi tegevdirektorina, kus ta jälgib ja arendab profimängijate nimekirja, skaudiosakonda ja klubi noorte arengut. Simon kirjutab ka iganädalasi veerge Bundesliga.com viimase Bundesliga mängu faktide kohta, mida toetab AWS. Seal pakub ta oma teadmisi endise mängija, kapteni ja teleanalüütikuna, et tõsta esile täiustatud statistika ja masinõppe mõju jalgpallimaailmale.

Tareq Haschemi on AWS Professional Services konsultant. Tema oskused ja valdkonnad hõlmavad rakenduste arendamist, andmeteadust, masinõpet ja suurandmeid. Ta toetab kliente andmepõhiste rakenduste arendamisel pilves. Enne AWS-iga liitumist oli ta ka konsultant erinevates tööstusharudes, nagu lennundus ja telekommunikatsioon. Ta on kirglik võimaldada klientidel nende andmete/AI teekonnal pilve jõuda.

Javier Poveda-Panter on EMEA spordiklientide andmeteadlane AWS Professional Services meeskonnas. Ta võimaldab publikuspordi valdkonna klientidel uuendusi teha ja oma andmeid ära kasutada, pakkudes masinõppe ja andmeteaduse kaudu kvaliteetseid kasutaja- ja fännikogemusi. Ta järgib vabal ajal oma kirge paljude spordialade, muusika ja tehisintellekti vastu.

Luuk Figdor on AWS Professional Services meeskonna sporditehnoloogia nõustaja. Ta teeb koostööd mängijate, klubide, liigade ja meediaettevõtetega, nagu Bundesliga ja Vormel 1, et aidata neil masinõppe abil andmetega lugusid rääkida. Vabal ajal meeldib talle õppida kõike mõistuse ja psühholoogia, majanduse ja tehisintellekti ristumiskohtade kohta.

Gabriel Zylka on AWS Professional Services masinõppeinsener. Ta teeb tihedat koostööd klientidega, et kiirendada nende pilve kasutuselevõttu. MLOps-valdkonnale spetsialiseerunud ta keskendub masinõppe töökoormuste tootmisele, automatiseerides täielikke masinõppe elutsükleid ja aidates saavutada soovitud äritulemusi.

Jakub Michalczyk on Sportec Solutions AG andmeteadlane. Mitu aastat tagasi valis ta jalgpalli mängimise asemel matemaatikaõpingud, kuna jõudis järeldusele, et viimases pole ta piisavalt hea. Nüüd ühendab ta mõlemad kired oma professionaalses karjääris, rakendades masinõppe meetodeid, et saada sellest kaunist mängust parem ülevaade. Vabal ajal meeldib talle siiani mängida seitsmevõistlusega jalgpalli, vaadata krimifilme ja kuulata filmimuusikat.

Ajatempel:

Veel alates AWS-i masinõpe