Bundesliga Match Fact Win Probability: Cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Probabilitatea de câștig din Bundesliga: cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS

Peste zece ani, capacitatea tehnologică a cluburilor va fi un factor cheie la succesul lor. Astăzi asistăm deja la potențialul tehnologiei de a revoluționa înțelegerea fotbalului. xObiective cuantifică și permite compararea potențialului de goluri din orice situație de tragere, în timp ce xAmenințare și EPV modelele prezic valoarea oricărui moment din joc. În cele din urmă, acestea și alte statistici avansate servesc unui singur scop: să îmbunătățească înțelegerea cine va câștiga și de ce. Introduceți noul Fapt de meci din Bundesliga: Probabilitatea de câștig.

În cel de-al doilea meci al lui Bayern împotriva lui Bochum din sezonul trecut, lucrurile s-au întors pe neașteptate. La începutul meciului, Lewandowski înscrie 1:0 după doar 9 minute. „Grey Mouse” al ligii își amintește instantaneu de dezastrul lor de 7:0 când se confruntă cu Bayern pentru prima dată în acel sezon. Dar nu de data aceasta: Christopher Antwi-Adjei marchează primul său gol pentru club doar 5 minute mai târziu. După ce a conceput un gol de penalty în minutul 38, echipa din Monaco di Bavaria pare paralizată și lucrurile au început să erupă: nucșoara Gamboa îl dă pe Coman și termină cu o doptă absolută de gol, iar Holtmann face 4:1 aproape de pauză cu un scafandru. din stânga. Bayern nu a conceput atâtea goluri în prima repriză din 1975 și abia a reușit să plece cu un rezultat de 4:2. Cine ar fi putut ghici asta? Ambele echipe au jucat fără primii portari, ceea ce pentru Bayern a însemnat să-l rateze pe căpitanul Manuel Neuer. Ar fi putut prezența lui să-i salveze de acest rezultat neașteptat?

În mod similar, Köln a reușit două zgomote extraordinare în sezonul 2020/2021. Când s-au confruntat cu Dortmund, au trecut 18 meciuri fără a câștiga, în timp ce Haaland de la BVB oferea o clasă de master în marcarea de goluri în acel sezon (23 în 22 de meciuri). Rolul favoritului a fost clar, totuși Köln a luat conducerea devreme cu doar 9 minute la cronometru. La începutul celei de-a doua reprize, Skhiri a marcat un gol-copie al primului său: 0:2. Dortmund a înlocuit forța de atac, a creat ocazii mari și a marcat 1:2. Dintre toți jucătorii, Haaland a ratat un model la 5 minute de la prelungiri și a încoronat Köln cu primele 3 puncte la Dortmund după aproape 30 de ani.

Mai târziu în acel sezon, Köln – fiind ultima în clasamentul de acasă – l-a surprins pe RB Leipzig, care a avut toată motivația să se apropie de liderul campionatului Bayern. Adversarul Leipzig a făcut presiune pe „Billy Goats” cu un record de 13 șuturi la poartă în prima repriză, crescând șansele lor deja mari de victorie. În mod ironic, Köln a marcat scorul de 1:0 cu primul șut la poartă în minutul 46. După ce „Red Bulls” au înscris un egal meritat, au dormit la aruncare de la margine doar 80 de secunde mai târziu, ceea ce a dus la Jonas Hector să înscrie pentru Köln. din nou. La fel ca și Dortmund, Leipzig a pus acum toată energia în atac, dar cel mai bun lucru pe care l-au reușit a fost să lovească postul în prelungiri.

Pentru toate aceste meciuri, experții și începătorii deopotrivă ar fi ghicit în mod greșit câștigătorul, chiar și până la începutul meciului. Dar care sunt evenimentele care au dus la aceste schimbări surprinzătoare în joc ale probabilității de câștig? În ce moment șansa de victorie a defavorabilului a depășit-o pe cea a favoritului, deoarece acestea au rămas fără timp? Bundesliga și AWS au lucrat împreună pentru a calcula și a ilustra evoluția în direct a șanselor de câștig pe parcursul meciurilor, permițând fanilor să vadă momentele cheie ale schimbărilor de probabilitate. Rezultatul este noul învățare automată (ML) alimentat de Bundesliga Match Fact: Win Probability.

Cum functioneaza?

Noul Bundesliga Match Fact Win Probability a fost dezvoltat prin construirea de modele ML care au analizat peste 1,000 de jocuri istorice. Modelul în direct preia estimările înainte de meci și le ajustează în funcție de procedurile meciului, pe baza caracteristicilor care afectează rezultatul, inclusiv următoarele:

  • Goluri
  • penalități
  • Cartonașe roșii
  • substitutii
  • A trecut timpul
  • S-au creat ocazii de gol
  • Situații de joc

Modelul live este antrenat folosind o arhitectură de rețea neuronală și folosește o abordare de distribuție Poisson pentru a prezice o rată a obiectivelor pe minut. r pentru fiecare echipă, așa cum este descris în următoarea ecuație:

Aceste rate pot fi privite ca o estimare a puterii unei echipe și sunt calculate folosind o serie de straturi dense pe baza intrărilor. Pe baza acestor rate și a diferenței dintre adversari, probabilitățile de victorie și egalitate sunt calculate în timp real.

Intrarea către model este un 3-tuplu de caracteristici de intrare, diferența de gol actuală și timpul de redare rămas în minute.

Prima componentă a celor trei dimensiuni de intrare constă într-un set de caracteristici care descrie acțiunea curentă a jocului în timp real pentru ambele echipe în valorile de performanță. Acestea includ diverse valori xG agregate bazate pe echipe, cu o atenție deosebită asupra fotografiilor făcute în ultimele 15 minute înainte de predicție. De asemenea, procesăm cartonașe roșii, penalități, lovituri de colț și numărul de lovituri libere periculoase. O lovitură liberă periculoasă este clasificată ca o lovitură liberă la mai puțin de 25 m de poarta adversă. În timpul dezvoltării modelului, pe lângă influența fostului Bundesliga Match Fact xGoals, am evaluat și impactul Bundesliga Match Fact Skill în model. Aceasta înseamnă că modelul reacționează la înlocuirea jucătorilor de top – jucători cu insigne în abilitățile Finisher, Initiator sau Ball winner.

Bundesliga Match Fact Win Probability: Cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Exemplu de probabilitate de câștig

Să ne uităm la un meci din sezonul curent (2022/2023). Următorul grafic arată probabilitatea de victorie pentru meciul Bayern Munchen și Stuttgart din ziua a 6-a.

Bundesliga Match Fact Win Probability: Cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Modelul de dinainte de meci a calculat o probabilitate de victorie de 67% pentru Bayern, 14% pentru Stuttgart și 19% pentru o remiză. Când ne uităm la cursul meciului, vedem un impact mare al golurilor marcate în minutele 36′, 57′ și 60′. Până în primul minut al prelungirilor, scorul a fost 2:1 pentru Bayern. Doar un penalty reușit al lui S. Grassy în minutul 90+2 a asigurat egalitatea. Prin urmare, modelul Win Probability Live a corectat prognoza de extragere de la 5% la peste 90%. Rezultatul este o întârziere neașteptată, probabilitatea de victorie a lui Bayern scăzând de la 90% la 8% în minutul 90+2. Graficul este reprezentativ pentru variația atmosferei din Allianz Arena în acea zi.

Cum este implementat?

Probabilitatea de câștig consumă date despre evenimente dintr-un meci în desfășurare (evenimente cu goluri, faulturi, cartonașe roșii și multe altele), precum și date produse de alte date despre meci, cum ar fi xGoals. Pentru actualizări în timp real ale probabilităților, folosim Streaming gestionat de Amazon Kafka (Amazon MSK) ca soluție centrală de transmitere a datelor și de mesagerie. În acest fel, datele despre evenimente, datele despre poziții și rezultatele diferitelor date despre meciurile din Bundesliga pot fi comunicate între containere în timp real.

Următoarea diagramă ilustrează fluxul de lucru end-to-end pentru Win Probability.

Bundesliga Match Fact Win Probability: Cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Datele adunate legate de potrivire sunt ingerate printr-un furnizor extern (DataHub). Metadatele potrivirii sunt ingerate și procesate într-un AWS Lambdas funcţie. Datele privind pozițiile și evenimentele sunt ingerate printr-un AWS Fargate container (MatchLink). Toate datele ingerate sunt apoi publicate pentru consum în subiectele MSK respective. Partea centrală a Win Probability Match Fact se află într-un container Fargate dedicat (BMF WinProbability), care rulează pe durata meciului respectiv și consumă toate datele necesare obținute prin Amazon MSK. Modelele ML (în direct și pre-meci) sunt implementate Amazon SageMaker Puncte finale de inferență fără server. Punctele finale fără server lansează automat resurse de calcul și scalează aceste resurse de calcul în funcție de traficul de intrare, eliminând nevoia de a alege tipurile de instanțe sau de a gestiona politicile de scalare. Cu acest model de plată pe utilizare, Serverless Inference este ideală pentru sarcinile de lucru care au perioade de inactivitate între accesele de trafic. Când nu există meciuri din Bundesliga, nu există costuri pentru resursele inactiv.

Cu puțin timp înainte de start, generăm setul nostru inițial de caracteristici și calculăm probabilitățile de câștig înainte de meci apelând punctul final PreMatch SageMaker. Cu acele probabilități PreMatch, inițializam apoi modelul live, care reacționează în timp real la evenimentele relevante din joc și este interogat continuu pentru a primi probabilitățile actuale de câștig.

Probabilitățile calculate sunt apoi trimise înapoi la DataHub pentru a fi furnizate altor consumatori MatchFacts. Probabilitățile sunt, de asemenea, trimise către clusterul MSK către un subiect dedicat, pentru a fi consumat de alte Bundesliga Match Facts. O funcție Lambda consumă toate probabilitățile din subiectul Kafka respectiv și le scrie într-un Amazon Aurora Bază de date. Aceste date sunt apoi utilizate pentru vizualizări interactive aproape în timp real Amazon QuickSight.

Bundesliga Match Fact Win Probability: Cuantificarea efectului evenimentelor din joc asupra șanselor de câștig folosind învățarea automată pe AWS PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Rezumat

În această postare, am demonstrat cum noul Bundesliga Match Fact Win Probability arată impactul evenimentelor din joc asupra șanselor ca o echipă să câștige sau să piardă un meci. Pentru a face acest lucru, construim și combinăm Faptele meciurilor din Bundesliga publicate anterior în timp real. Acest lucru le permite comentatorilor și fanilor să descopere momente de schimbări de probabilitate și multe altele în timpul meciurilor live.

Noul Bundesliga Match Fact este rezultatul unei analize aprofundate efectuate de experții din fotbal din Bundesliga și de oamenii de știință de date AWS. Probabilitățile de câștig sunt afișate în ticker-ul live al meciurilor respective în aplicația oficială Bundesliga. În timpul unei difuzări, probabilitățile de câștig sunt furnizate comentatorilor prin intermediul găsitor de povești de date și afișat vizual fanilor în momente cheie, cum ar fi atunci când cel defavorizat preia conducerea și acum este cel mai probabil să câștige jocul.

Sperăm că vă place acest nou-nouț Bundesliga Match Fact și că vă oferă noi perspective asupra jocului. Pentru a afla mai multe despre parteneriatul dintre AWS și Bundesliga, vizitați Bundesliga pe AWS!

Suntem încântați să aflăm ce modele veți descoperi. Împărtășiți-vă cunoștințele cu noi: @AWScloud pe Twitter, cu hashtag-ul #BundesligaMatchFacts.


Despre Autori

Simon Rolfes a jucat 288 de meciuri în Bundesliga ca mijlocaș central, a marcat 41 de goluri și a câștigat 26 de selecții pentru Germania. În prezent, Rolfes este Managing Director Sport la Bayer 04 Leverkusen, unde supraveghează și dezvoltă lista de jucători profesioniști, departamentul de scouting și dezvoltarea clubului pentru tineret. Simon scrie și rubrici săptămânale despre Bundesliga.com despre cele mai recente date despre meciurile din Bundesliga oferite de AWS. Acolo, el își oferă experiența ca fost jucător, căpitan și analist TV pentru a evidenția impactul statisticilor avansate și al învățării automate în lumea fotbalului.

Tareq Haschemi este consultant în cadrul AWS Professional Services. Abilitățile și domeniile sale de expertiză includ dezvoltarea de aplicații, știința datelor, învățarea automată și big data. El sprijină clienții în dezvoltarea aplicațiilor bazate pe date în cloud. Înainte de a se alătura AWS, a fost și consultant în diverse industrii, cum ar fi aviația și telecomunicațiile. Este pasionat de a permite clienților călătoria lor de date/AI către cloud.

Javier Poveda-Panter este Data Scientist pentru clienții de sport din EMEA în cadrul echipei AWS Professional Services. El permite clienților din zona sporturilor pentru spectatori să inoveze și să-și valorifice datele, oferind utilizatorilor și fanilor experiențe de înaltă calitate prin învățarea automată și știința datelor. Își urmărește pasiunea pentru o gamă largă de sporturi, muzică și IA în timpul liber.

Luuk Figdor este consilier pentru tehnologie sportivă în echipa AWS Professional Services. Lucrează cu jucători, cluburi, ligi și companii media, cum ar fi Bundesliga și Formula 1, pentru a-i ajuta să spună povești cu date folosind învățarea automată. În timpul liber, îi place să învețe totul despre minte și despre intersecția dintre psihologie, economie și IA.

Gabriel Zylka este inginer de învățare automată în cadrul AWS Professional Services. El lucrează îndeaproape cu clienții pentru a-și accelera călătoria de adoptare a cloud-ului. Specializat în domeniul MLOps, el se concentrează pe producția sarcinilor de lucru de învățare automată prin automatizarea ciclurilor de viață de învățare automată end-to-end și ajutând la obținerea rezultatelor de afaceri dorite.

Jakub Michalczyk este Data Scientist la Sportec Solutions AG. În urmă cu câțiva ani, a ales studiile de matematică decât fotbalul, deoarece a ajuns la concluzia că nu era suficient de bun la acesta din urmă. Acum el combină ambele pasiuni în cariera sa profesională, aplicând metode de învățare automată pentru a obține o perspectivă mai bună asupra acestui joc frumos. În timpul liber, îi place încă să joace fotbal cu șapte, să se uite la filme criminale și să asculte muzică de film.

Timestamp-ul:

Mai mult de la Învățare automată AWS