Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Bundesliga mängu fakti oskus: jalgpalluri omaduste määramine AWS-i masinõppe abil

Jalgpallis, nagu paljudel spordialadel, on arutelud üksikute mängijate üle alati olnud osa lõbu. "Kes on parim skooritegija?" või "Kes on kaitsjate kuningas?" on küsimused, mille üle fännid pidevalt arutavad, ja sotsiaalmeedia võimendab seda arutelu. Mõelge vaid sellele, et ainuüksi Erling Haalandil, Robert Lewandowskil ja Thomas Mülleril on Instagramis kokku 50 miljonit jälgijat. Paljud fännid on teadlikud uskumatust statistikast, mida staarmängijad nagu Lewandowski ja Haaland loovad, kuid sellised lood on vaid jäämäe tipp.

Mõelge sellele, et peaaegu 600 mängijaga on Bundesligas leping sõlmitud ja igal meeskonnal on oma meistrid – mängijad, keda tutvustatakse, et tuua matšis kaasa teatud oskused. Vaadake näiteks Michael Gregoritschi FC Augsburgist. Selle kirjutamise seisuga (21. mängupäev) on ta hooajal 21/22 löönud viis väravat, mitte midagi, mis paneks teda suurepäraste väravalööjate teemalises vestluses mainima. Kuid vaatame lähemalt: kui kogute Gregoritshil sel hooajal olnud kõigi väravavõimaluste eeldatavad väravate (xGoals) väärtused, on teie arv 1.7. See tähendab, et ta ületas oma pealelööke +194%, lüües oodatust 3.2 väravat rohkem. Võrdluseks tegi Lewandowski üle vaid 1.6 väravaga (+7%). Milline vägitegu! Ilmselgelt toob Gregoritsch Augsburgi erilise oskuse.

Kuidas siis valgustada kõiki varjatud lugusid üksikute Bundesliga mängijate, nende oskuste ja mängutulemuste kohta? Sisenege uude Bundesliga Match Facti, mida toetab AWS nimega Skill. Oskused on välja töötatud DFL-i ja AWS-i süvaanalüüsi abil, et tuvastada mängijad, kellel on oskused neljas konkreetses kategoorias: algataja, lõpetaja, palli võitja ja sprinter. See postitus annab põhjaliku sukeldumise neisse nelja oskustesse ja arutab, kuidas neid AWS-i infrastruktuuris rakendatakse.

Veel üks huvitav punkt on see, et siiani on Bundesliga mängufaktid välja töötatud üksteisest sõltumatult. Skill on esimene Bundesliga Match Fact, mis ühendab reaalajas mitme Bundesliga mängu fakti väljundi, kasutades selleks ehitatud voogedastusarhitektuuri. Amazoni hallatav voogesitus Kafka (Amazoni MSK).

Initsiaator

Algataja on mängija, kes annab suure hulga väärtuslikke esimest ja teist resultatiivset söötu. Nende abide väärtuse tuvastamiseks ja kvantifitseerimiseks võtsime kasutusele uue mõõdiku xAssist. See arvutatakse, jälgides viimast ja teist viimast söötu enne väravalööki ning määrates neile tegevustele vastava xGoalsi väärtuse. Hea algataja loob võimalusi keerulistes oludes, sooritades edukalt kõrge raskusastmega sööte. Et hinnata, kui raske on antud passi täita, kasutame olemasolevat xPass mudel. Selles mõõdikus välistame sihilikult tsenderduse ja karistuslöögid, et keskenduda mängijatele, kes loovad väravavõimalusi oma täpsete söötudega avatud mängust.

Oskuste skoor arvutatakse järgmise valemiga:
Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Vaatame näiteks praegust Rank 1 algatajat Thomas Müllerit. Ta on selle kirjutamise seisuga (9.23. mängupäev) kogunud xAssisti väärtuseks 21, mis tähendab, et tema söötude arv järgmistele väravat löönud mängijatele on andnud xGoali koguväärtuseks 9.23. Suhe xAssist 90 minuti kohta on 0.46. Seda saab arvutada tema jooksva hooaja kogu mänguaja järgi, mis on märkimisväärne – üle 1,804 minuti mänguaega. Teise resultatiivse sööduna andis ta koguväärtuseks 3.80, mis tähendab 0.19 sekundilist söötu 90 minuti kohta. Kokku andis tema 38 esimesest söödust 58 rasket söötu. Ja teise resultatiivse sööduna olid tema 11-st söödust 28 ka rasked söötud. Selle statistikaga on Thomas Müller end algatajate edetabelis esikohale katapulteerinud. Võrdluseks on järgmises tabelis toodud praeguse esikolmiku väärtused.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 Difficult Passes Assisted Rasked läbimisedAssisted2 Lõplik skoor
Thomas Müller – koht 1 9.23 0.46 3.80 0.18 38 11 0.948
Serge Gnabry – koht 2 3.94 0.25 2.54 0.16 15 11 0.516
Florian Wirtz – koht 3 6.41 0.37 2.45 0.14 21 1 0.510

Viimistleja

Lõpetaja on mängija, kes on erakordselt hea väravate löömises. Tal on kõrge löögiefektiivsus ja ta saavutab palju väravaid vastavalt oma mänguajale. Oskus põhineb tegelikel löödud väravatel ja nende erinevusel oodatavatest väravatest (xGoals). See võimaldab meil hinnata, kas võimalusi kasutatakse hästi ära. Oletame, et kahel ründajal on sama arv väravaid. Kas nad on võrdselt tugevad? Või kas üks neist teeb skoori kergetes oludes, samas kui teine ​​lõpetab rasketes olukordades? Löökefektiivsusega saab sellele vastata: kui löödud väravad ületavad xGoalide arvu, on mängija ülesooritus ja keskmisest tõhusam viskaja. Selle erinevuse suuruse kaudu saame kvantifitseerida, mil määral ületab laskuri efektiivsus keskmist.

Oskuste skoor arvutatakse järgmise valemiga:
Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai. Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Lõpetaja jaoks keskendume rohkem eesmärkidele. Järgnev tabel annab praegusest esikolmikust lähemalt ülevaate.

.. Eesmärgid GoalsPer90 ShotEfficiency Lõplik skoor
Robert Lewandowski – koht 1 24 1.14 1.55 0.813
Erling Haaland – 2. koht 16 1.18 5.32 0.811
Patrik Schick – 3. koht 18 1.10 4.27 0.802

Robert Lewandowski on sel hooajal löönud 24 väravat, millega ta on esikohal. Kuigi Haalandil on suurem löögiefektiivsus, ei piisa sellest siiski Haalandi esikohale jõudmiseks, sest me anname löödud väravatele suurema kaalu. See näitab, et Lewandowski teenib palju kasu nii saadud resultatiivsete söötude kvaliteedist kui ka kvantiteedist, kuigi ta lööb erakordselt hästi. Patrick Schick on löönud kaks väravat rohkem kui Haaland, kuid tal on madalam värav 90 minuti kohta ja madalam löögiefektiivsus.

Sprinter

Sprinteril on füüsiline võime saavutada suuri tippkiirusi ja teeb seda sagedamini kui teised. Sel eesmärgil hindame mängija jooksva hooaja kõigi mängude keskmisi tippkiirusi ja kaasame muude mõõdikute hulgas ka sprindisageduse 90 minuti kohta. Sprint loetakse, kui mängija jookseb minimaalselt 4.0 m/s rohkem kui kaks sekundit ja saavutab selle aja jooksul vähemalt 6.3 m/s tippkiiruse. Sprindi kestust iseloomustab aeg, mis jääb esimese ja viimase 6.3 m/s läve saavutamise vahele ning see peab olema kinnituseks vähemalt 1 sekund pikk. Uue spurdi saab lugeda alles pärast seda, kui tempo oli taas langenud alla 4.0 m/s läve.

Oskuste skoor arvutatakse järgmise valemiga:
Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai. Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Valem võimaldab meil hinnata paljusid viise, kuidas saame mängijate sprinte vaadata, ja minna kaugemale, kui lihtsalt vaadata nende mängijate tippkiirusi. Näiteks Jeremiah St. Juste käes on jooksva hooaja rekord 36.65 km/h. Kui aga vaadata tema spurtide sagedust, siis leiame, et ta spurdib keskmiselt vaid üheksa korda matši kohta! Alphonso Davies seevastu ei pruugi olla nii kiire kui St. Juste (tippkiirus 36.08 km/h), kuid sooritab jahmatavad 31 sprinti matši kohta! Ta spurtib palju sagedamini palju suurema keskmise kiirusega, avades oma meeskonnale väljakul ruumi.

Palli võitja

Sellise võimega mängija põhjustab vastasmeeskonnale pallikaotusi nii kogusummas kui ka vastavalt oma mänguajale. Ta võidab palju maa- ja õhuduelle ning varastab või vahelttab palli sageli, luues ise turvalise pallikontrolli ja võimaluse oma meeskonnal vasturünnakule asuda.

Oskuste skoor arvutatakse järgmise valemiga:
Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai. Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Selle kirjutamise seisuga on esikoha palli võitja Danilo Soares. Kokku on tal 235 kaitseduelli. 235 kaitseduellist on ta võitnud 75, alistades vastased vastasseisus. Ta on sel hooajal oma mängupositsioonil kaitsva tagamängijana 51 palli vahelt võtnud, mis annab talle umbes 32% võiduprotsenti. Keskmiselt lõi ta 2.4 minuti jooksul vahelt 90 palli.

Oskuste näide

Skill Bundesliga Match Fact võimaldab meil paljastada Bundesliga mängijate võimed ja tugevused. Oskuste edetabel seab mängijad tähelepanu keskpunkti, kes võisid tavapärase statistika, näiteks väravate, edetabelis varem märkamatuks jääda. Näiteks võtame sellise mängija nagu Michael Gregoritsch. Gregoritsch on FC Augsburgi ründaja, kes oli 21. mängupäeva seisuga lõpetajate edetabelis kuuendal kohal. Seni on ta löönud viis väravat, mis ei viiks teda üheski väravate edetabelis esikohale. Kuid ta sai sellega hakkama vaid 663 mänguminutiga! Üks neist väravatest oli hiline viigivärav 97. minutil, mis aitas Augsburgil vältida Berliini võõrsilkaotust.

Skill Bundesliga Match Facti kaudu saame ära tunda ka iga mängija erinevaid omadusi. Üks näide sellest on Dortmundi staar Erling Haaland, kes on pälvinud ka sprinteri ja finišeerija märgi ning on hetkel Bundesliga sprinterite seas kuuendal kohal.

Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai. Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.
Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai. Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Kõik need mõõdikud põhinevad mängija liikumise andmetel, väravatega seotud andmetel, pallitegevusega seotud andmetel ja söötudega seotud andmetel. Töötleme seda teavet andmekonveierites ja eraldame oskuste kohta vajaliku asjakohase statistika, mis võimaldab meil arvutada kõigi mõõdikute arengut reaalajas. Paljud eelnimetatud statistikad on normaliseeritud väljakul veedetud aja järgi, mis võimaldab arvestada mängijatega, kellel on vähe mänguaega, kuid kes mängivad hämmastavalt hästi. Mõõdikute kombinatsioonid ja kaalud liidetakse üheks skooriks. Tulemuseks on kõigi mängijate paremusjärjestus nelja mängija oskuste järgi. 10 parima hulka kuuluvad mängijad saavad oskuste märgi, mis aitab fännidel kiiresti tuvastada erakordsed omadused, mida nad oma meeskonda toovad.

Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

Teostus ja arhitektuur

Seni välja töötatud Bundesliga mängufaktid on üksteisest sõltumatud ja toetuvad ainult asukoha- ja sündmusteandmete allaneelamisele ning nende enda arvutustele. See aga muutub uue Bundesliga Match Fact Skill puhul, mis arvutab oskuste paremusjärjestuse olemasolevate Match Factide (nt xGoals või xPass) andmete põhjal. Ühe sündmuse tulemus, võib-olla uskumatu värav, mille sissepääsuvõimalused on väikesed, võib oluliselt mõjutada finišeerija oskuste asetust. Seetõttu lõime arhitektuuri, mis pakub alati kõige ajakohasemaid oskuste pingerea, kui alusandmeid värskendatakse. Oskuste reaalajas värskendamiseks kasutame andmete voogesituse ja sõnumside lahendusena Apache Kafka hallatavat AWS-teenust Amazon MSK. Nii saavad erinevad Bundesliga mängufaktid edastada uusimaid sündmusi ja värskendusi reaalajas.

Skill'i aluseks olev arhitektuur koosneb neljast põhiosast:

  • An Amazon Aurora serverita klaster salvestab kõik olemasolevate vastete faktide väljundid. See hõlmab näiteks andmeid iga söödu (nt xPass, mängija, ettenähtud vastuvõtja) või löögi (xGoal, mängija, värav) kohta, mis on toimunud pärast Bundesliga mängufaktide kasutuselevõttu.
  • Keskne AWS Lambda funktsioon kirjutab Bundesliga Match Fact väljundid Aurora andmebaasi ja teavitab teisi komponente värskenduse toimumisest.
  • Lambda funktsioon iga üksiku oskuse jaoks arvutab oskuste paremusjärjestuse. Need funktsioonid käivituvad alati, kui konkreetse oskuse arvutamiseks on saadaval uusi andmeid.
  • Amazon MSK Kafka klaster toimib kõigi nende komponentide vahelise keskse suhtluspunktina.

Järgmine diagramm illustreerib seda töövoogu. Iga Bundesliga mängu fakt saadab Kafkale kohe sündmuse teate, kui toimub sündmuse värskendus (nt värskendatud xGoalsi väärtus löögisündmuse jaoks). Keskne dispetšeri Lambda funktsioon käivitub automaatselt, kui Bundesliga Match Fact saadab sellise teate ja kirjutab need andmed andmebaasi. Seejärel saadab see Kafka kaudu uue sõnumi, mis sisaldab uusi andmeid, tagasi Kafkale, mis toimib individuaalsete oskuste arvutamise funktsioonide käivitajana. Need funktsioonid kasutavad uusimate oskuste edetabelite arvutamiseks ja avaldamiseks selle käivitussündmuse ja selle aluseks oleva Aurora klastri andmeid. Amazon MSK kasutamise kohta selles projektis põhjalikuma ülevaate saamiseks vaadake Set Piece Threat ajaveebipostitust.

Bundesliga Match Fact Skill: jalgpalluri omaduste kvantifitseerimine, kasutades AWS PlatoBlockchain Data Intelligence'i masinõpet. Vertikaalne otsing. Ai.

kokkuvõte

Selles postituses demonstreerisime, kuidas uus Bundesliga Match Fact Skill võimaldab objektiivselt võrrelda Bundesliga mängijaid nelja põhimängija dimensiooni alusel, tuginedes endisele sõltumatule Bundesliga mängu faktidele ja kombineerides neid reaalajas. See võimaldab nii kommentaatoritel kui ka fännidel paljastada varem märkamatud mängijate võimed ja valgustada rolle, mida erinevad Bundesliga mängijad täidavad.

Uus Bundesliga Match Fact on Bundesliga jalgpalliekspertide ja AWS-i andmeteadlaste süvaanalüüsi tulemus, et destilleerida ja kategoriseerida jalgpallurite omadusi objektiivsete sooritusandmete põhjal. Mängija oskuste märgid kuvatakse Bundesliga rakenduse rivistuses ja mängijate üksikasjade lehtedel. Saates antakse mängijaoskusi kommentaatoritele läbi andmelugude leidja ja seda näidatakse fännidele visuaalselt mängija vahetamisel ja siis, kui mängija liigub vastavasse top 10 edetabelisse.

Loodame, et teile meeldib see uhiuus Bundesliga mängu fakt ja see annab teile mängu kohta uusi teadmisi. AWS-i ja Bundesliga vahelise partnerluse kohta lisateabe saamiseks külastage Bundesliga AWS-is!


Autoritest

Simon Rolfes mängis keskpoolkaitsjana 288 Bundesliga mängu, lõi Saksamaa koondises 41 väravat ja võitis 26 mängu. Praegu töötab Rolfes Bayer 04 Leverkuseni spordidirektorina, kus ta jälgib ja arendab profimängijate nimekirja, skaudiosakonda ja klubi noorte arengut. Simon kirjutab ka iganädalasi veergusid saidil Bundesliga.com viimaste Bundesliga mängu faktide kohta, mida toetab AWS

Luuk Figdor on AWS Professional Services meeskonna sporditehnoloogia vanemspetsialist. Ta teeb koostööd mängijate, klubide, liigade ja meediaettevõtetega, nagu Bundesliga ja Vormel 1, et aidata neil masinõppe abil andmetega lugusid rääkida. Vabal ajal meeldib talle õppida kõike mõistuse ja psühholoogia, majanduse ja tehisintellekti ristumiskohtade kohta.

Pascal Kühner on pilverakenduste arendaja AWS-i professionaalsete teenuste meeskonnas. Ta teeb koostööd klientidega erinevates tööstusharudes, et aidata neil rakenduste arenduse, DevOpsi ja infrastruktuuri kaudu oma äritulemusi saavutada. Ta on väga kirglik spordi vastu ning naudib vabal ajal korvpalli ja jalgpalli mängimist.

Tareq Haschemi on AWS Professional Services konsultant. Tema oskused ja valdkonnad hõlmavad rakenduste arendamist, andmeteadust, masinõpet ja suurandmeid. Asudes Hamburgis, toetab ta kliente pilves andmepõhiste rakenduste arendamisel. Enne AWS-iga liitumist oli ta ka konsultant erinevates tööstusharudes, nagu lennundus ja telekommunikatsioon. Ta on kirglik võimaldada klientidel nende andmete/AI teekonnal pilve jõuda.

Jakub Michalczyk on Sportec Solutions AG andmeteadlane. Mitu aastat tagasi valis ta matemaatikaõpingud jalgpalli mängimise asemel, kuna jõudis järeldusele, et viimases ei olnud ta piisavalt hea. Nüüd ühendab ta need mõlemad kired oma professionaalses karjääris, rakendades masinõppe meetodeid, et saada sellest ilusast mängust parem ülevaade. Vabal ajal meeldib talle siiani mängida seitsmevõistlusega jalgpalli, vaadata krimifilme ja kuulata filmimuusikat.

Javier Poveda-Panter on EMEA spordiklientide andmeteadlane AWS Professional Services meeskonnas. Ta võimaldab publikuspordi valdkonna klientidel uuendusi teha ja oma andmeid ära kasutada, pakkudes masinõppe ja andmeteaduse kaudu kvaliteetseid kasutaja- ja fännikogemusi. Ta järgib vabal ajal oma kirge mitmesuguste spordialade, muusika ja tehisintellekti vastu.

Ajatempel:

Veel alates AWS-i masinõpe