Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Bundesliga Match Fact Skill: A futballisták minőségének számszerűsítése az AWS gépi tanulásával

A futballban, mint sok sportágban, az egyes játékosokról szóló megbeszélések mindig is a szórakozás részét képezték. – Ki a legjobb gólszerző? vagy „Ki a védők királya?” Ezek a kérdések állandóan vitatkoznak a rajongók körében, és a közösségi média felerősíti ezt a vitát. Gondoljunk csak arra, hogy egyedül Erling Haalandnak, Robert Lewandowskinak és Thomas Müllernek összesen 50 millió követője van az Instagramon. Sok rajongó tisztában van azzal, hogy milyen hihetetlen statisztikákat készítenek olyan sztárjátékosok, mint Lewandowski és Haaland, de az ehhez hasonló történetek csak a jéghegy csúcsát jelentik.

Gondoljunk csak arra, hogy közel 600 játékos áll szerződésben a Bundesligában, és minden csapatnak megvan a maga bajnoka – olyan játékosok, akiket azért mutatnak be, hogy egy adott készségüket a meccseken elsajátítsák. Nézze meg például Michael Gregoritscht, az FC Augsburg csapatában. Jelen pillanatban (21. mérkőzésnap) öt gólt szerzett a 21/22-es szezonban, ami nem arra késztetné, hogy bárki is megemlítse a nagyszerű góllövőkről szóló beszélgetésben. De nézzük közelebbről: ha összeadja Gregoritsch összes gólszerzési esélyének várható gólértékét (xGoals) ebben a szezonban, akkor 1.7-et kap. Ez azt jelenti, hogy +194%-kal túlteljesítette a kaput eltaláló lövéseit, és a vártnál 3.2 góllal többet szerzett. Ehhez képest Lewandowski mindössze 1.6 góllal teljesített felül (+7%). Micsoda bravúr! Egyértelmű, hogy Gregoritsch különleges képességet hoz Augsburgba.

Hogyan derítsünk fényt az egyes Bundesliga-játékosokról, képességeikről és a mérkőzések kimenetelére gyakorolt ​​hatásról szóló rejtett történetekre? Lépjen be az AWS által hajtott új Bundesliga Match Fact-ba, a Skill névre. A készségeket a DFL és az AWS mélyreható elemzésével fejlesztették ki, hogy azonosítsák azokat a játékosokat, akik négy konkrét kategóriában rendelkeznek képességekkel: kezdeményező, befejező, labdagyőztes és sprinter. Ez a bejegyzés mélyrehatóan betekintést nyújt ebbe a négy készségbe, és megvitatja, hogyan valósítják meg ezeket az AWS infrastruktúrán.

Egy másik érdekesség, hogy eddig a Bundesliga Match Facts-t egymástól függetlenül fejlesztették ki. A Skill az első Bundesliga Match Fact, amely valós időben egyesíti a több Bundesliga Match Fact kimenetét egy ráépített streaming architektúra segítségével. Amazon menedzselt streaming Kafka (Amazon MSK).

Kezdeményező

A kezdeményező az a játékos, aki nagy számú értékes első és második gólpasszt ad. A segítők értékének azonosítása és számszerűsítése érdekében bevezettük az új xAssist mérőszámot. Ezt úgy számítják ki, hogy nyomon követik a kapura lövés előtti utolsó és második utolsó passzt, és ezekhez a műveletekhez hozzárendelik a megfelelő xGoals értéket. Egy jó kezdeményező kihívást jelentő körülmények között teremt lehetőségeket azáltal, hogy sikeresen teljesíti a passzokat nagy nehézségi arányban. Annak értékelésére, hogy mennyire nehéz teljesíteni egy adott bérletet, a meglévőnket használjuk xPass modell. Ebben a mérőszámban szándékosan kizárjuk a keresztrúgásokat és a szabadrúgásokat, hogy azokra a játékosokra összpontosítsunk, akik nyílt játékból precíz gólpasszaikkal gólhelyzeteket generálnak.

A képzettségi pontszámot a következő képlettel számítják ki:
Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Példaként nézzük a jelenlegi Rank 1 kezdeményezőt, Thomas Müllert. 9.23-as xAssist értéket gyűjtött össze a jelen pillanatban (21. mérkőzésnap), ami azt jelenti, hogy a következő játékosoknak adott passzai 9.23-as xGoal-értéket generáltak. Az xAssist per 90 perc arány 0.46. Ez az aktuális szezon teljes játékidejéből számítható ki, ami figyelemre méltó – több mint 1,804 percnyi játékidő. Második gólpasszként 3.80-as összértéket generált, ami 0.19 percenként 90 másodperces gólpasszt jelent. Összességében 38 első gólpasszából 58 nehéz passz volt. Második gólpasszként pedig 11 passzából 28 szintén nehéz passz volt. Thomas Müller ezzel a statisztikával a kezdeményezői rangsorban az első helyre katapultálta magát. Összehasonlításképpen a következő táblázat az aktuális első három értékeit mutatja be.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 DifficultPassesAssisted Difficult Passes Assisted2 Végső pontszám
Thomas Müller – 1. helyezett 9.23 0.46 3.80 0.18 38 11 0.948
Serge Gnabry – 2. helyezett 3.94 0.25 2.54 0.16 15 11 0.516
Florian Wirtz – 3. helyezett 6.41 0.37 2.45 0.14 21 1 0.510

kikészítő

A befejező olyan játékos, aki kivételesen jó a gólszerzésben. Nagy a lövéshatékonysága, és játékidejéhez képest sok gólt ér el. A készség a ténylegesen szerzett gólokon és a várt gólokhoz való különbségén (xGoals) alapul. Ez lehetővé teszi számunkra annak értékelését, hogy az esélyeket jól kihasználják-e. Tegyük fel, hogy két csatárnak ugyanannyi gólja van. Egyformán erősek? Vagy egyikük könnyű körülményekből szerez gólt, míg a másik nehéz helyzetekben ér célba? A lövéshatékonysággal erre lehet válaszolni: ha a kapott gólok meghaladják az xGoalok számát, akkor egy játékos túlteljesít, és az átlagosnál hatékonyabb lövő. Ennek a különbségnek a nagyságán keresztül számszerűsíthetjük, hogy egy lövész hatékonysága mennyivel veri felül az átlagot.

A képzettségi pontszámot a következő képlettel számítják ki:
Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai. Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A befutónál inkább a gólokra koncentrálunk. Az alábbi táblázat a jelenlegi első három helyezettet mutatja be közelebbről.

.. Célok GoalsPer90 ShotEfficiency Végső pontszám
Robert Lewandowski – 1. helyezett 24 1.14 1.55 0.813
Erling Haaland – 2. helyezett 16 1.18 5.32 0.811
Patrik Schick – 3. helyezett 18 1.10 4.27 0.802

Robert Lewandowski 24 gólt szerzett ebben a szezonban, amivel az első helyen áll. Haalandnak ugyan magasabb a lövéshatékonysága, de ez még mindig nem elég, hogy Haaland legyen az első helyen, mert nagyobb súlyt adunk a szerzett góloknak. Ez azt jelzi, hogy Lewandowski sokat profitál a kapott gólpasszok minőségéből és mennyiségéből, annak ellenére, hogy kivételesen jól szerez gólt. Patrick Schick kettővel több gólt lőtt, mint Haaland, de alacsonyabb a 90 percenkénti gólja és alacsonyabb a lövéshatékonysága.

Rövidtávfutó

A sprinter fizikailag képes nagy végsebességet elérni, és ezt gyakrabban, mint mások. Ebből a célból kiértékeljük az átlagos végsebességet a játékos aktuális szezonjának összes meccsén, és egyéb mérőszámok mellett figyelembe vesszük a 90 percenkénti sprintek gyakoriságát is. Sprintnek számít, ha egy játékos legalább 4.0 m/s-os tempóval fut két másodpercnél tovább, és ezalatt eléri a legalább 6.3 m/s-os csúcssebességet. A sprint időtartamát a 6.3 m/s-os küszöb első és utolsó elérése közötti idő jellemzi, és legalább 1 másodpercnek kell lennie a nyugtázáshoz. Új sprint csak akkor tekinthető megtörténtnek, ha a tempó ismét a 4.0 m/s-os küszöb alá süllyedt.

A képzettségi pontszámot a következő képlettel számítják ki:
Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai. Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A képlet lehetővé teszi számunkra, hogy kiértékeljük, hogy a játékosok sprintjeit milyen sokféleképpen nézhetjük meg, és messzebbre léphetünk, mint pusztán a játékosok által produkált csúcssebességek vizsgálata. Például Jeremiah St. Juste 36.65 km/h az aktuális szezon rekordja. Ha azonban megnézzük sprintjei gyakoriságát, azt találjuk, hogy meccsenként átlagosan csak kilencszer sprintel! Alphonso Davies viszont lehet, hogy nem olyan gyors, mint St. Juste (végsebesség 36.08 km/h), de elképesztő 31 sprintet hajt végre meccsenként! Sokkal gyakrabban sprintel, sokkal nagyobb átlagsebességgel, így teret nyit csapatának a pályán.

Labdanyertes

Az ezzel a képességgel rendelkező játékos labdaveszteséget okoz az ellenfél csapatának, mind összességében, mind játékidejében. Sok földi és légi párharcot nyer, és gyakran ellopja vagy elkapja a labdát, így maga teremti meg a biztonságos labdakontrollt, és lehetőséget ad csapatának az ellentámadásra.

A képzettségi pontszámot a következő képlettel számítják ki:
Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai. Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Jelen állás szerint az első helyezett labdanyertes Danilo Soares. Összesen 235 védekező párharca van. A 235 védekező párharcból 75-öt megnyert, ellenfeleit bedobásban győzte le. Ebben a szezonban 51 labdát hárított el a védekező beosztásában, ami körülbelül 32%-os győzelmi arányt jelent. Átlagosan 2.4 labdát hárított 90 perc alatt.

Ügyességi példa

A Skill Bundesliga Match Fact lehetővé teszi számunkra, hogy felfedjük a Bundesliga-játékosok képességeit és erősségeit. A Skill-rangsor olyan játékosokat helyez a figyelem középpontjába, akik korábban észrevétlenek maradtak a hagyományos statisztikák, például a gólok rangsorában. Vegyünk például egy olyan játékost, mint Michael Gregoritsch. Gregoritsch az FC Augsburg csatára, aki a hatodik helyen végzett a 21. meccsnapon a befutói rangsorban. Eddig öt gólt szerzett, amivel nem állna a góllövőlista élén. Ez azonban mindössze 663 perc alatt sikerült neki! Az egyik ilyen gól a késői egyenlítés volt a 97. percben, ami segített az Augsburgnak elkerülni a berlini vendégveszteséget.

A Skill Bundesliga Match Fact révén az egyes játékosok különféle tulajdonságait is felismerhetjük. Ennek egyik példája a Dortmund sztárja, Erling Haaland, aki a sprinter és célbafutó jelvényét is kiérdemelte, és jelenleg a hatodik helyen áll a Bundesliga sprinterei között.

Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai. Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.
Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai. Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Mindezek a mutatók a játékos mozgási adatain, a gólokkal kapcsolatos adatokon, a labdatevékenységekkel és a passzokkal kapcsolatos adatokon alapulnak. Ezeket az információkat adatfolyamokban dolgozzuk fel, és készségenként kinyerjük a szükséges releváns statisztikákat, lehetővé téve, hogy valós időben számítsuk ki az összes mérőszám alakulását. A fent említett statisztikák közül sokat a pályán eltöltött idő szerint normalizálnak, lehetővé téve az olyan játékosok figyelembevételét, akiknek kevés játékidejük van, de elképesztően jól teljesítenek. A mérőszámok kombinációi és súlyozása egyetlen pontszámba egyesül. Az eredmény egy rangsor minden játékos számára a négy játékos képességei alapján. A legjobb 10-be kerülő játékosok ügyességi jelvényt kapnak, amely segít a szurkolóknak gyorsan felismerni, milyen kivételes tulajdonságokat hoznak a csapatukra.

Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Megvalósítás és architektúra

A Bundesliga mérkőzés tényei, amelyeket eddig kidolgoztak, függetlenek egymástól, és csak a helyzet- és eseményadatok bevitelére, valamint saját számításaikra támaszkodnak. Ez azonban megváltozik az új Bundesliga Match Fact Skill esetében, amely a meglévő Match Facts (például xGoals vagy xPass) adatok alapján számítja ki a képességek rangsorát. Egy esemény kimenetele, esetleg egy hihetetlen gól csekély esélyekkel a bejutásra, jelentős hatással lehet a célba érő képességek rangsorára. Ezért olyan architektúrát építettünk fel, amely mindig a legfrissebb készségrangsorokat nyújtja, amikor az alapul szolgáló adatok frissülnek. A készségek valós idejű frissítése érdekében az Amazon MSK-t, az Apache Kafka menedzselt AWS-szolgáltatását használjuk adatfolyamként és üzenetküldő megoldásként. Ily módon a különböző Bundesliga mérkőzéstényezők valós időben közölhetik a legújabb eseményeket és frissítéseket.

A Skill mögöttes architektúra négy fő részből áll:

  • An Amazon Aurora szerver nélküli fürt tárolja a meglévő egyezési tények összes kimenetét. Ez magában foglalja például a Bundesliga Match Facts bevezetése óta történt minden egyes passz (például xPass, játékos, tervezett fogadó) vagy lövés (xGoal, player, goal) adatait.
  • Egy központi AWS Lambda A funkció beírja a Bundesliga Match Fact kimeneteit az Aurora adatbázisba, és értesíti a többi komponenst, hogy frissítés történt.
  • A Lambda függvény minden egyes képességhez kiszámítja a képességek rangsorát. Ezek a függvények akkor futnak le, amikor új adatok állnak rendelkezésre az adott készség kiszámításához.
  • Az Amazon MSK Kafka fürt központi kommunikációs pontként szolgál ezen összetevők között.

A következő diagram ezt a munkafolyamatot mutatja be. Minden egyes Bundesliga-mérkőzés tény azonnal eseményüzenetet küld Kafkának, amikor egy eseményhez frissítés érkezik (például frissített xGoals érték egy lövéseseményhez). A központi diszpécser Lambda funkció automatikusan aktiválódik, amikor egy Bundesliga Match Fact ilyen üzenetet küld, és beírja ezeket az adatokat az adatbázisba. Ezután Kafkán keresztül egy újabb üzenetet küld vissza Kafkának, amely az új adatokat tartalmazza, ami triggerként szolgál az egyéni képességszámítási funkciókhoz. Ezek a függvények ennek a trigger eseménynek, valamint a mögöttes Aurora klaszternek az adatait használják fel a legújabb készségrangsorok kiszámításához és közzétételéhez. Az Amazon MSK projekten belüli használatának alaposabb megismeréséhez tekintse meg a Set Piece Threat blogbejegyzést.

Bundesliga Match Fact Skill: Quantifying football player qualities using machine learning on AWS PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Összegzésként

Ebben a bejegyzésben bemutattuk, hogy az új Bundesliga Match Fact Skill hogyan teszi lehetővé a Bundesliga-játékosok objektív összehasonlítását négy fő játékos dimenzióban, valós időben építve és kombinálva a korábbi független Bundesliga mérkőzés tényeket. Ez lehetővé teszi a kommentátorok és a rajongók számára, hogy felfedjék a korábban észrevétlen játékos képességeket, és rávilágítsanak a Bundesliga-játékosok szerepére.

Az új Bundesliga Match Fact a Bundesliga futballszakértői és az AWS adatkutatói által végzett mélyreható elemzés eredménye, amelynek célja a futballisták minőségeinek objektív teljesítményadatok alapján történő lepárlása és kategorizálása. A játékosok ügyességi jelvényei a felállásban és a Bundesliga alkalmazás játékos részleteit tartalmazó oldalakon jelennek meg. Az adásban a játékos képességeket a kommentelők rendelkezésére bocsátják a adattörténet kereső és vizuálisan látható a szurkolóknak játékoscserekor, és amikor egy játékos feljebb kerül a megfelelő top 10-be.

Reméljük, hogy elnyeri tetszését ez a vadonatúj Bundesliga Match Fact, és új betekintést nyújt a játékba. Ha többet szeretne megtudni az AWS és a Bundesliga közötti partnerségről, látogasson el ide Bundesliga az AWS-en!


A szerzőkről

Simon Rolfes 288 Bundesliga-mérkőzést játszott középpályásként, 41 gólt szerzett és 26-szor nyert a német válogatottban. Jelenleg Rolfes a Bayer 04 Leverkusen sportigazgatója, ahol felügyeli és fejleszti a profi játékosok névsorát, a felderítő osztályt és a klub utánpótlás-fejlesztését. Simon heti rovatokat is ír a Bundesliga.com oldalon a legutóbbi Bundesliga mérkőzés tényeiről, amelyet az AWS üzemeltet.

Luuk Figdor az AWS Professional Services csapatának vezető sporttechnológiai szakértője. Együttműködik játékosokkal, klubokkal, ligákkal és médiacégekkel, mint például a Bundesliga és a Forma-1, hogy segítsen nekik történeteket mesélni adatokkal a gépi tanulás segítségével. Szabadidejében szeret mindent megtudni az elméről, valamint a pszichológia, a közgazdaságtan és a mesterséges intelligencia találkozási pontjáról.

Pascal Kühner felhőalkalmazás-fejlesztő az AWS Professional Services csapatában. Több iparágban együttműködik az ügyfelekkel, hogy segítse őket üzleti eredményeik elérésében alkalmazásfejlesztésen, DevOpson és infrastruktúrán keresztül. Nagyon szenvedélyes a sportok iránt, szabadidejében szívesen kosárlabdázik és focizik.

Tareq Haschemi az AWS Professional Services tanácsadója. Képességei és szakterületei közé tartozik az alkalmazásfejlesztés, az adattudomány, a gépi tanulás és a big data. Hamburgi székhellyel támogatja ügyfeleit adatvezérelt alkalmazások fejlesztésében a felhőn belül. Mielőtt csatlakozott volna az AWS-hez, tanácsadóként dolgozott különböző iparágakban, például a légi közlekedésben és a távközlésben. Szenvedélyesen törekszik arra, hogy lehetővé tegye ügyfelei számára az adat-/AI-útjukat a felhő felé.

Jakub Michalczyk a Sportec Solutions AG adattudósa. Évekkel ezelőtt a matematika tanulmányait választotta a futball helyett, mivel arra a következtetésre jutott, hogy az utóbbiban nem volt elég jó. Most ezt a két szenvedélyt ötvözi szakmai pályafutása során azáltal, hogy gépi tanulási módszereket alkalmaz, hogy jobb betekintést nyerjen ebbe a gyönyörű játékba. Szabadidejében továbbra is szívesen futballozik hétcsapatban, krimit néz és filmzenét hallgat.

Javier Poveda-Panter adatkutató az EMEA-beli sportügyfelek számára az AWS Professional Services csapatán belül. Lehetővé teszi a látványsportok területén tevékenykedő ügyfelek számára, hogy újításokat hajtsanak végre, és kihasználják adataikat, magas színvonalú felhasználói és szurkolói élményeket biztosítva a gépi tanulás és az adattudomány révén. Szabadidejében a sport, a zene és a mesterséges intelligencia széles skálája iránti szenvedélyét követi.

Időbélyeg:

Még több AWS gépi tanulás