Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS

Za dziesięć lat sprawność technologiczna klubów będzie kluczowym czynnikiem ich sukcesu. Już dziś jesteśmy świadkami potencjału technologii, która może zrewolucjonizować rozumienie piłki nożnej. xCele kwantyfikuje i umożliwia porównanie potencjału strzeleckiego każdej sytuacji strzeleckiej, podczas gdy xZagrożenie i EPV modele przewidują wartość dowolnego momentu w grze. Ostatecznie te i inne zaawansowane statystyki służą jednemu celowi: lepszemu zrozumieniu, kto wygra i dlaczego. Wprowadź nowy fakt o meczu w Bundeslidze: prawdopodobieństwo wygranej.

W drugim meczu Bayernu z Bochum w zeszłym sezonie tabele niespodziewanie się odwróciły. Na początku meczu Lewandowski zdobywa wynik 1:0 już po 9 minutach. „Szara Myszka” ligi natychmiast przypomina sobie o katastrofie 7:0, gdy po raz pierwszy w tym sezonie zmierzy się z Bayernem. Ale nie tym razem: Christopher Antwi-Adjei strzelił swojego pierwszego gola dla klubu zaledwie 5 minut później. Po zdobyciu gola karnego w 38. minucie, zespół z Monako di Bawarii wydaje się być sparaliżowany i sprawy zaczęły wybuchać. z lewej. Bayern nie strzelił tylu goli w pierwszej połowie od 4 roku i ledwo był w stanie odejść z wynikiem 1:1975. Kto mógł się tego domyślić? Obie drużyny grały bez swoich pierwszych bramkarzy, co dla Bayernu oznaczało brak kapitana Manuela Neuera. Czy jego obecność mogła ich uratować przed tym nieoczekiwanym rezultatem?

Podobnie z Kolonii w sezonie 2020/2021 wyszły dwa niezwykłe zingery. Kiedy zmierzyli się z Dortmundem, rozegrali 18 meczów bez zwycięstwa, podczas gdy Haaland z BVB zapewniał mistrzowską klasę w strzelaniu goli w tym sezonie (23 w 22 meczach). Rola faworyta była jasna, ale Kolonia objęła wczesne prowadzenie z zaledwie 9 minutami na zegarze. Na początku drugiej połowy Skhiri strzelił swojego pierwszego gola: 0:2. Dortmund poddał się w ataku, stwarzał duże szanse i strzelił 1:2. Ze wszystkich graczy, Haaland nie miał zastępcy w 5 minutach dogrywki i po prawie 3 latach ukoronował Kolonię z pierwszymi 30 punktami w Dortmundzie.

Później w tym sezonie Kolonia – będąca ostatnia w tabeli u siebie – zaskoczyła RB Lipsk, który miał całą motywację, by zbliżyć się do lidera mistrzostw Bayernu. Przeciwnik Lipsk wywarł presję na „Kózki Billy” z rekordem sezonu drużynowego wynoszącym 13 strzałów na bramkę w pierwszej połowie, zwiększając ich i tak już wysokie szanse na zwycięstwo. Jak na ironię, Kolonia strzeliła 1:0 z pierwszym strzałem na bramkę w 46 minucie. Po tym, jak „Red Bulls” zdobyli zasłużony wyrównujący, zasnęli przy rzucie z autu zaledwie 80 sekund później, co doprowadziło do zdobycia bramki przez Jonasa Hectora dla Kolonii ponownie. Podobnie jak Dortmund, Lipsk włożył teraz całą energię w ofensywę, ale najlepsze, co udało im się osiągnąć, to trafienie w słupek w dogrywce.

We wszystkich tych meczach zarówno eksperci, jak i nowicjusze błędnie odgadliby zwycięzcę, nawet w trakcie meczu. Ale jakie wydarzenia doprowadziły do ​​tych zaskakujących wahań prawdopodobieństwa wygranej w grze? W którym momencie szanse na zwycięstwo słabszych przewyższyły faworytów, którym zabrakło czasu? Bundesliga i AWS współpracowały, aby obliczyć i zilustrować na żywo rozwój szans na wygraną podczas meczów, umożliwiając kibicom zobaczenie kluczowych momentów wahań prawdopodobieństwa. Rezultatem jest nowa Bundesliga oparta na uczeniu maszynowym (ML) Fakt meczu: prawdopodobieństwo wygranej.

Jak to działa?

Nowe prawdopodobieństwo wygranej meczu w Bundeslidze zostało opracowane przez zbudowanie modeli ML, które przeanalizowały ponad 1,000 gier historycznych. Model na żywo przyjmuje szacunki przedmeczowe i dostosowuje je zgodnie z przebiegiem meczu w oparciu o cechy, które wpływają na wynik, w tym:

  • Gole
  • kary
  • Czerwone kartki
  • Zastępstwa
  • Czas minął
  • Stworzono szanse na bramkę
  • Stałe sytuacje

Model na żywo jest szkolony przy użyciu architektury sieci neuronowej i wykorzystuje podejście dystrybucji Poissona do przewidywania liczby goli na minutę r dla każdej drużyny, jak opisano w następującym równaniu:

Wskaźniki te można traktować jako oszacowanie siły zespołu i są obliczane przy użyciu serii gęstych warstw na podstawie danych wejściowych. Na podstawie tych stawek i różnicy między przeciwnikami obliczane jest prawdopodobieństwo wygranej i remisu w czasie rzeczywistym.

Dane wejściowe do modelu to 3-krotka funkcji wejściowych, bieżąca różnica bramek i pozostały czas gry w minutach.

Pierwszy składnik trzech wymiarów wejściowych składa się z zestawu funkcji, który opisuje bieżącą akcję w grze w czasie rzeczywistym dla obu zespołów w metrykach wydajności. Obejmują one różne zagregowane wartości xG dla drużyny, ze szczególnym uwzględnieniem strzałów oddanych w ciągu ostatnich 15 minut przed prognozą. Przetwarzamy również czerwone kartki, rzuty karne, rzuty rożne oraz liczbę niebezpiecznych rzutów wolnych. Niebezpieczny rzut wolny jest klasyfikowany jako rzut wolny bliżej niż 25 m od bramki przeciwnika. Podczas opracowywania modelu, oprócz wpływu dawnej Bundesligi Match Fact xGoals, oceniliśmy również wpływ Bundesligi Match Fact Skill na model. Oznacza to, że model reaguje na zastępowanie najlepszych graczy — graczy z odznakami w umiejętnościach Finiszer, Inicjator lub Zdobywca piłki.

Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Przykład prawdopodobieństwa wygranej

Spójrzmy na mecz z obecnego sezonu (2022/2023). Poniższy wykres przedstawia prawdopodobieństwo wygranej meczu Bayernu Monachium i Stuttgartu od 6. kolejki.

Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Model przedmeczowy obliczył prawdopodobieństwo wygranej na 67% dla Bayernu, 14% dla Stuttgartu i 19% dla remisu. Patrząc na przebieg meczu widzimy duży wpływ bramek zdobytych w minutach 36′, 57′ i 60′. Do pierwszej minuty dogrywki dla Bayernu było 2:1. Dopiero celny rzut karny S. Grassy'ego w minucie 90+2 zapewnił remis. Model prawdopodobieństwa wygranej na żywo skorygował zatem prognozę remisu z 5% do ponad 90%. Rezultatem jest nieoczekiwany późny swing, w którym prawdopodobieństwo wygranej Bayernu spadło z 90% do 8% w ciągu 90+2 minuty. Wykres przedstawia zmianę atmosfery na Allianz Arena tego dnia.

Jak to jest realizowane?

Prawdopodobieństwo wygranej wykorzystuje dane o wydarzeniach z trwającego meczu (zdarzenia bramkowe, faule, czerwone kartki i inne), a także dane wygenerowane przez inne fakty meczowe, takie jak xGoals. Do aktualizacji prawdopodobieństw w czasie rzeczywistym używamy Streaming zarządzany przez Amazon Kafka (Amazon MSK) jako centralne rozwiązanie do przesyłania strumieniowego danych i przesyłania wiadomości. W ten sposób dane o wydarzeniach, dane o pozycjach i dane wyjściowe różnych faktów meczowych Bundesligi mogą być przekazywane między kontenerami w czasie rzeczywistym.

Poniższy diagram ilustruje kompletny przepływ pracy dla prawdopodobieństwa wygranej.

Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Zebrane dane związane z dopasowaniem są przetwarzane przez zewnętrznego dostawcę (DataHub). Metadane dopasowania są pozyskiwane i przetwarzane w AWS Lambda funkcjonować. Dane o pozycjach i zdarzeniach są pozyskiwane przez AWS-Fargate kontener (MatchLink). Wszystkie przetworzone dane są następnie publikowane do wykorzystania w odpowiednich tematach MSK. Serce Win Probability Match Fact znajduje się w dedykowanym kontenerze Fargate (BMF WinProbability), który działa przez czas trwania odpowiedniego dopasowania i wykorzystuje wszystkie wymagane dane uzyskane przez Amazon MSK. Modele ML (na żywo i przed meczem) są wdrażane na Amazon Sage Maker Punkty końcowe wnioskowania bezserwerowego. Bezserwerowe punkty końcowe automatycznie uruchamiają zasoby obliczeniowe i skalują te zasoby obliczeniowe w zależności od ruchu przychodzącego, eliminując potrzebę wybierania typów wystąpień lub zarządzania zasadami skalowania. W przypadku tego modelu płatności za użycie wnioskowanie bezserwerowe jest idealne dla obciążeń, w których występują okresy bezczynności między nagłymi wzrostami ruchu. Gdy nie ma meczów Bundesligi, nie ma kosztów za bezczynne zasoby.

Krótko przed rozpoczęciem gry generujemy nasz początkowy zestaw funkcji i obliczamy przedmeczowe prawdopodobieństwo wygranej, wywołując punkt końcowy PreMatch SageMaker. Z tymi prawdopodobieństwami przedmeczowymi inicjujemy następnie model na żywo, który reaguje w czasie rzeczywistym na odpowiednie wydarzenia w grze i jest stale odpytywany o aktualne prawdopodobieństwa wygranej.

Obliczone prawdopodobieństwa są następnie wysyłane z powrotem do DataHub w celu udostępnienia innym konsumentom MatchFacts. Prawdopodobieństwa są również przesyłane do klastra MSK na dedykowany temat, który zostanie wykorzystany przez inne fakty meczowe Bundesligi. Funkcja Lambda pobiera wszystkie prawdopodobieństwa z odpowiedniego tematu Kafki i zapisuje je w Amazonka Aurora Baza danych. Dane te są następnie wykorzystywane do interaktywnych wizualizacji w czasie zbliżonym do rzeczywistego przy użyciu Amazon QuickSight.

Fakty w meczu Bundesligi Prawdopodobieństwo wygranej: określanie wpływu wydarzeń w grze na szanse na wygraną za pomocą uczenia maszynowego w AWS PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Podsumowanie

W tym poście pokazaliśmy, jak nowe prawdopodobieństwo zwycięstwa w meczu Bundesligi pokazuje wpływ wydarzeń w grze na szanse wygranej lub przegranej drużyny. W tym celu opieramy się i łączymy w czasie rzeczywistym opublikowane wcześniej fakty dotyczące meczów Bundesligi. Dzięki temu komentatorzy i fani mogą odkryć momenty wahań prawdopodobieństwa i nie tylko podczas meczów na żywo.

Nowy fakt o meczu w Bundeslidze jest wynikiem dogłębnej analizy przeprowadzonej przez ekspertów piłkarskich Bundesligi i analityków danych AWS. Prawdopodobieństwo wygranej jest wyświetlane na pasku na żywo odpowiednich meczów w oficjalnej aplikacji Bundesligi. Podczas transmisji prawdopodobieństwa wygranej są podawane komentatorom za pośrednictwem wyszukiwarka historii danych i wizualnie pokazywane fanom w kluczowych momentach, na przykład gdy słabszy przejmuje prowadzenie i ma największe szanse na wygranie meczu.

Mamy nadzieję, że spodoba ci się ten nowy fakt o meczu w Bundeslidze i że dostarczy ci on nowych informacji na temat gry. Aby dowiedzieć się więcej o partnerstwie AWS i Bundesligi, odwiedź Bundesliga na AWS!

Jesteśmy podekscytowani, aby dowiedzieć się, jakie wzorce odkryjesz. Podziel się z nami swoimi spostrzeżeniami: @AWScloud na Twitterze, z hashtagiem #BundesligaMatchFacts.


O autorach

Szymon Rolfes rozegrał 288 meczów Bundesligi jako środkowy pomocnik, strzelił 41 goli i wygrał 26 meczów dla Niemiec. Obecnie Rolfes pełni funkcję Dyrektora Zarządzającego Sport w Bayer 04 Leverkusen, gdzie nadzoruje i rozwija skład profesjonalnych graczy, dział skautingu i rozwój młodzieży w klubie. Simon pisze także cotygodniowe felietony Bundesliga.com o najnowszych Faktach meczowych Bundesligi zasilanych przez AWS. Tam oferuje swoją wiedzę ekspercką jako były piłkarz, kapitan i analityk telewizyjny, aby podkreślić wpływ zaawansowanych statystyk i uczenia maszynowego na świat futbolu.

Tarek Haschemi jest konsultantem w AWS Professional Services. Jego umiejętności i obszary specjalizacji obejmują tworzenie aplikacji, naukę o danych, uczenie maszynowe i big data. Wspiera klientów w tworzeniu aplikacji opartych na danych w chmurze. Przed dołączeniem do AWS był również konsultantem w różnych branżach, takich jak lotnictwo i telekomunikacja. Jego pasją jest umożliwianie klientom ich podróży z danymi/AI do chmury.

Javiera Povedy-Pantera jest analitykiem danych dla klientów sportowych z regionu EMEA w zespole AWS Professional Services. Umożliwia klientom w dziedzinie sportów widowiskowych wprowadzanie innowacji i wykorzystywanie ich danych, zapewniając wysokiej jakości wrażenia użytkowników i fanów dzięki uczeniu maszynowemu i nauce danych. W wolnym czasie podąża za swoją pasją do szerokiej gamy sportów, muzyki i sztucznej inteligencji.

Łukasz Figdor jest doradcą ds. technologii sportowych w zespole AWS Professional Services. Współpracuje z graczami, klubami, ligami i firmami medialnymi, takimi jak Bundesliga i Formuła 1, aby pomóc im opowiadać historie za pomocą danych za pomocą uczenia maszynowego. W wolnym czasie lubi uczyć się wszystkiego o umyśle i skrzyżowaniu psychologii, ekonomii i sztucznej inteligencji.

Gabriel Żyłka jest inżynierem uczenia maszynowego w AWS Professional Services. Ściśle współpracuje z klientami, aby przyspieszyć ich podróż do wdrożenia chmury. Specjalizuje się w domenie MLOps, skupia się na produkcji obciążeń uczenia maszynowego poprzez automatyzację kompleksowych cykli życia uczenia maszynowego i pomaganie w osiąganiu pożądanych wyników biznesowych.

Jakuba Michalczyka jest analitykiem danych w firmie Sportec Solutions AG. Kilka lat temu wybrał studia matematyczne nad grę w piłkę nożną, ponieważ doszedł do wniosku, że nie jest wystarczająco dobry w tej drugiej. Teraz łączy obie te pasje w swojej karierze zawodowej, stosując metody uczenia maszynowego, aby uzyskać lepszy wgląd w tę piękną grę. W wolnym czasie nadal lubi grać w piłkę nożną, oglądać filmy kryminalne i słuchać muzyki filmowej.

Znak czasu:

Więcej z Uczenie maszynowe AWS