Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS

Через десять років технологічна підготовленість клубів стане ключовим фактором їх успіху. Сьогодні ми вже є свідками потенціалу технології змінити розуміння футболу. xЦілі кількісно оцінює та дозволяє порівнювати потенціал взяття воріт у будь-якій ситуації кидка xThreat та ЕПШ моделі передбачають цінність будь-якого моменту в грі. Зрештою, ці та інші передові статистичні дані служать одній меті: покращити розуміння того, хто переможе і чому. Введіть новий факт про матч Бундесліги: ймовірність перемоги.

У другому матчі "Баварії" проти "Бохума" в минулому сезоні ситуація несподівано змінилася. На початку матчу Левандовскі забиває 1:0 лише на 9 хвилині. «Сірі миші» ліги миттєво нагадують про їхню катастрофу 7:0 під час першого протистояння з «Баварією» цього сезону. Але не цього разу: Крістофер Антві-Аджеї забиває свій перший гол за клуб лише через 5 хвилин. Після голу з пенальті на 38-й хвилині команда з Монако-ді-Баварія, здається, паралізована, і все почало спалахувати: Гамбоа мускатно збиває Комана та завершує абсолютним голом, а Хольтманн робить рахунок 4:1 ближче до перерви ковпаком. зліва. «Баварія» не забивала стільки голів у першому таймі з 1975 року, і ледве змогла піти з результатом 4:2. Хто міг це здогадатися? Обидві команди грали без своїх перших воротарів, що для Баварії означало відсутність капітана Мануеля Нойєра. Чи могла його присутність врятувати їх від такого несподіваного результату?

Подібним чином «Кельн» зробив два надзвичайних успіху в сезоні 2020/2021. Коли вони зіткнулися з Дортмундом, вони пройшли 18 матчів без перемоги, тоді як Хааланд з BVB показав майстер-клас із забивання голів у тому сезоні (23 у 22 матчах). Роль фаворита була очевидна, але «Кельн» завчасно взяв лідерство лише на 9 хвилині. На початку другого тайму Схірі забив копію свого першого голу – 0:2. Дортмунд зменшив силу атаки, створив великі моменти та забив 1:2. З усіх гравців Хааланд пропустив ситера на 5 хвилині додатковий час і завоював «Кельн» першими трьома очками в Дортмунді після майже 3 років.

Пізніше в тому ж сезоні «Кельн», будучи останнім у таблиці домашнього турніру, здивував «РБ Лейпциг», який мав усю мотивацію наблизитися до лідера чемпіонату «Баварії». Суперник «Лейпциг» тиснув на «Біллі Готс» завдяки командному рекорду сезону — 13 ударів по воротах у першому таймі, що підвищило їхні й без того високі шанси на перемогу. За іронією долі, Кельн зробив рахунок 1:0, першим ударом по воротах на 46-й хвилині. Після того, як «Червоні бики» зрівняли рахунок, вони заслужено зрівняли рахунок, лише через 80 секунд вони спали на вкиданні, після чого Йонас Гектор забив за Кельн. знову. Так само, як і Дортмунд, Лейпциг тепер всю енергію вклав у атаку, але найкраще, чого їм вдалося досягти, це влучити у штангу в овертаймі.

У всіх цих матчах і експерти, і новачки помилково вгадали б переможця навіть на початку матчу. Але які події призвели до цих дивовижних коливань імовірності виграшу? На якій хвилині шанси аутсайдера на перемогу перевершили шанси фаворита, оскільки у них закінчився час? Бундесліга та AWS працювали разом, щоб обчислити та проілюструвати реальний розвиток шансів на перемогу протягом матчів, дозволяючи вболівальникам бачити ключові моменти коливань ймовірності. Результатом є нова функція машинного навчання (ML) на базі Bundesliga Match Fact: Win Probability.

Як це працює?

Нову ймовірність перемоги в матчі Bundesliga Match Fact було розроблено шляхом створення моделей ML, які проаналізували понад 1,000 історичних ігор. Модель у реальному часі бере оцінки перед матчем і коригує їх відповідно до ходу матчу на основі особливостей, які впливають на результат, зокрема:

  • Цілі
  • штрафи
  • Червоні картки
  • Заміни
  • Минав час
  • Створено гольові моменти
  • Стандартні ситуації

Жива модель навчена за допомогою архітектури нейронної мережі та використовує підхід розподілу Пуассона для прогнозування кількості голів за хвилину r для кожної команди, як описано в наступному рівнянні:

Ці показники можна розглядати як оцінку сили команди та обчислюють за допомогою серії щільних шарів на основі вхідних даних. На основі цих показників і різниці між суперниками в режимі реального часу обчислюється ймовірність перемоги та нічиєї.

Вхідними даними для моделі є 3-кортеж вхідних функцій, поточна різниця м’ячів і час гри, що залишився, у хвилинах.

Перший компонент трьох вхідних параметрів складається з набору функцій, який описує поточну ігрову дію в реальному часі для обох команд у показниках продуктивності. Вони включають різні сукупні командні значення xG, приділяючи особливу увагу ударам, зробленим за останні 15 хвилин перед прогнозом. Ми також обробляємо червоні картки, пенальті, кутові удари та кількість небезпечних штрафних ударів. Небезпечний штрафний удар класифікується як штрафний удар ближче ніж за 25 метрів до воріт суперника. Під час розробки моделі, окрім впливу попередніх фактів матчів Бундесліги xGoals, ми також оцінили вплив навичок фактів матчів Бундесліги в моделі. Це означає, що модель реагує на заміну найкращих гравців — гравців зі значками в навичках Фінішер, Ініціатор або Переможець м’яча.

Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Приклад ймовірності виграшу

Подивимося на матч поточного сезону (2022/2023). На наступному графіку показано ймовірність перемоги в матчі між «Баварією» та «Штутгартом» з 6-го туру.

Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Передматчева модель підрахувала ймовірність перемоги 67% для Баварії, 14% для Штутгарта та 19% для нічиєї. Коли ми дивимося на хід матчу, ми бачимо великий вплив голів, забитих на 36', 57' і 60' хвилинах. До першої хвилини овертайму рахунок був 2:1 на користь Баварії. Лише результативний удар С. Грассі з пенальті на 90+2 хвилині забезпечив нічию. Таким чином, модель вірогідності виграшу в реальному часі виправила прогноз нічиєї з 5% до понад 90%. Результатом стала несподівана пізня зміна: імовірність перемоги «Баварії» знизилася з 90% до 8% за 90+2 хвилини. Графік показує коливання атмосфери на Allianz Arena того дня.

Як це реалізується?

Імовірність перемоги використовує дані про події поточного матчу (події, пов’язані з голами, фоли, червоні картки тощо), а також дані, створені іншими функціями Match Facts, наприклад xGoals. Для оновлення ймовірностей у реальному часі ми використовуємо Amazon Managed Streaming Kafka (Amazon MSK) як центральне рішення потокової передачі даних і обміну повідомленнями. Таким чином, дані про події, дані про позиції та результати різних Фактів матчів Бундесліги можуть передаватись між контейнерами в реальному часі.

Наступна діаграма ілюструє наскрізний робочий процес для ймовірності виграшу.

Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Зібрані дані, пов’язані зі збігами, надходять через зовнішнього постачальника (DataHub). Метадані збігу надходять і обробляються в AWS Lambda функція. Дані про позиції та події надходять через an AWS Fargate контейнер (MatchLink). Потім усі отримані дані публікуються для використання у відповідних темах MSK. Серце факту збігу ймовірності виграшу міститься в спеціальному контейнері Fargate (BMF WinProbability), який працює протягом відповідного матчу та споживає всі необхідні дані, отримані через Amazon MSK. Моделі ML (живі та передматчеві) розгортаються на Amazon SageMaker Кінцеві точки безсерверного висновку. Безсерверні кінцеві точки автоматично запускають обчислювальні ресурси та масштабують ці обчислювальні ресурси залежно від вхідного трафіку, усуваючи потребу вибирати типи екземплярів або керувати політиками масштабування. Завдяки цій моделі оплати за використання безсерверний висновок ідеально підходить для робочих навантажень, у яких є періоди простою між стрибками трафіку. Коли немає матчів Бундесліги, витрати на неактивні ресурси не стягуються.

Незадовго до початку матчу ми створюємо наш початковий набір функцій і обчислюємо ймовірність перемоги перед матчем, викликаючи кінцеву точку PreMatch SageMaker. З цими ймовірностями PreMatch ми потім ініціалізуємо реальну модель, яка в режимі реального часу реагує на відповідні події в грі та отримує постійні запити для отримання поточних ймовірностей виграшу.

Розраховані ймовірності потім надсилаються назад до DataHub для надання іншим споживачам MatchFacts. Імовірності також надсилаються в кластер MSK до спеціальної теми, щоб використовуватися іншими Фактами про матчі Бундесліги. Лямбда-функція використовує всі ймовірності з відповідної теми Кафки та записує їх у Амазонська Аврора бази даних. Потім ці дані використовуються для інтерактивної візуалізації майже в реальному часі Amazon QuickSight.

Імовірність перемоги факту матчу Бундесліги: кількісна оцінка впливу подій у грі на шанси на перемогу за допомогою машинного навчання на AWS PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Підсумки

У цій публікації ми продемонстрували, як нова ймовірність перемоги в матчі Бундесліги показує вплив подій у грі на шанси команди виграти або програти матч. Для цього ми будуємо та об’єднуємо раніше опубліковані Факти про матчі Бундесліги в режимі реального часу. Це дозволяє коментаторам і вболівальникам виявляти моменти коливань ймовірності тощо під час живих матчів.

Нові факти про матчі Бундесліги є результатом глибокого аналізу футбольних експертів Бундесліги та дослідників даних AWS. Імовірність перемоги відображається в прямому ефірі відповідних матчів в офіційному додатку Bundesliga. Під час трансляції ймовірність виграшу надається коментаторам через пошук історії даних і візуально показується вболівальникам у ключові моменти, наприклад, коли аутсайдер бере лідерство і тепер, швидше за все, виграє гру.

Ми сподіваємося, що вам сподобається цей абсолютно новий факт про матч Бундесліги, і він надасть вам нові знання про гру. Щоб дізнатися більше про партнерство між AWS і Бундеслігою, відвідайте сайт Бундесліга на AWS!

Ми раді дізнатися, які закономірності ви відкриєте. Поділіться з нами своїми думками: @AWScloud у Twitter, з хештегом #BundesligaMatchFacts.


Про авторів

Саймон Рольфес провів 288 ігор у Бундеслізі на позиції центрального півзахисника, забив 41 гол і виграв 26 матчів за Німеччину. В даний час Рольфес працює керуючим директором зі спорту в Bayer 04 Leverkusen, де він контролює та розвиває склад професійних гравців, скаутський відділ і розвиток молоді клубу. Саймон також пише щотижневі колонки Bundesliga.com про останні факти про матчі Бундесліги на основі AWS. Там він пропонує свій досвід колишнього гравця, капітана та телеаналітика, щоб підкреслити вплив передової статистики та машинного навчання на світ футболу.

Тарек Хашемі є консультантом AWS Professional Services. Його навички та сфери знань включають розробку додатків, науку про дані, машинне навчання та великі дані. Він підтримує клієнтів у розробці додатків на основі даних у хмарі. До приходу в AWS він також був консультантом у різних галузях, таких як авіація та телекомунікації. Він захоплений тим, щоб допомогти клієнтам під час подорожі даних/ШІ до хмари.

Хав'єр Поведа-Пантер є дослідником даних для спортивних клієнтів у регіоні EMEA в команді AWS Professional Services. Він дозволяє клієнтам у сфері глядацьких видів спорту впроваджувати інновації та використовувати свої дані, забезпечуючи високоякісну роботу користувачів і вболівальників за допомогою машинного навчання та науки про дані. У вільний час він займається різними видами спорту, музикою та ШІ.

Луук Фігдор є радником зі спортивних технологій у команді професійних послуг AWS. Він працює з гравцями, клубами, лігами та медіа-компаніями, такими як Бундесліга та Формула-1, щоб допомогти їм розповідати історії за допомогою даних за допомогою машинного навчання. У вільний час він любить вивчати все про розум і перетин психології, економіки та ШІ.

Габріель Жилка є інженером машинного навчання в AWS Professional Services. Він тісно співпрацює з клієнтами, щоб прискорити процес впровадження хмарних технологій. Спеціалізуючись на сфері MLOps, він зосереджується на виробництві робочих навантажень машинного навчання шляхом автоматизації наскрізного життєвого циклу машинного навчання та допомоги в досягненні бажаних бізнес-результатів.

Якуб Міхальчик є спеціалістом з обробки даних у Sportec Solutions AG. Кілька років тому він обрав математику, а не футбол, оскільки дійшов висновку, що в останньому він недостатньо хороший. Тепер він поєднує обидві ці пристрасті у своїй професійній кар’єрі, застосовуючи методи машинного навчання, щоб краще зрозуміти цю прекрасну гру. У вільний час він любить грати в міні-футбол, дивитися кримінальні фільми та слухати музику з фільмів.

Часова мітка:

Більше від AWS Машинне навчання