Факт о матче Бундеслиги. Вероятность победы: количественная оценка влияния внутриигровых событий на шансы на победу с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Вероятность победы в матче Бундеслиги: количественная оценка влияния внутриигровых событий на шансы на победу с использованием машинного обучения на AWS

Через десять лет технологическая пригодность клубов станет ключевым фактором их успеха. Сегодня мы уже видим потенциал технологий, которые революционизируют понимание футбола. хГолс дает количественную оценку и позволяет сравнить потенциал забитых голов в любой бросковой ситуации, в то время как xУгроза и ЭПВ модели предсказывают ценность любого игрового момента. В конечном счете, эти и другие расширенные статистические данные служат одной цели: улучшить понимание того, кто победит и почему. Введите новый факт о матче Бундеслиги: вероятность победы.

Во втором матче «Баварии» против «Бохума» в прошлом сезоне ситуация изменилась неожиданно. В начале матча Левандовски забивает 1:0 уже через 9 минут. «Серая мышь» лиги мгновенно вспоминает о своем провале со счетом 7:0, когда впервые в этом сезоне встречается с «Баварией». Но не в этот раз: Кристофер Антви-Аджей забивает свой первый гол за клуб всего через 5 минут. Задумав гол с пенальти на 38-й минуте, команда из Монако-ди-Бавария кажется парализованной, и события начали вспыхивать: Гамбоа мускатным орехом Комана и завершает абсолютным закупориванием гола, а Хольтманн делает это 4: 1 ближе к перерыву с диппером. слева. «Бавария» не забивала столько голов в первом тайме с 1975 года и едва смогла уйти со счетом 4:2. Кто мог об этом догадаться? Обе команды играли без своих первых вратарей, что для «Баварии» означало потерю своего капитана Мануэля Нойера. Могло ли его присутствие спасти их от этого неожиданного результата?

Точно так же в сезоне 2020/2021 Кельн добился двух выдающихся успехов. Когда они встретились с Дортмундом, они провели 18 матчей без побед, в то время как Хааланд из BVB показал мастер-класс по забиванию голов в том сезоне (23 в 22 матчах). Роль фаворита была ясна, но Кельн быстро вышел вперед, всего за 9 минут до конца. В начале второго тайма Схири забил гол под копирку своего первого: 0:2. Дортмундцы уступили в силе атаки, создали большие моменты и забили 1:2. Из всех игроков Хааланд пропустил сидящего на 5 минуте дополнительного времени и принес Кельну первые 3 очка в Дортмунде после почти 30 лет.

Позже в том же сезоне «Кельн» — последний в домашней таблице — удивил «РБ Лейпциг», у которого была вся мотивация приблизиться к лидеру чемпионата «Баварии». Соперник «Лейпциг» оказал давление на «Билли Козлов» с рекордом сезона в 13 ударов по воротам в первом тайме, увеличив их и без того высокие шансы на победу. По иронии судьбы, «Кельн» забил 1:0 с первого удара по воротам на 46-й минуте. После того, как «Ред Буллз» сравняли счет, они заснули при вбрасывании всего через 80 секунд, что привело к тому, что Йонас Гектор забил гол за «Кельн». опять таки. Как и Дортмунд, «Лейпциг» теперь вкладывал всю энергию в нападение, но лучшее, чего им удалось добиться, это попадание в штангу в овертайме.

Во всех этих матчах как эксперты, так и новички ошибочно угадывали победителя даже в самом начале матча. Но какие события привели к этим неожиданным колебаниям вероятности выигрыша в игре? На какой минуте шансы аутсайдера на победу превысили шансы фаворита, так как у них не хватило времени? Bundesliga и AWS совместно рассчитали и проиллюстрировали изменение шансов на победу в реальном времени на протяжении матчей, что позволило болельщикам увидеть ключевые моменты колебаний вероятности. Результатом стал новый основанный на машинном обучении (ML) факт матча Бундеслиги: вероятность победы.

Как это работает?

Новая вероятность победы в матче Бундеслиги была разработана путем создания моделей машинного обучения, которые проанализировали более 1,000 исторических игр. Живая модель берет предматчевые оценки и корректирует их в соответствии с ходом матча на основе особенностей, влияющих на результат, в том числе следующих:

  • Цели
  • Штрафы
  • Красные карточки
  • Замены
  • Время прошло
  • Созданы голевые моменты
  • Стандартные ситуации

Живая модель обучается с использованием архитектуры нейронной сети и использует метод распределения Пуассона для прогнозирования скорости голов в минуту. r для каждой команды, как описано в следующем уравнении:

Эти показатели можно рассматривать как оценку силы команды, и они рассчитываются с использованием серии плотных слоев на основе входных данных. На основе этих ставок и разницы между соперниками в режиме реального времени рассчитываются вероятности победы и ничьей.

Входные данные для модели представляют собой набор из трех входных функций, текущей разницы мячей и оставшегося игрового времени в минутах.

Первый компонент трех входных измерений состоит из набора функций, который описывает текущее игровое действие в режиме реального времени для обеих команд в показателях производительности. К ним относятся различные агрегированные значения xG для команд с особым вниманием к ударам, сделанным за последние 15 минут до прогноза. Мы также обрабатываем красные карточки, пенальти, угловые удары и количество опасных штрафных ударов. Опасный штрафной удар классифицируется как штрафной удар ближе 25 м от ворот соперника. Во время разработки модели, помимо влияния xGoals бывшей Бундеслиги Match Fact, мы также оценили влияние Bundesliga Match Fact Skill в модели. Это означает, что модель реагирует на подмену лучших игроков — игроков со значками в навыках Финишер, Инициатор или Победитель мяча.

Факт о матче Бундеслиги. Вероятность победы: количественная оценка влияния внутриигровых событий на шансы на победу с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Пример вероятности выигрыша

Давайте посмотрим на матч текущего сезона (2022/2023). На следующем графике показана вероятность победы в матче мюнхенской «Баварии» и «Штутгарта» с 6-го тура.

Факт о матче Бундеслиги. Вероятность победы: количественная оценка влияния внутриигровых событий на шансы на победу с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Предматчевая модель рассчитала вероятность победы «Баварии» в 67 %, «Штутгарта» — 14 %, а в случае ничьей — 19 %. Когда мы смотрим на ход матча, мы видим большое влияние голов, забитых на 36-й, 57-й и 60-й минутах. До первой минуты овертайма счет был 2:1 в пользу «Баварии». Лишь удачный пенальти С. Грасси на 90+2 минуте обеспечил ничью. Таким образом, живая модель вероятности выигрыша скорректировала прогноз розыгрыша с 5% до более чем 90%. Результатом стал неожиданный поздний поворот, когда вероятность победы «Баварии» снизилась с 90% до 8% на 90+2 минуте. График отражает изменение атмосферы на «Альянц Арене» в тот день.

Как это реализовано?

Вероятность победы использует данные о событиях в текущем матче (голы, фолы, красные карточки и т. д.), а также данные, созданные другими фактами о матче, такими как xGoals. Для обновления вероятностей в реальном времени мы используем Amazon управлял потоковой передачей Kafka (Amazon MSK) в качестве централизованного решения для потоковой передачи данных и обмена сообщениями. Таким образом, данные о событиях, данные о позициях и выходные данные различных фактов о матчах Бундеслиги могут передаваться между контейнерами в режиме реального времени.

На следующей диаграмме показан сквозной рабочий процесс для Win Probability.

Факт о матче Бундеслиги. Вероятность победы: количественная оценка влияния внутриигровых событий на шансы на победу с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Собранные данные о матчах передаются через внешнего поставщика (DataHub). Метаданные матча принимаются и обрабатываются в AWS Lambda функция. Данные о позициях и событиях поступают через АМС Фаргейт контейнер (MatchLink). Затем все принятые данные публикуются для использования в соответствующих темах MSK. Суть факта совпадения вероятности победы находится в специальном контейнере Fargate (BMF WinProbability), который работает в течение всего матча и использует все необходимые данные, полученные через Amazon MSK. Модели машинного обучения (в реальном времени и перед матчем) развернуты на Создатель мудреца Амазонки Бессерверные конечные точки вывода. Бессерверные конечные точки автоматически запускают вычислительные ресурсы и масштабируют эти вычислительные ресурсы в зависимости от входящего трафика, устраняя необходимость выбирать типы экземпляров или управлять политиками масштабирования. Благодаря этой модели с оплатой по факту использования Serverless Inference идеально подходит для рабочих нагрузок с периодами простоя между скачками трафика. Когда матчей Бундеслиги нет, незанятые ресурсы не оплачиваются.

Незадолго до старта мы создаем наш первоначальный набор функций и вычисляем вероятности победы перед матчем, вызывая конечную точку PreMatch SageMaker. Затем с помощью этих PreMatch-вероятностей мы инициализируем живую модель, которая в режиме реального времени реагирует на соответствующие внутриигровые события и постоянно запрашивается для получения текущих вероятностей выигрыша.

Затем рассчитанные вероятности отправляются обратно в DataHub для предоставления другим потребителям MatchFacts. Вероятности также отправляются в кластер MSK в специальную тему для использования другими фактами о матчах Бундеслиги. Лямбда-функция использует все вероятности из соответствующей темы Kafka и записывает их в Амазон Аврора база данных. Затем эти данные используются для интерактивных визуализаций в режиме, близком к реальному времени. Amazon QuickSight.

Факт о матче Бундеслиги. Вероятность победы: количественная оценка влияния внутриигровых событий на шансы на победу с помощью машинного обучения в AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Обзор

В этом посте мы продемонстрировали, как новая вероятность победы в матче Бундеслиги показывает влияние внутриигровых событий на шансы команды на победу или поражение в матче. Для этого мы используем и объединяем ранее опубликованные факты о матчах Бундеслиги в режиме реального времени. Это позволяет комментаторам и болельщикам обнаруживать моменты колебаний вероятности и многое другое во время живых матчей.

Новые данные о матчах Бундеслиги являются результатом тщательного анализа, проведенного футбольными экспертами Бундеслиги и специалистами по данным AWS. Вероятность победы отображается в бегущей строке соответствующих матчей в официальном приложении Бундеслиги. Во время трансляции вероятность выигрыша предоставляется комментаторам через поиск истории данных и визуально показывается болельщикам в ключевые моменты, например, когда аутсайдер берет на себя инициативу и теперь, скорее всего, выиграет игру.

Мы надеемся, что вам понравится этот совершенно новый факт о матче Бундеслиги и что он даст вам новое представление об игре. Чтобы узнать больше о партнерстве между AWS и Бундеслигой, посетите Бундеслига на AWS!

Мы рады узнать, какие закономерности вы обнаружите. Поделитесь с нами своими наблюдениями: @AWScloud в Твиттере, с хэштегом #BundesligaMatchFacts.


Об авторах

Саймон Рольфес сыграл 288 матчей Бундеслиги в качестве центрального полузащитника, забил 41 гол и выиграл 26 матчей за сборную Германии. В настоящее время Рольфес является управляющим директором по спорту в Bayer 04 Leverkusen, где он курирует и развивает состав профессиональных игроков, скаутский отдел и развитие молодежи клуба. Саймон также ведет еженедельные колонки Bundesliga.com о последних фактах о матчах Бундеслиги на платформе AWS. Там он предлагает свой опыт в качестве бывшего игрока, капитана и телевизионного аналитика, чтобы подчеркнуть влияние расширенной статистики и машинного обучения на мир футбола.

Тарек Хашеми является консультантом AWS Professional Services. Его навыки и области знаний включают разработку приложений, науку о данных, машинное обучение и большие данные. Он поддерживает клиентов в разработке приложений, управляемых данными, в облаке. До прихода в AWS он также был консультантом в различных отраслях, таких как авиация и телекоммуникации. Он увлечен тем, чтобы помочь клиентам в их переходе от данных/ИИ к облаку.

Хавьер Поведа-Пантер работает специалистом по данным для спортивных клиентов в регионе EMEA в команде AWS Professional Services. Он позволяет клиентам в области зрелищных видов спорта внедрять инновации и извлекать выгоду из своих данных, обеспечивая высококачественный опыт пользователей и болельщиков с помощью машинного обучения и обработки данных. В свободное время он увлекается спортом, музыкой и искусственным интеллектом.

Луук Фигдор является консультантом по спортивным технологиям в команде AWS Professional Services. Он работает с игроками, клубами, лигами и медиа-компаниями, такими как Бундеслига и Формула-1, помогая им рассказывать истории на основе данных с помощью машинного обучения. В свободное время он любит узнавать все о разуме и пересечении психологии, экономики и ИИ.

Габриэль Зилка является инженером по машинному обучению в AWS Professional Services. Он тесно сотрудничает с клиентами, чтобы ускорить их переход к облачным технологиям. Специализируясь на области MLOps, он занимается производством рабочих нагрузок машинного обучения, автоматизируя сквозные жизненные циклы машинного обучения и помогая достичь желаемых бизнес-результатов.

Якуб Михальчик является специалистом по данным в Sportec Solutions AG. Несколько лет назад он предпочел математику игре в футбол, так как пришел к выводу, что в последнем он недостаточно хорош. Теперь он совмещает обе эти страсти в своей профессиональной карьере, применяя методы машинного обучения, чтобы лучше понять эту прекрасную игру. В свободное время он по-прежнему любит играть в мини-футбол, смотреть криминальные фильмы и слушать музыку из фильмов.

Отметка времени:

Больше от Машинное обучение AWS