Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Bundesliga Match Fact Skill: количественная оценка качеств футболиста с помощью машинного обучения на AWS

В футболе, как и во многих других видах спорта, дискуссии об отдельных игроках всегда были частью развлечения. «Кто лучший бомбардир?» или «Кто король защитников?» — это вопросы, которые постоянно обсуждаются фанатами, и социальные сети усиливают эти дебаты. Просто учтите, что только у Эрлинга Хааланда, Роберта Левандовски и Томаса Мюллера в общей сложности 50 миллионов подписчиков в Instagram. Многие болельщики знают о невероятной статистике таких звездных игроков, как Левандовски и Хааланд, но подобные истории — лишь верхушка айсберга.

Учтите, что почти 600 игроков имеют контракты в Бундеслиге, и у каждой команды есть свои чемпионы — игроки, которых знакомят, чтобы они применили в матче определенные навыки. Посмотрите, например, на Михаэля Грегорича из «Аугсбурга». На момент написания этой статьи (21-й тур) он забил пять голов в сезоне 21/22, и это не то, что заставило бы кого-либо упомянуть его в разговоре о великих бомбардирах. Но давайте посмотрим поближе: если вы суммируете значения ожидаемых голов (xGoals) всех голевых моментов, которые Грегорич имел в этом сезоне, вы получите цифру 1.7. Это означает, что он превзошел результативность ударов по воротам на +194%, забив на 3.2 гола больше, чем ожидалось. Для сравнения, Левандовски переиграл всего на 1.6 гола (+7%). Какой подвиг! Очевидно, что Грегорич привнес в «Аугсбург» особое мастерство.

Так как же нам пролить свет на все скрытые истории об отдельных игроках Бундеслиги, их навыках и влиянии на результаты матчей? Встречайте новый факт о матчах Бундеслиги на платформе AWS под названием Skill. Навыки были разработаны посредством углубленного анализа, проведенного DFL и AWS, для выявления игроков с навыками в четырех конкретных категориях: инициатор, финишер, обладатель мяча и спринтер. В этом посте подробно рассматриваются эти четыре навыка и обсуждается, как они реализуются в инфраструктуре AWS.

Еще один интересный момент заключается в том, что до сих пор «Факты о матчах Бундеслиги» разрабатывались независимо друг от друга. Skill — это первый факт о матчах Бундеслиги, который объединяет результаты нескольких фактов о матчах Бундеслиги в режиме реального времени с использованием архитектуры потоковой передачи, построенной на Amazon управлял потоковой передачей Kafka (Амазон МСК).

инициатор

Инициатор – игрок, выполняющий большое количество ценных первых и вторых передач. Чтобы определить и количественно оценить ценность этих передач, мы ввели новую метрику xAssist. Он рассчитывается путем отслеживания последнего и предпоследнего паса перед ударом по воротам и присвоения этим действиям соответствующего значения xGoals. Хороший инициатор создает возможности в сложных обстоятельствах, успешно выполняя пасы высокой сложности. Чтобы оценить, насколько сложно выполнить тот или иной проход, мы используем существующие xPass модель. В этом показателе мы намеренно исключаем навесы и штрафные удары, чтобы сосредоточиться на игроках, которые создают голевые моменты благодаря точным передачам в открытой игре.

Оценка навыков рассчитывается по следующей формуле:
Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Давайте рассмотрим в качестве примера нынешнего инициатора 1-го ранга Томаса Мюллера. На момент написания этой статьи (9.23-й тур) он получил значение xAssist, равное 21. Это означает, что его передачи следующим игрокам, которые били по воротам, принесли общее значение xGoal, равное 9.23. Коэффициент xAssist за 90 минут составляет 0.46. Это можно подсчитать, исходя из его общего игрового времени в текущем сезоне, что примечательно – более 1,804 минут игрового времени. В качестве второй передачи он набрал общее количество очков 3.80, что соответствует 0.19 секунды передачи за 90 минут. В общей сложности 38 из 58 его первых передач были трудными передачами. А что касается второй передачи, то 11 из его 28 передач также были трудными. Благодаря такой статистике Томас Мюллер вывел себя на первое место в рейтинге инициаторов. Для сравнения в следующей таблице представлены значения текущей тройки лидеров.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 СложныеПроходыПомощь СложныеПроходыПомощь2 Окончательный счет
Томас Мюллер – 1 место 9.23 0.46 3.80 0.18 38 11 0.948
Серж Гнабри – 2 место 3.94 0.25 2.54 0.16 15 11 0.516
Флориан Виртц — 3-й ранг 6.41 0.37 2.45 0.14 21 1 0.510

финишер

Финишер – это игрок, который исключительно хорошо забивает голы. Он обладает высокой эффективностью бросков и достигает многих целей в зависимости от своего игрового времени. Навык основан на фактических забитых голах и их разнице с ожидаемыми голами (xGoals). Это позволяет нам оценить, насколько хорошо используются шансы. Предположим, что два нападающих забили одинаковое количество голов. Они одинаково сильны? Или один из них забивает в легких обстоятельствах, а другой забивает в сложных ситуациях? На этот вопрос можно ответить с помощью эффективности бросков: если забитые голы превышают количество xGoals, игрок демонстрирует более высокую результативность и является более эффективным броском, чем в среднем. По величине этой разницы мы можем количественно оценить, насколько эффективность стрелка превышает средний показатель.

Оценка навыков рассчитывается по следующей формуле:
Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Что касается финишера, мы больше сосредотачиваемся на целях. В следующей таблице более подробно рассматривается тройка лидеров на данный момент.

.. Цели ГолыPer90 ВыстрелЭффективность Окончательный счет
Роберт Левандовски – 1 место 24 1.14 1.55 0.813
Эрлинг Хааланд — 2-й ранг 16 1.18 5.32 0.811
Патрик Шик – 3 место 18 1.10 4.27 0.802

Роберт Левандовски в этом сезоне забил 24 гола, что ставит его на первое место. Хотя у Хааланда более высокая эффективность бросков, этого все равно недостаточно для того, чтобы Хааланд занял первое место, потому что мы придаем более высокий вес забитым голам. Это указывает на то, что Левандовски получает большую выгоду как от качества, так и от количества получаемых передач, хотя он и забивает исключительно хорошо. Патрик Шик забил на два гола больше, чем Хааланд, но у него меньшая результативность за 90 минут и меньшая эффективность броска.

Спринтер

Спринтер обладает физической способностью достигать высоких скоростей и делает это чаще, чем другие. Для этой цели мы оцениваем средние максимальные скорости во всех играх текущего сезона игрока и включаем, среди других показателей, частоту спринтов за 90 минут. Спринт засчитывается, если игрок бежит с минимальной скоростью 4.0 м/с более двух секунд и достигает за это время максимальной скорости не менее 6.3 м/с. Продолжительность спринта характеризуется временем между первым и последним достижением порога 6.3 м/с и должна составлять не менее 1 секунды для подтверждения. Новый спринт можно считать произошедшим только после того, как темп снова упадет ниже порога 4.0 м/с.

Оценка навыков рассчитывается по следующей формуле:
Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Формула позволяет нам оценить множество способов оценки спринтов игроков и пойти дальше, чем просто смотреть на максимальную скорость, которую демонстрируют эти игроки. Например, у Джеремайи Сент-Жюста рекорд текущего сезона — 36.65 км/ч. Однако, если мы посмотрим на частоту его спринтов, мы обнаружим, что в среднем он совершает спринты только девять раз за матч! Альфонсо Дэвис, с другой стороны, возможно, не так быстр, как Сен-Жюст (максимальная скорость 36.08 км/ч), но совершает ошеломляющие 31 спринт за матч! Он бежит гораздо чаще и с гораздо более высокой средней скоростью, открывая пространство для своей команды на поле.

Победитель мяча

Игрок, обладающий этой способностью, приводит к потерям мяча команды противника как в целом, так и в зависимости от его игрового времени. Он выигрывает большое количество наземных и воздушных дуэлей, часто крадет или перехватывает мяч, обеспечивая себе безопасный контроль мяча и возможность для своей команды контратаковать.

Оценка навыков рассчитывается по следующей формуле:
Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

На момент написания этой статьи первое место занял Данило Соарес. Всего на его счету 235 защитных поединков. Из 235 защитных поединков он выиграл 75, победив соперников в вбрасывании. В этом сезоне на своей игровой позиции защитника он перехватил 51 мяч, что дает ему процент побед около 32%. В среднем он перехватывал 2.4 мяча за 90 минут.

Пример навыка

Факт о матчах в Бундеслиге позволяет нам раскрыть способности и сильные стороны игроков Бундеслиги. Рейтинги навыков ставят игроков в центр внимания, что раньше могло остаться незамеченным в рейтингах обычных статистических данных, таких как голы. Например, возьмем такого игрока, как Михаэль Грегорич. Грегорич – нападающий «Аугсбурга», занявший шестое место в рейтинге бомбардиров по состоянию на 21-й тур. На данный момент он забил пять голов, что не позволило бы ему возглавить какой-либо рейтинг результативности. Однако сделать это ему удалось всего за 663 сыгранные минуты! Одним из таких голов стал поздний счет, сравнявший счет на 97-й минуте, который помог «Аугсбургу» избежать выездного поражения в Берлине.

Благодаря факту матча Skill Bundesliga мы также можем распознать различные качества каждого игрока. Одним из примеров этого является звезда Дортмунда Эрлинг Хааланд, который также заслужил значок спринтера и финишера и в настоящее время занимает шестое место среди спринтеров Бундеслиги.

Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.
Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Все эти показатели основаны на данных о перемещениях игроков, данных о голах, данных о действиях мяча и данных о пасах. Мы обрабатываем эту информацию в конвейерах данных и извлекаем необходимую соответствующую статистику по каждому навыку, что позволяет нам рассчитывать развитие всех показателей в режиме реального времени. Многие из вышеупомянутых статистических данных нормализованы по времени, проведенному на поле, что позволяет учитывать игроков, у которых мало игрового времени, но которые показывают удивительно хорошие результаты во время игры. Комбинации и веса метрик объединяются в единый балл. Результатом является рейтинг всех игроков по четырем навыкам игрока. Игроки, вошедшие в десятку лучших, получают значок навыка, который поможет болельщикам быстро определить исключительные качества, которые они привносят в свои команды.

Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Реализация и архитектура

Факты о матчах Бундеслиги, разработанные до этого момента, независимы друг от друга и основаны только на использовании позиционных данных и данных о событиях, а также на собственных расчетах. Однако это меняется в отношении нового навыка «Факты о матчах Бундеслиги», который рассчитывает рейтинги навыков на основе данных, полученных с помощью существующих фактов о матчах, таких как, например, xGoals или xPass. Исход одного события, возможно, невероятный гол с низкими шансами на его попадание, может оказать существенное влияние на рейтинг навыков финишера. Поэтому мы создали архитектуру, которая всегда предоставляет самые актуальные рейтинги навыков при каждом обновлении базовых данных. Чтобы обеспечить обновление навыков в режиме реального времени, мы используем Amazon MSK, управляемый сервис AWS для Apache Kafka, в качестве решения для потоковой передачи данных и обмена сообщениями. Таким образом, различные факты о матчах Бундеслиги могут сообщать о последних событиях и обновлениях в режиме реального времени.

Базовая архитектура Skill состоит из четырех основных частей:

  • An Бессерверный кластер Amazon Aurora хранит все результаты существующих фактов совпадения. Сюда входят, например, данные о каждом пасе (например, xPass, игрок, предполагаемый принимающий) или ударе (xGoal, игрок, гол), произошедшем с момента введения «Фактов о матчах Бундеслиги».
  • Центральный AWS Lambda Функция записывает выходные данные о матчах Бундеслиги в базу данных Aurora и уведомляет другие компоненты о наличии обновления.
  • Лямбда-функция для каждого отдельного навыка вычисляет рейтинг навыка. Эти функции запускаются всякий раз, когда доступны новые данные для расчета конкретного навыка.
  • Кластер Amazon MSK Kafka служит центральной точкой связи между всеми этими компонентами.

Следующая диаграмма иллюстрирует этот рабочий процесс. Каждый факт матча Бундеслиги немедленно отправляет сообщение о событии в Kafka всякий раз, когда появляется обновление события (например, обновленное значение xGoals для события броска). Функция Lambda центрального диспетчера автоматически срабатывает всякий раз, когда факт матча Бундеслиги отправляет такое сообщение и записывает эти данные в базу данных. Затем он отправляет через Kafka еще одно сообщение, содержащее новые данные, обратно в Kafka, что служит триггером для отдельных функций расчета навыков. Эти функции используют данные этого триггерного события, а также базового кластера Aurora для расчета и публикации новейших рейтингов навыков. Более подробную информацию об использовании Amazon MSK в этом проекте можно найти в блоге Set Piece Threat.

Навык фактов матчей Бундеслиги: количественная оценка качеств футболистов с помощью машинного обучения на платформе AWS PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Обзор

В этом посте мы продемонстрировали, как новый навык «Факты о матчах Бундеслиги» позволяет объективно сравнивать игроков Бундеслиги по четырем основным параметрам, опираясь на и объединяя бывшие независимые факты о матчах Бундеслиги в режиме реального времени. Это позволяет комментаторам и болельщикам раскрыть ранее незамеченные способности игроков и пролить свет на роли, которые выполняют различные игроки Бундеслиги.

Новый «Факт о матчах Бундеслиги» — это результат углубленного анализа, проведенного футбольными экспертами Бундеслиги и специалистами по обработке данных AWS с целью выявить и классифицировать качества футболистов на основе объективных данных о результативности. Значки навыков игрока отображаются в составе и на страницах сведений об игроках в приложении Бундеслиги. В трансляции навыки игроков предоставляются комментаторам через поиск истории данных и визуально отображается болельщикам при замене игрока и когда игрок поднимается в соответствующую десятку лучших.

Мы надеемся, что вам понравится этот совершенно новый факт о матче Бундеслиги и что он даст вам новое представление об игре. Чтобы узнать больше о партнерстве между AWS и Бундеслигой, посетите Бундеслига на AWS!


Об авторах

Саймон Рольфес сыграл 288 матчей Бундеслиги в качестве центрального полузащитника, забил 41 гол и выиграл 26 матчей за сборную Германии. В настоящее время Рольфес занимает должность спортивного директора в «Байер 04 Леверкузен», где он курирует и развивает состав профессиональных игроков, скаутский отдел и развитие молодежи клуба. Саймон также ведет еженедельные колонки на Bundesliga.com о последних фактах о матчах Бундеслиги на платформе AWS.

Луук Фигдор — старший специалист по спортивным технологиям в команде AWS Professional Services. Он работает с игроками, клубами, лигами и медиа-компаниями, такими как Бундеслига и Формула-1, помогая им рассказывать истории с помощью данных с помощью машинного обучения. В свободное время ему нравится узнавать все о разуме и пересечении психологии, экономики и искусственного интеллекта.

Паскаль Кюнер — разработчик облачных приложений в команде AWS Professional Services. Он работает с клиентами из разных отраслей, помогая им достичь бизнес-результатов посредством разработки приложений, DevOps и инфраструктуры. Он очень увлечен спортом и в свободное время любит играть в баскетбол и футбол.

Тарек Хашеми является консультантом AWS Professional Services. Его навыки и области знаний включают разработку приложений, науку о данных, машинное обучение и большие данные. Находясь в Гамбурге, он поддерживает клиентов в разработке приложений, управляемых данными, в облаке. До прихода в AWS он также был консультантом в различных отраслях, таких как авиация и телекоммуникации. Он с энтузиазмом помогает клиентам перенести данные/ИИ в облако.

Якуб Михальчик — специалист по данным в Sportec Solutions AG. Несколько лет назад он предпочел изучение математики игре в футбол, поскольку пришел к выводу, что в последнем он недостаточно хорош. Теперь он объединяет оба этих увлечения в своей профессиональной карьере, применяя методы машинного обучения, чтобы лучше понять эту прекрасную игру. В свободное время он по-прежнему любит играть в мини-футбол, смотреть криминальные фильмы и слушать музыку из фильмов.

Хавьер Поведа-Пантер работает специалистом по данным для спортивных клиентов в регионе EMEA в команде AWS Professional Services. Он позволяет клиентам в области зрелищных видов спорта внедрять инновации и извлекать выгоду из своих данных, обеспечивая высококачественный опыт пользователей и болельщиков с помощью машинного обучения и обработки данных. В свободное время он увлекается спортом, музыкой и искусственным интеллектом.

Отметка времени:

Больше от Машинное обучение AWS