德甲比赛事实获胜概率：使用 AWS 上的机器学习量化游戏内事件对获胜机会的影响

由柏拉图重新发布

关注： 0

十年后，俱乐部的技术适应性将成为他们成功的关键因素。今天，我们已经见证了技术革命性地改变对足球的理解的潜力。 x目标量化并允许比较任何射击情况的进球潜力，同时 x威胁和电动车模型可以预测任何游戏中时刻的价值。最终，这些和其他高级统计数据服务于一个目的：提高对谁将获胜以及为什么获胜的理解。输入新的德甲比赛事实：获胜概率。

在上赛季拜仁对阵波鸿的第二场比赛中，形势出人意料地发生了逆转。比赛初期，莱万多夫斯基开场仅 1 分钟便以 0:9 领先。联盟中的“灰鼠”在那个赛季第一次面对拜仁时，瞬间想起了他们7:0的惨败。但这次不是：克里斯托弗·安特维-阿杰在 5 分钟后为俱乐部打进了他的第一个进球。在第 38 分钟射入点球后，来自摩纳哥的巴伐利亚队似乎陷入了瘫痪，事情开始爆发：甘博亚肉豆蔻科曼并以绝对的进球终结，而霍尔特曼则以 4:1 接近半场结束。从左边。自 1975 年以来，拜仁在上半场从未有过如此多的进球，并且几乎无法以 4:2 的比分离开。谁能猜到呢？两支球队都没有他们的第一门将，这对拜仁来说意味着错过了他们的队长曼努埃尔诺伊尔。他的出现能否让他们从这个意想不到的结果中解脱出来？

同样，科隆在 2020/2021 赛季也取得了两个非凡的成绩。当他们面对多特蒙德时，他们已经有 18 场比赛没有获胜，而多特蒙德的哈兰德则在那个赛季的进球方面提供了大师级的进球（23 场比赛中有 22 个进球）。热门的角色很明确，但科隆在比赛还剩 9 分钟时就早早取得领先。下半场一开始，斯基里就打进了他的第一个进球：0:2。多特蒙德攻势上垒，创造大好机会，1:2破门。在所有球员中，哈兰德在加时赛前 5 分钟错过了一名保姆，并在近 3 年后以多特蒙德的前 30 分加冕科隆。

在那个赛季的晚些时候，科隆——在主场排在最后——让 RB 莱比锡大吃一惊，后者完全有动力接近冠军领头羊拜仁。对手莱比锡队以上半场13次射门的球队赛季记录向“比利山羊”施加压力，增加了他们本已很高的获胜机会。具有讽刺意味的是，科隆在第 1 分钟第一次射门就打进了 0:46。在“红牛”打入当之无愧的扳平比分后，仅仅 80 秒他们就掷界外球，让乔纳斯·赫克托为科隆打进一球。再次。就像多特蒙德一样，莱比锡现在把所有的精力都放在了进攻上，但他们所取得的最好成绩就是在加时赛中击中了门柱。

对于所有这些比赛，专家和新手都会错误地猜出获胜者，即使是在比赛中。但是，是什么事件导致了这些令人惊讶的游戏内获胜概率波动？失败者的获胜机会在什么时候超过了热门者，因为他们没有时间了？德甲联赛和 AWS 合作计算和说明了整个比赛中获胜机会的实时发展，让球迷能够看到概率波动的关键时刻。结果是新的机器学习 (ML) 驱动的德甲比赛事实：获胜概率。

我们如何运作？

新的德甲比赛事实获胜概率是通过构建分析 1,000 多场历史比赛的 ML 模型开发的。实时模型采用赛前估计，并根据影响结果的特征根据比赛进程对其进行调整，包括以下内容：

理想中
处罚
红牌
替换
时间飞逝
创造进球机会
定位球情况

实时模型使用神经网络架构进行训练，并使用泊松分布方法来预测每分钟进球率 r 对于每个团队，如以下等式所述：

这些比率可以被视为对团队实力的估计，并根据输入使用一系列密集层进行计算。根据这些比率和对手之间的差异，实时计算获胜和平局的概率。

模型的输入是输入特征、当前目标差和剩余游戏时间（以分钟为单位）的三元组。

三个输入维度的第一个组成部分由一个特征集组成，该特征集在性能指标中实时描述两个团队的当前游戏动作。其中包括各种基于团队的综合 xG 值，特别注意预测前最后 15 分钟内的投篮。我们还处理红牌、点球、角球和危险任意球的数量。危险任意球被归类为距离对方球门25m以内的任意球。在模型的开发过程中，除了前德甲Match Fact xGoals的影响外，我们还评估了德甲Match Fact Skill对模型的影响。这意味着该模型会对顶级球员的替换做出反应——在技能终结者、发起者或球获胜者中拥有徽章的球员。

获胜概率示例

让我们看一下当前赛季（2022/2023）的一场比赛。下图显示了从第 6 个比赛日起拜仁慕尼黑和斯图加特比赛的获胜概率。

赛前模型计算出拜仁的获胜概率为 67%，斯图加特为 14%，平局为 19%。当我们查看比赛进程时，我们会看到在第 36 分钟、第 57 分钟和第 60 分钟进球的巨大影响。直到加时赛的第一分钟，拜仁的比分是2:1。只有在第 90+2 分钟，S. Grassy 的一记成功的点球扳平了比分。因此，获胜概率实时模型将平局预测从 5% 修正为 90% 以上。结果是出人意料的后期摇摆不定，拜仁在第 90+8 分钟的获胜概率从 90% 下降到 2%。该图代表了当天安联球场的气氛波动。

它是如何实施的？

获胜概率使用正在进行的比赛中的事件数据（进球事件、犯规、红牌等）以及其他比赛事实（例如 xGoals）产生的数据。对于概率的实时更新，我们使用亚马逊托管流媒体卡夫卡 (Amazon MSK) 作为中央数据流和消息传递解决方案。这样，不同德甲比赛事实的事件数据、位置数据和输出可以在容器之间实时通信。

下图说明了 Win Probability 的端到端工作流程。

收集的与比赛相关的数据通过外部提供者 (DataHub) 获取。比赛的元数据在一个 AWS Lambda 功能。位置和事件数据通过 AWS 法门容器（MatchLink）。然后发布所有摄取的数据以供在各自的 MSK 主题中使用。 Win Probability Match Fact 的核心位于专用的 Fargate 容器 (BMF WinProbability) 中，该容器在相应比赛期间运行并使用通过 Amazon MSK 获得的所有必需数据。 ML 模型（实时和赛前）部署在亚马逊SageMaker 无服务器推理端点。无服务器端点自动启动计算资源并根据传入流量扩展这些计算资源，无需选择实例类型或管理扩展策略。借助这种按使用付费的模型，无服务器推理非常适合在流量激增之间具有空闲期的工作负载。当没有德甲比赛时，闲置资源是没有成本的。

在开球前不久，我们通过调用 PreMatch SageMaker 端点生成我们的初始特征集并计算赛前获胜概率。使用这些 PreMatch 概率，我们然后初始化实时模型，该模型实时响应相关的游戏内事件并不断查询以接收当前的获胜概率。

然后将计算出的概率发送回 DataHub 以提供给其他 MatchFacts 消费者。概率也被发送到 MSK 集群的一个专用主题，以供其他德甲比赛事实使用。一个 Lambda 函数使用来自各个 Kafka 主题的所有概率，并将它们写入一个亚马逊极光数据库。然后将该数据用于交互式近实时可视化，使用亚马逊QuickSight.

总结

在这篇文章中，我们展示了新的德甲比赛事实获胜概率如何显示游戏内事件对球队赢或输比赛机会的影响。为此，我们实时构建并结合先前发布的德甲比赛事实。这使评论员和球迷可以在现场比赛中发现概率波动的时刻等。

新的德甲比赛事实是德甲足球专家和 AWS 数据科学家深入分析的结果。获胜概率显示在德甲官方应用程序中相应比赛的实时代码中。在广播期间，获胜概率会通过数据故事查找器并在关键时刻以视觉方式向球迷展示，例如当失败者取得领先并且现在最有可能赢得比赛时。

我们希望您喜欢这个全新的德甲比赛实况，并希望它为您提供对比赛的新见解。要了解有关 AWS 与德甲之间合作关系的更多信息，请访问 AWS 上的德甲联赛!

我们很高兴了解您将发现哪些模式。与我们分享您的见解：推特上的@AWScloud，带有#BundesligaMatchFacts 标签。

作者简介

西蒙·罗尔夫斯 作为中场出战288场德甲比赛，打进41球，为德国国家队出场26次。目前，罗尔夫斯在拜耳 04 勒沃库森担任体育董事总经理，负责监督和发展职业球员名单、球探部门和俱乐部的青年发展。西蒙还撰写每周专栏 Bundesliga.com 关于由 AWS 提供支持的最新德甲比赛事实。在那里，他提供了他作为前球员、队长和电视分析师的专业知识，以突出高级统计和机器学习对足球世界的影响。

塔雷克·哈舍米 是 AWS 专业服务部的一名顾问。他的技能和专业领域包括应用程序开发、数据科学、机器学习和大数据。他支持客户在云中开发数据驱动的应用程序。在加入 AWS 之前，他还是航空和电信等多个行业的顾问。他热衷于帮助客户进行数据/人工智能云之旅。

哈维尔·波韦达-潘特 是 AWS 专业服务团队中 EMEA 体育客户的数据科学家。他使观众体育领域的客户能够创新并利用他们的数据，通过机器学习和数据科学提供高质量的用户和球迷体验。他在业余时间追随对广泛运动、音乐和人工智能的热情。

卢克·菲格多 是 AWS 专业服务团队的体育技术顾问。他与球员、俱乐部、联赛和媒体公司（如德甲和一级方程式）合作，帮助他们使用机器学习利用数据讲述故事。在业余时间，他喜欢学习所有关于思维以及心理学、经济学和人工智能之间的交叉点的知识。

加布里埃尔·齐尔卡 是 AWS 专业服务部的一名机器学习工程师。他与客户密切合作，以加速他们的云采用之旅。他专注于 MLOps 领域，专注于通过自动化端到端机器学习生命周期和帮助实现预期的业务成果来生产机器学习工作负载。

雅库布·米哈尔奇克 是 Sportec Solutions AG 的数据科学家。几年前，他选择了数学学习而不是踢足球，因为他得出的结论是他在后者方面不够好。现在，他通过应用机器学习方法在他的职业生涯中结合了这两种激情，以更好地了解这个美丽的游戏。在业余时间，他仍然喜欢踢七人制足球、看犯罪电影和听电影音乐。

时间戳记： 2022 年 9 月 30 日2022 年 9 月 30 日

时间戳记： 2023 年 11 月 16 日

德甲比赛事实获胜概率：使用 AWS 上的机器学习量化游戏内事件对获胜机会的影响

由柏拉图重新发布

我们如何运作？

获胜概率示例

它是如何实施的？

总结

作者简介

更多来自 AWS机器学习

使用 PyTorch Model Zoo 创建 Amazon SageMaker 模型

在 Talkdesk CX Cloud 联络中心使用 Amazon Lex 创建强大的自助服务体验

为 Amazon Textract 引入自助服务配额管理和更高的默认服务配额

使用 AWS AI 服务进行智能文档处理：第 1 部分

使用 AWS CDK 和 AWS Service Catalog 使用 Amazon SageMaker Canvas 预置和管理 ML 环境

使用 Amazon SageMaker 异构集群提高模型训练的性价比

由 Amazon SageMaker Data Wrangler 提供支持的笔记本交互式数据准备小部件

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理