Xác suất thắng trận đấu Bundesliga: Định lượng tác động của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Xác suất thắng trận đấu Bundesliga: Định lượng ảnh hưởng của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS

Mười năm kể từ bây giờ, công nghệ thể dục của các câu lạc bộ sẽ là yếu tố đóng góp quan trọng vào thành công của họ. Hôm nay chúng ta đã chứng kiến ​​tiềm năng của công nghệ để cách mạng hóa sự hiểu biết về bóng đá. xMục tiêu định lượng và cho phép so sánh khả năng ghi bàn của bất kỳ tình huống quay nào, trong khi xMối đe dọaEPV mô hình dự đoán giá trị của bất kỳ thời điểm nào trong trò chơi. Cuối cùng, những thống kê này và các số liệu thống kê nâng cao khác phục vụ một mục đích: nâng cao hiểu biết về ai sẽ thắng và tại sao. Nhập thông tin trận đấu Bundesliga mới: Xác suất chiến thắng.

Trong trận đấu thứ hai của Bayern với Bochum mùa trước, cục diện đã bất ngờ thay đổi. Đầu trận, Lewandowski ghi tỷ số 1: 0 chỉ sau 9 phút. “Chuột xám” của giải đấu ngay lập tức được nhắc nhở về thảm họa 7: 0 của họ khi đối đầu với Bayern lần đầu tiên trong mùa giải đó. Nhưng không phải lần này: Christopher Antwi-Adjei ghi bàn thắng đầu tiên cho câu lạc bộ chỉ 5 phút sau đó. Sau khi nhận bàn thua ở phút 38, đội bóng đến từ Monaco di Bavaria dường như tê liệt và mọi thứ bắt đầu nổ ra: Gamboa nhục đậu khấu Coman và kết thúc bằng một cú sút tuyệt đối của một mục tiêu, và Holtmann làm cho tỷ số 4: 1 gần đến giờ nghỉ giải lao bằng một cái gáo. từ bên trái. Bayern đã không ghi được nhiều bàn thắng như vậy trong hiệp một kể từ năm 1975 và gần như không thể ra về với kết quả 4: 2. Ai có thể đoán được điều đó? Cả hai đội đều chơi mà không có thủ môn đầu tiên của họ, điều đó đối với Bayern đồng nghĩa với việc thiếu vắng đội trưởng Manuel Neuer. Phải chăng sự hiện diện của anh đã cứu họ khỏi kết quả bất ngờ này?

Tương tự, Cologne đã có hai lần lập công bất thường trong mùa giải 2020/2021. Khi đối đầu với Dortmund, họ đã trải qua 18 trận không thắng, trong khi Haaland của BVB đang cung cấp một đẳng cấp về khả năng ghi bàn ở mùa giải đó (23 trong 22 trận). Vai trò của đội được yêu thích đã rõ ràng, nhưng Cologne đã sớm dẫn trước khi chỉ còn 9 phút. Vào đầu hiệp hai, Skhiri đã ghi bàn thắng sao chép bằng tỷ số đầu tiên của anh ấy: 0: 2. Dortmund lấn át sức mạnh tấn công, tạo ra những cơ hội lớn và ghi bàn với tỷ số 1: 2. Trong tất cả các cầu thủ, Haaland đã bỏ lỡ 5 phút bù giờ trong hiệp phụ và đăng quang Cologne với 3 điểm đầu tiên trên sân của Dortmund sau gần 30 năm.

Cuối mùa giải đó, Cologne - đứng cuối cùng trong bảng trên sân nhà - đã gây bất ngờ cho RB Leipzig, người có tất cả động lực để áp sát đội dẫn đầu chức vô địch Bayern. Đối thủ Leipzig đã gây sức ép với “Những chú dê Billy” với kỷ lục 13 cú sút trúng đích trong hiệp một của đội bóng này, làm tăng khả năng giành chiến thắng vốn đã rất cao của họ. Trớ trêu thay, Cologne đã ghi bàn thắng ở tỷ số 1: 0 với cú sút đầu tiên ở phút 46. Sau khi “Red Bulls” ghi bàn gỡ hòa xứng đáng, họ đã ngủ quên trên quả ném biên chỉ 80 giây sau đó, dẫn đến việc Jonas Hector ghi bàn cho Cologne. lại. Cũng giống như Dortmund, Leipzig hiện đang dồn toàn lực tấn công, nhưng thành tích tốt nhất mà họ có được là sút trúng cột dọc trong hiệp phụ.

Đối với tất cả các trận đấu này, các chuyên gia cũng như người mới có thể đoán sai người chiến thắng, thậm chí là rất tốt trong trận đấu. Nhưng những sự kiện nào dẫn đến sự thay đổi xác suất chiến thắng trong trò chơi đáng ngạc nhiên này? Cơ hội giành chiến thắng của đội cửa dưới vượt qua đội được yêu thích ở phút nào khi họ hết thời gian? Bundesliga và AWS đã làm việc cùng nhau để tính toán và minh họa sự phát triển trực tiếp của các cơ hội chiến thắng trong suốt các trận đấu, cho phép người hâm mộ xem những khoảnh khắc chính của sự thay đổi xác suất. Kết quả là sự kiện trận đấu Bundesliga có sức mạnh mới (ML) được hỗ trợ: Xác suất chiến thắng.

Học như thế nào?

Xác suất thắng trận đấu Bundesliga mới được phát triển bằng cách xây dựng các mô hình ML phân tích hơn 1,000 trận đấu lịch sử. Mô hình trực tiếp lấy các ước tính trước trận đấu và điều chỉnh chúng theo diễn biến trận đấu dựa trên các đặc điểm ảnh hưởng đến kết quả, bao gồm:

  • Các mục tiêu
  • Hình phạt
  • Thẻ đỏ
  • Thay thế
  • Thời gian trôi qua
  • Cơ hội ghi bàn được tạo ra
  • Tình huống thiết lập

Mô hình trực tiếp được đào tạo bằng cách sử dụng kiến ​​trúc mạng thần kinh và sử dụng aplproach phân phối Poisson để dự đoán tỷ lệ mục tiêu mỗi phút r cho mỗi đội, như được mô tả trong phương trình sau:

Những tỷ lệ đó có thể được xem như một ước tính sức mạnh của một nhóm và được tính toán bằng cách sử dụng một loạt các lớp dày đặc dựa trên các yếu tố đầu vào. Dựa trên các tỷ lệ này và chênh lệch giữa các đối thủ, xác suất thắng và hòa được tính theo thời gian thực.

Đầu vào cho mô hình là 3 bộ tính năng đầu vào, hiệu số bàn thắng bại hiện tại và thời gian chơi còn lại tính bằng phút.

Thành phần đầu tiên của ba thứ nguyên đầu vào bao gồm một tập hợp tính năng mô tả hành động trò chơi hiện tại trong thời gian thực cho cả hai đội về chỉ số hiệu suất. Chúng bao gồm các giá trị xG tổng hợp dựa trên nhóm khác nhau, đặc biệt chú ý đến các ảnh được chụp trong 15 phút cuối cùng trước khi dự đoán. Chúng tôi cũng xử lý thẻ đỏ, phạt đền, phạt góc, và số lượng các quả đá phạt nguy hiểm. Đá phạt nguy hiểm được xếp vào loại đá phạt gần khung thành đối phương hơn 25m. Trong quá trình phát triển mô hình, bên cạnh ảnh hưởng của x Mục tiêu trận đấu Bundesliga trước đây, chúng tôi cũng đánh giá tác động của Kỹ năng xác định thông tin trận đấu Bundesliga trong mô hình. Điều này có nghĩa là mô hình phản ứng với việc thay thế những người chơi hàng đầu — những người chơi có huy hiệu ở các kỹ năng Người hoàn thiện, Người khởi xướng hoặc Người chiến thắng bóng.

Xác suất thắng trận đấu Bundesliga: Định lượng tác động của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Ví dụ về xác suất chiến thắng

Hãy cùng nhìn lại một trận đấu ở mùa giải hiện tại (2022/2023). Biểu đồ sau đây cho thấy xác suất thắng của trận đấu giữa Bayern Munich và Stuttgart từ ngày 6.

Xác suất thắng trận đấu Bundesliga: Định lượng tác động của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Mô hình trước trận đấu đã tính toán xác suất giành chiến thắng là 67% cho Bayern, 14% cho Stuttgart và 19% cho một trận hòa. Khi nhìn vào diễn biến trận đấu, chúng ta thấy tác động lớn của các bàn thắng được ghi ở các phút 36 ', 57' và 60 '. Cho đến phút bù giờ đầu tiên, tỷ số là 2: 1 cho Bayern. Chỉ có cú sút phạt đền thành công của S. Grassy ở phút 90 + 2 mới bảo toàn được tỷ số hòa. Do đó, Mô hình Trực tiếp Xác suất Chiến thắng đã điều chỉnh dự báo hòa từ 5% lên hơn 90%. Kết quả là một cú xoay người bất ngờ vào cuối trận, với xác suất thắng của Bayern giảm từ 90% xuống 8% ở phút 90 + 2. Biểu đồ đại diện cho sự dao động trong bầu không khí ở Allianz Arena vào ngày hôm đó.

Nó được thực hiện như thế nào?

Xác suất chiến thắng sử dụng dữ liệu sự kiện từ một trận đấu đang diễn ra (sự kiện bàn thắng, phạm lỗi, thẻ đỏ, v.v.) cũng như dữ liệu được tạo ra bởi Dữ kiện trận đấu khác, chẳng hạn như x Mục tiêu. Để cập nhật theo thời gian thực các xác suất, chúng tôi sử dụng Kafka phát trực tuyến được quản lý trên Amazon (Amazon MSK) như một giải pháp nhắn tin và truyền dữ liệu trung tâm. Bằng cách này, dữ liệu sự kiện, dữ liệu vị trí và kết quả của các trận đấu Bundesliga khác nhau có thể được giao tiếp giữa các vùng chứa trong thời gian thực.

Sơ đồ sau đây minh họa quy trình làm việc end-to-end cho Xác suất Giành chiến thắng.

Xác suất thắng trận đấu Bundesliga: Định lượng tác động của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Dữ liệu liên quan đến đối sánh đã thu thập được nhập thông qua nhà cung cấp bên ngoài (DataHub). Siêu dữ liệu của trận đấu được nhập và xử lý trong AWS Lambda hàm số. Dữ liệu vị trí và sự kiện được nhập thông qua Cổng xa AWS vùng chứa (MatchLink). Tất cả dữ liệu được nhập sau đó sẽ được xuất bản để sử dụng trong các chủ đề MSK tương ứng. Trọng tâm của Sự kiện Đối sánh Xác suất Giành chiến thắng nằm trong một vùng chứa Fargate chuyên dụng (BMF WinProbability), chạy trong suốt thời gian của trận đấu tương ứng và sử dụng tất cả dữ liệu cần thiết thu được thông qua Amazon MSK. Các mô hình ML (trực tiếp và trước trận đấu) được triển khai trên Amazon SageMaker Điểm cuối suy luận không máy chủ. Các điểm cuối serverless tự động khởi chạy các tài nguyên tính toán và chia tỷ lệ các tài nguyên tính toán đó tùy thuộc vào lưu lượng truy cập đến, loại bỏ sự cần thiết phải chọn các loại phiên bản hoặc quản lý các chính sách mở rộng quy mô. Với mô hình trả cho mỗi lần sử dụng này, Serverless Inference là lý tưởng cho các khối lượng công việc có thời gian nhàn rỗi giữa các lần lưu lượng truy cập. Khi không có các trận đấu Bundesliga, không có chi phí cho các nguồn tài nguyên nhàn rỗi.

Ngay trước khi bắt đầu, chúng tôi tạo bộ tính năng ban đầu và tính toán xác suất thắng trước trận đấu bằng cách gọi điểm cuối PreMatch SageMaker. Với các xác suất PreMatch đó, sau đó chúng tôi khởi tạo mô hình trực tiếp, mô hình này phản ứng trong thời gian thực với các sự kiện trong trò chơi có liên quan và liên tục được truy vấn để nhận các xác suất thắng hiện tại.

Sau đó, các xác suất được tính toán sẽ được gửi trở lại DataHub để cung cấp cho những người tiêu dùng MatchFacts khác. Xác suất cũng được gửi đến cụm MSK theo một chủ đề dành riêng, sẽ được đưa vào các Sự kiện trận đấu Bundesliga khác. Một hàm Lambda sử dụng tất cả các xác suất từ ​​chủ đề Kafka tương ứng và ghi chúng vào một Amazon cực quang cơ sở dữ liệu. Dữ liệu này sau đó được sử dụng cho các hình ảnh tương tác gần thời gian thực bằng cách sử dụng Amazon QuickSight.

Xác suất thắng trận đấu Bundesliga: Định lượng tác động của các sự kiện trong trò chơi đến cơ hội chiến thắng bằng cách sử dụng máy học trên AWS PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Tổng kết

Trong bài đăng này, chúng tôi đã trình bày cách Xác suất thắng trận đấu Bundesliga mới cho thấy tác động của các sự kiện trong trò chơi đến khả năng một đội thắng hoặc thua một trận đấu. Để làm như vậy, chúng tôi xây dựng và kết hợp các Dữ kiện trận đấu Bundesliga đã được công bố trước đó trong thời gian thực. Điều này cho phép các bình luận viên và người hâm mộ phát hiện ra những khoảnh khắc về xác suất và hơn thế nữa trong các trận đấu trực tiếp.

Thông tin trận đấu mới của Bundesliga là kết quả phân tích chuyên sâu của các chuyên gia bóng đá Bundesliga và các nhà khoa học dữ liệu AWS. Xác suất chiến thắng được hiển thị trong biểu ngữ trực tiếp của các trận đấu tương ứng trong ứng dụng Bundesliga chính thức. Trong một chương trình phát sóng, xác suất chiến thắng được cung cấp cho các bình luận viên thông qua công cụ tìm câu chuyện dữ liệu và hiển thị trực quan cho người hâm mộ vào những thời điểm quan trọng, chẳng hạn như khi đội cửa dưới dẫn trước và bây giờ có nhiều khả năng giành chiến thắng trong trò chơi.

Chúng tôi hy vọng rằng bạn thích sự kiện trận đấu Bundesliga hoàn toàn mới này và nó cung cấp cho bạn những hiểu biết mới về trò chơi. Để tìm hiểu thêm về quan hệ đối tác giữa AWS và Bundesliga, hãy truy cập Bundesliga trên AWS!

Chúng tôi rất vui khi biết bạn sẽ khám phá ra những mẫu nào. Chia sẻ những hiểu biết của bạn với chúng tôi: @AWScloud trên Twitter, với thẻ bắt đầu bằng # #BundesligaMatchFacts.


Về các tác giả

Simon Rolfes đã chơi 288 trận tại Bundesliga ở vị trí tiền vệ trung tâm, ghi 41 bàn thắng và 26 lần khoác áo đội tuyển Đức. Hiện tại, Rolfes đảm nhiệm vai trò Giám đốc điều hành Sport tại Bayer 04 Leverkusen, nơi ông giám sát và phát triển đội hình cầu thủ chuyên nghiệp, bộ phận tuyển trạch và phát triển đội trẻ của câu lạc bộ. Simon cũng viết các cột hàng tuần về Bundesliga.com về Thông tin trận đấu Bundesliga mới nhất do AWS cung cấp. Ở đó, anh ấy đưa ra kiến ​​thức chuyên môn của mình với tư cách là một cựu cầu thủ, đội trưởng và nhà phân tích truyền hình để làm nổi bật tác động của số liệu thống kê tiên tiến và công nghệ máy học đối với thế giới bóng đá.

Tareq Haschemi là nhà tư vấn trong Dịch vụ Chuyên nghiệp của AWS. Các kỹ năng và lĩnh vực chuyên môn của anh ấy bao gồm phát triển ứng dụng, khoa học dữ liệu, máy học và dữ liệu lớn. Anh ấy hỗ trợ khách hàng phát triển các ứng dụng theo hướng dữ liệu trong đám mây. Trước khi gia nhập AWS, ông cũng là nhà tư vấn trong nhiều ngành khác nhau như hàng không và viễn thông. Anh ấy rất đam mê hỗ trợ khách hàng trong hành trình dữ liệu / AI của họ lên đám mây.

Javier Poveda-Panter là Nhà khoa học dữ liệu cho khách hàng thể thao EMEA trong nhóm Dịch vụ Chuyên nghiệp của AWS. Anh ấy cho phép khách hàng trong lĩnh vực thể thao khán giả đổi mới và tận dụng dữ liệu của họ, mang lại trải nghiệm chất lượng cao cho người dùng và người hâm mộ thông qua máy học và khoa học dữ liệu. Anh ấy theo đuổi niềm đam mê của mình với một loạt các môn thể thao, âm nhạc và AI trong thời gian rảnh rỗi.

Luuk Figdor là Cố vấn Công nghệ Thể thao trong nhóm Dịch vụ Chuyên nghiệp của AWS. Anh ấy làm việc với các cầu thủ, câu lạc bộ, giải đấu và các công ty truyền thông như Bundesliga và Công thức 1 để giúp họ kể những câu chuyện bằng dữ liệu bằng máy học. Khi rảnh rỗi, anh ấy thích tìm hiểu tất cả về tâm trí và sự giao thoa giữa tâm lý học, kinh tế học và AI.

Gabriel Zylka là Kỹ sư Máy học trong Dịch vụ Chuyên nghiệp của AWS. Anh ấy hợp tác chặt chẽ với khách hàng để đẩy nhanh hành trình sử dụng đám mây của họ. Chuyên về lĩnh vực MLOps, ông tập trung vào việc sản xuất khối lượng công việc học máy bằng cách tự động hóa các vòng đời học máy từ đầu đến cuối và giúp đạt được kết quả kinh doanh mong muốn.

Jakub Michalczyk là Nhà khoa học dữ liệu tại Sportec Solutions AG. Vài năm trước, anh ấy chọn môn toán học thay vì chơi bóng đá, vì anh ấy đã đi đến kết luận rằng anh ấy không đủ giỏi môn toán sau này. Giờ đây, anh ấy kết hợp cả hai niềm đam mê này trong sự nghiệp chuyên nghiệp của mình bằng cách áp dụng các phương pháp học máy để có cái nhìn sâu sắc hơn về trò chơi tuyệt đẹp này. Khi rảnh rỗi, anh ấy vẫn thích chơi bóng bảy người, xem phim tội phạm và nghe nhạc phim.

Dấu thời gian:

Thêm từ Học máy AWS