הסתברות ניצחון של עובדות בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

הסתברות ניצחון של עובדות משחק בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS

בעוד עשר שנים, הכושר הטכנולוגי של מועדונים יתרום מרכזי להצלחתם. היום אנחנו כבר עדים לפוטנציאל של הטכנולוגיה לחולל מהפכה בהבנת הכדורגל. מטרות מכמת ומאפשר השוואה של פוטנציאל הבקעת השערים של כל מצב קליעה, תוך כדי x איום ו EPV מודלים מנבאים את הערך של כל רגע במשחק. בסופו של דבר, סטטיסטיקות מתקדמות אלו ואחרות משרתות מטרה אחת: לשפר את ההבנה של מי ינצח ולמה. היכנסו לעובדה החדשה של משחק הבונדסליגה: הסתברות זכייה.

במשחק השני של באיירן מול בוכום בעונה שעברה, השולחנות התהפכו במפתיע. בתחילת המשחק לבנדובסקי כובש 1:0 כבר אחרי 9 דקות. "העכבר האפור" של הליגה נזכר מיידית באסון ה-7:0 שלהם כשהתמודד מול באיירן בפעם הראשונה באותה עונה. אבל לא הפעם: כריסטופר אנטווי-אדג'י מבקיע את שערו הראשון במועדון רק 5 דקות לאחר מכן. לאחר שקלטה שער פנדל בדקה ה-38, הקבוצה ממונאקו די בוואריה נראית משותקת והעניינים החלו להתפרץ: גמבואה אגוז מוסקט קומאן ומסיים עם פקק מוחלט של שער, והולטמן מעמיד 4:1 סמוך להפסקה עם מטבל משמאל. באיירן לא ספגה כל כך הרבה שערים במחצית הראשונה מאז 1975, ובקושי הצליחה לברוח בתוצאה 4:2. מי יכול היה לנחש את זה? שתי הקבוצות שיחקו ללא השוערים הראשונים שלהן, מה שעבור באיירן פירושו החמצה של הקפטן מנואל נוייר. האם נוכחותו הייתה יכולה להציל אותם מהתוצאה הבלתי צפויה הזו?

באופן דומה, קלן הוציאה שני זינגרים יוצאי דופן בעונת 2020/2021. כשהם התמודדו מול דורטמונד, הם עברו 18 משחקים ללא ניצחון, בעוד Haaland של BVB סיפקה כיתת אמן בהבקעת שערים באותה עונה (23 ב-22 משחקים). תפקיד הפייבוריט היה ברור, ובכל זאת קלן עלתה ליתרון מוקדם עם 9 דקות בלבד על השעון. בתחילת המחצית השנייה, כבש סקחירי שער מהראשון שלו: 0:2. דורטמונד הכניעה כוח התקפי, יצרה הזדמנויות גדולות, וקבעה 1:2. מבין כל השחקנים, האלנד החמיצה יושבת 5 דקות בתוך תוספת הזמן והכתיר את קלן עם 3 הנקודות הראשונות בדורטמונד אחרי כמעט 30 שנה.

מאוחר יותר באותה עונה, קלן - כשהיא אחרונה בטבלת הבית - הפתיעה את RB לייפציג, שהייתה לה את כל המוטיבציה לסגור את באיירן מוליכת האליפות. היריבה לייפציג לחצה על ה"בילי גייטס" עם שיא עונתי של 13 זריקות לשער במחצית הראשונה, והגדילה את סיכויי הניצחון הגבוהים ממילא. למרבה האירוניה, קלן כבשה את ה-1:0 עם הבעיטה הראשונה לשער בדקה 46. לאחר שה"רד בולס" כבשו שער שוויון ראוי, הם ישנו בזריקה כעבור 80 שניות בלבד, מה שהוביל לזריקת ג'ונאס הקטור לזכות קלן. שוב. בדיוק כמו דורטמונד, לייפציג השקיעה כעת את כל האנרגיה בהתקפה, אבל הכי טוב שהיא הצליחה להשיג היה לנגוח על העמוד בהארכה.

עבור כל המשחקים הללו, מומחים וטירונים כאחד היו מנחשים בטעות את המנצח, אפילו הרבה בתוך המשחק. אבל מה הם האירועים שהובילו לתנודות המפתיעות הללו במשחק של הסתברות לניצחון? באיזו דקה הסיכוי של האנדרדוג לנצח עוקף את הפייבוריטי כשנגמר להם הזמן? בונדסליגה ו-AWS עבדו יחד כדי לחשב ולהמחיש את ההתפתחות החיה של סיכויי זכייה לאורך משחקים, מה שמאפשר לאוהדים לראות רגעי מפתח של תנודות הסתברות. התוצאה היא ה-Bundesliga Match Fact Fact: Win Probability המופעלת על ידי למידת מכונה (ML).

איך זה עובד?

ה-Bundesliga Match Fact Win Probability החדש פותח על ידי בניית מודלים של ML שניתחו למעלה מ-1,000 משחקים היסטוריים. המודל החי לוקח את ההערכות לפני המשחק ומתאים אותן בהתאם להליכי ההתאמה בהתבסס על תכונות המשפיעות על התוצאה, כולל הדברים הבאים:

  • שערים
  • עונשים
  • כרטיסים אדומים
  • החלפות
  • הזמן עבר
  • נוצרו הזדמנויות לכיבוש שערים
  • מצבי תפאורה

המודל החי מאומן באמצעות ארכיטקטורת רשת עצבית ומשתמש בגישת הפצה של Poisson כדי לחזות קצב יעדים לדקה r עבור כל צוות, כמתואר במשוואה הבאה:

ניתן לראות שיעורים אלה כהערכה של כוחו של צוות והם מחושבים באמצעות סדרה של שכבות צפופות המבוססות על התשומות. בהתבסס על שיעורים אלו וההפרש בין היריבים, ההסתברויות לניצחון ותיקו מחושבות בזמן אמת.

הקלט לדגם הוא 3-טופל של תכונות קלט, הפרש שערים נוכחי וזמן משחק שנותר בדקות.

הרכיב הראשון מבין שלושת מימדי הקלט מורכב מערך תכונות המתאר את פעולת המשחק הנוכחית בזמן אמת עבור שתי הקבוצות במדדי ביצועים. אלה כוללים ערכי xG שונים המצטברים מבוססי צוות, עם תשומת לב מיוחדת לצילומים שצולמו ב-15 הדקות האחרונות לפני התחזית. אנחנו גם מעבדים כרטיסים אדומים, פנדלים, בעיטות קרן ומספר בעיטות חופשיות מסוכנות. בעיטה חופשית מסוכנת מסווגת כבעיטה חופשית קרובה מ-25 מטר לשער היריב. במהלך פיתוח המודל, מלבד ההשפעה של ה-Bundesliga Match Fact Fact xGoals לשעבר, הערכנו גם את ההשפעה של Bundesliga Match Fact Skill במודל. המשמעות היא שהמודל מגיב להחלפת שחקנים מובילים - שחקנים עם תגים במיומנויות מסיים, יוזם או מנצח בכדור.

הסתברות ניצחון של עובדות בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

דוגמה להסתברות זכייה

בואו נסתכל על משחק מהעונה הנוכחית (2022/2023). הגרף הבא מציג את ההסתברות לניצחון במשחק באיירן מינכן ושטוטגרט מיום המשחקים השישי.

הסתברות ניצחון של עובדות בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

המודל שלפני המשחק חישב הסתברות ניצחון של 67% לבאיירן, 14% לשטוטגרט ו-19% לתיקו. כשאנחנו מסתכלים על מהלך המשחק, אנחנו רואים השפעה גדולה של שערים שהובקעו בדקות 36′, 57′ ו-60′. עד לדקה הראשונה של הארכה התוצאה הייתה 2:1 לבאיירן. רק קליעת עונשין מוצלחת של ש. גראסי בדקה 90+2 הבטיחה שוויון. לפיכך, מודל ההסתברות חי לנצח תיקן את תחזית ההגרלה מ-5% ליותר מ-90%. התוצאה היא תנופה מאוחרת בלתי צפויה, כאשר הסתברות הניצחון של באיירן ירדה מ-90% ל-8% בדקה ה-90+2. הגרף מייצג את התנופה באווירה באליאנץ ארנה באותו יום.

איך זה מיושם?

הסתברות ניצחון צורכת נתוני אירועים ממשחק מתמשך (אירועי שער, עבירות, כרטיסים אדומים ועוד) וכן נתונים המופקים על ידי עובדות משחק אחרות, כגון xGoals. עבור עדכונים בזמן אמת של הסתברויות, אנו משתמשים אמזון מנוהל הזרמת קפקא (Amazon MSK) כפתרון מרכזי להזרמת נתונים והודעות. בדרך זו, נתוני אירועים, נתוני מיקומים ותפוקות של עובדות משחק שונות בבונדסליגה ניתנים לתקשורת בין קונטיינרים בזמן אמת.

התרשים הבא ממחיש את זרימת העבודה מקצה לקצה עבור הסתברות ניצחון.

הסתברות ניצחון של עובדות בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

נתונים שנאספו הקשורים להתאמה נקלטים דרך ספק חיצוני (DataHub). מטא נתונים של ההתאמה נקלטים ומעובדים ב-an AWS למבדה פוּנקצִיָה. נתוני עמדות ואירועים נקלטים דרך an AWS פרגייט מיכל (MatchLink). כל הנתונים שנבלעו מתפרסמים לצריכה בנושאי MSK בהתאמה. לב ה-Win Probability Match Fact יושב במיכל ייעודי של Fargate (BMF WinProbability), הפועל למשך ההתאמה המתאימה וצורך את כל הנתונים הנדרשים שהושגו באמצעות Amazon MSK. דגמי ה-ML (חי וקדם-משחק) נפרסים על אמזון SageMaker נקודות קצה ללא שרת. נקודות קצה ללא שרת משיקות אוטומטית משאבי מחשוב ומדרגים את משאבי המחשוב בהתאם לתעבורה נכנסת, תוך ביטול הצורך לבחור סוגי מופעים או לנהל מדיניות קנה מידה. עם מודל תשלום לפי שימוש זה, Inference ללא Server אידיאלי לעומסי עבודה שיש להם תקופות סרק בין פרצי תנועה. כשאין משחקי בונדסליגה, אין עלות למשאבים סרק.

זמן קצר לפני הפתיחה, אנו יוצרים את קבוצת התכונות הראשונית שלנו ומחשבים את ההסתברויות לניצחון לפני המשחק על ידי קריאה לנקודת הסיום של PreMatch SageMaker. עם ההסתברויות הללו של PreMatch, לאחר מכן אנו מאתחלים את המודל החי, שמגיב בזמן אמת לאירועים רלוונטיים במשחק ונשאל ללא הרף כדי לקבל הסתברויות זכיות נוכחיות.

ההסתברויות המחושבות נשלחות בחזרה ל-DataHub כדי שיסופקו לצרכני MatchFacts אחרים. הסתברויות נשלחות גם לאשכול MSK לנושא ייעודי, שייצרכו על ידי עובדות משחק אחרות בבונדסליגה. פונקציית למבדה צורכת את כל ההסתברויות מהנושא המתאים של קפקא, וכותבת אותן ל-an אמזון אורורה מאגר מידע. נתונים אלה משמשים לאחר מכן עבור הדמיות אינטראקטיביות כמעט בזמן אמת באמצעות אמזון קוויקסייט.

הסתברות ניצחון של עובדות בבונדסליגה: כימת ההשפעה של אירועים במשחק על סיכויי הזכייה באמצעות למידת מכונה ב-AWS PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

<br> סיכום

בפוסט זה, הדגמנו כיצד ההסתברות החדשה לעובדות ניצחון במשחק בונדסליגה מראה את ההשפעה של אירועים במשחק על הסיכויים של קבוצה לנצח או להפסיד במשחק. כדי לעשות זאת, אנו מתבססים ומשלבים את עובדות המשחק בבונדסליגה שפורסמו בעבר בזמן אמת. זה מאפשר לפרשנים ולמעריצים לחשוף רגעים של תנודות הסתברות ועוד במהלך משחקים חיים.

עובדת הבונדסליגה החדשה היא תוצאה של ניתוח מעמיק על ידי מומחי הכדורגל של הבונדסליגה ומדעני הנתונים של AWS. הסתברויות הזכייה מוצגות בטוקר החי של המשחקים המתאימים באפליקציית הבונדסליגה הרשמית. במהלך שידור, ניתנות הסתברויות זכייה לפרשנים דרך ה- מאתר סיפורי נתונים ומוצג חזותי לאוהדים ברגעי מפתח, כמו כאשר האנדרדוג לוקח את ההובלה וכעת יש סיכוי גבוה יותר לנצח במשחק.

אנו מקווים שתיהנו מעובדת הבונדסליגה החדשה הזו ושהיא מספקת לכם תובנות חדשות על המשחק. למידע נוסף על השותפות בין AWS לבונדסליגה, בקר בונדסליגה ב-AWS!

אנו נרגשים ללמוד אילו דפוסים תחשוף. שתף אותנו בתובנות שלך: @AWScloud בטוויטר, עם ההאשטאג #BundesligaMatchFacts.


על הכותבים

סיימון רולפס שיחק 288 משחקי בונדסליגה כקשר מרכזי, כבש 41 שערים וזכה ב-26 משחקים עבור גרמניה. נכון לעכשיו, רולפס משמש כמנהל ספורט בבאייר 04 לברקוזן, שם הוא מפקח ומפתח את סגל השחקנים המקצוענים, מחלקת הסקאוטינג ופיתוח הנוער של המועדון. סיימון גם כותב טורים שבועיים בנושא Bundesliga.com על העובדות העדכניות ביותר של משחקי הבונדסליגה המופעלת על ידי AWS. שם הוא מציע את המומחיות שלו כשחקן לשעבר, קפטן ואנליסט טלוויזיה כדי להדגיש את ההשפעה של סטטיסטיקה מתקדמת ולמידת מכונה על עולם הכדורגל.

טארק הסכימי הוא יועץ בשירותים מקצועיים של AWS. הכישורים ותחומי ההתמחות שלו כוללים פיתוח יישומים, מדעי נתונים, למידת מכונה וביג דאטה. הוא תומך בלקוחות בפיתוח אפליקציות מונעות נתונים בתוך הענן. לפני שהצטרף ל-AWS, הוא היה גם יועץ בתעשיות שונות כמו תעופה וטלקומוניקציה. הוא נלהב לאפשר ללקוחות במסע הנתונים/AI שלהם לענן.

חאבייר פובדה-פנטר הוא מדען נתונים עבור לקוחות ספורט EMEA בצוות השירותים המקצועיים של AWS. הוא מאפשר ללקוחות בתחום ספורט הצופים לחדש ולהפיק תועלת מהנתונים שלהם, לספק חוויות משתמש ואוהדים באיכות גבוהה באמצעות למידת מכונה ומדעי הנתונים. הוא עוקב אחר התשוקה שלו למגוון רחב של ספורט, מוזיקה ובינה מלאכותית בזמנו הפנוי.

לוק פיגור הוא יועץ טכנולוגיות ספורט בצוות השירותים המקצועיים של AWS. הוא עובד עם שחקנים, מועדונים, ליגות וחברות מדיה כמו הבונדסליגה ופורמולה 1 כדי לעזור להם לספר סיפורים עם נתונים באמצעות למידת מכונה. בזמנו הפנוי, הוא אוהב ללמוד הכל על המוח ועל המפגש בין פסיכולוגיה, כלכלה ובינה מלאכותית.

גבריאל זילקה הוא מהנדס למידת מכונה בשירותים מקצועיים של AWS. הוא עובד בשיתוף פעולה הדוק עם לקוחות כדי להאיץ את מסע האימוץ שלהם בענן. מתמחה בתחום MLOps, הוא מתמקד בייצור עומסי עבודה של למידת מכונה על ידי אוטומציה של מחזורי חיים של למידת מכונה מקצה לקצה וסיוע בהשגת תוצאות עסקיות רצויות.

יעקב מיכלצ'יק הוא מדען נתונים ב- Sportec Solutions AG. לפני מספר שנים, הוא בחר בלימודי מתמטיקה על פני משחק כדורגל, מכיוון שהגיע למסקנה שהוא לא מספיק טוב באחרונים. כעת הוא משלב את שתי התשוקות הללו בקריירה המקצועית שלו על ידי יישום שיטות למידת מכונה כדי לקבל תובנה טובה יותר על המשחק היפה הזה. בזמנו הפנוי, הוא עדיין נהנה לשחק כדורגל של שבעה צדדים, לצפות בסרטי פשע ולהאזין למוזיקה קולנועית.

בול זמן:

עוד מ למידת מכונות AWS