बुंडेसलीगा मैच फैक्ट विन प्रोबेबिलिटी: एडब्ल्यूएस पर मशीन लर्निंग का उपयोग करके जीतने की संभावना पर इन-गेम इवेंट्स के प्रभाव को बढ़ाता है

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

अब से दस साल बाद, क्लबों की तकनीकी फिटनेस उनकी सफलता में महत्वपूर्ण योगदान देगी। आज हम पहले से ही फुटबॉल की समझ में क्रांति लाने के लिए प्रौद्योगिकी की क्षमता देख रहे हैं। XGoals किसी भी शूटिंग स्थिति की लक्ष्य स्कोरिंग क्षमता की मात्रा निर्धारित करता है और तुलना करने की अनुमति देता है, जबकि xखतरा और ईपीवी मॉडल किसी भी इन-गेम पल के मूल्य की भविष्यवाणी करते हैं। अंततः, ये और अन्य उन्नत आँकड़े एक उद्देश्य की पूर्ति करते हैं: कौन जीतेगा और क्यों की समझ में सुधार करना। नया बुंडेसलीगा मैच तथ्य दर्ज करें: जीत की संभावना।

पिछले सीज़न में बोचम के खिलाफ बेयर्न के दूसरे मैच में, तालिकाएँ अप्रत्याशित रूप से बदल गईं। मैच की शुरुआत में, लेवांडोव्स्की ने केवल 1 मिनट के बाद 0:9 का स्कोर बनाया। लीग के "ग्रे माउस" को उस सीजन में पहली बार बायर्न का सामना करने पर तुरंत उनकी 7:0 आपदा की याद दिला दी जाती है। लेकिन इस बार नहीं: क्रिस्टोफर एंटवी-अद्जेई ने क्लब के लिए अपना पहला गोल सिर्फ 5 मिनट बाद किया। 38वें मिनट में पेनल्टी गोल करने के बाद, मोनाको डि बवेरिया की टीम लकवाग्रस्त लगती है और चीजें फूटने लगीं: गैम्बो जायफल कोमन और एक गोल के एक पूर्ण कॉर्कर के साथ समाप्त होता है, और होल्टमैन इसे 4: 1 को डिपर के साथ हाफटाइम के करीब बनाता है बाएं से। बायर्न ने 1975 के बाद से पहली छमाही में इतने लक्ष्यों की कल्पना नहीं की थी, और मुश्किल से 4:2 के परिणाम के साथ चल पाया था। इसका अनुमान कौन लगा सकता था? दोनों टीमें अपने पहले कीपर के बिना खेली, जिसका मतलब बायर्न के लिए अपने कप्तान मैनुअल नेउर से चूकना था। क्या उनकी उपस्थिति उन्हें इस अप्रत्याशित परिणाम से बचा सकती थी?

इसी तरह, कोलोन ने 2020/2021 सीज़न में दो असाधारण ज़िंगर्स निकाले। जब उन्होंने डॉर्टमुंड का सामना किया, तो वे बिना जीत के 18 मैच खेल चुके थे, जबकि बीवीबी का हैलैंड उस सीजन (23 मैचों में 22) गोल करने में एक मास्टर क्लास प्रदान कर रहा था। पसंदीदा की भूमिका स्पष्ट थी, फिर भी कोलोन ने घड़ी में केवल 9 मिनट के साथ शुरुआती बढ़त ले ली। दूसरे हाफ की शुरुआत में, स्कीरी ने अपने पहले गोल का कार्बन-कॉपी गोल किया: 0:2। डॉर्टमुंड ने आक्रमण की ताकत को कम किया, बड़े मौके बनाए और 1:2 स्कोर किया। सभी खिलाड़ियों में से, हैलैंड ने अतिरिक्त समय में 5 मिनट का समय गंवा दिया और लगभग 3 वर्षों के बाद डॉर्टमुंड में पहले 30 अंकों के साथ कोलोन का ताज पहनाया।

बाद में उस सीज़न में, कोलोन-होम-टेबल में अंतिम-आश्चर्यचकित आरबी लीपज़िग, जिनके पास चैंपियनशिप लीडर बायर्न को बंद करने की सभी प्रेरणा थी। प्रतिद्वंद्वी लीपज़िग ने "बिली गोट्स" पर पहले हाफ में गोल पर 13 शॉट्स के टीम सीज़न रिकॉर्ड के साथ दबाव डाला, जिससे उनकी जीत की पहले से ही उच्च संभावना बढ़ गई। विडंबना यह है कि कोलोन ने मिनट 1 में पहले शॉट के साथ 0:46 का स्कोर बनाया। "रेड बुल" ने एक अच्छी तरह से योग्य बराबरी करने के बाद, वे केवल 80 सेकंड बाद थ्रो-इन पर सो गए, जिससे जोनास हेक्टर कोलोन के लिए स्कोरिंग हो गया। फिर से। डॉर्टमुंड की तरह, लीपज़िग ने अब सारी ऊर्जा को अपराध में डाल दिया, लेकिन वे जो सबसे अच्छा हासिल करने में कामयाब रहे, वह था ओवरटाइम में पद को मारना।

इन सभी मैचों के लिए, विशेषज्ञों और नौसिखियों ने समान रूप से विजेता का गलत अनुमान लगाया होगा, यहां तक कि मैच में भी। लेकिन ऐसी कौन सी घटनाएँ हैं जिनके कारण जीत की संभावना के इन आश्चर्यजनक इन-गेम झूलों का कारण बना? समय समाप्त होने पर दलित व्यक्ति के जीतने की संभावना ने पसंदीदा से आगे निकलने का मौका किस मिनट में प्राप्त किया? बुंडेसलीगा और एडब्ल्यूएस ने पूरे मैच में जीतने के अवसरों के जीवंत विकास की गणना और चित्रण करने के लिए एक साथ काम किया है, जिससे प्रशंसकों को प्रायिकता झूलों के महत्वपूर्ण क्षणों को देखने में मदद मिलती है। नतीजा नई मशीन लर्निंग (एमएल)-संचालित बुंडेसलिगा मैच फैक्ट: विन प्रोबेबिलिटी है।

यह कैसे काम करता है?

नई बुंडेसलीगा मैच फैक्ट विन प्रोबेबिलिटी को एमएल मॉडल बनाकर विकसित किया गया था, जिसमें 1,000 से अधिक ऐतिहासिक खेलों का विश्लेषण किया गया था। लाइव मॉडल प्री-मैच अनुमान लेता है और परिणाम को प्रभावित करने वाली विशेषताओं के आधार पर मैच की कार्यवाही के अनुसार उन्हें समायोजित करता है, जिसमें निम्न शामिल हैं:

लक्ष्यों
दंड
लाल कार्ड
प्रतिस्थापन
वक्त निकल गया
गोल करने के मौके बने
सेट-पीस स्थितियां

लाइव मॉडल को तंत्रिका नेटवर्क आर्किटेक्चर का उपयोग करके प्रशिक्षित किया जाता है और लक्ष्य-प्रति-मिनट-दर की भविष्यवाणी करने के लिए पॉइसन वितरण दृष्टिकोण का उपयोग करता है r प्रत्येक टीम के लिए, जैसा कि निम्नलिखित समीकरण में वर्णित है:

उन दरों को एक टीम की ताकत के अनुमान के रूप में देखा जा सकता है और इनपुट के आधार पर घनी परतों की एक श्रृंखला का उपयोग करके गणना की जाती है। इन दरों और विरोधियों के बीच के अंतर के आधार पर, वास्तविक समय में जीत और ड्रॉ की संभावनाओं की गणना की जाती है।

मॉडल में इनपुट इनपुट सुविधाओं का एक 3-टुपल, वर्तमान लक्ष्य अंतर और मिनटों में शेष प्लेटाइम है।

तीन इनपुट आयामों के पहले घटक में एक फीचर सेट होता है जो प्रदर्शन मेट्रिक्स में दोनों टीमों के लिए वास्तविक समय में वर्तमान गेम एक्शन का वर्णन करता है। इनमें विभिन्न एकत्रित टीम-आधारित xG मान शामिल हैं, विशेष रूप से भविष्यवाणी से पहले अंतिम 15 मिनट में लिए गए शॉट्स पर। हम रेड कार्ड, पेनल्टी, कॉर्नर किक और खतरनाक फ्री किक की संख्या भी प्रोसेस करते हैं। एक खतरनाक फ्री किक को प्रतिद्वंद्वी के लक्ष्य से 25 मीटर के करीब फ्री किक के रूप में वर्गीकृत किया जाता है। मॉडल के विकास के दौरान, पूर्व बुंडेसलीगा मैच फैक्ट xGoals के प्रभाव के अलावा, हमने मॉडल में बुंडेसलीगा मैच फैक्ट स्किल के प्रभाव का भी मूल्यांकन किया। इसका मतलब यह है कि मॉडल शीर्ष खिलाड़ियों के प्रतिस्थापन पर प्रतिक्रिया करता है - कौशल फिनिशर, आरंभकर्ता, या बॉल विजेता में बैज वाले खिलाड़ी।

विन प्रायिकता उदाहरण

आइए मौजूदा सीजन (2022/2023) के एक मैच पर नजर डालते हैं। निम्नलिखित ग्राफ मैच के दिन से बायर्न म्यूनिख और स्टटगार्ट मैच के लिए जीत की संभावना को दर्शाता है।

प्री-मैच मॉडल ने बायर्न के लिए 67%, स्टटगार्ट के लिए 14% और ड्रॉ के लिए 19% की जीत की संभावना की गणना की। जब हम मैच के दौरान देखते हैं, तो हम 36′, 57′ और 60′ मिनट में बनाए गए गोलों का एक बड़ा प्रभाव देखते हैं। ओवरटाइम के पहले मिनट तक बायर्न के लिए स्कोर 2:1 था। 90+2 मिनट में एस. ग्रासी द्वारा केवल एक सफल पेनल्टी शॉट ने ड्रॉ हासिल किया। इसलिए विन प्रोबेबिलिटी लाइव मॉडल ने ड्रॉ के पूर्वानुमान को 5% से 90% से अधिक कर दिया। परिणाम एक अप्रत्याशित देर से स्विंग है, जिसमें बायर्न की जीत की संभावना 90+8 मिनट में 90% से घटकर 2% हो गई है। ग्राफ उस दिन एलियांज एरिना में वातावरण में झूले का प्रतिनिधि है।

इसे कैसे लागू किया जाता है?

Win Probability चल रहे मैच (गोल इवेंट, फ़ाउल, रेड कार्ड, और बहुत कुछ) से इवेंट डेटा के साथ-साथ अन्य मैच फैक्ट्स, जैसे xGoals द्वारा उत्पादित डेटा का उपभोग करती है। संभावनाओं के रीयल-टाइम अपडेट के लिए, हम उपयोग करते हैं अमेज़न प्रबंधित स्ट्रीमिंग काफ्का (अमेज़ॅन एमएसके) एक केंद्रीय डेटा स्ट्रीमिंग और मैसेजिंग समाधान के रूप में। इस तरह, घटना डेटा, स्थिति डेटा, और विभिन्न बुंडेसलीगा मिलान तथ्यों के आउटपुट को वास्तविक समय में कंटेनरों के बीच संप्रेषित किया जा सकता है।

निम्न आरेख विन प्रोबेबिलिटी के लिए एंड-टू-एंड वर्कफ़्लो दिखाता है।

एकत्रित मिलान-संबंधी डेटा एक बाहरी प्रदाता (DataHub) के माध्यम से प्राप्त किया जाता है। मैच का मेटाडेटा एक में डाला और संसाधित किया जाता है AWS लाम्बा समारोह। स्थिति और ईवेंट डेटा एक . के माध्यम से अंतर्ग्रहण किया जाता है AWS फरगेट कंटेनर (मैचलिंक)। सभी अंतर्ग्रहीत डेटा को संबंधित एमएसके विषयों में उपभोग के लिए प्रकाशित किया जाता है। विन प्रोबेबिलिटी मैच फैक्ट का दिल एक समर्पित फारगेट कंटेनर (बीएमएफ विनप्रोबेबिलिटी) में बैठता है, जो संबंधित मैच की अवधि के लिए चलता है और अमेज़ॅन एमएसके से प्राप्त सभी आवश्यक डेटा का उपभोग करता है। एमएल मॉडल (लाइव और प्री-मैच) पर तैनात हैं अमेज़न SageMaker सर्वर रहित अनुमान समापन बिंदु। सर्वर रहित समापन बिंदु स्वचालित रूप से गणना संसाधनों को लॉन्च करते हैं और आने वाले ट्रैफ़िक के आधार पर उन गणना संसाधनों को मापते हैं, उदाहरण प्रकार चुनने या स्केलिंग नीतियों को प्रबंधित करने की आवश्यकता को समाप्त करते हैं। इस भुगतान-प्रति-उपयोग मॉडल के साथ, सर्वर रहित अनुमान उन कार्यभार के लिए आदर्श है, जिनमें ट्रैफ़िक में उछाल के बीच निष्क्रिय अवधि होती है। जब बुंडेसलीगा मैच नहीं होते हैं, तो निष्क्रिय संसाधनों की कोई कीमत नहीं होती है।

किक-ऑफ से कुछ समय पहले, हम सुविधाओं का अपना प्रारंभिक सेट तैयार करते हैं और प्री-मैच सेजमेकर एंडपॉइंट को कॉल करके प्री-मैच जीत की संभावनाओं की गणना करते हैं। उन प्रीमैच संभावनाओं के साथ, हम फिर लाइव मॉडल को इनिशियलाइज़ करते हैं, जो प्रासंगिक इन-गेम इवेंट्स के लिए वास्तविक समय में प्रतिक्रिया करता है और वर्तमान जीत की संभावनाओं को प्राप्त करने के लिए लगातार पूछताछ की जाती है।

परिकलित संभावनाओं को फिर अन्य MatchFacts उपभोक्ताओं को प्रदान करने के लिए DataHub को वापस भेज दिया जाता है। अन्य बुंडेसलीगा मैच फैक्ट्स द्वारा उपभोग किए जाने के लिए, एक समर्पित विषय पर एमएसके क्लस्टर को संभावनाएं भी भेजी जाती हैं। लैम्ब्डा फ़ंक्शन संबंधित काफ्का विषय से सभी संभावनाओं का उपभोग करता है, और उन्हें लिखता है an अमेज़न अरोड़ा डेटाबेस। इस डेटा का उपयोग इंटरएक्टिव निकट-वास्तविक-समय विज़ुअलाइज़ेशन के लिए किया जाता है अमेज़न क्विकसाइट.

सारांश

इस पोस्ट में, हमने दिखाया कि कैसे नया बुंडेसलीगा मैच फैक्ट विन प्रोबेबिलिटी एक मैच जीतने या हारने वाली टीम की संभावनाओं पर इन-गेम इवेंट्स के प्रभाव को दर्शाता है। ऐसा करने के लिए, हम वास्तविक समय में पहले से प्रकाशित बुंडेसलीगा मैच फैक्ट्स का निर्माण और संयोजन करते हैं। यह कमेंटेटरों और प्रशंसकों को लाइव मैचों के दौरान संभाव्यता झूलों और अधिक के क्षणों को उजागर करने की अनुमति देता है।

नया बुंडेसलीगा मैच फैक्ट बुंडेसलीगा के फुटबॉल विशेषज्ञों और एडब्ल्यूएस डेटा वैज्ञानिकों द्वारा गहन विश्लेषण का परिणाम है। आधिकारिक बुंडेसलीगा ऐप में संबंधित मैचों के लाइव टिकर में जीत की संभावनाएं दिखाई जाती हैं। एक प्रसारण के दौरान, कमेंटेटरों को जीत की संभावनाएं प्रदान की जाती हैं डेटा कहानी खोजक और महत्वपूर्ण क्षणों में प्रशंसकों को नेत्रहीन रूप से दिखाया जाता है, जैसे कि जब अंडरडॉग बढ़त लेता है और अब खेल जीतने की सबसे अधिक संभावना है।

हमें उम्मीद है कि आप इस बिल्कुल नए बुंडेसलीगा मैच फैक्ट का आनंद लेंगे और यह आपको गेम में नई अंतर्दृष्टि प्रदान करेगा। एडब्ल्यूएस और बुंडेसलीगा के बीच साझेदारी के बारे में अधिक जानने के लिए, यहां जाएं AWS . पर बुंडेसलीगा!

हम यह जानने के लिए उत्साहित हैं कि आप किन पैटर्नों को उजागर करेंगे। अपनी अंतर्दृष्टि हमारे साथ साझा करें: @AWScloud ट्विटर पर, हैशटैग #BundesligaMatchFacts के साथ।

लेखक के बारे में

साइमन रॉल्फ्स एक केंद्रीय मिडफील्डर के रूप में 288 बुंडेसलीगा खेल खेले, 41 गोल किए, और जर्मनी के लिए 26 कैप जीते। वर्तमान में, रॉल्फ्स बायर 04 लीवरकुसेन में प्रबंध निदेशक खेल के रूप में कार्य करता है, जहां वह प्रो प्लेयर रोस्टर, स्काउटिंग विभाग और क्लब के युवा विकास की देखरेख और विकास करता है। साइमन साप्ताहिक कॉलम भी लिखता है बुंडेसलिगा.कॉम AWS द्वारा संचालित नवीनतम बुंडेसलीगा मैच तथ्यों के बारे में। वहां वह फुटबॉल की दुनिया में उन्नत आंकड़ों और मशीन सीखने के प्रभाव को उजागर करने के लिए एक पूर्व खिलाड़ी, कप्तान और टीवी विश्लेषक के रूप में अपनी विशेषज्ञता प्रदान करता है।

तारेक हास्केमी एडब्ल्यूएस व्यावसायिक सेवाओं के भीतर एक सलाहकार है। उनके कौशल और विशेषज्ञता के क्षेत्रों में एप्लिकेशन डेवलपमेंट, डेटा साइंस, मशीन लर्निंग और बिग डेटा शामिल हैं। वह क्लाउड के भीतर डेटा-संचालित एप्लिकेशन विकसित करने में ग्राहकों का समर्थन करता है। एडब्ल्यूएस में शामिल होने से पहले, वह विमानन और दूरसंचार जैसे विभिन्न उद्योगों में सलाहकार भी थे। वह ग्राहकों को क्लाउड तक उनके डेटा/एआई यात्रा में सक्षम बनाने के लिए उत्साहित हैं।

जेवियर पोवेदा-पेंटर एडब्ल्यूएस प्रोफेशनल सर्विसेज टीम के भीतर ईएमईए खेल ग्राहकों के लिए डेटा वैज्ञानिक है। वह दर्शकों के खेल के क्षेत्र में ग्राहकों को मशीन सीखने और डेटा विज्ञान के माध्यम से उच्च गुणवत्ता वाले उपयोगकर्ता और प्रशंसक अनुभव प्रदान करने के लिए अपने डेटा को नया करने और पूंजीकरण करने में सक्षम बनाता है। वह अपने खाली समय में खेल, संगीत और एआई की एक विस्तृत श्रृंखला के लिए अपने जुनून का पालन करता है।

ल्यूक फिगर एडब्ल्यूएस प्रोफेशनल सर्विसेज टीम में स्पोर्ट्स टेक्नोलॉजी एडवाइजर हैं। वह खिलाड़ियों, क्लबों, लीगों और बुंडेसलीगा और फॉर्मूला 1 जैसी मीडिया कंपनियों के साथ काम करता है ताकि उन्हें मशीन लर्निंग का उपयोग करके डेटा के साथ कहानियां सुनाने में मदद मिल सके। अपने खाली समय में, वह मन और मनोविज्ञान, अर्थशास्त्र और एआई के बीच के अंतर के बारे में सब कुछ सीखना पसंद करता है।

गेब्रियल ज़िल्का एडब्ल्यूएस व्यावसायिक सेवाओं के भीतर एक मशीन लर्निंग इंजीनियर है। वह ग्राहकों की क्लाउड अपनाने की यात्रा में तेजी लाने के लिए उनके साथ मिलकर काम करता है। एमएलओपीएस डोमेन में विशिष्ट, वह एंड-टू-एंड मशीन लर्निंग जीवनचक्र को स्वचालित करके और वांछित व्यावसायिक परिणामों को प्राप्त करने में मदद करके मशीन लर्निंग वर्कलोड को उत्पादन करने पर ध्यान केंद्रित करता है।

जकूब माइकल्ज़िक स्पोर्टेक सॉल्यूशंस एजी में डेटा साइंटिस्ट हैं। कई साल पहले, उन्होंने फ़ुटबॉल खेलने के बजाय गणित की पढ़ाई को चुना, क्योंकि वे इस नतीजे पर पहुंचे कि बाद में वह काफी अच्छे नहीं थे। अब वह इस खूबसूरत खेल में बेहतर अंतर्दृष्टि प्राप्त करने के लिए मशीन सीखने के तरीकों को लागू करके अपने पेशेवर करियर में इन दोनों जुनून को जोड़ता है। अपने खाली समय में, वह अभी भी सेवेन-ए-साइड फ़ुटबॉल खेलना, अपराध फ़िल्में देखना और फ़िल्म संगीत सुनना पसंद करते हैं।

समय टिकट: सितम्बर 30, 2022सितम्बर 30, 2022

समय टिकट: अगस्त 22, 2023

प्लेटो द्वारा पुनर्प्रकाशित

यह कैसे काम करता है?

विन प्रायिकता उदाहरण

इसे कैसे लागू किया जाता है?

सारांश

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

AWS पर MONAI डिप्लॉय के साथ एक मेडिकल इमेजिंग AI अनुमान पाइपलाइन बनाएं | अमेज़न वेब सेवाएँ

अमेज़ॅन क्विकसाइट के साथ मेट्रिक्स विसंगति परिणामों के लिए अपने अमेज़ॅन लुकआउट की कल्पना करें

Amazon Transcribe में कस्टम शब्दावली के साथ ग्राहक-एजेंट कॉल की ट्रांसक्रिप्शन सटीकता में सुधार करें

एडब्ल्यूएस मशीन लर्निंग इंजीनियर छात्रवृत्ति के माध्यम से एमएल कौशल के साथ अपने करियर में तेजी लाएं

कस्टम ऑपरेटरों के साथ AWS ट्रेनियम की कार्यक्षमता को कैसे बढ़ाया जाए

AWS Inferentia का उपयोग करके विलंबता को कम करते हुए और थ्रूपुट को बढ़ाते हुए बाइटडांस अनुमान लागत पर 60% तक की बचत करता है

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा