मेटा के नए एआई को गेम 'डिप्लोमेसी' में शीर्ष 10% में स्थान दिया गया—और मानव खिलाड़ी कोई भी समझदार प्लेटोब्लॉकचेन डेटा इंटेलिजेंस नहीं थे। लंबवत खोज। ऐ।

मेटा की नई एआई को गेम 'डिप्लोमेसी' में शीर्ष 10% में स्थान दिया गया- और मानव खिलाड़ी कोई भी समझदार नहीं थे

एआई ने कुछ सबसे अधिक महारत हासिल की है जटिल खेल मनुष्य के लिए जाना जाता है, लेकिन जब यह अक्सर प्रतिस्पर्धा में उत्कृष्टता प्राप्त करता है, सहयोग स्वाभाविक रूप से नहीं आता है। अब मेटा के एक एआई ने गेम डिप्लोमेसी में महारत हासिल कर ली है, जिसे जीतने के लिए आपको अन्य खिलाड़ियों के साथ काम करने की आवश्यकता है।

Google की महारत गो का खेल एआई के लिए एक प्रमुख मील का पत्थर के रूप में स्वागत किया गया था, लेकिन इसकी निर्विवाद जटिलता के बावजूद, यह कई तरह से मशीन के ठंडे, गणना तर्क के अनुकूल है। यह सटीक जानकारी का खेल है, जहाँ आपको अपने प्रतिद्वंद्वी की चालों की पूरी दृश्यता होती है, और जीतने का मतलब केवल एक दूसरे खिलाड़ी को पछाड़ने में सक्षम होना है।

दूसरी ओर, डिप्लोमेसी, कहीं अधिक गन्दा मामला है। बोर्ड गेम में अधिकतम सात खिलाड़ी भाग लेते हैं के ऊपर यूरोपीय सैन्य शक्तियाँ और रणनीतिक शहरों पर नियंत्रण करने के लिए अपनी सेनाओं का उपयोग करती हैं। लेकिन खिलाड़ियों को कुल वर्चस्व की खोज में गठजोड़ बनाने और तोड़ने के लिए एक दूसरे के साथ बातचीत करने की अनुमति है।

और तो और, सभी खिलाड़ियों की चालें प्रत्येक मोड़ पर एक साथ चलती हैं, इसलिए आप दूसरे क्या करते हैं उस पर सीधे प्रतिक्रिया नहीं कर सकते। इसका मतलब यह है कि गेम जीतने के लिए रणनीतिक सोच, अन्य खिलाड़ियों के साथ सहयोग करने की क्षमता और प्रेरक बातचीत कौशल के एक जटिल संयोजन की आवश्यकता होती है। जबकि एआई ने पहले ही शुद्ध रणनीति में महारत हासिल कर ली है, उन अन्य कौशलों को दोहराने के लिए बहुत पेचीदा साबित हुआ है।

हालांकि, मेटा के शोधकर्ताओं द्वारा डिज़ाइन किया गया एक नया एआई उस दिशा में एक बड़ा कदम उठा सकता है। में एक पेपर प्रकाशित पहले सप्ताह से आखरी सप्ताह in विज्ञान, वे सिसरो नामक एक प्रणाली का वर्णन करते हैं जो एक ऑनलाइन डिप्लोमेसी लीग में शीर्ष 10 प्रतिशत खिलाड़ियों में रैंक करती है और मानव खिलाड़ियों के औसत स्कोर से दोगुने से अधिक हासिल करती है।

"सिसरो लचीला है, यह निर्मम है, और यह धैर्यवान है," तीन बार के डिप्लोमेसी वर्ल्ड चैंपियन एंड्रयू गोफ साid में मेटा द्वारा निर्मित वीडियो. "यह बहुत सारी मानवीय भावनाओं के बिना खेलता है जो कभी-कभी आपको गलत निर्णय लेने देता है। यह सिर्फ स्थिति का आकलन करता है और सबसे अच्छा निर्णय लेता है, न केवल इसके लिए बल्कि उन लोगों के लिए भी जिनके साथ यह काम कर रहा है।

सिसरो को बनाने के लिए मेटा शोधकर्ताओं को दो अलग-अलग उप-क्षेत्रों से अत्याधुनिक एआई विधियों को संयोजित करने की आवश्यकता थी: सामरिक तर्क और प्राकृतिक भाषा प्रसंस्करण। इसके दिल में, सिस्टम में एक नियोजन एल्गोरिदम है जो अन्य खिलाड़ियों की चाल की भविष्यवाणी करता है और अपनी रणनीति निर्धारित करने के लिए इसका उपयोग करता है। इस एल्गोरिदम को एआई को बार-बार खेलने के लिए प्रशिक्षित किया गया था, जबकि इंसानों के खेल खेलने के तरीके की नकल करने की कोशिश भी की गई थी।

शोधकर्ताओं ने पहले ही दिखाया था कि अकेले यह योजना मॉड्यूल सक्षम था मानव पेशेवरों को हराया खेल के एक सरलीकृत संस्करण में। लेकिन इस नवीनतम शोध में, टीम ने इसे इंटरनेट से बड़ी मात्रा में पाठ पर प्रशिक्षित एक बड़े भाषा मॉडल के साथ जोड़ा, और फिर डिप्लोमेसी के 40,000 ऑनलाइन गेम से संवाद का उपयोग करते हुए इसे ठीक किया। इसने उन्नत सिसरो को अन्य खिलाड़ियों के संदेशों की व्याख्या करने की क्षमता प्रदान की और अपना शिल्प भी बनाता है संदेश उन्हें एक साथ काम करने के लिए राजी करने के लिए।

संयुक्त प्रणाली बोर्ड की वर्तमान स्थिति और पिछले संवाद का उपयोग करके यह अनुमान लगाने के लिए शुरू होती है कि प्रत्येक खिलाड़ी क्या करने की संभावना रखता है। इसके बाद यह अपने इरादे को रेखांकित करने और अन्य खिलाड़ियों के सहयोग को सुनिश्चित करने के लिए डिज़ाइन किए गए संदेशों को उत्पन्न करने से पहले स्वयं और उसके भागीदारों दोनों के लिए कार्य योजना के साथ आता है।

ऑनलाइन टूर्नामेंट में 40 से अधिक खेलों में, सिसरो ने प्रभावी ढंग से 82 अन्य खिलाड़ियों के साथ अपने इरादे समझाने, कार्यों का समन्वय करने और गठजोड़ करने के लिए बातचीत की। गंभीर रूप से, शोधकर्ताओं का कहना है कि उन्होंने इन-गेम संदेशों से कोई सबूत नहीं देखा है कि मानव खिलाड़ियों को संदेह है कि वे एआई के साथ मिलकर काम कर रहे थे।

हालाँकि, मॉडल की संचार क्षमता त्रुटिहीन नहीं थी। यह निरर्थक संदेशों या अपने लक्ष्यों के साथ असंगत लोगों को बाहर निकालने में सक्षम है, इसलिए शोधकर्ताओं को प्रत्येक कदम पर कई उम्मीदवार संदेश उत्पन्न करने थे और फिर कचरे को हटाने के लिए विभिन्न फ़िल्टरिंग तंत्रों का उपयोग करना था। और फिर भी, शोधकर्ता स्वीकार करते हैं कि अतार्किक संदेश कभी-कभी फिसल जाते हैंped के माध्यम से।

इससे पता चलता है कि सिसरो के दिल में भाषा मॉडल अभी भी वास्तव में समझ में नहीं आता है कि क्या हो रहा है और केवल प्रशंसनीय लगने वाले संदेशों का उत्पादन कर रहा है, जिन्हें वांछित परिणाम प्राप्त करने के लिए सुनिश्चित करने की आवश्यकता है।

में लेखन वार्तालाप, ऑस्ट्रेलिया में न्यू साउथ वेल्स विश्वविद्यालय में एआई शोधकर्ता टोबी वॉल्श ने यह भी नोट किया है कि अधिकांश मानव खिलाड़ियों के विपरीत, सिसरो बिल्कुल ईमानदार है। हालांकि यह एक आश्चर्यजनक रूप से प्रभावी रणनीति है, यह एक बड़ी कमजोरी हो सकती है यदि प्रतियोगियों को लगता है कि उनका प्रतिद्वंद्वी कभी भी उन्हें धोखा देने की कोशिश नहीं करेगा।

प्रगति एक महत्वपूर्ण है, फिर भी, और फेसबुक उम्मीद करता है कि बोर्ड गेम से कहीं अधिक अनुप्रयोग हो सकते हैं। एक ब्लॉग पोस्ट में, शोधकर्ताओं का कहना है कि भाषा निर्माण को नियंत्रित करने के लिए नियोजन एल्गोरिदम का उपयोग करने की क्षमता एआई चैटबॉट्स के साथ अधिक लंबी और समृद्ध बातचीत करना संभव बना सकती है या वीडियो गेम के पात्र बना सकती है जो खिलाड़ी के व्यवहार के अनुकूल हो सकते हैं।

छवि क्रेडिट: माबेलअंबर / 4008 छवियां

समय टिकट:

से अधिक विलक्षणता हब

हमारे होमो सेपियन्स पूर्वजों ने निएंडरथल, डेनिसोवन्स और अन्य प्रकार के मनुष्यों के साथ दुनिया को साझा किया जिनके डीएनए हमारे जीन में रहते हैं

स्रोत नोड: 1727324
समय टिकट: अक्टूबर 21, 2022