Google रोबोटों को मनुष्यों की सेवा करना सिखाता है

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

वीडियो वेब जायंट के नवीनतम शोध के मुताबिक, Google का सबसे बड़ा एआई भाषा मॉडल मानव आदेशों को समझने और व्याख्या करने में रोबोटों को अधिक लचीला बनाने में मदद कर रहा है।

मशीनें आमतौर पर बहुत विशिष्ट मांगों के लिए सबसे अच्छी प्रतिक्रिया देती हैं - खुले-समाप्त अनुरोध कभी-कभी उन्हें फेंक देते हैं और ऐसे परिणाम देते हैं जो उपयोगकर्ताओं के दिमाग में नहीं होते। लोग रोबोट के साथ कठोर तरीके से बातचीत करना सीखते हैं, जैसे वांछित प्रतिक्रिया प्राप्त करने के लिए एक विशेष तरीके से प्रश्न पूछना।

Google की नवीनतम प्रणाली, जिसे PaLM-SayCan करार दिया गया है, अधिक स्मार्ट होने का वादा करती है। एवरीडे रोबोट्स से भौतिक उपकरण - Google X से निकला एक स्टार्टअप - इसके सिर में आंखों के लिए कैमरे हैं और इसके लंबे सीधे शरीर के पीछे एक पिनर लगा हुआ है, जो पहियों के एक सेट के ऊपर बैठता है।

आप नीचे दिए गए वीडियो में रोबोट को काम करते हुए देख सकते हैं:

यूट्यूब वीडियो

रोबोट से पूछते हुए, "मैंने अभी काम किया है, क्या आप मुझे एक स्वस्थ नाश्ता ला सकते हैं?" उसे एक सेब लाने के लिए प्रेरित करेगा। "PaLM-SayCan [है] भाषा मॉडल से ज्ञान का लाभ उठाने के लिए एक व्याख्यात्मक और सामान्य दृष्टिकोण है जो एक रोबोट को शारीरिक रूप से बुनियादी कार्यों को करने के लिए उच्च-स्तरीय शाब्दिक निर्देशों का पालन करने में सक्षम बनाता है," Google की ब्रेन टीम के शोध वैज्ञानिक समझाया.

Google ने अपना सबसे बड़ा भाषा मॉडल पेश किया हथेली इस साल अप्रैल में। PaLM को इंटरनेट से स्क्रैप किए गए डेटा पर प्रशिक्षित किया गया था, लेकिन ओपन एंडेड टेक्स्ट प्रतिक्रियाओं को उगलने के बजाय सिस्टम को रोबोट के अनुसरण के लिए निर्देशों की एक सूची तैयार करने के लिए अनुकूलित किया गया था।

यह कहते हुए कि "मैंने अपना कोक टेबल पर गिरा दिया, आप इसे कैसे फेंकेंगे और मुझे साफ करने में मदद करने के लिए कुछ लाएंगे?", PaLM को प्रश्न को समझने और कार्य को पूरा करने के लिए चरणों की एक सूची तैयार करने का संकेत देता है, जैसे ऊपर जाना कैन को उठाना, उसे कूड़ेदान में फेंकना और स्पंज प्राप्त करना।

हालांकि, PaLM जैसे बड़े भाषा मॉडल (LLM) उनके द्वारा कही गई किसी भी बात का अर्थ नहीं समझते हैं। इस कारण से, शोधकर्ताओं ने सुदृढ़ीकरण सीखने का उपयोग करके एक अलग मॉडल को दृश्य प्रस्तुतियों और कार्यों में अमूर्त भाषा को आधार बनाने के लिए प्रशिक्षित किया। इस तरह रोबोट "कोक" शब्द को फ़िज़ी ड्रिंक कैन की छवि के साथ जोड़ना सीखता है।

PaLM-SayCan तथाकथित "अफोर्डेंस फ़ंक्शंस" भी सीखता है - एक ऐसी विधि जो अपने वातावरण में दी गई वस्तुओं को एक विशिष्ट क्रिया को पूरा करने की संभावना को रैंक करती है। वैक्यूम क्लीनर की तुलना में रोबोट द्वारा स्पंज लेने की अधिक संभावना है, उदाहरण के लिए, यदि यह स्पंज का पता लगाता है लेकिन उसके पास कोई वैक्यूम नहीं है।

"हमारी विधि, SayCan, एलएलएम के भीतर भौतिक रूप से आधारभूत कार्यों में ज्ञान को निकालती है और उसका लाभ उठाती है," टीम ने एक में समझाया शोध पत्र. "एलएलएम (कहें) एक उच्च स्तरीय लक्ष्य के लिए उपयोगी कार्यों को निर्धारित करने के लिए एक कार्य-ग्राउंडिंग प्रदान करता है और योजना पर निष्पादित करने के लिए क्या संभव है यह निर्धारित करने के लिए सीखा हुआ वहन कार्य (कैन) एक विश्व-ग्राउंडिंग प्रदान करता है। हम रीइन्फोर्समेंट लर्निंग (आरएल) का उपयोग भाषा के अनुकूल मूल्य कार्यों को सीखने के तरीके के रूप में करते हैं जो दुनिया में जो कुछ भी संभव है उसका वहन प्रदान करता है।

रोबोट को काम से भटकने से रोकने के लिए, उसे केवल 101 अलग-अलग निर्देशों में से क्रियाओं का चयन करने के लिए प्रशिक्षित किया जाता है। Google ने इसे रसोई के अनुकूल बनाने के लिए प्रशिक्षित किया - PaLM-SayCan स्नैक्स, पेय प्राप्त कर सकता है और साधारण सफाई कार्य कर सकता है। शोधकर्ताओं का मानना है कि एलएलएम रोबोट को अधिक जटिल कार्यों को सुरक्षित रूप से दिए गए अमूर्त निर्देशों को पूरा करने के लिए पहला कदम है।

"कई वास्तविक दुनिया के रोबोटिक कार्यों पर हमारे प्रयोग उच्च सफलता दर पर लंबी-क्षितिज, सार, प्राकृतिक भाषा निर्देशों की योजना बनाने और पूरा करने की क्षमता प्रदर्शित करते हैं। हमारा मानना है कि PaLM-SayCan की व्याख्यात्मकता रोबोट के साथ सुरक्षित वास्तविक दुनिया उपयोगकर्ता सहभागिता की अनुमति देती है," उन्होंने निष्कर्ष निकाला। ®

समय टिकट: अगस्त 18, 2022अगस्त 18, 2022