इस रोबोट डॉग के पास AI ब्रेन है और उसने सिर्फ एक घंटे में चलना सिखाया है प्लेटोब्लॉकचैन डेटा इंटेलिजेंस। लंबवत खोज। ऐ.

इस रोबोट कुत्ते के पास एआई दिमाग है और उसने सिर्फ एक घंटे में चलना सिखाया

की छवि

क्या आपने कभी किसी बच्चे को गजल को चलना सीखते देखा है? एक फॉन, जो मूल रूप से एक स्तनधारी डैडी है, जो लंबे पैरों वाला है, अपने पैरों से हाथापाई करता है, गिरता है, खड़ा होता है और फिर से गिर जाता है। आखिरकार, यह अपने टूथपिक जैसे पैरों को निकट गिरने की श्रृंखला में फेंकने के लिए काफी लंबा खड़ा है ... अहम, कदम। आश्चर्यजनक रूप से, इस प्यारे प्रदर्शन के कुछ ही मिनटों के बाद, फॉन एक पुराने समर्थक की तरह इधर-उधर हो रहा है।

खैर, अब हमारे पास इस क्लासिक सेरेनगेटी दृश्य का रोबोट संस्करण है।

इस मामले में फॉन कैलिफोर्निया विश्वविद्यालय, बर्कले में एक रोबोटिक कुत्ता है। और यह वैसे ही आश्चर्यजनक रूप से त्वरित सीखने वाला है (बाकी रोबोट-प्रकार के सापेक्ष)। रोबोट इसलिए भी खास है क्योंकि, अन्य आकर्षक रोबोटों के विपरीत, जिन्हें आपने ऑनलाइन देखा होगा, यह कृत्रिम बुद्धिमत्ता का उपयोग खुद को चलना सिखाने के लिए करता है।

अपनी पीठ पर, पैर लहराते हुए, रोबोट एक घंटे में खुद को पलटना, खड़ा होना और चलना सीखता है। कार्डबोर्ड के एक रोल के साथ एक और दस मिनट का उत्पीड़न उसे यह सिखाने के लिए पर्याप्त है कि कैसे इसके संचालकों द्वारा इधर-उधर धकेले जाने से उबरना और उबरना है।

यह पहली बार नहीं है चलने के लिए सीखने के लिए एक रोबोट ने कृत्रिम बुद्धि का उपयोग किया है. लेकिन जब पूर्व के रोबोटों ने सिमुलेशन में असंख्य पुनरावृत्तियों पर परीक्षण और त्रुटि से कौशल सीखा, तो बर्कले बॉट ने पूरी तरह से वास्तविक दुनिया में सीखा।

[एम्बेडेड सामग्री]

में पेपर प्रकाशित arXiv प्रीप्रिंट सर्वर पर, शोधकर्ता- डेनिजर हाफनर, एलेजांद्रो एस्कॉन्ट्रेला, और फिलिप वू- कहते हैं कि वास्तविक दुनिया में सिमुलेशन में सीखे गए एल्गोरिदम को स्थानांतरित करना सीधा नहीं है। वास्तविक दुनिया और सिमुलेशन के बीच छोटे विवरण और अंतर नवोदित रोबोटों की यात्रा कर सकते हैं। दूसरी ओर, वास्तविक दुनिया में प्रशिक्षण एल्गोरिदम अव्यावहारिक है: इसमें बहुत अधिक समय लगेगा और टूट-फूट होगी।

चार साल पहले, उदाहरण के लिए, ओपनएआई ने एक एआई-सक्षम रोबोटिक हाथ दिखाया जो एक घन में हेरफेर कर सकता था। इस अपेक्षाकृत सरल कार्य को पूरा करने के लिए 100 सीपीयू और 6,144 एनवीडिया वी8 जीपीयू द्वारा संचालित सिमुलेशन में नियंत्रण एल्गोरिथम, डैक्टाइल को लगभग 100 वर्षों के अनुभव की आवश्यकता थी। तब से चीजें आगे बढ़ी हैं, लेकिन समस्या काफी हद तक बनी हुई है। शुद्ध सुदृढीकरण सीखने के एल्गोरिदम को वास्तविक दुनिया में प्रशिक्षित करने के लिए कौशल सीखने के लिए बहुत अधिक परीक्षण और त्रुटि की आवश्यकता होती है। सीधे शब्दों में कहें तो सीखने की प्रक्रिया शोधकर्ताओं को तोड़ देगी और कोई सार्थक प्रगति करने से पहले रोबोट।

बर्कले की टीम ने ड्रीमर नामक एक एल्गोरिथम के साथ इस समस्या को हल करने के लिए निर्धारित किया। निर्माण करना जिसे "" कहा जाता हैविश्व मॉडल, "सपने देखने वाला भविष्य की कार्रवाई अपने लक्ष्य को प्राप्त करने की संभावना को प्रोजेक्ट कर सकता है। अनुभव के साथ, इसके अनुमानों की सटीकता में सुधार होता है। कम सफल कार्रवाइयों को पहले से फ़िल्टर करके, विश्व मॉडल रोबोट को अधिक कुशलता से यह पता लगाने की अनुमति देता है कि क्या काम करता है।

"पिछले अनुभव से विश्व मॉडल सीखना रोबोट को संभावित कार्यों के भविष्य के परिणामों की कल्पना करने में सक्षम बनाता है, सफल व्यवहार सीखने के लिए आवश्यक वास्तविक वातावरण में परीक्षण और त्रुटि की मात्रा को कम करता है," शोधकर्ता लिखते हैं। "भविष्य के परिणामों की भविष्यवाणी करके, विश्व मॉडल वास्तविक दुनिया की बातचीत की केवल थोड़ी मात्रा में योजना और व्यवहार सीखने की अनुमति देते हैं।"

दूसरे शब्दों में, एक विश्व मॉडल सिमुलेशन में प्रशिक्षण समय के वर्षों के बराबर वास्तविक दुनिया में एक अजीब घंटे से अधिक नहीं कम कर सकता है।

रोबोट कुत्तों की तुलना में दृष्टिकोण की व्यापक प्रासंगिकता भी हो सकती है। टीम ने ड्रीमर को पिक-एंड-प्लेस रोबोटिक आर्म और व्हील वाले रोबोट पर भी लागू किया। दोनों ही मामलों में, उन्होंने पाया कि ड्रीमर ने अपने रोबोटों को कुशलता से प्रासंगिक कौशल सीखने की अनुमति दी, कोई सिम समय की आवश्यकता नहीं है। अधिक महत्वाकांक्षी भविष्य के अनुप्रयोगों में शामिल हो सकते हैं आत्म - ड्राइविंग कारें.

बेशक, अभी भी संबोधित करने के लिए चुनौतियां हैं। यद्यपि सुदृढीकरण सीखना आज के सबसे उन्नत रोबोटों के पीछे कुछ जटिल हाथ-कोडिंग को स्वचालित करता है, फिर भी इसके लिए इंजीनियरों को रोबोट के लक्ष्यों को परिभाषित करने की आवश्यकता होती है और जो सफलता का गठन करता है-एक ऐसा अभ्यास जो वास्तविक दुनिया के वातावरण के लिए समय लेने वाला और खुला दोनों है। इसके अलावा, हालांकि रोबोट यहां टीम के प्रयोगों से बच गया, अधिक उन्नत कौशल पर लंबे समय तक प्रशिक्षण भविष्य के बॉट्स को बिना नुकसान के जीवित रहने के लिए बहुत अधिक साबित हो सकता है। शोधकर्ताओं का कहना है कि तेजी से वास्तविक दुनिया सीखने के साथ सिम्युलेटर प्रशिक्षण को जोड़ना उपयोगी हो सकता है।

फिर भी, परिणाम रोबोटिक्स में एआई को एक और कदम आगे बढ़ाते हैं। ड्रीमर इस मामले को मजबूत करता है कि "रोबोट नियंत्रण के भविष्य में सुदृढीकरण सीखना एक आधारशिला उपकरण होगा," ओरेगन स्टेट यूनिवर्सिटी में रोबोटिक्स के प्रोफेसर जोनाथन हर्स्ट बोला था एमआईटी प्रौद्योगिकी की समीक्षा. 

छवि क्रेडिट: दानिजार हाफनर / यूट्यूब

समय टिकट:

से अधिक विलक्षणता हब