يتيح دماغ الروبوتات الشبيه بـ ChatGPT من DeepMind للروبوتات التعلم من الإنترنت

DeepMind's ChatGPT-Like Brain للروبوتات يتيح لهم التعلم من الإنترنت

منذ ظهور ChatGPT على الساحة التقنية في تشرين الثاني (نوفمبر) من العام الماضي ، كان يساعد الناس على كتابة جميع أنواع المواد وإنشاء التعليمات البرمجية والعثور على المعلومات. لقد سهلت هذه التقنية ونماذج اللغات الكبيرة الأخرى (LLMs) المهام من إرسال مكالمات خدمة العملاء إلى تلقي طلبات الوجبات السريعة. بالنظر إلى مدى فائدة LLMs للبشر في الوقت القصير الذي كانوا موجودين فيه ، كيف يمكن أن تؤثر ChatGPT للروبوتات على قدرتها على التعلم والقيام بأشياء جديدة؟ قرر الباحثون في Google DeepMind اكتشاف ونشر نتائجهم في ملف بلوق وظيفة والورق صدر الأسبوع الماضي.

يسمون نظامهم RT-2. إنه اختصار لمحول الروبوتات 2 ، وهو الوريث محول الروبوتات 1الذي أصدرته الشركة في نهاية العام الماضي. يعتمد RT-1 على برنامج صغير للغة والرؤية وتم تدريبه خصيصًا للقيام بالعديد من المهام. تم استخدام البرنامج في Alphabet X's الروبوتات اليومية، مما يمكنهم من القيام بأكثر من 700 مهمة مختلفة بمعدل نجاح 97 بالمائة. ولكن عندما طُلب منهم القيام بمهام جديدة لم يتم تدريبهم عليها ، كانت الروبوتات التي تستخدم RT-1 ناجحة فقط بنسبة 32٪ من الوقت.

يضاعف RT-2 هذا المعدل تقريبًا ، حيث يؤدي بنجاح مهام جديدة بنسبة 62 بالمائة من الوقت المطلوب. يطلق الباحثون على RT-2 نموذج الرؤية واللغة والعمل (VLA). تستخدم النصوص والصور التي تراها على الإنترنت لتعلم مهارات جديدة. هذا ليس بالبساطة التي يبدو عليها. يتطلب البرنامج أولاً "فهم" المفهوم ، ثم تطبيق هذا الفهم على أمر أو مجموعة من التعليمات ، ثم تنفيذ الإجراءات التي تلبي تلك التعليمات.

أحد الأمثلة التي قدمها مؤلفو الورقة هو التخلص من القمامة. في النماذج السابقة ، يجب تدريب برنامج الروبوت أولاً على تحديد القمامة. على سبيل المثال ، إذا كانت هناك موزة مقشرة على طاولة وبجانبها القشرة ، فسيظهر للروبوت أن القشر عبارة عن قمامة بينما الموز ليس كذلك. سيتم بعد ذلك تعليمه كيفية التقاط القشرة ونقلها إلى سلة المهملات وإيداعها هناك.

يعمل RT-2 بشكل مختلف قليلاً. نظرًا لأن النموذج قد تدرب على كميات كبيرة من المعلومات والبيانات من الإنترنت ، فلديه فهم عام لماهية المهملات ، وعلى الرغم من أنه لم يتم تدريبه على التخلص من القمامة ، إلا أنه يمكنه تجميع الخطوات معًا لإكمال هذه المهمة.

LLMs التي استخدمها الباحثون لتدريب RT-2 هي بالي-X (نموذج الرؤية واللغة مع 55 مليار معلمة) ، و بالم-E (ما تسميه Google نموذج لغة متعدد الوسائط ، تم تطويره خصيصًا للروبوتات ، مع 12 مليار معلمة). تشير "المعلمة" إلى سمة يحددها نموذج التعلم الآلي بناءً على بيانات التدريب الخاصة به. في حالة LLMs ، يقومون بنمذجة العلاقات بين الكلمات في الجملة ويوازنون مدى احتمالية أن تكون كلمة معينة مسبوقة أو متبوعة بكلمة أخرى.

من خلال إيجاد العلاقات والأنماط بين الكلمات في مجموعة بيانات عملاقة ، تتعلم النماذج من استنتاجاتهم الخاصة. يمكنهم في النهاية اكتشاف كيفية ارتباط المفاهيم المختلفة ببعضها البعض وتمييز السياق. في حالة RT-2 ، تترجم هذه المعرفة إلى تعليمات معممة للأعمال الروبوتية.

يتم تمثيل هذه الإجراءات للروبوت كرموز ، والتي تُستخدم عادةً لتمثيل نص بلغة طبيعية في شكل أجزاء كلمة. في هذه الحالة ، تكون الرموز المميزة جزءًا من إجراء ، ويقوم البرنامج بربط العديد من الرموز المميزة معًا لتنفيذ إجراء ما. يمكّن هذا الهيكل أيضًا البرنامج من إجراء استدلال متسلسل التفكير ، مما يعني أنه يمكنه الاستجابة للأسئلة أو المطالبات التي تتطلب درجة معينة من التفكير.

تشمل الأمثلة التي يقدمها الفريق اختيار كائن لاستخدامه كمطرقة عندما لا تتوفر مطرقة (يختار الروبوت صخرة) واختيار أفضل مشروب لشخص متعب (يختار الروبوت مشروب طاقة).

يتيح دماغ الروبوتات الشبيه بـ ChatGPT من DeepMind للروبوتات التعلم من ذكاء بيانات PlatoBlockchain عبر الإنترنت. البحث العمودي. منظمة العفو الدولية.
حقوق الصورة: Google DeepMind

كتب الباحثون في أحد مواقع Google: "تُظهر RT-2 قدرات تعميم محسّنة وفهمًا دلاليًا ومرئيًا يتجاوز البيانات الروبوتية التي تعرضت لها" بلوق وظيفة. "يتضمن ذلك تفسير الأوامر الجديدة والاستجابة لأوامر المستخدم من خلال تنفيذ التفكير البدائي ، مثل التفكير في فئات الكائنات أو الأوصاف عالية المستوى."

حلم الروبوتات للأغراض العامة يمكن أن يساعد البشر في كل ما قد يظهر - سواء في المنزل أو في مكان تجاري أو في بيئة صناعية - لن يكون قابلاً للتحقيق حتى تتمكن الروبوتات من التعلم أثناء التنقل. ما يبدو أنه أبسط غريزة بالنسبة لنا هو ، بالنسبة للروبوتات ، مزيج معقد من فهم السياق والقدرة على التفكير من خلاله واتخاذ الإجراءات لحل المشكلات التي لم يكن من المتوقع ظهورها. إن برمجتها للتفاعل بشكل مناسب مع مجموعة متنوعة من السيناريوهات غير المخطط لها أمر مستحيل ، لذلك يجب أن يكونوا قادرين على التعميم والتعلم من التجربة ، تمامًا كما يفعل البشر.

RT-2 هي خطوة في هذا الاتجاه. يعترف الباحثون ، على الرغم من ذلك ، أنه في حين أن RT-2 يمكن أن يعمم المفاهيم الدلالية والمرئية ، فإنه غير قادر بعد على تعلم أفعال جديدة بمفرده. بدلاً من ذلك ، فإنه يطبق الإجراءات التي يعرفها بالفعل على السيناريوهات الجديدة. ربما تكون RT-3 أو 4 قادرة على نقل هذه المهارات إلى المستوى التالي. في غضون ذلك ، كما يختتم الفريق في بلوق وظيفة، "بينما لا يزال هناك قدر هائل من العمل الذي يتعين القيام به لتمكين الروبوتات المفيدة في البيئات التي تركز على الإنسان ، يوضح لنا RT-2 مستقبلًا مثيرًا للروبوتات في متناول اليد."

الصورة الائتمان: جوجل DeepMind

الطابع الزمني:

اكثر من التفرد المحور