تُعلِّم Google الروبوتات لخدمة البشر - باستخدام نماذج اللغات الكبيرة ، مفتاح PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

تعلم Google الروبوتات لخدمة البشر - مع استخدام نماذج اللغات الكبيرة المفتاح

فيديو يساعد أكبر نموذج للغة AI من Google الروبوتات على أن تكون أكثر مرونة في فهم وتفسير الأوامر البشرية ، وفقًا لأحدث الأبحاث التي أجراها عملاق الويب.

عادةً ما تستجيب الأجهزة بشكل أفضل لمطالب محددة للغاية - يمكن للطلبات المفتوحة أحيانًا التخلص منها وتؤدي إلى نتائج لم يفكر فيها المستخدمون. يتعلم الناس التفاعل مع الروبوتات بطريقة صارمة ، مثل طرح الأسئلة بطريقة معينة للحصول على الاستجابة المطلوبة.

ومع ذلك ، يعد أحدث نظام من Google ، الملقب بـ PaLM-SayCan ، بأن يكون أكثر ذكاءً. يحتوي الجهاز المادي من Everyday Robots - وهي شركة ناشئة منبثقة عن Google X - على كاميرات للعيون في رأسه وذراع مع كماشة مطوية خلف جسمه الطويل المستقيم ، والذي يجلس فوق مجموعة من العجلات.  

يمكنك مشاهدة الروبوت وهو يعمل في الفيديو أدناه:

يوتيوب فيديو

سؤال الروبوت ، شيء مثل "لقد عملت للتو ، هل يمكنك أن تحضر لي وجبة خفيفة صحية؟" سوف تدفعه إلى جلب تفاحة. "PaLM-SayCan [هو] منهج عام وقابل للتفسير للاستفادة من المعرفة من نماذج اللغة التي تمكن الروبوت من اتباع تعليمات نصية عالية المستوى لأداء مهام تستند إلى أسس جسدية" ، وفقًا لعلماء أبحاث من فريق Brain في Google شرح.

قدمت Google أكبر نموذج لغوي لها كف، نخلة في أبريل من هذا العام. تم تدريب PaLM على البيانات المأخوذة من الإنترنت ، ولكن بدلاً من إرسال استجابات نصية مفتوحة ، تم تكييف النظام لإنشاء قائمة من الإرشادات ليتبعها الروبوت.

بقولك "لقد قمت بسكب الكولا الخاصة بي على الطاولة ، كيف يمكنك التخلص منها وإحضار شيئًا للمساعدة في التنظيف؟" ، يدفع PaLM إلى فهم السؤال وإنشاء قائمة بالخطوات التي يمكن أن يتبعها الروبوت لإكمال المهمة ، مثل الانتقال لالتقاط العلبة ، وإلقائها في سلة المهملات ، والحصول على إسفنجة.

ومع ذلك ، فإن نماذج اللغات الكبيرة (LLMs) مثل PaLM لا تفهم معنى أي شيء يقولونه. لهذا السبب ، قام الباحثون بتدريب نموذج منفصل باستخدام التعلم المعزز لتأسيس لغة مجردة في التمثيلات والأفعال المرئية. بهذه الطريقة يتعلم الروبوت ربط كلمة "كوكاكولا" بصورة علبة مشروب غازي.

يتعلم PaLM-SayCan أيضًا ما يسمى بـ "وظائف القدرة على تحمل التكاليف" - وهي طريقة تصنف إمكانية إكمال إجراء معين معين في بيئتها. من المرجح أن يلتقط الروبوت إسفنجة أكثر من المكنسة الكهربائية ، على سبيل المثال ، إذا اكتشف إسفنجة ولكن لم يكن بالقرب منها مكنسة كهربائية. 

أوضح الفريق في ورقة بحثية. "يوفر LLM (قل) أسس مهمة لتحديد الإجراءات المفيدة لهدف رفيع المستوى ، وتوفر وظائف القدرة على تحمل التكاليف المكتسبة (Can) أساسًا عالميًا لتحديد ما يمكن تنفيذه وفقًا للخطة. نحن نستخدم التعلم المعزز (RL) كطريقة لتعلم وظائف القيمة المكيفة اللغوية التي توفر ما هو ممكن في العالم ".

لمنع الروبوت من الانحراف عن المهمة ، يتم تدريبه على تحديد الإجراءات من 101 تعليمات مختلفة فقط. قامت Google بتدريبها على التكيف مع المطبخ - يمكن لـ PaLM-SayCan الحصول على وجبات خفيفة ومشروبات وأداء مهام تنظيف بسيطة. يعتقد الباحثون أن LLM هي الخطوة الأولى في جعل الروبوتات تؤدي مهامًا أكثر تعقيدًا بأمان في ضوء التعليمات المجردة.

"تُظهر تجاربنا على عدد من المهام الروبوتية في العالم الحقيقي القدرة على تخطيط وإكمال تعليمات اللغة الطبيعية والمجردة طويلة الأفق بمعدل نجاح مرتفع. وخلصوا إلى أننا نعتقد أن قابلية تفسير PaLM-SayCan تسمح بتفاعل مستخدم آمن في العالم الحقيقي مع الروبوتات ". ®

الطابع الزمني:

اكثر من السجل