منذ ظهور ChatGPT على الساحة التقنية في تشرين الثاني (نوفمبر) من العام الماضي ، كان يساعد الناس على كتابة جميع أنواع المواد وإنشاء التعليمات البرمجية والعثور على المعلومات. لقد سهلت هذه التقنية ونماذج اللغات الكبيرة الأخرى (LLMs) المهام من إرسال مكالمات خدمة العملاء إلى تلقي طلبات الوجبات السريعة. بالنظر إلى مدى فائدة LLMs للبشر في الوقت القصير الذي كانوا موجودين فيه ، كيف يمكن أن تؤثر ChatGPT للروبوتات على قدرتها على التعلم والقيام بأشياء جديدة؟ قرر الباحثون في Google DeepMind اكتشاف ونشر نتائجهم في ملف بلوق وظيفة والورق صدر الأسبوع الماضي.
يسمون نظامهم RT-2. إنه اختصار لمحول الروبوتات 2 ، وهو الوريث محول الروبوتات 1الذي أصدرته الشركة في نهاية العام الماضي. يعتمد RT-1 على برنامج صغير للغة والرؤية وتم تدريبه خصيصًا للقيام بالعديد من المهام. تم استخدام البرنامج في Alphabet X's الروبوتات اليومية، مما يمكنهم من القيام بأكثر من 700 مهمة مختلفة بمعدل نجاح 97 بالمائة. ولكن عندما طُلب منهم القيام بمهام جديدة لم يتم تدريبهم عليها ، كانت الروبوتات التي تستخدم RT-1 ناجحة فقط بنسبة 32٪ من الوقت.
يضاعف RT-2 هذا المعدل تقريبًا ، حيث يؤدي بنجاح مهام جديدة بنسبة 62 بالمائة من الوقت المطلوب. يطلق الباحثون على RT-2 نموذج الرؤية واللغة والعمل (VLA). تستخدم النصوص والصور التي تراها على الإنترنت لتعلم مهارات جديدة. هذا ليس بالبساطة التي يبدو عليها. يتطلب البرنامج أولاً "فهم" المفهوم ، ثم تطبيق هذا الفهم على أمر أو مجموعة من التعليمات ، ثم تنفيذ الإجراءات التي تلبي تلك التعليمات.
أحد الأمثلة التي قدمها مؤلفو الورقة هو التخلص من القمامة. في النماذج السابقة ، يجب تدريب برنامج الروبوت أولاً على تحديد القمامة. على سبيل المثال ، إذا كانت هناك موزة مقشرة على طاولة وبجانبها القشرة ، فسيظهر للروبوت أن القشر عبارة عن قمامة بينما الموز ليس كذلك. سيتم بعد ذلك تعليمه كيفية التقاط القشرة ونقلها إلى سلة المهملات وإيداعها هناك.
يعمل RT-2 بشكل مختلف قليلاً. نظرًا لأن النموذج قد تدرب على كميات كبيرة من المعلومات والبيانات من الإنترنت ، فلديه فهم عام لماهية المهملات ، وعلى الرغم من أنه لم يتم تدريبه على التخلص من القمامة ، إلا أنه يمكنه تجميع الخطوات معًا لإكمال هذه المهمة.
LLMs التي استخدمها الباحثون لتدريب RT-2 هي بالي-X (نموذج الرؤية واللغة مع 55 مليار معلمة) ، و بالم-E (ما تسميه Google نموذج لغة متعدد الوسائط ، تم تطويره خصيصًا للروبوتات ، مع 12 مليار معلمة). تشير "المعلمة" إلى سمة يحددها نموذج التعلم الآلي بناءً على بيانات التدريب الخاصة به. في حالة LLMs ، يقومون بنمذجة العلاقات بين الكلمات في الجملة ويوازنون مدى احتمالية أن تكون كلمة معينة مسبوقة أو متبوعة بكلمة أخرى.
من خلال إيجاد العلاقات والأنماط بين الكلمات في مجموعة بيانات عملاقة ، تتعلم النماذج من استنتاجاتهم الخاصة. يمكنهم في النهاية اكتشاف كيفية ارتباط المفاهيم المختلفة ببعضها البعض وتمييز السياق. في حالة RT-2 ، تترجم هذه المعرفة إلى تعليمات معممة للأعمال الروبوتية.
يتم تمثيل هذه الإجراءات للروبوت كرموز ، والتي تُستخدم عادةً لتمثيل نص بلغة طبيعية في شكل أجزاء كلمة. في هذه الحالة ، تكون الرموز المميزة جزءًا من إجراء ، ويقوم البرنامج بربط العديد من الرموز المميزة معًا لتنفيذ إجراء ما. يمكّن هذا الهيكل أيضًا البرنامج من إجراء استدلال متسلسل التفكير ، مما يعني أنه يمكنه الاستجابة للأسئلة أو المطالبات التي تتطلب درجة معينة من التفكير.
تشمل الأمثلة التي يقدمها الفريق اختيار كائن لاستخدامه كمطرقة عندما لا تتوفر مطرقة (يختار الروبوت صخرة) واختيار أفضل مشروب لشخص متعب (يختار الروبوت مشروب طاقة).
كتب الباحثون في أحد مواقع Google: "تُظهر RT-2 قدرات تعميم محسّنة وفهمًا دلاليًا ومرئيًا يتجاوز البيانات الروبوتية التي تعرضت لها" بلوق وظيفة. "يتضمن ذلك تفسير الأوامر الجديدة والاستجابة لأوامر المستخدم من خلال تنفيذ التفكير البدائي ، مثل التفكير في فئات الكائنات أو الأوصاف عالية المستوى."
حلم الروبوتات للأغراض العامة يمكن أن يساعد البشر في كل ما قد يظهر - سواء في المنزل أو في مكان تجاري أو في بيئة صناعية - لن يكون قابلاً للتحقيق حتى تتمكن الروبوتات من التعلم أثناء التنقل. ما يبدو أنه أبسط غريزة بالنسبة لنا هو ، بالنسبة للروبوتات ، مزيج معقد من فهم السياق والقدرة على التفكير من خلاله واتخاذ الإجراءات لحل المشكلات التي لم يكن من المتوقع ظهورها. إن برمجتها للتفاعل بشكل مناسب مع مجموعة متنوعة من السيناريوهات غير المخطط لها أمر مستحيل ، لذلك يجب أن يكونوا قادرين على التعميم والتعلم من التجربة ، تمامًا كما يفعل البشر.
RT-2 هي خطوة في هذا الاتجاه. يعترف الباحثون ، على الرغم من ذلك ، أنه في حين أن RT-2 يمكن أن يعمم المفاهيم الدلالية والمرئية ، فإنه غير قادر بعد على تعلم أفعال جديدة بمفرده. بدلاً من ذلك ، فإنه يطبق الإجراءات التي يعرفها بالفعل على السيناريوهات الجديدة. ربما تكون RT-3 أو 4 قادرة على نقل هذه المهارات إلى المستوى التالي. في غضون ذلك ، كما يختتم الفريق في بلوق وظيفة، "بينما لا يزال هناك قدر هائل من العمل الذي يتعين القيام به لتمكين الروبوتات المفيدة في البيئات التي تركز على الإنسان ، يوضح لنا RT-2 مستقبلًا مثيرًا للروبوتات في متناول اليد."
الصورة الائتمان: جوجل DeepMind
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون السيارات / المركبات الكهربائية ، كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- BlockOffsets. تحديث ملكية الأوفست البيئية. الوصول هنا.
- المصدر https://singularityhub.com/2023/08/02/deepminds-chatgpt-like-brain-for-robots-lets-them-learn-from-the-internet/
- :لديها
- :يكون
- :ليس
- $ UP
- 12
- 32
- 700
- a
- القدرة
- ماهرون
- عن المبجلة
- نقر
- اكشن
- الإجراءات
- الكل
- Alphabet
- سابقا
- أيضا
- كمية
- an
- و
- آخر
- كان متوقعا
- التقديم
- بشكل مناسب
- هي
- حول
- AS
- At
- الكتاب
- متاح
- بعيدا
- موز
- على أساس
- الأساسية
- BE
- كان
- يجري
- أفضل
- ما بين
- Beyond
- مليار
- أحذية طويلة
- دماغ
- لكن
- by
- دعوة
- دعوات
- CAN
- قدرات
- حمل
- حقيبة
- الفئات
- شات جي بي تي
- اختيار
- الكود
- مجموعة
- تأتي
- تجاري
- حول الشركة
- إكمال
- مجمع
- مفهوم
- المفاهيم
- سياق الكلام
- ائتمان
- زبون
- خدمة العملاء
- البيانات
- قررت
- العقل العميق
- يعرف
- الدرجة العلمية
- الايداع
- المتقدمة
- مختلف
- اتجاه
- do
- فعل
- الزوجي
- حلم
- الكحول و الخمر
- كل
- تمكين
- تمكن
- تمكين
- النهاية
- طاقة
- البيئات
- في النهاية
- مثال
- المثيره
- الخبره في مجال الغطس
- مكشوف
- يسر
- FAST
- الشكل
- العثور على
- النتائج
- الأول
- يتبع
- طعام
- في حالة
- النموذج المرفق
- تبدأ من
- مستقبل
- العلاجات العامة
- توليد
- عملاق
- منح
- معطى
- يعطي
- Go
- شراء مراجعات جوجل
- يفهم، يمسك، يقبض
- توصل
- يملك
- مساعدة
- مفيد
- مساعدة
- رفيع المستوى
- الصفحة الرئيسية
- كيفية
- كيفية
- HTML
- HTTPS
- البشر
- تحديد
- if
- صور
- التأثير
- مستحيل
- تحسن
- in
- تتضمن
- يشمل
- صناعي
- معلومات
- تعليمات
- Internet
- إلى
- IT
- انها
- JPG
- م
- المعرفة
- لغة
- كبير
- والأخير
- العام الماضي
- تعلم
- تعلم
- يتيح
- مستوى
- مثل
- على الأرجح
- القليل
- الأحمال
- آلة
- آلة التعلم
- كثير
- مادة
- ماكس العرض
- مايو..
- معنى
- غضون ذلك
- ربما
- نموذج
- عارضات ازياء
- أكثر
- خطوة
- متعدد
- طبيعي
- حاجة
- جديد
- التالي
- لا
- نوفمبر
- موضوع
- of
- on
- online
- فقط
- على
- or
- الطلبات
- أخرى
- خارج
- على مدى
- الخاصة
- ورق
- المعلمات
- أجزاء
- أنماط
- مجتمع
- فى المائة
- نفذ
- أداء
- ربما
- شخص
- اختيار
- قطعة
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- فرقعة
- سابق
- مشاكل
- البرنامج
- برمجة وتطوير
- نشرت
- الأسئلة المتكررة
- معدل
- بدلا
- رد فعل
- سبب
- يشير
- العلاقات
- صدر
- مثل
- ممثلة
- تطلب
- يتطلب
- الباحثين
- الرد
- الاستجابة
- رجل الالي
- الروبوتات
- الروبوتات
- صخرة
- s
- سيناريوهات
- مشهد
- يبدو
- يرى
- عقوبة
- الخدمة
- طقم
- ضبط
- قصير
- أظهرت
- يظهر
- الاشارات
- منذ
- مهارات
- صغير
- So
- تطبيقات الكمبيوتر
- حل
- بعض
- على وجه التحديد
- خطوة
- خطوات
- لا يزال
- بناء
- تحقيق النجاح
- ناجح
- بنجاح
- هذه
- نظام
- جدول
- أخذ
- مع الأخذ
- مهمة
- المهام
- يعلم
- فريق
- التكنولوجيا
- أن
- •
- من مشاركة
- منهم
- then
- هناك.
- تشبه
- هم
- الأشياء
- هؤلاء
- على الرغم من؟
- عبر
- الوقت
- متعب
- إلى
- سويا
- الرموز
- قطار
- متدرب
- قادة الإيمان
- محول
- هائل
- فهم
- حتى
- us
- تستخدم
- مستعمل
- مستخدم
- يستخدم
- استخدام
- عادة
- تشكيلة
- رؤيتنا
- وكان
- أسبوع
- وزن
- كان
- ابحث عن
- أيا كان
- متى
- التي
- في حين
- سوف
- مع
- في غضون
- كلمة
- كلمات
- للعمل
- أعمال
- سوف
- اكتب
- كتب
- X's
- عام
- حتى الآن
- زفيرنت