يتيح دماغ الروبوتات الشبيه بـ ChatGPT من DeepMind لهم التعلم من الإنترنت

أعاد نشره أفلاطون

المتابعون: 0

منذ ظهور ChatGPT على الساحة التقنية في تشرين الثاني (نوفمبر) من العام الماضي ، كان يساعد الناس على كتابة جميع أنواع المواد وإنشاء التعليمات البرمجية والعثور على المعلومات. لقد سهلت هذه التقنية ونماذج اللغات الكبيرة الأخرى (LLMs) المهام من إرسال مكالمات خدمة العملاء إلى تلقي طلبات الوجبات السريعة. بالنظر إلى مدى فائدة LLMs للبشر في الوقت القصير الذي كانوا موجودين فيه ، كيف يمكن أن تؤثر ChatGPT للروبوتات على قدرتها على التعلم والقيام بأشياء جديدة؟ قرر الباحثون في Google DeepMind اكتشاف ونشر نتائجهم في ملف بلوق وظيفة والورق صدر الأسبوع الماضي.

يسمون نظامهم RT-2. إنه اختصار لمحول الروبوتات 2 ، وهو الوريث محول الروبوتات 1الذي أصدرته الشركة في نهاية العام الماضي. يعتمد RT-1 على برنامج صغير للغة والرؤية وتم تدريبه خصيصًا للقيام بالعديد من المهام. تم استخدام البرنامج في Alphabet X's الروبوتات اليومية، مما يمكنهم من القيام بأكثر من 700 مهمة مختلفة بمعدل نجاح 97 بالمائة. ولكن عندما طُلب منهم القيام بمهام جديدة لم يتم تدريبهم عليها ، كانت الروبوتات التي تستخدم RT-1 ناجحة فقط بنسبة 32٪ من الوقت.

يضاعف RT-2 هذا المعدل تقريبًا ، حيث يؤدي بنجاح مهام جديدة بنسبة 62 بالمائة من الوقت المطلوب. يطلق الباحثون على RT-2 نموذج الرؤية واللغة والعمل (VLA). تستخدم النصوص والصور التي تراها على الإنترنت لتعلم مهارات جديدة. هذا ليس بالبساطة التي يبدو عليها. يتطلب البرنامج أولاً "فهم" المفهوم ، ثم تطبيق هذا الفهم على أمر أو مجموعة من التعليمات ، ثم تنفيذ الإجراءات التي تلبي تلك التعليمات.

أحد الأمثلة التي قدمها مؤلفو الورقة هو التخلص من القمامة. في النماذج السابقة ، يجب تدريب برنامج الروبوت أولاً على تحديد القمامة. على سبيل المثال ، إذا كانت هناك موزة مقشرة على طاولة وبجانبها القشرة ، فسيظهر للروبوت أن القشر عبارة عن قمامة بينما الموز ليس كذلك. سيتم بعد ذلك تعليمه كيفية التقاط القشرة ونقلها إلى سلة المهملات وإيداعها هناك.

يعمل RT-2 بشكل مختلف قليلاً. نظرًا لأن النموذج قد تدرب على كميات كبيرة من المعلومات والبيانات من الإنترنت ، فلديه فهم عام لماهية المهملات ، وعلى الرغم من أنه لم يتم تدريبه على التخلص من القمامة ، إلا أنه يمكنه تجميع الخطوات معًا لإكمال هذه المهمة.

LLMs التي استخدمها الباحثون لتدريب RT-2 هي بالي-X (نموذج الرؤية واللغة مع 55 مليار معلمة) ، و بالم-E (ما تسميه Google نموذج لغة متعدد الوسائط ، تم تطويره خصيصًا للروبوتات ، مع 12 مليار معلمة). تشير "المعلمة" إلى سمة يحددها نموذج التعلم الآلي بناءً على بيانات التدريب الخاصة به. في حالة LLMs ، يقومون بنمذجة العلاقات بين الكلمات في الجملة ويوازنون مدى احتمالية أن تكون كلمة معينة مسبوقة أو متبوعة بكلمة أخرى.

من خلال إيجاد العلاقات والأنماط بين الكلمات في مجموعة بيانات عملاقة ، تتعلم النماذج من استنتاجاتهم الخاصة. يمكنهم في النهاية اكتشاف كيفية ارتباط المفاهيم المختلفة ببعضها البعض وتمييز السياق. في حالة RT-2 ، تترجم هذه المعرفة إلى تعليمات معممة للأعمال الروبوتية.

يتم تمثيل هذه الإجراءات للروبوت كرموز ، والتي تُستخدم عادةً لتمثيل نص بلغة طبيعية في شكل أجزاء كلمة. في هذه الحالة ، تكون الرموز المميزة جزءًا من إجراء ، ويقوم البرنامج بربط العديد من الرموز المميزة معًا لتنفيذ إجراء ما. يمكّن هذا الهيكل أيضًا البرنامج من إجراء استدلال متسلسل التفكير ، مما يعني أنه يمكنه الاستجابة للأسئلة أو المطالبات التي تتطلب درجة معينة من التفكير.

تشمل الأمثلة التي يقدمها الفريق اختيار كائن لاستخدامه كمطرقة عندما لا تتوفر مطرقة (يختار الروبوت صخرة) واختيار أفضل مشروب لشخص متعب (يختار الروبوت مشروب طاقة).

يتيح دماغ الروبوتات الشبيه بـ ChatGPT من DeepMind للروبوتات التعلم من ذكاء بيانات PlatoBlockchain عبر الإنترنت. البحث العمودي. منظمة العفو الدولية. — *حقوق الصورة: Google DeepMind*

كتب الباحثون في أحد مواقع Google: "تُظهر RT-2 قدرات تعميم محسّنة وفهمًا دلاليًا ومرئيًا يتجاوز البيانات الروبوتية التي تعرضت لها" بلوق وظيفة. "يتضمن ذلك تفسير الأوامر الجديدة والاستجابة لأوامر المستخدم من خلال تنفيذ التفكير البدائي ، مثل التفكير في فئات الكائنات أو الأوصاف عالية المستوى."

حلم الروبوتات للأغراض العامة يمكن أن يساعد البشر في كل ما قد يظهر - سواء في المنزل أو في مكان تجاري أو في بيئة صناعية - لن يكون قابلاً للتحقيق حتى تتمكن الروبوتات من التعلم أثناء التنقل. ما يبدو أنه أبسط غريزة بالنسبة لنا هو ، بالنسبة للروبوتات ، مزيج معقد من فهم السياق والقدرة على التفكير من خلاله واتخاذ الإجراءات لحل المشكلات التي لم يكن من المتوقع ظهورها. إن برمجتها للتفاعل بشكل مناسب مع مجموعة متنوعة من السيناريوهات غير المخطط لها أمر مستحيل ، لذلك يجب أن يكونوا قادرين على التعميم والتعلم من التجربة ، تمامًا كما يفعل البشر.

RT-2 هي خطوة في هذا الاتجاه. يعترف الباحثون ، على الرغم من ذلك ، أنه في حين أن RT-2 يمكن أن يعمم المفاهيم الدلالية والمرئية ، فإنه غير قادر بعد على تعلم أفعال جديدة بمفرده. بدلاً من ذلك ، فإنه يطبق الإجراءات التي يعرفها بالفعل على السيناريوهات الجديدة. ربما تكون RT-3 أو 4 قادرة على نقل هذه المهارات إلى المستوى التالي. في غضون ذلك ، كما يختتم الفريق في بلوق وظيفة، "بينما لا يزال هناك قدر هائل من العمل الذي يتعين القيام به لتمكين الروبوتات المفيدة في البيئات التي تركز على الإنسان ، يوضح لنا RT-2 مستقبلًا مثيرًا للروبوتات في متناول اليد."

الصورة الائتمان: جوجل DeepMind

محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
أفلاطون السيارات / المركبات الكهربائية ، كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
BlockOffsets. تحديث ملكية الأوفست البيئية. الوصول هنا.
المصدر https://singularityhub.com/2023/08/02/deepminds-chatgpt-like-brain-for-robots-lets-them-learn-from-the-internet/

الطابع الزمني: 2 أغسطس 2023

الطابع الزمني: أغسطس 23، 2022

DeepMind's ChatGPT-Like Brain للروبوتات يتيح لهم التعلم من الإنترنت

أعاد نشره أفلاطون

اكثر من التفرد المحور

علماء الفلك يربطون لأول مرة انفجارًا لاسلكيًا سريعًا غامضًا بموجات الجاذبية

يرسم AlphaFold AI الجديد من Google DeepMind الرقص الجزيئي للحياة في دقائق

لا يمكن للفيزياء الحديثة أن تشرح الحياة - ولكن قد تكون هناك نظرية جديدة تقول أن الوقت أساسي

التكنولوجيا على المدى الطويل: قم بالتصغير لترى كيف يمكن أن يتغير العالم بشكل كبير خلال العمر

ما هي وحدة معالجة الرسومات؟ الرقائق التي تغذي طفرة الذكاء الاصطناعي، ولماذا تبلغ قيمتها تريليونات

قد يمنح قياس الهيليوم في المجرات البعيدة علماء الفيزياء نظرة ثاقبة حول سبب وجود الكون

يقوم العلماء بكهربة علم الأحياء عن طريق تحويل التيار إلى الوقود الكيميائي للخلايا

هل يمكننا منع القلب من الشيخوخة؟ قام العلماء بتسلسل خلايا القلب المفردة كبداية

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي