يتطلب تدريس الخوارزميات لتقليد البشر عادةً مئات أو آلاف الأمثلة. لكن الذكاء الاصطناعي الجديد من Google DeepMind يمكنه اكتساب مهارات جديدة من المتظاهرين البشريين بسرعة.
واحدة من أعظم الحيل البشرية هي قدرتنا على اكتساب المعرفة بسرعة وكفاءة من بعضنا البعض. هذا النوع من التعلم الاجتماعي، والذي يشار إليه غالبًا باسم النقل الثقافي، هو ما يسمح لنا أن نظهر لزميل كيفية استخدام أداة جديدة أو تعليم أطفالنا أغاني الأطفال.
وليس من المستغرب أن يحاول الباحثون تكرار العملية في الآلات. لقد كان التعلم بالتقليد، حيث يشاهد الذكاء الاصطناعي الإنسان وهو يكمل مهمة ثم يحاول تقليد سلوكه، أسلوبًا شائعًا منذ فترة طويلة لتدريب الروبوتات. ولكن حتى خوارزميات التعلم العميق الأكثر تقدمًا اليوم تحتاج عادةً إلى رؤية العديد من الأمثلة قبل أن تتمكن من نسخ مدربيها بنجاح.
عندما يتعلم البشر من خلال التقليد، يمكنهم في كثير من الأحيان التقاط مهام جديدة بعد عدد قليل من العروض التوضيحية. الآن، اتخذ باحثو Google DeepMind خطوة نحو التعلم الاجتماعي السريع في الذكاء الاصطناعي مع وكلاء يتعلمون التنقل في عالم افتراضي من البشر في الوقت الفعلي.
وكتب الباحثون في مقالة: "ينجح عملاؤنا في تقليد الإنسان في الوقت الفعلي في سياقات جديدة دون استخدام أي بيانات بشرية تم جمعها مسبقًا". الورق في طبيعة الاتصالات. "لقد حددنا مجموعة بسيطة بشكل مدهش من المكونات الكافية لتوليد النقل الثقافي.
وقام الباحثون بتدريب عملائهم في جهاز محاكاة مصمم خصيصًا يسمى GoalCycle3D. يستخدم جهاز المحاكاة خوارزمية لإنشاء عدد لا نهائي تقريبًا من البيئات المختلفة بناءً على قواعد حول كيفية عمل المحاكاة وجوانبها التي يجب أن تختلف.
في كل بيئة، فقاعة صغيرة تشبه وكلاء منظمة العفو الدولية يجب أن تتنقل عبر التضاريس غير المستوية والعقبات المختلفة للمرور عبر سلسلة من المجالات الملونة بترتيب معين. تختلف وعورة التضاريس وكثافة العوائق وتكوين المجالات بين البيئات.
يتم تدريب الوكلاء على التنقل باستخدام تعزيز التعلم. إنهم يحصلون على مكافأة مقابل المرور عبر المجالات بالترتيب الصحيح ويستخدمون هذه الإشارة لتحسين أدائهم خلال العديد من التجارب. ولكن بالإضافة إلى ذلك، تتميز البيئات أيضًا بوجود وكيل خبير - والذي يكون إما مشفرًا أو يتحكم فيه الإنسان - والذي يعرف بالفعل الطريق الصحيح خلال المسار.
من خلال العديد من الدورات التدريبية، يتعلم عملاء الذكاء الاصطناعي ليس فقط أساسيات كيفية عمل البيئات، ولكن أيضًا أن أسرع طريقة لحل كل مشكلة هي تقليد الخبير. للتأكد من أن الوكلاء كانوا يتعلمون التقليد بدلاً من مجرد حفظ الدورات التدريبية، قام الفريق بتدريبهم على مجموعة واحدة من البيئات ثم اختبارهم على مجموعة أخرى. والأهم من ذلك، بعد التدريب، أظهر الفريق أن وكلاءهم يمكنهم تقليد خبير والاستمرار في اتباع المسار حتى بدون الخبير.
يتطلب هذا بعض التعديلات على أساليب التعلم المعزز القياسية.
جعل الباحثون الخوارزمية تركز على الخبير من خلال جعلها تتنبأ بموقع العامل الآخر. لقد أعطوها أيضًا وحدة ذاكرة. أثناء التدريب، كان الخبير يدخل ويخرج من البيئات، مما يجبر الوكيل على حفظ أفعاله عندما لم يعد موجودًا. تم تدريب الذكاء الاصطناعي أيضًا على مجموعة واسعة من البيئات، مما ضمن له رؤية مجموعة واسعة من المهام المحتملة.
قد يكون من الصعب ترجمة هذا النهج إلى مجالات أكثر عملية. أحد القيود الرئيسية هو أنه عندما اختبر الباحثون ما إذا كان الذكاء الاصطناعي يمكنه التعلم من العروض البشرية، كان العميل الخبير يتحكم فيه شخص واحد خلال جميع الدورات التدريبية. وهذا يجعل من الصعب معرفة ما إذا كان بإمكان العملاء التعلم من مجموعة متنوعة من الأشخاص.
والأمر الأكثر إلحاحًا هو أن القدرة على تغيير بيئة التدريب بشكل عشوائي سيكون من الصعب إعادة إنشائها في العالم الحقيقي. وكانت المهمة الأساسية بسيطة، ولا تتطلب تحكمًا حركيًا دقيقًا، وتحدث في بيئات افتراضية يتم التحكم فيها بشكل كبير.
ومع ذلك، لا يزال التقدم في التعلم الاجتماعي في مجال الذكاء الاصطناعي موضع ترحيب. إذا أردنا أن نعيش في عالم به آلات ذكية، فإن إيجاد طرق فعالة وبديهية لمشاركة تجاربنا وخبراتنا معهم سيكون أمرًا بالغ الأهمية.
الصورة الائتمان: جوليانا وماريانا أموريم / Unsplash
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://singularityhub.com/2023/12/01/this-deepmind-ai-rapidly-learns-new-skills-just-by-watching-humans/
- :لديها
- :يكون
- :ليس
- $ UP
- a
- القدرة
- من نحن
- كسب
- الإجراءات
- إضافة
- متقدم
- بعد
- الوكيل
- عملاء
- AI
- خوارزمية
- خوارزميات
- الكل
- يسمح
- تقريبا
- سابقا
- أيضا
- an
- و
- آخر
- أي وقت
- نهج
- اقتراب
- هي
- AS
- الجوانب
- At
- على أساس
- BE
- كان
- قبل
- سلوك
- ما بين
- واسع
- لكن
- by
- تسمى
- CAN
- أطفال
- الزميل
- إكمال
- الاعداد
- السياقات
- استمر
- مراقبة
- ذو شاهد
- تصحيح
- استطاع
- الدورة
- دورات
- ائتمان
- حاسم
- بشكل حاسم
- ثقافي
- البيانات
- عميق
- التعلم العميق
- العقل العميق
- تصميم
- مختلف
- صعبة
- المجالات
- قطرة
- أثناء
- e
- كل
- كسب
- فعال
- بكفاءة
- إما
- التي لا نهاية لها
- ضمان
- مكفول
- البيئة
- البيئات
- حتى
- أمثلة
- الخبره في مجال الغطس
- خبير
- خبرة
- الميزات
- قليل
- العثور على
- نهاية
- تركز
- اتباع
- في حالة
- إجبار
- تبدأ من
- أساسيات
- أعطى
- توليد
- توليد
- شراء مراجعات جوجل
- أعظم
- حفنة
- الثابت
- يملك
- وجود
- جدا
- كيفية
- كيفية
- HTTPS
- الانسان
- البشر
- مئات
- تحديد
- if
- تحسن
- in
- ذكي
- حدسي
- IT
- انها
- م
- القفل
- نوع
- علم
- المعرفة
- يعرف
- تعلم
- تعلم
- يتعلم
- تحديد
- حي
- موقع
- طويل
- يعد
- الآلات
- صنع
- يصنع
- كثير
- مكبر الصوت : يدعم، مع دعم ميكروفون مدمج لمنع الضوضاء
- ربما
- وحدة
- الأكثر من ذلك
- أكثر
- محرك
- يجب
- الطبيعة
- التنقل
- حاجة
- جديد
- لا
- رواية
- الآن
- عدد
- العقبات
- تحدث
- of
- غالبا
- on
- ONE
- فقط
- طريقة التوسع
- or
- طلب
- أخرى
- لنا
- خارج
- على مدى
- pass
- مرور
- مجتمع
- أداء
- شخص
- اختيار
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- الرائج
- ممكن
- عملية
- تنبأ
- يقدم
- المشكلة
- عملية المعالجة
- التقدّم
- أسرع
- نطاق
- سريع
- بسرعة
- بدلا
- حقيقي
- العالم الحقيقي
- في الوقت الحقيقي
- يشار
- مطلوب
- يتطلب
- الباحثين
- مكافأة
- الروبوتات
- طريق
- القواعد
- يدير
- رأى
- انظر تعريف
- مسلسلات
- طقم
- مشاركة
- ينبغي
- إظهار
- أظهرت
- سيجنل
- الاشارات
- محاكاة
- محاكاة
- مهارات
- صغير
- العدالة
- حل
- خصيصا
- محدد
- معيار
- خطوة
- النجاح
- بنجاح
- كاف
- مفاجأة
- اتخذت
- مهمة
- المهام
- فريق
- تضاريس
- اختبار
- من
- أن
- •
- من مشاركة
- منهم
- then
- هم
- على الرغم من؟
- الآلاف
- عبر
- الوقت
- إلى
- اليوم
- أداة
- نحو
- متدرب
- قادة الإيمان
- ترجمه
- محاكمات
- حاول
- القرص
- عادة
- التي تقوم عليها
- us
- تستخدم
- يستخدم
- استخدام
- تشكيلة
- مختلف
- افتراضي
- العالم الافتراضي
- وكان
- الساعات
- مراقبة
- طريق..
- طرق
- ترحيب
- كان
- ابحث عن
- متى
- سواء
- التي
- واسع
- مدى واسع
- سوف
- مع
- بدون
- العالم
- سوف
- اكتب
- زفيرنت