نسخة رقمية من الأرض في ذكاء بيانات PlatoBlockchain في الكمبيوتر العملاق. البحث العمودي. منظمة العفو الدولية.

نسخة رقمية من Earth في كمبيوتر عملاق

قالت Meta Platforms Inc ، الشركة الأم لـ Facebook ، إنها أنشأت ذكاءً اصطناعيًا يمكن أن يتفوق على البشر في نسخة عبر الإنترنت من اللعبة الإستراتيجية الشهيرة ، Diplomacy ، حيث يتنافس سبعة لاعبين للسيطرة الجغرافية على أوروبا عن طريق تحريك القطع على الخريطة.

قال ميتا في ورقة بحثية نُشرت على موقع Science.com كان شيشرون أول وكيل ذكاء اصطناعي يحقق أداءً على المستوى البشري في الدبلوماسية ، وهي لعبة تنطوي على التعاون والمنافسة التي تؤكد على التفاوض اللغوي الطبيعي والتنسيق التكتيكي بين سبعة لاعبين.

في إجمالي 40 لعبة مجهولة الهوية للدبلوماسية عبر الإنترنت ، قال ميتا إن شيشرون حقق أكثر من ضعف متوسط ​​درجات اللاعبين البشريين واحتلت مرتبة ضمن أفضل 10٪ من المشاركين الذين لعبوا أكثر من لعبة واحدة.

قالت مجموعة التكنولوجيا الرائدة أن هذا كان جزءًا من هدفها الاستراتيجي طويل المدى في مجال الذكاء الاصطناعي لبناء وكلاء يمكنهم التخطيط والتنسيق والتفاوض مع البشر بلغة طبيعية.

ما هي أهمية شيشرون؟

يقول ميتا إن شيشرون مهم جدًا لأن الذكاء الاصطناعي يعتمد على بيئات غير معادية.

على عكس الماضي حيث كانت النجاحات الرئيسية السابقة للذكاء الاصطناعي متعدد الوكلاء في بيئات معارضة بحتة ، مثل الشطرنج والجو والبوكر ، حيث لا قيمة للتواصل ، يستخدم Cicero محركًا استراتيجيًا للتفكير ووحدة حوار يمكن التحكم فيها.

لهذه الأسباب ، يقول ميتا إن الدبلوماسية كانت بمثابة معيار صعب للتعلم متعدد الوكلاء.

"يقرن شيشرون وحدة حوار يمكن التحكم فيها بمحرك تفكير استراتيجي. في كل نقطة من اللعبة ، يصمم شيشرون كيف من المحتمل أن يتصرف اللاعبون الآخرون بناءً على حالة اللعبة ومحادثاتهم ،ميتا يقول.

ثم يخطط الذكاء الاصطناعي كيف يمكن للاعبين التنسيق بما يحقق مصلحتهم المشتركة ويرسم هذه الخطط في رسائل بلغة طبيعية.

عدم ثقة صحي

يتجنب شيشرون الثقة العمياء في مقترحات اللاعبين الآخرين ويرفض الخطط ذات "القيمة المتوقعة" المنخفضة والتي تسير بالتوازي مع مصالحها الخاصة.

نظرًا لحقيقة أن الحوار في الدبلوماسية يحدث بشكل خاص بين أزواج من اللاعبين ، فإن شيشرون يفسر ويحلل المعلومات التي يمكن للاعبين الوصول إليها عند إجراء التنبؤات.

"على سبيل المثال ، إذا كان شيشرون ينسق هجومًا مع حليف ضد خصم ، فإن توقع شيشرون لسياسة الخصم يجب أن يفسر حقيقة أن الخصم ليس على علم بالتنسيق المقصود ،"قال ميتا.

تقول ميتا إنها دخلت شيشرون دون الكشف عن هويتها في 40 مباراة دبلوماسية في دوري على الإنترنت للاعبين من البشر بين 19 أغسطس و 13 أكتوبر 2022.

على مدار 72 ساعة من اللعب التي تضمنت إرسال 5,277 رسالة ، احتل شيشرون المرتبة الأولى بين 10٪ من المشاركين الذين لعبوا أكثر من لعبة واحدة.

تقول Meta إنها جمعت بيانات من 125,261 لعبة دبلوماسية تم لعبها عبر الإنترنت على webDiplomacy.net. من بين هذه الألعاب ، احتوت 40,408 لعبة على حوار ، حيث تم تبادل 12,901,662 رسالة بين اللاعبين.

موجه: "روبوت يضرب الجميع في لعبة دبلوماسية" (من إنتاج الذكاء الاصطناعي).

تلاحظ Meta ، أن الذكاء الاصطناعي الجديد الخاص بها بعيد كل البعد عن الكمال

أرسل شيشرون رسائل تحتوي على أخطاء ، وتتناقض أحيانًا مع خططها الخاصة وترتكب أخطاء استراتيجية.

لكن Meta يصر على أن البشر مع ذلك اختاروا التعاون مع الذكاء الاصطناعي على لاعبين آخرين دون أن يدركوا أنه روبوت.

"تقريبًا جميع الاختراقات السابقة للذكاء الاصطناعي في الألعاب كانت في إعدادات مجموع الصفر للاعبين (2p0s) ، بما في ذلك الشطرنج و Go و Head-up Poker و StarCraft. في ألعاب 2p0 المحدودة ، ستتقارب بعض خوارزميات التعلم المعزز (RL) التي تتعلم من خلال اللعب ضد نفسها - وهي عملية تعرف باسم اللعب الذاتي - إلى سياسة لا تقبل المنافسة في التوقع في الألعاب المتوازنة "، أضاف ميتا في الورقة. "بعبارة أخرى ، أي لعبة 2p0s محدودة يمكن حلها من خلال اللعب الذاتي بحوسبة كافية وقدرة نموذجية."

ومع ذلك ، قال ميتا فيما يتعلق بالألعاب التي تنطوي على التعاون ، فإن اللعب الذاتي بدون بيانات بشرية لم يعد مضمونًا للعثور على سياسة تؤدي أداءً جيدًا مع البشر ، حتى مع الحوسبة اللانهائية وقدرة النموذج ، لأن عامل اللعب الذاتي قد يتقارب مع سياسة هي تتعارض مع المعايير والتوقعات البشرية.

يتوقع شيشرون الإجراءات المحتملة

أضاف Meta أن Cicero يتوقع الإجراءات المحتملة لكل لاعب بناءً على حالة اللوحة والحوار ، باستخدام ذلك كنقطة انطلاق لخوارزمية التخطيط باستخدام النماذج المدربة على RL.

تقول الشركة إن الذكاء الاصطناعي يستخدم وحدة تفكير إستراتيجية لتحديد النوايا والإجراءات بذكاء.

تقوم هذه الوحدة بعد ذلك بتشغيل خوارزمية تخطيط تتنبأ بسياسات جميع اللاعبين الآخرين استنادًا إلى حالة اللعبة والحوار ويأخذ في الاعتبار قوة الإجراءات المختلفة واحتمالية حدوثها في الألعاب البشرية. بناءً على هذه المعلومات والمتغيرات ، يتم اتخاذ أفضل إجراء لـ Cicero.

تحت قيادة مؤسس Meta ومديرها التنفيذي مارك زوكربيرج ، استثمرت الشركة بشكل كبير في الذكاء الاصطناعي والميتافيرس للاستفادة من الصناعة سريعة النمو التي يُنظر إليها على أنها مستقبل التكنولوجيا.

/ميتا نيوز

الطابع الزمني:

اكثر من ميتا نيوز