تم تصنيف الذكاء الاصطناعي الجديد من Meta ضمن أفضل 10% في لعبة "الدبلوماسية" - ولم يكن اللاعبون البشريون هم الأكثر حكمة في ذكاء بيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

تم تصنيف الذكاء الاصطناعي الجديد لشركة Meta ضمن أفضل 10٪ في "الدبلوماسية" للعبة - ولم يكن اللاعبون البشريون أكثر حكمة

لقد أتقن الذكاء الاصطناعي بعضًا من أكثرها إتقانًا ألعاب معقدة معروف للإنسان ، ولكن في حين أنه غالبًا ما يتفوق في المنافسة ، فإن التعاون لا يأتي بشكل طبيعي. الآن أتقن الذكاء الاصطناعي من Meta لعبة Diplomacy ، والتي تتطلب منك العمل مع لاعبين آخرين للفوز.

إتقان Google لـ لعبة Go تم الترحيب به باعتباره معلمًا رئيسيًا للذكاء الاصطناعي ، ولكن على الرغم من تعقيده الذي لا يمكن إنكاره ، فإنه من نواح كثيرة مناسب تمامًا لمنطق الآلة البارد. إنها لعبة معلومات مثالية ، حيث يكون لديك رؤية كاملة لتحركات خصمك ، والفوز يعني ببساطة أن تكون قادرًا على التفوق على لاعب آخر.

الدبلوماسية ، من ناحية أخرى ، هي مسألة فوضوية إلى حد كبير. ترى لعبة اللوحة ما يصل إلى سبعة لاعبين على مدى وتستخدم القوى العسكرية الأوروبية جيوشها للسيطرة على المدن الإستراتيجية. لكن يُسمح للاعبين بالتفاوض مع بعضهم البعض لتشكيل التحالفات وكسرها سعياً وراء الهيمنة الكاملة.

علاوة على ذلك ، يتم إجراء جميع حركات اللاعبين في وقت واحد في كل دور ، لذلك لا يمكنك ببساطة الرد على ما يفعله الآخرون. هذا يعني أن الفوز في الألعاب يتطلب مزيجًا معقدًا من التفكير الاستراتيجي والقدرة على التعاون مع لاعبين آخرين ومهارات تفاوض مقنعة. بينما أتقن الذكاء الاصطناعي بالفعل الإستراتيجية البحتة ، فقد ثبت أن تكرار تلك المهارات الأخرى أكثر صعوبة.

ربما يكون الذكاء الاصطناعي الجديد الذي صممه باحثون في Meta قد اتخذ خطوة كبيرة في هذا الاتجاه. في ورقة نشرت الأسبوع الماضي in علوم, يصفون نظامًا يُدعى Cicero احتل المرتبة الأولى من بين أفضل 10 في المائة من اللاعبين في دوري دبلوماسي عبر الإنترنت وحقق أكثر من ضعف متوسط ​​درجات اللاعبين البشريين.

"شيشرون يتمتع بالمرونة والقسوة والصبر "، بطل العالم للدبلوماسية ثلاث مرات أندرو جوف ساid في فيديو من إنتاج شركة Meta. "إنها تلعب بدون الكثير من المشاعر الإنسانية التي تجعلك تتخذ قرارات سيئة في بعض الأحيان. إنه يقيّم الموقف فقط ويتخذ القرار الأفضل ، ليس فقط من أجله ، ولكن للأشخاص الذين يعملون معهم ".

يتطلب إنشاء Cicero من الباحثين الفوقيين الجمع بين أحدث أساليب الذكاء الاصطناعي من مجالين فرعيين مختلفين: التفكير الاستراتيجي ومعالجة اللغة الطبيعية. يحتوي النظام في جوهره على خوارزمية تخطيط تتنبأ بتحركات اللاعبين الآخرين وتستخدم ذلك لتحديد استراتيجيتها الخاصة. تم تدريب هذه الخوارزمية من خلال جعل الذكاء الاصطناعي يلعب نفسه مرارًا وتكرارًا ، مع محاولة تقليد الطريقة التي يلعب بها البشر اللعبة.

أظهر الباحثون بالفعل أن وحدة التخطيط هذه وحدها كانت قادرة على ذلك تغلب على الايجابيات البشرية في نسخة مبسطة من اللعبة. لكن في هذا البحث الأخير ، قام الفريق بدمجه مع نموذج لغوي كبير تم تدريبه على كميات هائلة من النصوص من الإنترنت ، ثم صقله باستخدام حوار من 40,000 ألف لعبة عبر الإنترنت للدبلوماسية. أعطى هذا Cicero الذي تمت ترقيته القدرة على تفسير الرسائل من لاعبين آخرين و أيضا صياغة خاصة بها رسائل لإقناعهم بالعمل معًا.

يبدأ النظام المدمج باستخدام الحالة الحالية للوحة والحوار السابق للتنبؤ بما يحتمل أن يفعله كل لاعب. ثم تأتي بخطة عمل لنفسها ولشركائها قبل إنشاء رسائل مصممة لتحديد نواياها وضمان تعاون اللاعبين الآخرين.

أكثر من 40 مباراة في البطولة عبر الإنترنت ، تواصل Cicero بفعالية مع 82 لاعبًا آخر لشرح نواياهم وتنسيق الإجراءات والتفاوض على التحالفات. يقول الباحثون بشكل حاسم إنهم لم يروا أي دليل من الرسائل داخل اللعبة على أن اللاعبين البشريين اشتبهوا في أنهم يتعاونون مع الذكاء الاصطناعي.

ومع ذلك ، لم تكن القدرات التواصلية للنموذج خالية من العيوب. إنها أكثر من قادرة على بث رسائل غير منطقية أو رسائل غير متوافقة مع أهدافها ، لذلك كان على الباحثين إنشاء رسائل مرشحة متعددة في كل خطوة ثم استخدام آليات تصفية مختلفة للتخلص من القمامة. وحتى ذلك الحين ، يعترف الباحثون بأن الرسائل غير المنطقية تنزلق أحيانًاPED من خلال.

يشير هذا إلى أن نموذج اللغة في قلب شيشرون ما زال لا يفهم حقًا ما يجري ، وهو ببساطة ينتج رسائل تبدو معقولة والتي تحتاج بعد ذلك إلى التدقيق للتأكد من تحقيقها للنتائج المرجوة.

الكتابة في المحادثة, كما أشار الباحث في مجال الذكاء الاصطناعي ، توبي والش في جامعة نيو ساوث ويلز في أستراليا ، إلى أن شيشرون صادق بلا خطأ ، على عكس معظم اللاعبين البشر. في حين أن هذه استراتيجية فعالة بشكل مدهش ، فقد تكون نقطة ضعف رئيسية إذا اكتشف المنافسون أن خصمهم لن يحاول خداعهم أبدًا.

التقدم مهم ، ومع ذلك ، يأمل Facebook أن يكون لديه تطبيقات تتجاوز ألعاب الطاولة. في مشاركة مدونةيقول الباحثون إن القدرة على استخدام خوارزميات التخطيط للتحكم في توليد اللغة يمكن أن تجعل من الممكن إجراء محادثات أطول وأكثر ثراءً مع روبوتات الدردشة التي تعمل بالذكاء الاصطناعي أو إنشاء شخصيات ألعاب فيديو يمكنها التكيف مع سلوك اللاعب.

الصورة الائتمان: MabelAmber / 4008 صور

الطابع الزمني:

اكثر من التفرد المحور