لماذا يحب الجميع ذكاء بيانات ChatGPT Chatbot PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

لماذا يحب الجميع chatbot ChatGPT

هناك لعبة أخرى يُعتقد منذ فترة طويلة أنها تمثل تحديًا كبيرًا للذكاء الاصطناعي (AI) للتغلب عليها ، وقد سقطت في أيدي الروبوتات: Stratego.

DeepNash ، ذكاء اصطناعي من صنع شركة مقرها لندن العقل العميق، تتطابق الآن مع البشر الخبراء في Stratego ، وهي لعبة لوحية تتطلب تفكيرًا استراتيجيًا طويل المدى ضد المعلومات غير الكاملة.

يأتي هذا العمل الفذ الأخير في أعقاب فوز كبير آخر للذكاء الاصطناعي في الألعاب التي كان يُعتقد سابقًا أنها قوة البشر.

الأسبوع الماضي فقط ، ميتا شيشرون ، ذكاء اصطناعي يمكن أن يتفوق على اللاعبين البشريين في لعبة الدبلوماسية ، صنع التاريخ لخصوم أذكياء على الإنترنت.

يقول مايكل ويلمان من جامعة ميتشيغان في آن أربور ، عالم الكمبيوتر الذي يدرس التفكير الاستراتيجي واللعبة نظرية.

قال ويلمان: "تختلف الإستراتيجية والدبلوماسية تمامًا عن بعضهما البعض ، كما أنهما تمتلكان ميزات صعبة تختلف بشكل ملحوظ عن الألعاب التي تم تحقيق معالم مماثلة لها".

معلومات غير كاملة

تتميز اللعبة بخصائص أكثر تعقيدًا بشكل عام من لعبة الشطرنج أو لعبة Go أو البوكر. لقد أتقنت أنظمة الذكاء الاصطناعي لعبة الشطرنج وجو والبوكر.

في لعبة ستراتيجو ، وضع لاعبان 40 قطعة لكل منهما على لوح ، لكن يجب ألا يروا ما هي قطع خصمهم.

الهدف من اللعبة هو تحريك القطع بالتناوب للقضاء على قطع الخصم والتقاط العلم. 

شجرة لعبة ستراتيجو - رسم بياني لجميع الطرق الممكنة التي يمكن أن تسير بها اللعبة - بها 10535 حالة مقابل Go's 10360. 

عندما يتعلق الأمر بالمعلومات غير الكاملة في بداية اللعبة ، فإن لدى Stratego 1066 منصبًا خاصًا محتملاً ، وهو رقم يقزم فقط 106 من حالات البدء هذه في لعبة البوكر Texas Hold'em ثنائية اللاعبين.

يقول Julien Perolat ، الباحث في DeepMind ومقره باريس: "إن التعقيد الهائل لعدد النتائج المحتملة في Stratego يعني أن الخوارزميات التي تعمل بشكل جيد في ألعاب المعلومات المثالية ، وحتى تلك التي تعمل في لعبة البوكر ، لا تعمل".

تم تطوير DeepNash بواسطة Perolat وزملائه.

روبوت مستوحى من ناش

اسم الروبوت هو تكريم لعالم الرياضيات الأمريكي الشهير جون ناش ، الذي ابتكر نظرية توازن ناش التي تفترض أن هناك "مجموعة ثابتة من الاستراتيجيات" يمكن للاعبين اتباعها بطريقة لا يستفيد منها أي لاعب من خلال تغيير الإستراتيجية. بمفردهم. على هذا النحو ، تميل الألعاب إلى أن يكون لها صفر أو واحد أو أكثر من توازن ناش.

يجمع DeepNash بين خوارزمية التعلم المعزز والشبكة العصبية العميقة لإيجاد توازن ناش. 

بشكل عام ، التعلم المعزز هو المكان الذي يتفاعل فيه الوكيل الذكي (برنامج الكمبيوتر) مع البيئة ويتعلم أفضل سياسة لإملاء الإجراء لكل حالة من حالات اللعبة. 

من أجل الحصول على سياسة مثالية ، لعبت DeepNash إجمالي 5.5 مليار لعبة ضد نفسها. 

من حيث الجوهر ، إذا تمت معاقبة جانب ، تتم مكافأة الآخر ، ويتم تعديل متغيرات الشبكة العصبية - التي تمثل السياسة - وفقًا لذلك.

الذكاء الاصطناعي يتفوق على البشر في الإستراتيجية - تعرف على DeepMash

الذكاء الاصطناعي يتفوق على البشر في الإستراتيجية - تعرف على DeepMash

في مرحلة ما ، يتقارب DeepNash على توازن Nash التقريبي. على عكس الروبوتات الأخرى ، يقوم DeepNash بتحسين نفسه بدون sالبحث من خلال شجرة اللعبة.

لمدة أسبوعين ، لعب DeepNash ضد لاعبين ستراتيجو بشريين على منصة الألعاب عبر الإنترنت ، Gravon.

بعد التنافس في 50 مباراة ، احتل Ai المرتبة الثالثة بين جميع لاعبي Gravon Stratego منذ عام 2002. 

يقول عضو الفريق كارل تويلز ، باحث DeepMind ومقره في باريس: "يُظهر عملنا أن لعبة معقدة مثل الإستراتيجية ، تتضمن معلومات غير كاملة ، لا تتطلب تقنيات بحث لحلها". "إنها حقًا خطوة كبيرة إلى الأمام في مجال الذكاء الاصطناعي."

وقد أعجب باحثون آخرون بهذا العمل الفذ أيضًا.

نتائج مثيرة للإعجاب

يوافق نعوم براون ، الباحث في Meta AI ، ومقره مدينة نيويورك ، وعضو الفريق الذي أبلغ في عام 2019 عن لعبة AI Pluribus4 التي تلعب البوكر: "النتائج مذهلة".

في Meta ، الشركة الأم لـ Facebook ، قامت براون وزملاؤها ببناء ذكاء اصطناعي يمكنه لعب الدبلوماسية ، وهي لعبة يتنافس فيها سبعة لاعبين للسيطرة الجغرافية على أوروبا عن طريق تحريك القطع على الخريطة.

الهدف في الدبلوماسية هو السيطرة على مراكز الإمداد عن طريق تحريك الوحدات (الأساطيل والجيوش). 

يقول ميتا إن شيشرون مهم جدًا لأن الذكاء الاصطناعي يعتمد على بيئات غير معادية.

على عكس الماضي حيث كانت النجاحات الرئيسية السابقة للذكاء الاصطناعي متعدد الوكلاء في بيئات معارضة بحتة ، مثل الشطرنج والجو والبوكر ، حيث لا قيمة للتواصل ، يستخدم Cicero محركًا استراتيجيًا للتفكير ووحدة حوار يمكن التحكم فيها.

يقول براون: "عندما تتجاوز الألعاب ذات المحصلة الصفرية للاعبين ، فإن فكرة توازن ناش لم تعد مفيدة في اللعب بشكل جيد مع البشر".

قامت براون وفريقها بتدريب شيشرون باستخدام بيانات من 125,261 لعبة لنسخة عبر الإنترنت من الدبلوماسية تضم لاعبين بشريين. 

باستخدام بيانات اللعب الذاتي ووحدة التفكير الاستراتيجي (SRM) ، تعلم شيشرون أن يتنبأ بالحكم من خلال حالة اللعبة والرسائل المتراكمة والتحركات والسياسات المحتملة للاعبين الآخرين. 

الذكاء الاصطناعي يتفوق على البشر في الإستراتيجية - تعرف على DeepMash

الذكاء الاصطناعي يتفوق على البشر في الإستراتيجية - تعرف على DeepMash

تقول Meta إنها جمعت بيانات من 125,261 لعبة دبلوماسية تم لعبها عبر الإنترنت على webDiplomacy.net. من بين هذه الألعاب ، احتوت 40,408 لعبة على حوار ، حيث تم تبادل 12,901,662 رسالة بين اللاعبين.

سلوك العالم الحقيقي

يعتقد براون أن الروبوتات التي تمارس الألعاب مثل Cicero يمكنها التفاعل مع البشر وتفسير "الإجراءات البشرية دون المستوى أو حتى غير العقلانية التي يمكن أن تمهد الطريق لتطبيقات العالم الحقيقي."

يقول: "إذا كنت تصنع سيارة ذاتية القيادة ، فأنت لا تريد أن تفترض أن جميع السائقين الآخرين على الطريق عقلانيون تمامًا ، وسوف يتصرفون على النحو الأمثل".

ويضيف شيشرون ، خطوة كبيرة في هذا الاتجاه. "لا يزال لدينا قدم واحدة في عالم اللعبة ، ولكن لدينا الآن قدم واحدة في العالم الحقيقي أيضًا."

يتفق آخرون مثل ويلمان ، لكنهم يصرون على أن المزيد من العمل لا يزال يتعين القيام به. "العديد من هذه التقنيات ذات صلة بالفعل بما يتجاوز الألعاب الترفيهية" لتطبيقات العالم الحقيقي ، كما يقول. "ومع ذلك ، في مرحلة ما ، تحتاج مختبرات أبحاث الذكاء الاصطناعي الرائدة إلى تجاوز الإعدادات الترفيهية ، ومعرفة كيفية قياس التقدم العلمي في" ألعاب "العالم الواقعية الأكثر اسفنجة التي نهتم بها بالفعل".

/ميتا نيوز.

الطابع الزمني:

اكثر من ميتا نيوز