هوش مصنوعی جدید متا در رتبه 10 درصد برتر بازی «دیپلماسی» قرار گرفت – و بازیکنان انسانی هیچ یک از هوش داده پلاتو بلاک چین عاقل تر نبودند. جستجوی عمودی Ai.

هوش مصنوعی جدید متا در 10 درصد برتر بازی «دیپلماسی» قرار گرفت – و بازیکنان انسانی عاقلتر نبودند

هوش مصنوعی بر برخی از آنها مسلط است بازی های پیچیده برای انسان شناخته شده است، اما در حالی که اغلب در رقابت برتر است، همکاری به طور طبیعی به وجود نمی آید. اکنون یک هوش مصنوعی از متا بر بازی Diplomacy مسلط شده است که برای برنده شدن باید با بازیکنان دیگر کار کنید.

تسلط گوگل بر بازی Go به عنوان یک نقطه عطف بزرگ برای هوش مصنوعی مورد استقبال قرار گرفت، اما علیرغم پیچیدگی غیرقابل انکار آن، از بسیاری جهات به خوبی با منطق سرد و محاسباتی یک ماشین سازگار است. این یک بازی اطلاعات کامل است که در آن شما حرکات حریف خود را کاملاً مشاهده می کنید، و برنده شدن به سادگی به این معنی است که می توانید از یک بازیکن دیگر غلبه کنید.

از سوی دیگر، دیپلماسی امری بسیار آشفته‌تر است. بازی رومیزی تا هفت بازیکن را می بیند روی قدرت های نظامی اروپا و از ارتش خود برای کنترل شهرهای استراتژیک استفاده می کنند. اما بازیکنان مجاز به مذاکره با یکدیگر برای ایجاد و شکستن اتحادها در پی سلطه کامل هستند.

علاوه بر این، تمام حرکات بازیکنان به طور همزمان در هر نوبت انجام می شود، بنابراین شما نمی توانید به سادگی به کارهایی که دیگران انجام می دهند واکنش نشان دهید. این بدان معنی است که برنده شدن در بازی ها به ترکیبی پیچیده از تفکر استراتژیک، توانایی همکاری با سایر بازیکنان و مهارت های مذاکره متقاعد کننده نیاز دارد. در حالی که هوش مصنوعی در حال حاضر بر استراتژی خالص تسلط داشته است، این مهارت‌های دیگر برای تکرار بسیار دشوارتر شده‌اند.

با این حال، یک هوش مصنوعی جدید طراحی شده توسط محققان متا ممکن است گام بزرگی در این مسیر برداشته باشد. در یک مقاله منتشر شد هفته گذشته in علم, آنها سیستمی به نام سیسرو را توصیف می کنند که در بین 10 درصد بازیکنان برتر لیگ دیپلماسی آنلاین رتبه بندی می شود و بیش از دو برابر میانگین امتیاز بازیکنان انسانی به دست می آورد.

"سیسرو انعطاف پذیر است، بی رحم است و صبور است.id در ویدیو تولید شده توسط متا. "این بازی بدون احساسات انسانی زیادی بازی می کند که گاهی باعث می شود تصمیمات بدی بگیرید. فقط موقعیت را ارزیابی می کند و بهترین تصمیم را می گیرد، نه تنها برای آن، بلکه برای افرادی که با آنها کار می کند.»

ایجاد سیسرو به محققان متا نیاز داشت تا روش‌های هوش مصنوعی پیشرفته را از دو زیر زمینه مختلف ترکیب کنند: استدلال استراتژیک و پردازش زبان طبیعی. این سیستم در قلب خود یک الگوریتم برنامه ریزی دارد که حرکات بازیکنان دیگر را پیش بینی می کند و از آن برای تعیین استراتژی خود استفاده می کند. این الگوریتم با واداشتن هوش مصنوعی به بازی بارها و بارها و در عین حال تلاش برای تقلید از نحوه بازی انسان ها آموزش داده شد.

محققان قبلاً نشان داده بودند که این ماژول برنامه ریزی به تنهایی قادر به انجام این کار است ضرب و شتم جوانب مثبت انسان در نسخه ساده شده بازی اما در این جدیدترین تحقیق، تیم آن را با یک مدل زبان بزرگ که بر روی مقادیر وسیعی از متن از اینترنت آموزش داده شده بود، ترکیب کرد و سپس با استفاده از دیالوگ 40,000 بازی آنلاین دیپلماسی، آن را تنظیم کرد. این به سیسرو ارتقا یافته این توانایی را داد که هر دو پیام های بازیکنان دیگر را تفسیر کند و خود را نیز بسازد پیام برای متقاعد کردن آنها به همکاری

سیستم ترکیبی با استفاده از وضعیت فعلی تخته و گفتگوهای گذشته برای پیش بینی آنچه که هر بازیکن احتمالا انجام خواهد داد، شروع می شود. سپس قبل از ایجاد پیام هایی که برای مشخص کردن هدف خود و اطمینان از همکاری سایر بازیکنان طراحی شده است، برنامه عملی برای خود و شرکای خود ارائه می دهد.

سیسرو بیش از 40 بازی در مسابقات آنلاین به طور موثر با 82 بازیکن دیگر ارتباط برقرار کرد تا اهداف خود را توضیح دهد، اقدامات را هماهنگ کند، و در مورد اتحادها مذاکره کند. مهمتر از همه، محققان می گویند که هیچ مدرکی از پیام های درون بازی ندیدند که بازیکنان انسانی مشکوک به همکاری با یک هوش مصنوعی باشند.

با این حال، توانایی های ارتباطی مدل بی عیب و نقص نبود. این بیش از آن است که بتواند پیام‌های بی‌معنی یا پیام‌هایی را که با اهدافش سازگاری ندارد، بیرون بیاورد، بنابراین محققان مجبور شدند در هر حرکت چندین پیام کاندید تولید کنند و سپس از مکانیسم‌های مختلف فیلتر برای از بین بردن زباله‌ها استفاده کنند. و حتی پس از آن، محققان اعتراف می کنند که گاهی اوقات پیام های غیرمنطقی می لغزندپد از طریق.

این نشان می‌دهد که مدل زبان در قلب سیسرو هنوز واقعاً نمی‌داند چه اتفاقی می‌افتد و به سادگی پیام‌هایی با صدای معقول تولید می‌کند که پس از آن باید بررسی شوند تا اطمینان حاصل شود که به نتایج مطلوب می‌رسند.

نوشتن در گفتگو, توبی والش، محقق هوش مصنوعی در دانشگاه نیو ساوت ولز در استرالیا نیز خاطرنشان می کند که سیسرو برخلاف اکثر بازیکنان انسان، بی اشتباه صادق است. در حالی که این یک استراتژی شگفت آور موثر است، اما اگر رقبا متوجه شوند که حریف آنها هرگز سعی نخواهد کرد آنها را فریب دهد، می تواند یک ضعف بزرگ باشد.

با این وجود، پیشرفت قابل توجهی است و فیس بوک امیدوار است بتواند برنامه هایی فراتر از بازی های رومیزی داشته باشد. در یک پست وبلاگمحققان می‌گویند توانایی استفاده از الگوریتم‌های برنامه‌ریزی برای کنترل تولید زبان می‌تواند مکالمات طولانی‌تر و غنی‌تر با چت‌بات‌های هوش مصنوعی یا خلق شخصیت‌های بازی ویدیویی را که می‌توانند با رفتار بازیکن سازگار شوند، ممکن کند.

تصویر های اعتباری: تصاویر MabelAmber / 4008

تمبر زمان:

بیشتر از تکینگی هاب