A Meta új mesterséges intelligencia a legjobb 10%-ba került a „Diplomacy” játékban – és az emberi játékosok sem voltak a bölcsebb PlatoBlockchain adatintelligenciában. Függőleges keresés. Ai.

A Meta új mesterséges intelligencia a legjobb 10%-ba került a „Diplomacy” játékban – és az emberi játékosok sem voltak bölcsebbek

A mesterséges intelligencia a legtöbbet elsajátította összetett játékok az emberek ismerik, de bár gyakran remekel a versenyben, az együttműködés nem jön magától. Most a Meta MI-je elsajátította a Diplomacy játékot, amelyhez más játékosokkal együtt kell működnie a győzelemhez.

A Google elsajátította a játék a Go A mesterséges intelligencia jelentős mérföldkövének méltatták, de tagadhatatlan összetettsége ellenére sok szempontból jól illeszkedik a gép hideg, számító logikájához. Ez egy tökéletes információs játék, ahol teljes mértékben láthatod ellenfeled lépéseit, és a győzelem egyszerűen azt jelenti, hogy képes vagy kiszorítani egy másik játékost.

A diplomácia viszont sokkal zűrzavarosabb ügy. A társasjátékban legfeljebb hét játékos vesz részt felett az európai katonai hatalmak és hadseregeik segítségével átvegyék az irányítást a stratégiai városok felett. De a játékosok tárgyalhatnak egymással, hogy szövetségeket hozzanak létre és bontsanak meg a teljes uralomra törekedve.

Sőt, a játékosok minden lépése egyszerre történik minden körben, így nem lehet egyszerűen reagálni mások cselekedeteire. Ez azt jelenti, hogy a játékok megnyeréséhez a stratégiai gondolkodás, a többi játékossal való együttműködés képessége és a meggyőző tárgyalási készség összetett kombinációja szükséges. Míg a mesterséges intelligencia már elsajátította a tiszta stratégiát, a többi készséget sokkal bonyolultabb reprodukálni.

A Meta kutatói által tervezett új AI azonban nagy lépést tett ebbe az irányba. Az a könyv megjelent a múlt héten in Tudomány, leírják a Cicero nevű rendszert, amely a játékosok legjobb 10 százalékába került egy online diplomácia ligában, és több mint kétszeresét érte el az emberi játékosok átlagpontszámának.

"Cicero kitartó, könyörtelen és türelmes” – mondta Andrew Goff, a diplomácia háromszoros világbajnoka.id egy a videót a Meta készítette. „Sok emberi érzelem nélkül játszik, amelyek néha rossz döntéseket hoznak. Csak felméri a helyzetet, és meghozza a legjobb döntést, nemcsak számára, hanem az emberek számára is, akikkel együtt dolgozik.”

A Cicero létrehozásához a Meta kutatóinak két különböző részterületről – a stratégiai érvelésről és a természetes nyelvi feldolgozásról – származó legmodernebb AI-módszereket kellett kombinálniuk. A rendszer középpontjában egy tervezési algoritmus áll, amely előrejelzi a többi játékos lépéseit, és ezt használja saját stratégiájának meghatározásához. Ezt az algoritmust úgy képezték ki, hogy a mesterséges intelligencia újra és újra megjátssza magát, miközben megpróbálta utánozni az emberek játékmódját.

A kutatók már kimutatták, hogy ez a tervezési modul önmagában képes legyőzni az emberi profikat a játék egyszerűsített változatában. De ebben a legújabb kutatásban a csapat egy nagy nyelvi modellel kombinálta, amelyet az internetről származó hatalmas mennyiségű szövegre képeztek ki, majd a Diplomácia 40,000 XNUMX online játékából származó párbeszédek segítségével finomították. Ez lehetővé tette a továbbfejlesztett Cicero számára, hogy értelmezze a többi játékos üzeneteit és a saját készítésű is üzenetek hogy rávegye őket a közös munkára.

A kombinált rendszer a tábla jelenlegi állapotának és a múltbeli párbeszédnek a felhasználásával kezdődik, hogy előre jelezze, mit fognak tenni az egyes játékosok. Ezután cselekvési tervet dolgoz ki saját maga és partnerei számára, mielőtt üzeneteket generálna, amelyek célja, hogy felvázolják szándékát és biztosítsák a többi szereplő együttműködését.

Az online versenyen több mint 40 meccsen Cicero hatékonyan kommunikált 82 másik játékossal, hogy elmagyarázza a szándékait, összehangolja az akciókat és tárgyaljon a szövetségekről. Lényeges, hogy a kutatók azt mondják, hogy a játékon belüli üzenetekből nem láttak bizonyítékot arra, hogy az emberi játékosok azt gyanították volna, hogy egy MI-vel szövetkeznek.

A modell kommunikációs képességei azonban nem voltak hibátlanok. Több mint képes kiköpni az értelmetlen vagy a céljaival össze nem egyeztethető üzeneteket, ezért a kutatóknak minden lépésnél több jelölt üzenetet kellett generálniuk, majd különféle szűrőmechanizmusok segítségével kiszűrni a szemetet. A kutatók még ekkor is elismerik, hogy a logikátlan üzenetek néha elcsúsznakped keresztül.

Ez azt sugallja, hogy a Cicero középpontjában álló nyelvi modell még mindig nem igazán érti, mi történik, és egyszerűen hihetően hangzó üzeneteket produkál, amelyeket aztán ellenőrizni kell, hogy megbizonyosodjanak arról, hogy elérik a kívánt eredményeket.

Írás A beszélgetés, Az ausztráliai Új-Dél-Wales Egyetem kutatója, Toby Walsh szintén megjegyzi, hogy Cicero tévedhetetlenül őszinte, ellentétben a legtöbb emberi játékossal. Bár ez egy meglepően hatékony stratégia, nagy gyengeség lehet, ha a versenytársak rájönnek, hogy ellenfelük soha nem fogja megpróbálni megtéveszteni őket.

Az előrelépés ennek ellenére jelentős, és a Facebook reméli, hogy a társasjátékokon túlmutató alkalmazásai is lehetnek. Egy blogbejegyzésben, a kutatók szerint az a képesség, hogy tervezőalgoritmusokat használnak a nyelvgenerálás szabályozására, sokkal hosszabb és gazdagabb beszélgetéseket tesz lehetővé AI chatbotokkal, vagy olyan videojáték-karaktereket hozhat létre, akik képesek alkalmazkodni a játékos viselkedéséhez.

Kép: MabelAmber / 4008 képek

Időbélyeg:

Még több Singularity Hub