La nouvelle IA de Meta s'est classée dans le top 10 % du jeu « Diplomatie » – et les joueurs humains n'étaient pas les plus sages en matière d'intelligence des données PlatoBlockchain. Recherche verticale. Aï.

La nouvelle IA de Meta classée dans le top 10 % du jeu "Diplomacy" - et les joueurs humains n'étaient pas plus sages

L'IA a maîtrisé certains des plus jeux complexes connu de l'homme, mais s'il excelle souvent dans la compétition, la coopération ne vient pas aussi naturellement. Maintenant, une IA de Meta a maîtrisé le jeu Diplomacy, qui vous oblige à travailler avec d'autres joueurs pour gagner.

La maîtrise de Google de la jeu de Go a été salué comme une étape majeure pour l'IA, mais malgré sa complexité indéniable, il est à bien des égards bien adapté à la logique froide et calculatrice d'une machine. C'est un jeu d'informations parfaites, où vous avez une visibilité totale sur les mouvements de votre adversaire, et gagner signifie simplement être capable de déjouer un autre joueur.

La diplomatie, en revanche, est une affaire beaucoup plus compliquée. Le jeu de société voit jusqu'à sept joueurs prendre plus de Les puissances militaires européennes utilisent leurs armées pour prendre le contrôle de villes stratégiques. Mais les joueurs sont autorisés à négocier entre eux pour former et rompre des alliances dans la poursuite d'une domination totale.

De plus, tous les mouvements des joueurs sont effectués simultanément à chaque tour, vous ne pouvez donc pas simplement réagir à ce que font les autres. Cela signifie que gagner des jeux nécessite une combinaison complexe de réflexion stratégique, la capacité de coopérer avec d'autres joueurs et des compétences de négociation persuasives. Alors que l'IA maîtrise déjà la stratégie pure, ces autres compétences se sont avérées beaucoup plus difficiles à reproduire.

Une nouvelle IA conçue par des chercheurs de Meta a peut-être fait un grand pas dans cette direction. Dans un papier publié la semaine dernière in Sciences, ils décrivent un système appelé Cicero qui s'est classé parmi les 10% des meilleurs joueurs d'une ligue de diplomatie en ligne et a obtenu plus du double du score moyen des joueurs humains.

"Cicéron est résilient, impitoyable et patient », a déclaré Andrew Goff, triple champion du monde de diplomatie.id dans un vidéo réalisée par Meta. "Cela joue sans beaucoup d'émotion humaine qui vous fait parfois prendre de mauvaises décisions. Il évalue simplement la situation et prend la meilleure décision, non seulement pour elle, mais pour les personnes avec lesquelles elle travaille.

La création de Cicero a obligé les chercheurs de Meta à combiner des méthodes d'IA de pointe issues de deux sous-domaines différents : le raisonnement stratégique et le traitement du langage naturel. Au cœur du système se trouve un algorithme de planification qui prédit les mouvements des autres joueurs et l'utilise pour déterminer sa propre stratégie. Cet algorithme a été formé en faisant en sorte que l'IA se joue encore et encore, tout en essayant d'imiter la façon dont les humains jouent au jeu.

Les chercheurs avaient déjà montré que ce module de planification était à lui seul capable de battre les pros humains dans une version simplifiée du jeu. Mais dans cette dernière recherche, l'équipe l'a combiné avec un grand modèle de langage formé sur de grandes quantités de texte provenant d'Internet, puis affiné à l'aide du dialogue de 40,000 XNUMX jeux en ligne de diplomatie. Cela a donné au Cicero amélioré la possibilité d'interpréter les messages d'autres joueurs ainsi que fabrique aussi le sien messages pour les persuader de travailler ensemble.

Le système combiné commence par utiliser l'état actuel du plateau et les dialogues passés pour prédire ce que chaque joueur est susceptible de faire. Il propose ensuite un plan d'action pour lui-même et ses partenaires avant de générer des messages destinés à définir son intention et à assurer la coopération des autres acteurs.

Plus de 40 matchs dans le tournoi en ligne, Cicéron a communiqué efficacement avec 82 autres joueurs pour expliquer ses intentions, coordonner ses actions et négocier des alliances. Surtout, les chercheurs disent qu'ils n'ont vu aucune preuve dans les messages du jeu que les joueurs humains soupçonnaient qu'ils faisaient équipe avec une IA.

Cependant, les capacités de communication du modèle n'étaient pas sans faille. Il est plus que capable de cracher des messages absurdes ou incompatibles avec ses objectifs, de sorte que les chercheurs ont dû générer plusieurs messages candidats à chaque mouvement, puis utiliser divers mécanismes de filtrage pour éliminer les ordures. Et même alors, les chercheurs admettent que des messages illogiques glissent parfoisped par.

Cela suggère que le modèle de langage au cœur de Cicero ne comprend toujours pas vraiment ce qui se passe et produit simplement des messages à consonance plausible qui doivent ensuite être vérifiés pour s'assurer qu'ils atteignent les résultats souhaités.

Ecrire dans The Conversation, Le chercheur en intelligence artificielle Toby Walsh de l'Université de Nouvelle-Galles du Sud en Australie note également que Cicéron est infailliblement honnête, contrairement à la plupart des joueurs humains. Bien qu'il s'agisse d'une stratégie étonnamment efficace, cela pourrait être une faiblesse majeure si les concurrents découvrent que leur adversaire n'essaiera jamais de les tromper.

L'avancée est néanmoins importante et Facebook espère qu'elle pourrait avoir des applications bien au-delà des jeux de société. Dans un blog, les chercheurs affirment que la possibilité d'utiliser des algorithmes de planification pour contrôler la génération de langage pourrait permettre d'avoir des conversations beaucoup plus longues et plus riches avec des chatbots IA ou de créer des personnages de jeux vidéo capables de s'adapter au comportement d'un joueur.

Crédit image: MabelAmber / 4008 images

Horodatage:

Plus de Singularity Hub