A nova IA da Meta foi classificada entre os 10% melhores no jogo 'Diplomacia' - e os jogadores humanos não eram os mais sábios da PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai.

A nova IA da Meta classificada entre os 10% melhores no jogo 'Diplomacy' - e os jogadores humanos não eram os mais sábios

A IA dominou alguns dos mais jogos complexos conhecido pelo homem, mas embora muitas vezes se destaque na competição, a cooperação não vem tão naturalmente. Agora, uma IA da Meta dominou o jogo Diplomacy, que exige que você trabalhe com outros jogadores para vencer.

domínio do Google sobre o jogo de ir foi aclamado como um marco importante para a IA, mas, apesar de sua inegável complexidade, é adequado em muitos aspectos para a lógica fria e calculista de uma máquina. É um jogo de informação perfeita, onde você tem total visibilidade dos movimentos de seu oponente, e vencer significa simplesmente ser capaz de enganar outro jogador.

A diplomacia, por outro lado, é um assunto muito mais confuso. O jogo de tabuleiro permite que até sete jogadores tomem Acima de potências militares europeias e usam seus exércitos para assumir o controle de cidades estratégicas. Mas os jogadores podem negociar entre si para formar e quebrar alianças em busca do domínio total.

Além do mais, todos os movimentos dos jogadores são feitos simultaneamente em cada turno, então você não pode simplesmente reagir ao que os outros fazem. Isso significa que ganhar jogos requer uma combinação complexa de pensamento estratégico, capacidade de cooperar com outros jogadores e habilidades de negociação persuasiva. Embora a IA já tenha dominado a estratégia pura, essas outras habilidades se mostraram muito mais difíceis de replicar.

Uma nova IA projetada por pesquisadores da Meta pode ter dado um grande passo nessa direção. Em um artigo publicado semana passada in Ciência, eles descrevem um sistema chamado Cicero que se classificou entre os 10% melhores jogadores em uma liga de Diplomacia online e alcançou mais que o dobro da pontuação média dos jogadores humanos.

"Cícero é resiliente, implacável e paciente”, Andrew Goff, tricampeão mundial de diplomacia.id em uma vídeo produzido por Meta. “Ele joga sem muita emoção humana que às vezes faz você tomar más decisões. Ele apenas avalia a situação e toma a melhor decisão, não apenas para ele, mas para as pessoas com quem está trabalhando.”

A criação do Cícero exigiu que os pesquisadores da Meta combinassem métodos de IA de última geração de dois subcampos diferentes: raciocínio estratégico e processamento de linguagem natural. Em sua essência, o sistema possui um algoritmo de planejamento que prevê os movimentos de outros jogadores e usa isso para determinar sua própria estratégia. Este algoritmo foi treinado fazendo com que a IA jogasse repetidamente, ao mesmo tempo que tentava imitar a maneira como os humanos jogam.

Os pesquisadores já haviam mostrado que esse módulo de planejamento por si só era capaz de vencer profissionais humanos em uma versão simplificada do jogo. Mas nesta pesquisa mais recente, a equipe o combinou com um grande modelo de linguagem treinado em grandes quantidades de texto da Internet e, em seguida, ajustado usando o diálogo de 40,000 jogos online do Diplomacy. Isso deu ao Cicero atualizado a capacidade de interpretar mensagens de outros jogadores e também cria o seu próprio mensagens para convencê-los a trabalhar juntos.

O sistema combinado começa usando o estado atual do tabuleiro e os diálogos anteriores para prever o que cada jogador provavelmente fará. Em seguida, apresenta um plano de ação para si e para os seus parceiros antes de gerar mensagens destinadas a delinear a sua intenção e garantir a cooperação de outros intervenientes.

Ao longo de 40 jogos no torneio online, Cícero comunicou-se eficazmente com outros 82 jogadores para explicar suas intenções, coordenar ações e negociar alianças. Crucialmente, os pesquisadores dizem que não viram nenhuma evidência nas mensagens do jogo de que jogadores humanos suspeitassem que estavam se unindo a uma IA.

No entanto, as habilidades comunicativas do modelo não eram perfeitas. É mais do que capaz de cuspir mensagens sem sentido ou inconsistentes com seus objetivos, então os pesquisadores tiveram que gerar várias mensagens candidatas a cada movimento e, em seguida, usar vários mecanismos de filtragem para eliminar o lixo. E mesmo assim, os pesquisadores admitem que as mensagens ilógicas às vezes escapamped através.

Isto sugere que o modelo de linguagem no coração de Cícero ainda não compreende realmente o que se passa e está simplesmente a produzir mensagens que parecem plausíveis, que depois precisam de ser examinadas para garantir que alcançam os resultados desejados.

Escrevendo em A Conversação, O pesquisador de IA Toby Walsh, da Universidade de New South Wales, na Austrália, também observa que Cícero é infalivelmente honesto, ao contrário da maioria dos jogadores humanos. Embora esta seja uma estratégia surpreendentemente eficaz, pode ser uma grande fraqueza se os concorrentes descobrirem que seu oponente nunca tentará enganá-los.

O avanço é significativo, no entanto, e o Facebook espera que possa ter aplicações muito além dos jogos de tabuleiro. Em uma postagem no blog, os pesquisadores dizem que a capacidade de usar algoritmos de planejamento para controlar a geração de linguagem pode possibilitar conversas muito mais longas e ricas com chatbots de IA ou criar personagens de videogame que podem se adaptar ao comportamento de um jogador.

Crédito de imagem: MabelAmber / 4008 imagens

Carimbo de hora:

Mais de Singularity Hub