Meta's nieuwe AI staat in de top 10% van het spel 'Diplomacy' - en menselijke spelers waren niet wijzer

Heruitgegeven door Plato

volgers: 0

AI heeft een aantal van de meeste onder de knie complexe spellen bekend bij de mens, maar hoewel het vaak uitblinkt in competitie, is samenwerking niet zo vanzelfsprekend. Nu heeft een AI van Meta het spel Diplomacy onder de knie, waarbij je met andere spelers moet samenwerken om te winnen.

Google's beheersing van de spel van Go werd geprezen als een belangrijke mijlpaal voor AI, maar ondanks zijn onmiskenbare complexiteit is het in veel opzichten zeer geschikt voor de koude, berekenende logica van een machine. Het is een spel met perfecte informatie, waarbij je volledig zicht hebt op de zetten van je tegenstander, en winnen betekent simpelweg dat je een andere speler te slim af kunt zijn.

Diplomatie daarentegen is een veel rommeligere aangelegenheid. Het bordspel ziet maximaal zeven spelers nemen over Europese militaire machten en gebruiken hun legers om de controle over strategische steden over te nemen. Maar spelers mogen met elkaar onderhandelen om allianties te vormen en te verbreken in het streven naar totale overheersing.

Bovendien worden de zetten van alle spelers bij elke beurt tegelijkertijd gedaan, dus je kunt niet zomaar reageren op wat anderen doen. Dit betekent dat het winnen van games een complexe combinatie vereist van strategisch denken, het vermogen om samen te werken met andere spelers en overtuigende onderhandelingsvaardigheden. Hoewel AI pure strategie al onder de knie heeft, zijn die andere vaardigheden veel lastiger gebleken om te repliceren.

Een nieuwe AI, ontworpen door onderzoekers van Meta, heeft misschien een grote stap in die richting gezet. In een papier gepubliceerd vorige week in Wetenschap, ze beschrijven een systeem genaamd Cicero dat in de top 10 procent van de spelers in een online diplomatiecompetitie stond en meer dan het dubbele behaalde van de gemiddelde score van de menselijke spelers.

"Cicero is veerkrachtig, meedogenloos en geduldig”, zegt drievoudig diplomatie-wereldkampioen Andrew Goff said een video geproduceerd door Meta. “Het speelt zonder veel van de menselijke emotie waardoor je soms slechte beslissingen neemt. Het beoordeelt gewoon de situatie en neemt de beste beslissing, niet alleen voor zichzelf, maar ook voor de mensen waarmee het werkt.”

Om Cicero te maken, moesten Meta-onderzoekers state-of-the-art AI-methoden uit twee verschillende subgebieden combineren: strategisch redeneren en natuurlijke taalverwerking. In de kern heeft het systeem een planningsalgoritme dat de bewegingen van andere spelers voorspelt en dit gebruikt om zijn eigen strategie te bepalen. Dit algoritme is getraind door de AI zichzelf keer op keer te laten spelen, en tegelijkertijd te proberen de manier waarop mensen het spel spelen na te bootsen.

Dat alleen deze planningsmodule daartoe in staat was, hadden de onderzoekers al aangetoond versla menselijke pro's in een vereenvoudigde versie van het spel. Maar in dit laatste onderzoek heeft het team het gecombineerd met een groot taalmodel dat is getraind op enorme hoeveelheden tekst van internet en vervolgens is verfijnd met behulp van dialogen uit 40,000 online games van Diplomacy. Dit gaf de geüpgradede Cicero de mogelijkheid om zowel berichten van andere spelers te interpreteren en ook zelf knutselen berichten overtuigen om samen te werken.

Het gecombineerde systeem begint door de huidige staat van het bord en eerdere dialogen te gebruiken om te voorspellen wat elke speler waarschijnlijk gaat doen. Vervolgens bedenkt het een actieplan voor zichzelf en zijn partners voordat het berichten genereert die zijn ontworpen om zijn bedoeling te schetsen en de medewerking van andere spelers te verzekeren.

In meer dan 40 spellen in het online toernooi communiceerde Cicero effectief met 82 andere spelers om zijn intenties uit te leggen, acties te coördineren en allianties te sluiten. Cruciaal is dat de onderzoekers zeggen dat ze geen bewijs zagen uit in-game berichten dat menselijke spelers vermoedden dat ze samenwerkten met een AI.

De communicatieve vaardigheden van het model waren echter niet onberispelijk. Het is meer dan in staat om onzinnige berichten uit te spugen of berichten die niet overeenstemmen met zijn doelen, dus moesten de onderzoekers bij elke beweging meerdere kandidaat-berichten genereren en vervolgens verschillende filtermechanismen gebruiken om het afval eruit te halen. En zelfs dan geven de onderzoekers toe dat er soms onlogische boodschappen uitglippenped door.

Dit suggereert dat het taalmodel in het hart van Cicero nog steeds niet echt begrijpt wat er aan de hand is en eenvoudig plausibel klinkende berichten produceert die vervolgens moeten worden doorgelicht om ervoor te zorgen dat ze de gewenste resultaten bereiken.

Schrijven in The Conversation, AI-onderzoeker Toby Walsh van de Universiteit van New South Wales in Australië merkt ook op dat Cicero onfeilbaar eerlijk is, in tegenstelling tot de meeste menselijke spelers. Hoewel dit een verrassend effectieve strategie is, kan het een grote zwakte zijn als concurrenten erachter komen dat hun tegenstander hen nooit zal proberen te misleiden.

De vooruitgang is echter aanzienlijk en Facebook hoopt dat het toepassingen kan hebben die veel verder gaan dan bordspellen. In een blog post, zeggen de onderzoekers dat de mogelijkheid om planningsalgoritmen te gebruiken om het genereren van talen te beheersen, het mogelijk zou kunnen maken om veel langere en rijkere gesprekken te voeren met AI-chatbots of om videogamekarakters te creëren die zich kunnen aanpassen aan het gedrag van een speler.

Krediet van het beeld: Mabel Amber / 4008 afbeeldingen

Tijdstempel: 28 november 202228 november 2022

Tijdstempel: 1-2024-XNUMX

Meta's nieuwe AI gerangschikt in de top 10% van het spel 'Diplomatie' - en menselijke spelers waren niet wijzer

Heruitgegeven door Plato

Meer van Hub voor singulariteit

Wetenschappers overtuigen bacteriën om exotische eiwitten te maken die niet in de natuur voorkomen

Onze voorouders van Homo Sapiens deelden de wereld met neanderthalers, denisovamensen en andere soorten mensen wiens DNA voortleeft in onze genen

De nieuwe programmeerbare vloeistof van Harvard verandert zijn eigenschappen op verzoek

Dit algoritme ontwerpt eiwitten vanaf het begin om de ontdekking van geneesmiddelen te versnellen

Wat is een GPU? De chips die de AI-boom aandrijven, en waarom ze biljoenen waard zijn

Kosmisch stof van Venus inspireert nieuwe technologie om luchtvervuiling tegen te gaan

Net als mensen maakt deze baanbrekende AI concepten uit de woorden die het leert

Wetenschappers hebben zojuist laten zien hoe kwantumcomputers kunnen worden gebaseerd op geluidsgolven

Deze robotkok zal binnenkort perfect gekruide chips uitdelen bij Chipotle

Is de maangoudkoorts begonnen? Waarom de eerste privémaanlanding ertoe doet

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account