Metas nya AI rankad bland de 10 % bästa i spelet "Diplomacy" - och mänskliga spelare var inga de klokare PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Metas nya AI rankad bland de 10 % bästa i spelet "Diplomacy" - och mänskliga spelare var inte desto klokare

AI har bemästrat några av de mest komplexa spel känd för människan, men även om det ofta utmärker sig i konkurrens, kommer samarbetet inte lika naturligt. Nu har en AI från Meta bemästrat spelet Diplomacy, som kräver att du arbetar med andra spelare för att vinna.

Googles behärskning av spelet Go hyllades som en viktig milstolpe för AI, men trots sin obestridliga komplexitet är den på många sätt väl lämpad för en maskins kalla, beräknande logik. Det är ett spel med perfekt information, där du har full synlighet av din motståndares drag, och att vinna betyder helt enkelt att du kan överlista en annan spelare.

Diplomati, å andra sidan, är en mycket stökigare affär. Brädspelet ser upp till sju spelare ta över Europeiska militärmakter och använder sina arméer för att ta kontroll över strategiska städer. Men spelare tillåts att förhandla med varandra för att bilda och bryta allianser i jakten på total dominans.

Dessutom görs alla spelares drag samtidigt vid varje tur, så du kan inte bara reagera på vad andra gör. Det betyder att vinnande spel kräver en komplex kombination av strategiskt tänkande, förmågan att samarbeta med andra spelare och övertygande förhandlingsförmåga. Även om AI redan har bemästrat ren strategi, har dessa andra färdigheter visat sig vara mycket svårare att replikera.

En ny AI designad av forskare vid Meta kan dock ha tagit ett stort steg i den riktningen. I en publicerat papper förra veckan in Vetenskap, de beskriver ett system som heter Cicero som rankades bland de 10 procent av spelarna i en online-diplomatiliga och som uppnådde mer än dubbelt så högt medelpoäng som de mänskliga spelarna.

"Cicero är motståndskraftig, den är hänsynslös och den är tålmodig, säger trefaldige diplomativärldsmästaren Andrew Goff said i en video producerad av Meta. "Den spelar utan en massa mänskliga känslor som ibland får dig att fatta dåliga beslut. Den bedömer bara situationen och fattar det bästa beslutet, inte bara för den, utan för människorna den arbetar med.”

Att skapa Cicero krävde att Meta-forskare kombinerade toppmoderna AI-metoder från två olika delområden: strategiska resonemang och naturlig språkbehandling. I centrum har systemet en planeringsalgoritm som förutsäger andra spelares rörelser och använder detta för att bestämma sin egen strategi. Denna algoritm tränades genom att få AI:n att spela sig själv om och om igen, samtidigt som man försökte efterlikna hur människor spelar spelet.

Forskarna hade redan visat att denna planeringsmodul ensam kunde slå mänskliga proffs i en förenklad version av spelet. Men i den senaste forskningen kombinerade teamet det med en stor språkmodell som tränades på stora mängder text från internet och sedan finjusterades med hjälp av dialog från 40,000 XNUMX onlinespel av Diplomacy. Detta gav den uppgraderade Ciceron möjligheten att både tolka meddelanden från andra spelare och hantverkar också sitt eget meddelanden för att övertala dem att arbeta tillsammans.

Det kombinerade systemet börjar med att använda brädets nuvarande tillstånd och tidigare dialoger för att förutsäga vad varje spelare sannolikt kommer att göra. Den kommer sedan med en handlingsplan för både sig själv och sina partners innan den genererar meddelanden som är utformade för att beskriva dess avsikt och säkerställa samarbetet mellan andra aktörer.

Över 40 spel i onlineturneringen kommunicerade Cicero effektivt med 82 andra spelare för att förklara dess avsikter, koordinera handlingar och förhandla fram allianser. Avgörande är att forskarna säger att de inte såg några bevis från meddelanden i spelet att mänskliga spelare misstänkte att de samarbetade med en AI.

Men modellens kommunikativa förmåga var inte felfri. Det är mer än kapabelt att spotta ut meningslösa meddelanden eller sådana som inte överensstämmer med dess mål, så forskarna var tvungna att generera flera kandidatmeddelanden vid varje drag och sedan använda olika filtreringsmekanismer för att sålla bort skräpet. Och även då erkänner forskarna att ologiska budskap ibland gliderped igenom.

Detta tyder på att språkmodellen i hjärtat av Cicero fortfarande inte riktigt förstår vad som pågår och helt enkelt producerar rimligt klingande meddelanden som sedan måste granskas för att säkerställa att de uppnår önskade resultat.

Skriva i Avlyssningen, AI-forskaren Toby Walsh vid University of New South Wales i Australien konstaterar också att Cicero är ofelbart ärlig, till skillnad från de flesta mänskliga spelare. Även om detta är en förvånansvärt effektiv strategi, kan det vara en stor svaghet om konkurrenterna räknar ut att deras motståndare aldrig kommer att försöka lura dem.

Framgången är ändå betydande, och Facebook hoppas att det kan ha applikationer långt utöver brädspel. I ett blogginlägg, säger forskarna att möjligheten att använda planeringsalgoritmer för att styra språkgenerering kan göra det möjligt att ha mycket längre och rikare konversationer med AI-chatbots eller skapa videospelkaraktärer som kan anpassa sig till en spelares beteende.

Image Credit: MabelAmber / 4008 bilder

Tidsstämpel:

Mer från Singularity Hub