Metas nye AI rangert blant de 10 % beste i spillets "Diplomati" - og menneskelige spillere var ingen av de klokere PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Metas nye AI rangert blant de 10 % beste i spillet "Diplomati" - og menneskelige spillere var ikke desto klokere

AI har mestret noe av det meste komplekse spill kjent for mennesker, men selv om det ofte utmerker seg i konkurranse, kommer ikke samarbeid like naturlig. Nå har en AI fra Meta mestret spillet Diplomacy, som krever at du jobber med andre spillere for å vinne.

Googles mestring av spillet Go ble hyllet som en viktig milepæl for AI, men til tross for dens ubestridelige kompleksitet, er den på mange måter godt egnet til den kalde, kalkulerende logikken til en maskin. Det er et spill med perfekt informasjon, hvor du har full oversikt over motstanderens trekk, og å vinne betyr ganske enkelt å kunne overliste en annen spiller.

Diplomati er derimot en mye mer rotete affære. Brettspillet ser opptil syv spillere ta enn Europeiske militærmakter og bruker hærene deres til å ta kontroll over strategiske byer. Men spillere har lov til å forhandle med hverandre for å danne og bryte allianser i jakten på total dominans.

Dessuten gjøres alle spillernes trekk samtidig ved hver tur, så du kan ikke bare reagere på hva andre gjør. Dette betyr at det å vinne spill krever en kompleks kombinasjon av strategisk tenkning, evnen til å samarbeide med andre spillere og overbevisende forhandlingsevner. Mens AI allerede har mestret ren strategi, har de andre ferdighetene vist seg mye vanskeligere å replikere.

En ny AI designet av forskere ved Meta kan imidlertid ha tatt et stort skritt i den retningen. I en utgitt papir forrige uke in Vitenskap, de beskriver et system kalt Cicero som rangerte blant de 10 prosent beste spillerne i en online Diplomacy-liga og oppnådde mer enn det dobbelte av den gjennomsnittlige poengsummen til de menneskelige spillerne.

"Cicero er spenstig, den er hensynsløs, og den er tålmodig," sa den tre ganger diplomati verdensmesteren Andrew Goffid i en video produsert av Meta. "Den spiller uten mye av de menneskelige følelsene som noen ganger får deg til å ta dårlige beslutninger. Den vurderer bare situasjonen og tar den beste avgjørelsen, ikke bare for den, men for menneskene den jobber med.»

Å lage Cicero krevde at Meta-forskere kombinerte toppmoderne AI-metoder fra to forskjellige underfelt: strategisk resonnement og naturlig språkbehandling. I hjertet har systemet en planleggingsalgoritme som forutsier andre spilleres bevegelser og bruker dette til å bestemme sin egen strategi. Denne algoritmen ble trent opp ved å få AI til å spille seg selv om og om igjen, samtidig som den prøvde å etterligne måten mennesker spiller spillet på.

Forskerne hadde allerede vist at denne planleggingsmodulen alene var i stand til det slå menneskelige proffer i en forenklet versjon av spillet. Men i denne siste forskningen kombinerte teamet det med en stor språkmodell trent på enorme mengder tekst fra internett, og deretter finjustert ved hjelp av dialog fra 40,000 XNUMX onlinespill med Diplomacy. Dette ga den oppgraderte Cicero muligheten til både å tolke meldinger fra andre spillere og også lage sine egne meldinger å overtale dem til å jobbe sammen.

Det kombinerte systemet starter med å bruke gjeldende status på brettet og tidligere dialog for å forutsi hva hver spiller sannsynligvis vil gjøre. Deretter kommer den med en handlingsplan for både seg selv og partnerne før de genererer meldinger designet for å skissere intensjonen og sikre samarbeidet med andre aktører.

Over 40 spill i nettturneringen kommuniserte Cicero effektivt med 82 andre spillere for å forklare intensjonene deres, koordinere handlinger og forhandle allianser. Det avgjørende er at forskerne sier at de ikke så noen bevis fra meldinger i spillet om at menneskelige spillere mistenkte at de slo seg sammen med en AI.

Imidlertid var modellens kommunikative evner ikke feilfrie. Den er mer enn i stand til å spytte ut useriøse meldinger eller meldinger som ikke stemmer overens med målene, så forskerne måtte generere flere kandidatmeldinger ved hvert trekk og deretter bruke forskjellige filtreringsmekanismer for å luke ut søppelet. Og selv da innrømmer forskerne at ulogiske meldinger noen ganger glipperped gjennom.

Dette antyder at språkmodellen i hjertet av Cicero fortsatt ikke helt forstår hva som skjer og ganske enkelt produserer plausibelt klingende meldinger som deretter må undersøkes for å sikre at de oppnår de ønskede resultatene.

Skriver inn Den Conversation, AI-forsker Toby Walsh ved University of New South Wales i Australia bemerker også at Cicero er ufeilbarlig ærlig, i motsetning til de fleste menneskelige spillere. Selv om dette er en overraskende effektiv strategi, kan det være en stor svakhet hvis konkurrenter finner ut at motstanderen aldri kommer til å prøve å lure dem.

Fremgangen er likevel betydelig, og Facebook håper det kan ha applikasjoner langt utover brettspill. I et blogginnlegg, sier forskerne at muligheten til å bruke planleggingsalgoritmer for å kontrollere språkgenerering kan gjøre det mulig å ha mye lengre og rikere samtaler med AI-chatboter eller lage videospillkarakterer som kan tilpasse seg en spillers oppførsel.

Bilde Credit: MabelAmber / 4008 bilder

Tidstempel:

Mer fra Singularity Hub