Metas nye kunstige intelligens er placeret i top 10 % i spillet 'Diplomati' – og menneskelige spillere var ingen af ​​de klogere PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Metas nye kunstige intelligens er placeret i top 10 % i spillet 'Diplomati' - og menneskelige spillere var ikke desto klogere

AI har mestret noget af det meste komplekse spil kendt af mennesket, men selvom det ofte udmærker sig ved konkurrence, kommer samarbejdet ikke så naturligt. Nu har en AI fra Meta mestret spillet Diplomacy, som kræver, at du arbejder sammen med andre spillere for at vinde.

Googles beherskelse af spil Go blev hyldet som en stor milepæl for kunstig intelligens, men på trods af dens ubestridelige kompleksitet er den på mange måder velegnet til en maskines kolde, beregnende logik. Det er et spil med perfekt information, hvor du har fuld synlighed over din modstanders træk, og at vinde betyder simpelthen at være i stand til at outfoxe en anden spiller.

Diplomati er på den anden side en meget mere rodet affære. Brætspillet kan se op til syv spillere tage i løbet af europæiske militærmagter og bruge deres hære til at tage kontrol over strategiske byer. Men spillere har lov til at forhandle med hinanden for at danne og bryde alliancer i jagten på total dominans.

Desuden laves alle spilleres træk samtidigt ved hver tur, så du kan ikke bare reagere på, hvad andre gør. Det betyder, at vinde spil kræver en kompleks kombination af strategisk tænkning, evnen til at samarbejde med andre spillere og overbevisende forhandlingsevner. Mens AI allerede har mestret ren strategi, har disse andre færdigheder vist sig meget vanskeligere at replikere.

En ny AI designet af forskere ved Meta kan dog have taget et stort skridt i den retning. I en papir offentliggjort sidste uge in Videnskab, de beskriver et system kaldet Cicero, der placerede sig i top 10 procent af spillere i en online Diplomacy-liga og opnåede mere end dobbelt så meget som de menneskelige spilleres gennemsnitlige score.

"Cicero er modstandsdygtig, den er hensynsløs, og den er tålmodig,” siger den tredobbelte Diplomacy-verdensmester Andrew Goff.id i en video produceret af Meta. "Den spiller uden en masse af de menneskelige følelser, der nogle gange får dig til at træffe dårlige beslutninger. Den vurderer bare situationen og træffer den bedste beslutning, ikke kun for den, men for de mennesker, den arbejder med.”

At skabe Cicero krævede, at Meta-forskere kombinerede avancerede AI-metoder fra to forskellige underområder: strategisk ræsonnement og naturlig sprogbehandling. I hjertet har systemet en planlægningsalgoritme, der forudsiger andre spilleres bevægelser og bruger dette til at bestemme sin egen strategi. Denne algoritme blev trænet ved at få AI til at spille sig selv igen og igen, mens den også forsøgte at efterligne den måde, mennesker spiller spillet på.

Forskerne havde allerede vist, at dette planlægningsmodul alene var i stand til det slå menneskelige proffer i en forenklet version af spillet. Men i denne seneste forskning kombinerede holdet det med en stor sprogmodel, trænet på enorme mængder tekst fra internettet, og derefter finjusteret ved hjælp af dialog fra 40,000 onlinespil Diplomacy. Dette gav den opgraderede Cicero muligheden for både at fortolke beskeder fra andre spillere , også lave sin egen beskeder at overtale dem til at arbejde sammen.

Det kombinerede system starter med at bruge brættets nuværende tilstand og tidligere dialog til at forudsige, hvad hver spiller sandsynligvis vil gøre. Den kommer derefter med en handlingsplan for både sig selv og sine partnere, før den genererer beskeder designet til at skitsere dens hensigt og sikre samarbejdet mellem andre aktører.

Over 40 spil i onlineturneringen kommunikerede Cicero effektivt med 82 andre spillere for at forklare dens intentioner, koordinere handlinger og forhandle alliancer. Det afgørende er, at forskerne siger, at de ikke så beviser fra beskeder i spillet om, at menneskelige spillere havde mistanke om, at de slog sig sammen med en AI.

Imidlertid var modellens kommunikative evner ikke fejlfri. Det er mere end i stand til at spytte meningsløse beskeder ud eller dem, der ikke stemmer overens med dens mål, så forskerne var nødt til at generere flere kandidatbeskeder ved hvert træk og derefter bruge forskellige filtreringsmekanismer til at luge ud i skraldet. Og selv da indrømmer forskerne, at ulogiske budskaber nogle gange gliderPED igennem.

Dette tyder på, at sprogmodellen i hjertet af Cicero stadig ikke rigtig forstår, hvad der foregår, og blot producerer plausibelt klingende beskeder, som derefter skal undersøges for at sikre, at de opnår de ønskede resultater.

Skrivning i The Conversation, AI-forsker Toby Walsh ved University of New South Wales i Australien bemærker også, at Cicero er ufejlbarligt ærlig, i modsætning til de fleste menneskelige spillere. Selvom dette er en overraskende effektiv strategi, kan det være en stor svaghed, hvis konkurrenterne regner ud, at deres modstander aldrig vil forsøge at bedrage dem.

Fremgangen er ikke desto mindre betydelig, og Facebook håber, at den kan have applikationer langt ud over brætspil. I et blogindlæg, siger forskerne, at evnen til at bruge planlægningsalgoritmer til at styre sproggenerering kunne gøre det muligt at have meget længere og rigere samtaler med AI-chatbots eller skabe videospilfigurer, der kan tilpasse sig en spillers adfærd.

Billede Credit: MabelAmber / 4008 billeder

Tidsstempel:

Mere fra Singularitet Hub