Meta uus tehisintellekt kuulus mängus "Diplomaatia" 10% edetabelisse ja inimmängijad polnud targemad

Taasavaldanud Platon

järgijaid: 0

AI on valdanud mõnda kõige enamat keerulised mängud inimestele teada, kuid kuigi see on sageli konkurentsis suurepärane, ei tule koostöö nii loomulikult. Nüüd on Meta tehisintellekt omandanud mängu Diplomacy, mis nõuab võidu nimel koostööd teiste mängijatega.

Google'i meisterlikkus mäng Go tunnistati tehisintellekti jaoks oluliseks verstapostiks, kuid vaatamata selle vaieldamatule keerukusele sobib see paljuski hästi masina külma, kalkuleeriva loogikaga. See on täiusliku teabe mäng, kus näete oma vastase käike ja võitmine tähendab lihtsalt seda, et saate ühe teise mängija välja lüüa.

Diplomaatia on seevastu palju segasem asi. Lauamängus osaleb kuni seitse mängijat üle Euroopa sõjalised jõud ja kasutavad oma armeed strateegiliste linnade kontrolli alla võtmiseks. Kuid mängijatel on lubatud pidada omavahel läbirääkimisi, et luua ja purustada liite, püüdes saavutada täielikku domineerimist.

Veelgi enam, kõik mängijad tehakse igal käigul üheaegselt, nii et te ei saa lihtsalt reageerida sellele, mida teised teevad. See tähendab, et mängude võitmiseks on vaja keerukat kombinatsiooni strateegilisest mõtlemisest, oskusest teha koostööd teiste mängijatega ja veenvaid läbirääkimisoskusi. Kuigi tehisintellekt on juba puhta strateegia selgeks saanud, on neid teisi oskusi palju keerulisem korrata.

Meta teadlaste loodud uus tehisintellekt võis siiski selles suunas astuda suure sammu. Sees paber avaldatud Eelmine nädal in teadus, nad kirjeldavad süsteemi nimega Cicero, mis kuulus online-diplomaatia liigas 10 protsendi parimate mängijate hulka ja saavutas rohkem kui kahekordse keskmise tulemuse kui inimmängijad.

"Cicero on vastupidav, halastamatu ja kannatlik," ütles diplomaatia kolmekordne maailmameister Andrew Goff.id aastal video produtseeris Meta. "See mängib ilma inimlike emotsioonideta, mis mõnikord paneb teid halbu otsuseid tegema. See lihtsalt hindab olukorda ja teeb parima otsuse mitte ainult selle jaoks, vaid ka inimeste jaoks, kellega koos töötab.

Cicero loomine nõudis Meta teadlastelt kahe erineva alamvaldkonna tipptasemel tehisintellekti meetodite ühendamist: strateegiline arutluskäik ja loomuliku keele töötlemine. Süsteemi keskmes on planeerimisalgoritm, mis ennustab teiste mängijate käike ja kasutab seda oma strateegia määramiseks. Seda algoritmi treeniti nii, et tehisintellekt hakkas ikka ja jälle ennast mängima, püüdes samal ajal matkida seda, kuidas inimesed mängu mängivad.

Teadlased olid juba näidanud, et see planeerimismoodul üksi oli võimeline võita inimproffe mängu lihtsustatud versioonis. Kuid selles viimases uuringus ühendas meeskond selle suure keelemudeliga, mis oli koolitatud suurel hulgal Internetist pärit tekstile ja seejärel peenhäälestatud, kasutades dialoogi 40,000 XNUMX Diplomaatia võrgumängust. See andis uuendatud Cicerole võimaluse tõlgendada teiste mängijate sõnumeid ja ka ise meisterdada kirjad veenda neid koostööd tegema.

Kombineeritud süsteem algab laua hetkeseisu ja varasemate dialoogidega, et ennustada, mida iga mängija tõenäoliselt teeb. Seejärel koostab ta tegevuskava nii enda kui ka oma partnerite jaoks, enne kui genereerib sõnumeid, mille eesmärk on kirjeldada oma kavatsust ja tagada teiste osalejate koostöö.

Cicero suhtles võrguturniiril enam kui 40 mängu jooksul 82 mängijaga, et selgitada oma kavatsusi, koordineerida tegevusi ja pidada läbirääkimisi liitude üle. Oluline on see, et teadlased väidavad, et nad ei näinud mängusisestest sõnumitest tõendeid selle kohta, et inimmängijad kahtlustaks, et nad teevad koostööd tehisintellektiga.

Modelli suhtlemisoskused ei olnud aga veatud. See on enam kui võimeline välja sülitama mõttetuid või selle eesmärkidega vastuolus olevaid sõnumeid, nii et teadlased pidid igal liigutusel genereerima mitu kandidaatsõnumit ja seejärel kasutama prügi välja rookimiseks erinevaid filtreerimismehhanisme. Ja isegi siis tunnistavad teadlased, et ebaloogilised sõnumid lähevad mõnikord vahelePed läbi.

See viitab sellele, et Cicero keskmes olev keelemudel ei saa ikka veel päriselt aru, mis toimub, ja toodab lihtsalt usutavalt kõlavaid sõnumeid, mida tuleb seejärel kontrollida, et tagada soovitud tulemuste saavutamine.

Sisestamine Vestlus, Austraalia Uus-Lõuna-Walesi ülikooli AI-uurija Toby Walsh märgib samuti, et erinevalt enamikust inimmängijatest on Cicero eksimatult aus. Kuigi see on üllatavalt tõhus strateegia, võib see olla suureks nõrkuseks, kui konkurendid teevad kindlaks, et nende vastane ei ürita neid kunagi petta.

Edasiminek on sellegipoolest märkimisväärne ja Facebook loodab, et sellel võib olla rakendusi, mis on lauamängudest kaugel. Blogi postituses, väidavad teadlased, et suutlikkus kasutada keele genereerimise juhtimiseks planeerimisalgoritme võib võimaldada palju pikemaid ja rikkalikumaid vestlusi AI-vestlusbotidega või luua videomängutegelasi, kes suudavad mängija käitumisega kohaneda.

Image Credit: MabelAmber / 4008 kujutist

Ajatempel: November 28, 2022November 28, 2022

Ajatempel: November 4, 2023

Meta uus tehisintellekt kuulus mängus "Diplomaatia" 10% parima hulka – ja inimmängijad polnud targemad

Taasavaldanud Platon

Veel alates Singulaarsuse keskus

Autonoomsed veokid sõidavad järgmisel aastal maanteedel, ütleb Startup

Oregoni metsatulekahjus ellujäänute jaoks ehitatakse 3D-prinditud kodude kogukonda

Ettevõte ütleb, et see ujuv "püramiid" tuuleturbiin toodab rohkem energiat madalama hinnaga

Selle nädala vinged tehnikalood kogu veebist (kuni 6. augustini)

Selle nädala ägedad tehnikalood veebist (kuni 2. juulini)

Aritmeetikal on bioloogiline päritolu – see väljendub meie taju "sügava struktuuri" sümbolites

See tõeline kalafilee trükiti 3D-printimiseks laboris kasvatatud rakkudest

Inimese ajurakkude ja bioloogiliste kiibidega sead: kuidas laboris kasvatatud hübriidsed eluvormid rikuvad teaduseetikat

Selle nädala vinged tehnikalood kogu veebist (kuni 4. novembrini)

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto