Metin novi AI se je uvrstil med 10 % najboljših v igri 'Diplomacy'—človeški igralci pa niso bili nič pametnejši PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Metin novi AI se je uvrstil med 10 % najboljših v igri 'Diplomacy'—človeški igralci pa niso bili nič pametnejši

AI je obvladal nekaj najbolj kompleksne igre znano človeku, toda čeprav se pogosto izkaže pri tekmovanju, sodelovanje ni tako naravno. Zdaj je AI iz Mete obvladal igro Diplomacy, ki zahteva, da za zmago sodelujete z drugimi igralci.

Googlovo obvladovanje igra Go je bil hvaljen kot velik mejnik za AI, vendar je kljub svoji nesporni kompleksnosti v mnogih pogledih zelo primeren za hladno, računsko logiko stroja. To je igra s popolnimi informacijami, kjer imate popoln vpogled v nasprotnikove poteze, zmaga pa preprosto pomeni, da lahko prehitite drugega igralca.

Po drugi strani pa je diplomacija veliko bolj neurejena zadeva. Družabna igra lahko igra do sedem igralcev več evropske vojaške sile in uporabijo svoje vojske za prevzem nadzora nad strateškimi mesti. Toda igralcem je dovoljeno, da se pogajajo med seboj za sklepanje in prekinitev zavezništev v prizadevanju za popolno prevlado.

Še več, poteze vseh igralcev so izvedene hkrati na vsakem koraku, tako da se ne morete preprosto odzvati na dejanja drugih. To pomeni, da zmagovanje v igrah zahteva kompleksno kombinacijo strateškega razmišljanja, sposobnosti sodelovanja z drugimi igralci in prepričljivih pogajalskih sposobnosti. Čeprav je umetna inteligenca že obvladala čisto strategijo, se je izkazalo, da je te druge veščine veliko težje ponoviti.

Nova umetna inteligenca, ki so jo oblikovali raziskovalci pri Meti, je morda naredila velik korak v tej smeri. V objavljen prispevek Prejšnji teden in Znanost, opisujejo sistem, imenovan Cicero, ki se je uvrstil med 10 odstotkov najboljših igralcev v spletni ligi Diplomacy in dosegel več kot dvojno povprečno oceno človeških igralcev.

"Ciceron je odporen, neusmiljen in potrpežljiv,« pravi trikratni svetovni prvak v diplomaciji Andrew Goff.id v video produkcija Meta. »Igra se brez veliko človeških čustev, zaradi katerih včasih sprejemaš slabe odločitve. Samo oceni situacijo in sprejme najboljšo odločitev, ne samo zanjo, ampak za ljudi, s katerimi dela.«

Ustvarjanje Cicerona je od raziskovalcev Mete zahtevalo, da združijo najsodobnejše metode umetne inteligence iz dveh različnih podpolj: strateškega razmišljanja in obdelave naravnega jezika. V središču sistema je algoritem za načrtovanje, ki predvideva poteze drugih igralcev in to uporablja za določanje lastne strategije. Ta algoritem je bil usposobljen tako, da je umetna inteligenca vedno znova igrala samega sebe, hkrati pa poskušala posnemati način, kako ljudje igrajo igro.

Raziskovalci so že pokazali, da je ta modul za načrtovanje zmožen sam premagati človeške profesionalce v poenostavljeni različici igre. Toda v tej najnovejši raziskavi ga je ekipa združila z velikim jezikovnim modelom, ki je bil učen na ogromnih količinah besedila iz interneta in nato natančno nastavljen z uporabo dialoga iz 40,000 spletnih iger diplomacije. To je nadgrajenemu Ciceru dalo možnost, da oba razlaga sporočila drugih igralcev in izdeluje tudi svoje sporočil da jih prepričamo k sodelovanju.

Kombinirani sistem se začne z uporabo trenutnega stanja plošče in preteklih dialogov, da napove, kaj bo vsak igralec verjetno storil. Nato pripravi akcijski načrt zase in za svoje partnerje, preden ustvari sporočila, namenjena orisu njegove namere in zagotavljanju sodelovanja drugih akterjev.

V več kot 40 igrah na spletnem turnirju je Cicero učinkovito komuniciral z 82 drugimi igralci, da bi razložil svoje namere, uskladil akcije in se pogajal za zavezništva. Bistveno je, da raziskovalci pravijo, da v sporočilih v igri niso videli nobenega dokaza, da bi človeški igralci sumili, da se združujejo z umetno inteligenco.

Manekenkine komunikacijske sposobnosti pa niso bile brezhibne. Je več kot sposoben izpljuniti nesmiselna sporočila ali sporočila, ki niso v skladu z njegovimi cilji, zato so morali raziskovalci ustvariti več kandidatnih sporočil ob vsaki potezi in nato uporabiti različne mehanizme filtriranja, da so izločili smeti. In tudi takrat raziskovalci priznavajo, da nelogična sporočila včasih zdrsnejoPed skozi.

To nakazuje, da jezikovni model v središču Cicerona še vedno ne razume zares, kaj se dogaja, in preprosto proizvaja verjetna sporočila, ki jih je treba nato preveriti, da se prepričamo, da dosegajo želene rezultate.

Pisanje v Pogovor, Raziskovalec umetne inteligence Toby Walsh z Univerze v Novem Južnem Walesu v Avstraliji prav tako ugotavlja, da je Cicero nezmotljivo pošten, za razliko od večine človeških igralcev. Čeprav je to presenetljivo učinkovita strategija, je lahko velika slabost, če konkurenti ugotovijo, da jih njihov nasprotnik nikoli ne bo poskušal prevarati.

Kljub temu je napredek pomemben in Facebook upa, da bi lahko imel aplikacije daleč od družabnih iger. V objavi na blogu, raziskovalci pravijo, da bi zmožnost uporabe načrtovalskih algoritmov za nadzor generiranja jezika lahko omogočila veliko daljše in bogatejše pogovore s klepetalnimi roboti AI ali ustvarjanje likov iz video iger, ki se lahko prilagodijo vedenju igralca.

Kreditno slike: MabelAmber / 4008 slik

Časovni žig:

Več od Središče singularnosti