'Pravi' svet: Agenti AI načrtujejo zabave in drug drugega vabijo na zmenke v 16-bitnem virtualnem mestu

'Pravi' svet: Agenti AI načrtujejo zabave in drug drugega vabijo na zmenke v 16-bitnem virtualnem mestu

The ‘Real’ World: AI Agents Plan Parties and Ask Each Other Out on Dates in 16-Bit Virtual Town PlatoBlockchain Data Intelligence. Vertical Search. Ai.

»To je resnična zgodba o 25 likih iz video iger, izbranih za življenje v mestu in posneli svoja življenja ... da bi izvedeli, kaj se zgodi, ko računalniki prenehajo biti vljudni ... in začnite postajati resnični«.

Raziskovalci pri Googlu in Stanfordu so pred kratkim ustvarili nekakšen nov resničnostni šov – z agenti AI namesto ljudi.

Z uporabo OpenAI-jevega virusnega chatbota ChatGPT in nekaj kode po meri so ustvarili 25 likov AI z zgodbami, osebnostmi, spomini in motivacijo. Nato so raziskovalci te like spustili v mesto 16-bitnih video iger – in jim pustili, da nadaljujejo s svojim življenjem. Pa kaj ne zgodi, ko začnejo računalniki postajati pravi?

"Generativni dejavniki se zbudijo, skuhajo zajtrk in se odpravijo na delo," so zapisali raziskovalci v a papir za predhodni tisk objavljen v arXiv z opisom projekta. »Umetniki slikajo, avtorji pa pišejo; ustvarjajo mnenja, se opazijo in začenjajo pogovore; spominjajo se in razmišljajo o preteklih dneh, ko načrtujejo naslednji dan.«

Televizija ni ravno navdušujoča, a presenetljivo realistična za to, kar se spušča v ogromen algoritem strojnega učenja ... ki govori sam s seboj.

Mesto z umetno inteligenco, Smallville, je le najnovejši razvoj v fascinantnem trenutku za umetno inteligenco. Medtem ko osnovna različica ChatGPT sprejema interakcije eno za drugo – napišite poziv, prejmite odgovor –več stranskih projektov združujejo ChatGPT z drugimi programi za samodejno dokončanje niza nalog. To lahko vključuje izdelavo seznama opravil in odkljukovanje elementov na seznamu enega za drugim, iskanje informacij v Googlu in povzemanje rezultatov, pisanje in razhroščevanje kode, celo kritiziranje in popravljanje lastnega rezultata ChatGPT.

Tudi Smallville deluje zaradi tovrstnih kaskadnih interakcij. Raziskovalci so izdelali vrsto spremljevalnih algoritmov, ki skupaj poganjajo preproste agente AI, ki lahko shranjujejo spomine in nato razmišljajo, načrtujejo in delujejo na podlagi teh spominov.

Prvi korak je ustvariti lik. Da bi to naredili, raziskovalci napišejo temeljni spomin v obliki podrobnega poziva, ki opisuje osebnost, motivacijo in situacijo tega lika. Tukaj je skrajšan primer iz časopisa: »John Lin je lastnik lekarne na Willow Market and Pharmacy, ki rad pomaga ljudem. Vedno išče načine, kako svojim strankam olajšati pridobivanje zdravil; John Lin živi s svojo ženo Mei Lin, ki je profesorica na fakulteti, in sinom Eddyjem Linom, ki je študent, ki študira glasbeno teorijo.«

Toda karakterizacija ni dovolj. Vsak lik potrebuje tudi spomin. Tako je ekipa ustvarila zbirko podatkov, imenovano »tok spomina«, ki beleži agentove izkušnje v vsakdanjem jeziku.

Ko agent dostopa do pomnilniškega toka, prikaže najnovejše, pomembne in ustrezne spomine. Dogodki največje "pomembnosti" so zabeleženi kot ločeni spomini, ki jih raziskovalci imenujejo "odsevi". Končno agent ustvari načrte z uporabo gnezda vse bolj podrobnih pozivov, ki dan razdelijo na vse manjše in manjše časovne korake – vsak načrt na visoki ravni je tako razdeljen na manjše korake. Ti načrti so prav tako dodani v pomnilniški tok za priklic.

Medtem ko agent opravlja svoj dan – prevaja besedilne pozive v dejanja in pogovore z drugimi liki v igri – se dotakne svojega spominskega toka izkušenj, razmišljanj in načrtov za informiranje o vsakem dejanju in pogovoru. Medtem se nove izkušnje vrnejo v tok. Postopek je dokaj preprost, toda v kombinaciji z velikimi jezikovnimi modeli OpenAI prek vmesnika ChatGPT je rezultat presenetljivo zapleten, celo pojaven.

V preizkusu je ekipa spodbudila lik, Isabello, da načrtuje zabavo za valentinovo, drugo, Mario, pa, da se zaljubi v tretjega, Klausa. Isabella je na zabavo povabila prijatelje in stranke, okrasila kavarno in za pomoč zaposlila svojo prijateljico Mario. Maria Klausu omeni zabavo in ga povabi, naj gre z njo. Zabave se udeleži pet agentov – a prav tako človeški – nekateri se jih izognejo ali pa se enostavno ne prikažejo.

Poleg začetnih semen – načrta zabave in simpatije – se je ostalo pojavilo samo od sebe. "Družbeno vedenje širjenja novic, okraševanja, vabljenja drug drugega, prihoda na zabavo in medsebojne interakcije na zabavi je sprožila agentska arhitektura," so zapisali avtorji.

Izjemno je, da je to večinoma mogoče doseči tako, da preprosto razdelimo ChatGPT na številne funkcionalne dele in osebnosti ter jih igramo drug proti drugemu.

Video igre so najbolj očitna uporaba te vrste verjetne, odprte interakcije, še posebej v kombinaciji z avatarji visoke ločljivosti. Liki, ki niso igralci, bi se lahko razvili iz scenarijskih interakcij v pogovori s prepričljivimi osebnostmi.

Raziskovalci opozarjajo, da bi ljudi morda zamikalo, da bi vzpostavili odnose z realističnimi liki –trend, ki je že tukaj— in oblikovalci bi morali paziti, da dodajo zaščitne ograje vsebine in vedno zavrnejo, kadar je lik agent. Druga tveganja vključujejo tista, ki veljajo za generativno umetno inteligenco na splošno, kot sta širjenje napačnih informacij in pretirano zanašanje na agente.

Ta pristop morda ni dovolj praktičen za delo v običajnih video igrah, vendar nakazuje, da bo takšna prihodnost verjetno kmalu.

Enako velja za večji trend agentov. Trenutne izvedbe so kljub navdušenju še vedno omejene. Toda povezovanje več algoritmov –skupaj z vtičniki in dostopom do interneta— lahko omogoči ustvarjanje sposobnih agentov, podobnih pomočnikom, ki lahko na poziv izvedejo večstopenjske naloge. Dolgoročno bi lahko bila takšna avtomatizirana umetna inteligenca zelo uporabna, vendar predstavlja tudi tveganje, da bi neusklajeni algoritmi povzročili nepričakovane težave v velikem obsegu.

Za zdaj je najbolj očitno, kako ples med generativno umetno inteligenco in skupnostjo razvijalcev in raziskovalcev še naprej odpira presenetljive nove smeri in zmogljivosti – povratna zanka, ki še ne kaže znakov upočasnitve.

Avtorstvo slike: »Generativni agenti: Interaktivni simulakri človeškega vedenja«, Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein

Časovni žig:

Več od Središče singularnosti