Hvad hvis nogen blandede The Sims med ChatGPT-bots? Det ville se sådan ud

Hvad hvis nogen blandede The Sims med ChatGPT-bots? Det ville se sådan ud

Chatbots som Googles LaMDA eller OpenAIs ChatGPT er ikke sansende eller så intelligente. Ikke desto mindre mener Boffins, at de kan bruge disse store sprogmodeller til at simulere menneskelig adfærd inspireret af et af verdens mest populære tidlige computerspil og noget AI-kode.

Den seneste indsats i denne retning kommer fra seks dataloger – fem fra Stanford University og én fra Google Research – Joon Sung Park, Joseph O'Brien, Carrie Cai, Meredith Ringel Morris, Percy Liang og Michael Bernstein. Projektet ligner meget en hyldest til det klassiske Maxis-spil The Sims, der debuterede i 2000 og lever videre på EA i forskellige efterfølgere.

Figur 1 fra papiret Generative Agents: Interactive Simulacra of Human Behavior

Skærmbillede fra Park et al's papir om deres ChatGPT-drevne software, der illustrerer, hvad hver agent i simuleringen laver og deres samtaler

Som beskrevet i deres seneste fortrykt papir, "Generative Agents: Interactive Simulacra of Human Behavior," udviklede forskerne softwarearkitektur, der "lagrer, syntetiserer og anvender relevante minder til at generere troværdig adfærd ved hjælp af en stor sprogmodel."

Eller mere kortfattet boltede de hukommelse, refleksion (slutning fra minder) og planlægningskode til ChatGPT for at skabe generative agenter - simulerede personligheder, der interagerer og forfølger deres egne mål ved hjælp af tekstkommunikation i et forsøgt naturligt sprog.

"I dette arbejde demonstrerer vi generative agenter ved at befolke et sandkassemiljø, der minder om The Sims, med XNUMX agenter," forklarer forskerne. "Brugere kan observere og gribe ind, når agenter planlægger deres dage, deler nyheder, danner relationer og koordinerer gruppeaktiviteter."

For at gøre det, besøg demo-verdenen kører på en Heroku-instans, bygget med Phaser webspilramme. Besøgende kan interagere med en forudberegnet session-gentagelse, mens disse softwareagenter går deres liv.

Demoen, centreret omkring en agent ved navn Isabelle og hendes forsøg på at planlægge en Valentinsdagsfest, giver besøgende mulighed for at undersøge statens data af de simulerede personligheder. Det vil sige, at du kan klikke på dem og se deres teksthukommelser og anden information om dem.

For eksempel havde den generative agent Rajiv Patel følgende hukommelse 2023-02-13 20:04:40:

Hailey Johnson taler om Rajiv Patel og Hailey Johnson diskuterer potentielle samarbejder, der involverer matematik, poesi og kunst, deltager i borgmestervalgsdiskussioner og rådhusmøder for at skabe jobmuligheder for unge mennesker i deres lokalsamfund, deltage i impro-kurser og mixologi-begivenheder og Haileys plan at starte en podcast, hvor Rajiv vil være gæst og dele mere om sin guitarspilrejse; og de har også diskuteret potentielle samarbejder med Carmen Ortiz om at fremme kunst i lavindkomstsamfund for at skabe flere jobmuligheder for unge mennesker.

Formålet med denne forskning er at bevæge sig ud over grundlæggende arbejde som 1960'erne Eliza motor- og forstærkningsindsats som AlphaStar for Starcraft og OpenAI Five for Dota 2, der fokuserer på modstridende miljøer med klare sejrsmål og en softwarearkitektur, der egner sig til programmatiske agenter.

"Et forskelligartet sæt af tilgange til at skabe troværdige agenter dukkede op i løbet af de sidste fire årtier. I implementeringen forenklede disse tilgange dog ofte miljøet eller dimensionerne af agentadfærd for at gøre indsatsen mere overskuelig,” forklarer forskerne. "Men deres succes har i vid udstrækning fundet sted i modstridende spil med let definerbare belønninger, som en læringsalgoritme kan optimere til."

Store sprogmodeller, som ChatGPT, observerer boffinerne, koder for en bred vifte af menneskelig adfærd. Så givet en prompt med en tilstrækkelig snæver kontekst, kan disse modeller generere plausibel menneskelig adfærd – hvilket kan vise sig nyttigt til automatiseret interaktion, der ikke er begrænset til et specifikt sæt af forudprogrammerede spørgsmål og svar.

Men modellerne har brug for yderligere stilladser for at skabe troværdige simulerede personligheder. Det er her hukommelsen, refleksionen og planlægningsrutinerne kommer i spil.

"Agenter opfatter deres omgivelser, og alle opfattelser er gemt i en omfattende registrering af agentens oplevelser kaldet hukommelsesstrømmen," fastslår forskerne i deres papir.

"Baseret på deres opfattelser, henter arkitekturen relevante minder og bruger derefter de hentede handlinger til at bestemme en handling. Disse hentede minder bruges også til at danne langsigtede planer og til at skabe refleksioner på højere niveau, som begge indgår i hukommelsesstrømmen til fremtidig brug."

Skærmbillede af hukommelsesstrøm fra ArXiv-papir, Generative Agents: Interactive Simulacra of Human Behavior

Illustration af hukommelsesstrømmen udviklet af akademikerne, taget fra deres papir

Hukommelsesstrømmen er simpelthen en tidsstemplet liste over observationer, relevante eller ej, om agentens aktuelle situation. For eksempel:

  • (1) Isabella Rodriguez stiller bagværket frem
  • (2) Maria Lopez læser til en kemiprøve, mens hun drikker kaffe
  • (3) Isabella Rodriguez og Maria Lopez taler om at planlægge en valentinsdagsfest på Hobbs Cafe
  • (4) Køleskabet er tomt

    Disse hukommelsesstrømposter bliver bedømt for seneste, vigtighed og relevans.

Refleksioner er en type hukommelse, der genereres med jævne mellemrum, når vigtighedsscore overstiger en vis tærskel. De er fremstillet ved at forespørge den store sprogmodel om agentens seneste erfaringer for at bestemme, hvad de skal overveje, og forespørgselssvarene vænnes derefter til at undersøge modellen yderligere og stille den spørgsmål som f.eks. Hvilket emne brænder Klaus Mueller for? , Hvad er forholdet mellem Klaus Mueller og Maria Lopez?

Modellen genererer derefter et svar som Klaus Mueller er dedikeret til sin forskning i gentrificering og som bruges til at forme fremtidig adfærd og planlægningsmodulet, som skaber en daglig plan for agenter, der kan ændres gennem interaktioner med andre karakterer, der forfølger deres egne dagsordener.

Det ender ikke godt

Desuden kommunikerede agenterne med succes med hinanden, hvilket resulterede i, hvad forskerne beskriver som emergent adfærd.

"I løbet af den to-dages simulering steg de agenter, der kendte til Sams borgmesterkandidatur fra én (4 procent) til otte (32 procent), og de agenter, der kendte til Isabellas parti, steg fra én (4 procent) til tolv (48 procent). ), helt uden brugerindblanding,” står der i avisen. "Ingen, der hævdede at kende til oplysningerne, havde hallucineret det."

Der var nogle hallucinationer. Agenten Isabella havde kendskab til agenten Sams udmelding om at stille op til borgmesterposten, selvom de to aldrig havde den samtale. Og agenturet Yuriko "beskrev hendes nabo, Adam Smith, som en naboøkonom, der forfattede Wealth of Nations, en bog forfattet af en økonom fra det 18. århundrede af samme navn."

Det gik dog for det meste godt i den simulerede by Smallville. Fem af de tolv gæster, der var inviteret til festen på Hobbs cafe, dukkede op. Tre deltog ikke på grund af planlægningskonflikter. Og de resterende fire havde udtrykt interesse, men dukkede ikke op. Så tæt på det virkelige liv.

Forskerne siger, at deres generative adfærdsarkitektur skabte den mest troværdige adfærd - som vurderet af menneskelige evaluatorer - sammenlignet med versioner af arkitekturen, der deaktiverede refleksion, planlægning og hukommelse.

Begrænsninger

Samtidig indrømmede de, at deres tilgang ikke er uden nogle barske pletter.

Adfærd blev mere uforudsigelig med tiden, efterhånden som hukommelsesstørrelsen steg til det punkt, at det blev problematisk at finde de mest relevante data. Der var også uberegnelig adfærd, når det naturlige sprog, der blev brugt til minder og interaktioner, undlod at indeholde fremtrædende social information.

"For eksempel har kollegiet et badeværelse, der kun kan bebos af én person på trods af dets navn, men nogle agenter antog, at badeværelset er til mere end én person, fordi kollegiets badeværelser har en tendens til at støtte mere end én person samtidigt og vælger at gå ind. det, når der er en anden person indeni,” forklarede forfatterne.

På samme måde erkendte generative agenter ikke altid, at de ikke kunne komme ind i butikkerne, efter at de lukkede kl. 1700 lokal tid – helt klart en fejl. Sådanne problemer, siger boffinerne, kan håndteres gennem mere eksplicitte beskrivelser, såsom at beskrive kollegiets badeværelse som "enmandsbadeværelse" i stedet for et "kollegiebadeværelse" og tilføje normative åbningstider til butiksbeskrivelser.

Forskerne bemærker også, at deres tilgang var dyr - kostede tusindvis af dollars i ChatGPT-tokens for at simulere to dage - og at der skal arbejdes yderligere for at løse skævhed, utilstrækkelige modeldata og sikkerhed.

Generative agenter, bemærker de, "kan være sårbare over for hurtig hacking, memory hacking - hvor en omhyggeligt udformet samtale kunne overbevise en agent om eksistensen af ​​en tidligere begivenhed, der aldrig fandt sted - og hallucinationer, blandt andet."

Nå, de kører i hvert fald ikke flere tons stål i høj hastighed på offentlige veje. ®

Tidsstempel:

Mere fra Registret