„Prawdziwy” świat: agenci AI planują imprezy i zapraszają się na randki w 16-bitowym wirtualnym mieście

„Prawdziwy” świat: agenci AI planują imprezy i zapraszają się na randki w 16-bitowym wirtualnym mieście

The ‘Real’ World: AI Agents Plan Parties and Ask Each Other Out on Dates in 16-Bit Virtual Town PlatoBlockchain Data Intelligence. Vertical Search. Ai.

„To jest prawdziwa historia 25 postaci z gier wideo wybranych do życia w mieście i nagrywania ich życia… aby dowiedzieć się, co się dzieje, gdy komputery przestają być grzeczne… i zacznij stawać się prawdziwy".

Naukowcy z Google i Stanford niedawno stworzyli coś w rodzaju nowego reality show – z agentami AI zamiast ludzi.

Korzystając z wirusowego chatbota OpenAI ChatGPT i niestandardowego kodu, wygenerowali 25 postaci AI z historiami, osobowościami, wspomnieniami i motywacjami. Następnie badacze umieścili te postacie w 16-bitowym mieście gier wideo i pozwolili im żyć własnym życiem. Więc co robi stanie się, gdy komputery zaczną stawać się prawdziwe?

„Generatywni agenci budzą się, gotują śniadanie i idą do pracy” – napisali naukowcy w a papier z nadrukiem wysłane do arXiv przedstawiające projekt. „Artyści malują, podczas gdy autorzy piszą; formułują opinie, zauważają się nawzajem i inicjują rozmowy; pamiętają i zastanawiają się nad minionymi dniami, planując dzień następny”.

Niezupełnie porywająca telewizja, ale zaskakująco realistyczna jak na ogromny algorytm uczenia maszynowego… mówiący do siebie.

Miasto AI, Smallville, to tylko najnowszy rozwój w fascynującym momencie dla AI. Podczas gdy podstawowa wersja ChatGPT wykonuje interakcje pojedynczo — napisz monit, uzyskaj odpowiedź —szereg projektów pobocznych łączą ChatGPT z innymi programami, aby automatycznie wykonywać kaskadę zadań. Może to obejmować sporządzenie listy rzeczy do zrobienia i odhaczanie pozycji na liście jeden po drugim, googlowanie informacji i podsumowanie wyników, pisanie i debugowanie kodu, nawet krytykując i poprawiając własne dane wyjściowe ChatGPT.

To właśnie tego rodzaju kaskadowe interakcje sprawiają, że Smallville też działa. Naukowcy stworzyli serię algorytmów towarzyszących, które razem zasilają prostych agentów AI, którzy mogą przechowywać wspomnienia, a następnie odzwierciedlać, planować i działać w oparciu o te wspomnienia.

Pierwszym krokiem jest stworzenie postaci. Aby to zrobić, naukowcy zapisują podstawowe wspomnienie w formie szczegółowej podpowiedzi opisującej osobowość, motywacje i sytuację tej postaci. Oto skrócony przykład z gazety: „John Lin jest sklepikarzem w aptece w Willow Market and Pharmacy, który uwielbia pomagać ludziom. Zawsze szuka sposobów, aby ułatwić swoim klientom proces pozyskiwania leków; John Lin mieszka ze swoją żoną Mei Lin, która jest profesorem college'u, i synem Eddy'm Linem, który jest studentem teorii muzyki.

Ale charakteryzacja to za mało. Każda postać potrzebuje też pamięci. Zespół stworzył więc bazę danych zwaną „strumieniem pamięci”, która rejestruje doświadczenia agenta w języku potocznym.

Uzyskując dostęp do strumienia pamięci, agent ujawnia najnowsze, ważne i odpowiednie wspomnienia. Wydarzenia o najwyższej „ważności” są rejestrowane jako osobne wspomnienia, które badacze nazywają „odbiciami”. Na koniec agent tworzy plany, korzystając z zestawu coraz bardziej szczegółowych monitów, które dzielą dzień na coraz mniejsze odcinki czasu — każdy plan wysokiego poziomu jest w ten sposób podzielony na mniejsze etapy. Plany te są również dodawane do strumienia pamięci w celu ich odzyskania.

Gdy agent zajmuje się swoim dniem — tłumacząc podpowiedzi tekstowe na działania i rozmowy z innymi postaciami w grze — korzysta ze swojego strumienia pamięci doświadczeń, refleksji i planów, aby informować o każdej akcji i rozmowie. Tymczasem nowe doświadczenia wracają do strumienia. Proces jest dość prosty, ale w połączeniu z dużymi modelami językowymi OpenAI za pomocą interfejsu ChatGPT, dane wyjściowe są zaskakująco złożone, a nawet powstające.

W teście zespół skłonił jedną postać, Isabellę, do zaplanowania przyjęcia walentynkowego, a inną, Marię, do zakochania się w trzecim, Klausie. Isabella zaprosiła przyjaciół i klientów na przyjęcie, udekorowała kawiarnię i zwerbowała Marię, swoją przyjaciółkę, do pomocy. Maria wspomina o przyjęciu Klausowi i zaprasza go, by z nią poszedł. Pięciu agentów bierze udział w przyjęciu - ale równie ludzkim - kilku płatków lub po prostu nie pojawia się.

Poza początkowymi nasionami — planem przyjęcia i zauroczeniem — reszta wyłoniła się sama. „Zachowania społeczne polegające na rozpowszechnianiu informacji, dekorowaniu, zapraszaniu się na randki, przychodzeniu na przyjęcie i wzajemnych interakcjach na przyjęciu zostały zainicjowane przez architekturę agentów” – napisali autorzy.

To niezwykłe, że można to osiągnąć, w większości, po prostu dzieląc ChatGPT na kilka funkcjonalnych części i osobowości i grając je ze sobą.

Gry wideo to najbardziej oczywiste zastosowanie tego rodzaju wiarygodnej, otwartej interakcji, zwłaszcza w połączeniu z awatarami o wysokiej wierności. Postacie niezależne mogą ewoluować od scenariuszowych interakcji do rozmowy z przekonującymi osobowościami.

Naukowcy ostrzegają, że ludzie mogą ulegać pokusie nawiązywania relacji z realistycznymi postaciami:trend, który już tu jest— a projektanci powinni zadbać o dodanie barier ochronnych i zawsze zrzekać się, kiedy postać jest agentem. Inne zagrożenia obejmują te, które mają zastosowanie do generatywnej sztucznej inteligencji w ogóle, takie jak rozpowszechnianie dezinformacji i nadmierne poleganie na agentach.

To podejście może nie być wystarczająco praktyczny do pracy w głównych grach wideo, ale sugeruje, że taka przyszłość prawdopodobnie nadejdzie wkrótce.

To samo dotyczy szerszego trendu wśród agentów. Obecne implementacje są nadal ograniczone, pomimo szumu. Ale połączenie wielu algorytmów —wraz z wtyczkami i dostępem do Internetu— może pozwolić na stworzenie zdolnych, podobnych do asystentów agentów, którzy mogą wykonywać wieloetapowe zadania w krótkim czasie. W dłuższej perspektywie taka zautomatyzowana sztuczna inteligencja może być całkiem użyteczna, ale stwarza również ryzyko niedopasowania algorytmów powodujących nieprzewidziane problemy na dużą skalę.

Na razie najbardziej oczywiste jest to, jak taniec między generatywną sztuczną inteligencją a społecznością programistów i badaczy wciąż ujawnia zaskakujące nowe kierunki i możliwości — pętla sprzężenia zwrotnego, która jeszcze nie wykazuje oznak spowolnienia.

Źródło obrazu: „Generatywni agenci: interaktywne symulacje ludzkich zachowań”, Joon Sung Park, Joseph C. O'Brien, Carrie J. Cai, Meredith Ringel Morris, Percy Liang, Michael S. Bernstein

Znak czasu:

Więcej z Centrum osobliwości