「現実」の世界: 16 ビットの仮想都市で AI エージェントがパーティーを計画し、お互いに日付を尋ね合う

「現実」の世界: 16 ビットの仮想都市で AI エージェントがパーティーを計画し、お互いに日付を尋ね合う

「現実」の世界: AI エージェントが 16 ビット仮想タウン PlatoBlockchain データ インテリジェンスでパーティーを計画し、お互いにデートに誘います。垂直検索。あい。

「これは、コンピューターが礼儀正しさを失ったときに何が起こるかを知るために、ある町に住むように選ばれた 25 人のビデオ ゲーム キャラクターの実話です…そして… 現実になり始めるに設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」

Google とスタンフォードの研究者は最近、人の代わりに AI エージェントを使って、一種の新しいリアリティ ショーを作成しました。

OpenAI のバイラル チャットボット ChatGPT といくつかのカスタム コードを使用して、バック ストーリー、個性、思い出、動機を持つ 25 の AI キャラクターを生成しました。 次に、研究者はこれらのキャラクターを 16 ビットのビデオ ゲームの町に落として、彼らの生活を続けさせました。 だから何 ありません コンピューターが現実になり始めるとどうなりますか?

「生成エージェントは目を覚まし、朝食を作り、仕事に向かいます」と研究者は書いています。 プレプリント紙 プロジェクトの概要をarXivに投稿しました。 「芸術家は絵を描き、作家は書く。 彼らは意見を形成し、お互いに気づき、会話を始めます。 彼らは翌日の計画を立てる際に、過ぎ去った日々を思い出し、振り返ります。」

正確にはテレビを釘付けにするわけではありませんが、巨大な機械学習アルゴリズムに要約されるものは驚くほど本物そっくりです...それ自体に話しかけます.

AI の町、スモールビルは、AI にとって魅力的な瞬間の最新の開発です。 ChatGPT の基本バージョンでは、一度に XNUMX つずつやり取りが行われますが、プロンプトを書き、返信を受け取ります。多くの派生プロジェクト ChatGPT を他のプログラムと組み合わせて、タスクのカスケードを自動的に完了します。 これらには、やることリストを作成してリストの項目を XNUMX つずつチェックすること、情報をグーグル検索して結果を要約すること、 コードの作成とデバッグ、ChatGPT 自身の出力を批判して修正することさえあります。

Smallville が機能するのも、この種のカスケード インタラクションです。 研究者は一連のコンパニオン アルゴリズムを作成しました。これらのアルゴリズムを組み合わせることで、記憶を保存し、それらの記憶に基づいて反映、計画、および行動できる単純な AI エージェントを強化します。

最初のステップは、キャラクターを作成することです。 これを行うために、研究者は、そのキャラクターの性格、動機、および状況を説明する詳細なプロンプトの形で基本的な記憶を書きます. 以下は、この論文の簡単な例です。 彼は常に、顧客が薬を入手するプロセスをより簡単にする方法を探しています。 ジョン・リンは、大学教授である妻のメイ・リンと、音楽理論を研究している学生である息子のエディ・リンと一緒に暮らしています。」

しかし、特徴付けは十分ではありません。 各キャラクターにもメモリが必要です。 そこでチームは、エージェントの経験を日常言語で記録する「メモリ ストリーム」と呼ばれるデータベースを作成しました。

メモリ ストリームにアクセスすると、エージェントは最新の重要で関連性のあるメモリを表示します。 最も「重要」な出来事は、研究者が「反省」と呼ぶ別個の記憶として記録されます。 最後に、エージェントは、XNUMX 日をより小さな時間の増分に分割する、ますます詳細なプロンプトのネストを使用して計画を作成します。したがって、各高レベルの計画は、より小さなステップに分割されます。 これらのプランは、取得のためにメモリ ストリームにも追加されます。

エージェントは、テキスト プロンプトをアクションやゲーム内の他のキャラクターとの会話に変換しながら XNUMX 日を過ごすと、経験、反省、計画のメモリ ストリームを利用して、各アクションや会話に情報を提供します。 その間、新しい経験がストリームにフィードバックされます。 プロセスは非常に単純ですが、ChatGPT インターフェースを介して OpenAI の大規模な言語モデルと組み合わせると、出力は驚くほど複雑になり、創発的ですらあります。

テストでは、チームはキャラクターのイザベラにバレンタインデーのパーティーを計画するように促し、別のキャラクターのマリアにXNUMX番目のクラウスに恋をするように促しました. イザベラは友人や顧客をパーティーに招待し、カフェを飾り、友人のマリアに手伝ってもらいました。 マリアはクラウスにパーティーのことを話し、一緒に行こうと誘います。 XNUMX 人のエージェントがパーティーに参加しますが、同じように人間です。

最初の種、つまりパーティーの計画とクラッシュを超えて、残りは自然に現れました。 「言葉を広めたり、飾り付けたり、お互いに尋ねたり、パーティーに到着したり、パーティーでお互いに交流したりする社会的行動は、エージェントアーキテクチャによって開始されました」と著者は書いています.

ほとんどの場合、ChatGPT をいくつかの機能部分とパーソナリティに分割し、それらを相互に作用させるだけで、これを達成できることは驚くべきことです。

ビデオ ゲームは、特に忠実度の高いアバターと組み合わせると、この種の信じられないほど制限のないインタラクションの最も明白なアプリケーションです。 ノンプレイヤー キャラクターは、スクリプト化されたインタラクションから 説得力のある人物との会話.

研究者たちは、人々は現実的なキャラクターと関係を築きたくなるかもしれないと警告しています。すでにあるトレンド—デザイナーは、コンテンツ ガードレールを追加するように注意し、キャラクターがエージェントである場合は常に免責する必要があります。 その他のリスクには、誤った情報の拡散やエージェントへの過度の依存など、ジェネレーティブ AI 全般に適用されるリスクが含まれます。

このアプローチ 十分に実用的ではないかもしれません まだ主流のビデオゲームで動作することはありませんが、そのような未来がすぐに来る可能性が高いことを示唆しています.

エージェントのより大きな傾向についても同じことが言えます。 誇大広告にもかかわらず、現在の実装はまだ限られています. しかし、複数のアルゴリズムを接続すると—プラグインとインターネットアクセスを完備—マルチステップのタスクを即座に実行できる有能なアシスタントのようなエージェントの作成が可能になる場合があります。 長期的には、このような自動化された AI は非常に役立つ可能性がありますが、アルゴリズムの不整合が予期しない問題を大規模に引き起こすリスクもあります。

今のところ最も明白なのは、ジェネレーティブ AI と、開発者や研究者のコミュニティとの間のダンスが、驚くべき新しい方向性と機能を表面化し続けていることです。フィードバック ループは、まだ減速の兆しを見せていません。

画像著作権: 「Generative Agents: Interactive Simulacra of Human Behaviour」、Joon Sung Park、Joseph C. O'Brien、Carrie J. Cai、Meredith Ringel Morris、Percy Liang、Michael S. Bernstein

タイムスタンプ:

より多くの 特異点ハブ