Google の Genie AI は単一の画像からゲームを作成

Google の Genie AI は単一の画像からゲームを作成

Googleは、人工知能への継続的な投資の一環として、モバイルゲーム作成アプリ「Genie」を発表した。 

GoogleのAIスタートアップDeepMindが開発した生成AIモデルGenieのライブデモが行われた。 Genie は、何十万ものゲームプレイ ビデオからゲームの仕組みを学習し、最小限のプロンプトでプレイ可能なゲームを生成できます。

また読む: Figure AI、労働解決ヒューマノイドロボット開発で675億XNUMX万ドルを調達

魔神のお披露目

Google の公式 DeepMind に記載されているとおり ブログ投稿, Genie は、オンラインビデオを使用してトレーニングされた基礎的な世界モデルです。 「合成画像、写真、さらにはスケッチから、無限に多様なプレイ可能な(アクション制御可能な)世界」をモデルによって生成できます。

Genie は Generative Interactive Environmentals の略で、Google とブリティッシュ コロンビア大学の提携により開発されました。たった 2 枚の画像で、ユーザーのプロンプトに基づいて Contra や Super Mario Brothers などの横スクロール XNUMXD プラットフォーマーを生成できます。

しかし、Google DeepMind は発表の中で、Genie の形で生成人工知能 (AI) の「新しいパラダイム」を導入すると述べました。さらに同社は、言語、画像、さらにはビデオを通じて斬新で創造的なコンテンツを生成できる生成 AI モデルの出現を認めました。

Google によると、Genie がトレーニングされた 200,000 時間に及ぶ監視されていない公開インターネット ゲーム ビデオのうち、かなりの部分は完全な仮想現実ゲームではなく 2D プラットフォーマーです。

ジーニーの仕様

次元に関して言えば、Genie のパラメータは 11 億にも及びます。このモデルには、時空間ビデオ トークナイザー、自己回帰ダイナミクス モデル、およびシンプルでスケーラブルな潜在アクション モデルも含まれています。これらの仕様により、Genie は、トレーニング時にラベルやその他のドメイン固有の要件がなくても、生成された環境でフレームごとに動作できるようになります。

さらに、Genie は、ビデオのみのデータでトレーニングされているにもかかわらず、インタラクティブで制御可能な環境の多様なセットを生成するように指示できます。 Genie は、言語画像やビデオを使用してクリエイティブなコンテンツを作成できる多数の生成 AI モデルとは異なり、たった 1 つの画像プロンプトでプレイ可能な環境を作成できます。

しかし、Google DeepMind の開発者 Tim Rocktäschel 氏は、X (元 Twitter) で、帰納的バイアスを追加するのではなく、スケールに重点を置いていると述べました。

同氏は、200D プラットフォーマーからの 2 万時間以上のビデオのデータセットを使用し、11 億の世界モデルをトレーニングしていると付け加えました。ジーニーは、監視されていない方法で、キャラクターを一貫して制御するさまざまな潜在的なアクションを学習します。

Google の Genie AI は単一の画像からゲームを作成
写真提供者:Google

ジーニーの能力

による でログイン 研究者らによると、Genie は 3 つのモデルによって駆動されています。1 つは次のフレームで何が起こるかを予測する動的モデル、生のビデオ フレームを個別のトークンに変換するビデオ トークナイザー、そしてビデオ フレーム間のアクションを推測できる潜在アクション モデルです。

Genie の基本モデルは、アクションやテキスト注釈のトレーニングを受けずにゲームの主要キャラクターを識別できる機能を備えており、そのユニークな機能の 1 つです。それを駆動するモデルのおかげで、ユーザーはキャラクターを簡単に制御できます。 AIによって生成された 仮想現実環境。

Rocktäschel 氏はまた、Genie は他のメディアをゲームに変えることができるとも述べました。 Genie は、付属の Google DeepMind 研究論文のさまざまな入力からさまざまなアクション制御可能な仮想世界を作成するように依頼できます。

さらに、Rocktäschel 氏は、このモデルはあらゆる画像を再生可能な 2D 世界に変換できると述べました。彼によると、Genie は人間がデザインしたスケッチなどの作品に命を吹き込むことができます。たとえば、世界の最年少クリエイターであるセネカとカスピアンの XNUMX 人による美しいアートワークです。

タイムスタンプ:

より多くの メタニュース