Google の Genie AI は単一の画像からゲームを作成

プラトン再発行

フォロワー： 0

Googleは、人工知能への継続的な投資の一環として、モバイルゲーム作成アプリ「Genie」を発表した。

GoogleのAIスタートアップDeepMindが開発した生成AIモデルGenieのライブデモが行われた。 Genie は、何十万ものゲームプレイビデオからゲームの仕組みを学習し、最小限のプロンプトでプレイ可能なゲームを生成できます。

Google DeepMind、プレイ可能なゲームを即座に呼び出す AI「Genie」を発表 https://t.co/9c6iMsZ1Qa $ GOOG $ GOOGL

— BizTechia (@BizTechia) 2024 年 2 月 27 日

また読む： Figure AI、労働解決ヒューマノイドロボット開発で675億XNUMX万ドルを調達

魔神のお披露目

Google の公式 DeepMind に記載されているとおりブログ投稿, Genie は、オンラインビデオを使用してトレーニングされた基礎的な世界モデルです。「合成画像、写真、さらにはスケッチから、無限に多様なプレイ可能な（アクション制御可能な）世界」をモデルによって生成できます。

Genie は Generative Interactive Environmentals の略で、Google とブリティッシュコロンビア大学の提携により開発されました。たった 2 枚の画像で、ユーザーのプロンプトに基づいて Contra や Super Mario Brothers などの横スクロール XNUMXD プラットフォーマーを生成できます。

しかし、Google DeepMind は発表の中で、Genie の形で生成人工知能 (AI) の「新しいパラダイム」を導入すると述べました。さらに同社は、言語、画像、さらにはビデオを通じて斬新で創造的なコンテンツを生成できる生成 AI モデルの出現を認めました。

Google が Genie を発表

生成的インタラクティブ環境

Genie は、ラベルのないインターネットビデオから教師なしの方法でトレーニングされた初の生成インタラクティブ環境です。モデルは、無限の種類のアクション制御可能な仮想を生成するように促すことができます。 pic.twitter.com/ZO1focG7Vx

—AK (@_akhaliq) 2024 年 2 月 26 日

Google によると、Genie がトレーニングされた 200,000 時間に及ぶ監視されていない公開インターネットゲームビデオのうち、かなりの部分は完全な仮想現実ゲームではなく 2D プラットフォーマーです。

ジーニーの仕様

次元に関して言えば、Genie のパラメータは 11 億にも及びます。このモデルには、時空間ビデオトークナイザー、自己回帰ダイナミクスモデル、およびシンプルでスケーラブルな潜在アクションモデルも含まれています。これらの仕様により、Genie は、トレーニング時にラベルやその他のドメイン固有の要件がなくても、生成された環境でフレームごとに動作できるようになります。

さらに、Genie は、ビデオのみのデータでトレーニングされているにもかかわらず、インタラクティブで制御可能な環境の多様なセットを生成するように指示できます。 Genie は、言語画像やビデオを使用してクリエイティブなコンテンツを作成できる多数の生成 AI モデルとは異なり、たった 1 つの画像プロンプトでプレイ可能な環境を作成できます。

しかし、Google DeepMind の開発者 Tim Rocktäschel 氏は、X (元 Twitter) で、帰納的バイアスを追加するのではなく、スケールに重点を置いていると述べました。

帰納的なバイアスを加えるのではなく、スケールに重点を置きます。 200D プラットフォームからの 2 万時間以上のビデオのデータセットを使用し、11 億の世界モデルをトレーニングします。ジーニーは、監視されていない方法で、一貫した方法でキャラクターを制御するさまざまな潜在的なアクションを学習します。 pic.twitter.com/71a3iuAGZA

— ティム・ロックテシェル (@_rockt) 2024 年 2 月 26 日

同氏は、200D プラットフォーマーからの 2 万時間以上のビデオのデータセットを使用し、11 億の世界モデルをトレーニングしていると付け加えました。ジーニーは、監視されていない方法で、キャラクターを一貫して制御するさまざまな潜在的なアクションを学習します。

Google の Genie AI は単一の画像からゲームを作成 — 写真提供者：Google

ジーニーの能力

によるでログイン研究者らによると、Genie は 3 つのモデルによって駆動されています。1 つは次のフレームで何が起こるかを予測する動的モデル、生のビデオフレームを個別のトークンに変換するビデオトークナイザー、そしてビデオフレーム間のアクションを推測できる潜在アクションモデルです。

Genie の基本モデルは、アクションやテキスト注釈のトレーニングを受けずにゲームの主要キャラクターを識別できる機能を備えており、そのユニークな機能の 1 つです。それを駆動するモデルのおかげで、ユーザーはキャラクターを簡単に制御できます。 AIによって生成された仮想現実環境。

Rocktäschel 氏はまた、Genie は他のメディアをゲームに変えることができるとも述べました。 Genie は、付属の Google DeepMind 研究論文のさまざまな入力からさまざまなアクション制御可能な仮想世界を作成するように依頼できます。

何を明らかにするかとても楽しみです @GoogleDeepMindのオープンエンドネスチームは🚀に取り組んできました。 Genie 🧞 は、インターネットビデオのみからトレーニングされた基盤ワールドモデルで、画像プロンプトが与えられると、無限の種類のアクション制御可能な 2D 世界を生成できます。 pic.twitter.com/TnQ8uv81wc

— ティム・ロックテシェル (@_rockt) 2024 年 2 月 26 日

さらに、Rocktäschel 氏は、このモデルはあらゆる画像を再生可能な 2D 世界に変換できると述べました。彼によると、Genie は人間がデザインしたスケッチなどの作品に命を吹き込むことができます。たとえば、世界の最年少クリエイターであるセネカとカスピアンの XNUMX 人による美しいアートワークです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://metanews.com/googles-genie-ai-crafts-games-from-single-images/

タイムスタンプ： 2024 年 2 月 29 日

タイムスタンプ： 2024 年 4 月 12 日

Google の Genie AI は単一の画像からゲームを作成

プラトン再発行

魔神のお披露目

ジーニーの仕様

ジーニーの能力

より多くのメタニュース

ChatGPTのローンチ後、AmazonでAIが書いた電子書籍ブーム

レディー・ガガ、フォートナイト・メタバースの音楽祭でヘッドラインを飾る

Twitterに追加された暗号価格チャート

God of War: Ragnarok、2022 年後半に PC と PS5 に登場

米国、誤情報と闘うためにウクライナのeスポーツプログラムに資金提供

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

魔神のお披露目

ジーニーの仕様

ジーニーの能力

より多くの メタニュース

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くのメタニュース