AIは大量の光と熱を生成し続けます。テキストと画像の最高のモデルは、今や購読数を伸ばし、消費者向け製品に組み込まれており、インチを競い合っています。 OpenAI、Google、Anthropic はすべて、多かれ少なかれ互角の関係にあります。
AI 研究者が生成モデルを新たな領域に押し広げようとしているのも不思議ではありません。 AI には膨大な量のデータが必要となるため、今後の展開を予測する 1 つの方法は、オンラインで広く入手可能であるものの、まだほとんど利用されていないデータを調べることです。
ビデオはたくさんありますが、次のステップとなるのは明らかです。実際、先月、OpenAI はプレビューされました Sora と呼ばれる新しいテキストからビデオへの AI それは見物人を唖然とさせた。
しかし、ビデオやゲームはどうでしょうか?
尋ねて受け取る
オンラインにはかなりの数のゲーマービデオがあることがわかりました。 Google DeepMind は、ゲーマーがシンプルなプラットフォーマー (初期の任天堂のゲームを思い浮かべてください) をプレイしている様子を映す 30,000 時間に及ぶ厳選されたビデオ映像をもとに、新しい AI である Genie を訓練したと述べています。 独自のサンプルを作成できるようになりました.
Genie は、単純な画像、写真、またはスケッチをインタラクティブなビデオ ゲームに変えます。
たとえば、キャラクターとその周囲の絵などのプロンプトが与えられると、AI はプレイヤーからの入力を受け取り、その世界内でキャラクターを移動させることができます。 DeepMind はブログ投稿で、Genie の作品が 2D の風景をナビゲートし、プラットフォーム間を歩き回ったりジャンプしたりする様子を示しました。尻尾を食べるヘビのように、これらの世界のいくつかは AI が生成した画像をソースとしています。
従来のビデオ ゲームとは対照的に、Genie はこれらのインタラクティブな世界をフレームごとに生成します。プロンプトと移動コマンドが与えられると、最も可能性の高い次のフレームを予測し、その場で作成します。さらに、前景が背景よりも速く動くプラットフォーマーによくある機能である視差の感覚を組み込むことも学びました。
注目すべきは、AI のトレーニングにはラベルが含まれていなかったことです。むしろ、Genie は、トレーニングの例を観察するだけで、入力コマンド (左、右、ジャンプなど) とゲーム内の動きを関連付けることを学びました。つまり、ビデオ内のキャラクターが左に動くとき、コマンドとその動きを結び付けるラベルがありませんでした。ジーニーはその部分を自分で理解しました。つまり、将来のバージョンは、オンラインにある限りの適切なビデオでトレーニングできる可能性があります。
この AI は優れた概念実証ですが、まだ開発の初期段階にあり、DeepMind はモデルをまだ公開する予定はありません。
ゲーム自体は、60 秒あたり 120 フレームの速度でストリーミングされるピクセル化された世界です。それに比べて、現代のビデオ ゲームは XNUMX 秒あたり XNUMX または XNUMX フレームに達することがあります。また、すべての生成アルゴリズムと同様に、Genie は奇妙な、または一貫性のない視覚的なアーティファクトを生成します。また、「非現実的な未来」の幻覚を見る傾向があります。 チームはAIについて説明した論文にこう書いた.
そうは言っても、Genie がここから改善すると信じる理由はいくつかあります。
世界をかき立てる
AI はラベルのないオンライン ビデオから学習でき、パラメータ数が 11 億個とまだ控えめなサイズであるため、スケールアップする機会は十分にあります。より多くの情報に基づいてトレーニングされた大規模なモデルは、劇的に改善される傾向があります。そして、 推論に重点を置いた成長産業訓練された AI が画像やテキストの生成などのタスクを実行するプロセスは、さらに高速化される可能性があります。
DeepMind は、Genie はプロの開発者などの人々のビデオゲーム作成を支援できる可能性があると述べています。しかし、Sora はビデオ以上のものであると信じている OpenAI と同様に、チームはより広い視野で考えています。このアプローチはビデオゲームをはるかに超えたものになる可能性があります。
一例です。 ロボットを制御できるAI。チームは、さまざまなタスクを完了するロボットアームのビデオで別のモデルをトレーニングしました。モデルはロボットを操作し、さまざまな物体を扱うことを学びました。
DeepMindはまた、Genieが生成したビデオゲーム環境をAIエージェントのトレーニングに使用できる可能性があるとも述べた。それは新しい戦略ではありません。 2021年の論文では、別の論文で DeepMind チームは、XLand と呼ばれるビデオ ゲームの概要を説明しました そこには、AI エージェントと、彼らに挑戦するタスクやゲームを生成する AI オーバーロードが住んでいました。 AI の次の大きなステップには、相互にトレーニングしたり、合成トレーニング データを生成したりできるアルゴリズムが必要になるという考えです。 けん引力.
これらすべては、AI の進歩を示すための OpenAI と Google 間の熾烈な競争における最新の一斉攻撃です。他の人が現場にいる間、 人間っぽい、GPT-4に似たマルチモーダルモデルを進めており、GoogleとOpenAIも世界をシミュレートするアルゴリズムに焦点を当てているようです。このようなアルゴリズムは、計画と対話において優れている可能性があります。どちらも、AI エージェントにとって重要なスキルとなり、両組織が開発に熱心に取り組んでいるようです。
「ジーニーは、現実世界の写真やスケッチなど、これまでに見たことのない画像を表示することで、人々が想像上の仮想世界と対話できるようにすることができ、基本的に世界の基礎モデルとして機能します」と研究者らは論文で述べている。 ジーニーのブログ投稿。 「私たちが焦点を当てているのは、 2D プラットフォーマー ゲームとロボット工学のビデオ しかし、私たちの方法は一般的であり、あらゆる種類のドメインで機能し、さらに大規模なインターネット データセットにも拡張可能です。」
同様に、OpenAI が先月 Sora をプレビューしたとき、研究者らは、それがより基礎的なもの、つまり世界シミュレーターを予告する可能性があると示唆しました。つまり、両チームは、オンライン ビデオの膨大なキャッシュを、AI が独自のビデオを生成するようにトレーニングする方法であると考えているようですが、同時に、オンラインまたはオフラインで世界をより効果的に理解し、運用するためでもあります。
これが利益をもたらすのか、それとも長期的に持続可能なのかは未解決の問題です。人間の脳は電球に相当する電力で動作します。生成 AI はデータセンター全体を使い果たします。しかし、AI を改善するだけでなく、AI の効率性を高めることを目指して、人材、技術、頭脳、資金といった現在働いている力を過小評価しないことが最善です。
テキスト、画像、音声、そしてその 3 つすべてにおいて目覚ましい進歩が見られました。ビデオはポットに投入される次の材料であり、さらに強力なビールを作る可能性があります。
画像のクレジット: Google DeepMind
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://singularityhub.com/2024/03/07/a-google-ai-watched-30000-hours-of-video-games-now-it-makes-its-own/
- :持っている
- :は
- :not
- :どこ
- $UP
- 000
- 11
- 120
- 2021
- 2D
- 30
- 60
- a
- 私たちについて
- 演技
- 前進
- エージェント
- AI
- 同族の
- アルゴリズム
- すべて
- また
- 金額
- an
- および
- 別の
- 人間原理
- どれか
- 適用可能な
- アプローチ
- です
- 武器
- 周りに
- AS
- At
- オーディオ
- 利用できます
- 背景
- BE
- さ
- 信じる
- と考えています
- BEST
- より良いです
- の間に
- 越えて
- ビッグ
- より大きい
- 10億
- ブログ
- 両言語で
- 脳
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- キャッシュ
- 呼ばれます
- 缶
- センター
- 挑戦する
- 文字
- コマンドと
- 比較
- 競合します
- コンペ
- 完了
- コンセプト
- consumer
- 現代の
- 続ける
- コントラスト
- コントロール
- 可能性
- 作ります
- 作成します。
- 創作
- クレジット
- 重大な
- キュレーション
- データ
- データセンター
- データセット
- ディープマインド
- 記述
- 開発者
- 開発
- 配当金
- ドメイン
- 劇的に
- 描画
- 早い
- 効果的に
- 効率的な
- 有効にする
- 巨大な
- 環境
- さらに
- EVER
- 例
- 例
- 速いです
- 特徴
- 少数の
- フィールド
- 考え出した
- フォーカス
- 焦点を当て
- 軍隊
- 予想
- Foundation
- 基礎的な
- FRAME
- から
- 未来
- 先物
- ゲーム
- ゲーマー
- Games
- 生成する
- 生成
- 生成
- 生々しい
- 生成AI
- 精霊
- 取得する
- 与えられた
- Go
- 行く
- でログイン
- google it
- ハンドル
- 助けます
- こちら
- ヒット
- HOURS
- HTTPS
- 人間
- アイデア
- 画像
- 画像
- 想像
- 印象的
- 改善します
- in
- ゲーム内の
- include
- 確かに
- 産業を変えます
- 情報
- 強烈な
- 意図
- 対話
- 相互作用
- 相互作用的
- インターネット
- に
- IT
- ITS
- 自体
- ラベル
- ラベル
- 風景
- 主として
- より大きい
- 姓
- 最新の
- LEARN
- 学んだ
- 左
- less
- 光
- ような
- 可能性が高い
- 連結
- 長い
- 見て
- 探して
- make
- 作る
- 五月..
- 手段
- 方法
- かもしれない
- モデル
- 控えめな
- 月
- 他には?
- もっと効率的
- 最も
- モーション
- 移動
- 動作
- 移動
- ずっと
- ナビゲート
- 決して
- 新作
- 次の
- Nintendo
- いいえ
- オブジェクト
- 明白
- of
- オフ
- on
- ONE
- オンライン
- の
- 開いた
- OpenAI
- 操作する
- 動作
- 機会
- or
- 組織
- その他
- 私たちの
- でる
- 概説
- 自分の
- 紙素材
- 部
- 国
- のワークプ
- 以下のために
- 実行する
- 写真
- 写真
- 計画
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- プレイヤー
- 再生
- プレンティ
- 人口
- ポスト
- 強力な
- :
- 電力
- 予測
- プロセス
- 作成
- プロ
- 進捗
- 証明
- 概念実証
- 公共
- プッシュ
- 質問
- 非常に
- むしろ
- リアル
- 現実の世界
- 理由は
- 必要とする
- 必要
- 研究者
- 右
- ロボット
- 前記
- 言う
- 言う
- ド電源のデ
- 規模
- 二番
- 思われる
- 見て
- センス
- 別
- すべき
- 表示する
- 示されました
- 表示
- 簡単な拡張で
- 単に
- シミュレートする
- シミュレータ
- スキル
- 一部
- 何か
- 調達
- 手順
- まだ
- 奇妙な
- 戦略
- ストリーミング
- サブスクリプション
- そのような
- 驚き
- 持続可能な
- 合成
- 取る
- 才能
- タスク
- チーム
- チーム
- テク
- 傾向があります
- 期間
- 条件
- 領土
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- より
- それ
- 世界
- アプリ環境に合わせて
- それら
- 自分自身
- その後
- そこ。
- ボーマン
- 彼ら
- 物事
- 考え
- この
- 三
- 介して
- 〜へ
- 一緒に
- 伝統的な
- トレーニング
- 訓練された
- トレーニング
- ターン
- type
- わかる
- 未開発
- 中古
- 使用されます
- 多様
- さまざまな
- バージョン
- 非常に
- ビデオ
- ビデオゲーム
- ビデオゲーム
- 動画
- 詳しく見る
- バーチャル
- ビジュアル
- ウォーキング
- ました
- 監視
- 仕方..
- WELL
- した
- この試験は
- いつ
- which
- while
- 全体
- 広く
- 意志
- 仕事
- 世界
- 世界の
- 価値
- 書いた
- はい
- まだ
- ゼファーネット