あなたは散弾銃小屋に住んでいることに気づくかもしれません。そして、GPT-4 を使用していることに気づくかもしれません。そして、「GPT-4 は Doom を実行するのでしょうか?」と自問するかもしれません。そして、あなたは自問するかもしれません。私が間違っている?"
マイクロソフトの主任応用科学者であり、イギリスのヨーク大学の研究者でもあるエイドリアン・デ・ウィンター氏は、最近の研究論文で次のような疑問を投げかけています。GPT-4は破滅をもたらすのか?「
残念ながら、Microsoft が支援する OpenAI の大規模な言語モデルである GPT-4 には、Doom のソース コードを直接実行する機能がありません。
しかし、そのマルチモーダルなバージョンである GPT-4V は、テキストだけでなく画像も入力として受け入れることができ、同様の愛らしいサブコンピテンシーを示します。 運命 無数の AI スタートアップを立ち上げた、問題を抱えたテキストベースのモデルと同じです。
「論文の設定では、GPT-4 (およびビジョン付き GPT-4、または GPT-4V) は、実際にはそれ自体で Doom を実行することはできません。入力サイズによって制限されているためです (そして明らかに、おそらくそれは単に何かをでっち上げているだけでしょう) ; コンパイラが XNUMX 分ごとに幻覚を起こすのは本当に望ましくありません)」と de Wynter 氏は説明文で書いています。 注意 彼の論文について。 「とはいえ、エンジンのプロキシとして機能することは間違いなく、他の「Doom を実行しますか?」と区別することはできません。実装など 大腸菌 or メモ帳に設立された地域オフィスに加えて、さらにローカルカスタマーサポートを提供できるようになります。」
つまり、GPT-4V では Doom は実行されません。 ジョンディアのトラクターみたいに ただし、特別なトレーニングなしでも Doom をプレイできます。
これを管理するために、de Wynter は GPT-4V を呼び出す Vision コンポーネントを設計しました。GPT-4V は、ゲーム エンジンからスクリーンショットをキャプチャし、ゲーム状態の構造記述を返します。そして彼は、それを GPT-XNUMX を呼び出して視覚的な入力と以前の履歴に基づいて意思決定を行うエージェント モデルと組み合わせました。エージェント モデルは、その応答を、ゲーム エンジンにとって意味のあるキーストローク コマンドに変換するように指示されています。
インタラクションは、オープンソースの Python バインディングで構成されるマネージャー層を通じて処理されます。 C ドゥームエンジン Matplotlib 上で実行されます。
同紙によると、この AI モデルとコードの組み合わせにより、ドアを開け、敵と戦い、武器を発砲することができるという。また、レベルのウォークスルーなどのより広範な命令セットを実行して、自身のパフォーマンスを向上させることができます。
この GPT-4V ベースのシステムの主な欠点は、オブジェクトの永続性が欠如していることです。ゲーム内のゾンビが画面外に出ると、そのことを忘れてしまいます。
GPT-4 はゾンビのことを忘れてただ進み続けます
「たとえば、モデルが画面上にゾンビを見つけて、ゾンビに当たる(または死ぬ)まで発砲し続けることは非常に一般的です」とデ・ウィンター氏は説明します。 「これは 1993 年のハードウェアで動作するように書かれた AI なので、非常に深い意思決定ツリーはないと推測します。ゾンビはあなたに向かって発砲し、部屋中を走り始めます。
「ここで何が問題ですか?さて、まずゾンビが視界から消えます。さらに悪いことに、それはまだ生きており、いつかあなたを打ちのめすでしょう。だから、それを追いかけなければなりませんね?結局のところ、Doom では叩くか叩かれるかです。
「GPT-4 はゾンビのことを忘れてそのまま進み続けることが判明しました。注: プロンプトは、モデルがダメージを受けていて敵が見えない場合に何をすべきかを明示的にモデルに指示します。さらに良いのは、ただ楽しく進んで隅に追い込まれて死んでしまうことです。何度か向きを変えましたが、50~60回近くの実行で、それを観察しました…言いたいのはXNUMX回です。」
また、GPT-4 はうまく推論することができません。文脈上は一般的に正しい行動を説明するように求められたとき、その説明は不十分で、しばしば幻覚(別名、誤った情報)が含まれていました。
それでもデ・ウィンター氏は、GPT-4 が事前のトレーニングなしで Doom をプレイできることは注目に値すると考えています。
同時に、彼はそれが厄介なことだとも感じています。
「倫理部門に関して言えば、(a) モデルに何かを撮影させるためのコードを構築するのが私にとってどれほど簡単だったかは非常に心配です。 (b) モデルが指示を実際に考え直さずに正確に撮影できるようにすること」と彼は要約投稿に書いている。
「つまり、これは計画と推論に関する非常に興味深い調査であり、ビデオ ゲームの自動テストに応用できる可能性がありますが、このモデルが自分が何をしているのかを認識していないことは明らかです。これらのモデルの導入が社会とその潜在的な悪用にどのような影響を与えるかを皆さんに考えていただくことを強くお勧めします。」
そしてあなたは自分自身にこう言うかもしれません。神様、私が何をしてしまったのでしょうか?”®
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://go.theregister.com/feed/www.theregister.com/2024/03/11/gpt4_wont_run_doom/
- :持っている
- :は
- :not
- $UP
- 369
- 7
- a
- 私たちについて
- 同意
- 従った
- 正確にデジタル化
- 行為
- 行動
- 実際に
- 後
- エージェント
- AI
- AIモデル
- 別名
- alive を使用します。
- すべて
- am
- an
- および
- 適用された
- です
- 周りに
- AS
- 頼む
- At
- 自動化
- 知って
- ベース
- BE
- なぜなら
- き
- より良いです
- 拘束
- より広い
- ビルド
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- コール
- 缶
- できる
- 容量
- キャプチャ
- チャート
- クリック
- CO
- コード
- 組み合わせた
- コマンドと
- コンポーネント
- 考慮する
- からなる
- コンテキスト
- コーナー
- 正しい
- 可能性
- カップル
- 損傷
- de
- 決定
- 決定
- 深いです
- 絶対に
- 部門
- 展開
- 設計
- 設計
- ダイアグラム
- DID
- 死んだ
- 直接に
- do
- doesnの
- すること
- ドン
- 行われ
- 運命
- ドア
- 簡単に
- エンジン
- イングランド
- 倫理
- あらゆる
- 誰も
- 例
- 実行します
- 展示
- 説明する
- 説明
- 説明
- 明示的
- 探査
- 戦い
- もう完成させ、ワークスペースに掲示しましたか?
- 発見
- 火災
- 発射
- 名
- 五
- はしゃぐ
- から
- ゲーム
- 一般に
- 取得する
- を取得
- GitHubの
- Go
- 神
- ゴエス
- 行く
- 推測
- Hardware
- 持ってる
- he
- こちら
- 彼の
- history
- ヒット
- 認定条件
- HTML
- HTTPS
- i
- if
- 画像
- 実装
- 改善します
- in
- ゲーム内の
- 含まれました
- 誤った
- 情報
- 説明書
- 興味深い
- に
- 問題
- IT
- ITS
- 自体
- John Redfern
- JPG
- ただ
- 続けて
- 欠如
- 言語
- 大
- 打ち上げ
- 層
- レベル
- ような
- 限定的
- 生活
- メイン
- make
- 管理します
- マネージャー
- matplotlib
- 五月..
- me
- 意味
- メリー
- Microsoft
- 分
- 誤用
- マサチューセッツ工科大学(MIT)
- ミックス
- モデル
- ほぼ
- 注意
- 今
- オブジェクト
- 明白
- of
- オフ
- 頻繁に
- on
- 開いた
- オープンソース
- OpenAI
- or
- その他
- でる
- 自分の
- 紙素材
- パフォーマンス
- 計画
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- 再生
- ポイント
- 貧しいです
- 提起
- ポスト
- 潜在的な
- 前
- 校長
- 事前の
- 多分
- 代理
- Python
- 質問
- 非常に
- 本当に
- 理由
- 最近
- 顕著
- 研究
- 研究者
- 回答
- 収益
- 右
- ルーム
- ラン
- ランニング
- runs
- s
- 前記
- 同じ
- 言う
- 科学者
- 画面
- スクリーンショット
- セッションに
- 最高の
- 表示
- サイズ
- So
- 社会
- 一部
- 何か
- ソース
- ソースコード
- 特定の
- start
- 開始
- スタートアップ
- 都道府県
- まだ
- 強く
- 構造
- そのような
- 概要
- スーパー
- 取得
- 伝える
- テスト
- 클라우드 기반 AI/ML및 고성능 컴퓨팅을 통한 디지털 트윈의 기초 – Edward Hsu, Rescale CPO 많은 엔지니어링 중심 기업에게 클라우드는 R&D디지털 전환의 첫 단계일 뿐입니다. 클라우드 자원을 활용해 엔지니어링 팀의 제약을 해결하는 단계를 넘어, 시뮬레이션 운영을 통합하고 최적화하며, 궁극적으로는 모델 기반의 협업과 의사 결정을 지원하여 신제품을 결정할 때 데이터 기반 엔지니어링을 적용하고자 합니다. Rescale은 이러한 혁신을 돕기 위해 컴퓨팅 추천 엔진, 통합 데이터 패브릭, 메타데이터 관리 등을 개발하고 있습니다. 이번 자리를 빌려 비즈니스 경쟁력 제고를 위한 디지털 트윈 및 디지털 스레드 전략 개발 방법에 대한 인사이트를 나누고자 합니다.
- それ
- アプリ環境に合わせて
- その後
- ボーマン
- 彼ら
- 考える
- この
- 介して
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- 言われ
- トレーニング
- 翻訳する
- ツリー
- 困った
- 順番
- ターン
- Twice
- 下
- 大学
- 異なり、
- まで
- バリアント
- 非常に
- ビデオ
- ビデオゲーム
- 詳しく見る
- ビジョン
- ビジュアル
- ウォークスルー
- 欲しいです
- ました
- 仕方..
- 兵器
- WELL
- した
- この試験は
- いつ
- which
- while
- 意志
- 無し
- 勝った
- 仕事
- ワーキング
- もっと悪い
- でしょう
- 書かれた
- 間違った
- 書いた
- まだ
- ヨーク
- You
- あなたの
- あなた自身
- ゼファーネット
- ゾンビ