OpenAI は火曜日に GPT-4 を発表しました。これは、昨年 XNUMX 月の発売以来、インターネットの想像力をかきたててきた、世界的に有名なチャットボットの最新版です。
MetaNews はソーシャル メディアを利用して、ユーザーがアップグレードされた技術で何をしてきたかを明らかにし、ボットのこれまでの最大の勝ち負けは何かを調べました。
大規模なマルチモーダル モデルである GPT-4 を発表し、機能と整合性に関する史上最高の結果を示します。 https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
- OpenAI(@OpenAI) 2023 年 3 月 14 日
勝利
の発売以来 GPT-4 ユーザーは勝利をチャットボットと共有することに熱心であり、勝利は積み重ねられています.
GPT-4 の開始以来の大きな見出しの 90 つは、ボットが標準化された試験にほとんど問題なく合格するという驚くべき能力を持っていることです。 弁護士候補者が法律実務を行うために受験しなければならない司法試験は、ボットが見事に合格できる試験の 88 つです (80%)。 その他の試験には、LSAT の法律試験 (XNUMX%) と GRE Quantitative math (XNUMX%) が含まれていました。
GPT-4 の大きな成果のいくつかを次に示します。
Doodle からウェブサイトへ
GPT-4 は、その能力を示す XNUMX つのデモンストレーションで、手描きのスケッチを機能的な Web サイトに変換しました。 この Web サイトは確かに非常に基本的なものですが、しっかりとした概念実証です。
GPT-4 が手描きのスケッチを機能的な Web サイトに変えるのを見たところです。
これは非常識です。 pic.twitter.com/P5nSjrk7Wn
— ローワン・チャン (@rowancheung) 2023 年 3 月 14 日
£5,000 と 2 週間の節約
XNUMX人の賢いユーザー 中継された GPT-4 を活用して、新製品の 5 つのマイクロサービスのコードを作成した方法。 ユーザーによると、「非常に優れた」開発者は 5,000 ポンドの見積もりを出し、仕事を完了するのに 2 週間かかると述べました。 GPT-4 を使用すると、ユーザーはわずか 3 時間でジョブを完了することができました。
スマート コントラクトのセキュリティ ホールを特定する
の別のアプリケーション GPT-4 イーサリアム スマート コントラクトのセキュリティ ホールを特定しています。これが悪用されると、盗難や多額の金銭の損失につながる可能性があります。
Coinbase のディレクターである Conor Grogan は、彼の Twitter アカウントからその能力を実証しました。 火曜日.
「ライブのイーサリアム コントラクトを GPT-4 にダンプしました」と Grogan 氏は言います。 「すぐに、多くのセキュリティの脆弱性が浮き彫りになり、コントラクトが悪用される可能性のある表面領域が指摘されました。 次に、契約を悪用できる特定の方法を検証しました。」
AI は最終的に、スマートコントラクトをより安全かつ簡単に構築できるようにするのに役立つと信じています。これは、大量採用の最大の障害の XNUMX つです。
—コナー(@jconorgrogan) 2023 年 3 月 14 日
損失
ChatGPT の最大の損失の 20 つは、自社のソーシャル メディアから直接もたらされたものです。 ボットは、近い将来に取って代わられる可能性のある XNUMX の仕事を予測しています。その役割は、データ入力係から採用担当者、コピーライターまで多岐にわたります。
その仕事 #GPT-4 は置き換えられ、GPT-4 によって記述されます。 pic.twitter.com/aMrwQHnfwH
— ChatGPT (@ChatGPT_0penAI) 2023 年 3 月 16 日
それほど速くない、GPT-4。
GPT-4 の能力は印象的かもしれませんが、ボットが熟練した人間の仕事に取って代わるには、まだかなりの時間が必要です。 適例:CNET. 技術出版物が最近、人間の執筆スタッフを独自のスタッフに置き換えたとき コピーライティング AI、それが排出した記事は悲惨なものでした。 確かに、そのボットは ChatGPT ではありませんでした。 チャットボット ほとんど見落とされずに人間の仕事をすること。
GPT-4 が「データ入力担当者」または「採用担当者」に取って代わる可能性があるという考えについては、これは絶対的な限界点まで信憑性を高めます。 GPT-4 はありません。これに該当する人はいません。
ソーシャル メディア ユーザーから報告された GPT-4 の失敗の他の例を次に示します。
GPT-4 はあなたのひどい質問にうんざりしています
ボットを使用してコードを作成することの期待される利点の XNUMX つは、雇用されたソフトウェア エンジニアとは異なり、ボットが疲れたり、速度が低下したり、退屈したりすることがないことです。 少なくとも、それが希望です。
ユーザー 報告 GPT-4 に「長いコード セグメント」を要求すると、AI は「退屈している」ように見え、タスクを途中で中断しただけでした。 この動作を観察したユーザーは、「この物体は日に日に人間らしくなってきています…」と明るく言いました。
MetaNews は、GPT-4 にもっと興味深いプロジェクトを任せたり、もっとお金を払ったりすることを提案しています。
失敗の勝利
追加のプロンプト eng なしで、GPT-4 で以下のロジック パズルを試しました。 GPT-3.5 は無限の幻覚でこのパズルに見事に失敗しましたが、GPT-4 はそれほど劇的に失敗しませんでした。
強力な推論能力を達成するにはまだ長い道のりがありますが、それは進歩です.
— シタル・シャー (@sytelus) 2023 年 3 月 14 日
はい、「それほど目立たないだけで失敗します」は、かすかな賞賛の中で最もかすかなものかもしれませんが、それでも進歩です. おそらく、これは「台無しにされた勝利」と呼ぶべきでしょう。
整数の失敗
小さな GPT-4 の発見: ChatGPT-4 は N=20 の整数を並べ替えることができ、N=21 の場合はしばしば失敗し、N=22 の場合はほとんど常に失敗します。 これが何を意味するのか誰か教えてください。
— アダム (@traditionalboi) 2023 年 3 月 16 日
これは、頭の中で整数を処理することに戻る必要があることを意味します。
勝ったと思った負け
これは、GPT-4 の重要なユースケースを急いで特定するためのものであり、誰もが立ち止まって、自分の勝利が本当に勝利であったかどうかを実際に考える時間があったわけではありません。
この現象は、Visual-ChatGPT を使用して、果物、チーズ、肉、卵、およびその他の主要な食材で満たされた冷蔵庫の写真をチャットボットにスキャンする方法を説明した、過度に興奮した 60 人のユーザーによって典型化されました。 次に、ユーザーは、識別した材料から XNUMX つのレシピをすべてわずか XNUMX 秒で配信するように命令しました。
その後、ユーザーは自信を持って GPT-4 の出力を、彼が説明した XNUMX つの「かなりまともな食品レシピ」と共有しました。 これらのレシピは、フルーツ サラダ、チーズ オムレツ、ハムとチーズのサンドイッチ、フルーツ スムージー、チーズとフルーツの盛り合わせでした。
野蛮なインターネットはすぐに指摘しましたが、これらの提案のほとんどは、まともなレシピは言うまでもなく、ほとんどどんな種類のレシピでもありません. さらに悪いことに、いわゆるレシピのうちの XNUMX つは、果物を皿や他の容器に入れるバリエーションにすぎません。
GPT-4 に公平を期すために、GPT-20 が代替できると予測した XNUMX の仕事のうち、Chef は XNUMX つではありませんでした。
それでも、この食べ物の話がすべて食欲を刺激した場合は、「ハムとチーズのサンドイッチ」の GPT-4 の「かなりまともな」レシピを気軽に試してみてください。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://metanews.com/taco-bells-metaverse-wedding-actually-happened/
- :は
- $UP
- 000
- 10
- 7
- 9
- a
- 能力
- 能力
- できる
- 絶対の
- 従った
- 達成する
- 実際に
- アダム
- NEW
- 養子縁組
- 利点
- AI
- アラインメント
- すべて
- 一人で
- 常に
- 間で
- および
- 発表の
- 登場
- 食欲
- 申し込み
- です
- エリア
- 物品
- AS
- At
- バック
- バー
- 基本
- BE
- さ
- 信じる
- 以下
- ビッグ
- 最大の
- 退屈する
- ロボット
- 破壊
- ビルド
- by
- 呼ばれます
- 缶
- 機能
- 場合
- 例
- 確かに
- チャットボット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- CNET
- コード
- coinbase
- コンプリート
- コンセプト
- 自信を持って
- かなりの
- 縮小することはできません。
- 契約
- 可能性
- データ
- データ入力
- 配信する
- 実証
- 記載された
- Developer
- 難しさ
- 直接に
- 取締役
- 悲惨な
- すること
- ダウン
- 容易
- 卵
- エンドレス
- エンジニア
- エントリ
- イーサリアム
- 誰も
- 試験
- 例
- 予想される
- 説明
- 悪用する
- 搾取
- フェイル
- 失敗
- 公平
- 落下
- スピーディー
- 少数の
- 埋め
- もう完成させ、ワークスペースに掲示しましたか?
- 発見
- 飛行
- フード
- 無料版
- から
- 果物
- 機能的な
- 未来
- 取得する
- 受け
- Go
- が起こった
- 持ってる
- ヘッドライン
- 助けます
- 強調表示された
- 穴
- 希望
- HOURS
- 認定条件
- しかしながら
- HTTPS
- 人間
- i
- 特定され
- 識別する
- 識別
- 想像力
- 印象的
- in
- 含まれました
- INSANE
- インスタント
- 興味深い
- インターネット
- IT
- 繰り返し
- ITS
- ジョブ
- Jobs > Create New Job
- JPG
- キーン
- 種類
- 大
- 姓
- 最新の
- 起動する
- 法律
- 弁護士
- コメントを残す
- 活用します
- 少し
- ライブ
- 長い
- 損失
- 損失
- make
- 質量
- 大量採用
- math
- 最大幅
- 手段
- メディア
- メタバース
- マイクロサービス
- お金
- 他には?
- 最も
- 近く
- 必要
- 新作
- 新製品
- 概念
- 11月
- 数
- of
- on
- ONE
- OpenAI
- 注文
- その他
- 出力
- 見落とし
- 自分の
- 支払い
- おそらく
- 現象
- 画像
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- お願いします
- ポイント
- :
- 力
- 練習
- 予測
- 予測
- プロダクト
- 進捗
- プロジェクト(実績作品)
- 証明
- 概念実証
- 出版
- パッティング
- パズル
- クイック
- すぐに
- 測距
- 最近
- レシピ
- replace
- 置き換え
- 報告
- の提出が必要です
- 結果
- 結果
- 堅牢な
- 役割
- ラッシュ
- より安全な
- 前記
- スキャン
- 秒
- セキュリティ
- セグメント
- シェアする
- shared
- ショート
- すべき
- 重要
- 単に
- から
- 熟練した
- 遅く
- スマート
- スマート契約
- スマートコントラクト
- So
- これまでのところ
- 社会
- ソーシャルメディア
- ソフトウェア
- ソフトウェアエンジニア
- 固体
- 一部
- 誰か
- 特定の
- スタッキング
- スタッフ
- ステープル
- 都道府県
- 明記
- まだ
- Force Stop
- 停止
- 株
- 提案する
- 表面
- Talk
- 仕事
- テク
- それ
- 盗難
- アプリ環境に合わせて
- もの
- 物事
- 考え
- 三
- 介して
- 時間
- タイヤ
- 〜へ
- 変換
- true
- 火曜日
- 順番
- さえずり
- 最終的に
- 明らかにする
- アップグレード
- つかいます
- ユーザー
- users
- 検証
- 勝利
- 脆弱性
- 監視
- 仕方..
- ウェブサイト
- 結婚式
- ウィークス
- この試験は
- かどうか
- which
- while
- 誰
- 意志
- win
- 勝
- 無し
- 仕事
- 働いていました
- 書きます
- コードを書く
- 書き込み
- 書かれた
- You
- あなたの
- ゼファーネット