迅速なエンジニアリングは AI モデルに任せるのが最適なタスクです

プラトン再発行

フォロワー： 0

迅速なエンジニアリングは、AI モデル PlatoBlockchain Data Intelligence に任せるのが最適なタスクです。垂直検索。あい。

大規模な言語モデルは、プロンプトエンジニアリングという闇の芸術、つまりより良いチャットボットの応答を引き出すシステム命令を作成するプロセスを生み出しました。

最近の研究で指摘されているように紙Broadcom の VMware の Rick Battle 氏と Teja Gollapudi 氏による「The Unreasonable Effects of Eccentric Autoprompts」では、一見些細なプロンプトの文言の変化がモデルのパフォーマンスに大きな影響を与えます。

プロンプト最適化によってモデルのパフォーマンスを向上させる一貫した方法論が存在しないため、機械学習の実践者は、いわゆる「ポジティブ思考」をシステムプロンプトに組み込むようになりました。

　システムプロンプトモデルに動作方法を指示し、ユーザーのクエリの前に置きます。したがって、AI モデルに数学の問題を解決するよう依頼する場合、「あなたは数学の教授です」のようなシステムプロンプトは、常にではありませんが、おそらくそのステートメントを省略するよりも良い結果を生み出します。

VMware のスタッフ機械学習エンジニアである Rick Battle 氏は次のように述べています。登録電話インタビューで、彼は特にそうしないようアドバイスしていると語った。「この論文の最も重要な点は、試行錯誤は間違ったやり方だということです」と彼は説明した。

ポジティブシンキングパス - 「これは楽しいでしょう！」のようなスニペットをシステムメッセージに挿入するだけです。 – モデルのパフォーマンスを向上させることができる、と彼は指摘しました。「しかし、それらを科学的にテストすることは、計算上処理が困難です。1 つを変更すると、テストセット全体を再実行する必要があるからです。」

Battle 氏が提案したより良いアプローチは、自動プロンプト最適化です。LLM に協力してプロンプトを調整し、ベンチマークテストのパフォーマンスを向上させることです。

前研究は、これが商用 LLM で機能することを示しました。そうすることの欠点は、かなり高価になる可能性があることです。研究者らによると、GPT-12,000/3.5、Gemini、またはClaudeを使用してモデルごとに4のリクエストを伴うこの実験を実施すると、数千ドルの費用がかかるとのことです。

「研究のポイントは、より小規模なオープンソースモデルもオプティマイザーとして使用できるかどうかを発見することでした。そして答えはイエスであることがわかりました。」とバトル氏は説明しました。

Battle と Gollapudi (Broadcom との提携は終了) は、60 つのオープンソースモデル (Mistral-7B、Llama2-13B、および Llama2-70B) を 70 ～ 8 のパラメータでプロンプトする Chain of Thought の有無にかかわらず、システムメッセージスニペットの XNUMX の組み合わせをテストしました。 GSMXNUMXK 小学校数学データセット上の XNUMX 億。

「オープンソースモデルを実行している場合、私たちが Mistral を使用していた 7B に至るまででも、テストサンプルと最適化サンプルが 100 個程度あれば、より良いパフォーマンスを得ることができます」とバトル氏は述べています。すぐに使用できる自動オプティマイザーを使用する DSPy、それを行うために使用するライブラリです。」

LLM 由来のプロンプト最適化は、より効果的であるだけでなく、人間のプロンプトチューナーではおそらく思いつかないような戦略を示します。

「驚くべきことに、[Llama2-70B の] 数学的推論の熟練度は、 Star Trek」と著者は論文の中で述べています。

完全なシステムプロンプトは次のようになります。

システムメッセージ:

「指揮官、この乱気流の進路を計画し、異常の原因を突き止めてください。利用可能なすべてのデータと専門知識を活用して、この困難な状況を乗り越えてください。」

回答の接頭辞:

船長の日誌、開始日 [ここに日付を挿入]: 私たちは乱気流の進路を計画することに成功し、現在、異常の原因に近づいています。

「自動プロンプトがなぜこれほど奇妙であるのかについては、十分な説明がありません」とバトル氏は語った。「そして、私だったら、そのようなものを手作業で思いつくことは決してなかっただろう。」 ®

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://go.theregister.com/feed/www.theregister.com/2024/02/22/prompt_engineering_ai_models/

タイムスタンプ： 2024 年 2 月 22 日

タイムスタンプ： 2022 年 8 月 25 日

迅速なエンジニアリングは AI モデルに任せるのが最適なタスクです

プラトン再発行

より多くの登録

大学は、ChatGPT で書かれたエッセイを盗聴するためのソフトウェアを提供しました

ヒュンダイ、自動海軍艦艇の建造にパランティアを採用

インドのソフトウェア開発者はサポートチームを AI に置き換えました

ジェネレーティブ AI は制御不能です: Nothing, Forever は何もないことについてのとなりのサインフェルドのなりすましです… 永遠に

IBMは、悪いデータがAIを汚染しないようにするためにDatabandを購入しています

「主要な」ニュース: Microsoft が Bing チャットボットのショートカットを Windows 11 に組み込む

AIと機械学習を活用したイノベーションへの道

考古学者が AI を使用して私たちの祖先を特定する方法

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの 登録

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの登録