Amazon SageMaker ジャンプスタート は、アルゴリズム、モデル、ML ソリューションを提供する機械学習 (ML) ハブです。 SageMaker JumpStart を使用すると、ML 実践者は、最もパフォーマンスが高く、公開されているリストの増え続けるリストから選択できます。 基礎モデル (FM) など 咲く, ラマ2, ファルコン-40B, 安定拡散, OpenLLaMA, フラン-T5/UL2、またはからのFM 密着 および ライトオン.
この投稿と付属のノートブックでは、 SageMaker Python 簡素化された SDK in Amazon SageMaker ジャンプスタート エンドポイントとして使用し、さまざまな自然言語処理 (NLP) タスクに使用します。 から基礎モデルにアクセスすることもできます。 Amazon SageMakerスタジオ。 公開されている最大のモデルの 176 つである BloomZ XNUMXB モデルは、さまざまなインコンテキスト 少数ショット学習およびゼロショット学習 NLP タスクを実行できる、最先端の命令調整モデルです。 命令チューニングは、命令を使用して NLP タスクのコレクションで言語モデルを微調整する手法です。 命令チューニングの詳細については、を参照してください。 Amazon SageMaker JumpStart での Flan-T5 基盤モデルのゼロショット プロンプト.
NLP のゼロショット学習により、事前トレーニングされた LLM は、特にトレーニングされていないタスクに対する応答を生成できます。 この手法では、モデルに入力テキストと、モデルからの予想される出力を自然言語で説明するプロンプトが提供されます。 ゼロショット学習は、次のようなさまざまな NLP タスクで使用されます。
- 多言語テキストと感情分類
- 多言語での質疑応答
- コード生成
- 段落の言い換え
- 要約
- 常識推論と自然言語推論
- 質問に答える
- 文章と感情の分類
- タイトルに基づく架空の記事生成
- 記事に基づいてタイトルを要約する
フューショット学習では、少数の例のみを提供して、新しいタスクを実行するようにモデルをトレーニングします。 これは、トレーニングに使用できるラベル付きデータが限られている場合に便利です。 少数ショー学習は、次のようなさまざまなタスクで使用されます。
- テキスト要約
- コード生成
- 固有表現抽出
- 質問に答える
- 文法とスペルの修正
- 製品の説明と概要
- 文章と感情の分類
- チャットボットと会話型AI
- ツイートの生成
- 機械翻訳
- 意図の分類
ブルームについて
BigScience Large Open-science Open-access Multilingual (BLOOM) 言語モデルは、トランスフォーマーベースの大規模言語モデル (LLM) です。 BLOOM は、産業規模の計算リソースを使用して、膨大な量のテキスト データのプロンプトからテキストを継続するように訓練された自己回帰 LLM です。 そのため、人間が書いたテキストとほとんど区別できない一貫したテキストを出力できます。 BLOOM は、テキスト生成タスクとしてキャストすることで、明示的にトレーニングされていないテキスト タスクを実行するように指示することもできます。
176 億のパラメータを備えた BLOOM は、46 の自然言語と 13 のプログラミング言語でテキストを生成できます。 スペイン語、フランス語、アラビア語など、ほぼすべての言語において、BLOOM はこれまでに作成された 100 億を超えるパラメーターを備えた初めての言語モデルです。 研究者は次のことができます BLOOMをダウンロード、実行、学習してください 最近開発された LLM のパフォーマンスと動作を、最も深い内部操作に至るまで調査します。
ソリューションの概要
この投稿では、最先端の命令調整された BloomZ 176B モデルの使用方法を説明します。 ハグ顔 テキスト生成用。 モデルを微調整することなく、多くの NLP タスクに対して BloomZ 176B モデルを少数ショット学習およびゼロショット学習で使用できます。 BloomZ 176B のようなモデルには、再トレーニングせずに多くのコンテキストに簡単に適応できるように多数のパラメーターがあるため、新しいモデルをトレーニングする必要はありません。 BloomZ 176B モデルは大量のデータを使用してトレーニングされているため、多くの汎用タスクに適用できます。
このデモのすべてのステップのコードは、次の場所から入手できます。 ノート.
命令チューニング
LLM の規模と複雑さは、ここ数年で爆発的に増加しました。 LLM は、自然言語の意味論を学習し、人間のような応答を生成する際に優れた能力を実証してきました。 最近の LLM の多くは、と呼ばれる強力な技術を使用して微調整されています。 命令チューニングこれは、モデルが新しいタスクを実行したり、プロンプト固有の微調整なしで新しいプロンプトへの応答を生成したりするのに役立ちます。 命令調整されたモデルは、関連するタスクまたは概念の理解を使用して、新しいプロンプトに対する予測を生成します。 この手法ではモデルの重みを更新する必要がないため、これまでに見られなかった新しいタスクのためにモデルを微調整するために必要な、時間と計算コストのかかるプロセスを回避できます。
命令のチューニングには、命令を使用して NLP タスクのコレクションに対する言語モデルを微調整することが含まれます。 この手法では、各タスクの特定のデータセットではなく、テキストの指示に従ってタスクを実行するようにモデルがトレーニングされます。 モデルはタスクごとに入力例と出力例のセットを使用して微調整されており、タスクにプロンプトが提供されている限り、明示的にトレーニングされていない新しいタスクにモデルを一般化できます。 命令チューニングはモデルの精度と有効性を向上させるのに役立ち、特定のタスクに大規模なデータセットを使用できない状況に役立ちます。
BLOOM モデルでのゼロショットおよび少数ショットの NLP タスクの迅速なエンジニアリング
迅速なエンジニアリング モデルを望ましい応答に導くための高品質のプロンプトを作成することに取り組みます。 プロンプトは、使用される特定のタスクとデータセットに基づいて設計する必要があります。 ここでの目標は、ノイズを最小限に抑えながら高品質の応答を生成するために必要な情報をモデルに提供することです。 これには、キーワード、追加のコンテキスト、質問などが含まれる場合があります。
適切に設計されたプロンプトは、モデルをより創造的で一般化したものにし、新しいタスクに簡単に適応できるようにします。 プロンプトは、特定のタスクに関するドメイン知識を組み込み、解釈可能性を向上させるのにも役立ちます。 迅速なエンジニアリングにより、ゼロショットおよび少数ショットの学習モデルのパフォーマンスを大幅に向上させることができます。 高品質のプロンプトを作成するには、目の前のタスクを慎重に検討するだけでなく、モデルの長所と制限を深く理解する必要があります。
次の表では、BloomZ 176B モデルを使用して、さまざまなゼロショットおよび少数ショットの NLP タスクに対する応答を生成しています。 最初の列にはタスクが表示され、XNUMX 列目にはモデルに提供されたプロンプトが含まれます (テンプレート テキストは太字で、太字でないテキストは入力例です)、XNUMX 列目はプロンプトに対してクエリが実行されたときのモデルからの応答です。
以下のすべてのタスクでは、ハイパーパラメータを 600 に設定します。 max_length
, num_return_sequences
, top_k
250になると、 top_p
は 0.95 となり、サンプリングは行われません。
仕事 | プロンプト入力 | 出力 |
ゼロショット学習タスク | ||
多言語テキストまたは感情分類 (中国語から英語) | 一つの奇妙な端、一つの静かな神聖な言葉、それは単なる電気的影響ではなく、新しい時代を駆け抜ける一つの波動として、永続的な歴史の動きとして存在する。前回のレビューを肯定的、中立、または否定的と評価しますか? | 正の |
多言語質問応答(英語から中国語) | 繁体字中国語で説明してください バックプロパゲーションとは何ですか | 勾配逆方向伝達計算は、人工ネットワークを最小化するために使用される機械的計算である。 |
コード生成 | 書く 二分探索木 O(log(n)) の計算量。 {コード_スタート} |
def binary_search(a, x): 低い = 0 高 = len(a) – 1 低 <= 高の間: 中 = (低 + 高) // 2 a[mid] < x の場合: 低 = 中 + 1 elif a[mid] > x: 高 = 中 – 1 その他: 途中で戻る -1'を返す ... その他: 途中で戻る 低く戻ります」 出力が切り捨てられる |
段落の言い換え | アマゾン ウェブ サービス (AWS) は、クラウドベースの機械学習プラットフォームである SageMaker の XNUMX つの主要な新しいアップデートを発表しました。 SageMaker は、事実上あらゆるユースケースの ML モデルの構築、トレーニング、デプロイに使用できる機械学習サービスを提供することを目指しています。 今年の re:Invent カンファレンス中に、AWS は SageMaker の機能をさらに改善するためにいくつかの発表を行いました。nn英語を使ってそれを簡潔に言い換えるとどうなりますか?,アマゾン ウェブ サービス (AWS) は、クラウドベースの機械学習プラットフォームである SageMaker の XNUMX つの主要な新しいアップデートを発表しました。 SageMaker は、事実上あらゆるユースケースの ML モデルの構築、トレーニング、デプロイに使用できる機械学習サービスを提供することを目指しています。 今年の re:Invent カンファレンス中に、AWS は SageMaker の機能をさらに改善するためにいくつかの発表を行いました。 n上の文は非常に複雑です。 複数の文で構成される簡略化された同義語バージョンを提供してください。 |
Amazon SageMaker がメジャーアップデートを取得 アマゾン ウェブ サービス (AWS) は、クラウドベースの機械学習プラットフォームである SageMaker の XNUMX つの主要な新しいアップデートを発表しました。 SageMaker は、事実上あらゆるユースケースの ML モデルの構築、トレーニング、デプロイに使用できる機械学習サービスを提供することを目指しています。 |
要約 | Amazon Comprehend は、自然言語処理 (NLP) を使用して、ドキュメントのコンテンツに関する洞察を抽出します。 ドキュメント内のエンティティ、キー フレーズ、言語、感情、およびその他の一般的な要素を認識することで、洞察を深めます。 Amazon Comprehend を使用して、ドキュメントの構造の理解に基づいて新しい製品を作成します。 たとえば、Amazon Comprehend を使用すると、ソーシャル ネットワーキング フィードで製品に関する言及を検索したり、ドキュメント リポジトリ全体をスキャンしてキー フレーズを探したりすることができます。 Amazon Comprehend コンソールまたは Amazon Comprehend API を使用して、Amazon Comprehend ドキュメント分析機能にアクセスできます。 小さなワークロードに対してリアルタイム分析を実行したり、大きなドキュメント セットに対して非同期分析ジョブを開始したりできます。 Amazon Comprehend が提供する事前トレーニング済みのモデルを使用するか、独自のカスタム モデルをトレーニングして分類とエンティティ認識を行うことができます。 Amazon Comprehend のすべての機能は、UTF-8 テキスト ドキュメントを入力として受け入れます。 さらに、カスタム分類とカスタム エンティティ認識は、画像ファイル、PDF ファイル、および Word ファイルを入力として受け入れます。 Amazon Comprehend は、特定の機能に応じて、さまざまな言語でドキュメントを調査および分析できます。 詳細については、「Amazon Comprehend でサポートされる言語」を参照してください。 Amazon Comprehend の主要言語機能は、ドキュメントを検査し、より幅広い言語選択の主要言語を決定できます。nn===n前のテキストの要約を英語で書きます。 |
Amazon Comprehend は、自然言語処理 (NLP) を使用して、ドキュメントのコンテンツに関する洞察を抽出します。 ドキュメント内のエンティティ、キー フレーズ、言語、感情、およびその他の一般的な要素を認識することで、洞察を深めます。 Amazon Comprehend を使用して、ドキュメントの構造の理解に基づいて新しい製品を作成します。 たとえば、Amazon Comprehend を使用すると、ソーシャル ネットワーキング フィードで製品に関する言及を検索したり、ドキュメント リポジトリ全体をスキャンしてキー フレーズを探したりすることができます。 Amazon Comprehend コンソールまたは Amazon Comprehend API を使用して、Amazon Comprehend ドキュメント分析機能にアクセスできます。 小さなワークロードに対してリアルタイム分析を実行したり、大きなドキュメント セットに対して非同期分析ジョブを開始したりできます。 Amazon Comprehend が提供する事前トレーニング済みのモデルを使用するか、独自のカスタム モデルをトレーニングして分類とエンティティ認識を行うことができます。 Amazon Comprehend のすべての機能は、UTF-8 テキスト ドキュメントを入力として受け入れます。 さらに、カスタム分類とカスタム エンティティ認識は、画像ファイル、PDF ファイル、および Word ファイルを入力として受け入れます。 Amazon Comprehend は、特定の機能に応じて、さまざまな言語でドキュメントを調べて分析できます。 詳細については、Amazon Comprehend でサポートされている言語を参照してください。 Amazon Comprehend の Dominant language 機能は、ドキュメントを調べて、はるかに幅広い言語の選択肢から支配的な言語を決定できます。 |
常識推論と自然言語推論 | ことを考えると ワールドカップがアメリカ・ロサンゼルスで開幕。 それに従うのか ワールドカップはアメリカで開催されます。 はい、もしくは、いいえ?、 ワールドカップがアメリカ・ロサンゼルスで開幕。 上記の説明と世界についてあなたが知っていることだけを使用すると、 「ワールドカップはアメリカで開催されます」 確かに正しいですか? はい、もしくは、いいえ?、 |
はい |
質問に答える | 質問: 新しいKindleの主な機能は何ですか?nnコンテキスト: 最新かつ最も革新的な Kindle では、何百万もの本や文書にメモを取り、リストや日記を書くことができます。 Amazon の新しい Kindle は、電子書籍で何かを書きたいと常に思っていた読者のために、まさにそれを可能にします。 Kindle Scribe は読み書き用の最初の Kindle であり、ユーザーは本やドキュメントにメモやリストなどを追加することができます。 ここでは、Kindle Scribe について知っておく必要のあるすべての情報と、よく寄せられる質問を紹介します。 Kindle Scribe を使用すると、紙のように簡単に読み書きできます。 Kindle Scribe は、10.2 インチ、まぶしさのない画面 (すべての Kindle デバイスの中で最大)、鮮明な 300 ppi の解像度、環境に合わせて自動的に調整される 35 個の LED フロント ライトを備えています。 調整可能なウォーム ライト、フォント サイズ、行間隔などを使用して、エクスペリエンスをさらにパーソナライズします。 ベーシック ペンまたはプレミアム ペンから選択でき、紙に書くように画面に書くことができます。 また、Kindle に磁気で取り付けられるため、充電する必要はありません。 プレミアム ペンには、専用の消しゴムとカスタマイズ可能なショートカット ボタンが含まれています。 Kindle Scribe には、すべての Kindle デバイスの中で最も多くのストレージ オプションがあります。読み書きのレベルに合わせて、8 GB、16 GB、または 32 GB から選択できます。 nn答え |
何百万もの本や文書についてメモを取ったり、リストや日記を書いたりすることができます。 |
文章と感情の分類 | レビュー:nこの映画はとても素晴らしく、再び私たちを魅了し、喜ばせますnこの映画のレビュー文は否定的ですか、それとも肯定的ですか?nオプション:n-ポジティブ n-ネガティブ | ポジティブ |
タイトルから想像記事生成 | タイトル: 「大学には新しい施設が建設される予定です」「n上記の架空の記事のタイトルを与えられて、その記事を想像してください。n」」 |
1.2万ポンドのプロジェクトでは、インバネスのハイランド・アイランズ大学(UHI)に新しい教育学習センターが設立される。 インヴァネス商科大学の跡地に建設される予定です。 UHIは、新しい施設は教育と学習だけでなく、学生のサポートと管理にも使用されると述べた。 大学によると、会議やイベントにも使用される予定だという。 新しい建物は、インヴァネス商科大学の跡地に建設されます。 同大学によると、新校舎は2013年に閉校したインバネス商科大学の跡地に建設される予定だという。 新しい施設は教育と学習だけでなく、学生のサポートと管理にも使用されると述べた。 会議やイベントなどにも使われるそうです。 UHIは、新しい施設はインヴァネス商科大学の跡地に建設されると発表した 同大学によると、新校舎は2013年に閉校したインバネス商科大学の跡地に建設される予定だという。 新しい施設は教育と学習だけでなく、学生のサポートと管理にも使用されると述べた。 UHIは、新しい施設はインヴァネスの跡地に建設されると述べた… |
記事をもとにタイトルを要約すると | 最新かつ最も革新的な Kindle では、何百万冊もの本や文書についてメモを取ったり、リストや日記を書いたりすることができます。 Amazon の新しい Kindle は、電子書籍で何かを書きたいと常に思っていた読者のために、まさにそれを可能にします。 Kindle Scribe は読み書き用の最初の Kindle であり、ユーザーは本やドキュメントにメモやリストなどを追加することができます。 ここでは、Kindle Scribe について知っておく必要のあるすべての情報と、よく寄せられる質問を紹介します。 Kindle Scribe を使用すると、紙のように簡単に読み書きできます。 Kindle Scribe は、10.2 インチ、まぶしさのない画面 (すべての Kindle デバイスの中で最大)、鮮明な 300 ppi の解像度、環境に合わせて自動的に調整される 35 個の LED フロント ライトを備えています。 調整可能なウォーム ライト、フォント サイズ、行間隔などを使用して、エクスペリエンスをさらにパーソナライズします。 ベーシック ペンまたはプレミアム ペンから選択でき、紙に書くように画面に書くことができます。 また、Kindle に磁気で取り付けられるため、充電する必要はありません。 プレミアム ペンには、専用の消しゴムとカスタマイズ可能なショートカット ボタンが含まれています。 Kindle Scribe には、すべての Kindle デバイスの中で最も多くのストレージ オプションがあり、読み書きのレベルに合わせて 8 GB、16 GB、または 32 GB から選択できます。 んんん上の記事に適切なタイトルを付けてください。 |
Amazon の Kindle Scribe: 知っておくべきことすべて |
数ショットの学習タスク | ||
要約 | [原文]: Amazon の科学者は、シェフィールド大学の研究者と協力して、大規模な事実抽出および検証データセットを初めて一般公開しています。 このデータセットは 185,000 件を超える証拠に裏付けられた主張で構成されており、自動情報抽出を実行するソフトウェア アプリケーションやクラウドベースのサービスにおける事実の抽出と検証の問題に対処する研究開発を促進するために利用可能になっています。 [概要]: Amazon と大学の研究者が事実の抽出と検証のデータセットを公開しています。 ### [原文]: 米国のプライム会員は、プライム会員になるとさらに多くのものを自宅に届けることができます。 メンバーは、プライム メンバーシップへの追加料金なしで、月額 9.99 ドル相当の Grubhub+ を 0 年間無料で楽しむことができます。 この取引を有効にするには、amazon.com/grubhub にアクセスしてください。 この新しいオファーには、12 ドル以上の注文で無制限の 25 ドルの食品配達手数料が含まれるほか、Grubhub+ メンバー限定の特典や、無料食品や注文割引などの特典が含まれます。 さらに、ダイナーは、2021 年だけで 20 万ドル以上を集め、全国の XNUMX 以上の慈善団体に利益をもたらした寄付マッチング イニシアチブである Grubhub の Donate the Change プログラムに参加することで、「良いことをしながらおいしいものを食べる」ことができます。 [概要]: 米国のプライム会員は、対象となる注文に対して食品配達料なしで、Grubhub+ を XNUMX 年間無料でお楽しみいただけます。 ### [原文]: Amazon の科学者は、シェフィールド大学の研究者と協力して、大規模な事実抽出および検証データセットを初めて一般公開しています。 このデータセットは 185,000 件を超える証拠に裏付けられた主張で構成されており、自動情報抽出を実行するソフトウェア アプリケーションやクラウドベースのサービスにおける事実の抽出と検証の問題に対処する研究開発を促進するために利用可能になっています。 [概要]: |
[概要]: Amazon と大学の研究者は、事実の抽出と検証のデータセットを一般公開しています。 |
コード生成 | 説明: 停止を示すオレンジ色のボタン コード:停止 ### 説明: 赤い枠が付いた黄色の円が含まれる青いボックス コード: ### 説明: AI へようこそという見出し コード: |
コード: AI へようこそ' |
固有表現抽出 | [本文]: フレッドは連続起業家です。 Platform.sh の共同創設者兼 CEO である彼は、以前は大手 Drupal e コマース プロバイダーである Commerce Guys を共同設立しました。 彼の使命は、クラウド コンピューティングの使用方法と認識方法を根本的に変革するという野心的な旅を続ける中で、私たちが地に足をしっかりつけて、これまで享受してきた急速な成長を継続できるようにすることです。 [名前]:フレッド [役職]: 共同創設者兼CEO [会社名]: プラットフォーム.sh ### [本文]: Microsoft (この言葉は「マイクロコンピュータ ソフトウェア」のかばん語) は、Altair 4 用の BASIC インタプリタを開発および販売するために、1975 年 8800 月 2000 日にビル ゲイツによって設立されました。XNUMX 年にスティーブ バルマーがゲイツの後任として CEO になり、その後「デバイスとサービス」戦略を構想しました。 [名前]:スティーブ・バルマー 【役職】:代表取締役社長 【会社名】:マイクロソフト ### [本文]: フランク・リブーは、7 年 1955 月 XNUMX 日にリヨンに生まれました。 彼は、元ヨーロッパのガラスメーカー BSN グループを食品業界の主要企業に変えた前 CEO アントワーヌ・リブーの息子です。 彼はダノンのCEOです。 【名前】:フランク・リブー 【役職】:代表取締役社長 【会社名】:ダノン ### [本文]: デビッド メルビンは、CITIC CLSA の投資および金融サービスの専門家であり、投資銀行業務とプライベート エクイティで 30 年以上の経験があります。 彼は現在、CITIC CLSA の上級顧問を務めています。 |
[名前]:フレッド [役職]: 共同創設者兼CEO [会社名]: プラットフォーム.sh |
質問に答える | 背景: NLP Cloud は、本番環境で自然言語処理を確実に活用する簡単な方法がないとチームが認識した 2021 年に設立されました。 質問: NLP クラウドはいつ設立されましたか? 回答:2021 ### コンテキスト: NLP Cloud は 2020 年半ばまでに API を開発し、それ以来、事前トレーニングされたオープンソース モデルを多数追加しました。 質問: NLP クラウドは何を開発しましたか? 答え: API ### コンテキスト: すべての計画はいつでも停止できます。 料金はサービスを利用した時間分のみお支払いいただきます。 ダウングレードの場合は、次回の請求書で割引が適用されます。 質問: 計画はいつ中止できますか? 答え: いつでも ### 背景: GPT-J の主な課題はメモリ消費です。 GPU プランの使用をお勧めします。 質問: GPT-J にはどのプランが推奨されますか? 答え:""" |
答え: GPU プラン |
文法とスペルの修正 | 私はビーチに行くのが大好きです。 訂正:私はビーチに行くのが大好きです。 ### 持たせてください! 訂正:持たせてください! ### 欠点が多すぎます。 訂正: 欠点が多すぎます。 ### 行きたくない 訂正: |
訂正:行きたくないです |
製品の説明と概要 | キーワードから製品説明を生成します。 キーワード: 靴、女性、$59 文: 59 ドルの価格の女性用の美しい靴。 ### キーワード: パンツ、メンズ、69 ドル 文: 男性用のモダンなパンツ、たったの 69 ドル。 ### キーワード: 手袋、冬、19 ドル 文: 寒い冬にぴったりの驚くほど温かい手袋、19 ドル。 ### キーワード: Tシャツ、メンズ、$39 文: |
文: クールな男性用 T シャツ、たったの 39 ドル。 |
文章と感情の分類 | メッセージ: 宇宙船が火星に着陸したとき、人類全体が興奮しました トピック: 宇宙 ### メッセージ: 私はテニスとゴルフが大好きです。 週にXNUMX回練習しています。 トピック: スポーツ ### メッセージ: 営業担当者のチームを管理するのは、大変ですがやりがいのある仕事です。 トピック: ビジネス ### メッセージ: 鶏肉とトマトを料理しようとしています。 トピック: |
トピック: 食べ物 |
チャットボットと会話型AI | これは【人間】と【ロボット】の対話です。 [ロボット]はとても優しくて共感力があります。 [人間]: こんにちは、初めまして。 [ロボット]: 初めまして。 ### [人間]: 今日はどうですか? [ロボット]: 悪くないよ、ありがとう! あなたはどうですか? ### [人間]: 大丈夫です、でもちょっと悲しいです… [ロボット]: ああ? どうして? ### [人間]: インフルエンザにかかりました [ロボット]: |
[ロボット]: いや、それは残念です! |
ツイートの生成 | キーワード: 市場 ツイート: 人からではなく、自然や市場からフィードバックを得る ### キーワード: 子供たち tweet: もしかしたら、私たちは子供に戻るために死ぬのかもしれない。 ### キーワード: スタートアップ tweet: スタートアップは火を消す方法を心配すべきではなく、火を起こす方法を心配すべきだ。 ### キーワード: NLP つぶやき: |
ツイート: NLP はツールであり、目的ではありません。 |
機械翻訳 | ハグフェイスは NLP の革命です。 翻訳: ハグフェイスは NLP に革命をもたらしました。 ### セラは本当に信じられないほどです! 訳:これは信じられないですね! ### Désolé je ne peux pas. 翻訳: 申し訳ありませんが、できません。 ### NLP クラウドは、本番環境で NLP をデプロイすることができます。 翻訳: |
翻訳: NLP Cloud を使用すると、NLP を本番環境に簡単にデプロイできます。 |
意図の分類 | とても楽しそうなので明日からコーディングを始めたいと思います! 目的: コーディングを開始する ### あなたが持っている最後の写真を見せてください。 目的: 写真を見せる ### これらすべてのファイルをできるだけ早く検索してください。 目的: ファイルの検索 ### 来週中国語を教えていただけますか? 意図: |
目的: 中国語を教えてください |
SageMaker で BloomZ 176B 命令調整モデルにアクセスする
SageMaker JumpStart は、これらの命令調整された Bloom モデルの使用を開始するための XNUMX つの方法を提供します。 Amazon SageMakerスタジオ そしてSageMaker SDK。 次のセクションでは、これらの各オプションがどのようなものであるか、およびそれらにアクセスする方法を説明します。
簡素化された SageMaker JumpStart SDK を使用してモデルにアクセスします
簡素化された SageMaker JumpStart SDK 数行のコードで組み込みの SageMaker JumpStart モデルのトレーニングとデプロイを容易にします。 これにより、モデル ID 以外の入力を必要とせずに、最新の基礎モデルやイメージ生成モデルを含む SageMaker JumpStart モデルのライブラリ全体にアクセスできるようになります。
提供されているモデル固有のデフォルト値を利用して、Docker イメージ、ML インスタンス タイプ、モデル アーティファクトの場所、ハイパーパラメータなどのフィールドの構成を指定できます。 これらの属性は単なるデフォルト値です。 それらをオーバーライドして、作成した AWS モデルに対するきめ細かな制御を維持できます。 これらの変更の結果、SageMaker JumpStart モデルをデプロイおよびトレーニングするための Python ワークフローを作成する労力が軽減され、重要なタスクにより多くの時間を費やすことができるようになりました。 この機能は、JumpStart がサポートされているすべてのリージョンで利用でき、次のコマンドを使用してアクセスできます。 SageMaker Python SDK バージョン2.154.0以降。
SageMaker SDK を介してプログラムでエンドポイントをデプロイできます。 SageMaker モデル ハブ内の目的のモデルのモデル ID と、デプロイメントに使用されるインスタンス タイプを指定する必要があります。 推論スクリプトを含むモデル URI と Docker コンテナの URI は、SageMaker SDK を通じて取得されます。 これらの URI は SageMaker JumpStart によって提供され、デプロイメント用に SageMaker モデル オブジェクトを初期化するために使用できます。
モデルをデプロイし、エンドポイントをクエリする
このノートブックには ipywidget が必要です。 ipywidgets をインストールし、現在のノートブックに関連付けられている実行ロールを、SageMaker アクセス権を持つ AWS アカウント ロールとして使用します。
事前トレーニングされたモデルを選択する
私達は選びます bloomz-176b-fp16
事前トレーニングされたモデル:
次のセクションのノートブックでは、 ブルームZ 176B 例として。 SageMaker の事前トレーニング済みモデルの完全なリストについては、以下を参照してください。 事前トレーニング済みのモデル テーブルを使用した組み込みアルゴリズム.
アーティファクトを取得してエンドポイントをデプロイする
SageMaker を使用すると、新しいデータセットで最初にモデルを微調整することなく、事前トレーニングされたモデルで推論を実行できます。 まずは、 deploy_image_uri
, deploy_source_uri
, model_uri
事前トレーニング済みモデルの場合。 事前トレーニングされたモデルをホストするには、次のインスタンスを作成します。 sagemaker.model.Model そしてそれを展開します。 これには数分かかる場合があります。
これで、次のコード行で簡素化された SageMaker JumpStart SDK を使用してモデルをデプロイできるようになります。
を使用しております SageMaker 大規模モデル推論 (LMI) コンテナー BloomZ 176B モデルをホストします。 LMI は、生成 AI モデルで使いやすい機能とパフォーマンスの向上を提供する、AWS で構築された LLM ソフトウェア スタック (コンテナ) です。 推論を高速化するために、モデルの並列処理、コンパイル、量子化、その他のスタックが組み込まれています。 詳細については、を参照してください。 BLOOM-176B と OPT-30B を Amazon SageMaker にデプロイし、大規模なモデルの推論を行う Deep Learning Containers と DeepSpeed.
このモデルのデプロイには p4de.24xlarge インスタンスが必要であり、デプロイには通常約 1 時間かかることに注意してください。 そのインスタンスのクォータがない場合は、AWS サービス クォータ コンソールでクォータの追加をリクエストします。
エンドポイントをクエリし、さまざまなパラメーターを使用して応答を解析し、生成されたテキストを制御します
エンドポイントへの入力は、JSON としてフォーマットされ、utf-8 形式でエンコードされたテキストの文字列です。 エンドポイントの出力は、生成されたテキストを含む JSON ファイルです。
次の例では、入力テキストのサンプルをいくつか示します。 任意のテキストを入力すると、モデルがシーケンス内の次の単語を予測します。 モデルを繰り返し呼び出すことで、より長いテキストのシーケンスを生成できます。 次のコードは、これらの引数を使用してエンドポイントを呼び出す方法を示しています。
次の出力が得られます。
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
SageMaker Studio でモデルにアクセスする
これらのモデルには、 JumpStart ランディング ページ スタジオで。 このページには、利用可能なエンドツーエンドの ML ソリューション、事前トレーニング済みのモデル、ノートブックの例が一覧表示されています。
この投稿の公開時点では、BloomZ 176B は us-east-2
領域。
BloomZ 176B モデル カードを選択してノートブックを表示できます。
その後、ノートブックをインポートして、ノートブックをさらに実行できます。
クリーンアップ
継続的な料金を回避するには、SageMaker 推論エンドポイントを削除します。 次のコマンドを使用して、SageMaker コンソールまたは SageMaker Studio ノートブックからエンドポイントを削除できます。
predictor.delete_model()
predictor.delete_endpoint()
まとめ
この投稿では、ゼロショット学習と少数ショット学習の利点の概要を示し、迅速なエンジニアリングによって命令調整モデルのパフォーマンスがどのように向上するかについて説明しました。 また、命令調整された BloomZ 176B モデルを SageMaker JumpStart から簡単にデプロイする方法を示し、SageMaker でデプロイされた BloomZ 176B モデルのエンドポイントを使用してさまざまな NLP タスクを実行する方法を示す例を提供しました。
SageMaker JumpStart から BloomZ 176B モデルをデプロイし、NLP ユースケース用の独自のプロンプトを作成することをお勧めします。
SageMaker JumpStart の詳細については、以下を確認してください。
著者について
ラジャクマールサンパスクマール AWSのプリンシパルテクニカルアカウントマネージャーであり、ビジネステクノロジーの調整に関するガイダンスをお客様に提供し、クラウド運用モデルとプロセスの再発明をサポートしています。 彼はクラウドと機械学習に情熱を注いでいます。 Rajは機械学習のスペシャリストでもあり、AWSのお客様と協力して、AWSのワークロードとアーキテクチャを設計、デプロイ、管理しています。
XinHuang博士 は、AmazonSageMakerJumpStartおよびAmazonSageMakerの組み込みアルゴリズムの応用科学者です。 彼はスケーラブルな機械学習アルゴリズムの開発に焦点を当てています。 彼の研究対象は、自然言語処理、表形式データに関する説明可能な深層学習、および非パラメトリック時空間クラスタリングの堅牢な分析の分野です。 彼は、ACL、ICDM、KDD会議、およびRoyal Statistics Society:SeriesAジャーナルに多くの論文を発表しています。
エヴァン・クラヴィッツ アマゾンウェブサービスのソフトウェアエンジニアであり、SageMakerJumpStartに取り組んでいます。 彼はニューヨーク市で料理やランニングを楽しんでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 自動車/EV、 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- チャートプライム。 ChartPrime でトレーディング ゲームをレベルアップしましょう。 こちらからアクセスしてください。
- ブロックオフセット。 環境オフセット所有権の近代化。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- :持っている
- :は
- :not
- :どこ
- $UP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 視聴者の38%が
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- できる
- 私たちについて
- 上記の.
- 同意
- アクセス
- アクセス
- 精度
- 越えて
- 適応する
- 加えます
- 追加されました
- 添加
- NEW
- アドレス
- 調節可能
- 管理
- 利点
- 再び
- に対して
- AI
- AIモデル
- 目指して
- AL
- アルゴリズム
- アラインメント
- すべて
- 許可
- ことができます
- 一人で
- また
- アルテア
- 常に
- am
- Amazon
- Amazon Comprehend
- アマゾンセージメーカー
- Amazon SageMaker ジャンプスタート
- Amazon Webサービス
- Amazon Webサービス(AWS)
- 野心的な
- 間で
- 量
- 金額
- an
- 分析
- 分析します
- および
- アンヘレス
- 発表の
- お知らせ
- どれか
- API
- API
- 適用可能な
- 適用された
- 4月
- アラビア語
- です
- AREA
- 引数
- 記事
- AS
- 関連する
- At
- アタッチ
- 属性
- オートマチック
- 自動的に
- 利用できます
- 避ける
- AWS
- バック
- 悪い
- バンキング
- ベース
- 基本
- BE
- (ダグラス・ビーチ)
- 美しい
- なぜなら
- き
- 行動
- さ
- 恩恵を受ける
- 利点
- ほかに
- BEST
- の間に
- ビル
- ビル·ゲイツ
- 10億
- ビット
- ブルーム
- 青
- 大胆な
- 本
- 国境
- 生まれる
- ボックス
- 簡潔に
- BSN
- ビルド
- 建物
- 内蔵
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- (Comma Separated Values) ボタンをクリックして、各々のジョブ実行の詳細(開始/停止時間、変数値など)のCSVファイルをダウンロードします。
- by
- 呼ばれます
- 呼び出し
- 缶
- 取得することができます
- 機能
- 機能
- カード
- 注意深い
- 場合
- 例
- 鋳造
- キャッチ
- センター
- 最高経営責任者(CEO)
- 挑戦する
- 変化する
- 変更
- 荷担した
- 課金
- チェック
- 子供達
- 中国語
- 選択
- 選択する
- 円
- 市町村
- クレーム
- 分類
- 閉まっている
- クラウド
- クラウドコンピューティング
- クラスタリング
- 共同創設者
- コード
- コーディング
- コヒーレント
- 冷たい
- 環境、テクノロジーを推奨
- コレクション
- カレッジ
- コラム
- 来ます
- comes
- 到来
- 貿易
- コマンドと
- 会社
- コンプリート
- 複雑さ
- 複雑な
- 理解する
- 備えます
- コンピューティング
- コンセプト
- 講演
- 会議
- 考慮
- からなる
- 領事
- 消費
- コンテナ
- コンテナ
- 含まれています
- コンテンツ
- 文脈
- 続ける
- 連続
- コントロール
- 会話
- クール
- 正しい
- 費用
- 可能性
- 国
- カップル
- 作ります
- 作成した
- 作成
- 創造
- クリエイティブ
- カップ
- 電流プローブ
- 現在
- カスタム
- Customers
- カスタマイズ可能な
- データ
- データセット
- デイビッド
- 取引
- 特価
- 専用の
- 深いです
- 深い学習
- 深い
- デフォルト
- 配信
- 配達
- デモ
- 実証します
- 実証
- によっては
- 展開します
- 展開
- デプロイヤー
- 展開する
- 展開
- 記載された
- 説明
- 設計
- 設計
- 希望
- 細部
- 決定する
- 開発する
- 発展した
- 開発
- 開発
- 開発
- Devices
- DID
- 死
- 異なります
- お得な商品
- 割引
- 議論
- do
- デッカー
- ドキュメント
- ドキュメント
- そうではありません
- すること
- ドメイン
- 支配的
- 寄付する
- ドント
- によって
- ダウン
- ダウングレード
- ドレイン
- 欠点
- 各
- 簡単に
- 簡単に
- 使いやすい
- 電子ブック
- eコマース
- 有効
- 努力
- 要素は
- 適格
- 埋め込まれた
- 有効にする
- 奨励する
- 端から端まで
- エンドポイント
- エンジニア
- エンジニアリング
- 英語
- 楽しみます
- 全体
- エンティティ
- エンティティ
- 起業家
- 環境
- 株式
- 欧州言語
- さらに
- イベント
- EVER
- すべてのもの
- 調べる
- 例
- 例
- 特別
- 実行
- 予想される
- 高価な
- 体験
- エキス
- 顔
- 促進する
- 施設
- 実際
- 遠く
- スピーディー
- 特徴
- 特徴
- フィードバック
- 費用
- 足
- 少数の
- フィールズ
- File
- ファイナンシャル
- 金融業務
- 火災
- 名
- 初回
- 焦点を当てて
- フォロー中
- フード
- 食品の配達
- 形式でアーカイブしたプロジェクトを保存します.
- 前者
- Foundation
- 設立
- 無料版
- フランス語
- 頻繁に
- から
- フロント
- 機能
- さらに
- 利得
- ゲイツ
- 一般的用途
- 生成する
- 生成された
- 世代
- 生々しい
- 生成AI
- 取得する
- 与える
- 目標
- 行く
- ゴルフ
- 良い
- GPU
- 素晴らしい
- 大いに
- 陸上
- グループ
- 成長
- 成長性
- 保証
- ガイダンス
- ガイド
- ハンド
- 持ってる
- 持って
- he
- 見出し
- 聞く
- 高さ
- 助けます
- 役立つ
- ことができます
- こちら
- ハイ
- 高品質
- 彼の
- うまくいけば
- host
- HOT
- 時間
- 認定条件
- How To
- HTML
- HTTPS
- 黄
- ハブ
- 人間
- 人類
- 人間
- i
- ID
- if
- 画像
- 虚数
- 絵
- import
- 改善します
- in
- 含ま
- 含めて
- 組み込む
- 産業を変えます
- 情報
- 情報抽出
- イニシアチブ
- 革新的な
- 入力
- 洞察
- install
- を取得する必要がある者
- 説明書
- 利益
- 内部
- に
- 調べる
- 投資
- 投資銀行
- 巻き込む
- アイランズ
- IT
- ITS
- ジョブ
- Jobs > Create New Job
- ジャーナル
- 旅
- JPG
- JSON
- ただ
- キープ
- キー
- キーワード
- 知っている
- 知識
- 着陸
- 言語
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 大
- 大規模
- 最大の
- 姓
- 後で
- 最新の
- 主要な
- LEARN
- 学習
- ツェッペリン
- う
- ことができます
- レベル
- 活用します
- 図書館
- 光
- ような
- 制限
- 限定的
- LINE
- ライン
- リスト
- リスト
- LLM
- 場所
- 長い
- より長いです
- 見て
- のように見える
- インクルード
- ロサンゼルス
- 愛
- ロー
- 機械
- 機械学習
- 製
- メイン
- 主要な
- make
- 作る
- 作成
- 管理します
- マネージャー
- 管理する
- 多くの
- マーケット
- 火星
- 問題
- 五月..
- 多分
- me
- 大会
- メンバー
- メンバーシップ
- メモリ
- メンズ
- 言及
- Microsoft
- ミッド
- 百万
- 何百万
- 最小化
- 分
- ミッション
- ML
- モデル
- モダン
- 月
- 他には?
- 最も
- 映画
- の試合に
- 名
- ナチュラル
- 自然言語処理
- 自然
- ne
- 必要
- 必要
- 負
- ネットワーキング
- 普通
- 決して
- 新作
- 新製品
- ニューヨーク
- ニューヨーク市
- 最新
- 次の
- 来週
- nice
- NLP
- いいえ
- ノイズ
- ノート
- ノート
- 小説
- 11月
- 今
- 数
- オブジェクト
- 得
- of
- オフ
- 提供
- 提供すること
- オファー
- oh
- on
- かつて
- ONE
- 継続
- の
- オープンソース
- 操作
- 業務執行統括
- オプション
- or
- オレンジ
- 注文
- 受注
- 組織
- オリジナル
- その他
- 私たちの
- でる
- 出力
- が
- オーバーライド
- 概要
- 自分の
- ページ
- 紙素材
- 論文
- パラメータ
- 情熱的な
- 支払う
- のワークプ
- 以下のために
- 知覚される
- 実行する
- パフォーマンス
- 実行
- 役得
- 個人
- フレーズ
- ピクチャー
- 場所
- 計画
- プラン
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイヤー
- 再生
- お願いします
- さらに
- 位置
- 正の
- 可能
- ポスト
- 強力な
- PPI
- 予測
- Predictor
- 予測
- プレミアム
- 前
- 前に
- ブランド
- 素数
- 校長
- プライベート
- 未公開株式
- 問題
- プロセス
- ラボレーション
- 処理
- 作成
- プロダクト
- 生産
- 製品
- プロ
- 演奏曲目
- プログラミング
- プログラミング言語
- プロジェクト
- 提供します
- 提供
- プロバイダー
- は、大阪で
- 提供
- 公然と
- 公表
- 出版
- 置きます
- Python
- 質問
- 質問
- 隆起した
- 急速な
- レート
- RE
- 読む
- 読者
- リーディング
- への
- 実現
- 最近
- 最近
- 認識
- 認識
- 推奨される
- レッド
- 電話代などの費用を削減
- 地域
- 地域
- 関連する
- 顕著
- 繰り返し
- 言い換えると
- 置き換え
- 倉庫
- 要求
- の提出が必要です
- 必要
- 研究
- 研究開発
- 研究者
- 解像度
- リソース
- 応答
- 回答
- 結果
- リテンションを維持
- レビュー
- 革命を起こした
- 報われる
- 報酬
- ロボット
- 堅牢な
- 職種
- ロイヤル
- ラン
- runs
- s
- セージメーカー
- SageMaker の推論
- 前記
- セールス
- 塩
- 格言
- 言う
- ド電源のデ
- スキャン
- 科学者
- 科学者たち
- 画面
- SDDK
- を検索
- 二番
- セクション
- と思われる
- 選択
- 売る
- 意味論
- シニア
- センス
- 文
- 感情
- 思い
- シーケンス
- シリアル
- シリーズ
- シリーズA
- サービス
- サービス
- セッションに
- セット
- 設定
- いくつかの
- すべき
- 表示する
- 示されました
- 作品
- 重要
- 簡略化されました
- から
- ウェブサイト
- 状況
- サイズ
- サイズ
- 小さい
- より小さい
- So
- 社会
- ソーシャルネットワーキング
- 社会
- ソフトウェア
- ソフトウェアエンジニア
- 固体
- ソリューション
- 一部
- 息子
- スペイン語
- 専門家
- 特定の
- 特に
- スピード
- 綴り
- 過ごす
- スタック
- スタック
- start
- 開始
- スタートアップ
- 最先端の
- 米国
- 統計的
- ステップ
- スティーブ
- 停止
- ストレージ利用料
- ストレージオプション
- 戦略
- 強み
- 文字列
- 構造
- 学生
- 研究
- 勉強
- そのような
- スーツ
- 概要
- 補足
- 供給
- サポート
- サポート
- 支援する
- 同義語
- テーブル
- 取る
- 取り
- 仕事
- タスク
- ティーチング
- チーム
- 技術的
- template
- より
- 感謝
- それ
- エリア
- 世界
- アプリ環境に合わせて
- それら
- その後
- そこ。
- ボーマン
- 彼ら
- 三番
- この
- 介して
- スルー
- 時間
- 時間がかかる
- 役職
- 〜へ
- 今日
- 明日
- あまりに
- ツール
- 厳しい
- に向かって
- 伝統的な
- トレーニング
- 訓練された
- トレーニング
- 最適化の適用
- 変換
- インタビュー
- ツリー
- ツイート
- Twice
- 2
- type
- 私達
- 理解する
- ユナイテッド
- 米国
- 大学
- 無限の
- まで
- アップデイト
- 更新版
- 更新
- つかいます
- 使用事例
- 中古
- users
- 使用されます
- 通常
- 評価
- 価値観
- 多様
- さまざまな
- 広大な
- Verification
- バージョン
- 非常に
- 、
- 詳しく見る
- 事実上
- 訪問
- 欲しいです
- 暖かいです
- ました
- 水
- 仕方..
- 方法
- we
- ウェブ
- Webサービス
- 週間
- 歓迎
- WELL
- この試験は
- 何ですか
- いつ
- which
- while
- 白
- 誰
- 全体
- なぜ
- より広い
- 幅
- 意志
- Winter
- 無し
- レディース
- Word
- 言葉
- ワークフロー
- ワーキング
- 作品
- 世界
- ワールドカップ
- 不安
- でしょう
- 書きます
- 書き込み
- 書かれた
- X
- 年
- 年
- はい
- まだ
- ヨーク
- You
- あなたの
- ゼファーネット
- ゼロショット学習