AWS 認定を取得すると、新しい役割を見つけたり、新しいプロジェクトに取り組むスキルを発揮したり、チームの頼れるエキスパートになりたい場合など、キャリアを推進するのに役立ちます。 また、AWS 認定試験は関連する役割または技術分野の専門家によって作成されているため、これらの試験の準備をすることで、その分野の熟練した実務者によって特定された必要なスキルを構築することができます。
サービスをより深く理解するには、認定試験に関連する AWS サービスの FAQ ページを読むことが重要です。 ただし、これにはかなり時間がかかる可能性があります。 XNUMX つのサービスの FAQ を読むだけでも、読んで理解するのに半日かかることがあります。 たとえば、 アマゾンセージメーカー FAQ には、SageMaker だけで約 33 ページ (印刷版) のコンテンツが含まれています。
AWS サービスの FAQ ページで自分自身をテストするためのシステムを使用できれば、より簡単で楽しい学習体験になると思いませんか? 実際、最先端の言語モデルと数行の Python を使用して、このようなシステムを開発できます。
この投稿では、AI21 Jurassic-2 Jumbo Instruct 基盤モデルに基づいて、AWS サービスの FAQ ページに多肢選択クイズ ソリューションをデプロイするための包括的なガイドを紹介します。 Amazon SageMaker ジャンプスタート.
大規模な言語モデル
近年、言語モデルの規模と人気が大幅に高まりました。 2018年には、 BERT-largeがデビューしました 340 億 500 万のパラメーターと革新的なトランスフォーマー アーキテクチャにより、NLP タスクのパフォーマンスのベンチマークを設定します。 わずか数年で、最先端のモデルのサイズは 3 倍以上に膨れ上がりました。 OpenAI の GPT-176 と Bloom 175 B (どちらも 21 億のパラメータを持つ)、および AI2 Jurassic-178 Jumbo Instruct (XNUMX 億のパラメータを持つ) は、自然言語処理 (NLP) の精度の基準を引き上げる大規模言語モデル (LLM) の XNUMX つの例にすぎません。
SageMaker 基盤モデル
SageMaker は、Hugging Face、PyTorch Hub、TensorFlow Hub などの一般的なモデル ハブからのさまざまなモデルと、AI21、Cohere、LightOn からの独自のモデルを提供しており、SageMaker の機械学習 (ML) 開発ワークフロー内でアクセスできます。 ML の最近の進歩により、として知られる新しいクラスのモデルが誕生しました。 基礎モデル、数十億のパラメータがあり、大量のデータでトレーニングされています。 これらの基礎モデルは、テキストの要約、デジタル アートの生成、言語翻訳など、幅広いユースケースに適応できます。 これらのモデルのトレーニングにはコストがかかる可能性があるため、顧客はこれらのモデルを自分でトレーニングするのではなく、既存の事前トレーニングされた基礎モデルを使用し、必要に応じて微調整することを望んでいます。 SageMaker は、SageMaker コンソールで選択できる厳選されたモデルのリストを提供します。
JumpStart を使用すると、さまざまなプロバイダーの基礎モデルを見つけて、基礎モデルをすぐに開始できるようになります。 モデルの特性と使用条件を確認し、テスト UI ウィジェットを使用してこれらのモデルを試すことができます。 基礎モデルを大規模に使用する準備ができたら、モデルプロバイダーから事前に構築されたノートブックを使用することで、SageMaker を離れることなく簡単に使用できます。 モデルは AWS でホストおよびデプロイされているため、データは、モデルの評価に使用されるか大規模な使用に使用されるかにかかわらず、第三者と共有されることはありません。
AI21 ジュラシック-2 ジャンボ命令
Jurassic-2 Jumbo Instruct は、AI21 Labs による LLM で、あらゆる言語理解または生成タスクに適用できます。 自然言語の指示とコンテキストに従うように最適化されているため、例を提供する必要はありません。 エンドポイントにはモデルが事前にロードされており、使いやすい API と Python SDK を介してクエリを提供できる状態になっているため、すぐに使い始めることができます。 Jurassic-2 Jumbo Instruct は、特に読み取りと書き込みに関連するタスクにおいて、HELM でトップの成績を収めています。
ソリューションの概要
次のセクションでは、SageMaker で Jurassic-2 Jumbo 命令モデルをテストする手順を説明します。
- SageMaker コンソールで Jurassic-2 Jumbo 命令モデルを選択します。
- プレイグラウンドを使用してモデルを評価します。
- 基盤モデルに関連付けられたノートブックを使用して、環境にデプロイします。
SageMaker コンソールから Jurassic-2 Jumbo Instruct にアクセスする
最初のステップは、SageMaker コンソールにログインすることです。 下 ジャンプスタート ナビゲーション ペインで、 基礎モデル モデルリストへのアクセスをリクエストします。
アカウントが許可リストに登録されると、このページでモデルのリストが表示され、Jurassic-2 Jumbo Instruct モデルを検索できるようになります。
モデル プレイグラウンドで Jurassic-2 Jumbo Instruct モデルを評価する
AI21 Jurassic-2 Jumbo Instruct リストで、 モデルを見る. モデルの説明と実行できるタスクが表示されます。 続行する前に、モデルの EULA をよくお読みください。
まず、SageMaker FAQ ページに基づいてテストを生成するモデルを試してみましょう。 に移動します。 プレイグラウンド タブには何も表示されないことに注意してください。
ソフトウェア設定ページで、下図のように プレイグラウンド タブでは、Jurassic-2 Jumbo Instruct モデルにサンプル プロンプトを提供し、出力を表示できます。
最大 500 トークンを使用できることに注意してください。 [最大長] を、生成するトークンの最大数である 500 に設定します。 このモデルには 8,192 トークンのコンテキスト ウィンドウがあります (プロンプトと完了の長さは最大 8,192 トークンである必要があります)。
プロンプトを見やすくするために、 プロンプト ボックス。
最大 500 トークンを使用できるため、トークンのごく一部が使用されます。 Amazon SageMaker よくある質問ページ ローコード ML テストプロンプトのセクション。
次のプロンプトを使用します。
プロンプトエンジニアリングは反復的なプロセスです。 明確かつ具体的にし、モデルに考える時間を与える必要があります。
ここでは、停止シーケンスとして ## を使用してコンテキストを指定しました。これは、この文字または文字列が生成された後に生成を停止するようモデルに信号を送ります。 これは、数回のプロンプトを使用する場合に便利です。
次に、プロンプトでは明確かつ非常に具体的で、XNUMX つの質問と XNUMX つの選択肢からなる多肢選択クイズを求めています。 開始文字列を使用して各質問に対する正しい答えを含めるようモデルに依頼します。 'Correct Answer:'
したがって、後で Python を使用して解析できます。
適切に設計されたプロンプトは、モデルをより創造的で一般化したものにし、新しいタスクに簡単に適応できるようにします。 プロンプトは、特定のタスクに関するドメイン知識を組み込み、解釈可能性を向上させるのにも役立ちます。 迅速なエンジニアリングにより、ゼロショットおよび少数ショットの学習モデルのパフォーマンスを大幅に向上させることができます。 高品質のプロンプトを作成するには、目の前のタスクを慎重に検討するだけでなく、モデルの長所と制限を深く理解する必要があります。
この投稿の範囲では、この広範囲の領域についてはこれ以上取り上げません。
プロンプトをコピーして、 プロンプト ボックスをクリックして選択します テキストを生成する.
これにより、推論のために Jurassic-2 Jumbo Instruct モデルにプロンプトが送信されます。 遊び場での実験は無料です。
また、LLM は最先端の性質にもかかわらず、依然として偏見、エラー、幻覚を起こしやすいことにも留意してください。
モデルの出力を徹底的かつ慎重に読んだ後、モデルが非常に優れたクイズを生成したことがわかります。
モデルを試した後は、ノートブックを使用して環境内のエンドポイントとしてデプロイします。 小さな Python 関数を使用して出力を解析し、対話型テストをシミュレートします。
Jurassic-2 Jumbo Instruct 基礎モデルをノートブックからデプロイする
次のものを使用できます サンプルノート SageMaker を使用して Jurassic-2 Jumbo Instruct をデプロイします。 この例では ml.p4d.24xlarge インスタンスを使用していることに注意してください。 AWS アカウントのデフォルトの制限が 0 の場合、次のことを行う必要があります。 制限の引き上げをリクエストする この GPU インスタンスの場合。
SageMaker 推論を使用してエンドポイントを作成しましょう。 まず、必要な変数を設定してから、モデル パッケージからモデルをデプロイします。
エンドポイントがデプロイされた後、モデルに対して推論クエリを実行できます。
モデルがデプロイされた後、次のコード スニペットを使用して、デプロイされたエンドポイントと対話できます。
ml.p2d.4xlarge インスタンスの SageMaker エンドポイントにデプロイされた Jurassic-24 Jumbo Instruct 基盤モデルを使用すると、4,096 個のトークンを含むプロンプトを使用できます。 プレイグラウンドで使用したものと同じプロンプトを使用して、さらに多くの質問を追加できます。 この例では、FAQ の全体を追加しました。 ローコード ML セクションをコンテキストとしてプロンプトに追加します。
モデルの出力を見ると、XNUMX つの質問と各質問に XNUMX つの選択肢がある多肢選択クイズが生成されます。
これで、出力を解析し、対話型の多肢選択クイズを作成する Python 関数を開発できるようになりました。
このような関数は、数行のコードで開発するのが非常に簡単です。 プロンプトで要求したとおりに、モデルが質問ごとに「正解: 」を含む行を作成したため、答えを簡単に解析できます。 この投稿の範囲では、クイズ生成用の Python コードは提供しません。
ノートブックでクイズを実行する
以前に作成した Python 関数と Jurassic-2 Jumbo Instruct 基礎モデルからの出力を使用して、ノートブックでインタラクティブなクイズを実行します。
75 問中 XNUMX 問正解し、XNUMX% の成績を獲得したことがわかります。 SageMaker FAQ をあと数回読む必要があるかもしれません。
クリーンアップ
エンドポイントを試した後、料金が発生しないように、SageMaker 推論エンドポイントとモデルを必ず削除してください。
まとめ
この投稿では、SageMaker を使用して AI21 の Jurassic-2 Jumbo Instruct モデルをテストして使用し、自動クイズ生成システムを構築する方法を説明しました。 これは、公開されている SageMaker FAQ ページのテキストが埋め込まれたかなり単純なプロンプトと数行の Python コードを使用して実現されました。
この投稿で説明した例と同様に、いくつかのラベル付きの例を使用して、ビジネスの基盤モデルをカスタマイズできます。 すべてのデータは暗号化され、AWS アカウントから流出しないため、データはプライベートで機密性が保たれると信頼できます。
アクセスをリクエストする 基礎モデルを試す 今日の SageMaker で、フィードバックをお寄せください!
著者について
エイタンセラ アマゾンウェブサービスの機械学習スペシャリストソリューションアーキテクトです。 彼はAWSのお客様と協力してガイダンスと技術支援を提供し、AWSでの機械学習ソリューションの構築と運用を支援しています。 余暇には、ジョギングや最新の機械学習記事を読むことを楽しんでいます。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- プラトアイストリーム。 Web3 データ インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- 未来を鋳造する w エイドリエン・アシュリー。 こちらからアクセスしてください。
- PREIPO® を使用して PRE-IPO 企業の株式を売買します。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/accelerate-your-learning-towards-aws-certification-exams-with-automated-quiz-generation-using-amazon-sagemaker-foundations-models/
- :持っている
- :は
- :not
- 1
- 100
- 14
- 視聴者の38%が
- 17
- 2018
- 23
- 500
- 7
- 8
- 9
- a
- 私たちについて
- 加速する
- アクセス
- 精度
- 達成
- 取得する
- 実際に
- 適応する
- 加えます
- 追加されました
- 進歩
- 後
- に対して
- アルゴリズム
- すべて
- 許す
- また
- Amazon
- アマゾンセージメーカー
- Amazon SageMakerオートパイロット
- Amazon SageMaker ジャンプスタート
- Amazon Webサービス
- 金額
- an
- および
- 回答
- どれか
- API
- 適用された
- 建築
- です
- AREA
- 宝品
- 物品
- AS
- 援助
- 関連する
- At
- 自動化
- 利用できます
- AWS
- バー
- ベース
- ベース
- BE
- なぜなら
- になる
- ベンチマーク
- バイアス
- 10億
- 億
- ブルーム
- 両言語で
- ボックス
- ビルド
- 内蔵
- ビジネス
- by
- 缶
- キャリア
- 注意深い
- 慎重に
- 場合
- 例
- 認証
- 認証
- 文字
- 特性
- 課金
- 選択
- 選択する
- class
- 分類
- クリア
- コード
- 来ます
- comes
- 完成
- 包括的な
- 考慮
- からなる
- 領事
- 含まれています
- コンテンツ
- コンテキスト
- 正しい
- 可能性
- カバー
- 作ります
- 作成した
- 作成
- クリエイティブ
- キュレーション
- Customers
- カスタマイズ可能な
- カスタマイズ
- 最先端
- データ
- 中
- 深いです
- より深い
- デフォルト
- 需要
- 需要予測
- 展開します
- 展開
- 展開する
- 説明
- にもかかわらず
- 検出
- 開発する
- 開発
- 異なります
- デジタル
- デジタルアート
- do
- そうではありません
- ドメイン
- ドント
- 各
- 前
- 容易
- 簡単に
- 使いやすい
- 埋め込まれた
- 有効にする
- では使用できません
- エンドポイント
- エンジニアリング
- 大きくする
- 入力します
- 全体
- 環境
- エラー
- 評価します
- さらに
- 正確に
- 試験
- 例
- 例
- 既存の
- 高価な
- 体験
- エキスパート
- 専門家
- 顔
- よくある質問
- 少数の
- フィールド
- もう完成させ、ワークスペースに掲示しましたか?
- 名
- フィット
- フォロー中
- Foundation
- 財団
- 4
- 詐欺
- 不正検出
- 無料版
- から
- 完全に
- 楽しいです
- function
- さらに
- 生成する
- 生成された
- 生成
- 世代
- 取得する
- 受け
- 与える
- 与えられた
- Go
- 良い
- GPU
- グレード
- 大いに
- 陸上
- ガイダンス
- ガイド
- 半分
- ハンド
- 持ってる
- he
- 助けます
- 助け
- ことができます
- 高品質
- 彼の
- ヒット
- 主催
- 認定条件
- しかしながら
- HTML
- HTTPS
- ハブ
- 巨大な
- i
- 特定され
- if
- 画像
- 画像分類
- 重要
- 改善します
- in
- include
- 含ま
- 含めて
- 組み込む
- 情報
- 革新的な
- 説明書
- 対話
- 相互作用的
- に
- IT
- ITS
- ジョブ
- ただ
- キープ
- 知っている
- 知識
- 既知の
- ラボ
- 言語
- 大
- 後で
- 最新の
- 起動する
- 学習
- コメントを残す
- 残す
- 長さ
- う
- LIMIT
- 制限
- LINE
- ライン
- リスト
- リストされた
- リスト
- LLM
- ログ
- 探して
- 機械
- 機械学習
- 製
- メンテナンス
- make
- 手動で
- 多くの
- 大規模な
- マックス
- 言及した
- 百万
- マインド
- ML
- モデル
- 修正する
- 他には?
- 最も
- の試合に
- my
- ナチュラル
- 自然言語処理
- 自然
- ナビゲート
- ナビゲーション
- 必要
- 必要
- 必要とされる
- 決して
- 新作
- NLP
- いいえ
- ノート
- 数
- オブジェクト
- オブジェクト検出
- of
- 提供
- on
- ONE
- もの
- 継続
- オープンソース
- 操作する
- 最適化
- オプション
- or
- 注文
- 私たちの
- でる
- 出力
- が
- パッケージ
- ページ
- ペイン
- パラメータ
- 特に
- パーティー
- 実行する
- パフォーマンス
- パフォーマー
- おそらく
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- 演奏
- さらに
- 人気
- 人気
- 部分
- ポスト
- Predictor
- 準備中
- 現在
- 防ぐ
- プレビュー
- プライベート
- プロセス
- 処理
- 生産
- プロジェクト
- 推進します
- 所有権
- 提供します
- プロバイダ
- は、大阪で
- 公然と
- Python
- パイトーチ
- クエリ
- 質問
- 質問
- すぐに
- 調達
- 範囲
- むしろ
- 読む
- リーディング
- 準備
- 最近
- 関連する
- 関連した
- 残る
- 削除します
- 要求
- の提出が必要です
- 必要
- レビュー
- 上昇
- 職種
- ラン
- ランニング
- セージメーカー
- SageMaker の推論
- 同じ
- 規模
- スコープ
- スクリプト
- SDDK
- を検索
- セクション
- セクション
- 見て
- 送る
- 文
- 役立つ
- サービス
- サービス
- セッションに
- 設定
- shared
- ショート
- すべき
- ショーケース
- 示されました
- 信号
- 簡単な拡張で
- サイズ
- 熟練した
- スキル
- 小さい
- So
- 溶液
- ソリューション
- 一部
- 専門家
- 特定の
- 指定の
- 開始
- 起動
- 最先端の
- 手順
- ステップ
- まだ
- Force Stop
- 停止
- 簡単な
- 強み
- 文字列
- そのような
- サポート
- サポート
- 発生します
- 取る
- 仕事
- タスク
- 技術的
- テンソルフロー
- 条件
- test
- テキスト分類
- より
- それ
- それら
- 自分自身
- その後
- そこ。
- ボーマン
- 彼ら
- 考える
- 三番
- 第三者
- この
- 徹底的に
- それらの
- 三
- 介して
- 時間
- <font style="vertical-align: inherit;">回数</font>
- 〜へ
- 今日
- トークン
- top
- トピック
- に向かって
- トレーニング
- 訓練された
- トレーニング
- トランス
- インタビュー
- トライアル
- 試験
- 試み
- 信頼
- 試します
- ui
- 下
- わかる
- 理解する
- アップデイト
- us
- 使用法
- つかいます
- 使用事例
- 中古
- 使用されます
- 非常に
- 、
- 詳しく見る
- ビジョン
- 訪問
- 欲しいです
- ました
- we
- ウェブ
- Webサービス
- WELL
- この試験は
- いつ
- かどうか
- which
- ワイド
- 広い範囲
- 意志
- 以内
- 無し
- ワークフロー
- 作品
- 書き込み
- XGブースト
- 年
- はい
- You
- あなたの
- あなた自身
- ゼファーネット