Amazon SageMaker Foundations モデルを使用した自動クイズ生成で、AWS 認定試験に向けた学習を加速する

プラトン再発行

フォロワー： 0

AWS 認定を取得すると、新しい役割を見つけたり、新しいプロジェクトに取り組むスキルを発揮したり、チームの頼れるエキスパートになりたい場合など、キャリアを推進するのに役立ちます。また、AWS 認定試験は関連する役割または技術分野の専門家によって作成されているため、これらの試験の準備をすることで、その分野の熟練した実務者によって特定された必要なスキルを構築することができます。

サービスをより深く理解するには、認定試験に関連する AWS サービスの FAQ ページを読むことが重要です。ただし、これにはかなり時間がかかる可能性があります。 XNUMX つのサービスの FAQ を読むだけでも、読んで理解するのに半日かかることがあります。たとえば、アマゾンセージメーカー FAQ には、SageMaker だけで約 33 ページ (印刷版) のコンテンツが含まれています。

AWS サービスの FAQ ページで自分自身をテストするためのシステムを使用できれば、より簡単で楽しい学習体験になると思いませんか? 実際、最先端の言語モデルと数行の Python を使用して、このようなシステムを開発できます。

この投稿では、AI21 Jurassic-2 Jumbo Instruct 基盤モデルに基づいて、AWS サービスの FAQ ページに多肢選択クイズソリューションをデプロイするための包括的なガイドを紹介します。 Amazon SageMaker ジャンプスタート.

大規模な言語モデル

近年、言語モデルの規模と人気が大幅に高まりました。 2018年には、 BERT-largeがデビューしました 340 億 500 万のパラメーターと革新的なトランスフォーマーアーキテクチャにより、NLP タスクのパフォーマンスのベンチマークを設定します。わずか数年で、最先端のモデルのサイズは 3 倍以上に膨れ上がりました。 OpenAI の GPT-176 と Bloom 175 B (どちらも 21 億のパラメータを持つ)、および AI2 Jurassic-178 Jumbo Instruct (XNUMX 億のパラメータを持つ) は、自然言語処理 (NLP) の精度の基準を引き上げる大規模言語モデル (LLM) の XNUMX つの例にすぎません。

SageMaker 基盤モデル

SageMaker は、Hugging Face、PyTorch Hub、TensorFlow Hub などの一般的なモデルハブからのさまざまなモデルと、AI21、Cohere、LightOn からの独自のモデルを提供しており、SageMaker の機械学習 (ML) 開発ワークフロー内でアクセスできます。 ML の最近の進歩により、として知られる新しいクラスのモデルが誕生しました。 基礎モデル、数十億のパラメータがあり、大量のデータでトレーニングされています。これらの基礎モデルは、テキストの要約、デジタルアートの生成、言語翻訳など、幅広いユースケースに適応できます。これらのモデルのトレーニングにはコストがかかる可能性があるため、顧客はこれらのモデルを自分でトレーニングするのではなく、既存の事前トレーニングされた基礎モデルを使用し、必要に応じて微調整することを望んでいます。 SageMaker は、SageMaker コンソールで選択できる厳選されたモデルのリストを提供します。

JumpStart を使用すると、さまざまなプロバイダーの基礎モデルを見つけて、基礎モデルをすぐに開始できるようになります。モデルの特性と使用条件を確認し、テスト UI ウィジェットを使用してこれらのモデルを試すことができます。基礎モデルを大規模に使用する準備ができたら、モデルプロバイダーから事前に構築されたノートブックを使用することで、SageMaker を離れることなく簡単に使用できます。モデルは AWS でホストおよびデプロイされているため、データは、モデルの評価に使用されるか大規模な使用に使用されるかにかかわらず、第三者と共有されることはありません。

AI21 ジュラシック-2 ジャンボ命令

Jurassic-2 Jumbo Instruct は、AI21 Labs による LLM で、あらゆる言語理解または生成タスクに適用できます。自然言語の指示とコンテキストに従うように最適化されているため、例を提供する必要はありません。エンドポイントにはモデルが事前にロードされており、使いやすい API と Python SDK を介してクエリを提供できる状態になっているため、すぐに使い始めることができます。 Jurassic-2 Jumbo Instruct は、特に読み取りと書き込みに関連するタスクにおいて、HELM でトップの成績を収めています。

ソリューションの概要

次のセクションでは、SageMaker で Jurassic-2 Jumbo 命令モデルをテストする手順を説明します。

SageMaker コンソールで Jurassic-2 Jumbo 命令モデルを選択します。
プレイグラウンドを使用してモデルを評価します。
基盤モデルに関連付けられたノートブックを使用して、環境にデプロイします。

SageMaker コンソールから Jurassic-2 Jumbo Instruct にアクセスする

最初のステップは、SageMaker コンソールにログインすることです。下 ジャンプスタート ナビゲーションペインで、 基礎モデル モデルリストへのアクセスをリクエストします。

SageMaker 基盤モデル

アカウントが許可リストに登録されると、このページでモデルのリストが表示され、Jurassic-2 Jumbo Instruct モデルを検索できるようになります。

モデルプレイグラウンドで Jurassic-2 Jumbo Instruct モデルを評価する

AI21 Jurassic-2 Jumbo Instruct リストで、 モデルを見る. モデルの説明と実行できるタスクが表示されます。続行する前に、モデルの EULA をよくお読みください。

まず、SageMaker FAQ ページに基づいてテストを生成するモデルを試してみましょう。に移動します。 プレイグラウンド タブには何も表示されないことに注意してください。

ソフトウェア設定ページで、下図のように プレイグラウンド タブでは、Jurassic-2 Jumbo Instruct モデルにサンプルプロンプトを提供し、出力を表示できます。

AI21 ジュラシック-2 ジャンボ命令 - 遊び場を選択してください

最大 500 トークンを使用できることに注意してください。 [最大長] を、生成するトークンの最大数である 500 に設定します。このモデルには 8,192 トークンのコンテキストウィンドウがあります (プロンプトと完了の長さは最大 8,192 トークンである必要があります)。

プロンプトを見やすくするために、 プロンプト ボックス。

AI21 ジュラシック-2 ジャンボ命令 - プレイグラウンドを構成する

最大 500 トークンを使用できるため、トークンのごく一部が使用されます。 Amazon SageMaker よくある質問ページ ローコード ML テストプロンプトのセクション。

次のプロンプトを使用します。

Below is SageMaker Low-code ML FAQ: ##
Q: Will my data (from inference or training) be used or shared to update the base model that is offered to customers using Amazon SageMaker JumpStart?
No. Your inference and training data will not be used nor shared to update or train the base model that SageMaker JumpStart surfaces to customers. Q: Can I see the model weights and scripts of proprietary models in preview with Amazon SageMaker JumpStart?
No. Proprietary models do not allow customers to view model weights and scripts. Q: Which open-source models are supported with Amazon SageMaker JumpStart?
Amazon SageMaker JumpStart includes 150+ pre-trained open-source models from PyTorch Hub and TensorFlow Hub. For vision tasks such as image classification and object detection, you can use models such as ResNet, MobileNet, and Single-Shot Detector (SSD). For text tasks such as sentence classification, text classification, and question answering, you can use models such as BERT, RoBERTa, and DistilBERT. Q: What solutions come pre-built with Amazon SageMaker JumpStart?
SageMaker JumpStart includes solutions that are preconfigured with all necessary AWS services to launch a solution into production. Solutions are fully customizable so you can easily modify them to fit your specific use case and dataset. You can use solutions for over 15 use cases including demand forecasting, fraud detection, and predictive maintenance, and readily deploy solutions with just a few clicks. For more information about all solutions available, visit the SageMaker getting started page. Q: What built-in algorithms are supported in Amazon SageMaker Autopilot?
Amazon SageMaker Autopilot supports 2 built-in algorithms: XGBoost and Linear Learner. Q: Can I stop an Amazon SageMaker Autopilot job manually?
Yes. You can stop a job at any time. When an Amazon SageMaker Autopilot job is stopped, all ongoing trials will be stopped and no new trial will be started.
## Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

プロンプトエンジニアリングは反復的なプロセスです。明確かつ具体的にし、モデルに考える時間を与える必要があります。

ここでは、停止シーケンスとして ## を使用してコンテキストを指定しました。これは、この文字または文字列が生成された後に生成を停止するようモデルに信号を送ります。これは、数回のプロンプトを使用する場合に便利です。

Below is SageMaker Low-code ML FAQ: ##
<SageMaker Low-code ML FAQ content>
##

次に、プロンプトでは明確かつ非常に具体的で、XNUMX つの質問と XNUMX つの選択肢からなる多肢選択クイズを求めています。開始文字列を使用して各質問に対する正しい答えを含めるようモデルに依頼します。 'Correct Answer:' したがって、後で Python を使用して解析できます。

Create a multiple choice quiz on the topic of SageMaker Low-code ML FAQ consisting of 4 questions. Each question should have 4 options. Also include the correct answer for each question using the starting string 'Correct Answer:`

適切に設計されたプロンプトは、モデルをより創造的で一般化したものにし、新しいタスクに簡単に適応できるようにします。プロンプトは、特定のタスクに関するドメイン知識を組み込み、解釈可能性を向上させるのにも役立ちます。迅速なエンジニアリングにより、ゼロショットおよび少数ショットの学習モデルのパフォーマンスを大幅に向上させることができます。高品質のプロンプトを作成するには、目の前のタスクを慎重に検討するだけでなく、モデルの長所と制限を深く理解する必要があります。

この投稿の範囲では、この広範囲の領域についてはこれ以上取り上げません。

プロンプトをコピーして、 プロンプト ボックスをクリックして選択します テキストを生成する.

AI21 ジュラシック-2 ジャンボ命令 - プロンプト入力

これにより、推論のために Jurassic-2 Jumbo Instruct モデルにプロンプトが送信されます。遊び場での実験は無料です。

Amazon SageMaker 基礎モデルを使用した自動クイズ生成により、AWS 認定試験に向けた学習を加速します |アマゾンウェブサービス PlatoBlockchain データインテリジェンス。垂直検索。あい。

また、LLM は最先端の性質にもかかわらず、依然として偏見、エラー、幻覚を起こしやすいことにも留意してください。

モデルの出力を徹底的かつ慎重に読んだ後、モデルが非常に優れたクイズを生成したことがわかります。

モデルを試した後は、ノートブックを使用して環境内のエンドポイントとしてデプロイします。小さな Python 関数を使用して出力を解析し、対話型テストをシミュレートします。

Jurassic-2 Jumbo Instruct 基礎モデルをノートブックからデプロイする

次のものを使用できますサンプルノート SageMaker を使用して Jurassic-2 Jumbo Instruct をデプロイします。この例では ml.p4d.24xlarge インスタンスを使用していることに注意してください。 AWS アカウントのデフォルトの制限が 0 の場合、次のことを行う必要があります。制限の引き上げをリクエストするこの GPU インスタンスの場合。

SageMaker 推論を使用してエンドポイントを作成しましょう。まず、必要な変数を設定してから、モデルパッケージからモデルをデプロイします。

endpoint_name = "j2-jumbo-instruct" content_type = "application/json" real_time_inference_instance_type = ( "ml.p4d.24xlarge"
) # create a deployable model from the model package.
model = ModelPackage(
role=role, model_package_arn=model_package_arn, sagemaker_session=sagemaker_session
) # Deploy the model
predictor = model.deploy(1, real_time_inference_instance_type, endpoint_name=endpoint_name,
model_data_download_timeout=3600,
container_startup_health_check_timeout=600,
)

エンドポイントがデプロイされた後、モデルに対して推論クエリを実行できます。

モデルがデプロイされた後、次のコードスニペットを使用して、デプロイされたエンドポイントと対話できます。

response = ai21.Completion.execute(sm_endpoint=endpoint_name,
prompt=instruction,
maxTokens=2048,
temperature=0.7,
numResults=1,
stopSequences=['##']) output = response['completions'][0]['data']['text']

ml.p2d.4xlarge インスタンスの SageMaker エンドポイントにデプロイされた Jurassic-24 Jumbo Instruct 基盤モデルを使用すると、4,096 個のトークンを含むプロンプトを使用できます。プレイグラウンドで使用したものと同じプロンプトを使用して、さらに多くの質問を追加できます。この例では、FAQ の全体を追加しました。 ローコード ML セクションをコンテキストとしてプロンプトに追加します。

AI21 Jurassic-2 Jumbo Instruct エンドポイントプロンプト出力

モデルの出力を見ると、XNUMX つの質問と各質問に XNUMX つの選択肢がある多肢選択クイズが生成されます。

これで、出力を解析し、対話型の多肢選択クイズを作成する Python 関数を開発できるようになりました。

このような関数は、数行のコードで開発するのが非常に簡単です。プロンプトで要求したとおりに、モデルが質問ごとに「正解: 」を含む行を作成したため、答えを簡単に解析できます。この投稿の範囲では、クイズ生成用の Python コードは提供しません。

ノートブックでクイズを実行する

以前に作成した Python 関数と Jurassic-2 Jumbo Instruct 基礎モデルからの出力を使用して、ノートブックでインタラクティブなクイズを実行します。

AI21 Jurassic-2 Jumbo Instruct エンドポイント - テストを受ける

75 問中 XNUMX 問正解し、XNUMX% の成績を獲得したことがわかります。 SageMaker FAQ をあと数回読む必要があるかもしれません。

クリーンアップ

エンドポイントを試した後、料金が発生しないように、SageMaker 推論エンドポイントとモデルを必ず削除してください。

model.sagemaker_session.delete_endpoint(endpoint_name)
model.sagemaker_session.delete_endpoint_config(endpoint_name) model.delete_model()

まとめ

この投稿では、SageMaker を使用して AI21 の Jurassic-2 Jumbo Instruct モデルをテストして使用し、自動クイズ生成システムを構築する方法を説明しました。これは、公開されている SageMaker FAQ ページのテキストが埋め込まれたかなり単純なプロンプトと数行の Python コードを使用して実現されました。

この投稿で説明した例と同様に、いくつかのラベル付きの例を使用して、ビジネスの基盤モデルをカスタマイズできます。すべてのデータは暗号化され、AWS アカウントから流出しないため、データはプライベートで機密性が保たれると信頼できます。

アクセスをリクエストする基礎モデルを試す今日の SageMaker で、フィードバックをお寄せください!