Amazon SageMaker JumpStar を使用したゼロショットテキスト分類

プラトン再発行

フォロワー： 0

自然言語処理 (NLP) は、人間と同じ方法でテキストや話し言葉を理解できる能力をコンピューターに与えることに関係する機械学習 (ML) の分野です。最近では、次のような最先端のアーキテクチャが登場しています。トランスアーキテクチャテキストの要約、テキストの分類、エンティティ認識などの NLP の下流タスクで人間に近いパフォーマンスを達成するために使用されます。

大規模言語モデル (LLM) は、数億もの大量のラベルなしテキストでトレーニングされたトランスフォーマーベースのモデルです (ベルト) 兆を超えるパラメータ (MiCS)、そのサイズにより単一 GPU トレーニングは非現実的になります。 LLM は本質的に複雑であるため、LLM をゼロからトレーニングすることは非常に困難な作業であり、その余裕のある組織はほとんどありません。 NLP ダウンストリームタスクの一般的な方法は、事前トレーニングされた LLM を取得して微調整することです。微調整の詳細については、を参照してください。ドメイン適応財務データの Amazon SageMaker JumpStart での基盤モデルの微調整および AmazonSageMakerのHuggingFaceを使用して、言語の多様性のためにトランスフォーマー言語モデルを微調整します.

NLP のゼロショット学習により、事前トレーニングされたLLM 明示的にトレーニングされていないタスクに対する応答を生成します (微調整なしでも)。テキスト分類について具体的に言えば、 ゼロショットテキスト分類 は、自然言語処理のタスクであり、NLP モデルを使用して、目に見えないクラスからテキストを分類します。 教師付き分類ここで、NLP モデルは、トレーニングデータ内のクラスに属するテキストのみを分類できます。

最近、ゼロショット分類モデルのサポートを開始しました。 Amazon SageMaker ジャンプスタート。 SageMaker JumpStart は、アマゾンセージメーカーこれにより、事前トレーニングされた基盤モデル (FM)、LLM、組み込みアルゴリズム、およびソリューションテンプレートへのアクセスが提供され、ML をすぐに開始できるようになります。この投稿では、SageMaker Jumpstart で事前トレーニングされたモデルを使用してゼロショット分類を実行する方法を示します。 SageMaker Jumpstart UI と SageMaker Python SDK を使用してソリューションをデプロイし、利用可能なモデルを使用して推論を実行する方法を学習します。

ゼロショット学習

ゼロショット分類は、トレーニングデータには存在しなかったクラスに属する新しい未確認のサンプルをモデルが分類できるパラダイムです。たとえば、人間の言語を理解するようにトレーニングされた言語モデルを使用して、新年の抱負のツイートを次のような複数のクラスに分類できます。 career, health, finance言語モデルはテキスト分類タスクで明示的にトレーニングされません。これはモデルの微調整とは対照的です。後者は (転移学習による) モデルの再トレーニングを意味しますが、ゼロショット学習では追加のトレーニングは必要ありません。

次の図は、転移学習 (左) とゼロショット学習 (右) の違いを示しています。

インら。自然言語推論 (NLI) を使用してゼロショット分類器を作成するためのフレームワークを提案しました。このフレームワークは、配列を NLI 前提として分類することによって機能し、各候補ラベルから仮説を構築します。たとえば、シーケンスがクラスに属しているかどうかを評価したい場合、 politics, 「この文章は政治について書かれている」という仮説を立てることができます。次に、含意と矛盾の確率がラベル確率に変換されます。簡単に復習すると、NLI では前提と仮説という XNUMX つの文を考慮します。タスクは、前提条件を考慮して仮説が真 (含意) か偽 (矛盾) かを判断することです。次の表にいくつかの例を示します。

前提	ラベル	仮説
東アジアのどこかの国で、人物の制服を検査する男性。	矛盾	男は寝ています。
微笑む年上の男性と若い男性。	普通	二人の男性が床で遊んでいる猫を見て微笑んで笑っている。
複数の男性がプレーするサッカーゲーム。	含意	スポーツをしている男性もいます。

ソリューションの概要

この投稿では、次のことについて説明します。

SageMaker JumpStart UI を使用して事前トレーニングされたゼロショットテキスト分類モデルをデプロイし、短いテキストデータを使用してデプロイされたモデルで推論を実行する方法
SageMaker Python SDK を使用して、SageMaker JumpStart の事前トレーニング済みゼロショットテキスト分類モデルにアクセスし、推論スクリプトを使用してモデルを SageMaker エンドポイントにデプロイしてリアルタイムテキスト分類のユースケースを実現する方法
SageMaker Python SDK を使用して、事前トレーニングされたゼロショットテキスト分類モデルにアクセスし、バッチテキスト分類のユースケースで SageMaker バッチ変換を使用する方法

SageMaker JumpStart は、一般的な ML タスクにわたるさまざまな事前トレーニング済みモデルのワンクリックの微調整とデプロイを提供するだけでなく、一般的なビジネス上の問題を解決するエンドツーエンドのソリューションの選択も提供します。これらの機能により、ML プロセスの各ステップから重労働が軽減され、高品質のモデルの開発が簡素化され、デプロイまでの時間が短縮されます。の JumpStart API 独自のデータセットで事前にトレーニングされた膨大な数のモデルをプログラムで展開し、微調整することができます。

JumpStart モデルハブは、カスタムデータセットでの転移学習と微調整を可能にする多数の NLP モデルへのアクセスを提供します。この記事の執筆時点で、JumpStart モデルハブには、Stable Diffusion、Flan T300、Alexa TM、Bloom など、さまざまな人気モデルにわたる 5 を超えるテキストモデルが含まれています。

このセクションの手順に従うと、インフラストラクチャを AWS アカウントにデプロイすることになり、コストが発生する可能性があることに注意してください。

スタンドアロンのゼロショットテキスト分類モデルを展開する

このセクションでは、SageMaker JumpStart を使用してゼロショット分類モデルをデプロイする方法を示します。 JumpStart ランディングページから事前トレーニングされたモデルにアクセスできます。 Amazon SageMakerスタジオ。次の手順を実行します。

SageMaker Studio で、JumpStart ランディングページを開きます。
参照する JumpStartを開いて使用する SageMaker JumpStart に移動する方法の詳細については、「SageMaker JumpStart」を参照してください。
テキストモデル カルーセルで、「ゼロショットテキスト分類」モデルカードを見つけます。
選択する モデルを見る その facebook-bart-large-mnli モデル。
あるいは、検索バーでゼロショット分類モデルを検索し、SageMaker JumpStart でモデルにアクセスすることもできます。
デプロイメント設定、SageMaker ホスティングインスタンスタイプ、エンドポイント名を指定します。 Amazon シンプルストレージサービス (Amazon S3) バケット名、およびその他の必須パラメーター。
オプションで、次のようなセキュリティ構成を指定できます。 AWS IDおよびアクセス管理 (IAM) ロール、VPC 設定、および AWSキー管理サービス (AWS KMS) 暗号化キー。
選択する 配備します SageMaker エンドポイントを作成します。

このステップが完了するまでに数分かかります。完了すると、ゼロショット分類モデルをホストする SageMaker エンドポイントに対して推論を実行できます。

次のビデオでは、このセクションの手順を詳しく説明します。

SageMakerSDKでJumpStartをプログラムで使用する

SageMaker Studio の SageMaker JumpStart セクションの クイックスタートソリューション、あなたは見つけることができますソリューションテンプレート。 SageMaker JumpStart ソリューションテンプレートは、多くの一般的な ML ユースケースに対応する、ワンクリックのエンドツーエンドソリューションです。この記事の執筆時点では、需要予測、不正行為の検出、パーソナライズされた推奨事項など、複数のユースケースに 20 を超えるソリューションが利用可能です。

「顔を抱きしめたゼロショットテキスト分類」ソリューションは、特定のラベルに合わせてモデルをトレーニングすることなくテキストを分類する方法を提供します (ゼロショット分類) 事前トレーニングされたテキスト分類子を使用します。このソリューションのデフォルトのゼロショット分類モデルは、フェイスブック-バート-ラージ-mnli (BART)モデル。このソリューションでは、 2015 年新年の抱負データセット解像度を分類します。のみを含む元のデータセットのサブセット。 Resolution_Category (グラウンドトゥルースラベル) と text 列はソリューションのアセットに含まれます。

入力データには、テキスト文字列、分類に必要なカテゴリのリスト、および分類が同期 (リアルタイム) 推論用のマルチラベルであるかどうかが含まれます。非同期 (バッチ) 推論の場合、テキスト文字列のリスト、各文字列のカテゴリのリスト、分類がマルチラベルかどうかを JSON 行形式のテキストファイルで提供します。

推論の結果は、次のスクリーンショットのような JSON オブジェクトです。

原文はこちらにあります sequence フィールド、テキスト分類に使用されるラベル labels フィールド、およびフィールド内の各ラベルに（同じ出現順で）割り当てられる確率 scores.

顔を抱きしめたゼロショットテキスト分類ソリューションを展開するには、次の手順を実行します。

SageMaker JumpStart ランディングページで、 モデル、ノートブック、ソリューション ナビゲーションペインに表示されます。
ソリューション セクションでは、選択 すべてのソリューションを調べる.
ソフトウェア設定ページで、下図のように ソリューション ページで、Hugging Face モデルカードを使用したゼロショットテキスト分類を選択します。
導入の詳細を確認し、同意する場合は、 起動する.

デプロイメントでは、リアルタイム推論用の SageMaker リアルタイムエンドポイントと、バッチ変換結果を保存するための S3 バケットがプロビジョニングされます。

次の図は、このメソッドのアーキテクチャを示しています。

ゼロショット分類モデルを使用してリアルタイム推論を実行する

このセクションでは、Python SDK を使用して、SageMaker エンドポイントを使用して (利用可能なモデルのいずれかを使用して) ゼロショットテキスト分類をリアルタイムで実行する方法を確認します。

まず、モデルに対する推論ペイロードリクエストを構成します。これはモデルに依存しますが、BART モデルの場合、入力は次の構造を持つ JSON オブジェクトです。
```
{
“inputs”: # The text to be classified
“parameters”: {
“candidate_labels”: # A list of the labels we want to use for the text classification
“multi_label”: True | False
}
}
```

BART モデルは明示的にトレーニングされていないことに注意してください。 candidate_labels。ゼロショット分類手法を使用して、テキストシーケンスを目に見えないクラスに分類します。次のコードは、新年の抱負データセットのテキストと定義されたクラスを使用した例です。

classification_categories = ['Health', 'Humor', 'Personal Growth', 'Philanthropy', 'Leisure', 'Career', 'Finance', 'Education', 'Time Management']
data_zero_shot = { "inputs": "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", "parameters": { "candidate_labels": classification_categories, "multi_label": False
}
}

次に、ゼロショットペイロードを使用して SageMaker エンドポイントを呼び出すことができます。 SageMaker エンドポイントは、SageMaker JumpStart ソリューションの一部としてデプロイされます。
```
response = runtime.invoke_endpoint(EndpointName=sagemaker_endpoint_name,
ContentType='application/json',
Body=json.dumps(payload)) parsed_response = json.loads(response['Body'].read())
```

推論応答オブジェクトには、元のシーケンス、最大値から最小値までのスコアで並べ替えられたラベル、およびラベルごとのスコアが含まれます。

{'sequence': "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", 'labels': ['Personal Growth', 'Health', 'Time Management', 'Leisure', 'Education', 'Humor', 'Career', 'Philanthropy', 'Finance'], 'scores': [0.4198768436908722,
0.2169460505247116,
0.16591140627861023,
0.09742163866758347,
0.031757451593875885,
0.027988269925117493,
0.015974704176187515,
0.015464971773326397,
0.008658630773425102]}

Python SDK を使用して SageMaker バッチ変換ジョブを実行する

このセクションでは、ゼロショット分類を使用してバッチ変換推論を実行する方法について説明します。 facebook-bart-large-mnli を使用したモデル SageMaker Python SDK。次の手順を実行します。

入力データを JSON 行形式でフォーマットし、ファイルを Amazon S3 にアップロードします。
SageMaker バッチ変換は、S3 ファイルにアップロードされたデータポイントに対して推論を実行します。

次のパラメータを使用してモデルデプロイメントアーティファクトを設定します。

モデル ID - 使用する huggingface-zstc-facebook-bart-large-mnli.
デプロイイメージ_uri - 使用 image_uris 事前に構築された SageMaker Docker イメージを取得するための Python SDK 関数 model_id。関数は次を返します。 Amazon エラスティックコンテナレジストリ (Amazon ECR) URI。
デプロイ_ソース_URI – script_uris ユーティリティ API を使用して、事前トレーニングされたモデル推論を実行するスクリプトを含む S3 URI を取得します。を指定します。 script_scope as inference.

モデルウリ - 使用する model_uri 指定されたモデルのアーティファクトを Amazon S3 から取得します。 model_id.

#imports
from sagemaker import image_uris, model_uris, script_uris, hyperparameters #set model id and version
model_id, model_version, = ( "huggingface-zstc-facebook-bart-large-mnli", "*",
) # Retrieve the inference Docker container URI. This is the base Hugging Face container image for the default model above.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None, # Automatically inferred from model_id
image_scope="inference",
model_id=model_id,
model_version=model_version,
instance_type="ml.g4dn.xlarge",
) # Retrieve the inference script URI. This includes all dependencies and scripts for model loading, inference handling, and more.
deploy_source_uri = script_uris.retrieve(model_id=model_id, model_version=model_version, script_scope="inference") # Retrieve the model URI. This includes the pre-trained model and parameters.
model_uri = model_uris.retrieve(model_id=model_id, model_version=model_version, model_scope="inference")

　 HF_TASK Hugging Face トランスフォーマーパイプラインのタスクを定義し、 HF_MODEL_ID テキストの分類に使用されるモデルを定義するには、次のようにします。
```
# Hub model configuration <https://huggingface.co/models>
hub = { 'HF_MODEL_ID':'facebook/bart-large-mnli', # The model_id from the Hugging Face Hub 'HF_TASK':'zero-shot-classification' # The NLP task that you want to use for predictions
}
```
タスクの完全なリストについては、を参照してください。パイプラインハグフェイスのドキュメントに記載されています。

SageMaker バッチ変換ジョブでデプロイされる Hugging Face モデルオブジェクトを作成します。

# Create HuggingFaceModel class
huggingface_model_zero_shot = HuggingFaceModel(
model_data=model_uri, # path to your trained sagemaker model
env=hub, # configuration for loading model from Hub
role=role, # IAM role with permissions to create an endpoint
transformers_version="4.17", # Transformers version used
pytorch_version="1.10", # PyTorch version used
py_version='py38', # Python version used
)

バッチジョブを実行するための変換を作成します。

# Create transformer to run a batch job
batch_job = huggingface_model_zero_shot.transformer(
instance_count=1,
instance_type='ml.m5.xlarge',
strategy='SingleRecord',
assemble_with='Line',
output_path=s3_path_join("s3://",sagemaker_config['S3Bucket'],"zero_shot_text_clf", "results"), # we are using the same s3 path to save the output with the input
)

バッチ変換ジョブを開始し、S3 データを入力として使用します。

batch_job.transform(
data=data_upload_path,
content_type='application/json',
split_type='Line',
logs=False,
wait=True
)

SageMaker コンソールでバッチ処理ジョブを監視できます ( バッチ変換ジョブ 下推論ナビゲーションペインで）。ジョブが完了すると、で指定した S3 ファイルでモデル予測出力を確認できます。 output_path.

SageMaker JumpStart で利用可能なすべての事前トレーニング済みモデルのリストについては、以下を参照してください。事前トレーニング済みのモデルテーブルを使用した組み込みアルゴリズム。検索バーでキーワード「zstc」（ゼロショットテキスト分類の略）を使用して、ゼロショットテキスト分類を実行できるすべてのモデルを見つけます。

クリーンアップ

ノートブックの実行が完了したら、このガイドでデプロイされた資産によって発生するコストが確実に発生しないように、プロセスで作成されたすべてのリソースを必ず削除してください。デプロイされたリソースをクリーンアップするコードは、ゼロショットテキスト分類ソリューションおよびモデルに関連付けられたノートブックで提供されます。

デフォルトのセキュリティ構成

SageMaker JumpStart モデルは、次のデフォルトのセキュリティ構成を使用してデプロイされます。

SageMaker のセキュリティ関連トピックについて詳しくは、以下をご覧ください。 Amazon SageMaker でセキュリティを設定する.

まとめ

この投稿では、SageMaker JumpStart UI を使用してゼロショット分類モデルをデプロイし、デプロイされたエンドポイントを使用して推論を実行する方法を説明しました。 SageMaker JumpStart 新年の抱負ソリューションを使用して、SageMaker Python SDK を使用してエンドツーエンドのソリューションを構築し、ゼロショット分類アプリケーションを実装する方法を示しました。 SageMaker JumpStart は、コンピュータビジョン、自然言語処理、レコメンデーションシステムなどのタスクのための何百もの事前トレーニングされたモデルとソリューションへのアクセスを提供します。ご自身で解決策を試して、ご意見をお聞かせください。

著者について

デビッドラレド 彼は中南米の AWS Envision Engineering のプロトタイピングアーキテクトであり、複数の機械学習プロトタイプの開発を支援してきました。以前は機械学習エンジニアとして働いており、5 年以上機械学習を行ってきました。彼の興味のある分野は、NLP、時系列、エンドツーエンドの ML です。

ヴィクラムエランゴ 米国バージニア州に拠点を置くアマゾンウェブサービスの AI/ML スペシャリストソリューションアーキテクトです。 Vikram は、設計とソートリーダーシップにより、金融および保険業界の顧客が機械学習アプリケーションを大規模に構築および展開できるよう支援します。彼は現在、自然言語処理、責任ある AI、推論の最適化、企業全体にわたる ML の拡張に重点を置いています。余暇には、家族と一緒に旅行、ハイキング、料理、キャンプを楽しんでいます。

ヴィヴェック・マダン博士 Amazon SageMaker JumpStart チームの応用科学者です。イリノイ大学アーバナシャンペーン校で博士号を取得し、ジョージア工科大学で博士研究員を務めました。彼は機械学習とアルゴリズム設計の活発な研究者であり、EMNLP、ICLR、COLT、FOCS、および SODA カンファレンスで論文を発表しています。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。自動車/EV、カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
チャートプライム。 ChartPrime でトレーディングゲームをレベルアップしましょう。こちらからアクセスしてください。
ブロックオフセット。環境オフセット所有権の近代化。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/zero-shot-text-classification-with-amazon-sagemaker-jumpstart/

タイムスタンプ： 2023 年 8 月 11 日

タイムスタンプ： 2023 年 7 月 26 日

Amazon SageMaker モデル並列ライブラリの新しいパフォーマンスの改善

ソースクラスター：

AWS機械学習

ソースノード： 1773672

タイムスタンプ： 2022 年 12 月 16 日

AWS AI サービスと LLM を使用して音声チャットとテキストチャットを管理する |アマゾンウェブサービス

ソースクラスター：

AWS機械学習

ソースノード： 1956061

タイムスタンプ： 2024 年 3 月 13 日

Amazon Translate を使用して、Salesforce Service Cloud で多言語カスタマーサポート翻訳を簡単に

ソースクラスター：

AWS機械学習

ソースノード： 1785867

タイムスタンプ： 2023 年 1 月 12 日

Best Egg は、Amazon SageMaker Automatic Model Tuning を使用して XNUMX 倍高速な ML モデルトレーニングを達成しました

ソースクラスター：

AWS機械学習

ソースノード： 1794788

タイムスタンプ： 2023 年 1 月 26 日

Amazon SageMaker JumpStart によるゼロショットテキスト分類 | アマゾンウェブサービス

プラトン再発行

ゼロショット学習

ソリューションの概要

スタンドアロンのゼロショットテキスト分類モデルを展開する

SageMakerSDKでJumpStartをプログラムで使用する

ゼロショット分類モデルを使用してリアルタイム推論を実行する

Python SDK を使用して SageMaker バッチ変換ジョブを実行する

クリーンアップ

デフォルトのセキュリティ構成

まとめ

著者について

より多くの AWS機械学習

Sportradar がディープ Java ライブラリを使用して実稼働規模の ML プラットフォームを構築し、パフォーマンスと効率を向上させた方法

AWS は、AI 戦略を計画するための新しい人工知能、機械学習、生成 AI ガイドを提供します | アマゾンウェブサービス

Amazon SageMaker モデル並列ライブラリの新しいパフォーマンスの改善

Amazon Translate を使用して、Salesforce Service Cloud で多言語カスタマーサポート翻訳を簡単に

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

ゼロショット学習

ソリューションの概要

スタンドアロンのゼロショット テキスト分類モデルを展開する

SageMakerSDKでJumpStartをプログラムで使用する

ゼロショット分類モデルを使用してリアルタイム推論を実行する

Python SDK を使用して SageMaker バッチ変換ジョブを実行する

クリーンアップ

デフォルトのセキュリティ構成

まとめ

著者について

より多くの AWS機械学習

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

スタンドアロンのゼロショットテキスト分類モデルを展開する