AmazonSageMakerとHuggingFaceによるテキスト要約

プラトン再発行

フォロワー： 0

この投稿では、テキストの要約に使用される、最もダウンロードされたHuggingFaceの事前トレーニング済みモデルのXNUMXつを実装する方法を示します。ディスティルBART-CNN-12-6、Jupyterノートブック内でアマゾンセージメーカーと SageMaker ハグ顔推論ツールキット。この投稿に示されている手順に基づいて、からのテキストを要約してみることができますウィキテキスト-2 データセット fast.aiによって管理されます、で入手可能 AWSでのオープンデータのレジストリ.

企業や消費者がデジタル製品やオンラインサービスの使用を拡大するにつれて、グローバルなデータ量はゼタバイト規模で増加しています。この増大するデータをよりよく理解するために、テキスト分析のための機械学習（ML）自然言語処理（NLP）技術は、テキストの要約、エンティティの認識、分類、翻訳などを含むユースケースに対処するために進化しました。 AWSは事前トレーニング済みを提供しています AWS AIサービス API呼び出しを使用してアプリケーションに統合でき、MLの経験は必要ありません。例えば、 Amazon Comprehend カスタムエンティティ認識、感情分析、キーフレーズ抽出、トピックモデリングなどのNLPタスクを実行して、テキストから洞察を収集できます。実行できます多種多様な言語でのテキスト分析そのさまざまな機能のために。

テキスト要約は、ソースドキュメントからコンテキスト上意味のある情報のサブセットを作成するため、大量のテキストデータを理解するのに役立つ手法です。このNLP手法をより長い形式のテキスト文書や記事に適用して、たとえば会議からの通話メモを要約するなど、より迅速な消費とより効果的な文書索引付けを可能にすることができます。

ハグ顔は、NLPで人気のあるオープンソースライブラリであり、さまざまなフレームワークをサポートする49,000185を超える言語でXNUMXを超える事前トレーニング済みモデルを備えています。 AWSとHuggingFaceにはパートナーシップこれにより、SageMakerを介して、PyTorchまたはTensorFlowでのトレーニングと推論、およびSageMaker PythonSDKのHuggingFaceエスティメータとプレディクタ用の一連のAWSディープラーニングコンテナ（DLC）とのシームレスな統合が可能になります。 SageMakerのこれらの機能は、開発者とデータサイエンティストがAWSでNLPをより簡単に開始するのに役立ちます。 PyTorchなどのディープラーニングフレームワークでトランスフォーマーを使用してテキストを処理することは、通常、データサイエンティストにとって複雑で時間のかかる作業であり、NLPプロジェクトを開発する際のフラストレーションや効率の欠如につながることがよくあります。 Hugging FaceのようなAIコミュニティの台頭は、SageMakerのようなクラウドのMLサービスの力と組み合わされて、これらのテキスト処理タスクの開発を加速および簡素化します。 SageMakerは、Hugging Faceモデルの構築、トレーニング、デプロイ、運用を支援します。

テキスト要約の概要

テキスト要約を適用して、ドキュメント内のキーセンテンスを識別したり、複数のドキュメント間でキーセンテンスを識別したりできます。テキストの要約では、抽出と抽象のXNUMX種類の要約を作成できます。抽出サマリーには、マシンで生成されたテキストは含まれず、入力ドキュメントから選択された重要な文のコレクションです。要約要約には、テキスト要約モデルによって生成された、人間が読める新しいフレーズや文が含まれています。正確な抽象テキスト要約を実現するのは難しいため、ほとんどのテキスト要約システムは抽出要約に基づいています。

Hugging Faceには、400を超える事前トレーニング済みの最先端技術があります利用可能なテキスト要約モデル、NLP技術のさまざまな組み合わせを実装します。これらのモデルは、さまざまなデータセットでトレーニングされ、テクノロジー企業やHuggingFaceコミュニティのメンバーによってアップロードおよび保守されています。最もダウンロードされた、または最も気に入ったモデルでフィルタリングし、使用時に直接ロードすることができます。要約パイプラインHuggingFaceトランスフォーマーAPI。 Hugging Faceトランスフォーマーは、NLP実装プロセスを簡素化するため、MLの操作に関する広範な知識を必要とせずに、高性能NLPモデルを微調整してテキストの要約を提供できます。

AWSでのHuggingFaceテキスト要約モデル

SageMakerは、ビジネスアナリスト、データサイエンティスト、MLOpsエンジニアに、AWSでMLワークロードを設計および運用するためのツールの選択肢を提供します。これらのツールは、最適な結果を達成するためのMLモデルのより迅速な実装とテストを提供します。

ノーザンダイバー社の SageMaker ハグ顔推論ツールキット、オープンソースライブラリでは、Jupyterノートブックを使用してHuggingFaceテキスト要約モデルを実装およびホストするXNUMXつの異なる方法の概要を説明します。

HuggingFace要約パイプライン –を作成します HuggingFace要約パイプライン「summarization」タスク識別子。Jupyterノートブック内の推論にデフォルトのテキスト要約モデルを使用します。これらのパイプラインは複雑なコードを抽象化し、初心者のML実践者に、推論エンドポイントを構成せずにテキストの要約をすばやく実装するためのシンプルなAPIを提供します。パイプラインにより、ML実践者は、事前にトレーニングされた特定のモデルとそれに関連するトークナイザーを選択することもできます。トークナイザーは、テキストを単語またはサブワードに分割し、ルックアップテーブルを介してIDに変換することにより、モデルの入力として使用できるようにテキストを準備します。簡単にするために、次のコードスニペットはパイプラインを使用する場合のデフォルトのケースを提供します。 The ディスティルBART-CNN-12-6 モデルは、Hugging Faceで最もダウンロードされた要約モデルのXNUMXつであり、要約パイプラインのデフォルトモデル。最後の行は、事前にトレーニングされたモデルを呼び出して、提供されたXNUMXつの引数が与えられた場合に渡されたテキストの要約を取得します。
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```
事前にトレーニングされたモデルを使用したSageMakerエンドポイント –事前にトレーニングされたモデルを使用してSageMakerエンドポイントを作成しますフェイスモデルハブを抱き締める次のコードスニペットのml.m5.xlargeインスタンスなどの推論エンドポイントにデプロイします。この方法により、経験豊富なML実践者は、特定のオープンソースモデルをすばやく選択して微調整し、モデルを高性能の推論インスタンスにデプロイできます。
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```
トレーニング済みモデルを使用したSageMakerエンドポイント –トレーニング済みモデルを保存したSageMakerモデルエンドポイントを作成します Amazon シンプルストレージサービス（Amazon S3）バケットを作成し、推論エンドポイントにデプロイします。この方法により、経験豊富なML実践者は、AmazonS3に保存されている独自のモデルを高性能の推論インスタンスにすばやくデプロイできます。モデル自体はHuggingFaceからダウンロードされて圧縮され、AmazonS3にアップロードできます。この手順は、次のコードスニペットで示されています。
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

AWSには、MLワークロードのデプロイを支援するために利用できるいくつかのリソースがあります。 The 機械学習レンズ AWSの適切に設計されたフレームワークリソースの最適化やコストの削減など、MLワークロードのベストプラクティスを推奨します。これらの推奨される設計原則により、AWSで適切に設計されたMLワークロードが本番環境にデプロイされます。 AmazonSageMaker推論レコメンダー最適な推論パフォーマンスとコストでMLモデルをデプロイするための適切なインスタンスを選択するのに役立ちます。 Inference Recommendationrは、負荷テストを自動化し、MLインスタンス全体でモデルのパフォーマンスを最適化することにより、モデルの展開をスピードアップし、市場投入までの時間を短縮します。

次のセクションでは、トレーニング済みモデルをS3バケットからロードし、適切な推論インスタンスにデプロイする方法を示します。

前提条件

このチュートリアルでは、次の前提条件を満たしている必要があります。

An AWSアカウント.
Jupyter ノートブック内の Amazon SageMakerスタジオまたは SageMaker ノートブックインスタンス。この投稿では、提供されたコードスニペットとともに「Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)」イメージを使用しますが、他の上位バージョンの PyTorch イメージを使用することもできます。利用可能な SageMaker カーネル.
S3 バケット内のデータセット。ウィキテキスト-2 からのデータセット AWSでのオープンデータのレジストリ.

テキスト要約推論のためにHuggingFaceモデルをSageMakerにロードします

次のコードを使用して、HuggingFaceの事前トレーニング済みテキスト要約モデルをダウンロードしますディスティルBART-CNN-12-6 とそのトークナイザーを使用して、SageMakerのJupyterノートブックディレクトリにローカルに保存します。

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

保存されたテキスト要約モデルとそのトークナイザーをtar.gz形式に圧縮し、圧縮されたモデルアーティファクトをS3バケットにアップロードします。

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

選択する推論Dockerコンテナイメージテキスト要約推論を実行します。 Linux OS、PyTorchフレームワーク、およびHugging Face Transformerのバージョンを定義し、アマゾンエラスティックコンピューティングクラウド（Amazon EC2）コンテナを実行するためのインスタンスタイプ。

Dockerイメージはで利用可能です Amazon エラスティックコンテナレジストリ（Amazon ECR）同じAWSアカウントであり、そのコンテナイメージのリンクがURIとして返されます。

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

推論を実行する選択されたコンテナイメージによって展開されるテキスト要約モデルを定義します。次のコードスニペットでは、AmazonS3にアップロードされた圧縮モデルがデプロイされています。

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

サンプル入力で展開されたテキスト要約モデルをテストします。

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

推論レコメンダーを使用して、推論タスクに最適なEC2インスタンスを評価します

次に、入力テキストの複数のペイロードサンプルをJSON形式で作成し、それらを単一のペイロードファイルに圧縮します。これらのペイロードサンプルは、異なるEC2インスタンスタイプ間の推論パフォーマンスを比較するために推論レコメンダーによって使用されます。各サンプルペイロードは、前に示したJSON形式と一致する必要があります。あなたはから例を得ることができますウィキテキスト-2 データセット fast.aiによって管理されます、で入手可能 AWSでのオープンデータのレジストリ.

圧縮されたテキスト要約モデルアーティファクトと圧縮されたサンプルペイロードファイルをS3バケットにアップロードします。前のステップでモデルをアップロードしましたが、わかりやすくするために、モデルを再度アップロードするためのコードを含めています。

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

SageMakerで利用可能な標準MLモデルのリストを確認してください一般的なモデル動物園、NLPやコンピュータビジョンなど。 NLPモデルを選択して、テキスト要約推論を実行します。

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

次の例では、 bert-base-cased NLPモデル。テキスト要約モデルをに登録します SageMakerモデルレジストリ前の手順で正しく識別されたドメイン、フレームワーク、およびタスクを使用します。この例のパラメーターは、次のコードスニペットの冒頭に示されています。

InferenceRecommenderによって評価されるEC2インスタンスタイプの範囲に注意してください。 SupportedRealtimeInferenceInstanceTypes 次のコードで。次のことを確認してください AWSアカウントのサービス制限これらのタイプの推論ノードの展開を許可します。

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

を使用して推論レコメンダーのデフォルトジョブを作成します ModelPackageVersion 前のステップの結果です。 The uuid Pythonライブラリは、ジョブの一意の名前を生成するために使用されます。

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

次のコードを実行すると、推論推奨ジョブのステータスを取得できます。

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

ジョブステータスが COMPLETED、推論レコメンダーのデフォルトジョブによって評価されたEC2インスタンスタイプの推論レイテンシー、ランタイム、およびその他のメトリックを比較します。ユースケースの要件に基づいて、適切なノードタイプを選択します。

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

まとめ

SageMakerは、HuggingFaceモデルを使用するための複数の方法を提供します。その他の例については、 AWSサンプルGitHub。ユースケースの複雑さとモデルの微調整の必要性に応じて、これらのモデルを使用するための最適な方法を選択できます。 Hugging Faceパイプラインは、適切なモデルをすばやく実験して選択するための良い出発点になります。選択したモデルをカスタマイズしてパラメーター化する必要がある場合は、モデルをダウンロードして、カスタマイズされた推論エンドポイントにデプロイできます。特定のユースケースに合わせてモデルをさらに微調整するには、モデルをダウンロードした後にトレーニングする必要があります。

テキスト要約モデルを含む一般的なNLPモデルは、ユースケースに固有のデータセットでトレーニングされた後のパフォーマンスが向上します。 SageMakerのMLOPとモデル監視機能により、デプロイされたモデルが期待どおりに機能し続けることが保証されます。この投稿では、推論レコメンダーを使用して、テキスト要約モデルをデプロイするのに最適なインスタンスタイプを評価しました。これらの推奨事項により、MLユースケースのパフォーマンスとコストを最適化できます。

著者について

ニダル・アルベイルティ博士 アマゾンウェブサービスのシニアソリューションアーキテクトであり、機械学習ソリューションに情熱を注いでいます。 Nidalは、さまざまなレベルおよび業種でさまざまなグローバルITの役割に携わってきた25年以上の経験があります。 Nidalは、多くのAWSのお客様がクラウド導入の過程をサポートし、加速するための信頼できるアドバイザーとして機能します。

ダレン・コ ロンドンを拠点とするソリューションアーキテクトです。彼は、英国とアイルランドの中小企業の顧客に、クラウドでの再設計と革新についてアドバイスしています。ダレンはサーバーレスアーキテクチャで構築されたアプリケーションに興味があり、機械学習で持続可能性の課題を解決することに情熱を注いでいます。

タイムスタンプ： 2022 年 6 月 15 日

タイムスタンプ： 2022 年 9 月 13 日

AmazonSageMakerとHuggingFaceによるテキストの要約

プラトン再発行

テキスト要約の概要

AWSでのHuggingFaceテキスト要約モデル

前提条件

テキスト要約推論のためにHuggingFaceモデルをSageMakerにロードします

推論レコメンダーを使用して、推論タスクに最適なEC2インスタンスを評価します

まとめ

著者について

より多くの AWS機械学習

SageMaker でのモデルホスティングパターン: SageMaker でのモデルのテストと更新のベストプラクティス

Amazon SageMaker Data Wrangler を使用して機械学習用に Amazon EMR からデータを準備する

Amazon Lookout for Metrics を使用して、ロイヤルティポイント異常検出器を構築する

Amazon Fraud Detector の新しい Account Takeover Insights モデルを使用して、ログイン時のアカウントの乗っ取りを防ぎます

Amazon Kendra FAQ のバージョン管理を自動化および実装する

AmazonAppFlowとAmazonSageMakerCanvasを使用したノーコードMLソリューションを使用して、SAPERPから洞察を抽出します

サーバーレス AWS Glue インタラクティブセッションを使用して、Amazon SageMaker Studio で大規模なデータを準備します

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー