Amazon SageMaker エンドポイントでの YOLOv8 PyTorch モデルのホスト

プラトン再発行

フォロワー： 0

モデルを大規模に展開することは、多くのデータサイエンティストや機械学習エンジニアにとって面倒な作業になる可能性があります。ただし、Amazon SageMaker エンドポイントは、機械学習 (ML) モデルの推論をデプロイおよびスケーリングするためのシンプルなソリューションを提供します。私たちの最後のブログ投稿および GitHubレポホスティングについて YOLOv5 TensorFlowModel on アマゾンセージメーカーエンドポイント読者の多くの関心を集めました。多くの読者は、YOLOv5 モデルをホストする方法についても興味を持っていました。 PyTorch. この問題に対処するために、最近リリースされた YOLOv8 からのモデルウルトラリティクス、YOLOv8をホストする方法に関するこの投稿を提示します PyTorchModel SageMaker エンドポイントで。 GNU GPL8 ライセンスの下で配布される YOLOv3 モデルは、実行効率と検出精度で知られる人気のあるオブジェクト検出モデルです。 Amazon SageMaker エンドポイントは、モデルをデプロイするための簡単にスケーラブルでコストが最適化されたソリューションを提供します。

ソリューションの概要

次の図は、SageMaker エンドポイントを使用して YOLOv8 モデルをホストし、エンドポイントをユーザーとして呼び出すために使用される AWS サービスの概要を示しています。ソリューションは使用します AWS CloudFormation SageMaker インスタンスの作成を自動化し、 GitHubのインスタンスへのリポジトリ。 SageMaker ノートブックは、YOLOv8 PyTorch モデルにアクセスしてダウンロードし、モデルとともにカスタム推論コードを Amazon シンプルストレージサービス (Amazon S3) バケット。ノートブック内の手順では、YOLOv8 PyTorch モデルとカスタム推論コードをホストする SageMaker エンドポイントの作成が強調されています。このノートブックは、エンドポイントをテストして結果をプロットする方法も示しています。このソリューションは、次の手順で構成されています。

XNUMX つのノートブックを含む GitHub リポジトリを作成しました 1_DeployEndpoint.ipynb および 2_TestEndpoint.ipynb、下 sm-notebook/ ディレクトリにあります。
AWS CloudFormation テンプレートが実行され、SageMaker Notebook インスタンスが作成され、GitHub リポジトリのクローンが作成されます。
ノート 1_DeployEndpoint.ipynb YOLOv8 モデルのダウンロードに使用されます。
YOLOv8 モデルと推論コードは次のように保存されます。 model.tar.gz アマゾンS3で。
SageMaker エンドポイントは、 model.tar.gz.
ノート 2_TestEndpoint.ipynb エンドポイントをテストして結果を収集するために使用されます。

Amazon SageMaker Endpoints PlatoBlockchain Data Intelligence で YOLOv8 PyTorch モデルをホストします。垂直検索。あい。

前提条件

AWS アカウント AWS Identity and Access Management (IAM) ロール以下へのアクセスを提供します。

AWS CloudFormation
アマゾンセージメーカー
アマゾンS3

1.SageMaker エンドポイントで YOLOv8 をホストする

Ultralytics には、さまざまな機能を持つ複数の YOLOv8 モデルがあります。それらは次のように細分されます。

オブジェクト検出 (yolov8l.pt, yolov8m.pt, yolov8n.pt, yolov8s.pt, yolov8x.pt, yolov8x6.pt)
Segmentation (yolov8l-seg.pt, yolov8m-seg.pt, yolov8n-seg.pt, yolov8s-seg.pt, yolov8x-seg.pt)
Classification (yolov8l-cls.pt, yolov8m-cls.pt, yolov8n-cls.pt, yolov8s-cls.pt, yolov8x-cls.pt)

このブログでは、以下を使用したオブジェクト検出に焦点を当てます。 yolov8l.pt PyTorch モデル。 SageMaker エンドポイントで YOLOv8 モデルとカスタム推論コードをホストするには、それらを XNUMX つのファイルにまとめて圧縮する必要があります。 model.tar.gz 次の構造で：

model.tar.gz ├─ code/ │ ├── inference.py │ └── requirements.txt └── yolov8l.pt

モデルの重み yolov8l.pt ファイルは code/ ディレクトリとメインの推論 python スクリプト inference.pyモデルの読み込み、入力の解析、推論の実行、および出力の後処理に必要な関数を含む code/ ディレクトリ。の詳細 inference.py 次のセクションで説明します。

1.1。カスタム推論コード

パイプラインとコードのワークフローに応じて、SageMaker エンドポイントへの入力と SageMaker エンドポイントからの出力は異なる場合があります。この投稿では、 numpy エンドポイントに配列して処理します。ただし、エンドポイントへの入力は json またはテキストも。ワークフローに応じて、の関数を変更する必要があります。 inference.py さまざまな入力と出力に対応します。さらに、最近の YOLOv8 のリリースでは、Ultralytics チームが Python API をリリースしました。これにより、YOLO ライブラリを直接インストールできます。 requirements.txt モデルをインポートします inference.py.

1.1.1. の内容 `code/inference.py`:

import numpy as np
import torch, os, json, io, cv2, time
from ultralytics import YOLO def model_fn(model_dir): print("Executing model_fn from inference.py ...") env = os.environ model = YOLO("/opt/ml/model/code/" + env['YOLOV8_MODEL']) return model def input_fn(request_body, request_content_type): print("Executing input_fn from inference.py ...") if request_content_type: jpg_original = np.load(io.BytesIO(request_body), allow_pickle=True) jpg_as_np = np.frombuffer(jpg_original, dtype=np.uint8) img = cv2.imdecode(jpg_as_np, flags=-1) else: raise Exception("Unsupported content type: " + request_content_type) return img def predict_fn(input_data, model): print("Executing predict_fn from inference.py ...") device = torch.device('cuda' if torch.cuda.is_available() else 'cpu') model.to(device) with torch.no_grad(): result = model(input_data) return result def output_fn(prediction_output, content_type): print("Executing output_fn from inference.py ...") infer = {} for result in prediction_output: if result.boxes: infer['boxes'] = result.boxes.numpy().data.tolist() if result.masks: infer['masks'] = result.masks.numpy().data.tolist() if result.probs: infer['probs'] = result.probs.numpy().data.tolist() return json.dumps(infer)

1.1.2. の内容 `code/requirements.txt`:

opencv-python
torchvision
seaborn
ultralytics
omegaconf==2.3.0

すべてのファイルの内容が model.tar.gz 完了したら、次のコマンドを実行して tar ボールを作成します。

$ tar -czvf model.tar.gz code/ yolov8l.pt

1.2.ホスト `model.tar.gz` SageMaker エンドポイントへ:

これには、いくつかの手順が含まれます。 model.tar.gz 最初に S3 バケットにアップロードされます。アップロードされたアーティファクトは、SageMaker PyTorchModel を作成するために使用されます。最後に、この PyTorchModel を使用して、モデルを SageMaker エンドポイントにデプロイします。

1.2.1. モデルと推論コードを S3 にアップロードします。

from sagemaker import s3 bucket = "s3://NAME_OF_BUCKET"
prefix = "yolov8/demo-custom-endpoint"
model_data = s3.S3Uploader.upload("model.tar.gz", bucket + "/" + prefix)

1.2.2. SageMaker PyTorchModel を作成します。

from sagemaker.pytorch import PyTorchModel model_name = 'yolov8l.pt' model = PyTorchModel(entry_point='inference.py', model_data=model_data, framework_version='1.12', py_version='py38', role=role, env={'TS_MAX_RESPONSE_SIZE':'20000000', 'YOLOV8_MODEL': model_name}, sagemaker_session=sess)

1.2.3. モデルをコンパイルしてエンドポイントにホストします。

from sagemaker.deserializers import JSONDeserializer INSTANCE_TYPE = 'ml.m5.4xlarge'
ENDPOINT_NAME = 'yolov8-pytorch-' + str(datetime.utcnow().strftime('%Y-%m-%d-%H-%M-%S-%f')) predictor = model.deploy(initial_instance_count=1, instance_type=INSTANCE_TYPE, deserializer=JSONDeserializer(), endpoint_name=ENDPOINT_NAME)

2.SageMaker エンドポイントをテストする

エンドポイントが正常にホストされると、それを使用して推論を実行できます。このステップでは、最初に画像を読み取り、それをバイトに変換し、バイトを入力としてエンドポイントに渡すことで推論を実行します。生成された結果には、ホスティングに使用された YOLOv8 モデルのタイプに基づいて、バウンディングボックス、マスク、または信頼スコアが含まれます。それに応じて出力をプロットできます。

2.1.1. 推論結果を生成し、出力をプロットします。

import cv2, random
import numpy as np
import matplotlib.pyplot as plt orig_image = cv2.imread('bus.jpg') image_height, image_width, _ = orig_image.shape
model_height, model_width = 300, 300
x_ratio = image_width/model_width
y_ratio = image_height/model_height resized_image = cv2.resize(orig_image, (model_height, model_width))
payload = cv2.imencode('.jpg', resized_image)[1].tobytes()
result = predictor.predict(payload) if 'boxes' in result: for idx,(x1,y1,x2,y2,conf,lbl) in enumerate(result['boxes']): # Draw Bounding Boxes x1, x2 = int(x_ratio*x1), int(x_ratio*x2) y1, y2 = int(y_ratio*y1), int(y_ratio*y2) color = (random.randint(10,255), random.randint(10,255), random.randint(10,255)) cv2.rectangle(orig_image, (x1,y1), (x2,y2), color, 4) cv2.putText(orig_image, f"Class: {int(lbl)}", (x1,y1-40), cv2.FONT_HERSHEY_SIMPLEX, 1, color, 2, cv2.LINE_AA) cv2.putText(orig_image, f"Conf: {int(conf*100)}", (x1,y1-10), cv2.FONT_HERSHEY_SIMPLEX, 1, color, 2, cv2.LINE_AA) if 'masks' in result: # Draw Masks mask = cv2.resize(np.asarray(result['masks'][idx]), dsize=(image_width, image_height), interpolation=cv2.INTER_CUBIC) for c in range(3): orig_image[:,:,c] = np.where(mask>0.5, orig_image[:,:,c]*(0.5)+0.5*color[c], orig_image[:,:,c]) if 'probs' in result: # Find Class lbl = result['probs'].index(max(result['probs'])) color = (random.randint(10,255), random.randint(10,255), random.randint(10,255)) cv2.putText(orig_image, f"Class: {int(lbl)}", (20,20), cv2.FONT_HERSHEY_SIMPLEX, 1, color, 2, cv2.LINE_AA) plt.imshow(cv2.cvtColor(orig_image, cv2.COLOR_BGR2RGB))
plt.show()

2.1.2。結果：

オブジェクト検出とセグメンテーション YOLOv8 モデルの出力を次の画像に示します。

Amazon SageMaker Endpoints PlatoBlockchain Data Intelligence で YOLOv8 PyTorch モデルをホストします。垂直検索。あい。

3.クリーンアップ

CloudFormation スタックの削除最初に作成されたすべてのリソースを削除します。ただし、CloudFormation は現在、エンドポイント、エンドポイント構成、およびモデルを自動的に削除するように構成されていません。ホストされたエンドポイントが使用されていない場合は、コストを節約するために削除することをお勧めします。次のように実行できます。

import boto3 sm_client = boto3.client(service_name="sagemaker") response = sm_client.describe_endpoint_config(EndpointConfigName=endpoint_name)
print(response)
endpoint_config_name = response['EndpointConfigName'] # Delete Endpoint
sm_client.delete_endpoint(EndpointName=endpoint_name) # Delete Endpoint Configuration
sm_client.delete_endpoint_config(EndpointConfigName=endpoint_config_name) # Delete Model
for prod_var in response['ProductionVariants']: model_name = prod_var['ModelName'] sm_client.delete_model(ModelName=model_name)

まとめ

この投稿では、事前トレーニング済みの YOLOv8 をホストする方法を示しました。 PyTorchModel SageMaker エンドポイントで、エンドポイントを呼び出して推論結果をテストします。詳細なコードは、 GitHubの、およびテンプレートの CloudFormation スタックは GitHub でも入手できます。

SageMaker エンドポイントの詳細については、こちらをご覧くださいエンドポイントを作成してモデルをデプロイするおよび Amazon SageMaker で PyTorch を使用するを使用して強調表示します PyTorchModel SageMaker で。このプロセスは、次を使用して自動化できます。 SageMaker の CloudFormation サポート.

著者について

Amazon SageMaker Endpoints PlatoBlockchain Data Intelligence で YOLOv8 PyTorch モデルをホストします。垂直検索。あい。 ケビンソング は、AWS プロフェッショナルサービスのデータサイエンティストです。彼は生物物理学の博士号を取得しており、コンピュータービジョンと機械学習ソリューションの構築において XNUMX 年以上の業界経験があります。

Amazon SageMaker Endpoints PlatoBlockchain Data Intelligence で YOLOv8 PyTorch モデルをホストします。垂直検索。あい。 ロミル・シャー は、AWS プロフェッショナルサービスの IoT Edge データサイエンティストです。 Romil は、コンピュータービジョン、機械学習、IoT エッジデバイスの業界で XNUMX 年以上の経験があります。彼は、顧客が産業用セットアップでエッジデバイスの機械学習モデルを最適化および展開するのを支援することに携わっています。