AWS Lambda でモデルエンドポイントをホストする MLOps ソリューションをデプロイする

プラトン再発行

フォロワー： 0

2019 年、Amazon は、気候の約束. この誓約の目標は、2040 年までにネットゼロカーボンを達成することです。これは、パリ協定の概要よりも 10 年早いものです。サインアップする企業は、定期的な報告、二酸化炭素の除去、および信頼できるオフセットに取り組んでいます。この記事の執筆時点で、377 社が気候に関する誓約に署名しており、その数は今も増え続けています。

AWS は、クラウドソリューションと機械学習 (ML) を通じてネットゼロ目標の達成を支援することに取り組んでいるため、炭素排出量を削減する多くのプロジェクトがすでに開発および展開されています。製造業は、このようなプロジェクトから大きな利益を得ることができる産業の XNUMX つです。コンプレッサーやチラーなど、製造工場の機械のエネルギー管理を最適化することで、企業は ML で二酸化炭素排出量を削減できます。

ML の実験段階から本番環境に効果的に移行することは困難です。モデルのトレーニングと再トレーニングの自動化、モデルレジストリの作成、実験と展開の追跡は、主要な課題の一部です。製造会社の場合、別の複雑なレイヤーがあります。つまり、展開されたモデルをエッジで実行する方法です。

この投稿では、持続可能なエネルギー管理ソリューションをホストする機械学習運用 (MLOps) テンプレートを提供することで、これらの課題に対処します。このソリューションはユースケースに依存しません。つまり、モデルとデータを変更することで、ユースケースに適応させることができます。でモデルを統合する方法を示します。 AmazonSageMakerパイプラインは、ML パイプラインを構築するためのネイティブワークフローオーケストレーションツールです。トレーニングジョブと、オプションでモンテカルロシミュレーションを使用した処理ジョブを実行します。実験はで追跡されます AmazonSageMakerの実験. モデルは追跡され、 Amazon SageMaker モデルレジストリ. 最後に、最終モデルを展開するためのコードを提供します。 AWSラムダ機能。

Lambda は、サーバーの管理やプロビジョニングを行わずにコードを実行できるコンピューティングサービスです。 Lambda の自動スケーリング、リクエストごとの請求、および使いやすさにより、Lambda はデータサイエンスチームにとって一般的なデプロイの選択肢となっています。この投稿により、データサイエンティストはモデルを費用対効果が高くスケーラブルな Lambda 関数に変えることができます。さらに、Lambda は以下との統合を可能にします AWS IoT Greengrass、持続可能なエネルギー管理ソリューションの場合のように、デバイスが生成したデータに基づいてエッジで動作できるようにするソフトウェアを構築するのに役立ちます。

ソリューションの概要

私たちが展開するアーキテクチャ (次の図を参照) は、機械学習に対する完全な CI/CD 駆動型のアプローチです。 XNUMX つのモノリシックソリューションを回避するために、要素が分離されています。

図の左上から始めましょう。の 処理 – イメージビルド コンポーネントは CI/CD 駆動型です AWS コードコミットのビルドとプッシュに役立つリポジトリデッカーコンテナ Amazon エラスティックコンテナレジストリ (アマゾン ECR)。この処理コンテナーは、ML パイプラインの最初のステップとして機能しますが、後処理ステップにも再利用されます。この場合、後処理としてモンテカルロシミュレーションを適用します。の トレーニング – イメージのビルド 左下に概説されているリポジトリは、処理その上にブロックします。主な違いは、モデルトレーニング用のコンテナーをビルドすることです。

主なパイプライン、 モデルの構築 (パイプライン)は、SageMaker パイプラインの実行を自動化する別の CodeCommit リポジトリです。このパイプラインは、データの前処理、モデルのトレーニング、SageMaker Experiments でのモデルメトリクスの追跡、データの後処理、および SageMaker モデルレジストリでのモデルのカタログ化を自動化して接続します。

最後のコンポーネントは右下にあります。 モデルの展開. の例に従うと、 AmazonSageMakerプロジェクト、SageMaker エンドポイントを使用してモデルをホストするテンプレートを取得します。デプロイリポジトリは、代わりに Lambda 関数でモデルをホストします。リアルタイム予測を実行できる Lambda 関数をデプロイするためのアプローチを示します。

前提条件

ソリューションを正常に展開するには、次のものが必要です。

GitHub リポジトリをダウンロードする

最初のステップとして、 GitHubリポジトリローカルマシンに。次のフォルダー構造が含まれています。

展開 – 展開に関連するコードが含まれています
mllib — 前処理、トレーニング、提供、およびシミュレーション用の ML コードが含まれています
テスト — 単体テストと統合テストが含まれています

展開のキーファイルはシェルスクリプトです。 deployment/deploy.sh. このファイルを使用して、アカウントにリソースをデプロイします。シェルスクリプトを実行する前に、次の手順を完了します。

Video Cloud Studioで deployment/app.py 下のbucket_nameを変更します SageMakerPipelineSourceCodeStackを選択します。 bucket_name グローバルに一意である必要があります (たとえば、氏名を追加します)。
In deployment/pipeline/assets/modelbuild/pipelines/energy_management/pipeline.py、変更 default_bucket 下 get_pipeline 手順 1 で指定したものと同じ名前にします。

AWS CDK を使用してソリューションをデプロイする

まず、 AWS CLI を構成する次に、次のコマンドを実行してデプロイディレクトリに移動し、仮想環境を作成してアクティブ化し、で指定された必要な pip パッケージをインストールします。 setup.py、そして deploy.sh:

cd deployment
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
pre-commit install
chmod u+x deploy.sh
./deploy.sh

deploy.sh 次のアクションを実行します。

Python で仮想環境を作成します。
仮想環境のアクティブ化スクリプトをソースします。
AWS CDK と、で概説されている要件をインストールします。 setup.py.
ブートストラップ環境。
作成した必要なファイルを圧縮してコピーします。 mllib ファイルを、これらのアセットが必要な対応するフォルダーに入れます。
Active Runs cdk deploy —require-approval never.
を作成します AWS CloudFormation AWS CDK を介してスタックします。

展開の初期段階にかかる時間は 5 分未満です。アーキテクチャ図に示されているように、AWS CLI で指定したリージョンの CodeCommit に XNUMX つのリポジトリが作成されました。の AWS コードパイプラインパイプラインは同時に実行されます。の modelbuild および modeldeploy パイプラインは、処理およびトレーニングイメージビルドの実行の成功に依存します。の modeldeploy パイプラインはモデルビルドの成功に依存します。モデルのデプロイは 1.5 時間以内に完了します。

Studio でモデルリポジトリを複製する

Studio UI で AWS CDK デプロイを介して作成された SageMaker パイプラインをカスタマイズするには、最初にリポジトリを Studio に複製する必要があります。 Studio でシステムターミナルを起動し、プロジェクト名と ID を指定した後、次のコマンドを実行します。

git clone https://git-codecommit.REGION.amazonaws.com/v1/repos/sagemaker-PROJECT_NAME-PROJECT_ID-modelbuild
git clone https://git-codecommit.REGION.amazonaws.com/v1/repos/sagemaker-PROJECT_NAME-PROJECT_ID-modeldeploy
git clone https://git-codecommit.REGION.amazonaws.com/v1/repos/sagemaker-PROJECT_NAME-PROJECT_ID-processing-imagebuild
git clone https://git-codecommit.REGION.amazonaws.com/v1/repos/sagemaker-PROJECT_NAME-PROJECT_ID-training-imagebuild

リポジトリのクローンを作成したら、コミットをリポジトリにプッシュできます。これらのコミットは、関連するパイプラインの CodePipeline 実行をトリガーします。

また、ソリューションをローカルマシンに適用して、好みの IDE で作業することもできます。

SageMaker Pipelines と SageMaker Experiments UI をナビゲートする

SageMaker パイプラインは、相互接続された一連のステップであり、 Amazon SageMaker Python SDK. このパイプライン定義は、JSON 定義としてエクスポートできる有向非巡回グラフ (DAG) を使用してパイプラインをエンコードします。このようなパイプラインの構造の詳細については、次を参照してください。 SageMaker パイプラインの概要.

MFAデバイスに移動する SageMakerリソース ペインをクリックし、表示する Pipelines リソースを選択します。下名前、見るべき PROJECT_NAME-PROJECT_ID. 実行 UI では、1 時間強かかると予想される正常な実行が表示されるはずです。パイプラインは、次のスクリーンショットに示すようになります。

Amazon SageMaker パイプライン

AWS CDK スタックがデプロイされた後、実行は自動的にトリガーされました。を選択して、実行を手動で呼び出すことができます。 創造する 実行。そこから、処理およびトレーニングステップのインスタンスタイプやインスタンス数など、独自のパイプラインパラメーターを選択できます。さらに、実行に名前と説明を付けることができます。パイプラインは、パイプライン定義全体で参照および定義できるパイプラインパラメーターを介して高度に構成可能です。

必要に応じて、パラメーターを使用して別のパイプライン実行を自由に開始してください。その後、に移動します SageMakerリソース ペインをもう一度選択して選択します 実験と試行. そこに、次のような名前の行が再び表示されるはずです PROJECT_NAME-PROJECT_ID. 実験に移動し、ランダム ID を持つ実行のみを選択します。そこから、SageMaker トレーニングジョブを選択して、トレーニングジョブに関連するメトリクスを調べます。

SageMaker Experiments の目標は、実験を作成し、それらにトライアルを入力し、トライアルと実験全体で分析を実行することをできるだけ簡単にすることです。 SageMaker Pipelines は SageMaker Experiments と密接に統合されており、デフォルトでは、実行ごとに実験、トライアル、およびトライアルコンポーネントが存在しない場合に備えて作成されます。

モデルレジストリで Lambda のデプロイを承認する

次のステップとして、以下のモデルレジストリに移動します。 SageMakerリソース. ここで、次のような名前の行をもう一度見つけることができます PROJECT_NAME-PROJECT_ID. 存在する唯一のモデルに移動して承認します。これにより、モデルアーティファクトが Lambda のコンテナに自動的にデプロイされます。

モデルレジストリでモデルを承認すると、アマゾンイベントブリッジイベントルールがトリガーされます。このルールは、末尾の CodePipeline パイプラインを実行します。 *-modeldeploy. このセクションでは、このソリューションが承認されたモデルをどのように使用し、それを Lambda 関数でホストするかについて説明します。 CodePipeline は、既存の CodeCommit リポジトリも取得します。 *-modeldeploy そのコードを使用して CodeBuild で実行します。 CodeBuild のメインエントリは、 buildspec.yml ファイル。最初にこれを見てみましょう：

version: 0.2

env:
  shell: bash

phases:
  install:
    runtime_versions:
      python: 3.8
    commands:
      - python3 -m ensurepip --upgrade
      - python3 -m pip install --upgrade pip
      - python3 -m pip install --upgrade virtualenv
      - python3 -m venv .venv
      - source .venv/bin/activate
      - npm install -g aws-cdk@2.26.0
      - pip install -r requirements.txt
      - cdk bootstrap
  build:
    commands:
      - python build.py --model-package-group-name "$SOURCE_MODEL_PACKAGE_GROUP_NAME"
      - tar -xf model.tar.gz
      - cp model.joblib lambda/digital_twin
      - rm model.tar.gz
      - rm model.joblib
      - cdk deploy --require-approval never

インストール段階では、Python ライブラリが最新であることを確認し、仮想環境を作成し、AWS CDK v2.26.0 をインストールして、 aws-cdk 要件ファイルを使用する他のものと一緒の Python ライブラリ。私達も AWS アカウントをブートストラップする. ビルド段階では、実行します build.py、次に説明します。そのファイルは、承認された最新の SageMaker モデルアーティファクトを次からダウンロードします。 Amazon シンプルストレージサービス (Amazon S3) をローカルの CodeBuild インスタンスに追加します。これ .tar.gz ファイルが解凍され、その内容が、メインの Lambda コードも含まれるフォルダーにコピーされます。 Lambda 関数は AWS CDK を使用してデプロイされ、コードは Amazon ECR の Docker コンテナから実行されます。これは、AWS CDK によって自動的に行われます。

　 build.py ファイルは、主にを使用する Python ファイルです。 AWS SDK for Python（Boto3）利用可能なモデルパッケージを一覧表示します。

関数 get_approved_package 前に説明したように、その後ダウンロードされるアーティファクトの Amazon S3 URI を返します。

モデルを正常にデプロイしたら、次のことができます。 test デプロイ先として選択したリージョンの Lambda コンソールで直接実行します。関数の名前には、 DigitalTwinStack-DigitalTwin*. 関数を開き、 ホイール試乗 タブ。次のイベントを使用して、テストコールを実行できます。

{
  "flow": "[280, 300]",
  "pressure": "[69, 70]",
  "simulations": "10",
  "no_of_trials": "10",
  "train_error_weight": "1.0"
}

テストイベントを実行すると、次のスクリーンショットに示すような応答が返されます。

AWS Lambda 関数をテストする

さらにシミュレーションやトライアルを実行したい場合は、Lambda のタイムアウト制限を増やしてコードを試すことができます! または、生成されたデータを取得して、同じものを視覚化することもできます。アマゾンクイックサイト. 以下は例です。あなたの番がきました！

アマゾンクイックサイト

クリーンアップ

これ以上課金されないようにするには、次の手順を実行します。

AWS CloudFormation コンソールで、 EnergyOptimization スタック。
これにより、ソリューション全体が削除されます。
スタックを削除する DigitalTwinStack、Lambda 関数をデプロイしました。

まとめ

この投稿では、エネルギー管理ソリューションの CI/CD 駆動型 MLOps パイプラインを紹介しました。このパイプラインでは、各ステップが分離されています。 Studio UI で ML パイプラインと実験を追跡できます。また、別のデプロイアプローチも示しました。モデルレジストリでモデルが承認されると、承認されたモデルをホストする Lambda 関数が CodePipeline を通じて自動的に構築されます。

AWS での MLOps パイプラインまたは持続可能なエネルギー管理ソリューションのいずれかに関心がある場合は、以下をご覧ください。 GitHubリポジトリ独自の AWS 環境にスタックをデプロイします!

著者について

ローレンス・ファン・デル・マース は、AWS プロフェッショナルサービスのデータサイエンティストです。彼は、AWS で機械学習ソリューションを構築しているお客様と緊密に連携しており、機械学習が私たちが知っている世界をどのように変えているかについて情熱を持っています。

カンカン・ワン AWS プロフェッショナルサービスの AI/ML コンサルタントです。彼女は、ヘルスケアおよびライフサイエンス業界で AI/ML ソリューションを展開した豊富な経験を持っています。彼女はまた、企業顧客がスケーラブルな AI/ML プラットフォームを構築して、データサイエンティストのクラウドジャーニーを加速するのを支援しています。

セレナ・タバラ は、AWS プロフェッショナルサービスのデータサイエンティストです。彼女は毎日顧客と協力して、AWS プラットフォームで革新することでビジネスの成果を達成しています。余暇には、ピアノを弾いたり、ハイキングをしたり、バスケットボールを見たりすることを楽しんでいます。

マイケルウォールナー は、AWS プロフェッショナルサービスの AI/ML に重点を置いたシニアコンサルタントです。 Michael は、クラウドへの移行を進めているお客様が AWSome になることを支援することに情熱を注いでいます。彼は製造業に情熱を注いでおり、データを通じて製造業の変革を支援することを楽しんでいます。

タイムスタンプ： 2022 年 11 月 28 日2022 年 11 月 28 日

Amazon SageMaker 地理空間機能による持続可能性のための原材料サプライチェーンのリモートモニタリング

ソースクラスター：

AWS機械学習

ソースノード： 1816676

タイムスタンプ： 2023 年 3 月 21 日

AWS Lambda でモデルエンドポイントをホストする MLOps ソリューションをデプロイする

プラトン再発行

ソリューションの概要

前提条件

GitHub リポジトリをダウンロードする

AWS CDK を使用してソリューションをデプロイする

Studio でモデルリポジトリを複製する

SageMaker Pipelines と SageMaker Experiments UI をナビゲートする

モデルレジストリで Lambda のデプロイを承認する

クリーンアップ

まとめ

著者について

より多くの AWS機械学習

AWS AI サービスカードの紹介: 透明性を高め、責任ある AI を推進するための新しいリソース

HuggingFaceから事前トレーニングされたトランスモデルを微調整するためのハイパーパラメータ最適化

Amazon Titan テキスト埋め込みの開始 |アマゾンウェブサービス

Amazon QuickSight を使用して、Amazon Lookout for Metrics の異常結果を視覚化する

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

ソリューションの概要

前提条件

GitHub リポジトリをダウンロードする

AWS CDK を使用してソリューションをデプロイする

Studio でモデル リポジトリを複製する

SageMaker Pipelines と SageMaker Experiments UI をナビゲートする

モデル レジストリで Lambda のデプロイを承認する

クリーンアップ

まとめ

著者について

より多くの AWS機械学習

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

Studio でモデルリポジトリを複製する

モデルレジストリで Lambda のデプロイを承認する