AWS Organizations で AWS の事前トレーニング済み AI サービスを使用して MLOps を実装する

プラトン再発行

フォロワー： 0

　 AWS Machine Learning Operations (MLOps) フレームワーク時間の経過とともに AI モデルを進化させる反復的かつ反復的なプロセスです。 DevOps と同様に、実務者は、品質管理のためのさまざまな環境 (品質保証、統合、運用など) を通じて成果物を効率的にプロモーションできるようになります。並行して、顧客は次のような方法でマルチアカウント戦略を迅速に採用しています。 AWS組織および AWS Control Tower 安全で隔離された環境を作成します。この組み合わせにより、AWS の事前トレーニング済み AI サービスを使用して MLOps を実装する際に課題が生じる可能性があります。 Amazon Rekognitionカスタムラベル。この投稿では、セキュリティのベストプラクティスを維持しながらその複雑さを軽減するための設計パターンについて説明します。

概要

あらゆる業界のお客様が、機械学習 (ML) を効率的に運用し、ビジネス価値を実現するまでの時間を短縮することの価値を認識しています。ほとんどの AWS の事前トレーニング済み AI サービスは、一般的なユースケースの中でも特に、コンピュータービジョン、翻訳、不正行為検出のためのすぐに使用できる機能を通じてこの状況に対処します。多くのユースケースでは、一般的な答えを超えたドメイン固有の予測が必要です。 AI サービスは、これらのシナリオに対して顧客がラベル付けしたデータを使用して、予測モデルの結果を微調整できます。

時間の経過とともに、ドメイン固有の語彙は変化し、進化します。たとえば、工具メーカーが画像内の製品 (ハンマーやドライバーなど) を検出するためにコンピュータービジョンモデルを作成したとします。将来のリリースでは、レンチとのこぎりのサポートが追加されます。これらの新しいラベルを使用するには、製造元の Web サイトやカスタムアプリケーションのコードを変更する必要があります。現在、両方のアーティファクトが同時に解放する必要がある依存関係があります。

AWS MLOps フレームワークは、反復的かつ反復的なプロセスを通じてこれらのリリースの課題に対処します。モデル成果物は、運用エンドユーザーに届く前に、アプリケーションコードなどのさまざまな品質ゲートを通過する必要があります。通常、これらの品質ゲートは次を使用して実装します。複数の AWS アカウント AWS 組織内。このアプローチにより、これらのアプリケーションドメインを一元管理し、ガードレールとビジネス要件を強制する柔軟性が得られます。組織内に数十、さらには数百のアカウントを持つことがますます一般的になってきています。ただし、ワークロード分離のニーズとチームの規模および複雑さのバランスを取る必要があります。

MLOps 担当者には、アカウント間で成果物をプロモートするための標準手順があります (QA から運用環境への移行など)。これらのパターンは実装が簡単で、コードとバイナリリソースをコピーすることに依存します。 Amazon シンプルストレージサービス (Amazon S3) バケット。ただし、AWS 事前トレーニング済み AI サービスは現在、トレーニング済みのカスタムモデルを AWS アカウント間でコピーすることをサポートしていません。このようなメカニズムが存在するまでは、同じデータセットを使用して各 AWS アカウントでモデルを再トレーニングする必要があります。このアプローチでは、新しいアカウントでモデルを再トレーニングするための時間とコストがかかります。このメカニズムは、一部の顧客にとっては実行可能なオプションとなる可能性があります。ただし、この投稿では、AWS 組織のアカウント全体でこれらのカスタムモデルを安全に共有しながら、これらのカスタムモデルを一元的に定義および進化させる手段を示します。

ソリューションの概要

この投稿では、AWS の事前トレーニング済み AI Service ドメイン固有モデルを安全に共有するための設計パターンについて説明します。これらのサービスには以下が含まれますアマゾン詐欺検出器, Amazon Transcribe, Amazonの再認識、いくつか例を挙げると。これらの戦略は広く適用できますが、具体的な例として Rekognition Custom Labels に焦点を当てます。 Rekognition Custom Labels 特有のニュアンスについては、意図的に深く掘り下げることを避けています。

このアーキテクチャは、管理アカウントで構成された AWS Control Tower から始まります。 AWS Control Tower は、安全なマルチアカウント AWS 環境をセットアップして管理するための最も簡単な方法を提供します。次の図に示すように、次の図を使用します。アカウントファクトリ AWS Control Tower で XNUMX つの AWS アカウントを作成します。

デプロイオーケストレーション用の CI/CD アカウント (たとえば、 AWS コードスター)
外部エンドユーザー用の実稼働アカウント (公開 Web サイトなど)
社内開発チーム (試作前など) の品質保証アカウント
カスタムモデルとサポートシステムの ML アカウント
AWS レイクハウス独自の顧客データを保持するアカウント

規制要件、業界、規模によっては、この構成が粒度が高すぎたり、粗すぎたりする場合があります。参照する AWS Organizations と AWS Control Tower を使用したマルチアカウント環境の管理詳細については、

AWS Organizations アカウント構成の例

Rekognition カスタムラベルモデルの作成

Rekognition Custom Labels モデルを作成する最初のステップは、それをホストする AWS アカウントを選択することです。単一の ML アカウントを使用して ML の旅を始めることもできます。このアプローチでは、あらゆるツールと手順が XNUMX か所に統合されます。ただし、この集中化により、個々のアカウントが肥大化し、モノリシックな環境が生じる可能性があります。より成熟した企業は、この ML アカウントをチームまたはワークロードごとにセグメント化します。粒度に関係なく、一元的に定義してモデルを一度トレーニングするという目的は同じです。

この投稿では、単一の ML アカウントと別のデータレイクアカウントで Rekognition Custom Labels モデルを使用する方法を示します (次の図を参照)。データが別のアカウントに存在する場合は、次のようにリソースポリシーを構成する必要があります。 S3 バケットへのクロスアカウントアクセスを提供するオブジェクト。この手順により、バケットの内容が ML アカウントと安全に共有されます。を参照してください。クイックスタートサンプルの詳細については、 Amazon Rekognition ドメイン固有モデルの作成.

アカウント間でのデータの共有

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AWSRekognitionS3AclBucketRead20191011", "Effect": "Allow", "Principal": { "Service": "rekognition.amazonaws.com" }, "Action": [ "s3:GetBucketAcl", "s3:GetBucketLocation" ], "Resource": "arn:aws:s3:::S3:" }, { "Sid": "AWSRekognitionS3GetBucket20191011", "Effect": "Allow", "Principal": { "Service": "rekognition.amazonaws.com" }, "Action": [ "s3:GetObject", "s3:GetObjectAcl", "s3:GetObjectVersion", "s3:GetObjectTagging" ], "Resource": "arn:aws:s3:::S3:/*" }, { "Sid": "AWSRekognitionS3ACLBucketWrite20191011", "Effect": "Allow", "Principal": { "Service": "rekognition.amazonaws.com" }, "Action": "s3:GetBucketAcl", "Resource": "arn:aws:s3:::S3:" }, { "Sid": "AWSRekognitionS3PutObject20191011", "Effect": "Allow", "Principal": { "Service": "rekognition.amazonaws.com" }, "Action": "s3:PutObject", "Resource": "arn:aws:s3:::S3:/*", "Condition": { "StringEquals": { "s3:x-amz-acl": "bucket-owner-full-control" } } } ]
}

クロスアカウントアクセスを有効にする

モデルを構築してデプロイした後は、エンドポイントは ML アカウント内でのみ使用できます。使用しないでください。静的キーアクセスを共有します。絶対です代理アクセスを使用して実稼働 (または QA) アカウントに AWS IDおよびアクセス管理 (IAM) の役割。 ML アカウントでクロスアカウントロールを作成するには、次の手順を実行します。

Rekognition Custom Labelsコンソールで、 プロジェクト プロジェクト名を選択します。
選択する Models そしてあなたのモデル名。
ソフトウェア設定ページで、下図のように モデルを使用 タブで、下にスクロールして モデルを使用する のセクションから無料でダウンロードできます。
モデル Amazon リソースネーム (ARN) をコピーします。次のようにフォーマットする必要があります。 arn:aws:rekognition:region-name:account-id:project/model-name/version/version-id/timestamp.
でロールを作成します rekognition:DetectCustomLabels モデル ARN へのアクセス許可と、許可する信頼ポリシー sts:AssumeRole 本番 (または QA) アカウントから (たとえば、 arn:aws:iam::PROD_ACCOUNT_ID_HERE:root).
必要に応じて、ワークロード固有のアクション (S3 バケットへのアクセスなど) に追加のポリシーをアタッチします。
必要に応じて、条件要素追加の委任要件を強制するため。
次のセクションで使用する新しいロールの ARN を記録します。

エンドポイントを呼び出す

セキュリティポリシーを設定したら、構成をテストします。簡単なアプローチには、アマゾンエラスティックコンピューティングクラウド (Amazon EC2) インスタンスと、 AWSコマンドラインインターフェイス (AWS CLI)。次の手順でエンドポイントを呼び出します。

本番 (または QA) アカウントで、Amazon EC2 のロールを作成します。
許可するポリシーをアタッチします。 sts:AssumeRole ML アカウントのクロスロール ARN に追加します。
Amazon Linux 2 インスタンスを起動する前のステップの役割を使用します。
プロビジョニングされるまで待ってから、 SSH を使用して Linux インスタンスに接続する.
コマンドを呼び出す aws iam assume-role 前のセクションのクロスアカウントの役割に切り替えます。
モデルエンドポイントを開始するまだ実行していない場合は、Rekognition コンソールまたは開始プロジェクトバージョン AWS CLI コマンド。
コマンドを呼び出す aws rekognition 検出カスタムラベル動作をテストします。

AWS SDK と別のコンピューティングリソース (たとえば、 AWSラムダ).

公共のインターネットを避ける

前のセクションでは、detect-custom-labels リクエストは Virtual Private Cloud (VPC) のインターネットゲートウェイを使用し、パブリックインターネットを通過します。 TLS/SSL 暗号化により、多くのワークロードの通信チャネルが十分に保護されます。使用できます AWS プライベートリンク〜へ VPC とサポートするサービス間の接続を有効にするインターネットゲートウェイ、NAT デバイス、VPN 接続、トランジットゲートウェイ、または AWSダイレクトコネクト繋がり。その後、detect-custom-labels リクエストが AWS ネットワークから公共のインターネットに公開されることはありません。 AWS PrivateLink は、この投稿内で使用されるすべてのサービスをサポートしています。事前トレーニングされた AI サービスを強制することもできます IAM によるプライベート接続の使用クロスロールポリシーで。この制御により、構成を誤ったクライアントが事前トレーニングされた AI サービスのインターネットに接続されたエンドポイントを使用することを防ぐ、別のレベルの保護が追加されます。追加情報については、次を参照してください。 Amazon VPC エンドポイントでの Amazon Rekognition の使用, Amazon S3 の AWS PrivateLink, AWS STS インターフェイス VPC エンドポイントの使用.

次の図は、実稼働アカウント、ML アカウント、QA アカウント間の VPC エンドポイント構成を示しています。

アカウント間での VPC エンドポイントの使用

モデルをプロモートするための CI/CD パイプラインを構築する

AWS では、Amazon Rekognition プロジェクトのデータセットにカスタムラベルを付けるために、より多くのトレーニングデータとテストデータを継続的に提供することをお勧めします。モデルを改善する。プロジェクトにさらにデータを追加すると、新しいモデルによって精度が向上したり、ラベルが変更されたりすることがあります。

MLOps では、モデルアーティファクトに一貫性がなければなりません。事前トレーニングされた AI サービスでこれを実現するために、AWS では、コードの参照を新しいモデルバージョンの ARN に更新することでモデルエンドポイントを昇格することをお勧めします。このアプローチにより、各環境 (QA アカウントや運用アカウントなど) でのドメイン固有のモデルの再トレーニングが回避されます。アプリケーションは、次のように新しいモデルの ARN をランタイム変数として使用できます。 AWS システムマネージャーマルチアカウント内またはマルチステージ環境.

XNUMX つの粒度レベルにより、クロスアカウントモデルへのアクセスが、特にアカウント、プロジェクト、モデルバージョンレベルで制限されます。モデルは冪等であり、特定の時点のトレーニングにマッピングされる固有の ARN を持ちます。 arn:aws:rekognition:account:region:project/project_name/version/name/timestamp.

次の図は、QA から本番環境へのモデルのローテーションを示しています。

モデルバージョンのプロモーション

前述のアーキテクチャでは、本番アプリケーションと QA アプリケーションは、それぞれの VPC エンドポイントを通じて v2 または v3 モデルエンドポイントを使用する API 呼び出しを行います。構成ストアから ARN を受け取ります (たとえば、 Amazon Systems Manager パラメータストア or AWS アプリ構成）。このプロセスは n 環境は多数ありますが、簡単にするために XNUMX つのアカウントのみを使用して説明します。必要に応じて、置き換えられたモデルバージョンを削除すると、それらのリソースがさらに消費されなくなります。

ML アカウントには、アクセスを必要とする各環境固有 (運用アカウントなど) の IAM ロールがあります。デプロイの一部としての CI/CD パイプラインは、IAM ロールのインラインポリシーを変更して、適切なモデルへのアクセスを許可します。

Model-v2 を QA アカウントから運用アカウントに昇格させるシナリオを考えてみましょう。このプロセスには次の手順が必要です。

Rekognition Custom Labels コンソールで、Model-v2 エンドポイントを実行状態に移行します。
ML アカウントの IAM クロスアカウントロールに、新しいバージョンの Model-v2 へのアクセスを付与します。

なお、リソース要素 ARN のワイルドカードをサポートします。

委任ロールを使用して、実稼働アプリケーションから Model-v2 にテスト呼び出しを送信します。
必要に応じて、Model-v1 へのクロスアカウントロールのアクセスを削除します。
必要に応じて、追加の AWS アカウントごとにステップ 2 ～ 3 を繰り返します。
必要に応じて、コストの発生を避けるために Model-v1 エンドポイントを停止します。

すべてのリージョンの IAM コントロールプレーンから IAM データプレーンへのグローバルポリシーの伝播は、結果的に整合性のある操作です。この設計では、マルチリージョン構成でわずかな遅延が発生する可能性があります。

サービス制御ポリシーを通じてガードレールを作成する

クロスアカウントロールを使用すると、事前トレーニングされたマネージド AI リソースを共有するための安全なメカニズムが作成されます。しかし、その役割のポリシーが寛容すぎる場合はどうなるのでしょうか? これらのリスクを軽減するには、サービスコントロールポリシー (SCP) を使用して、アカウント全体にアクセス許可のガードレールを設定する。ガードレールは、最大権限 IAM ID で使用できます。これらの機能により、モデル消費者アカウントが共有 Amazon Rekognition エンドポイントを停止するなどの行為を防ぐことができます。適切なガードレール要件を定義した後、組織内の組織単位複数のアカウントにわたるこれらのポリシーを一元管理できるようになります。

{ "Version": "2012-10-17", "Statement": [ { "Sid": "DenyModifyingRekgnotionProjects", "Effect": "Deny", "Action": [ "rekognition:CreateProject*", "rekognition:DeleteProject*", "rekognition:StartProject*", "rekognition:StopProject*", ], "Resource": [ “arn:aws:rekognition:*:*:project/* ] } ]
}

また、検出制御を構成してその構成を監視し、コンプライアンスから逸脱しないようにすることもできます。 AWS IAMアクセスアナライザー組織全体のポリシーの評価と、未使用のアクセス許可のレポートをサポートします。さらに、 AWSConfig AWS リソースの構成の評価、監査、評価が可能になります。この機能は、次のような標準的なセキュリティおよびコンプライアンスの要件をサポートします。検証と修復 S3 バケットの暗号化設定。

まとめ

コンピュータービジョン、翻訳、不正行為検出などの ML 機能を追加するには、すぐに使えるソリューションが必要です。また、品質管理、コンプライアンス、規制の目的で、さまざまな環境を分離するセキュリティ境界も必要です。 AWS の事前トレーニング済み AI サービスと AWS Control Tower は、その機能を簡単にアクセスでき安全な方法で提供します。

AWS の事前トレーニング済み AI サービスは現在、トレーニング済みのカスタムモデルを AWS アカウント間でコピーすることをサポートしていません。このようなメカニズムが存在するまでは、同じデータセットを使用して各 AWS アカウントでモデルを再トレーニングする必要があります。この投稿では、IAM クロスアカウントポリシーを使用して、堅牢なセキュリティ制御を維持しながらモデルエンドポイントを共有する代替設計アプローチを示します。さらに、余分なトレーニングジョブに対する支払いを停止することもできます。クロスアカウントポリシーの詳細については、次を参照してください。 IAMチュートリアル：IAMロールを使用してAWSアカウント間でアクセスを委任する.

著者について

ネイト・バッハマイヤー は AWS のシニアソリューションアーキテクトで、一度に XNUMX つのクラウド統合をしながらニューヨークを遊牧的に探索しています。彼は顧客のワークロードの移行と最新化を専門としています。これに加えて、ネイトはフルタイムの学生であり、XNUMX 人の子供がいます。

マリオ・ブルゴイン AWS のシニアパートナーソリューションアーキテクト、AI/ML スペシャリスト、および MLOps のグローバルテクノロジーリードです。彼は、クラウドに AI ソリューションを導入する企業顧客やパートナーと協力しています。彼は、ビッグデータ用の最初の商用機械学習システムの 30 つを作成したことから始まり、スタートアップや企業で機械学習と AI に XNUMX 年以上の経験を持っています。マリオは残りの時間を、XNUMX 台のベルギー製タービュレンで遊んだり、家族のために夕食を作ったり、数学や宇宙論を学んだりして過ごしています。

ティム・マーフィー は、AWS のシニアソリューションアーキテクトであり、さまざまな業界の企業顧客と協力して、クラウドでビジネスベースのソリューションを構築しています。彼は過去 XNUMX 年間、新興企業、非営利企業、営利企業、政府機関と協力してインフラストラクチャを大規模に展開してきました。テクノロジーをいじっていない余暇には、彼が地球の遠く離れた場所で山をハイキングしたり、波でサーフィンをしたり、新しい街をサイクリングしたりしているのを見つけることができるでしょう。

タイムスタンプ： 2022 年 2 月 8 日

タイムスタンプ： 2022 年 3 月 3 日

プラトン再発行

Amazon SageMaker パイプラインを使用して、Amazon SageMaker Autopilot ML モデルを実験から本番環境に移行する

Exafunction は AWS Inferentia をサポートし、機械学習推論の最高の価格パフォーマンスを実現します

Amazon SageMaker Data Wrangler を使用してデータを準備し、Studio Labs を使用して ML を学習および実験する

Amazon Bedrock を使用した製品説明の生成の自動化 | アマゾンウェブサービス

AmazonTextractとAmazonPollyを使用して、視覚障害者がドキュメントを聞くことができるようにします

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

概要