エッジでの視覚的な品質検査のためのエンドツーエンドの MLOps パイプラインを構築する – パート 1

プラトン再発行

フォロワー： 0

実稼働環境での機械学習 (ML) モデルのデプロイを成功させるには、エンドツーエンドの ML パイプラインに大きく依存します。このようなパイプラインの開発は困難な場合がありますが、問題を扱う場合はさらに複雑になります。エッジ ML の使用例。エッジでの機械学習は、ML モデルをローカルで実行する機能をエッジデバイスにもたらす概念です。これらのモデルをエッジで展開、監視、保守するには、堅牢な MLOps パイプラインが必要です。 MLOps パイプラインを使用すると、データのラベル付けからモデルのトレーニングとデプロイに至るまで、ML ライフサイクル全体を自動化できます。

エッジに MLOps パイプラインを実装すると、さらに複雑さが生じ、運用オーバーヘッドが増加するため、自動化、統合、メンテナンスのプロセスがより困難になります。ただし、次のような専用サービスを使用すると、アマゾンセージメーカーおよび AWS IoT Greengrass を使用すると、この労力を大幅に削減できます。このシリーズでは、SageMaker、AWS IoT Greengrass、および AWSクラウド開発キット（AWS CDK）。

この投稿では、MLOps パイプラインアーキテクチャ全体の設計に焦点を当てます。第2部および第3部このシリーズでは、個々のコンポーネントの実装に焦点を当てます。付属のサンプル実装を提供しています。 GitHubリポジトリあなた自身を試してみてください。 AWS のエッジで MLOps を使い始めたばかりの場合は、を参照してください。 Amazon SageMaker Edge Manager と AWS IoT Greengrass を使用したエッジでの MLOps 概要とリファレンスアーキテクチャについては、

使用例: 金属タグの品質検査

ML エンジニアとして、取り組んでいるビジネスケースを理解することが重要です。 MLOps パイプラインアーキテクチャに入る前に、この投稿のサンプルユースケースを見てみましょう。カスタマイズされた荷物タグを作成するために金属タグを彫刻するメーカーの生産ラインを想像してください。未加工の金属タグに傷などの欠陥がないか手動で検査する必要があるため、品質保証プロセスにはコストがかかります。このプロセスをより効率的にするために、ML を使用してプロセスの早い段階で欠陥のあるタグを検出します。これは、生産プロセスの後の段階で、コストのかかる欠陥を回避するのに役立ちます。モデルは、傷などの可能性のある欠陥をほぼリアルタイムで特定し、マークする必要があります。製造現場の環境では、多くの場合、接続がない場合や帯域幅の制約、遅延の増加に対処する必要があります。したがって、製造現場でローカルに推論を実行し、接続に関する要件を軽減できる、視覚的な品質検査用のオンエッジ ML ソリューションを実装したいと考えています。例をわかりやすくするために、検出された傷を境界ボックスでマークするモデルをトレーニングします。次の画像は、XNUMX つのスクラッチがマークされたデータセットのタグの例です。

パイプラインアーキテクチャの定義

これで、ユースケースと、エッジでのオブジェクト検出を中心とした、私たちが対処しようとしている特定の ML 問題が明確になりました。ここで、MLOps パイプラインのアーキテクチャを作成します。現段階では、まだテクノロジーや特定のサービスには注目していませんが、むしろパイプラインの高レベルのコンポーネントに注目しています。迅速に再トレーニングしてデプロイするには、データのラベル付けからトレーニング、推論まで、エンドツーエンドのプロセス全体を自動化する必要があります。ただし、エッジケース向けのパイプラインの設定を特に困難にするいくつかの課題があります。

このプロセスのさまざまな部分を構築するには、さまざまなスキルセットが必要です。たとえば、データのラベル付けとトレーニングにはデータサイエンスに重点が置かれており、エッジ展開にはモノのインターネット (IoT) の専門家が必要であり、プロセス全体の自動化は通常、DevOps スキルセットを持つ担当者によって行われます。
組織によっては、このプロセス全体が複数のチームによって実装される場合もあります。私たちのユースケースでは、別々のチームがラベル付け、トレーニング、展開を担当するという想定に基づいて作業しています。
役割とスキルセットが増えると、ツールやプロセスの要件も異なります。たとえば、データサイエンティストは、使い慣れたノートブック環境を監視して作業したいと考えるかもしれません。 MLOps エンジニアは、コードとしてのインフラストラクチャ (IaC) ツールを使用して作業することを望んでおり、 AWSマネジメントコンソール.

これはパイプラインアーキテクチャにとって何を意味するのでしょうか?

まず、さまざまなチームが独立して作業できるようにするエンドツーエンドシステムの主要コンポーネントを明確に定義することが重要です。次に、コラボレーションの効率を高めるために、チーム間のインターフェースを明確に定義する必要があります。これらのインターフェイスは、チーム間の混乱を最小限に抑えるのに役立ち、定義されたインターフェイスに従っている限り、必要に応じて内部プロセスを変更できるようになります。次の図は、これがコンピュータービジョンパイプラインでどのようになるかを示しています。

MLOps パイプラインの全体的なアーキテクチャを詳しく調べてみましょう。

このプロセスは、初期トレーニングデータセットを形成するために実稼働環境でエッジカメラデバイスを使用してキャプチャされた金属タグの生画像の収集から始まります。
次のステップでは、これらの画像にラベルを付け、境界ボックスを使用して欠陥をマークします。ラベル付きデータセットをバージョン管理し、使用されたトレーニングデータのトレーサビリティと説明責任を確保することが不可欠です。
ラベル付きデータセットを取得したら、モデルのトレーニング、微調整、評価、バージョン管理を進めることができます。
モデルのパフォーマンスに満足したら、モデルをエッジデバイスにデプロイし、エッジでライブ推論を実行できます。
モデルが運用環境で動作している間、エッジカメラデバイスは、これまでに見たことのない欠陥やエッジケースを含む貴重な画像データを生成します。このデータを使用して、モデルのパフォーマンスをさらに向上させることができます。これを達成するために、モデルが低い信頼度で予測した画像、または誤った予測を行った画像を保存します。これらの画像は生のデータセットに再び追加され、プロセス全体が再度開始されます。

生の画像データ、ラベル付きデータセット、トレーニングされたモデルが、個別のパイプライン間の明確に定義されたインターフェイスとして機能することに注意することが重要です。 MLOps エンジニアとデータサイエンティストは、これらのアーティファクトを一貫して生成する限り、パイプライン内のテクノロジーを柔軟に選択できます。最も重要なことは、閉じたフィードバックループを確立したことです。本番環境で行われた誤った予測または信頼性の低い予測を使用して、データセットを定期的に強化し、モデルを自動的に再トレーニングして強化することができます。

ターゲットアーキテクチャ

高レベルのアーキテクチャが確立されたので、次はさらに XNUMX レベル深く進み、AWS のサービスを使用してこれを構築する方法を検討します。この投稿で示されているアーキテクチャは、データサイエンスプロセス全体を完全に制御することを前提としていることに注意してください。ただし、エッジでの品質検査を始めたばかりの場合は、次のことをお勧めします。アマゾンルックアウトフォービジョン。これにより、ML コードを構築、保守、理解することなく、独自の品質検査モデルをトレーニングする方法が提供されます。詳細については、以下を参照してください。 Amazon Lookout for Visionは、エッジでの製品欠陥の目視検査をサポートするようになりました.

ただし、完全に制御したい場合は、次の図にアーキテクチャがどのようになるかを示します。

前と同様に、ワークフローを段階的に説明し、どの AWS サービスが要件に適合するかを特定してみましょう。

Amazon シンプルストレージサービス (Amazon S3) は、低コストのストレージソリューションを提供するため、生の画像データを保存するために使用されます。
ラベル付けワークフローは、次を使用して調整されます。 AWSステップ関数は、ラベル付けワークフローのステップを簡単に調整できるサーバーレスワークフローエンジンです。このワークフローの一部として、 Amazon SageMakerグラウンドトゥルースラベル付けジョブと管理された人間の労働力を使用して、ラベル付けを完全に自動化します。 AWSラムダデータを準備し、ラベル付けジョブを開始し、ラベルを保存するために使用されます。 Amazon SageMaker フィーチャーストア.
SageMaker Feature Store はラベルを保存します。これにより、機能を一元管理して共有できるようになり、組み込みのデータバージョン管理機能が提供されるため、パイプラインがより堅牢になります。
を使用してモデルの構築とトレーニングパイプラインを調整します。 AmazonSageMakerパイプライン。組み込みのステップを介して必要な他の SageMaker 機能と統合されます。 SageMaker トレーニングジョブモデルのトレーニングを自動化するために使用されます。 SageMaker処理ジョブデータを準備し、モデルのパフォーマンスを評価するために使用されます。この例では、ウルトラリティクス YOLOv8 物体検出モデルをトレーニングしてエクスポートするための Python パッケージとモデルアーキテクチャ ONNX 移植性を考慮した ML モデル形式。
パフォーマンスが許容できる場合、トレーニングされたモデルは次の場所に登録されます。 Amazon SageMaker モデルレジストリ増分バージョン番号が付加されます。これは、モデルのトレーニングとエッジ展開のステップの間のインターフェイスとして機能します。モデルの承認状況もここで管理します。使用されている他のサービスと同様に、フルマネージドであるため、独自のインフラストラクチャの実行に注意を払う必要はありません。
エッジ展開ワークフローは、ラベル付けワークフローと同様に、Step Functions を使用して自動化されます。 Step Functions の API 統合を使用すると、AWS IoT Greengrass などのさまざまな必要な AWS サービス API を簡単に呼び出して、新しいモデルコンポーネントを作成し、その後コンポーネントをエッジデバイスにデプロイできます。
AWS IoT Greengrass はエッジデバイスのランタイム環境として使用されます。これは、エッジでのモデルと推論コンポーネントの展開ライフサイクルを管理します。これにより、単純な API 呼び出しを使用して、モデルと推論コンポーネントの新しいバージョンを簡単にデプロイできるようになります。さらに、エッジの ML モデルは通常、単独では実行されません。さまざまなものを使用できます AWS およびコミュニティ他のサービスに接続するための AWS IoT Greengrass のコンポーネントを提供しました。

ここで説明したアーキテクチャは、前に示した高レベルのアーキテクチャに似ています。 Amazon S3、SageMaker Feature Store、および SageMaker Model Registry は、異なるパイプライン間のインターフェイスとして機能します。ソリューションの実行と運用にかかる労力を最小限に抑えるために、可能な限りマネージドサービスとサーバーレスサービスを使用します。

堅牢な CI/CD システムへの統合

データのラベル付け、モデルのトレーニング、エッジ展開の手順は、当社のソリューションの中核です。そのため、これらの部分の基礎となるコードまたはデータに関連する変更は、オーケストレーションプロセス全体の新たな実行をトリガーする必要があります。これを実現するには、このパイプラインを CI/CD システムに統合する必要があります。これにより、バージョン管理されたコードリポジトリから実稼働環境にコードとインフラストラクチャの変更を自動的にデプロイできるようになります。前のアーキテクチャと同様に、ここでもチームの自律性が重要な側面です。次の図は、AWS のサービスを使用するとこれがどのようになるかを示しています。

CI/CD アーキテクチャを見てみましょう。

AWS コードコミット Git リポジトリとして機能します。わかりやすくするために、提供されたサンプルでは、単一の git リポジトリ内のサブフォルダーを介して個別の部分 (ラベル付け、モデルトレーニング、エッジデプロイメント) を分離しました。実際のシナリオでは、各チームがパーツごとに異なるリポジトリを使用する可能性があります。
インフラストラクチャのデプロイは AWS CDK を使用して自動化され、各部分 (ラベル付け、トレーニング、エッジ) が独自の AWS CDK アプリを取得して、独立したデプロイが可能になります。
AWS CDK パイプライン機能では、 AWS コードパイプラインインフラストラクチャとコードのデプロイメントを自動化します。
AWS CDK は、ステップごとに XNUMX つのコードパイプライン (アセットパイプラインとワークフローパイプライン) をデプロイします。アセットに変更がない場合 (トレーニングに使用できる新しいイメージがある場合など) に備えて、ワークフローをアセットのデプロイメントから分離し、ワークフローを個別に開始できるようにしました。
- アセットコードパイプラインは、ワークフローが正常に実行されるために必要なすべてのインフラストラクチャをデプロイします。 AWS IDおよびアクセス管理 (IAM) ロール、Lambda 関数、トレーニング中に使用されるコンテナーイメージ。
- ワークフローコードパイプラインは、実際のラベル付け、トレーニング、またはエッジデプロイメントのワークフローを実行します。
アセットパイプラインは、前のワークフローパイプラインが完了したときだけでなく、コミット時にも自動的にトリガーされます。
プロセス全体は、アマゾンイベントブリッジ定期的な再トレーニングのルール。

CI/CD の統合により、エンドツーエンドのチェーン全体が完全に自動化されました。パイプラインは、Git リポジトリ内のコードが変更されるたびに、またデータ変更に対応するスケジュールに従ってトリガーされます。

先に考えます

説明されているソリューションアーキテクチャは、エッジでエンドツーエンドの MLOps パイプラインを構築するための基本コンポーネントを表しています。ただし、要件によっては、追加機能の追加を検討する場合があります。以下にいくつかの例を示します。

まとめ

この投稿では、AWS のサービスを使用してエッジで視覚的な品質検査を行うためのエンドツーエンドの MLOps パイプラインを構築するためのアーキテクチャの概要を説明しました。このアーキテクチャは、データのラベル付け、モデル開発、エッジ展開を含むプロセス全体を合理化し、モデルの新しいバージョンを迅速かつ確実にトレーニングして実装できるようにします。サーバーレスおよびマネージドサービスを使用すると、インフラストラクチャの管理ではなく、ビジネス価値の提供に重点を置くことができます。

In 第2部このシリーズでは、さらに XNUMX レベル深く掘り下げて、このアーキテクチャの実装、特にラベル付けとモデル構築を詳しく見ていきます。コードに直接ジャンプしたい場合は、付属のコードをチェックしてください。 GitHubレポ.

著者について

マイケル・ロート AWS のシニアソリューションアーキテクトとして、ドイツの製造業の顧客が AWS テクノロジーを通じてビジネス上の課題を解決できるようサポートしています。仕事と家族のほかに、スポーツカーに興味があり、イタリアンコーヒーを楽しんでいます。

イェルク・ヴェールレ AWS のソリューションアーキテクトとして、ドイツの製造業の顧客と協力しています。 Joerg は自動化に情熱を持っており、AWS 入社以前はソフトウェア開発者、DevOps エンジニア、サイト信頼性エンジニアとして働いてきました。雲を超えて、彼は野心的なランナーであり、家族と充実した時間を楽しんでいます。 DevOps に挑戦したい場合、またはランニングに行きたい場合は、彼に知らせてください。

ヨハネス・ランガー AWS のシニアソリューションアーキテクトで、ドイツの企業顧客と協力しています。 Johannes は、実際のビジネス上の問題を解決するために機械学習を適用することに情熱を持っています。私生活では、ヨハネスは家の改善プロジェクトに取り組み、家族と屋外で時間を過ごすことを楽しんでいます。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/build-an-end-to-end-mlops-pipeline-for-visual-quality-inspection-at-the-edge-part-1/

タイムスタンプ： 2023 年 10 月 2 日

プラトン再発行

新しい Amazon HealthLake 機能により、次世代のイメージングソリューションと精密な健康分析が可能になります

イノベーションのロックを解除: AWS と Anthropic が一緒に生成 AI の限界を押し広げます |アマゾンウェブサービス

AmazonTranslateで冒とく的な表現のマスキングを適用する

臨床レポート要約のための生成 AI 技術の評価 |アマゾンウェブサービス

Contentful と Amazon Bedrock でコンテンツ編集を強化 |アマゾンウェブサービス

Amazon SageMaker Pipelines と Amazon SageMaker SDK の新機能

AWS と Hugging Face が協力して、ジェネレーティブ AI をよりアクセスしやすく、費用対効果の高いものにします

Comprehend フライホイールを使用して、Amazon Comprehend カスタムモデルの継続的な学習を簡素化する

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー