Amazon SageMaker Ground Truth Plus での数クリックのセグメンテーション マスクのラベル付け

Amazon SageMaker Ground Truth Plus での数クリックのセグメンテーション マスクのラベル付け

Amazon SageMaker グラウンド トゥルース プラス は、機械学習 (ML) アプリケーションのデータに簡単にラベルを付けることができるマネージド データ ラベル サービスです。 一般的なユース ケースの 2 つはセマンティック セグメンテーションです。これは、画像内の個々のピクセルにクラス ラベルを割り当てるコンピューター ビジョン ML 手法です。 たとえば、移動中の車両によってキャプチャされたビデオ フレームでは、クラス ラベルに車両、歩行者、道路、信号機、建物、または背景を含めることができます。 画像内のさまざまなオブジェクトの位置を高精度に把握できるため、自律走行車やロボット工学の認識システムの構築によく使用されます。 セマンティック セグメンテーション用の ML モデルを構築するには、まず大量のデータをピクセル レベルでラベル付けする必要があります。 このラベル付けプロセスは複雑です。 熟練したラベラーとかなりの時間が必要です。画像によっては、正確にラベルを付けるのに最大 XNUMX 時間以上かかる場合があります。

2019年には、 Auto-segment for Ground Truth と呼ばれる ML を利用したインタラクティブなラベル付けツールをリリースしました これにより、高品質のセグメンテーション マスクをすばやく簡単に作成できます。 詳細については、次を参照してください。 自動セグメンテーション ツール. この機能は、オブジェクトの上、左、下、および右端の「極値」をクリックできるようにすることで機能します。 バックグラウンドで実行されている ML モデルは、このユーザー入力を取り込み、Ground Truth ラベル付けツールですぐにレンダリングされる高品質のセグメンテーション マスクを返します。 ただし、この機能では XNUMX つのクリックしか配置できません。 場合によっては、ML で生成されたマスクが、エッジが不明瞭なオブジェクトの境界周辺や、色、彩度、または影が周囲に溶け込んでいる場所など、画像の特定の部分を誤って見逃してしまうことがあります。

柔軟な数の修正クリックによる極端なポイントクリック

ツールが強化され、境界点を追加でクリックできるようになりました。これにより、ML モデルにリアルタイムのフィードバックが提供されます。 これにより、より正確なセグメンテーション マスクを作成できます。 次の例では、影の近くの境界が弱いため、最初のセグメンテーション結果は正確ではありません。 重要なのは、このツールがリアルタイムのフィードバックを可能にするモードで動作することです。一度にすべてのポイントを指定する必要はありません。 代わりに、最初にマウスを XNUMX 回クリックすると、ML モデルがトリガーされてセグメンテーション マスクが生成されます。 次に、このマスクを検査し、潜在的な不正確さを特定し、その後、モデルを正しい結果に「微調整」するために必要に応じて追加のクリックを配置できます。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。

以前のラベリング ツールでは、正確に XNUMX 回のマウス クリック (赤い点) を配置できました。 最初のセグメンテーションの結果 (赤い影付きの領域) は、影 (赤いマスクの左下) の近くの境界が弱いため、正確ではありません。

強化されたラベリング ツールを使用すると、ユーザーは最初にマウスを XNUMX 回クリックします (上の図の赤い点)。 次に、結果のセグメンテーション マスクを検査する機会があります (上の図の赤い網掛け部分)。 追加のマウス クリック (下の図の緑色の点) を行うと、モデルがマスクを調整できます (下の図の赤い網掛け部分)。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。

ツールの元のバージョンと比較して、強化されたバージョンでは、オブジェクトが変形可能で、凸状ではなく、形状や外観が異なる場合に改善された結果が得られます。

最初にベースライン ツールを実行して (100 回の極端なクリックのみ)、サンプル データに対するこの改善されたツールのパフォーマンスをシミュレートしてセグメンテーション マスクを生成し、セグメンテーション マスクの精度の一般的な尺度であるその平均 Intersection over Union (mIoU) を評価しました。 次に、シミュレートされた修正クリックを適用し、シミュレートされた各クリック後の mIoU の改善を評価しました。 次の表は、これらの結果をまとめたものです。 最初の行は mIoU を示し、9 番目の行はエラー (XNUMX% から mIoU を差し引いた値) を示します。 マウスを XNUMX 回クリックするだけで、このタスクのエラーを XNUMX% 減らすことができます。

. . 修正クリック数 .
. ベースライン 1 2 3 4 5
みお 72.72 76.56 77.62 78.89 80.57 81.73
エラー 視聴者の38%が 視聴者の38%が 視聴者の38%が 視聴者の38%が 視聴者の38%が 視聴者の38%が

Ground Truth およびパフォーマンス プロファイリングとの統合

このモデルを Ground Truth と統合するには、次の図に示す標準的なアーキテクチャ パターンに従います。 まず、ML モデルを Docker イメージに構築し、それを Amazon エラスティック コンテナ レジストリ (Amazon ECR) は、コンテナ イメージの保存、共有、デプロイを容易にする完全マネージド型の Docker コンテナ レジストリです。 を使用して SageMaker 推論ツールキット Docker イメージを構築することで、モデル サービスのベスト プラクティスを簡単に使用して、低レイテンシの推論を実現できます。 次に、 アマゾンセージメーカー モデルをホストするリアルタイム エンドポイント。 を紹介します AWSラムダ SageMaker エンドポイントの前でプロキシとして機能し、さまざまなタイプのデータ変換を提供します。 最後に、使用します アマゾンAPIゲートウェイ バックエンドに安全な認証を提供するために、フロントエンドであるグラウンド トゥルース ラベル付けアプリケーションと統合する方法として。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。

専用の ML ツールの独自のユースケースでこの一般的なパターンに従い、それらをカスタム Ground Truth タスク UI と統合することができます。 詳細については、次を参照してください。 Amazon SageMaker Ground Truthでカスタムデータラベル付けワークフローを構築する.

このアーキテクチャをプロビジョニングし、 AWSクラウド開発キット (AWS CDK) を使用して、さまざまな SageMaker インスタンス タイプでモデルのレイテンシー特性を評価しました。 SageMaker リアルタイム推論エンドポイントを使用してモデルを提供するため、これは非常に簡単です。 SageMaker リアルタイム推論エンドポイントは、 アマゾンクラウドウォッチ メモリ使用率やモデル レイテンシなどのメトリクスをセットアップ不要で発行します ( SageMakerエンドポイント呼び出しメトリクス 詳細については)。

次の図では、SageMaker リアルタイム推論エンドポイントによってネイティブに出力された ModelLatency メトリクスを示しています。 CloudWatch のさまざまなメトリクス数学関数を簡単に使用して、p50 や p90 レイテンシーなどのレイテンシー パーセンタイルを表示できます。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。

次の表は、p2.xlarge、p3.2xlarge、および g4dn.xlarge の 3.2 つのインスタンス タイプのセマンティック セグメンテーション用の拡張エクストリーム クリック ツールの結果をまとめたものです。 p4xlarge インスタンスは最小のレイテンシーを提供しますが、g4dn.xlarge インスタンスは最高のコスト対パフォーマンス比を提供します。 g8dn.xlarge インスタンスは、p35xlarge インスタンスよりも 3.2% 遅い (81 ミリ秒) だけですが、p3.2xlarge インスタンスよりも時間ベースで XNUMX% 低コストです ( Amazon SageMakerの価格 SageMaker インスタンスのタイプと料金の詳細について)。

SageMaker インスタンスタイプ p90 レイテンシ (ミリ秒)
1 p2.xlarge 751
2 p3.2xラージ 424
3 g4dn.xlarge 459

まとめ

この投稿では、セマンティック セグメンテーション アノテーション タスクのグラウンド トゥルース自動セグメント機能の拡張機能を紹介しました。 ツールの元のバージョンでは、モデルをトリガーして高品質のセグメンテーション マスクを提供する正確に XNUMX 回のマウス クリックを行うことができますが、拡張機能を使用すると、修正クリックを行うことができ、それによって ML モデルを更新およびガイドして、より良い予測を行うことができます。 また、対話型ツールを Ground Truth のラベル付け UI にデプロイして統合するために使用できる基本的なアーキテクチャ パターンも紹介しました。 最後に、モデルのレイテンシーをまとめ、SageMaker リアルタイム推論エンドポイントを使用するとモデルのパフォーマンスを簡単に監視できることを示しました。

このツールがどのようにラベリング コストを削減し、精度を向上させるかについて詳しくは、次の Web サイトをご覧ください。 Amazon SageMaker データのラベル付け 今日からコンサルテーションを開始します。


著者について

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。ジョナサン・バック 機械学習と分散システムの交差点で働くアマゾン ウェブ サービスのソフトウェア エンジニアです。 彼の仕事には、機械学習モデルの製品化と、機械学習を活用した新しいソフトウェア アプリケーションの開発が含まれており、最新の機能を顧客に提供しています。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーション マスクのラベル付けが可能になります。垂直検索。あい。リー・エラン・リー Humain-in-the-Loop サービス、AWS AI、Amazon の応用科学マネージャーです。 彼の研究対象は、3D 深層学習、および視覚と言語表現の学習です。 以前は、Alexa AI のシニア サイエンティスト、Scale AI の機械学習責任者、Pony.ai のチーフ サイエンティストを務めていました。 それ以前は、Uber ATG の認識チームおよび Uber の機械学習プラットフォーム チームに所属し、自動運転のための機械学習、機械学習システム、および AI の戦略的イニシアチブに取り組んでいました。 彼はベル研究所でキャリアをスタートさせ、コロンビア大学の非常勤教授を務めました。 彼は ICML'17 と ICCV'19 でチュートリアルを共同で教え、NeurIPS、ICML、CVPR、ICCV で自動運転のための機械学習、3D ビジョンとロボティクス、機械学習システム、敵対的機械学習に関するいくつかのワークショップを共催しました。 コーネル大学でコンピュータ サイエンスの博士号を取得しています。 彼は ACM フェローおよび IEEE フェローです。

タイムスタンプ:

より多くの AWS機械学習