Amazon SageMaker Ground Truth Plus での数クリックのセグメンテーションマスクラベル付け

プラトン再発行

フォロワー： 0

Amazon SageMaker グラウンドトゥルースプラスは、機械学習 (ML) アプリケーションのデータに簡単にラベルを付けることができるマネージドデータラベルサービスです。一般的なユースケースの 2 つはセマンティックセグメンテーションです。これは、画像内の個々のピクセルにクラスラベルを割り当てるコンピュータービジョン ML 手法です。たとえば、移動中の車両によってキャプチャされたビデオフレームでは、クラスラベルに車両、歩行者、道路、信号機、建物、または背景を含めることができます。画像内のさまざまなオブジェクトの位置を高精度に把握できるため、自律走行車やロボット工学の認識システムの構築によく使用されます。セマンティックセグメンテーション用の ML モデルを構築するには、まず大量のデータをピクセルレベルでラベル付けする必要があります。このラベル付けプロセスは複雑です。熟練したラベラーとかなりの時間が必要です。画像によっては、正確にラベルを付けるのに最大 XNUMX 時間以上かかる場合があります。

2019年には、 Auto-segment for Ground Truth と呼ばれる ML を利用したインタラクティブなラベル付けツールをリリースしましたこれにより、高品質のセグメンテーションマスクをすばやく簡単に作成できます。詳細については、次を参照してください。自動セグメンテーションツール. この機能は、オブジェクトの上、左、下、および右端の「極値」をクリックできるようにすることで機能します。バックグラウンドで実行されている ML モデルは、このユーザー入力を取り込み、Ground Truth ラベル付けツールですぐにレンダリングされる高品質のセグメンテーションマスクを返します。ただし、この機能では XNUMX つのクリックしか配置できません。場合によっては、ML で生成されたマスクが、エッジが不明瞭なオブジェクトの境界周辺や、色、彩度、または影が周囲に溶け込んでいる場所など、画像の特定の部分を誤って見逃してしまうことがあります。

柔軟な数の修正クリックによる極端なポイントクリック

ツールが強化され、境界点を追加でクリックできるようになりました。これにより、ML モデルにリアルタイムのフィードバックが提供されます。これにより、より正確なセグメンテーションマスクを作成できます。次の例では、影の近くの境界が弱いため、最初のセグメンテーション結果は正確ではありません。重要なのは、このツールがリアルタイムのフィードバックを可能にするモードで動作することです。一度にすべてのポイントを指定する必要はありません。代わりに、最初にマウスを XNUMX 回クリックすると、ML モデルがトリガーされてセグメンテーションマスクが生成されます。次に、このマスクを検査し、潜在的な不正確さを特定し、その後、モデルを正しい結果に「微調整」するために必要に応じて追加のクリックを配置できます。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーションマスクのラベル付けが可能になります。垂直検索。あい。

以前のラベリングツールでは、正確に XNUMX 回のマウスクリック (赤い点) を配置できました。最初のセグメンテーションの結果 (赤い影付きの領域) は、影 (赤いマスクの左下) の近くの境界が弱いため、正確ではありません。

強化されたラベリングツールを使用すると、ユーザーは最初にマウスを XNUMX 回クリックします (上の図の赤い点)。次に、結果のセグメンテーションマスクを検査する機会があります (上の図の赤い網掛け部分)。追加のマウスクリック (下の図の緑色の点) を行うと、モデルがマスクを調整できます (下の図の赤い網掛け部分)。

ツールの元のバージョンと比較して、強化されたバージョンでは、オブジェクトが変形可能で、凸状ではなく、形状や外観が異なる場合に改善された結果が得られます。

最初にベースラインツールを実行して (100 回の極端なクリックのみ)、サンプルデータに対するこの改善されたツールのパフォーマンスをシミュレートしてセグメンテーションマスクを生成し、セグメンテーションマスクの精度の一般的な尺度であるその平均 Intersection over Union (mIoU) を評価しました。次に、シミュレートされた修正クリックを適用し、シミュレートされた各クリック後の mIoU の改善を評価しました。次の表は、これらの結果をまとめたものです。最初の行は mIoU を示し、9 番目の行はエラー (XNUMX% から mIoU を差し引いた値) を示します。マウスを XNUMX 回クリックするだけで、このタスクのエラーを XNUMX% 減らすことができます。

.	.	修正クリック数	.
.	ベースライン	1	2	3	4	5
みお	72.72	76.56	77.62	78.89	80.57	81.73
エラー	視聴者の３８%が	視聴者の３８%が	視聴者の３８%が	視聴者の３８%が	視聴者の３８%が	視聴者の３８%が

Ground Truth およびパフォーマンスプロファイリングとの統合

このモデルを Ground Truth と統合するには、次の図に示す標準的なアーキテクチャパターンに従います。まず、ML モデルを Docker イメージに構築し、それを Amazon エラスティックコンテナレジストリ (Amazon ECR) は、コンテナイメージの保存、共有、デプロイを容易にする完全マネージド型の Docker コンテナレジストリです。を使用して SageMaker 推論ツールキット Docker イメージを構築することで、モデルサービスのベストプラクティスを簡単に使用して、低レイテンシの推論を実現できます。次に、アマゾンセージメーカーモデルをホストするリアルタイムエンドポイント。を紹介します AWSラムダ SageMaker エンドポイントの前でプロキシとして機能し、さまざまなタイプのデータ変換を提供します。最後に、使用しますアマゾンAPIゲートウェイバックエンドに安全な認証を提供するために、フロントエンドであるグラウンドトゥルースラベル付けアプリケーションと統合する方法として。

専用の ML ツールの独自のユースケースでこの一般的なパターンに従い、それらをカスタム Ground Truth タスク UI と統合することができます。詳細については、次を参照してください。 Amazon SageMaker Ground Truthでカスタムデータラベル付けワークフローを構築する.

このアーキテクチャをプロビジョニングし、 AWSクラウド開発キット (AWS CDK) を使用して、さまざまな SageMaker インスタンスタイプでモデルのレイテンシー特性を評価しました。 SageMaker リアルタイム推論エンドポイントを使用してモデルを提供するため、これは非常に簡単です。 SageMaker リアルタイム推論エンドポイントは、アマゾンクラウドウォッチメモリ使用率やモデルレイテンシなどのメトリクスをセットアップ不要で発行します ( SageMakerエンドポイント呼び出しメトリクス詳細については）。

次の図では、SageMaker リアルタイム推論エンドポイントによってネイティブに出力された ModelLatency メトリクスを示しています。 CloudWatch のさまざまなメトリクス数学関数を簡単に使用して、p50 や p90 レイテンシーなどのレイテンシーパーセンタイルを表示できます。

次の表は、p2.xlarge、p3.2xlarge、および g4dn.xlarge の 3.2 つのインスタンスタイプのセマンティックセグメンテーション用の拡張エクストリームクリックツールの結果をまとめたものです。 p4xlarge インスタンスは最小のレイテンシーを提供しますが、g4dn.xlarge インスタンスは最高のコスト対パフォーマンス比を提供します。 g8dn.xlarge インスタンスは、p35xlarge インスタンスよりも 3.2% 遅い (81 ミリ秒) だけですが、p3.2xlarge インスタンスよりも時間ベースで XNUMX% 低コストです ( Amazon SageMakerの価格 SageMaker インスタンスのタイプと料金の詳細について)。

	SageMaker インスタンスタイプ	p90 レイテンシ (ミリ秒)
1	p2.xlarge	751
2	p3.2xラージ	424
3	g4dn.xlarge	459

まとめ

この投稿では、セマンティックセグメンテーションアノテーションタスクのグラウンドトゥルース自動セグメント機能の拡張機能を紹介しました。ツールの元のバージョンでは、モデルをトリガーして高品質のセグメンテーションマスクを提供する正確に XNUMX 回のマウスクリックを行うことができますが、拡張機能を使用すると、修正クリックを行うことができ、それによって ML モデルを更新およびガイドして、より良い予測を行うことができます。また、対話型ツールを Ground Truth のラベル付け UI にデプロイして統合するために使用できる基本的なアーキテクチャパターンも紹介しました。最後に、モデルのレイテンシーをまとめ、SageMaker リアルタイム推論エンドポイントを使用するとモデルのパフォーマンスを簡単に監視できることを示しました。

このツールがどのようにラベリングコストを削減し、精度を向上させるかについて詳しくは、次の Web サイトをご覧ください。 Amazon SageMaker データのラベル付け今日からコンサルテーションを開始します。

著者について

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーションマスクのラベル付けが可能になります。垂直検索。あい。 ジョナサン・バック 機械学習と分散システムの交差点で働くアマゾンウェブサービスのソフトウェアエンジニアです。彼の仕事には、機械学習モデルの製品化と、機械学習を活用した新しいソフトウェアアプリケーションの開発が含まれており、最新の機能を顧客に提供しています。

Amazon SageMaker Ground Truth Plus PlatoBlockchain Data Intelligence で、数回クリックするだけでセグメンテーションマスクのラベル付けが可能になります。垂直検索。あい。 リー・エラン・リー Humain-in-the-Loop サービス、AWS AI、Amazon の応用科学マネージャーです。彼の研究対象は、3D 深層学習、および視覚と言語表現の学習です。以前は、Alexa AI のシニアサイエンティスト、Scale AI の機械学習責任者、Pony.ai のチーフサイエンティストを務めていました。それ以前は、Uber ATG の認識チームおよび Uber の機械学習プラットフォームチームに所属し、自動運転のための機械学習、機械学習システム、および AI の戦略的イニシアチブに取り組んでいました。彼はベル研究所でキャリアをスタートさせ、コロンビア大学の非常勤教授を務めました。彼は ICML'17 と ICCV'19 でチュートリアルを共同で教え、NeurIPS、ICML、CVPR、ICCV で自動運転のための機械学習、3D ビジョンとロボティクス、機械学習システム、敵対的機械学習に関するいくつかのワークショップを共催しました。コーネル大学でコンピュータサイエンスの博士号を取得しています。彼は ACM フェローおよび IEEE フェローです。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
情報源： https://aws.amazon.com/blogs/machine-learning/few-click-segmentation-mask-labeling-in-amazon-sagemaker-ground-truth-plus/

タイムスタンプ： 2023 年 3 月 13 日

タイムスタンプ： 2022 年 8 月 15 日

プラトン再発行

AmazonTextractとAmazonPollyを使用して、視覚障害者がドキュメントを聞くことができるようにします

LangChain、Amazon SageMaker JumpStart、MongoDB Atlas セマンティック検索による検索拡張生成 | アマゾンウェブサービス

SageMaker でのモデルホスティングパターン: SageMaker でのモデルのテストと更新のベストプラクティス

Snowflake をデータソースとして使用して、Amazon SageMaker で ML モデルをトレーニングする

SageMaker 自動モデル調整を使用して、公平性などの追加の目的のために ML モデルを調整する

Chronomics は、Amazon Rekognition カスタムラベルを使用して COVID-19 テスト結果を検出します

Hugging Face Transformersを使用してテキスト要約プロジェクトを設定する：パート2

Amazon Personalize のビジネスルールを使用して特定の商品を宣伝することで、おすすめをカスタマイズします

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー