Amazon SageMaker グラウンド トゥルース プラス は、機械学習 (ML) アプリケーションのデータに簡単にラベルを付けることができるマネージド データ ラベル サービスです。 一般的なユース ケースの 2 つはセマンティック セグメンテーションです。これは、画像内の個々のピクセルにクラス ラベルを割り当てるコンピューター ビジョン ML 手法です。 たとえば、移動中の車両によってキャプチャされたビデオ フレームでは、クラス ラベルに車両、歩行者、道路、信号機、建物、または背景を含めることができます。 画像内のさまざまなオブジェクトの位置を高精度に把握できるため、自律走行車やロボット工学の認識システムの構築によく使用されます。 セマンティック セグメンテーション用の ML モデルを構築するには、まず大量のデータをピクセル レベルでラベル付けする必要があります。 このラベル付けプロセスは複雑です。 熟練したラベラーとかなりの時間が必要です。画像によっては、正確にラベルを付けるのに最大 XNUMX 時間以上かかる場合があります。
2019年には、 Auto-segment for Ground Truth と呼ばれる ML を利用したインタラクティブなラベル付けツールをリリースしました これにより、高品質のセグメンテーション マスクをすばやく簡単に作成できます。 詳細については、次を参照してください。 自動セグメンテーション ツール. この機能は、オブジェクトの上、左、下、および右端の「極値」をクリックできるようにすることで機能します。 バックグラウンドで実行されている ML モデルは、このユーザー入力を取り込み、Ground Truth ラベル付けツールですぐにレンダリングされる高品質のセグメンテーション マスクを返します。 ただし、この機能では XNUMX つのクリックしか配置できません。 場合によっては、ML で生成されたマスクが、エッジが不明瞭なオブジェクトの境界周辺や、色、彩度、または影が周囲に溶け込んでいる場所など、画像の特定の部分を誤って見逃してしまうことがあります。
柔軟な数の修正クリックによる極端なポイントクリック
ツールが強化され、境界点を追加でクリックできるようになりました。これにより、ML モデルにリアルタイムのフィードバックが提供されます。 これにより、より正確なセグメンテーション マスクを作成できます。 次の例では、影の近くの境界が弱いため、最初のセグメンテーション結果は正確ではありません。 重要なのは、このツールがリアルタイムのフィードバックを可能にするモードで動作することです。一度にすべてのポイントを指定する必要はありません。 代わりに、最初にマウスを XNUMX 回クリックすると、ML モデルがトリガーされてセグメンテーション マスクが生成されます。 次に、このマスクを検査し、潜在的な不正確さを特定し、その後、モデルを正しい結果に「微調整」するために必要に応じて追加のクリックを配置できます。
以前のラベリング ツールでは、正確に XNUMX 回のマウス クリック (赤い点) を配置できました。 最初のセグメンテーションの結果 (赤い影付きの領域) は、影 (赤いマスクの左下) の近くの境界が弱いため、正確ではありません。
強化されたラベリング ツールを使用すると、ユーザーは最初にマウスを XNUMX 回クリックします (上の図の赤い点)。 次に、結果のセグメンテーション マスクを検査する機会があります (上の図の赤い網掛け部分)。 追加のマウス クリック (下の図の緑色の点) を行うと、モデルがマスクを調整できます (下の図の赤い網掛け部分)。
ツールの元のバージョンと比較して、強化されたバージョンでは、オブジェクトが変形可能で、凸状ではなく、形状や外観が異なる場合に改善された結果が得られます。
最初にベースライン ツールを実行して (100 回の極端なクリックのみ)、サンプル データに対するこの改善されたツールのパフォーマンスをシミュレートしてセグメンテーション マスクを生成し、セグメンテーション マスクの精度の一般的な尺度であるその平均 Intersection over Union (mIoU) を評価しました。 次に、シミュレートされた修正クリックを適用し、シミュレートされた各クリック後の mIoU の改善を評価しました。 次の表は、これらの結果をまとめたものです。 最初の行は mIoU を示し、9 番目の行はエラー (XNUMX% から mIoU を差し引いた値) を示します。 マウスを XNUMX 回クリックするだけで、このタスクのエラーを XNUMX% 減らすことができます。
. | . | 修正クリック数 | . | |||
. | ベースライン | 1 | 2 | 3 | 4 | 5 |
みお | 72.72 | 76.56 | 77.62 | 78.89 | 80.57 | 81.73 |
エラー | 視聴者の38%が | 視聴者の38%が | 視聴者の38%が | 視聴者の38%が | 視聴者の38%が | 視聴者の38%が |
Ground Truth およびパフォーマンス プロファイリングとの統合
このモデルを Ground Truth と統合するには、次の図に示す標準的なアーキテクチャ パターンに従います。 まず、ML モデルを Docker イメージに構築し、それを Amazon エラスティック コンテナ レジストリ (Amazon ECR) は、コンテナ イメージの保存、共有、デプロイを容易にする完全マネージド型の Docker コンテナ レジストリです。 を使用して SageMaker 推論ツールキット Docker イメージを構築することで、モデル サービスのベスト プラクティスを簡単に使用して、低レイテンシの推論を実現できます。 次に、 アマゾンセージメーカー モデルをホストするリアルタイム エンドポイント。 を紹介します AWSラムダ SageMaker エンドポイントの前でプロキシとして機能し、さまざまなタイプのデータ変換を提供します。 最後に、使用します アマゾンAPIゲートウェイ バックエンドに安全な認証を提供するために、フロントエンドであるグラウンド トゥルース ラベル付けアプリケーションと統合する方法として。
専用の ML ツールの独自のユースケースでこの一般的なパターンに従い、それらをカスタム Ground Truth タスク UI と統合することができます。 詳細については、次を参照してください。 Amazon SageMaker Ground Truthでカスタムデータラベル付けワークフローを構築する.
このアーキテクチャをプロビジョニングし、 AWSクラウド開発キット (AWS CDK) を使用して、さまざまな SageMaker インスタンス タイプでモデルのレイテンシー特性を評価しました。 SageMaker リアルタイム推論エンドポイントを使用してモデルを提供するため、これは非常に簡単です。 SageMaker リアルタイム推論エンドポイントは、 アマゾンクラウドウォッチ メモリ使用率やモデル レイテンシなどのメトリクスをセットアップ不要で発行します ( SageMakerエンドポイント呼び出しメトリクス 詳細については)。
次の図では、SageMaker リアルタイム推論エンドポイントによってネイティブに出力された ModelLatency メトリクスを示しています。 CloudWatch のさまざまなメトリクス数学関数を簡単に使用して、p50 や p90 レイテンシーなどのレイテンシー パーセンタイルを表示できます。
次の表は、p2.xlarge、p3.2xlarge、および g4dn.xlarge の 3.2 つのインスタンス タイプのセマンティック セグメンテーション用の拡張エクストリーム クリック ツールの結果をまとめたものです。 p4xlarge インスタンスは最小のレイテンシーを提供しますが、g4dn.xlarge インスタンスは最高のコスト対パフォーマンス比を提供します。 g8dn.xlarge インスタンスは、p35xlarge インスタンスよりも 3.2% 遅い (81 ミリ秒) だけですが、p3.2xlarge インスタンスよりも時間ベースで XNUMX% 低コストです ( Amazon SageMakerの価格 SageMaker インスタンスのタイプと料金の詳細について)。
SageMaker インスタンスタイプ | p90 レイテンシ (ミリ秒) | |
1 | p2.xlarge | 751 |
2 | p3.2xラージ | 424 |
3 | g4dn.xlarge | 459 |
まとめ
この投稿では、セマンティック セグメンテーション アノテーション タスクのグラウンド トゥルース自動セグメント機能の拡張機能を紹介しました。 ツールの元のバージョンでは、モデルをトリガーして高品質のセグメンテーション マスクを提供する正確に XNUMX 回のマウス クリックを行うことができますが、拡張機能を使用すると、修正クリックを行うことができ、それによって ML モデルを更新およびガイドして、より良い予測を行うことができます。 また、対話型ツールを Ground Truth のラベル付け UI にデプロイして統合するために使用できる基本的なアーキテクチャ パターンも紹介しました。 最後に、モデルのレイテンシーをまとめ、SageMaker リアルタイム推論エンドポイントを使用するとモデルのパフォーマンスを簡単に監視できることを示しました。
このツールがどのようにラベリング コストを削減し、精度を向上させるかについて詳しくは、次の Web サイトをご覧ください。 Amazon SageMaker データのラベル付け 今日からコンサルテーションを開始します。
著者について
ジョナサン・バック 機械学習と分散システムの交差点で働くアマゾン ウェブ サービスのソフトウェア エンジニアです。 彼の仕事には、機械学習モデルの製品化と、機械学習を活用した新しいソフトウェア アプリケーションの開発が含まれており、最新の機能を顧客に提供しています。
リー・エラン・リー Humain-in-the-Loop サービス、AWS AI、Amazon の応用科学マネージャーです。 彼の研究対象は、3D 深層学習、および視覚と言語表現の学習です。 以前は、Alexa AI のシニア サイエンティスト、Scale AI の機械学習責任者、Pony.ai のチーフ サイエンティストを務めていました。 それ以前は、Uber ATG の認識チームおよび Uber の機械学習プラットフォーム チームに所属し、自動運転のための機械学習、機械学習システム、および AI の戦略的イニシアチブに取り組んでいました。 彼はベル研究所でキャリアをスタートさせ、コロンビア大学の非常勤教授を務めました。 彼は ICML'17 と ICCV'19 でチュートリアルを共同で教え、NeurIPS、ICML、CVPR、ICCV で自動運転のための機械学習、3D ビジョンとロボティクス、機械学習システム、敵対的機械学習に関するいくつかのワークショップを共催しました。 コーネル大学でコンピュータ サイエンスの博士号を取得しています。 彼は ACM フェローおよび IEEE フェローです。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/few-click-segmentation-mask-labeling-in-amazon-sagemaker-ground-truth-plus/
- :は
- $UP
- 1
- 100
- 2019
- 3d
- 7
- a
- 私たちについて
- 精度
- 正確な
- 達成する
- ACM
- NEW
- 敵対者
- 後
- AI
- アレクサ
- すべて
- 許可
- ことができます
- しかし
- Amazon
- アマゾンセージメーカー
- Amazon SageMakerグラウンドトゥルース
- Amazon Webサービス
- および
- API
- 申し込み
- 適用された
- 適切な
- 建築の
- 建築
- です
- AREA
- 周りに
- AS
- At
- 認証
- オート
- 自律的
- 自律車両
- AWS
- バックエンド
- 背景
- 背景
- ベースライン
- 基本
- 基礎
- なぜなら
- ベル
- BEST
- ベストプラクティス
- より良いです
- ボトム
- 境界
- ビルド
- 建物
- by
- 呼ばれます
- 缶
- 機能
- キャリア
- 場合
- 例
- 原因となる
- 一定
- 特性
- チーフ
- class
- クリック
- クラウド
- カラー
- COLUMBIA
- コマンドと
- 複雑な
- コンピュータ
- コンピュータサイエンス
- Computer Vision
- コンテナ
- 費用
- 作ります
- カスタム
- Customers
- データ
- 深いです
- 深い学習
- 展開します
- 展開する
- 細部
- 開発
- 開発
- 異なります
- 配布
- 分散システム
- デッカー
- そうではありません
- 運転
- 各
- 簡単に
- 可能
- エンドポイント
- エンジニア
- 強化された
- エラー
- 評価
- 正確に
- 例
- 高価な
- 余分な
- 極端な
- 特徴
- フィードバック
- 仲間
- フィギュア
- 最後に
- 名
- フレキシブル
- フォロー中
- フロント
- フロントエンド
- 完全に
- function
- 機能
- 生成する
- 与えられた
- グリーン
- 陸上
- ガイド
- ハンド
- 持ってる
- 高品質
- host
- HOURS
- 認定条件
- しかしながら
- HTML
- HTTP
- HTTPS
- IEEE
- 画像
- 画像
- 直ちに
- 改善されました
- 改善
- in
- include
- 増える
- 個人
- 情報
- 初期
- イニシアチブ
- を取得する必要がある者
- 統合する
- 統合
- 相互作用的
- 利益
- 交差点
- 紹介する
- 導入
- IT
- ITS
- JPG
- ラベル
- ラベリング
- ラベル
- ラボ
- 言語
- 大
- レイテンシ
- 最新の
- LEARN
- 学習
- レベル
- 場所
- 機械
- 機械学習
- make
- 作る
- マネージド
- マネージャー
- mask
- マスク
- math
- だけど
- メモリ
- メトリック
- メトリック
- ML
- モード
- モデル
- モニター
- 他には?
- 移動する
- MS
- 近く
- 必要
- 小説
- 数
- オブジェクト
- オブジェクト
- of
- 提供
- on
- ONE
- 動作
- 機会
- オリジナル
- 自分の
- パターン
- 知覚
- パフォーマンス
- ピクセル
- 場所
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- さらに
- ポイント
- ポイント
- ポスト
- 潜在的な
- パワード
- プラクティス
- 予測
- PLM platform.
- 前
- 前に
- 価格設定
- プロセス
- 作り出す
- 東京大学大学院海洋学研究室教授
- 提供します
- は、大阪で
- 代理
- 置きます
- すぐに
- 比
- への
- レッド
- 減らします
- レジストリ
- リリース
- レンダリング
- 表現
- 必要とする
- の提出が必要です
- 必要
- 研究
- 結果
- 結果として
- 結果
- return
- ロボット工学
- 行
- ランニング
- セージメーカー
- 規模
- スケールai
- 科学
- 科学者
- シームレス
- 二番
- 安全に
- セグメント
- セグメンテーション
- シニア
- 役立つ
- サービス
- サービス
- サービング
- いくつかの
- Shadow
- 形状
- シェアする
- 表示する
- 示す
- 作品
- 信号
- 重要
- 熟練した
- ソフトウェア
- ソフトウェアエンジニア
- 標準
- start
- 開始
- 店舗
- 簡単な
- 戦略的
- 続いて
- そのような
- システム
- テーブル
- 取る
- 仕事
- タスク
- チーム
- それ
- それら
- それによって
- ボーマン
- 三
- 〜へ
- 今日
- ツール
- 豊富なツール群
- top
- トラフィック
- 変換
- トリガー
- チュートリアル
- ユーバー
- 理解する
- 組合
- 大学
- アップデイト
- us
- つかいます
- 使用事例
- ユーザー
- さまざまな
- 自動車
- 車
- バージョン
- ビデオ
- ビジョン
- 訪問
- ボリューム
- 仕方..
- ウェブ
- Webサービス
- which
- 意志
- 仕事
- ワーキング
- 作品
- ワークショップ
- You
- あなたの
- ゼファーネット