Chronomics が Amazon Rekognition カスタムラベルを使用して COVID-19 テスト結果を検出

プラトン再発行

フォロワー： 0

クロノミクスは、バイオマーカー (分子の分析から取得した定量化可能な情報) とテクノロジーを使用して、科学とデータの使用を民主化し、人々の生活を改善するテクノロジーバイオ企業です。彼らの目標は、生物学的サンプルを分析し、目に見えないものについてもっと知ることが重要なあらゆることについて、意思決定に役立つ実用的な情報を提供することです. Chronomics のプラットフォームにより、プロバイダーは、効率や精度を犠牲にすることなく、大規模な在宅診断をシームレスに実装できます。このプラットフォームを通じてすでに数百万のテストを処理しており、高品質の診断エクスペリエンスを提供しています。

COVID-19 パンデミックの間、Chronomics は COVID-19 を検出するためのラテラルフローテスト (LFT) を販売しました。ユーザーは、テストカセットの写真をアップロードし、テストの読み取り値 (陽性、陰性、または無効) を手動で入力することにより、プラットフォームにテストを登録します。テスト数とユーザー数の増加に伴い、報告された結果がテストの画像の結果と一致するかどうかを手動で検証することは、すぐに現実的ではなくなりました。 Chronomics は、コンピュータービジョンを使用して結果を検証するスケーラブルなソリューションを構築したいと考えていました。

この投稿では、クロノミクスがどのように使用されたかを共有します Amazonの再認識 COVID-19 ラテラルフローテストの結果を自動的に検出します。

データの準備

次の画像は、ユーザーがアップロードしたテストカセットの写真を示しています。データセットは、このような画像で構成されています。これらの画像は、COVID-19 検査の結果に応じて、陽性、陰性、または無効に分類されます。

データセットの主な課題は次のとおりです。

不均衡なデータセット – データセットが極端に歪んでいた。サンプルの 90% 以上がネガティブクラスのものでした。
信頼できないユーザー入力 – ユーザーが手動で報告した測定値は信頼できませんでした。読み取り値の約 40% は、写真の実際の結果と一致しませんでした。

高品質のトレーニングデータセットを作成するために、クロノミクスのエンジニアは次の手順に従うことにしました。

手動注釈 – 1,000 枚の画像を手動で選択してラベル付けし、XNUMX つのクラスが均等に表示されるようにします
画像増強 – ラベル付けされた画像を拡張して、数を 10,000 に増やします

を使用して画像拡張を実行しましたアルバム化、オープンソースの Python ライブラリです。 9,000 枚の合成画像を生成するために、回転、再スケーリング、明るさなどの多くの変換が実行されました。これらの合成画像は、高品質のデータセットを作成するために元の画像に追加されました。

Amazon Rekognition を使用してカスタムコンピュータビジョンモデルを構築する

クロノミクスのエンジニアは Amazon Rekognitionカスタムラベル、AutoML 機能を備えた Amazon Rekognition の機能です。トレーニングイメージが提供されると、データの読み込みと検査、適切なアルゴリズムの選択、モデルのトレーニング、モデルパフォーマンスメトリックの提供を自動的に行うことができます。これにより、コンピュータビジョンモデルのトレーニングとデプロイのプロセスが大幅に加速され、Chronomics が Amazon Rekognition を採用する主な理由となっています。 Amazon Rekognition を使用すると、目的のパフォーマンスを達成するためにカスタムモデルを構築しようとして 3 か月を費やすのとは対照的に、4 ～ 4 週間で非常に正確なモデルを取得できました。

次の図は、モデルトレーニングパイプラインを示しています。注釈付きの画像は、最初に AWSラムダ関数。この前処理手順により、画像が適切なファイル形式であることを確認し、画像のサイズ変更や画像の RGB からグレースケールへの変換などの追加の手順も実行しました。これにより、モデルのパフォーマンスが向上したことが観察されました。

モデルがトレーニングされた後、XNUMX 回のクリックまたは API 呼び出しを使用して、推論のためにデプロイできます。

モデルのパフォーマンスと微調整

モデルは、サンプル外の画像のセットで 96.5% の精度と 1% の F97.9 スコアをもたらしました。 F1 スコアは、適合率と再現率の両方を使用して分類器のパフォーマンスを測定する尺度です。の DetectCustomLabels API 推論中に提供された画像のラベルを検出するために使用されます。この API は、Rekognition Custom Labels が予測されたラベルの精度に対して持っている信頼度も返します。次のグラフは、画像の予測ラベルの信頼スコアの分布を示しています。 x 軸は 100 を掛けた信頼スコアを表し、y 軸は対数スケールでの予測の数です。

信頼度スコアにしきい値を設定することで、信頼度の低い予測を除外できます。 0.99 のしきい値では 99.6% の精度が得られ、予測の 5% が破棄されました。 0.999 のしきい値では、99.87% の精度が得られ、予測の 27% が破棄されました。適切なビジネス価値を提供するために、Chronomics は精度を最大化し、予測の拒否を最小限に抑えるために 0.99 のしきい値を選択しました。詳細については、次を参照してください。トレーニング済みモデルを使用した画像の分析.

破棄された予測は、次を使用してループ内の人間にルーティングすることもできます Amazon拡張AI (Amazon A2I) 画像を手動で処理します。これを行う方法の詳細については、次を参照してください。 Amazon RekognitionでAmazon Augmented AIを使用する.

次の画像は、モデルが 0.999 の信頼度でテストを無効として正しく識別した例です。

まとめ

この投稿では、Chronoms が、Amazon Rekognition を使用して COVID-19 ラテラルフローテストの結果を検出する、スケーラブルなコンピュータービジョンベースのソリューションを迅速に構築およびデプロイした簡単さを示しました。の Amazon 認識 API により、実務者はコンピュータビジョンモデルの構築プロセスを非常に簡単に加速できます。

特定のビジネスユースケースに合わせてコンピュータービジョンモデルをトレーニングする方法については、次の URL を参照してください。 Amazon Rekognition カスタムラベルの使用開始そして見直すことで Amazon Rekognition カスタムラベルガイド.

著者について

マティア・スピネッリ バイオメディカル企業 Chronomics のシニア機械学習エンジニアです。 Chronomics のプラットフォームにより、プロバイダーは、効率や精度を犠牲にすることなく、大規模な在宅診断をシームレスに実装できます。

ピナック・パニグラヒ お客様と協力して機械学習主導のソリューションを構築し、AWS での戦略的なビジネス上の問題を解決します。機械学習に専念していないときは、ハイキングをしたり、本を読んだり、スポーツをしたりしています。

著者-JayRao ジェイ・ラオ AWSのプリンシパルソリューションアーキテクトです。彼は、顧客に技術的および戦略的なガイダンスを提供し、顧客がAWSでソリューションを設計および実装するのを支援することを楽しんでいます。

パシュミーンミストリー AWS のシニアプロダクトマネージャーです。仕事以外では、冒険的なハイキング、写真撮影、家族との時間を楽しんでいます。

タイムスタンプ： 2022 年 12 月 13 日2022 年 12 月 16 日

タイムスタンプ： 2024 年 1 月 29 日

Chronomics は、Amazon Rekognition カスタムラベルを使用して COVID-19 テスト結果を検出します

プラトン再発行

データの準備

Amazon Rekognition を使用してカスタムコンピュータビジョンモデルを構築する

モデルのパフォーマンスと微調整

まとめ

著者について

より多くの AWS機械学習

本人確認ソリューションを評価するための指標

VPC をサポートする Amazon Kendra S3 Connector を使用して正確に回答を検索する

AmazonKendraBoxコネクタの使用を開始する

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

データの準備

Amazon Rekognition を使用してカスタム コンピュータ ビジョン モデルを構築する

モデルのパフォーマンスと微調整

まとめ

著者について

より多くの AWS機械学習

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

Amazon Rekognition を使用してカスタムコンピュータビジョンモデルを構築する