クロノミクス は、バイオマーカー (分子の分析から取得した定量化可能な情報) とテクノロジーを使用して、科学とデータの使用を民主化し、人々の生活を改善するテクノロジーバイオ企業です。 彼らの目標は、生物学的サンプルを分析し、目に見えないものについてもっと知ることが重要なあらゆることについて、意思決定に役立つ実用的な情報を提供することです. Chronomics のプラットフォームにより、プロバイダーは、効率や精度を犠牲にすることなく、大規模な在宅診断をシームレスに実装できます。 このプラットフォームを通じてすでに数百万のテストを処理しており、高品質の診断エクスペリエンスを提供しています。
COVID-19 パンデミックの間、Chronomics は COVID-19 を検出するためのラテラル フロー テスト (LFT) を販売しました。 ユーザーは、テスト カセットの写真をアップロードし、テストの読み取り値 (陽性、陰性、または無効) を手動で入力することにより、プラットフォームにテストを登録します。 テスト数とユーザー数の増加に伴い、報告された結果がテストの画像の結果と一致するかどうかを手動で検証することは、すぐに現実的ではなくなりました。 Chronomics は、コンピューター ビジョンを使用して結果を検証するスケーラブルなソリューションを構築したいと考えていました。
この投稿では、クロノミクスがどのように使用されたかを共有します Amazonの再認識 COVID-19 ラテラル フロー テストの結果を自動的に検出します。
データの準備
次の画像は、ユーザーがアップロードしたテスト カセットの写真を示しています。 データセットは、このような画像で構成されています。 これらの画像は、COVID-19 検査の結果に応じて、陽性、陰性、または無効に分類されます。
データセットの主な課題は次のとおりです。
- 不均衡なデータセット – データセットが極端に歪んでいた。 サンプルの 90% 以上がネガティブ クラスのものでした。
- 信頼できないユーザー入力 – ユーザーが手動で報告した測定値は信頼できませんでした。 読み取り値の約 40% は、写真の実際の結果と一致しませんでした。
高品質のトレーニング データセットを作成するために、クロノミクスのエンジニアは次の手順に従うことにしました。
- 手動注釈 – 1,000 枚の画像を手動で選択してラベル付けし、XNUMX つのクラスが均等に表示されるようにします
- 画像増強 – ラベル付けされた画像を拡張して、数を 10,000 に増やします
を使用して画像拡張を実行しました アルバム化、オープンソースの Python ライブラリです。 9,000 枚の合成画像を生成するために、回転、再スケーリング、明るさなどの多くの変換が実行されました。 これらの合成画像は、高品質のデータセットを作成するために元の画像に追加されました。
Amazon Rekognition を使用してカスタム コンピュータ ビジョン モデルを構築する
クロノミクスのエンジニアは Amazon Rekognitionカスタムラベル、AutoML 機能を備えた Amazon Rekognition の機能です。 トレーニング イメージが提供されると、データの読み込みと検査、適切なアルゴリズムの選択、モデルのトレーニング、モデル パフォーマンス メトリックの提供を自動的に行うことができます。 これにより、コンピュータビジョンモデルのトレーニングとデプロイのプロセスが大幅に加速され、Chronomics が Amazon Rekognition を採用する主な理由となっています。 Amazon Rekognition を使用すると、目的のパフォーマンスを達成するためにカスタムモデルを構築しようとして 3 か月を費やすのとは対照的に、4 ~ 4 週間で非常に正確なモデルを取得できました。
次の図は、モデル トレーニング パイプラインを示しています。 注釈付きの画像は、最初に AWSラムダ 関数。 この前処理手順により、画像が適切なファイル形式であることを確認し、画像のサイズ変更や画像の RGB からグレースケールへの変換などの追加の手順も実行しました。 これにより、モデルのパフォーマンスが向上したことが観察されました。
モデルがトレーニングされた後、XNUMX 回のクリックまたは API 呼び出しを使用して、推論のためにデプロイできます。
モデルのパフォーマンスと微調整
モデルは、サンプル外の画像のセットで 96.5% の精度と 1% の F97.9 スコアをもたらしました。 F1 スコアは、適合率と再現率の両方を使用して分類器のパフォーマンスを測定する尺度です。 の DetectCustomLabels API 推論中に提供された画像のラベルを検出するために使用されます。 この API は、Rekognition Custom Labels が予測されたラベルの精度に対して持っている信頼度も返します。 次のグラフは、画像の予測ラベルの信頼スコアの分布を示しています。 x 軸は 100 を掛けた信頼スコアを表し、y 軸は対数スケールでの予測の数です。
信頼度スコアにしきい値を設定することで、信頼度の低い予測を除外できます。 0.99 のしきい値では 99.6% の精度が得られ、予測の 5% が破棄されました。 0.999 のしきい値では、99.87% の精度が得られ、予測の 27% が破棄されました。 適切なビジネス価値を提供するために、Chronomics は精度を最大化し、予測の拒否を最小限に抑えるために 0.99 のしきい値を選択しました。 詳細については、次を参照してください。 トレーニング済みモデルを使用した画像の分析.
破棄された予測は、次を使用してループ内の人間にルーティングすることもできます Amazon拡張AI (Amazon A2I) 画像を手動で処理します。 これを行う方法の詳細については、次を参照してください。 Amazon RekognitionでAmazon Augmented AIを使用する.
次の画像は、モデルが 0.999 の信頼度でテストを無効として正しく識別した例です。
まとめ
この投稿では、Chronoms が、Amazon Rekognition を使用して COVID-19 ラテラル フロー テストの結果を検出する、スケーラブルなコンピューター ビジョン ベースのソリューションを迅速に構築およびデプロイした簡単さを示しました。 の Amazon 認識 API により、実務者はコンピュータ ビジョン モデルの構築プロセスを非常に簡単に加速できます。
特定のビジネス ユース ケースに合わせてコンピューター ビジョン モデルをトレーニングする方法については、次の URL を参照してください。 Amazon Rekognition カスタムラベルの使用開始 そして見直すことで Amazon Rekognition カスタム ラベル ガイド.
著者について
マティア・スピネッリ バイオメディカル企業 Chronomics のシニア機械学習エンジニアです。 Chronomics のプラットフォームにより、プロバイダーは、効率や精度を犠牲にすることなく、大規模な在宅診断をシームレスに実装できます。
ピナック・パニグラヒ お客様と協力して機械学習主導のソリューションを構築し、AWS での戦略的なビジネス上の問題を解決します。 機械学習に専念していないときは、ハイキングをしたり、本を読んだり、スポーツをしたりしています。
ジェイ・ラオ AWSのプリンシパルソリューションアーキテクトです。 彼は、顧客に技術的および戦略的なガイダンスを提供し、顧客がAWSでソリューションを設計および実装するのを支援することを楽しんでいます。
パシュミーンミストリー AWS のシニア プロダクト マネージャーです。 仕事以外では、冒険的なハイキング、写真撮影、家族との時間を楽しんでいます。