機械学習フレームワークが胸部 X 線で肺炎を分類

機械学習フレームワークが胸部 X 線で肺炎を分類

胸部X線画像
テストデータ 正常な肺(左)、細菌性肺炎(中央)、ウイルス性肺炎(右)の例を示す胸部 X 線画像。 (礼儀: マッハ。 学ぶ:科学技術。 10.1088/2632-2153/acc30f)

肺炎は急速に進行し、死に至る可能性のある肺感染症です。 空咳、呼吸困難、高熱などの肺炎の症状のある患者は、通常、肺の聴診検査を受け、続いて診断を確定するために胸部X線検査を受けます。 しかし、細菌性肺炎とウイルス性肺炎を区別することは、どちらも同様の臨床症状を示すため、依然として困難です。

数学的モデリングと人工知能は、X 線画像からの疾患診断の精度の向上に役立つ可能性があります。 ディープラーニングは医療画像の分類にますます一般的になってきており、畳み込みニューラル ネットワーク (CNN) モデルを使用して胸部 X 線画像から肺炎を自動的に識別する研究がいくつかの研究で行われています。 ただし、偽陰性なしで大量の医療画像を分析できる効率的なモデルを作成することが重要です。

さて、KMアブベカーとSバスカーは、 Karpagam高等教育アカデミー インドの研究チームは、グラフィックス処理装置 (GPU) 上で胸部 X 線画像を肺炎分類するための新しい機械学習フレームワークを作成しました。 彼らは自分たちの戦略を次のように説明しています。 機械学習:科学と技術.

トレーニングデータの最適化

深層学習分類器のパフォーマンスは、ニューラル ネットワーク モデルと、ネットワークのトレーニングに使用されるデータの品質の両方に依存します。 医療画像の場合、十分な大きさのデータセットが不足していることが、パフォーマンスが標準以下になる主な原因です。 この不足に対処するために、研究者らはデータ拡張を使用しました。これは、既存のデータから新しいトレーニング データを合成し(たとえば、画像の回転、シフト、クロップを介して)、データセットをより包括的かつ多様なものにします。

適切なトレーニング データの不足に対処するために使用されるもう XNUMX つの方法は転移学習です。これは、関連タスクの実行中に得られた既存の知識を使用して、新しいタスクを学習するモデルの能力を向上させます。 研究の第 XNUMX 段階で、Abubeker 氏と Baskar 氏は転移学習を使用して XNUMX つの最先端のニューラル CNN モデルをトレーニングし、胸部 X 線写真が肺炎を描写しているかどうかを評価しました。

実験では、公開されている RSNA Kaggle データセットの胸部 X 線画像を使用しました。これには、トレーニング用の画像 (1341 枚が正常、1678 枚が細菌性肺炎、2197 枚がウイルス性肺炎に分類)、検査用画像 (234 枚が正常、184 枚が細菌性肺炎、206 枚がウイルス性肺炎に分類) が含まれています。 ) および検証 (正常 76 件、細菌性肺炎 48 件、ウイルス性肺炎 56 件)。 データセットに幾何学的拡張を適用すると、合計 2571 枚の正常な画像、2019 枚の細菌性画像、および 2625 枚のウイルス性肺炎画像に拡張されました。

精度、再現率、ROC 曲線下面積 (AUROC、いくつかのしきい値にわたるパフォーマンスを要約する指標) などのパフォーマンス測定に基づいて、研究者らは最高パフォーマンスの 160 つの CNN モデル (DenseNet-121、ResNet-16、および VGGNet-XNUMX) を選択しました。アンサンブルテクニックを使用した再トレーニングに。

アンサンブル戦略

アンサンブル モデルは、単一の機械学習モデルに依存するのではなく、複数のモデルの結論をプールして、パフォーマンス メトリクスを向上させ、エラーを最小限に抑えます。 研究者らは、B2-Net と呼ばれる転移学習ベースのアンサンブル戦略を開発し、これを選択した 2 つの CNN と使用して最終モデルを作成しました。 彼らは、NVIDIA Jetson Nano GPU コンピューターに最終的な BXNUMX-Net モデルを実装しました。

胸部 X 線写真で肺炎を分類するための B2-Net モデル

彼らは、トレーニング中、一部のモデルは通常の X 線画像の識別でより優れたパフォーマンスを発揮したが、他のモデルはウイルス性および細菌性肺炎サンプルの識別でより優れたパフォーマンスを発揮したことに注目しています。 アンサンブル戦略では、重み付け投票手法を使用して、事前定義された基準に基づいて各分類器に特定の度合いの検出力を提供します。

再トレーニングされたモデルでは、ベースライン モデルと比較して診断精度が大幅に向上していることが実証されました。 バランスの取れたデータセットでモデルをテストしたところ、DenseNet-160、ResNet-121、VGGNet-16 がそれぞれ 0.9801、0.9822、0.9955 の AUROC 値を達成したことが明らかになりました。 ただし、提案された B2-Net アンサンブル アプローチは、AUROC が 0.9977 で、XNUMX つすべてを上回りました。

研究者らは、プールされたデータセットから約 2 枚の胸部 X 線画像のサブセットを使用して、B600-Net と他の 160 つのモデルを評価および検証しました。 DenseNet-16 は肺炎検査画像 121 枚を誤認し、VGGNet-2 と ResNet-97.69 はそれぞれ 100 枚の X 線画像を誤診しました。 全体として、提案された BXNUMX-Net アプローチは他のすべてのモデルよりも優れており、胸部 X 線画像で正常症例、細菌性肺炎、ウイルス性肺炎を XNUMX% の精度と再現率 (陽性者の総数の中の真陽性者の割合) で区別しました。 XNUMX%。

Abubeker 氏と Baskar 氏は、偽陰性率は医療画像分類器にとって最も重要な基準である一方、提案された B2-Net モデルはリアルタイムの臨床アプリケーションに最適な代替手段を提供すると説明しています。 「このアプローチは、特に現在世界的に新型コロナウイルス感染症が流行している中で、放射線科医が迅速かつ確実に肺炎を診断するのに役立ち、早期治療が可能になる可能性がある」と研究者らは書いている。

次に、結核や新型コロナウイルス感染症の変異型を含む、より多くの肺疾患を分類できるようにモデルを拡張する予定です。

タイムスタンプ:

より多くの 物理学の世界