Le cadre d'apprentissage automatique classe la pneumonie sur les radiographies pulmonaires

Le cadre d'apprentissage automatique classe la pneumonie sur les radiographies pulmonaires

Images radiographiques du thorax
Données de test Images radiographiques thoraciques montrant des exemples de poumons normaux (à gauche), de pneumonie bactérienne (au centre) et de pneumonie virale (à droite). (Courtoisie: Mach. Apprendre. : Sci. Technol. 10.1088/2632-2153/acc30f)

La pneumonie est une infection pulmonaire potentiellement mortelle qui évolue rapidement. Les patients présentant des symptômes de pneumonie – tels qu’une toux sèche et sèche, des difficultés respiratoires et une forte fièvre – subissent généralement un examen des poumons au stéthoscope, suivi d’une radiographie pulmonaire pour confirmer le diagnostic. La distinction entre pneumonie bactérienne et virale reste cependant un défi, car les deux ont une présentation clinique similaire.

La modélisation mathématique et l’intelligence artificielle pourraient contribuer à améliorer la précision du diagnostic des maladies à partir d’images radiographiques. L’apprentissage profond est devenu de plus en plus populaire pour la classification des images médicales, et plusieurs études ont exploré l’utilisation de modèles de réseaux neuronaux convolutifs (CNN) pour identifier automatiquement la pneumonie à partir d’images radiographiques pulmonaires. Il est cependant essentiel de créer des modèles efficaces capables d’analyser un grand nombre d’images médicales sans faux négatifs.

Maintenant, KM Abubeker et S Baskar au Académie d'enseignement supérieur Karpagam en Inde, ont créé un nouveau cadre d'apprentissage automatique pour la classification des pneumonies des images radiographiques pulmonaires sur une unité de traitement graphique (GPU). Ils décrivent leur stratégie dans Apprentissage automatique : science et technologie.

Optimisation des données de formation

Les performances d'un classificateur d'apprentissage profond reposent à la fois sur le modèle de réseau neuronal et sur la qualité des données utilisées pour entraîner le réseau. Pour l’imagerie médicale, l’absence d’un ensemble de données suffisamment volumineux est l’une des principales causes de performances médiocres. Pour combler cette lacune, les chercheurs ont utilisé l'augmentation des données, dans laquelle de nouvelles données de formation sont synthétisées à partir de données existantes (par exemple via des rotations, des décalages et des recadrages d'images) pour rendre l'ensemble de données plus complet et plus diversifié.

Une autre méthode utilisée pour remédier au manque de données de formation appropriées est l'apprentissage par transfert : améliorer la capacité d'un modèle à apprendre une nouvelle tâche en utilisant les connaissances existantes acquises lors de l'exécution d'une tâche connexe. Dans la première phase de leur étude, Abubeker et Baskar ont utilisé l'apprentissage par transfert pour former neuf modèles neuronaux de pointe de CNN afin d'évaluer si une radiographie pulmonaire représente ou non une pneumonie.

Pour les expériences, ils ont utilisé des images de radiographie pulmonaire provenant d'ensembles de données publics RSNA Kaggle, y compris des images pour la formation (1341 classées comme normales, 1678 comme pneumonie bactérienne et 2197 comme pneumonie virale), les tests (234 normaux, 184 pneumonies bactériennes, 206 pneumonies virales). ) et validation (76 normales, 48 ​​pneumonies bactériennes, 56 pneumonies virales). L’application d’une augmentation géométrique à l’ensemble de données l’a étendu à un total de 2571 2019 images normales, 2625 XNUMX bactériennes et XNUMX XNUMX images de pneumonie virale.

Sur la base de mesures de performance comprenant la précision, le rappel et l'aire sous la courbe ROC (AUROC, une métrique résumant les performances sur plusieurs seuils), les chercheurs ont choisi les trois modèles CNN les plus performants – DenseNet-160, ResNet-121 et VGGNet-16 – pour la reconversion selon une technique d'ensemble.

Stratégie d'ensemble

Plutôt que de s'appuyer sur un seul modèle d'apprentissage automatique, les modèles d'ensemble regroupent les conclusions de plusieurs modèles pour améliorer les mesures de performances et minimiser les erreurs. Les chercheurs ont développé une stratégie d’ensemble basée sur l’apprentissage par transfert appelée B2-Net et l’ont utilisée avec les trois CNN sélectionnés pour créer un modèle final. Ils ont implémenté le modèle B2-Net final sur un ordinateur NVIDIA Jetson Nano GPU.

Modèle B2-Net pour classer la pneumonie sur les radiographies pulmonaires

Ils notent que pendant la formation, certains modèles ont mieux réussi à identifier les images radiologiques normales, tandis que d'autres ont mieux réussi à identifier les échantillons de pneumonie virale et bactérienne. La stratégie d'ensemble utilise une technique de vote pondéré pour fournir à chaque classificateur un degré de pouvoir spécifique basé sur des critères prédéfinis.

Les modèles recyclés ont démontré des améliorations significatives de la précision du diagnostic par rapport aux modèles de base. Le test des modèles sur un ensemble de données équilibré a révélé que DenseNet-160, ResNet-121 et VGGNet-16 ont atteint des valeurs AUROC de 0.9801, 0.9822 et 0.9955, respectivement. L’approche d’ensemble B2-Net proposée a toutefois surperformé les trois, avec un AUROC de 0.9977.

Les chercheurs ont évalué et validé B2-Net et les trois autres modèles en utilisant un sous-ensemble d’environ 600 images de radiographie pulmonaire provenant de l’ensemble de données regroupées. DenseNet-160 a mal identifié trois des images de test de pneumonie, tandis que VGGNet-16 et ResNet-121 ont mal diagnostiqué une image radiographique chacun. Dans l'ensemble, l'approche B2-Net proposée a surpassé tous les autres modèles, distinguant les cas normaux, la pneumonie bactérienne et la pneumonie virale dans les images radiographiques pulmonaires avec une précision de 97.69 % et un taux de rappel (la proportion de vrais positifs parmi le nombre total de positifs) de 100%.

Abubeker et Baskar expliquent que même si le taux de faux négatifs constitue le critère le plus critique pour un classificateur d'images médicales, le modèle B2-Net proposé constitue la meilleure alternative pour les applications cliniques en temps réel. « Cette approche, en particulier lors des épidémies mondiales actuelles de COVID-19, pourrait aider les radiologues à diagnostiquer la pneumonie de manière rapide et fiable, permettant ainsi un traitement précoce », écrivent-ils.

Ensuite, ils prévoient d’élargir leur modèle pour classer davantage de troubles pulmonaires, notamment les variantes de la tuberculose et du COVID-19.

Horodatage:

Plus de Monde de la physique