Machine-Learning-Framework klassifiziert Lungenentzündung auf Röntgenaufnahmen des Brustkorbs

Machine-Learning-Framework klassifiziert Lungenentzündung auf Röntgenaufnahmen des Brustkorbs

Röntgenbilder der Brust
Testdaten Röntgenbilder des Brustkorbs, die Beispiele einer normalen Lunge (links), einer bakteriellen Lungenentzündung (Mitte) und einer viralen Lungenentzündung (rechts) zeigen. (Anstand: Mach. Lernen.: Sci. Technol. 10.1088/2632-2153/acc30f)

Lungenentzündung ist eine potenziell tödliche Lungeninfektion, die schnell fortschreitet. Patienten mit Lungenentzündungssymptomen – wie trockenem, stechenden Husten, Atembeschwerden und hohem Fieber – erhalten in der Regel eine Stethoskopuntersuchung der Lunge, gefolgt von einer Röntgenaufnahme des Brustkorbs zur Bestätigung der Diagnose. Die Unterscheidung zwischen bakterieller und viraler Lungenentzündung bleibt jedoch eine Herausforderung, da beide ein ähnliches klinisches Erscheinungsbild aufweisen.

Mathematische Modellierung und künstliche Intelligenz könnten dazu beitragen, die Genauigkeit der Krankheitsdiagnose anhand von Röntgenbildern zu verbessern. Deep Learning erfreut sich bei der Klassifizierung medizinischer Bilder immer größerer Beliebtheit, und mehrere Studien haben die Verwendung von Convolutional Neural Network (CNN)-Modellen untersucht, um Lungenentzündungen anhand von Röntgenbildern des Brustkorbs automatisch zu identifizieren. Es ist jedoch von entscheidender Bedeutung, effiziente Modelle zu erstellen, die eine große Anzahl medizinischer Bilder ohne falsch negative Ergebnisse analysieren können.

Nun, KM Abubeker und S Baskar am Karpagam Akademie für Hochschulbildung in Indien haben ein neuartiges maschinelles Lernsystem für die Lungenentzündungsklassifizierung von Röntgenbildern des Brustkorbs auf einer Grafikverarbeitungseinheit (GPU) entwickelt. Sie beschreiben ihre Strategie in Maschinelles Lernen: Wissenschaft und Technologie.

Trainingsdatenoptimierung

Die Leistung eines Deep-Learning-Klassifikators hängt sowohl vom neuronalen Netzwerkmodell als auch von der Qualität der zum Training des Netzwerks verwendeten Daten ab. Bei der medizinischen Bildgebung ist das Fehlen eines ausreichend großen Datensatzes eine Hauptursache für eine unterdurchschnittliche Leistung. Um dieses Defizit zu beheben, nutzten die Forscher die Datenerweiterung, bei der neue Trainingsdaten aus vorhandenen Daten synthetisiert werden (z. B. durch Bilddrehungen, Verschiebungen und Zuschnitte), um den Datensatz umfassender und vielfältiger zu machen.

Eine weitere Methode, um den Mangel an geeigneten Trainingsdaten zu beheben, ist Transferlernen – die Verbesserung der Fähigkeit eines Modells, eine neue Aufgabe zu lernen, indem es vorhandenes Wissen nutzt, das bei der Ausführung einer verwandten Aufgabe erworben wurde. In der ersten Phase ihrer Studie trainierten Abubeker und Baskar mithilfe von Transferlernen neun hochmoderne neuronale CNN-Modelle, um zu beurteilen, ob eine Röntgenaufnahme des Brustkorbs eine Lungenentzündung darstellt oder nicht.

Für die Experimente verwendeten sie Röntgenaufnahmen des Brustkorbs aus öffentlichen RSNA-Kaggle-Datensätzen, darunter Bilder für das Training (1341 als normal, 1678 als bakterielle Lungenentzündung und 2197 als virale Lungenentzündung) und Tests (234 als normal, 184 bakterielle Lungenentzündung, 206 virale Lungenentzündung). ) und Validierung (76 normale, 48 bakterielle Pneumonie, 56 virale Pneumonie). Durch die Anwendung der geometrischen Augmentation auf den Datensatz wurde dieser auf insgesamt 2571 normale, 2019 bakterielle und 2625 virale Lungenentzündungsbilder erweitert.

Basierend auf Leistungsmaßen wie Genauigkeit, Rückruf und der Fläche unter der ROC-Kurve (AUROC, eine Metrik, die die Leistung über mehrere Schwellenwerte zusammenfasst) wählten die Forscher die drei leistungsstärksten CNN-Modelle – DenseNet-160, ResNet-121 und VGGNet-16 – aus. zur Umschulung in Ensembletechnik.

Ensemble-Strategie

Anstatt sich auf ein einzelnes Modell für maschinelles Lernen zu verlassen, bündeln Ensemble-Modelle die Schlussfolgerungen mehrerer Modelle, um Leistungsmetriken zu verbessern und Fehler zu minimieren. Die Forscher entwickelten eine auf Transferlernen basierende Ensemble-Strategie namens B2-Net und verwendeten diese mit den drei ausgewählten CNNs, um ein endgültiges Modell zu erstellen. Sie implementierten das endgültige B2-Net-Modell auf einem NVIDIA Jetson Nano GPU-Computer.

B2-Net-Modell zur Klassifizierung von Lungenentzündungen im Röntgenbild des Brustkorbs

Sie stellen fest, dass während des Trainings einige Modelle bei der Identifizierung normaler Röntgenbilder besser abschnitten, während andere bei der Identifizierung viraler und bakterieller Lungenentzündungsproben besser abschnitten. Die Ensemble-Strategie verwendet eine gewichtete Abstimmungstechnik, um jedem Klassifikator basierend auf vordefinierten Kriterien einen bestimmten Grad an Leistung zu verleihen.

Die neu trainierten Modelle zeigten im Vergleich zu den Basismodellen deutliche Verbesserungen der Diagnosegenauigkeit. Das Testen der Modelle anhand eines ausgewogenen Datensatzes ergab, dass DenseNet-160, ResNet-121 und VGGNet-16 AUROC-Werte von 0.9801, 0.9822 bzw. 0.9955 erreichten. Der vorgeschlagene B2-Net-Ensemble-Ansatz übertraf jedoch alle drei mit einem AUROC von 0.9977.

Die Forscher bewerteten und validierten B2-Net und die anderen drei Modelle anhand einer Teilmenge von rund 600 Röntgenbildern des Brustkorbs aus dem gepoolten Datensatz. DenseNet-160 identifizierte drei der Lungenentzündungstestbilder falsch, während VGGNet-16 und ResNet-121 jeweils ein Röntgenbild falsch diagnostizierten. Insgesamt übertraf der vorgeschlagene B2-Net-Ansatz alle anderen Modelle und unterschied zwischen Normalfällen, bakterieller Lungenentzündung und viraler Lungenentzündung in Röntgenbildern des Brustkorbs mit einer Genauigkeit von 97.69 % und einer Erinnerungsrate (dem Anteil der wirklich positiven Ergebnisse an der Gesamtzahl der positiven Ergebnisse). von 100 %.

Abubeker und Baskar erklären, dass die Falsch-Negativ-Rate zwar das kritischste Kriterium für einen medizinischen Bildklassifizierer ist, das vorgeschlagene B2-Net-Modell jedoch die beste Alternative für klinische Echtzeitanwendungen bietet. „Dieser Ansatz könnte, insbesondere während der gegenwärtigen weltweiten COVID-19-Ausbrüche, Radiologen dabei helfen, eine Lungenentzündung schnell und zuverlässig zu diagnostizieren und eine frühzeitige Behandlung zu ermöglichen“, schreiben sie.

Als nächstes planen sie, ihr Modell zu erweitern, um weitere Lungenerkrankungen zu klassifizieren, darunter Tuberkulose und COVID-19-Varianten.

Zeitstempel:

Mehr von Physik-Welt