Machine-learning raamwerk classificeert longontsteking op röntgenfoto's van de borst

Machine-learning raamwerk classificeert longontsteking op röntgenfoto's van de borst

Röntgenfoto's van de borst
Testgegevens Röntgenfoto's van de borstkas met voorbeelden van normale longontsteking (links), bacteriële longontsteking (midden) en virale longontsteking (rechts). (Beleefdheid: Mach. Leer.: Wetenschap. Technologie 10.1088/2632-2153/acc30f)

Longontsteking is een potentieel fatale longinfectie die snel vordert. Patiënten met symptomen van longontsteking – zoals een droge hoest, ademhalingsmoeilijkheden en hoge koorts – krijgen doorgaans een stethoscooponderzoek van de longen, gevolgd door een röntgenfoto van de borstkas om de diagnose te bevestigen. Het onderscheid maken tussen bacteriële en virale longontsteking blijft echter een uitdaging, aangezien beide een vergelijkbare klinische presentatie hebben.

Wiskundige modellen en kunstmatige intelligentie kunnen de nauwkeurigheid van de ziektediagnose op basis van radiografische beelden helpen verbeteren. Deep learning is steeds populairder geworden voor de classificatie van medische beelden, en verschillende onderzoeken hebben het gebruik van convolutionele neurale netwerkmodellen (CNN) onderzocht om longontsteking automatisch te identificeren op röntgenfoto's van de borstkas. Het is echter van cruciaal belang om efficiënte modellen te creëren die grote aantallen medische beelden kunnen analyseren zonder valse negatieven.

Nu, K M Abubeker en S Baskar bij de Karpagam Academie voor Hoger Onderwijs in India hebben een nieuw machinaal leerraamwerk gecreëerd voor de classificatie van longontstekingen van röntgenfoto's van de borstkas op een grafische verwerkingseenheid (GPU). Ze beschrijven hun strategie in Machine learning: wetenschap en technologie.

Optimalisatie van trainingsgegevens

De prestaties van een deep-learning classificator zijn afhankelijk van zowel het neurale netwerkmodel als de kwaliteit van de gegevens die worden gebruikt om het netwerk te trainen. Voor medische beeldvorming is het ontbreken van een voldoende grote dataset een primaire oorzaak van ondermaatse prestaties. Om dit tekort aan te pakken, gebruikten de onderzoekers data-augmentatie, waarbij nieuwe trainingsgegevens worden gesynthetiseerd uit bestaande gegevens (bijvoorbeeld via beeldrotaties, verschuivingen en bijsnijden) om de dataset uitgebreider en diverser te maken.

Een andere methode die wordt gebruikt om het gebrek aan geschikte trainingsgegevens aan te pakken is transfer learning: het verbeteren van het vermogen van een model om een ​​nieuwe taak te leren met behulp van bestaande kennis die is verkregen tijdens het uitvoeren van een gerelateerde taak. In de eerste fase van hun onderzoek gebruikten Abubeker en Baskar transfer learning om negen ultramoderne neurale CNN-modellen te trainen om te beoordelen of een röntgenfoto van de borstkas al dan niet longontsteking weergeeft.

Voor de experimenten gebruikten ze röntgenfoto's van de borstkas uit openbare RSNA Kaggle-datasets, inclusief afbeeldingen voor training (1341 gecategoriseerd als normaal, 1678 als bacteriële longontsteking en 2197 als virale longontsteking), testen (234 normaal, 184 bacteriële longontsteking, 206 virale longontsteking ) en validatie (76 normale, 48 bacteriële pneumonie, 56 virale pneumonie). Door geometrische augmentatie op de dataset toe te passen, werd deze uitgebreid tot een totaal van 2571 normale, 2019 bacteriële en 2625 virale longontstekingsbeelden.

Op basis van prestatiemaatstaven, waaronder nauwkeurigheid, herinnering en het gebied onder de ROC-curve (AUROC, een maatstaf die de prestaties over verschillende drempels samenvat), kozen de onderzoekers de drie best presterende CNN-modellen – DenseNet-160, ResNet-121 en VGGNet-16 – voor herscholing met behulp van een ensembletechniek.

Ensemble-strategie

In plaats van te vertrouwen op één enkel machine-learning-model, bundelen ensemblemodellen de conclusies van verschillende modellen om de prestatiestatistieken te verbeteren en fouten te minimaliseren. De onderzoekers ontwikkelden een op transfer learning gebaseerde ensemblestrategie genaamd B2-Net en gebruikten deze met de drie geselecteerde CNN's om een ​​definitief model te creëren. Ze implementeerden het definitieve B2-Net-model op een NVIDIA Jetson Nano GPU-computer.

B2-Net-model voor het classificeren van longontsteking op röntgenfoto's van de borstkas

Ze merken op dat sommige modellen tijdens de training beter presteerden bij het identificeren van normale röntgenfoto's, terwijl andere beter presteerden bij het identificeren van virale en bacteriële longontstekingsmonsters. De ensemblestrategie maakt gebruik van een gewogen stemtechniek om elke classificator een specifieke mate van macht te geven op basis van vooraf gedefinieerde criteria.

De opnieuw getrainde modellen lieten significante verbeteringen zien in de diagnostische nauwkeurigheid ten opzichte van de basismodellen. Uit het testen van de modellen op een gebalanceerde dataset bleek dat DenseNet-160, ResNet-121 en VGGNet-16 AUROC-waarden bereikten van respectievelijk 0.9801, 0.9822 en 0.9955. De voorgestelde B2-Net-ensemblebenadering presteerde echter beter dan alle drie, met een AUROC van 0.9977.

De onderzoekers evalueerden en valideerden B2-Net en de andere drie modellen met behulp van een subset van ongeveer 600 röntgenfoto's van de borstkas uit de samengevoegde dataset. DenseNet-160 heeft drie van de longontstekingstestbeelden verkeerd geïdentificeerd, terwijl VGGNet-16 en ResNet-121 elk één röntgenfoto verkeerd hebben gediagnosticeerd. Over het geheel genomen presteerde de voorgestelde B2-Net-aanpak beter dan alle andere modellen, waarbij onderscheid werd gemaakt tussen normale gevallen, bacteriële pneumonie en virale pneumonie op röntgenfoto's van de borstkas met een nauwkeurigheid van 97.69% en een herinneringspercentage (het aandeel echte positieven onder het totale aantal positieven). van 100%.

Abubeker en Baskar leggen uit dat hoewel het percentage fout-negatieve beelden het meest kritische criterium is voor een classificatie voor medische beelden, het voorgestelde B2-Net-model het beste alternatief biedt voor realtime klinische toepassingen. “Deze aanpak, vooral tijdens de huidige wereldwijde COVID-19-uitbraken, zou radiologen kunnen helpen bij het snel en betrouwbaar diagnosticeren van longontsteking, waardoor een vroege behandeling mogelijk wordt”, schrijven ze.

Vervolgens zijn ze van plan hun model uit te breiden om meer longaandoeningen te classificeren, waaronder varianten van tuberculose en COVID-19.

Tijdstempel:

Meer van Natuurkunde wereld