Maskininlärningsramverk klassificerar lunginflammation på lungröntgen

Maskininlärningsramverk klassificerar lunginflammation på lungröntgen

Bröströntgenbilder
Testdata Bröströntgenbilder som visar exempel på normal lunga (vänster), bakteriell lunginflammation (mitten) och viral lunginflammation (höger). (Artighet: Mach. Lär dig.: Sci. Technol. 10.1088/2632-2153/acc30f)

Lunginflammation är en potentiellt dödlig lunginfektion som fortskrider snabbt. Patienter med symtom på lunginflammation – såsom torr, hackande hosta, andningssvårigheter och hög feber – får vanligtvis en stetoskopundersökning av lungorna, följt av en lungröntgen för att bekräfta diagnosen. Att skilja mellan bakteriell och viral lunginflammation är dock fortfarande en utmaning, eftersom båda har liknande klinisk presentation.

Matematisk modellering och artificiell intelligens kan bidra till att förbättra noggrannheten för sjukdomsdiagnostik från röntgenbilder. Deep learning har blivit allt mer populärt för medicinsk bildklassificering, och flera studier har utforskat användningen av CNN-modeller (convolutional neural network) för att automatiskt identifiera lunginflammation från lungröntgenbilder. Det är dock viktigt att skapa effektiva modeller som kan analysera ett stort antal medicinska bilder utan falska negativa resultat.

Nu, KM Abubeker och S Baskar på Karpagam Academy of Higher Education i Indien har skapat ett nytt ramverk för maskininlärning för klassificering av lunginflammation av lungröntgenbilder på en grafisk bearbetningsenhet (GPU). De beskriver sin strategi i Maskininlärning: vetenskap och teknik.

Träningsdataoptimering

Prestandan hos en klassificerare för djupinlärning är beroende av både den neurala nätverksmodellen och kvaliteten på de data som används för att träna nätverket. För medicinsk bildbehandling är avsaknaden av en tillräckligt stor datauppsättning en primär orsak till dålig prestanda. För att åtgärda denna brist använde forskarna dataförstärkning, där ny träningsdata syntetiseras från befintliga data (till exempel via bildrotationer, skiftningar och beskärningar) för att göra datasetet mer omfattande och mångsidigt.

En annan metod som används för att komma till rätta med bristen på lämplig träningsdata är överföringsinlärning – att förbättra en modells förmåga att lära sig en ny uppgift med hjälp av befintlig kunskap som erhållits samtidigt som en relaterad uppgift utförs. I den första fasen av sin studie använde Abubeker och Baskar överföringsinlärning för att träna nio toppmoderna neurala CNN-modeller för att bedöma om en lungröntgen skildrar lunginflammation eller inte.

För experimenten använde de bröströntgenbilder från offentliga RSNA Kaggle-datauppsättningar, inklusive bilder för träning (1341 kategoriserade som normala, 1678 som bakteriell lunginflammation och 2197 som viral lunginflammation), testning (234 normala, 184 bakteriella lunginflammationer, 206 viral pneumoni) ) och validering (76 normal, 48 bakteriell lunginflammation, 56 viral pneumoni). Genom att tillämpa geometrisk förstärkning på datasetet utökades den till totalt 2571 normala, 2019 bakteriella och 2625 virala lunginflammationsbilder.

Baserat på prestandamått inklusive noggrannhet, återkallelse och arean under ROC-kurvan (AUROC, ett mått som sammanfattar prestanda över flera trösklar), valde forskarna de tre bästa CNN-modellerna – DenseNet-160, ResNet-121 och VGGNet-16 – för omskolning med ensembleteknik.

Ensemble strategi

Istället för att förlita sig på en enda maskininlärningsmodell slår ensemblemodeller samman slutsatserna från flera modeller för att öka prestandamåtten och minimera fel. Forskarna utvecklade en överföringsinlärningsbaserad ensemblestrategi kallad B2-Net och använde denna med de tre utvalda CNN:erna för att skapa en slutlig modell. De implementerade den slutliga B2-Net-modellen på en NVIDIA Jetson Nano GPU-dator.

B2-Net-modell för klassificering av lunginflammation vid lungröntgen

De noterar att under träningen presterade vissa modeller bättre för att identifiera normala röntgenbilder, medan andra presterade bättre för att identifiera prover av virala och bakteriella lunginflammationer. Ensemblestrategin använder en vägd röstningsteknik för att ge varje klassificerare en specifik grad av makt baserat på fördefinierade kriterier.

De omtränade modellerna visade betydande förbättringar i diagnostisk noggrannhet jämfört med baslinjemodellerna. Att testa modellerna på en balanserad datauppsättning visade att DenseNet-160, ResNet-121 och VGGNet-16 uppnådde AUROC-värden på 0.9801, 0.9822 respektive 0.9955. Den föreslagna B2-Net-ensemblemetoden överträffade dock alla tre, med en AUROC på 0.9977.

Forskarna utvärderade och validerade B2-Net och de andra tre modellerna med hjälp av en delmängd av cirka 600 lungröntgenbilder från den sammanslagna datamängden. DenseNet-160 felidentifierade tre av lunginflammationstestbilderna, medan VGGNet-16 och ResNet-121 feldiagnostiserade en röntgenbild vardera. Sammantaget överträffade den föreslagna B2-Net-metoden alla andra modeller, och skilde mellan normala fall, bakteriell lunginflammation och viral lunginflammation i lungröntgenbilder med 97.69 % noggrannhet och en återkallningsfrekvens (andelen sanna positiva av det totala antalet positiva). på 100 %.

Abubeker och Baskar förklarar att även om den falska negativa frekvensen är det mest kritiska kriteriet för en medicinsk bildklassificerare, ger den föreslagna B2-Net-modellen det bästa alternativet för kliniska tillämpningar i realtid. "Det här tillvägagångssättet, särskilt under de nuvarande globala covid-19-utbrotten, kan hjälpa radiologer att snabbt och tillförlitligt diagnostisera lunginflammation, vilket möjliggör tidig behandling", skriver de.

Därefter planerar de att utöka sin modell för att klassificera fler lungsjukdomar, inklusive TB och COVID-19-varianter.

Tidsstämpel:

Mer från Fysikvärlden