Maskinlæringsramme klassificerer lungebetændelse på røntgenbilleder af thorax

Maskinlæringsramme klassificerer lungebetændelse på røntgenbilleder af thorax

Røntgenbilleder af thorax
Test data Røntgenbilleder af thorax, der viser eksempler på normal lunge (til venstre), bakteriel lungebetændelse (i midten) og viral lungebetændelse (højre). (Høflighed: Mach. Lær.: Sci. Teknol. 10.1088/2632-2153/acc30f)

Lungebetændelse er en potentielt dødelig lungeinfektion, der udvikler sig hurtigt. Patienter med lungebetændelsessymptomer - såsom tør hoste, vejrtrækningsbesvær og høj feber - får generelt en stetoskopundersøgelse af lungerne efterfulgt af et røntgenbillede af thorax for at bekræfte diagnosen. At skelne mellem bakteriel og viral lungebetændelse er dog stadig en udfordring, da begge har lignende klinisk præsentation.

Matematisk modellering og kunstig intelligens kan hjælpe med at forbedre nøjagtigheden af ​​sygdomsdiagnose fra røntgenbilleder. Deep learning er blevet mere og mere populært til medicinsk billedklassificering, og adskillige undersøgelser har udforsket brugen af ​​CNN-modeller (convolutional neural network) til automatisk at identificere lungebetændelse fra røntgenbilleder af thorax. Det er imidlertid afgørende at skabe effektive modeller, der kan analysere et stort antal medicinske billeder uden falske negativer.

Nu, KM Abubeker og S Baskar på Karpagam Academy of Higher Education i Indien har skabt en ny maskinlæringsramme til klassificering af lungebetændelse af røntgenbilleder af thorax på en grafisk behandlingsenhed (GPU). De beskriver deres strategi i Machine Learning: Videnskab og teknologi.

Træningsdataoptimering

Ydeevnen af ​​en deep-learning-klassifikator afhænger af både den neurale netværksmodel og kvaliteten af ​​de data, der bruges til at træne netværket. Til medicinsk billeddannelse er manglen på et stort nok datasæt en primær årsag til dårlig ydeevne. For at afhjælpe denne mangel brugte forskerne dataforøgelse, hvor nye træningsdata syntetiseres fra eksisterende data (for eksempel via billedrotationer, forskydninger og beskæringer) for at gøre datasættet mere omfattende og mangfoldigt.

En anden metode, der anvendes til at afhjælpe manglen på passende træningsdata, er overførsel af læring – at forbedre en models kapacitet til at lære en ny opgave ved at bruge eksisterende viden, der er opnået, mens den udfører en relateret opgave. I den første fase af deres undersøgelse brugte Abubeker og Baskar overførselslæring til at træne ni avancerede neurale CNN-modeller til at vurdere, hvorvidt et røntgenbillede af thorax viser lungebetændelse.

Til eksperimenterne brugte de røntgenbilleder af thorax fra offentlige RSNA Kaggle-datasæt, inklusive billeder til træning (1341 kategoriseret som normale, 1678 som bakteriel lungebetændelse og 2197 som viral lungebetændelse), test (234 normale, 184 bakteriel lungebetændelse, 206 viral pneumoni) ) og validering (76 normal, 48 bakteriel lungebetændelse, 56 viral pneumoni). Ved at anvende geometrisk forstærkning på datasættet blev det udvidet til i alt 2571 normale, 2019 bakterielle og 2625 virale lungebetændelsesbilleder.

Baseret på ydeevnemål, herunder nøjagtighed, genkaldelse og arealet under ROC-kurven (AUROC, en metrisk opsummerende ydeevne over flere tærskler), valgte forskerne de tre toppræsterende CNN-modeller – DenseNet-160, ResNet-121 og VGGNet-16 – til genoptræning ved brug af ensembleteknik.

Ensemble strategi

I stedet for at stole på en enkelt maskinlæringsmodel, samler ensemblemodeller konklusionerne fra flere modeller for at øge ydeevnemålingerne og minimere fejl. Forskerne udviklede en overførselslæringsbaseret ensemblestrategi kaldet B2-Net og brugte denne sammen med de tre udvalgte CNN'er til at skabe en endelig model. De implementerede den endelige B2-Net-model på en NVIDIA Jetson Nano GPU-computer.

B2-Net model til klassificering af lungebetændelse ved røntgenbilleder af thorax

De bemærker, at nogle modeller under træning klarede sig bedre til at identificere normale røntgenbilleder, mens andre klarede sig bedre til at identificere virale og bakterielle lungebetændelsesprøver. Ensemblestrategien bruger en vægtet stemmeteknik til at give hver klassifikator en specifik grad af magt baseret på foruddefinerede kriterier.

De omskolede modeller viste signifikante forbedringer i diagnostisk nøjagtighed i forhold til basislinjemodellerne. Test af modellerne på et afbalanceret datasæt viste, at DenseNet-160, ResNet-121 og VGGNet-16 opnåede AUROC-værdier på henholdsvis 0.9801, 0.9822 og 0.9955. Den foreslåede B2-Net-ensembletilgang klarede sig dog bedre end alle tre med en AUROC på 0.9977.

Forskerne evaluerede og validerede B2-Net og de tre andre modeller ved hjælp af en undergruppe af omkring 600 røntgenbilleder fra det samlede datasæt. DenseNet-160 fejlidentificerede tre af lungebetændelsestestbillederne, mens VGGNet-16 og ResNet-121 fejldiagnosticerede et røntgenbillede hver. Samlet set overgik den foreslåede B2-Net-tilgang alle andre modeller, idet den skelnede mellem normale tilfælde, bakteriel lungebetændelse og viral lungebetændelse i røntgenbilleder af thorax med 97.69 % nøjagtighed og en tilbagekaldelsesrate (andelen af ​​sande positive blandt det samlede antal positive) på 100 %.

Abubeker og Baskar forklarer, at mens den falske negative rate er det mest kritiske kriterium for en medicinsk billedklassifikator, giver den foreslåede B2-Net-model det bedste alternativ til kliniske anvendelser i realtid. "Denne tilgang, især under de nuværende verdensomspændende COVID-19-udbrud, kunne hjælpe radiologer med hurtigt og pålideligt at diagnosticere lungebetændelse, hvilket muliggør tidlig behandling," skriver de.

Dernæst planlægger de at udvide deres model til at klassificere flere lungelidelser, herunder TB og COVID-19 varianter.

Tidsstempel:

Mere fra Fysik verden