Maskinlæringsramme klassifiserer lungebetennelse på røntgen av thorax

Maskinlæringsramme klassifiserer lungebetennelse på røntgen av thorax

Røntgenbilder av thorax
Test data Røntgenbilder av thorax som viser eksempler på normal lunge (til venstre), bakteriell lungebetennelse (i midten) og viral lungebetennelse (til høyre). (Høflighet: Mach. Lær.: Sci. Teknol. 10.1088/2632-2153/acc30f)

Lungebetennelse er en potensielt dødelig lungeinfeksjon som utvikler seg raskt. Pasienter med lungebetennelsessymptomer – som tørr hoste, pustevansker og høy feber – får vanligvis en stetoskopundersøkelse av lungene, etterfulgt av røntgen av thorax for å bekrefte diagnosen. Å skille mellom bakteriell og viral lungebetennelse er imidlertid fortsatt en utfordring, siden begge har lignende klinisk presentasjon.

Matematisk modellering og kunstig intelligens kan bidra til å forbedre nøyaktigheten av sykdomsdiagnostikk fra radiografiske bilder. Dyplæring har blitt stadig mer populært for medisinsk bildeklassifisering, og flere studier har utforsket bruken av CNN-modeller (convolutional neural network) for automatisk å identifisere lungebetennelse fra røntgenbilder av thorax. Det er imidlertid avgjørende å lage effektive modeller som kan analysere et stort antall medisinske bilder uten falske negativer.

Nå, KM Abubeker og S Baskar på Karpagam Academy of Higher Education i India har laget et nytt maskinlæringsrammeverk for klassifisering av lungebetennelse av røntgenbilder av thorax på en grafisk prosesseringsenhet (GPU). De beskriver strategien sin i Maskinlæring: Vitenskap og teknologi.

Treningsdataoptimalisering

Ytelsen til en dyplæringsklassifiser er avhengig av både den nevrale nettverksmodellen og kvaliteten på dataene som brukes til å trene nettverket. For medisinsk bildebehandling er mangelen på et stort nok datasett en primær årsak til dårlig ytelse. For å løse denne mangelen brukte forskerne dataforsterkning, der nye treningsdata syntetiseres fra eksisterende data (for eksempel via bilderotasjoner, skift og beskjæringer) for å gjøre datasettet mer omfattende og mangfoldig.

En annen metode som brukes for å adressere mangelen på passende opplæringsdata er overføringslæring – å forbedre en modells kapasitet til å lære en ny oppgave ved å bruke eksisterende kunnskap oppnådd mens du utfører en relatert oppgave. I den første fasen av studien deres brukte Abubeker og Baskar overføringslæring for å trene ni toppmoderne nevrale CNN-modeller for å vurdere hvorvidt røntgen av thorax viser lungebetennelse eller ikke.

For eksperimentene brukte de røntgenbilder fra thorax fra offentlige RSNA Kaggle-datasett, inkludert bilder for trening (1341 kategorisert som normal, 1678 som bakteriell lungebetennelse og 2197 som viral lungebetennelse), testing (234 normal, 184 bakteriell lungebetennelse, 206 viral pneumoni) ) og validering (76 normal, 48 bakteriell lungebetennelse, 56 viral lungebetennelse). Ved å bruke geometrisk forsterkning på datasettet ble det utvidet til totalt 2571 bilder av normal, 2019 og 2625 viral lungebetennelse.

Basert på ytelsesmål inkludert nøyaktighet, tilbakekalling og arealet under ROC-kurven (AUROC, en metrisk oppsummering av ytelse over flere terskler), valgte forskerne de tre beste CNN-modellene – DenseNet-160, ResNet-121 og VGGNet-16 – for omskolering ved bruk av ensembleteknikk.

Ensemble strategi

I stedet for å stole på én enkelt maskinlæringsmodell, samler ensemblemodeller konklusjonene fra flere modeller for å øke ytelsesmålingene og minimere feil. Forskerne utviklet en overføringslæringsbasert ensemblestrategi kalt B2-Net og brukte denne sammen med de tre utvalgte CNN-ene for å lage en endelig modell. De implementerte den endelige B2-Net-modellen på en NVIDIA Jetson Nano GPU-datamaskin.

B2-Net modell for klassifisering av lungebetennelse ved røntgen thorax

De bemerker at under trening presterte noen modeller bedre når det gjaldt å identifisere normale røntgenbilder, mens andre presterte bedre når det gjaldt å identifisere prøver av viral og bakteriell lungebetennelse. Ensemblestrategien bruker en vektet stemmeteknikk for å gi hver klassifiserer en spesifikk grad av makt basert på forhåndsdefinerte kriterier.

De omskolerte modellene viste betydelige forbedringer i diagnostisk nøyaktighet i forhold til grunnlinjemodellene. Testing av modellene på et balansert datasett viste at DenseNet-160, ResNet-121 og VGGNet-16 oppnådde AUROC-verdier på henholdsvis 0.9801, 0.9822 og 0.9955. Den foreslåtte B2-Net ensemble-tilnærmingen overgikk imidlertid alle tre, med en AUROC på 0.9977.

Forskerne evaluerte og validerte B2-Net og de tre andre modellene ved å bruke en undergruppe på rundt 600 røntgenbilder fra det samlede datasettet. DenseNet-160 feilidentifiserte tre av lungebetennelsestestbildene, mens VGGNet-16 og ResNet-121 feildiagnostiserte ett røntgenbilde hver. Totalt sett overgikk den foreslåtte B2-Net-tilnærmingen alle andre modeller, og skilte mellom normale tilfeller, bakteriell lungebetennelse og viral lungebetennelse i røntgenbilder av thorax med 97.69 % nøyaktighet og en tilbakekallingsrate (andelen sanne positive blant det totale antallet positive) på 100 %.

Abubeker og Baskar forklarer at selv om den falske negative frekvensen er det mest kritiske kriteriet for en medisinsk bildeklassifisering, gir den foreslåtte B2-Net-modellen det beste alternativet for sanntids kliniske applikasjoner. "Denne tilnærmingen, spesielt under de nåværende verdensomspennende COVID-19-utbruddene, kan hjelpe radiologer med å raskt og pålitelig diagnostisere lungebetennelse, noe som muliggjør tidlig behandling," skriver de.

Deretter planlegger de å utvide modellen for å klassifisere flere lungesykdommer, inkludert TB og COVID-19-varianter.

Tidstempel:

Mer fra Fysikkens verden