Koneoppimiskehys luokittelee keuhkokuumeen rintakehän röntgenkuvissa

Koneoppimiskehys luokittelee keuhkokuumeen rintakehän röntgenkuvissa

Rintakehän röntgenkuvat
Testitiedot Rintakehän röntgenkuvat, joissa on esimerkkejä normaaleista keuhkoista (vasemmalla), bakteerikeuhkokuumeesta (keskellä) ja viruskeuhkokuumeesta (oikealla). (Kohteliaisuus: Mach. Opi.: Sci. Technol. 10.1088/2632-2153/acc30f)

Keuhkokuume on mahdollisesti kuolemaan johtava keuhkotulehdus, joka etenee nopeasti. Potilaat, joilla on keuhkokuumeoireita – kuten kuivaa, yskää, hengitysvaikeuksia ja korkeaa kuumetta – saavat yleensä keuhkot stetoskooppitutkimuksen, jota seuraa keuhkojen röntgenkuvaus diagnoosin vahvistamiseksi. Bakteeri- ja viruskeuhkokuumeen erottaminen toisistaan ​​on kuitenkin edelleen haaste, koska molemmilla on samanlainen kliininen esitys.

Matemaattinen mallintaminen ja tekoäly voisivat auttaa parantamaan sairauden diagnoosin tarkkuutta röntgenkuvista. Syväoppimisesta on tullut yhä suositumpaa lääketieteellisten kuvien luokittelussa, ja useat tutkimukset ovat tutkineet konvoluutiohermoverkkomallien (CNN) käyttöä keuhkokuumeen tunnistamiseksi automaattisesti keuhkojen röntgenkuvista. On kuitenkin erittäin tärkeää luoda tehokkaita malleja, jotka voivat analysoida suuria määriä lääketieteellisiä kuvia ilman vääriä negatiivisia.

Nyt KM Abubeker ja S Baskar klo Karpagamin korkeakouluakatemia Intiassa ovat luoneet uudenlaisen koneoppimiskehyksen keuhkokuumeen luokitteluun keuhkojen röntgenkuvien grafiikkakäsittely-yksikössä (GPU). He kuvaavat strategiaansa Koneoppiminen: Tiede ja teknologia.

Koulutustietojen optimointi

Syväoppivan luokittelijan suorituskyky riippuu sekä hermoverkkomallista että verkon kouluttamiseen käytetyn datan laadusta. Lääketieteellisessä kuvantamisessa riittävän suuren tietojoukon puute on ensisijainen syy huonompaan suorituskykyyn. Tämän puutteen korjaamiseksi tutkijat käyttivät datan lisäystä, jossa uutta harjoitustietoa syntetisoidaan olemassa olevista tiedoista (esimerkiksi kuvien kiertojen, siirtojen ja rajausten avulla) tehdäkseen tietojoukosta kattavamman ja monipuolisemman.

Toinen menetelmä, jota käytetään puuttumaan asianmukaisen harjoitusdatan puutteeseen, on siirtooppiminen – mallin kyvyn parantaminen uuden tehtävän oppimiseen käyttämällä olemassa olevaa tietoa, joka on saatu suoritettaessa liittyvää tehtävää. Tutkimuksensa ensimmäisessä vaiheessa Abubeker ja Baskar käyttivät siirtooppimista kouluttaakseen yhdeksää uusinta hermoston CNN-mallia arvioidakseen, kuvaako rintakehän röntgenkuva keuhkokuumetta vai ei.

Kokeissa he käyttivät keuhkojen röntgenkuvia julkisista RSNA Kaggle -tietosarjoista, mukaan lukien harjoituskuvia (1341 luokiteltu normaaliksi, 1678 bakteerikeuhkokuumeeksi ja 2197 viruskeuhkokuumeeksi), testaukseen (234 normaalia, 184 bakteerikeuhkokuumetta, 206 viruskeuhkokuumetta). ) ja validointi (76 normaalia, 48 bakteerikeuhkokuumetta, 56 viruskeuhkokuumetta). Geometrisen augmentaation soveltaminen tietoaineistoon laajensi sen yhteensä 2571 normaaliin, 2019 bakteeri- ja 2625 viruskeuhkokuumekuvaan.

Suorituskykymittareiden mukaan lukien tarkkuus, muistaminen ja ROC-käyrän alla oleva pinta-ala (AUROC, mittari, joka tiivistää suorituskyvyn useiden kynnysten yli), tutkijat valitsivat kolme parhaiten suoriutuvaa CNN-mallia – DenseNet-160, ResNet-121 ja VGGNet-16. uudelleenkoulutukseen ensemble-tekniikalla.

Yhtyestrategia

Sen sijaan, että luotaisiin yhteen koneoppimismalliin, yhdistelmämallit yhdistävät useiden mallien johtopäätökset tehostamaan suorituskykymittareita ja minimoimaan virheet. Tutkijat kehittivät siirtooppimiseen perustuvan ensemble-strategian nimeltä B2-Net ja käyttivät sitä kolmen valitun CNN:n kanssa lopullisen mallin luomiseksi. He toteuttivat lopullisen B2-Net-mallin NVIDIA Jetson Nano GPU -tietokoneessa.

B2-Net-malli keuhkokuumeen luokitteluun rintakehän röntgenkuvissa

He huomauttavat, että koulutuksen aikana jotkut mallit onnistuivat paremmin tunnistamaan normaaleja röntgenkuvia, kun taas toiset suoriutuivat paremmin virus- ja bakteerikeuhkokuumenäytteiden tunnistamisessa. Ensemble-strategia käyttää painotettua äänestystekniikkaa antaakseen kullekin luokittelijalle tietyn tehotason ennalta määritettyjen kriteerien perusteella.

Uudelleenkoulutetut mallit osoittivat merkittäviä parannuksia diagnostisessa tarkkuudessa perusmalleihin verrattuna. Mallien testaus tasapainotetulla tietojoukolla paljasti, että DenseNet-160, ResNet-121 ja VGGNet-16 saavuttivat AUROC-arvot 0.9801, 0.9822 ja 0.9955. Ehdotettu B2-Net ensemble -lähestymistapa suoritti kuitenkin kaikki kolme, ja AUROC oli 0.9977.

Tutkijat arvioivat ja validoivat B2-Netin ja kolme muuta mallia käyttämällä noin 600 rintakehän röntgenkuvan alajoukkoa yhdistetystä tietojoukosta. DenseNet-160 tunnisti väärin kolme keuhkokuumetestikuvaa, kun taas VGGNet-16 ja ResNet-121 diagnosoivat väärin yhden röntgenkuvan. Kaiken kaikkiaan ehdotettu B2-Net-lähestymistapa ylitti kaikki muut mallit erottelemalla normaalit tapaukset, bakteerikeuhkokuume ja viruskeuhkokuume rintakehän röntgenkuvissa 97.69 %:n tarkkuudella ja palautussuhteella (todellisten positiivisten osuus positiivisten tulosten kokonaismäärästä). 100 %:sta.

Abubeker ja Baskar selittävät, että vaikka väärän negatiivinen osuus on kriittisin kriteeri lääketieteellisen kuvan luokittelijana, ehdotettu B2-Net-malli tarjoaa parhaan vaihtoehdon reaaliaikaisiin kliinisiin sovelluksiin. "Tämä lähestymistapa, erityisesti nykyisten maailmanlaajuisten COVID-19-epidemioiden aikana, voisi auttaa radiologeja diagnosoimaan keuhkokuumeen nopeasti ja luotettavasti, mikä mahdollistaa varhaisen hoidon", he kirjoittavat.

Seuraavaksi he aikovat laajentaa malliaan luokittelemaan lisää keuhkosairauksia, mukaan lukien tuberkuloosi ja COVID-19-muunnelmat.

Aikaleima:

Lisää aiheesta Fysiikan maailma