Ramy uczenia maszynowego klasyfikują zapalenie płuc na zdjęciach rentgenowskich klatki piersiowej

Ramy uczenia maszynowego klasyfikują zapalenie płuc na zdjęciach rentgenowskich klatki piersiowej

Zdjęcia rentgenowskie klatki piersiowej
Dane testowe Zdjęcia rentgenowskie klatki piersiowej przedstawiające przykłady normalnego płuca (po lewej), bakteryjnego zapalenia płuc (w środku) i wirusowego zapalenia płuc (po prawej). (Kurtuazja: Mach. Dowiedz się.: Nauka. Techno. 10.1088/2632-2153/acc30f)

Zapalenie płuc jest potencjalnie śmiertelną infekcją płuc, która szybko postępuje. Pacjenci z objawami zapalenia płuc – takimi jak suchy kaszel, trudności w oddychaniu i wysoka gorączka – na ogół otrzymują badanie płuc stetoskopem, a następnie prześwietlenie klatki piersiowej w celu potwierdzenia diagnozy. Odróżnienie bakteryjnego i wirusowego zapalenia płuc pozostaje jednak wyzwaniem, ponieważ oba mają podobny obraz kliniczny.

Modelowanie matematyczne i sztuczna inteligencja mogą pomóc w zwiększeniu dokładności diagnozowania chorób na podstawie zdjęć radiologicznych. Głębokie uczenie się staje się coraz bardziej popularne w klasyfikacji obrazów medycznych, a kilka badań dotyczyło wykorzystania modeli splotowych sieci neuronowych (CNN) do automatycznej identyfikacji zapalenia płuc na podstawie zdjęć rentgenowskich klatki piersiowej. Jednak niezwykle ważne jest tworzenie wydajnych modeli, które mogą analizować dużą liczbę obrazów medycznych bez fałszywych negatywów.

Teraz KM Abubeker i S Baskar w Karpagam Akademia Szkolnictwa Wyższego w Indiach stworzyli nowatorską platformę uczenia maszynowego do klasyfikacji obrazów rentgenowskich klatki piersiowej w obrazach rentgenowskich klatki piersiowej na procesorze graficznym (GPU). Swoją strategię opisują m.in Uczenie maszynowe: nauka i technologia.

Optymalizacja danych treningowych

Wydajność klasyfikatora głębokiego uczenia zależy zarówno od modelu sieci neuronowej, jak i jakości danych wykorzystywanych do uczenia sieci. W przypadku obrazowania medycznego brak wystarczająco dużego zbioru danych jest główną przyczyną niskiej wydajności. Aby zaradzić temu brakowi, naukowcy wykorzystali rozszerzenie danych, w ramach którego nowe dane treningowe są syntetyzowane z istniejących danych (na przykład poprzez obracanie, przesuwanie i przycinanie obrazu), aby zestaw danych był bardziej wszechstronny i zróżnicowany.

Inną metodą stosowaną w celu rozwiązania problemu braku odpowiednich danych szkoleniowych jest uczenie się transferu – poprawa zdolności modelu do uczenia się nowego zadania przy użyciu istniejącej wiedzy uzyskanej podczas wykonywania powiązanego zadania. W pierwszej fazie swoich badań Abubeker i Baskar wykorzystali uczenie się transferu, aby wytrenować dziewięć najnowocześniejszych neuronowych modeli CNN, aby ocenić, czy zdjęcie rentgenowskie klatki piersiowej przedstawia zapalenie płuc.

Do eksperymentów wykorzystali zdjęcia rentgenowskie klatki piersiowej z publicznych zbiorów danych RSNA Kaggle, w tym obrazy do treningu (1341 sklasyfikowanych jako normalne, 1678 jako bakteryjne zapalenie płuc i 2197 jako wirusowe zapalenie płuc), testy (234 normalne, 184 bakteryjne zapalenie płuc, 206 wirusowe zapalenie płuc) ) i walidacji (76 normalnych, 48 bakteryjnych, 56 wirusowych). Zastosowanie geometrycznej augmentacji do zbioru danych rozszerzyło go do łącznie 2571 obrazów normalnego, bakteryjnego i 2019 wirusowego zapalenia płuc z 2625 r.

W oparciu o pomiary wydajności, w tym dokładność, pamięć i obszar pod krzywą ROC (AUROC, metryka podsumowująca wydajność w kilku progach), badacze wybrali trzy najlepsze modele CNN – DenseNet-160, ResNet-121 i VGGNet-16 – do przekwalifikowania przy użyciu techniki zespołowej.

Strategia zespołu

Zamiast polegać na jednym modelu uczenia maszynowego, modele zespołowe łączą wnioski z kilku modeli w celu zwiększenia wskaźników wydajności i zminimalizowania błędów. Badacze opracowali strategię zespołową opartą na transferze uczenia się, zwaną B2-Net, i wykorzystali ją w trzech wybranych CNN do stworzenia ostatecznego modelu. Zaimplementowali ostateczny model B2-Net na komputerze z procesorem graficznym NVIDIA Jetson Nano.

Model B2-Net do klasyfikacji zapalenia płuc na zdjęciach rentgenowskich klatki piersiowej

Zauważyli, że podczas szkolenia niektóre modele radziły sobie lepiej w identyfikacji normalnych zdjęć rentgenowskich, podczas gdy inne radziły sobie lepiej w identyfikacji próbek wirusowego i bakteryjnego zapalenia płuc. Strategia zespołowa wykorzystuje technikę głosowania ważonego, aby zapewnić każdemu klasyfikatorowi określony stopień mocy w oparciu o wcześniej zdefiniowane kryteria.

Przeszkolone modele wykazały znaczną poprawę dokładności diagnostycznej w porównaniu z modelami podstawowymi. Testowanie modeli na zrównoważonym zbiorze danych ujawniło, że DenseNet-160, ResNet-121 i VGGNet-16 osiągnęły wartości AUROC odpowiednio 0.9801, 0.9822 i 0.9955. Proponowane podejście zespołowe B2-Net przewyższało jednak wszystkie trzy, z AUROC na poziomie 0.9977.

Naukowcy ocenili i zweryfikowali B2-Net i pozostałe trzy modele, używając podzbioru około 600 zdjęć rentgenowskich klatki piersiowej z połączonego zestawu danych. DenseNet-160 błędnie zidentyfikował trzy obrazy testowe zapalenia płuc, podczas gdy VGGNet-16 i ResNet-121 błędnie zdiagnozowały po jednym zdjęciu rentgenowskim. Ogólnie rzecz biorąc, proponowane podejście B2-Net przewyższyło wszystkie inne modele, rozróżniając normalne przypadki, bakteryjne zapalenie płuc i wirusowe zapalenie płuc w obrazach rentgenowskich klatki piersiowej z dokładnością 97.69% i współczynnikiem przywołań (odsetek prawdziwie pozytywnych wyników wśród całkowitej liczby pozytywnych wyników). 100%.

Abubeker i Baskar wyjaśniają, że chociaż odsetek wyników fałszywie ujemnych jest najważniejszym kryterium klasyfikatora obrazów medycznych, proponowany model B2-Net stanowi najlepszą alternatywę dla zastosowań klinicznych w czasie rzeczywistym. „Takie podejście, szczególnie podczas obecnych światowych epidemii COVID-19, może pomóc radiologom w szybkim i niezawodnym diagnozowaniu zapalenia płuc, umożliwiając wczesne leczenie” – piszą.

Następnie planują rozszerzyć swój model, aby sklasyfikować więcej chorób płuc, w tym warianty gruźlicy i COVID-19.

Znak czasu:

Więcej z Świat Fizyki