Механізм машинного навчання класифікує пневмонію на рентгенівських знімках грудної клітки

Механізм машинного навчання класифікує пневмонію на рентгенівських знімках грудної клітки

Рентгенівські зображення грудної клітини
Дані тесту Рентгенівські зображення грудної клітки демонструють приклади нормальної легені (ліворуч), бактеріальної пневмонії (у центрі) та вірусної пневмонії (праворуч). (З дозволу: мах. Навч.: наук. технол. 10.1088/2632-2153/acc30f)

Пневмонія — це потенційно смертельна легенева інфекція, яка швидко прогресує. Пацієнти з такими симптомами пневмонії, як сухий надривний кашель, утруднене дихання та висока температура, зазвичай отримують стетоскопічний огляд легенів, а потім рентген грудної клітки для підтвердження діагнозу. Проте розрізнення між бактеріальною та вірусною пневмонією залишається проблемою, оскільки обидва мають подібну клінічну картину.

Математичне моделювання та штучний інтелект можуть допомогти підвищити точність діагностики захворювань на рентгенографічних зображеннях. Глибоке навчання стає все більш популярним для класифікації медичних зображень, і кілька досліджень вивчали використання моделей згорткової нейронної мережі (CNN) для автоматичної ідентифікації пневмонії на рентгенівських знімках грудної клітки. Однак дуже важливо створити ефективні моделі, які можуть аналізувати велику кількість медичних зображень без помилкових негативів.

Тепер К. М. Абубекер і С. Баскар на Карпагамська академія вищої освіти в Індії створили нову структуру машинного навчання для класифікації пневмонії рентгенівських зображень грудної клітини на графічному процесорі (GPU). Вони описують свою стратегію в Машинне навчання: наука і техніка.

Оптимізація навчальних даних

Продуктивність класифікатора глибокого навчання залежить як від моделі нейронної мережі, так і від якості даних, які використовуються для навчання мережі. Для медичної візуалізації відсутність достатньо великого набору даних є основною причиною низької продуктивності. Щоб усунути цю нестачу, дослідники використали доповнення даних, у якому нові навчальні дані синтезуються з існуючих даних (наприклад, за допомогою обертання зображень, зсувів і обрізання), щоб зробити набір даних більш повним і різноманітним.

Інший метод, який використовується для усунення нестачі відповідних навчальних даних, – це перенесення навчання – покращення здатності моделі вивчати нове завдання, використовуючи наявні знання, отримані під час виконання пов’язаного завдання. На першому етапі свого дослідження Абубекер і Баскар використовували перехідне навчання, щоб навчити дев’ять найсучасніших нейронних моделей CNN, щоб оцінити, чи відображає рентген грудної клітки пневмонію.

Для експериментів вони використовували рентгенівські зображення грудної клітки з загальнодоступних наборів даних RSNA Kaggle, включаючи зображення для навчання (1341 класифіковані як нормальні, 1678 як бактеріальна пневмонія та 2197 як вірусна пневмонія), тестування (234 нормальні, 184 бактеріальні пневмонії, 206 вірусні пневмонії). ) та перевірка (76 нормальних, 48 бактеріальних пневмоній, 56 вірусних пневмоній). Застосування геометричного доповнення до набору даних розширило його до 2571 нормальних, 2019 бактеріальних і 2625 зображень вірусної пневмонії.

Ґрунтуючись на показниках ефективності, включаючи точність, запам’ятовування та площу під кривою ROC (AUROC, метрика, яка підсумовує продуктивність за кількома пороговими значеннями), дослідники вибрали три найефективніші моделі CNN – DenseNet-160, ResNet-121 і VGGNet-16 – для перепідготовки за методикою ансамблю.

Ансамблева стратегія

Замість того, щоб покладатися на одну модель машинного навчання, ансамблеві моделі об’єднують висновки кількох моделей, щоб покращити показники продуктивності та мінімізувати помилки. Дослідники розробили ансамблеву стратегію на основі навчання, яка називається B2-Net, і використали її з трьома вибраними CNN для створення остаточної моделі. Остаточну модель B2-Net вони реалізували на комп’ютері NVIDIA Jetson Nano GPU.

Модель B2-Net для класифікації пневмонії на рентгенівських знімках грудної клітки

Вони відзначають, що під час навчання деякі моделі показали кращі результати в ідентифікації нормальних рентгенівських зображень, тоді як інші продемонстрували кращі результати в ідентифікації зразків вірусної та бактеріальної пневмонії. Стратегія ансамблю використовує метод зваженого голосування, щоб надати кожному класифікатору певний ступінь влади на основі попередньо визначених критеріїв.

Повторно навчені моделі продемонстрували значні покращення діагностичної точності порівняно з базовими моделями. Тестування моделей на збалансованому наборі даних показало, що DenseNet-160, ResNet-121 і VGGNet-16 досягли значень AUROC 0.9801, 0.9822 і 0.9955 відповідно. Запропонований комплексний підхід B2-Net, однак, перевершив усі три, з AUROC 0.9977.

Дослідники оцінили та підтвердили B2-Net та інші три моделі, використовуючи підмножину з приблизно 600 рентгенівських зображень грудної клітки з об’єднаного набору даних. DenseNet-160 помилково встановив три знімки тесту на пневмонію, тоді як VGGNet-16 і ResNet-121 помилково діагностували по одному рентгенівському знімку. Загалом, запропонований підхід B2-Net перевершив усі інші моделі, розрізняючи звичайні випадки, бактеріальну пневмонію та вірусну пневмонію на рентгенівських знімках грудної клітки з точністю 97.69% і коефіцієнтом запам’ятовування (частка справжніх позитивних результатів серед загальної кількості позитивних). на 100%.

Абубекер і Баскар пояснюють, що хоча частота хибнонегативних результатів є найважливішим критерієм для класифікатора медичних зображень, запропонована модель B2-Net є найкращою альтернативою для клінічних застосувань у реальному часі. «Цей підхід, особливо під час нинішніх світових спалахів COVID-19, міг би допомогти радіологам швидко та надійно діагностувати пневмонію, дозволяючи раннє лікування», — пишуть вони.

Далі вони планують розширити свою модель, щоб класифікувати більше легеневих захворювань, включаючи варіанти туберкульозу та COVID-19.

Часова мітка:

Більше від Світ фізики