El marco de aprendizaje automático clasifica la neumonía en las radiografías de tórax

El marco de aprendizaje automático clasifica la neumonía en las radiografías de tórax

Imágenes de rayos X de tórax
Datos de prueba Imágenes de rayos X de tórax que muestran ejemplos de pulmón normal (izquierda), neumonía bacteriana (centro) y neumonía viral (derecha). (Cortesía: Mach. Aprender.: Sci. Tecnología 10.1088/2632-2153/acc30f)

La neumonía es una infección pulmonar potencialmente fatal que progresa rápidamente. Los pacientes con síntomas de neumonía, como tos seca y áspera, dificultad para respirar y fiebre alta, generalmente reciben un examen de los pulmones con estetoscopio, seguido de una radiografía de tórax para confirmar el diagnóstico. Sin embargo, distinguir entre neumonía bacteriana y viral sigue siendo un desafío, ya que ambas tienen una presentación clínica similar.

El modelado matemático y la inteligencia artificial podrían ayudar a mejorar la precisión del diagnóstico de enfermedades a partir de imágenes radiográficas. El aprendizaje profundo se ha vuelto cada vez más popular para la clasificación de imágenes médicas, y varios estudios han explorado el uso de modelos de redes neuronales convolucionales (CNN) para identificar automáticamente la neumonía a partir de imágenes de rayos X de tórax. Sin embargo, es fundamental crear modelos eficientes que puedan analizar un gran número de imágenes médicas sin falsos negativos.

Ahora, KM Abubeker y S Baskar en el Academia Karpagam de Educación Superior en India han creado un nuevo marco de aprendizaje automático para la clasificación de neumonía de imágenes de rayos X de tórax en una unidad de procesamiento de gráficos (GPU). Describen su estrategia en Aprendizaje automático: ciencia y tecnología.

Optimización de datos de entrenamiento

El rendimiento de un clasificador de aprendizaje profundo se basa tanto en el modelo de red neuronal como en la calidad de los datos utilizados para entrenar la red. Para las imágenes médicas, la falta de un conjunto de datos lo suficientemente grande es la causa principal del rendimiento deficiente. Para abordar este déficit, los investigadores utilizaron el aumento de datos, en el que se sintetizan nuevos datos de entrenamiento a partir de datos existentes (por ejemplo, a través de rotaciones, cambios y recortes de imágenes) para hacer que el conjunto de datos sea más completo y diverso.

Otro método empleado para abordar la falta de datos de capacitación apropiados es el aprendizaje por transferencia: mejorar la capacidad de un modelo para aprender una nueva tarea utilizando el conocimiento existente obtenido al realizar una tarea relacionada. En la primera fase de su estudio, Abubeker y Baskar utilizaron el aprendizaje por transferencia para entrenar nueve modelos neuronales CNN de última generación para evaluar si una radiografía de tórax muestra o no neumonía.

Para los experimentos, utilizaron imágenes de rayos X de tórax de conjuntos de datos públicos de RSNA Kaggle, incluidas imágenes para entrenamiento (1341 clasificadas como normales, 1678 como neumonía bacteriana y 2197 como neumonía viral), pruebas (234 normales, 184 neumonía bacteriana, 206 neumonía viral ) y validación (76 normales, 48 ​​neumonías bacterianas, 56 neumonías virales). La aplicación de aumento geométrico al conjunto de datos lo expandió a un total de 2571 imágenes normales, 2019 bacterianas y 2625 de neumonía viral.

Con base en medidas de rendimiento que incluyen precisión, recuperación y el área bajo la curva ROC (AUROC, una métrica que resume el rendimiento en varios umbrales), los investigadores eligieron los tres modelos de CNN de mayor rendimiento: DenseNet-160, ResNet-121 y VGGNet-16. para el reentrenamiento utilizando una técnica de conjunto.

estrategia de conjunto

En lugar de depender de un solo modelo de aprendizaje automático, los modelos de conjuntos combinan las conclusiones de varios modelos para impulsar las métricas de rendimiento y minimizar los errores. Los investigadores desarrollaron una estrategia de conjunto basada en el aprendizaje de transferencia llamada B2-Net y la usaron con las tres CNN seleccionadas para crear un modelo final. Implementaron el modelo B2-Net final en una computadora GPU NVIDIA Jetson Nano.

Modelo B2-Net para clasificar neumonía en radiografías de tórax

Señalan que durante el entrenamiento, algunos modelos se desempeñaron mejor en la identificación de imágenes de rayos X normales, mientras que otros se desempeñaron mejor en la identificación de muestras de neumonía viral y bacteriana. La estrategia de conjunto utiliza una técnica de votación ponderada para proporcionar a cada clasificador un grado específico de poder basado en criterios predefinidos.

Los modelos reentrenados demostraron mejoras significativas en la precisión del diagnóstico con respecto a los modelos de referencia. La prueba de los modelos en un conjunto de datos equilibrado reveló que DenseNet-160, ResNet-121 y VGGNet-16 alcanzaron valores AUROC de 0.9801, 0.9822 y 0.9955, respectivamente. Sin embargo, el enfoque de conjunto B2-Net propuesto superó a los tres, con un AUROC de 0.9977.

Los investigadores evaluaron y validaron B2-Net y los otros tres modelos utilizando un subconjunto de alrededor de 600 imágenes de rayos X de tórax del conjunto de datos agrupados. DenseNet-160 identificó erróneamente tres de las imágenes de prueba de neumonía, mientras que VGGNet-16 y ResNet-121 diagnosticaron erróneamente una imagen de rayos X cada uno. En general, el enfoque B2-Net propuesto superó a todos los demás modelos, distinguiendo entre casos normales, neumonía bacteriana y neumonía viral en imágenes de rayos X de tórax con una precisión del 97.69 % y una tasa de recuperación (la proporción de verdaderos positivos entre el número total de positivos) del 100%.

Abubeker y Baskar explican que, si bien la tasa de falsos negativos es el criterio más crítico para un clasificador de imágenes médicas, el modelo B2-Net propuesto proporciona la mejor alternativa para aplicaciones clínicas en tiempo real. “Este enfoque, particularmente durante los brotes mundiales actuales de COVID-19, podría ayudar a los radiólogos a diagnosticar la neumonía de manera rápida y confiable, lo que permitiría un tratamiento temprano”, escriben.

Luego, planean expandir su modelo para clasificar más trastornos pulmonares, incluidas las variantes de TB y COVID-19.

Sello de tiempo:

Mas de Mundo de la física