기계 학습 프레임워크는 흉부 X선에서 폐렴을 분류합니다.

기계 학습 프레임워크는 흉부 X선에서 폐렴을 분류합니다.

흉부 엑스레이 이미지
테스트 데이터 정상 폐(왼쪽), 세균성 폐렴(가운데), 바이러스성 폐렴(오른쪽)의 예를 보여주는 흉부 X선 이미지입니다. (예의: 마하. 배우십시오.: 과학. 기술. 10.1088/2632-2153/acc30f)

폐렴은 빠르게 진행되는 잠재적으로 치명적인 폐 감염입니다. 마른 기침, 호흡 곤란, 고열 등 폐렴 증상이 있는 환자는 일반적으로 폐에 대한 청진기 검사를 받은 후 흉부 엑스레이를 촬영하여 진단을 확정합니다. 그러나 세균성 폐렴과 바이러스성 폐렴을 구별하는 것은 두 가지 모두 유사한 임상 증상을 보이기 때문에 여전히 어려운 문제로 남아 있습니다.

수학적 모델링과 인공지능은 방사선 영상을 통한 질병 진단의 정확성을 높이는 데 도움이 될 수 있습니다. 의료 이미지 분류를 위한 딥 러닝의 인기가 높아지고 있으며, 여러 연구에서는 CNN(컨볼루션 신경망) 모델을 사용하여 흉부 X선 이미지에서 폐렴을 자동으로 식별하는 방법을 연구했습니다. 그러나 거짓 부정 없이 다수의 의료 이미지를 분석할 수 있는 효율적인 모델을 만드는 것이 중요합니다.

이제 KM Abubeker와 S Baskar가 Karpagam 고등 교육 아카데미 인도에서는 GPU(그래픽 처리 장치)에서 흉부 X선 이미지의 폐렴 분류를 위한 새로운 기계 학습 프레임워크를 만들었습니다. 그들은 그들의 전략을 다음과 같이 설명합니다. 기계 학습: 과학 및 기술.

훈련 데이터 최적화

딥러닝 분류기의 성능은 신경망 모델과 네트워크 훈련에 사용되는 데이터의 품질에 따라 달라집니다. 의료 영상의 경우 충분히 큰 데이터 세트가 부족하면 성능이 저하되는 주요 원인이 됩니다. 이러한 부족함을 해결하기 위해 연구원들은 데이터 증강을 사용했습니다. 즉, 기존 데이터에서 새로운 훈련 데이터를 합성하여(예: 이미지 회전, 이동 및 자르기를 통해) 데이터세트를 더욱 포괄적이고 다양하게 만들었습니다.

적절한 훈련 데이터의 부족을 해결하기 위해 채택된 또 다른 방법은 전이 학습입니다. 즉, 관련 작업을 수행하면서 얻은 기존 지식을 사용하여 새로운 작업을 학습하는 모델의 능력을 향상시키는 것입니다. 연구의 첫 번째 단계에서 Abubeker와 Baskar는 흉부 X-레이가 폐렴을 나타내는지 여부를 평가하기 위해 전이 학습을 사용하여 XNUMX개의 최첨단 신경 CNN 모델을 훈련했습니다.

실험을 위해 그들은 훈련용 이미지(정상으로 분류된 1341개, 세균성 폐렴으로 분류된 1678개, 바이러스성 폐렴으로 분류된 2197개), 테스트용 이미지(정상 234개, 세균성 폐렴 184개, 바이러스성 폐렴 206개)를 포함하여 공개 RSNA Kaggle 데이터 세트의 흉부 X선 이미지를 사용했습니다. ) 및 검증(정상 76명, 세균성 폐렴 48명, 바이러스성 폐렴 56명). 데이터세트에 기하학적 확장을 적용하면 총 2571개의 정상 이미지, 2019년 박테리아 이미지, 2625개의 바이러스성 폐렴 이미지로 확장되었습니다.

정확성, 재현율 및 ROC 곡선 아래 영역(AUROC, 여러 임계값에 대한 성능을 요약하는 메트릭)을 포함한 성능 측정을 기반으로 연구원들은 세 가지 최고 성능의 CNN 모델인 DenseNet-160, ResNet-121 및 VGGNet-16을 선택했습니다. 앙상블 기법을 사용한 재훈련을 위한 것입니다.

앙상블 전략

앙상블 모델은 단일 기계 학습 모델에 의존하는 대신 여러 모델의 결론을 모아 성능 지표를 향상하고 오류를 최소화합니다. 연구원들은 B2-Net이라는 전이 학습 기반 앙상블 전략을 개발하고 이를 선택된 2개의 CNN과 함께 사용하여 최종 모델을 만들었습니다. 그들은 NVIDIA Jetson Nano GPU 컴퓨터에서 최종 BXNUMX-Net 모델을 구현했습니다.

흉부 엑스레이에서 폐렴을 분류하기 위한 B2-Net 모델

그들은 훈련 중에 일부 모델은 정상적인 X선 이미지를 식별하는 데 더 나은 성능을 보인 반면 다른 모델은 바이러스 및 세균성 폐렴 샘플을 식별하는 데 더 나은 성능을 발휘했다고 지적합니다. 앙상블 전략은 가중치 투표 기법을 사용하여 사전 정의된 기준에 따라 특정 수준의 검정력을 각 분류자에게 제공합니다.

재훈련된 모델은 기준 모델에 비해 진단 정확도가 크게 향상되었음을 보여주었습니다. 균형 잡힌 데이터 세트에서 모델을 테스트한 결과 DenseNet-160, ResNet-121 및 VGGNet-16은 각각 0.9801, 0.9822 및 0.9955의 AUROC 값을 달성한 것으로 나타났습니다. 그러나 제안된 B2-Net 앙상블 접근 방식은 AUROC가 0.9977로 세 가지 모두를 능가했습니다.

연구원들은 풀링된 데이터 세트에서 약 2개의 흉부 X선 이미지의 하위 집합을 사용하여 B600-Net과 다른 세 가지 모델을 평가하고 검증했습니다. DenseNet-160은 폐렴 테스트 이미지 16개를 잘못 식별한 반면, VGGNet-121과 ResNet-2은 각각 X선 이미지 97.69개를 잘못 진단했습니다. 전반적으로 제안된 B100-Net 접근 방식은 흉부 X선 영상에서 정상 사례, 세균성 폐렴, 바이러스성 폐렴을 구분하는 등 다른 모든 모델보다 우수한 성능을 보였으며 XNUMX%의 정확도와 재현율(전체 양성자 중 참양성자의 비율)을 나타냈습니다. XNUMX%.

Abubeker와 Baskar는 위음성율이 의료 영상 분류기의 가장 중요한 기준이지만 제안된 B2-Net 모델은 실시간 임상 적용을 위한 최상의 대안을 제공한다고 설명합니다. “이러한 접근 방식은 특히 현재 전 세계적으로 코로나19가 발생하는 동안 방사선 전문의가 신속하고 안정적으로 폐렴을 진단하여 조기 치료가 가능하도록 도울 수 있습니다.”라고 그들은 썼습니다.

다음으로 그들은 결핵과 코로나19 변종을 포함한 더 많은 폐 질환을 분류하기 위해 모델을 확장할 계획입니다.

타임 스탬프 :

더보기 물리 세계