Khung học máy phân loại viêm phổi trên phim X-quang ngực

Khung học máy phân loại viêm phổi trên phim X-quang ngực

Hình ảnh X-quang ngực
Dữ liệu kiểm tra Hình ảnh X-quang ngực cho thấy phổi bình thường (trái), viêm phổi do vi khuẩn (giữa) và viêm phổi do virus (phải). (Lịch sự: máy móc. Tìm hiểu.: Khoa học. công nghệ. 10.1088/2632-2153/acc30f)

Viêm phổi là một bệnh nhiễm trùng phổi có khả năng gây tử vong và tiến triển nhanh chóng. Bệnh nhân có các triệu chứng viêm phổi – chẳng hạn như ho khan, ho khan, khó thở và sốt cao – thường được kiểm tra phổi bằng ống nghe, sau đó chụp X-quang ngực để xác nhận chẩn đoán. Tuy nhiên, việc phân biệt giữa viêm phổi do vi khuẩn và virus vẫn còn là một thách thức vì cả hai đều có biểu hiện lâm sàng tương tự nhau.

Mô hình toán học và trí tuệ nhân tạo có thể giúp cải thiện độ chính xác của chẩn đoán bệnh từ hình ảnh X quang. Học sâu ngày càng trở nên phổ biến trong việc phân loại hình ảnh y tế và một số nghiên cứu đã khám phá việc sử dụng mô hình mạng lưới thần kinh tích chập (CNN) để tự động xác định bệnh viêm phổi từ hình ảnh X-quang ngực. Tuy nhiên, điều quan trọng là tạo ra các mô hình hiệu quả có thể phân tích số lượng lớn hình ảnh y tế mà không có kết quả âm tính giả.

Bây giờ, KM Abubeker và S Baskar tại Học viện giáo dục đại học Karpagam ở Ấn Độ đã tạo ra một khung học máy mới để phân loại bệnh viêm phổi bằng hình ảnh X-quang ngực trên bộ xử lý đồ họa (GPU). Họ mô tả chiến lược của họ trong Học máy: Khoa học và Công nghệ.

Tối ưu hóa dữ liệu đào tạo

Hiệu suất của bộ phân loại học sâu phụ thuộc vào cả mô hình mạng thần kinh và chất lượng dữ liệu được sử dụng để huấn luyện mạng. Đối với hình ảnh y tế, việc thiếu tập dữ liệu đủ lớn là nguyên nhân chính dẫn đến hiệu suất dưới mức trung bình. Để giải quyết sự thiếu hụt này, các nhà nghiên cứu đã sử dụng tính năng tăng cường dữ liệu, trong đó dữ liệu đào tạo mới được tổng hợp từ dữ liệu hiện có (ví dụ: thông qua xoay, dịch chuyển và cắt ảnh) để làm cho tập dữ liệu toàn diện và đa dạng hơn.

Một phương pháp khác được sử dụng để giải quyết tình trạng thiếu dữ liệu đào tạo phù hợp là học chuyển giao - nâng cao năng lực của mô hình để học một nhiệm vụ mới bằng cách sử dụng kiến ​​thức hiện có thu được khi thực hiện một nhiệm vụ liên quan. Trong giai đoạn đầu tiên của nghiên cứu, Abubeker và Baskar đã sử dụng phương pháp học chuyển giao để huấn luyện chín mô hình CNN thần kinh tiên tiến nhất nhằm đánh giá liệu ảnh chụp X-quang ngực có mô tả bệnh viêm phổi hay không.

Đối với các thí nghiệm, họ đã sử dụng hình ảnh X-quang ngực từ bộ dữ liệu RSNA Kaggle công cộng, bao gồm các hình ảnh để huấn luyện (1341 được phân loại là bình thường, 1678 là viêm phổi do vi khuẩn và 2197 là viêm phổi do vi rút), xét nghiệm (234 trường hợp bình thường, 184 trường hợp viêm phổi do vi khuẩn, 206 trường hợp viêm phổi do vi rút). ) và xác nhận (76 trường hợp bình thường, 48 trường hợp viêm phổi do vi khuẩn, 56 trường hợp viêm phổi do virus). Việc áp dụng tăng cường hình học cho tập dữ liệu đã mở rộng nó lên tổng số 2571 hình ảnh bình thường, 2019 hình ảnh vi khuẩn và 2625 hình ảnh viêm phổi do virus.

Dựa trên các thước đo hiệu suất bao gồm độ chính xác, khả năng thu hồi và diện tích dưới đường cong ROC (AUROC, một số liệu tóm tắt hiệu suất qua nhiều ngưỡng), các nhà nghiên cứu đã chọn ba mô hình CNN hoạt động tốt nhất – DenseNet-160, ResNet-121 và VGGNet-16 – để đào tạo lại bằng cách sử dụng kỹ thuật hòa tấu.

Chiến lược tập hợp

Thay vì dựa vào một mô hình học máy duy nhất, các mô hình tập hợp tổng hợp kết luận của một số mô hình để tăng cường các chỉ số hiệu suất và giảm thiểu sai sót. Các nhà nghiên cứu đã phát triển một chiến lược tổng hợp dựa trên học tập chuyển giao có tên là B2-Net và sử dụng chiến lược này với ba CNN đã chọn để tạo ra mô hình cuối cùng. Họ đã triển khai mô hình B2-Net cuối cùng trên máy tính GPU NVIDIA Jetson Nano.

Mô hình B2-Net phân loại viêm phổi trên X-quang ngực

Họ lưu ý rằng trong quá trình đào tạo, một số mô hình hoạt động tốt hơn trong việc xác định hình ảnh X-quang bình thường, trong khi những mô hình khác hoạt động tốt hơn trong việc xác định các mẫu bệnh viêm phổi do virus và vi khuẩn. Chiến lược tổng hợp sử dụng kỹ thuật bỏ phiếu có trọng số để cung cấp cho mỗi bộ phân loại một mức độ quyền lực cụ thể dựa trên các tiêu chí được xác định trước.

Các mô hình được đào tạo lại đã chứng minh những cải thiện đáng kể về độ chính xác trong chẩn đoán so với các mô hình cơ sở. Thử nghiệm các mô hình trên tập dữ liệu cân bằng cho thấy DenseNet-160, ResNet-121 và VGGNet-16 đạt được các giá trị AUROC lần lượt là 0.9801, 0.9822 và 0.9955. Tuy nhiên, phương pháp tiếp cận tổng thể B2-Net được đề xuất đã vượt trội hơn cả ba phương pháp này, với AUROC là 0.9977.

Các nhà nghiên cứu đã đánh giá và xác nhận B2-Net và ba mô hình khác bằng cách sử dụng tập hợp con khoảng 600 hình ảnh X-quang ngực từ tập dữ liệu tổng hợp. DenseNet-160 đã xác định sai ba hình ảnh xét nghiệm viêm phổi, trong khi VGGNet-16 và ResNet-121 chẩn đoán sai một hình ảnh X-quang. Nhìn chung, phương pháp B2-Net được đề xuất vượt trội hơn tất cả các mô hình khác, phân biệt giữa các trường hợp bình thường, viêm phổi do vi khuẩn và viêm phổi do virus trong hình ảnh X-quang ngực với độ chính xác 97.69% và tỷ lệ thu hồi (tỷ lệ dương tính thật trong tổng số dương tính) là 100%.

Abubeker và Baskar giải thích rằng mặc dù tỷ lệ âm tính giả là tiêu chí quan trọng nhất đối với bộ phân loại hình ảnh y tế, nhưng mô hình B2-Net được đề xuất cung cấp giải pháp thay thế tốt nhất cho các ứng dụng lâm sàng theo thời gian thực. Họ viết: “Phương pháp tiếp cận này, đặc biệt là trong đợt bùng phát COVID-19 trên toàn thế giới hiện nay, có thể hỗ trợ các bác sĩ X quang chẩn đoán bệnh viêm phổi nhanh chóng và đáng tin cậy, cho phép điều trị sớm”.

Tiếp theo, họ có kế hoạch mở rộng mô hình của mình để phân loại nhiều bệnh về phổi hơn, bao gồm các biến thể của bệnh lao và COVID-19.

Dấu thời gian:

Thêm từ Thế giới vật lý