Makine öğrenimi çerçevesi, akciğer röntgenlerinde pnömoniyi sınıflandırıyor

Makine öğrenimi çerçevesi, akciğer röntgenlerinde pnömoniyi sınıflandırıyor

Göğüs röntgeni görüntüleri
Test verisi Normal akciğer (solda), bakteriyel pnömoni (ortada) ve viral pnömoni (sağda) örneklerini gösteren göğüs röntgeni görüntüleri. (Nezaket: Mak. Öğrenin.: Bilim. Teknoloji. 10.1088/2632-2153/acc30f)

Zatürre, hızla ilerleyen potansiyel olarak ölümcül bir akciğer enfeksiyonudur. Kuru, şiddetli öksürük, nefes alma güçlüğü ve yüksek ateş gibi pnömoni semptomları olan hastalara genellikle akciğerleri steteskopla muayene edilir ve ardından tanıyı doğrulamak için göğüs röntgeni çekilir. Bununla birlikte, bakteriyel ve viral pnömoniyi birbirinden ayırmak, her ikisinin de benzer klinik bulgulara sahip olması nedeniyle hala bir zorluktur.

Matematiksel modelleme ve yapay zeka, radyografik görüntülerden hastalık teşhisinin doğruluğunun artırılmasına yardımcı olabilir. Derin öğrenme, tıbbi görüntü sınıflandırmasında giderek daha popüler hale geldi ve çeşitli çalışmalar, göğüs röntgeni görüntülerinden pnömoniyi otomatik olarak tanımlamak için evrişimli sinir ağı (CNN) modellerinin kullanımını araştırdı. Ancak çok sayıda tıbbi görüntüyü yanlış negatifler olmadan analiz edebilecek etkili modeller oluşturmak kritik öneme sahiptir.

Şimdi KM Abubeker ve S Baskar Karpagam Yüksek Öğrenim Akademisi Hindistan'da, göğüs röntgeni görüntülerinin bir grafik işleme biriminde (GPU) pnömoni sınıflandırmasına yönelik yeni bir makine öğrenimi çerçevesi oluşturuldu. Stratejilerini şu şekilde açıklıyorlar: Makine Öğrenimi: Bilim ve Teknoloji.

Eğitim verileri optimizasyonu

Derin öğrenme sınıflandırıcısının performansı, hem sinir ağı modeline hem de ağı eğitmek için kullanılan verilerin kalitesine bağlıdır. Tıbbi görüntüleme için yeterince büyük bir veri kümesinin bulunmaması, ortalamanın altında performansın temel nedenidir. Bu eksikliği gidermek için araştırmacılar, veri kümesini daha kapsamlı ve çeşitli hale getirmek amacıyla mevcut verilerden (örneğin görüntü döndürme, kaydırma ve kırpma yoluyla) yeni eğitim verilerinin sentezlendiği veri artırmayı kullandılar.

Uygun eğitim verilerinin eksikliğini gidermek için kullanılan diğer bir yöntem ise transfer öğrenimidir; ilgili bir görevi yerine getirirken elde edilen mevcut bilgiyi kullanarak bir modelin yeni bir görevi öğrenme kapasitesinin arttırılmasıdır. Çalışmalarının ilk aşamasında Abubeker ve Baskar, göğüs röntgeninin zatürreyi yansıtıp yansıtmadığını değerlendirmek için son teknolojiye sahip dokuz nöral CNN modelini eğitmek üzere transfer öğrenmeyi kullandı.

Deneyler için, eğitim amaçlı görüntüler (1341'i normal, 1678'i bakteriyel pnömoni ve 2197'si viral pnömoni olarak sınıflandırılmış), test (234 normal, 184 bakteriyel pnömoni, 206 viral pnömoni) dahil olmak üzere halka açık RSNA Kaggle veri setlerinden göğüs röntgeni görüntüleri kullanıldı. ) ve doğrulama (76 normal, 48 bakteriyel pnömoni, 56 viral pnömoni). Veri kümesine geometrik büyütme uygulandığında, veri seti toplam 2571 normal, 2019 bakteriyel ve 2625 viral pnömoni görüntüsüne genişletildi.

Doğruluk, geri çağırma ve ROC eğrisinin altındaki alanı (AUROC, çeşitli eşiklerdeki performansı özetleyen bir ölçüm) içeren performans ölçümlerine dayanarak araştırmacılar en iyi performans gösteren üç CNN modelini seçtiler: DenseNet-160, ResNet-121 ve VGGNet-16. bir topluluk tekniği kullanarak yeniden eğitim için.

Topluluk stratejisi

Topluluk modelleri, tek bir makine öğrenimi modeline güvenmek yerine, performans ölçümlerini artırmak ve hataları en aza indirmek için çeşitli modellerin sonuçlarını bir araya getirir. Araştırmacılar, B2-Net adı verilen transfer öğrenmeye dayalı bir topluluk stratejisi geliştirdiler ve bunu seçilen üç CNN ile nihai bir model oluşturmak için kullandılar. Son B2-Net modelini bir NVIDIA Jetson Nano GPU bilgisayarında uyguladılar.

Göğüs röntgeninde pnömoniyi sınıflandırmak için B2-Net modeli

Eğitim sırasında bazı modellerin normal X-ışını görüntülerini tanımlamada daha iyi performans gösterdiğini, diğerlerinin ise viral ve bakteriyel pnömoni örneklerini tanımlamada daha iyi performans gösterdiğini belirtiyorlar. Topluluk stratejisi, her sınıflandırıcıya önceden tanımlanmış kriterlere dayalı olarak belirli bir güç derecesi sağlamak için ağırlıklı bir oylama tekniği kullanır.

Yeniden eğitilen modeller, temel modellere göre teşhis doğruluğunda önemli gelişmeler gösterdi. Modellerin dengeli bir veri seti üzerinde test edilmesi, DenseNet-160, ResNet-121 ve VGGNet-16'nın sırasıyla 0.9801, 0.9822 ve 0.9955 AUROC değerlerine ulaştığını ortaya çıkardı. Ancak önerilen B2-Net topluluk yaklaşımı, 0.9977'lik AUROC ile üçünü de geride bıraktı.

Araştırmacılar, havuzlanmış veri kümesinden yaklaşık 2 göğüs röntgeni görüntüsünden oluşan bir alt kümeyi kullanarak B600-Net ve diğer üç modeli değerlendirdi ve doğruladı. DenseNet-160 zatürre testi görüntülerinden üçünü yanlış tanımladı; VGGNet-16 ve ResNet-121 ise birer röntgen görüntüsünü yanlış teşhis etti. Genel olarak önerilen B2-Net yaklaşımı, göğüs röntgeni görüntülerinde normal vakaları, bakteriyel pnömoniyi ve viral pnömoniyi %97.69 doğruluk ve geri çağırma oranı (toplam pozitif sayısı içindeki gerçek pozitiflerin oranı) ile ayırt ederek diğer tüm modellerden daha iyi performans gösterdi. %100.

Abubeker ve Baskar, tıbbi görüntü sınıflandırıcı için yanlış negatif oranının en kritik kriter olmasına rağmen önerilen B2-Net modelinin gerçek zamanlı klinik uygulamalar için en iyi alternatifi sağladığını açıklıyor. "Bu yaklaşım, özellikle dünya çapındaki mevcut COVID-19 salgınları sırasında, radyologların zatürreyi hızlı ve güvenilir bir şekilde teşhis etmesine yardımcı olarak erken tedaviye olanak sağlayabilir" diye yazıyorlar.

Daha sonra modellerini, TB ve COVID-19 varyantları da dahil olmak üzere daha fazla akciğer hastalığını sınıflandırmak için genişletmeyi planlıyorlar.

Zaman Damgası:

Den fazla Fizik dünyası