מסגרת למידת מכונה מסווגת דלקת ריאות בצילומי רנטגן של החזה

מסגרת למידת מכונה מסווגת דלקת ריאות בצילומי רנטגן של החזה

תמונות רנטגן בחזה
בדוק נתונים תמונות רנטגן בחזה המציגות דוגמאות של ריאות תקינות (משמאל), דלקת ריאות חיידקית (במרכז) ודלקת ריאות ויראלית (מימין). (דרך ארץ: מאך. למד.: מדע. טכנול. 10.1088/2632-2153/acc30f)

דלקת ריאות היא זיהום ריאות שעלול להיות קטלני שמתקדם במהירות. חולים עם סימפטומים של דלקת ריאות - כגון שיעול יבש ופורץ, קשיי נשימה וחום גבוה - מקבלים בדרך כלל בדיקת סטטוסקופ של הריאות, ולאחר מכן צילום חזה כדי לאשר את האבחנה. עם זאת, ההבחנה בין דלקת ריאות חיידקית לויראלית נותרה אתגר, שכן לשניהם יש הצגה קלינית דומה.

מודלים מתמטיים ובינה מלאכותית יכולים לעזור לשפר את הדיוק של אבחון המחלה מתמונות רנטגן. למידה עמוקה הפכה פופולרית יותר ויותר עבור סיווג תמונות רפואיות, וכמה מחקרים בחנו את השימוש במודלים של רשתות עצביות קונבולוציונית (CNN) לזיהוי אוטומטי של דלקת ריאות מתמונות רנטגן בחזה. עם זאת, זה קריטי ליצור מודלים יעילים שיכולים לנתח מספר רב של תמונות רפואיות ללא תשלילים כוזבים.

כעת, KM Abubeker ו-S Baskar ב- האקדמיה להשכלה גבוהה קרפגם בהודו יצרו מסגרת חדשה ללימוד מכונה לסיווג דלקת ריאות של תמונות רנטגן של החזה ביחידת עיבוד גרפית (GPU). הם מתארים את האסטרטגיה שלהם ב למידת מכונה: מדע וטכנולוגיה.

אימון אופטימיזציה של נתונים

הביצועים של מסווג למידה עמוקה מסתמכים הן על מודל הרשת העצבית והן על איכות הנתונים המשמשים לאימון הרשת. עבור הדמיה רפואית, היעדר מערך נתונים גדול מספיק הוא הגורם העיקרי לביצועים נמוכים. כדי לטפל בחסר הזה, החוקרים השתמשו בהגדלת נתונים, שבה נתוני אימון חדשים מסונתזים מנתונים קיימים (למשל באמצעות סיבובי תמונות, הזזות וחיתולים) כדי להפוך את מערך הנתונים למקיף ומגוון יותר.

שיטה נוספת המופעלת כדי להתמודד עם היעדר נתוני הכשרה מתאימים היא למידת העברה - שיפור יכולתו של מודל ללמוד משימה חדשה תוך שימוש בידע קיים שהושג תוך כדי ביצוע משימה קשורה. בשלב הראשון של המחקר שלהם, אבובקר ובסקר השתמשו בלימוד העברה כדי לאמן תשעה מודלים עצביים חדישים של CNN כדי להעריך אם צילום רנטגן של החזה מציג דלקת ריאות או לא.

לצורך הניסויים, הם השתמשו בתמונות רנטגן של החזה ממערכי נתונים ציבוריים של RSNA Kaggle, כולל תמונות לאימון (1341 מסווגות כתקינות, 1678 כדלקת ריאות חיידקית ו-2197 כדלקת ריאות ויראלית), בדיקות (234 תקינות, 184 דלקות ריאות חיידקיות, 206 דלקת ריאות חיידקית ויראלית). ) ואימות (76 דלקת ריאות תקינה, 48 דלקת ריאות חיידקית, 56 דלקת ריאות ויראלית). יישום הגדלה גיאומטרית על מערך הנתונים הרחיב אותו לסך של 2571 תמונות נורמליות, 2019 חיידקיות ו-2625 תמונות של דלקת ריאות ויראלית.

בהתבסס על מדדי ביצועים הכוללים דיוק, ריקול והשטח מתחת לעקומת ה-ROC (AUROC, מדד המסכם ביצועים על פני מספר ספים), החוקרים בחרו את שלושת דגמי ה-CNN בעלי הביצועים הטובים ביותר - DenseNet-160, ResNet-121 ו-VGGNet-16 - לאימון מחדש בטכניקת אנסמבל.

אסטרטגיית אנסמבל

במקום להסתמך על מודל יחיד של לימוד מכונה, מודלים של אנסמבל מאגדים את המסקנות של מספר דגמים כדי להגביר את מדדי הביצועים ולמזער שגיאות. החוקרים פיתחו אסטרטגיית אנסמבל מבוססת למידה העברה בשם B2-Net והשתמשו בכך עם שלושת ה-CNN שנבחרו כדי ליצור מודל סופי. הם יישמו את המודל הסופי של B2-Net במחשב NVIDIA Jetson Nano GPU.

דגם B2-Net לסיווג דלקת ריאות בצילומי חזה

הם מציינים שבמהלך האימון, חלק מהמודלים הצליחו יותר בזיהוי תמונות רנטגן רגילות, בעוד שאחרים הצליחו יותר בזיהוי דגימות דלקת ריאות נגיפית וחיידקית. אסטרטגיית האנסמבל משתמשת בטכניקת הצבעה משוקללת כדי לספק לכל מסווג מידה מסוימת של כוח המבוססת על קריטריונים מוגדרים מראש.

המודלים שעברו הכשרה מחדש הראו שיפורים משמעותיים בדיוק האבחון לעומת המודלים הבסיסיים. בדיקת המודלים על מערך נתונים מאוזן העלתה כי DenseNet-160, ResNet-121 ו-VGGNet-16 השיגו ערכי AUROC של 0.9801, 0.9822 ו-0.9955, בהתאמה. עם זאת, גישת האנסמבל המוצעת של B2-Net עלתה על שלושתם, עם AUROC של 0.9977.

החוקרים העריכו ואימתו את B2-Net ואת שלושת המודלים האחרים תוך שימוש בתת-קבוצה של כ-600 תמונות רנטגן בחזה ממערך הנתונים המשולב. DenseNet-160 זיהה שגוי שלוש מתמונות בדיקת דלקת ריאות, בעוד VGGNet-16 ו-ResNet-121 אבחנו בטעות תמונת רנטגן אחת כל אחת. בסך הכל, גישת ה-B2-Net המוצעת עלתה על כל המודלים האחרים, תוך הבחנה בין מקרים רגילים, דלקת ריאות חיידקית ודלקת ריאות ויראלית בתמונות רנטגן בחזה עם דיוק של 97.69% ושיעור היזכרות (שיעור התוצאות החיוביות האמיתיות מבין המספר הכולל של התוצאות החיוביות) של 100%.

אבוקר ובסקר מסבירים כי בעוד ששיעור השלילי הכוזב הוא הקריטריון הקריטי ביותר למסווג תמונה רפואית, המודל המוצע של B2-Net מספק את האלטרנטיבה הטובה ביותר עבור יישומים קליניים בזמן אמת. "גישה זו, במיוחד במהלך התפרצויות ה-COVID-19 העולמיות הנוכחיות, יכולה לסייע לרדיולוגים באבחון מהיר ואמין של דלקת ריאות, ולאפשר טיפול מוקדם", הם כותבים.

בשלב הבא, הם מתכננים להרחיב את המודל שלהם כדי לסווג הפרעות ריאות נוספות, כולל גרסאות שחפת ו-COVID-19.

בול זמן:

עוד מ עולם הפיזיקה