मशीन-लर्निंग फ्रेमवर्क छाती के एक्स-रे पर निमोनिया का वर्गीकरण करता है

मशीन-लर्निंग फ्रेमवर्क छाती के एक्स-रे पर निमोनिया का वर्गीकरण करता है

छाती के एक्स-रे चित्र
डेटा का परीक्षण करें छाती के एक्स-रे चित्र सामान्य फेफड़े (बाएं), बैक्टीरियल निमोनिया (केंद्र), और वायरल निमोनिया (दाएं) के उदाहरण दिखा रहे हैं। (शिष्टाचार: मच. जानें.: विज्ञान. तकनीक. 10.1088/2632-2153/एसीसी30एफ)

निमोनिया एक संभावित घातक फेफड़ों का संक्रमण है जो तेजी से बढ़ता है। निमोनिया के लक्षणों वाले मरीज़ - जैसे सूखी, तेज़ खांसी, सांस लेने में कठिनाई और तेज़ बुखार - आम तौर पर निदान की पुष्टि करने के लिए फेफड़ों की स्टेथोस्कोप जांच की जाती है, इसके बाद छाती का एक्स-रे किया जाता है। हालाँकि, बैक्टीरियल और वायरल निमोनिया के बीच अंतर करना एक चुनौती बनी हुई है, क्योंकि दोनों की नैदानिक ​​​​प्रस्तुति समान है।

गणितीय मॉडलिंग और कृत्रिम बुद्धिमत्ता रेडियोग्राफिक छवियों से रोग निदान की सटीकता में सुधार करने में मदद कर सकती है। चिकित्सा छवि वर्गीकरण के लिए गहन शिक्षण तेजी से लोकप्रिय हो गया है, और कई अध्ययनों ने छाती के एक्स-रे छवियों से निमोनिया की स्वचालित रूप से पहचान करने के लिए कन्वेन्शनल न्यूरल नेटवर्क (सीएनएन) मॉडल के उपयोग का पता लगाया है। हालाँकि, ऐसे कुशल मॉडल बनाना महत्वपूर्ण है जो झूठी नकारात्मकताओं के बिना बड़ी संख्या में चिकित्सा छवियों का विश्लेषण कर सकें।

अब, केएम अबुबेकर और एस भास्कर उच्च शिक्षा के करपगम अकादमी भारत में ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) पर छाती के एक्स-रे छवियों के निमोनिया वर्गीकरण के लिए एक उपन्यास मशीन-लर्निंग ढांचा बनाया गया है। वे अपनी रणनीति का वर्णन करते हैं मशीन लर्निंग: विज्ञान और प्रौद्योगिकी.

प्रशिक्षण डेटा अनुकूलन

डीप-लर्निंग क्लासिफायर का प्रदर्शन तंत्रिका नेटवर्क मॉडल और नेटवर्क को प्रशिक्षित करने के लिए उपयोग किए जाने वाले डेटा की गुणवत्ता दोनों पर निर्भर करता है। मेडिकल इमेजिंग के लिए, पर्याप्त बड़े डेटासेट की कमी खराब प्रदर्शन का एक प्राथमिक कारण है। इस कमी को दूर करने के लिए, शोधकर्ताओं ने डेटा संवर्द्धन का उपयोग किया, जिसमें डेटासेट को अधिक व्यापक और विविध बनाने के लिए मौजूदा डेटा (उदाहरण के लिए छवि रोटेशन, बदलाव और फसलों के माध्यम से) से नए प्रशिक्षण डेटा को संश्लेषित किया जाता है।

उपयुक्त प्रशिक्षण डेटा की कमी को दूर करने के लिए नियोजित एक अन्य विधि ट्रांसफर लर्निंग है - संबंधित कार्य करते समय प्राप्त मौजूदा ज्ञान का उपयोग करके एक नया कार्य सीखने के लिए एक मॉडल की क्षमता में सुधार करना। अपने अध्ययन के पहले चरण में, अबुबेकर और बास्कर ने नौ अत्याधुनिक तंत्रिका सीएनएन मॉडल को प्रशिक्षित करने के लिए ट्रांसफर लर्निंग का उपयोग किया ताकि यह आकलन किया जा सके कि छाती का एक्स-रे निमोनिया को चित्रित करता है या नहीं।

प्रयोगों के लिए, उन्होंने सार्वजनिक आरएसएनए कागल डेटासेट से छाती के एक्स-रे छवियों का उपयोग किया, जिसमें प्रशिक्षण के लिए छवियां (1341 सामान्य, 1678 बैक्टीरियल निमोनिया और 2197 वायरल निमोनिया के रूप में वर्गीकृत), परीक्षण (234 सामान्य, 184 बैक्टीरियल निमोनिया, 206 वायरल निमोनिया) शामिल हैं। ) और सत्यापन (76 सामान्य, 48 बैक्टीरियल निमोनिया, 56 वायरल निमोनिया)। डेटासेट में ज्यामितीय वृद्धि लागू करने से इसका कुल 2571 सामान्य, 2019 बैक्टीरियल और 2625 वायरल निमोनिया छवियों तक विस्तार हुआ।

सटीकता, रिकॉल और आरओसी वक्र (एयूआरओसी, कई सीमाओं पर प्रदर्शन को सारांशित करने वाला एक मीट्रिक) सहित प्रदर्शन उपायों के आधार पर, शोधकर्ताओं ने तीन शीर्ष प्रदर्शन करने वाले सीएनएन मॉडल - डेंसनेट-160, रेसनेट-121, और वीजीजीनेट-16 को चुना। एक संयोजन तकनीक का उपयोग करके पुनः प्रशिक्षण के लिए।

सामूहिक रणनीति

एकल मशीन-लर्निंग मॉडल पर भरोसा करने के बजाय, प्रदर्शन मेट्रिक्स को बढ़ावा देने और त्रुटियों को कम करने के लिए सामूहिक मॉडल कई मॉडलों के निष्कर्षों को एकत्रित करते हैं। शोधकर्ताओं ने बी2-नेट नामक एक स्थानांतरण शिक्षण-आधारित संयोजन रणनीति विकसित की और अंतिम मॉडल बनाने के लिए तीन चयनित सीएनएन के साथ इसका उपयोग किया। उन्होंने NVIDIA जेटसन नैनो GPU कंप्यूटर पर अंतिम B2-नेट मॉडल लागू किया।

छाती के एक्स-रे में निमोनिया को वर्गीकृत करने के लिए बी2-नेट मॉडल

उन्होंने ध्यान दिया कि प्रशिक्षण के दौरान, कुछ मॉडलों ने सामान्य एक्स-रे छवियों की पहचान करने में बेहतर प्रदर्शन किया, जबकि अन्य ने वायरल और बैक्टीरियल निमोनिया नमूनों की पहचान करने में बेहतर प्रदर्शन किया। संयोजन रणनीति प्रत्येक क्लासिफायरियर को पूर्वनिर्धारित मानदंडों के आधार पर एक विशिष्ट डिग्री की शक्ति प्रदान करने के लिए एक भारित वोटिंग तकनीक का उपयोग करती है।

पुनः प्रशिक्षित मॉडलों ने बेसलाइन मॉडलों की तुलना में नैदानिक ​​सटीकता में महत्वपूर्ण सुधार प्रदर्शित किए। संतुलित डेटासेट पर मॉडलों का परीक्षण करने से पता चला कि DenseNet-160, ResNet-121 और VGGNet-16 ने क्रमशः 0.9801, 0.9822 और 0.9955 के AUROC मान प्राप्त किए। हालाँकि, प्रस्तावित बी2-नेट एन्सेबल दृष्टिकोण ने 0.9977 के एयूआरओसी के साथ तीनों से बेहतर प्रदर्शन किया।

शोधकर्ताओं ने एकत्रित डेटासेट से लगभग 2 छाती एक्स-रे छवियों के सबसेट का उपयोग करके बी600-नेट और अन्य तीन मॉडलों का मूल्यांकन और सत्यापन किया। DenseNet-160 ने निमोनिया परीक्षण छवियों में से तीन की गलत पहचान की, जबकि VGGNet-16 और ResNet-121 ने एक-एक एक्स-रे छवि की गलत पहचान की। कुल मिलाकर, प्रस्तावित बी2-नेट दृष्टिकोण ने अन्य सभी मॉडलों से बेहतर प्रदर्शन किया, 97.69% सटीकता और रिकॉल दर (सकारात्मक की कुल संख्या के बीच वास्तविक सकारात्मकता का अनुपात) के साथ छाती के एक्स-रे छवियों में सामान्य मामलों, बैक्टीरियल निमोनिया और वायरल निमोनिया के बीच अंतर किया। 100% का.

अबुबेकर और बास्कर बताते हैं कि जबकि झूठी नकारात्मक दर एक चिकित्सा छवि वर्गीकरणकर्ता के लिए सबसे महत्वपूर्ण मानदंड है, प्रस्तावित बी 2-नेट मॉडल वास्तविक समय नैदानिक ​​​​अनुप्रयोगों के लिए सबसे अच्छा विकल्प प्रदान करता है। "यह दृष्टिकोण, विशेष रूप से वर्तमान विश्वव्यापी सीओवीआईडी ​​​​-19 के प्रकोप के दौरान, रेडियोलॉजिस्ट को निमोनिया का तेजी से और विश्वसनीय निदान करने में सहायता कर सकता है, जिससे शीघ्र उपचार की अनुमति मिल सकती है," वे लिखते हैं।

इसके बाद, वे टीबी और सीओवीआईडी-19 वेरिएंट सहित अधिक फेफड़ों के विकारों को वर्गीकृत करने के लिए अपने मॉडल का विस्तार करने की योजना बना रहे हैं।

समय टिकट:

से अधिक भौतिकी की दुनिया