مشین لرننگ فریم ورک سینے کے ایکس رے پر نمونیا کی درجہ بندی کرتا ہے۔

مشین لرننگ فریم ورک سینے کے ایکس رے پر نمونیا کی درجہ بندی کرتا ہے۔

سینے کے ایکسرے کی تصاویر
ٹیسٹ ڈیٹا سینے کے ایکسرے کی تصاویر جو عام پھیپھڑوں (بائیں)، بیکٹیریل نمونیا (درمیان)، اور وائرل نمونیا (دائیں) کی مثالیں دکھاتی ہیں۔ (بشکریہ: مچ سیکھیں۔: سائنس۔ ٹیکنالوجی. 10.1088/2632-2153/acc30f)

نمونیا ایک ممکنہ طور پر مہلک پھیپھڑوں کا انفیکشن ہے جو تیزی سے بڑھتا ہے۔ نمونیا کی علامات والے مریض - جیسے خشک، کھانسی، سانس لینے میں دشواری اور تیز بخار - عام طور پر پھیپھڑوں کا اسٹیتھوسکوپ معائنہ کرتے ہیں، جس کے بعد تشخیص کی تصدیق کے لیے سینے کا ایکسرے کیا جاتا ہے۔ بیکٹیریل اور وائرل نمونیا کے درمیان فرق کرنا، تاہم، ایک چیلنج بنی ہوئی ہے، کیونکہ دونوں کی طبی پیش کش ایک جیسی ہے۔

ریاضیاتی ماڈلنگ اور مصنوعی ذہانت ریڈیوگرافک امیجز سے بیماری کی تشخیص کی درستگی کو بہتر بنانے میں مدد کر سکتی ہے۔ طبی امیج کی درجہ بندی کے لیے گہری تعلیم تیزی سے مقبول ہو رہی ہے، اور کئی مطالعات نے سینے کی ایکسرے امیجز سے نمونیا کی خود بخود شناخت کرنے کے لیے convolutional neural network (CNN) ماڈلز کے استعمال کی کھوج کی ہے۔ تاہم، یہ انتہائی اہم ہے کہ ایسے موثر ماڈلز بنائیں جو غلط منفی کے بغیر بڑی تعداد میں طبی امیجز کا تجزیہ کر سکیں۔

اب، کے ایم ابوبکر اور ایس باسکر کرپاگام اکیڈمی آف ہائر ایجوکیشن ہندوستان میں گرافکس پروسیسنگ یونٹ (GPU) پر سینے کے ایکسرے امیجز کی نمونیا کی درجہ بندی کے لیے ایک نیا مشین لرننگ فریم ورک بنایا ہے۔ میں اپنی حکمت عملی بیان کرتے ہیں۔ مشین لرننگ: سائنس اور ٹیکنالوجی.

ڈیٹا کی اصلاح کی تربیت

گہری سیکھنے والے درجہ بندی کی کارکردگی کا انحصار نیورل نیٹ ورک ماڈل اور نیٹ ورک کو تربیت دینے کے لیے استعمال ہونے والے ڈیٹا کے معیار دونوں پر ہوتا ہے۔ میڈیکل امیجنگ کے لیے، کافی بڑے ڈیٹاسیٹ کی کمی سب پار کارکردگی کی بنیادی وجہ ہے۔ اس کمی کو پورا کرنے کے لیے، محققین نے ڈیٹا بڑھانے کا استعمال کیا، جس میں ڈیٹاسیٹ کو مزید جامع اور متنوع بنانے کے لیے موجودہ ڈیٹا (مثال کے طور پر تصویری گردش، شفٹوں اور فصلوں کے ذریعے) سے نئے تربیتی ڈیٹا کی ترکیب کی جاتی ہے۔

مناسب تربیتی ڈیٹا کی کمی کو دور کرنے کے لیے استعمال کیا جانے والا ایک اور طریقہ ٹرانسفر لرننگ ہے - متعلقہ کام کو انجام دینے کے دوران حاصل کردہ موجودہ علم کا استعمال کرتے ہوئے ایک نیا کام سیکھنے کے لیے ماڈل کی صلاحیت کو بہتر بنانا۔ اپنے مطالعے کے پہلے مرحلے میں، ابوبکر اور باسکر نے نو جدید ترین نیورل CNN ماڈلز کو تربیت دینے کے لیے ٹرانسفر لرننگ کا استعمال کیا تاکہ یہ اندازہ لگایا جا سکے کہ آیا سینے کا ایکسرے نمونیا کی تصویر کشی کرتا ہے یا نہیں۔

تجربات کے لیے، انہوں نے عوامی RSNA Kaggle ڈیٹاسیٹس سے سینے کی ایکسرے کی تصاویر کا استعمال کیا، بشمول تربیت کے لیے تصاویر (1341 کو نارمل درجہ بندی، 1678 کو بیکٹیریل نمونیا اور 2197 کو وائرل نمونیا کے طور پر)، ٹیسٹنگ (234 نارمل، 184 بیکٹیریل نمونیا، pneumonia) ) اور توثیق (206 نارمل، 76 بیکٹیریل نمونیا، 48 وائرل نمونیا)۔ ڈیٹاسیٹ پر جیومیٹرک اضافہ کو لاگو کرنے سے اسے مجموعی طور پر 56 نارمل، 2571 بیکٹیریل اور 2019 وائرل نمونیا امیجز تک پھیلا دیا گیا۔

کارکردگی کے اقدامات بشمول درستگی، یاد کرنے اور ROC منحنی خطوط کے تحت (AUROC، کئی حدوں پر کارکردگی کا ایک میٹرک خلاصہ) کی بنیاد پر محققین نے تین اعلیٰ کارکردگی دکھانے والے CNN ماڈلز - DenseNet-160، ResNet-121، اور VGGNet-16 کا انتخاب کیا۔ ایک ensemble تکنیک کا استعمال کرتے ہوئے دوبارہ تربیت کے لیے۔

جوڑ کی حکمت عملی

ایک واحد مشین لرننگ ماڈل پر انحصار کرنے کے بجائے، جوڑا ماڈل کارکردگی کے میٹرکس کو بڑھانے اور غلطیوں کو کم کرنے کے لیے کئی ماڈلز کے نتائج کو جمع کرتے ہیں۔ محققین نے B2-Net نامی ٹرانسفر لرننگ پر مبنی جوڑ کی حکمت عملی تیار کی اور اسے حتمی ماڈل بنانے کے لیے تین منتخب CNNs کے ساتھ استعمال کیا۔ انہوں نے حتمی B2-Net ماڈل کو NVIDIA Jetson Nano GPU کمپیوٹر پر لاگو کیا۔

سینے کے ایکس رے میں نمونیا کی درجہ بندی کے لیے B2-Net ماڈل

وہ نوٹ کرتے ہیں کہ تربیت کے دوران، کچھ ماڈلز نے عام ایکسرے امیجز کی شناخت میں بہتر کارکردگی کا مظاہرہ کیا، جبکہ دیگر نے وائرل اور بیکٹیریل نمونیا کے نمونوں کی شناخت میں بہتر کارکردگی کا مظاہرہ کیا۔ جوڑا حکمت عملی ایک وزنی ووٹنگ تکنیک کا استعمال کرتی ہے تاکہ ہر درجہ بندی کرنے والے کو پہلے سے طے شدہ معیار کی بنیاد پر طاقت کی ایک مخصوص ڈگری فراہم کی جا سکے۔

دوبارہ تربیت یافتہ ماڈلز نے بیس لائن ماڈلز کے مقابلے میں تشخیصی درستگی میں نمایاں بہتری کا مظاہرہ کیا۔ متوازن ڈیٹا سیٹ پر ماڈلز کی جانچ کرنے سے پتہ چلا کہ DenseNet-160، ResNet-121 اور VGGNet-16 نے بالترتیب 0.9801، 0.9822 اور 0.9955 کی AUROC قدریں حاصل کیں۔ تاہم، مجوزہ B2-Net ensemble اپروچ نے 0.9977 کے AUROC کے ساتھ، تینوں کو پیچھے چھوڑ دیا۔

محققین نے B2-Net اور دیگر تین ماڈلز کا جائزہ لیا اور ان کی توثیق کی جو کہ جمع کیے گئے ڈیٹاسیٹ سے تقریباً 600 سینے کی ایکس رے امیجز کے ذیلی سیٹ کا استعمال کرتے ہیں۔ DenseNet-160 نے نمونیا ٹیسٹ کی تین تصاویر کی غلط شناخت کی، جبکہ VGGNet-16 اور ResNet-121 نے ایک ایک ایکسرے تصویر کی غلط تشخیص کی۔ مجموعی طور پر، مجوزہ B2-Net اپروچ نے دیگر تمام ماڈلز سے بہتر کارکردگی کا مظاہرہ کیا، 97.69% درستگی کے ساتھ سینے کے ایکسرے امیجز میں عام کیسز، بیکٹیریل نمونیا اور وائرل نمونیا کے درمیان فرق کرتے ہوئے اور یاد کرنے کی شرح (مثبت کی کل تعداد میں حقیقی مثبت کا تناسب) 100٪ کا۔

ابوبکر اور باسکر وضاحت کرتے ہیں کہ اگرچہ غلط منفی شرح طبی تصویر کی درجہ بندی کرنے والے کے لیے سب سے اہم معیار ہے، مجوزہ B2-Net ماڈل ریئل ٹائم کلینیکل ایپلی کیشنز کے لیے بہترین متبادل فراہم کرتا ہے۔ وہ لکھتے ہیں، "یہ نقطہ نظر، خاص طور پر موجودہ دنیا بھر میں COVID-19 کے پھیلاؤ کے دوران، ریڈیولوجسٹوں کو نمونیا کی تیزی سے اور قابل اعتماد طریقے سے تشخیص کرنے میں مدد کر سکتا ہے، جس سے جلد علاج ممکن ہو سکے،" وہ لکھتے ہیں۔

اس کے بعد، وہ پھیپھڑوں کے مزید عارضوں کی درجہ بندی کرنے کے لیے اپنے ماڈل کو وسعت دینے کا ارادہ رکھتے ہیں، بشمول TB اور COVID-19 کی مختلف اقسام۔

ٹائم اسٹیمپ:

سے زیادہ طبیعیات کی دنیا