بہتر AI ماڈلز بنانے کے لیے "بلیک باکس" کو کھولنا

بہتر AI ماڈلز بنانے کے لیے "بلیک باکس" کو کھولنا

بہتر AI ماڈلز PlatoBlockchain Data Intelligence بنانے کے لیے "بلیک باکس" کو کھولنا۔ عمودی تلاش۔ عی

جب گہرے سیکھنے کے ماڈل حقیقی دنیا میں تعینات کیے جاتے ہیں، شاید کریڈٹ کارڈ کی سرگرمی سے مالی فراڈ کا پتہ لگانے یا طبی تصاویر میں کینسر کی نشاندہی کرنے کے لیے، وہ اکثر انسانوں کو پیچھے چھوڑنے کے قابل ہوتے ہیں۔

لیکن یہ گہری سیکھنے والے ماڈلز بالکل کیا سیکھ رہے ہیں؟ کیا کلینیکل امیجز میں جلد کے کینسر کی نشاندہی کرنے کے لیے تربیت یافتہ ماڈل، مثال کے طور پر، دراصل کینسر والے ٹشو کے رنگ اور ساخت سیکھتا ہے، یا کیا یہ کچھ دوسری خصوصیات یا نمونوں کو جھنجھوڑ رہا ہے؟

یہ طاقتور مشین لرننگ ماڈل عام طور پر پر مبنی ہوتے ہیں۔ مصنوعی اعصابی نیٹ ورک جس میں لاکھوں نوڈس ہوسکتے ہیں جو پیشین گوئی کرنے کے لیے ڈیٹا پر کارروائی کرتے ہیں۔ ان کی پیچیدگی کی وجہ سے، محققین اکثر ان ماڈلز کو "بلیک باکس" کہتے ہیں کیونکہ ان کو بنانے والے سائنس دان بھی ہر اس چیز کو نہیں سمجھتے جو ہڈ کے نیچے چل رہا ہے۔

سٹیفنی جیگلکا اس "بلیک باکس" کی وضاحت سے مطمئن نہیں ہیں۔ ایم آئی ٹی ڈیپارٹمنٹ آف الیکٹریکل انجینئرنگ اور کمپیوٹر سائنس میں ایک نئے عہدے پر فائز ایسوسی ایٹ پروفیسر، جیگلکا یہ سمجھنے کے لیے گہرائی سے سیکھ رہے ہیں کہ یہ ماڈل کیا سیکھ سکتے ہیں اور وہ کیسے برتاؤ کرتے ہیں، اور ان ماڈلز میں کچھ پیشگی معلومات کیسے تیار کی جائیں۔

"دن کے اختتام پر، ایک گہری سیکھنے والا ماڈل کیا سیکھے گا اس کا انحصار بہت سے عوامل پر ہوتا ہے۔ لیکن عملی طور پر متعلقہ سمجھ پیدا کرنے سے ہمیں بہتر ماڈلز کو ڈیزائن کرنے میں مدد ملے گی، اور یہ سمجھنے میں بھی مدد ملے گی کہ ان کے اندر کیا چل رہا ہے تاکہ ہم جان سکیں کہ ہم کب ماڈل لگا سکتے ہیں اور کب نہیں کر سکتے۔ یہ انتہائی اہم ہے،" جیگلکا کہتی ہیں، جو کمپیوٹر سائنس اور مصنوعی ذہانت لیبارٹری (CSAIL) اور انسٹی ٹیوٹ فار ڈیٹا، سسٹمز اور سوسائٹی (IDSS) کی رکن بھی ہیں۔

جیگلکا خاص طور پر مشین لرننگ ماڈلز کو بہتر بنانے میں دلچسپی رکھتی ہے جب ان پٹ ڈیٹا گراف کی شکل میں ہو۔ گراف ڈیٹا مخصوص چیلنجز پیش کرتا ہے: مثال کے طور پر، ڈیٹا میں موجود معلومات انفرادی نوڈس اور کناروں کے ساتھ ساتھ ساخت کے بارے میں دونوں معلومات پر مشتمل ہوتی ہے — کس چیز سے منسلک ہے۔ اس کے علاوہ، گرافس میں ریاضیاتی ہم آہنگی ہوتی ہے جس کا مشین لرننگ ماڈل کے ذریعے احترام کرنا ضروری ہے تاکہ، مثال کے طور پر، ایک ہی گراف ہمیشہ ایک ہی پیشین گوئی کی طرف لے جائے۔ مشین لرننگ ماڈل میں اس طرح کی ہم آہنگی بنانا عام طور پر آسان نہیں ہوتا ہے۔

مثال کے طور پر مالیکیولز کو لے لیں۔ مالیکیولز کو گراف کے طور پر پیش کیا جا سکتا ہے، اس کے عمودی خطوط جو ایٹموں اور کناروں سے مماثلت رکھتے ہیں جو ان کے درمیان کیمیائی بندھن سے مطابقت رکھتے ہیں۔ ڈرگ کمپنیاں بہت سے مالیکیولز کی خصوصیات کی تیزی سے پیشین گوئی کرنے کے لیے گہری سیکھنے کا استعمال کرنا چاہتی ہیں، اس تعداد کو کم کرتی ہیں جو انہیں لیب میں جسمانی طور پر ٹیسٹ کرنا ہوں گی۔

جیگلکا ریاضیاتی مشین لرننگ ماڈلز بنانے کے طریقوں کا مطالعہ کرتا ہے جو گراف ڈیٹا کو مؤثر طریقے سے ان پٹ اور آؤٹ پٹ کے طور پر لے سکتے ہیں، اس صورت میں مالیکیول کی کیمیائی خصوصیات کی پیشین گوئی۔ یہ خاص طور پر مشکل ہے کیونکہ ایک مالیکیول کی خصوصیات کا تعین نہ صرف اس کے اندر موجود ایٹموں سے ہوتا ہے بلکہ ان کے درمیان رابطوں سے بھی ہوتا ہے۔  

گرافس پر مشین لرننگ کی دیگر مثالوں میں ٹریفک روٹنگ، چپ ڈیزائن، اور تجویز کنندہ سسٹم شامل ہیں۔

ان ماڈلز کو ڈیزائن کرنا اس حقیقت کی وجہ سے اور بھی مشکل بنا دیا گیا ہے کہ ان کی تربیت کے لیے استعمال ہونے والا ڈیٹا اکثر اس ڈیٹا سے مختلف ہوتا ہے جو ماڈل عملی طور پر دیکھتے ہیں۔ شاید ماڈل کو چھوٹے مالیکیولر گرافس یا ٹریفک نیٹ ورکس کا استعمال کرتے ہوئے تربیت دی گئی تھی، لیکن ایک بار تعینات کیے جانے کے بعد یہ جو گراف دیکھتا ہے وہ بڑا یا زیادہ پیچیدہ ہوتا ہے۔

اس صورت میں، محققین اس ماڈل سے کیا سیکھنے کی توقع کر سکتے ہیں، اور کیا یہ اب بھی عملی طور پر کام کرے گا اگر حقیقی دنیا کا ڈیٹا مختلف ہے؟

جیگلکا کا کہنا ہے کہ "کمپیوٹر سائنس میں کچھ سختی کے مسائل کی وجہ سے آپ کا ماڈل سب کچھ سیکھنے کے قابل نہیں ہو گا، لیکن آپ کیا سیکھ سکتے ہیں اور کیا نہیں سیکھ سکتے اس کا انحصار اس بات پر ہے کہ آپ ماڈل کو کیسے ترتیب دیتے ہیں،" جیگلکا کہتی ہیں۔

وہ الگورتھم اور مجرد ریاضی کے لیے اپنے شوق کو مشین لرننگ کے لیے اپنے جوش کے ساتھ جوڑ کر اس سوال تک پہنچتی ہے۔

تتلیوں سے بائیو انفارمیٹکس تک

جیگلکا جرمنی کے ایک چھوٹے سے قصبے میں پلا بڑھا اور جب وہ ہائی اسکول کی طالبہ تھی سائنس میں دلچسپی لی۔ ایک معاون استاد نے اسے بین الاقوامی سائنس مقابلے میں حصہ لینے کی ترغیب دی۔ وہ اور امریکہ اور سنگاپور سے اس کے ساتھیوں نے تین زبانوں میں تتلیوں کے بارے میں بنائی گئی ویب سائٹ کے لیے ایک ایوارڈ جیتا ہے۔

"ہمارے پراجیکٹ کے لیے، ہم نے ایک مقامی یونیورسٹی آف اپلائیڈ سائنسز میں اسکیننگ الیکٹران مائیکروسکوپ کے ساتھ پروں کی تصاویر لیں۔ مجھے مرسڈیز بینز میں ایک تیز رفتار کیمرہ استعمال کرنے کا موقع بھی ملا — یہ کیمرہ عام طور پر کمبشن انجنوں کو فلماتا ہے — جسے میں تتلی کے پروں کی حرکت کی سست رفتار ویڈیو کیپچر کرنے کے لیے استعمال کرتا تھا۔ یہ پہلا موقع تھا جب میں واقعی سائنس اور ایکسپلوریشن سے جڑا تھا،‘‘ وہ یاد کرتی ہیں۔

حیاتیات اور ریاضی دونوں سے دلچسپی رکھتے ہوئے، جیگلکا نے یونیورسٹی آف ٹوبنجن اور آسٹن کی یونیورسٹی آف ٹیکساس میں بائیو انفارمیٹکس پڑھنے کا فیصلہ کیا۔ اس کے پاس انڈرگریجویٹ کے طور پر تحقیق کرنے کے چند مواقع تھے، بشمول جارج ٹاؤن یونیورسٹی میں کمپیوٹیشنل نیورو سائنس میں انٹرنشپ، لیکن اس بات کا یقین نہیں تھا کہ کس کیریئر کی پیروی کرنا ہے۔

جب وہ کالج کے اپنے آخری سال کے لیے واپس آئی تو جیگلکا دو روم میٹ کے ساتھ چلی گئیں جو ٹوبنجن کے میکس پلانک انسٹی ٹیوٹ میں ریسرچ اسسٹنٹ کے طور پر کام کر رہے تھے۔

"وہ مشین لرننگ پر کام کر رہے تھے، اور یہ مجھے بہت اچھا لگا۔ مجھے اپنا بیچلر کا مقالہ لکھنا تھا، اس لیے میں نے انسٹی ٹیوٹ میں پوچھا کہ کیا ان کے پاس میرے لیے کوئی پروجیکٹ ہے۔ میں نے میکس پلانک انسٹی ٹیوٹ میں مشین لرننگ پر کام کرنا شروع کیا اور مجھے یہ پسند آیا۔ میں نے وہاں بہت کچھ سیکھا، اور یہ تحقیق کے لیے ایک بہترین جگہ تھی،‘‘ وہ کہتی ہیں۔

وہ ماسٹر کا مقالہ مکمل کرنے کے لیے میکس پلانک انسٹی ٹیوٹ میں رہیں، اور پھر میکس پلانک انسٹی ٹیوٹ اور سوئس فیڈرل انسٹی ٹیوٹ آف ٹیکنالوجی میں مشین لرننگ میں پی ایچ ڈی کی ڈگری حاصل کی۔.

اپنی پی ایچ ڈی کے دوران، اس نے دریافت کیا کہ کس طرح مجرد ریاضی کے تصورات مشین سیکھنے کی تکنیک کو بہتر بنانے میں مدد کر سکتے ہیں۔

سیکھنے کے لیے ماڈلز سکھانا

جیگلکا نے مشین لرننگ کے بارے میں جتنا زیادہ سیکھا، ماڈلز کے برتاؤ اور اس رویے کو کیسے آگے بڑھانا ہے اس کو سمجھنے کے چیلنجوں سے وہ اتنی ہی زیادہ پرجوش ہوتی گئی۔

"آپ مشین لرننگ کے ساتھ بہت کچھ کر سکتے ہیں، لیکن صرف اس صورت میں جب آپ کے پاس صحیح ماڈل اور ڈیٹا ہو۔ یہ صرف ایک بلیک باکس چیز نہیں ہے جہاں آپ اسے ڈیٹا پر پھینک دیتے ہیں اور یہ کام کرتا ہے۔ آپ کو درحقیقت اس کے بارے میں سوچنا ہوگا، اس کی خصوصیات، اور آپ ماڈل کو کیا سیکھنا اور کرنا چاہتے ہیں،" وہ کہتی ہیں۔

برکلے کی یونیورسٹی آف کیلیفورنیا میں پوسٹ ڈاک مکمل کرنے کے بعد، جیگلکا کو تحقیق پر لگا دیا گیا اور اس نے اکیڈمیا میں کیریئر بنانے کا فیصلہ کیا۔ اس نے 2015 میں ایم آئی ٹی میں اسسٹنٹ پروفیسر کے طور پر فیکلٹی میں شمولیت اختیار کی۔

"میں نے شروع سے ہی MIT کے بارے میں جو چیز واقعی پسند کی تھی، وہ یہ تھی کہ لوگ تحقیق اور تخلیقی صلاحیتوں کا بہت زیادہ خیال رکھتے ہیں۔ یہ وہی ہے جو میں MIT کے بارے میں سب سے زیادہ تعریف کرتا ہوں. یہاں کے لوگ اصلیت اور تحقیق میں گہرائی کو اہمیت دیتے ہیں،" وہ کہتی ہیں۔

تخلیقی صلاحیتوں پر اس توجہ نے جیگلکا کو موضوعات کی ایک وسیع رینج کو تلاش کرنے کے قابل بنایا ہے۔

MIT میں دیگر فیکلٹی کے ساتھ مل کر، وہ بائیولوجی، امیجنگ، کمپیوٹر ویژن، اور میٹریل سائنس میں مشین لرننگ ایپلی کیشنز کا مطالعہ کرتی ہے۔

لیکن جو چیز واقعی جیگلکا کو چلاتی ہے وہ مشین لرننگ کے بنیادی اصولوں کی تحقیقات کر رہی ہے، اور حال ہی میں، مضبوطی کا مسئلہ۔ اکثر، ایک ماڈل تربیتی ڈیٹا پر اچھی کارکردگی کا مظاہرہ کرتا ہے، لیکن اس کی کارکردگی اس وقت بگڑ جاتی ہے جب اسے قدرے مختلف ڈیٹا پر لگایا جاتا ہے۔ وہ کہتی ہیں کہ ماڈل میں پیشگی معلومات کی تعمیر اسے زیادہ قابل اعتماد بنا سکتی ہے، لیکن یہ سمجھنا کہ ماڈل کو کامیاب ہونے کے لیے کن معلومات کی ضرورت ہے اور اسے کیسے بنایا جائے، وہ اتنا آسان نہیں ہے۔

وہ تصویر کی درجہ بندی کے لیے مشین لرننگ ماڈلز کی کارکردگی کو بہتر بنانے کے طریقے بھی تلاش کر رہی ہے۔

تصویری درجہ بندی کے ماڈلز ہر جگہ ہیں، موبائل فون پر چہرے کی شناخت کے نظام سے لے کر سوشل میڈیا پر جعلی اکاؤنٹس کی شناخت کرنے والے ٹولز تک۔ ان ماڈلز کو تربیت کے لیے بڑے پیمانے پر ڈیٹا کی ضرورت ہوتی ہے، لیکن چونکہ لاکھوں تصاویر پر ہاتھ سے لیبل لگانا انسانوں کے لیے مہنگا ہے، اس لیے محققین اکثر ماڈلز کو پہلے سے تربیت دینے کے لیے بغیر لیبل والے ڈیٹا سیٹس کا استعمال کرتے ہیں۔

یہ ماڈل پھر ان نمائندگیوں کو دوبارہ استعمال کرتے ہیں جو انہوں نے سیکھی ہیں جب انہیں بعد میں کسی خاص کام کے لیے ٹھیک بنایا جاتا ہے۔

مثالی طور پر، محققین چاہتے ہیں کہ ماڈل پہلے سے تربیت کے دوران زیادہ سے زیادہ سیکھے، تاکہ وہ اس علم کو اپنے بہاو کے کام پر لاگو کر سکے۔ لیکن عملی طور پر، یہ ماڈل اکثر صرف چند آسان ارتباط سیکھتے ہیں — جیسے کہ ایک تصویر میں دھوپ ہوتی ہے اور ایک میں سایہ ہوتا ہے — اور تصاویر کی درجہ بندی کرنے کے لیے ان "شارٹ کٹس" کا استعمال کرتے ہیں۔

"ہم نے ظاہر کیا کہ یہ 'متضاد سیکھنے' میں ایک مسئلہ ہے، جو کہ نظریاتی اور تجرباتی طور پر، پری ٹریننگ کے لیے ایک معیاری تکنیک ہے۔ لیکن ہم یہ بھی ظاہر کرتے ہیں کہ آپ ان معلومات کی اقسام کو متاثر کر سکتے ہیں جن کی نمائندگی کرنے کے لیے ماڈل سیکھے گا ڈیٹا کی اقسام میں ترمیم کر کے جو آپ ماڈل دکھاتے ہیں۔ یہ سمجھنے کی طرف ایک قدم ہے کہ ماڈل عملی طور پر کیا کرنے جا رہے ہیں،" وہ کہتی ہیں۔

محققین اب بھی ہر اس چیز کو نہیں سمجھتے جو گہری سیکھنے والے ماڈل کے اندر چلتی ہے، یا اس بارے میں تفصیلات کہ وہ کس طرح اثر انداز ہو سکتے ہیں کہ ماڈل کیا سیکھتا ہے اور اس کا برتاؤ کیسے ہوتا ہے، لیکن جیگلکا ان موضوعات کی تلاش جاری رکھنے کے منتظر ہیں۔

"اکثر مشین لرننگ میں، ہم عملی طور پر کچھ ہوتے ہوئے دیکھتے ہیں اور ہم اسے نظریاتی طور پر سمجھنے کی کوشش کرتے ہیں۔ یہ ایک بہت بڑا چیلنج ہے۔ آپ ایک ایسی سمجھ پیدا کرنا چاہتے ہیں جو آپ کو عملی طور پر نظر آنے والی چیزوں سے مماثل ہو، تاکہ آپ بہتر کام کر سکیں۔ ہم ابھی بھی اسے سمجھنے کی شروعات میں ہیں،" وہ کہتی ہیں۔

لیب کے باہر، جیگلکا موسیقی، آرٹ، سفر اور سائیکلنگ کا مداح ہے۔ لیکن ان دنوں، وہ اپنا زیادہ تر فارغ وقت اپنی پری اسکول کی عمر کی بیٹی کے ساتھ گزارتی ہیں۔

<!–
->

ٹائم اسٹیمپ:

سے زیادہ بلاکچین کنسلٹنٹس