DALL-E کا شکریہ، مصنوعی پروٹین کی دوائیں بنانے کی دوڑ پلیٹو بلاکچین ڈیٹا انٹیلی جنس پر ہے۔ عمودی تلاش۔ عی

DALL-E کی بدولت، مصنوعی پروٹین ادویات بنانے کی دوڑ جاری ہے۔

یاد رکھیں جب AI کا استعمال کرتے ہوئے پروٹین کی شکلوں کی پیش گوئی کرنا اس سال کی پیش رفت تھی؟

یہ پرانی خبر ہے۔ ہونا تقریبا تمام پروٹین ڈھانچے کو حل کیا حیاتیات سے واقف، AI اب ایک نئے چیلنج کی طرف متوجہ ہو رہا ہے: شروع سے پروٹین ڈیزائن کرنا۔

علمی تعاقب سے دور، یہ کوشش منشیات کی دریافت کے لیے ایک ممکنہ گیم چینجر ہے۔ جسم کے اندر کسی بھی ہدف کے لیے پروٹین کی دوائیں تیار کرنے کی صلاحیت کا ہونا — جیسا کہ کینسر کی نشوونما اور پھیلاؤ کو متحرک کرنا — ہمارے بدترین طبی دشمنوں سے نمٹنے کے لیے ادویات کی ایک نئی کائنات کا آغاز کر سکتا ہے۔

یہ کوئی تعجب کی بات نہیں ہے کہ متعدد AI پاور ہاؤسز چیلنج کا جواب دے رہے ہیں۔ حیرت کی بات یہ ہے کہ وہ ایک ہی نقطہ نظر پر اکٹھے ہو گئے۔ اس سال ڈیپ مائنڈ، میٹا، اور واشنگٹن یونیورسٹی میں ڈاکٹر ڈیوڈ بیکر کی ٹیم سب نے ایک غیر متوقع ذریعہ سے تحریک لی: DALL-E اور GPT-3۔

ان پیدا کرنے والے الگورتھم نے دنیا کو طوفان میں لے لیا ہے۔ جب روزمرہ کی انگریزی میں صرف چند آسان اشارے دیئے جاتے ہیں، تو پروگرام ذہن کو موڑنے والی تصاویر، تخلیقی تحریر کے پیراگراف، یا فلمی مناظر تیار کر سکتے ہیں، اور یہاں تک کہ جدید ترین فیشن ڈیزائنوں کو بھی ریمکس کر سکتے ہیں۔ وہی بنیادی ٹیکنالوجی حال ہی میں ایک وار لیا کمپیوٹر کوڈ لکھنے میں، ایک انتہائی چیلنجنگ پروگرامنگ کام میں تقریباً نصف انسانی حریفوں کو بہترین بنانا۔

اس میں سے کسی کا پروٹین سے کیا تعلق ہے؟

بات یہ ہے: پروٹین بنیادی طور پر ثانوی ڈھانچے میں ڈھالے گئے "حروف" کے تار ہوتے ہیں — سوچیں جملے — اور پھر 3D "پیراگراف۔" اگر AI خوبصورت تصاویر اور صاف ستھری تحریر تیار کر سکتا ہے، تو کیوں نہ ضابطہ حیات کو دوبارہ لکھنے کے لیے ٹیکنالوجی کا ساتھ دے؟

یہاں آو چیمپئنز

پروٹین زندگی کی کلید ہے۔ یہ ہمارے جسم کو بناتا ہے۔ یہ ہمارے میٹابولزم کو چلاتا ہے۔ یہ دماغ کے پیچیدہ افعال کو زیر کرتا ہے۔ یہ نئی ادویات کی دولت کی بنیاد بھی ہے جو ہمارے آج تک کے کچھ ناقابل تسخیر صحت کے مسائل کا علاج کر سکتی ہے — اور بائیو ایندھن کے نئے ذرائع پیدا کر سکتی ہے، لیبارٹری میں تیار کردہ گوشت، یا یہاں تک کہ مصنوعی حیاتیات کے ذریعے مکمل طور پر ناول لائففارمز۔

اگرچہ "پروٹین" اکثر چکن کے چھاتیوں کی تصویریں نکالتا ہے، لیکن یہ مالیکیول ایک پیچیدہ لیگو پہیلی سے زیادہ ملتے جلتے ہیں۔ پروٹین کی تعمیر کا آغاز امینو ایسڈز کی ایک تار سے ہوتا ہے — ایک تار پر کرسمس لائٹس کے ہزارہا کے بارے میں سوچیں — جو پھر 3D ڈھانچے میں بند ہو جاتی ہیں (جیسے انہیں ذخیرہ کرنے کے لیے بڑھانا)۔

ڈیپ مائنڈ اور بیکر دونوں نے اس وقت لہریں بنائیں جب ان میں سے ہر ایک نے اپنے امینو ایسڈ کی ترتیب کی بنیاد پر کسی بھی پروٹین کی ساخت کا اندازہ لگانے کے لیے الگورتھم تیار کیا۔ یہ کوئی سادہ سی کوشش نہیں تھی۔ پیشین گوئیوں کو جوہری سطح پر نقشہ بنایا گیا تھا۔

نئے پروٹین کو ڈیزائن کرنا پیچیدگی کو ایک اور سطح تک بڑھاتا ہے۔ اس سال بیکر کی لیب نے ایک کوشش کے ساتھ اس پر وار کیا۔ اچھی پرانی اسکریننگ کا استعمال کرتے ہوئے تکنیک اور دوسرے پر انحصار کرنا گہری سیکھنے کے فریب. دونوں الگورتھم قدرتی پروٹینوں کو غیر واضح کرنے اور نئے پیدا کرنے کے لیے انتہائی طاقتور ہیں، لیکن ان کی پیمائش کرنا مشکل تھا۔

لیکن انتظار کیجیے. پروٹین کو ڈیزائن کرنا ایک مضمون لکھنے کی طرح ہے۔ اگر GPT-3 اور ChatGPT فطری زبان کا استعمال کرتے ہوئے نفیس مکالمے لکھ سکتے ہیں، تو یہی ٹیکنالوجی نظریہ طور پر پروٹینز کی زبان کو بھی ریجگر کر سکتی ہے-امائنو ایسڈز- کو فعال پروٹین بنانے کے لیے جو فطرت کے لیے مکمل طور پر نامعلوم ہیں۔

AI تخلیقی صلاحیت حیاتیات سے ملتی ہے۔

پہلی نشانیوں میں سے ایک کہ چال کام کر سکتی ہے میٹا سے آئی۔

حال ہی میں پری پرنٹ کاغذ، انہوں نے DALL-E اور ChatGPT کے تحت AI فن تعمیر میں ٹیپ کیا، جو کہ بڑی زبان کے ماڈلز (LLMs) کہلانے والی مشین لرننگ کی ایک قسم ہے، تاکہ پروٹین کی ساخت کا اندازہ لگایا جا سکے۔ ماڈلز کو متن یا تصاویر کی بھرپور مقدار میں کھانا کھلانے کے بجائے، ٹیم نے انہیں معلوم پروٹین کے امینو ایسڈ کی ترتیب پر تربیت دی۔ ماڈل کا استعمال کرتے ہوئے، Meta's AI نے پیش گوئی کی۔ 600 ملین سے زیادہ ان کے امینو ایسڈ کے "حروف" کو اکیلے پڑھ کر پروٹین کے ڈھانچے — بشمول مٹی، سمندر کے پانی اور ہمارے جسموں میں موجود مائکروجنزموں کے باطنی جن کے بارے میں ہم بہت کم جانتے ہیں۔

زیادہ متاثر کن طور پر، AI، جسے ESMFold کہا جاتا ہے، بالآخر پروٹین کی ترتیب کو "خود مکمل" کرنا سیکھ لیا یہاں تک کہ جب کچھ امینو ایسڈ کے حروف کو غیر واضح کر دیا گیا تھا۔ اگرچہ ڈیپ مائنڈ کے الفا فولڈ کی طرح درست نہیں ہے، لیکن یہ تقریباً 60 گنا زیادہ تیزی سے چلتا ہے، جس سے بڑے ڈیٹا بیس تک پیمانہ کرنا آسان ہو جاتا ہے۔

بیکر کی لیب نے پروٹین کے "آٹوکمپلیٹ" فنکشن کو ایک نئی سطح پر لے گیا۔ ایک پری پرنٹ اس مہینے کے شروع میں شائع ہوا۔ اگر AI پہلے سے ہی خالی جگہوں کو پُر کر سکتا ہے جب یہ پروٹین کے ڈھانچے کی پیشن گوئی کرنے کے لیے آتا ہے، تو اسی طرح کا اصول ممکنہ طور پر پرامپٹ سے پروٹین بھی پیدا کر سکتا ہے — اس صورت میں، اس کا ممکنہ حیاتیاتی فعل۔

چابی نیچے آ گئی۔ بازی ماڈلز، مشین لرننگ الگورتھم کی ایک قسم جو DALL-E کو طاقت دیتی ہے۔ سیدھے الفاظ میں، یہ اعصابی نیٹ ورک کسی بھی ڈیٹا کو شامل کرنے اور پھر شور کو ہٹانے میں خاص طور پر اچھے ہیں - چاہے وہ تصاویر، متن، یا پروٹین کی ترتیب ہوں۔ تربیت کے دوران، وہ سب سے پہلے شور ڈال کر تربیتی ڈیٹا کو تباہ کرتے ہیں۔ اس کے بعد ماڈل denoising نامی ایک قدم کے ذریعے عمل کو الٹ کر اصل ڈیٹا کو بازیافت کرنا سیکھتا ہے۔ یہ ایک لیپ ٹاپ یا دیگر الیکٹرانک کو ختم کرنے اور اسے دوبارہ ایک ساتھ رکھنے کی طرح ہے کہ مختلف اجزاء کیسے کام کرتے ہیں۔

چونکہ ڈفیوژن ماڈل عام طور پر سکیمبلڈ ڈیٹا سے شروع ہوتے ہیں (کہتے ہیں کہ ایک تصویر کے تمام پکسلز کو شور میں دوبارہ ترتیب دیا جاتا ہے) اور آخر کار اصل تصویر کی تشکیل نو کرنا سیکھتے ہیں، یہ خاص طور پر بظاہر بے ترتیب نمونوں سے نئی امیجز — یا پروٹین — بنانے میں مؤثر ہے۔

بیکر کی لیب نے ان کے دستخط کی تھوڑی سی ٹھیک ٹیوننگ کے ساتھ نقطہ نظر میں ٹیپ کیا۔ RoseTTAFold ساخت کی پیشن گوئی نیٹ ورک. اس سے پہلے، سافٹ ویئر کے ایک ورژن نے صرف ایک قدم میں پروٹین سکفولڈز — ایک پروٹین کی ریڑھ کی ہڈی — تیار کی تھی۔ لیکن پروٹین یکساں بلاب نہیں ہیں: ہر ایک میں متعدد ہاٹ سپاٹ ہوتے ہیں جو انہیں جسمانی طور پر ایک دوسرے پر ٹیگ کرنے کی اجازت دیتے ہیں، جو مختلف حیاتیاتی عمل کو متحرک کرتے ہیں۔ جب RoseTTAFold کو مشکل مسائل کا سامنا کرنا پڑا — جیسے کہ پروٹین ہاٹ سپاٹ کو کم سے کم علم کے ساتھ ڈیزائن کرنا — اس نے جدوجہد کی۔

ٹیم کا حل یہ تھا کہ RoseTTAFold کو ایک ڈفیوژن ماڈل کے ساتھ ضم کیا جائے، جس میں سابقہ ​​نے denoising step میں مدد کی۔ نتیجہ خیز الگورتھم، RoseTTAFold Diffusion (RF Diffusion)، پروٹین کی ساخت کی پیشن گوئی اور تخلیقی نسل کے درمیان محبت کا بچہ ہے۔ AI نے پہلے سے طے شدہ لیکن حیاتیاتی لحاظ سے متعلقہ حدود کی وجہ سے محدود کسی بھی معروف پروٹین ڈھانچے سے بہت کم مشابہت کے ساتھ وسیع پروٹینوں کی ایک وسیع رینج کو ڈیزائن کیا۔

پروٹین ڈیزائن کرنا صرف پہلا قدم ہے۔ اگلا ان ڈیجیٹل ڈیزائنوں کا اصل پروٹین میں ترجمہ کرنا اور یہ دیکھنا ہے کہ وہ خلیات میں کیسے کام کرتے ہیں۔ ایک ٹیسٹ میں، ٹیم نے اینٹی بیکٹیریل اور اینٹی وائرل صلاحیت کے حامل 44 امیدواروں کو لیا اور ان کے اندر موجود پروٹین کو قابل اعتماد بنایا۔ ای کولی بیکٹیریا 80 فیصد سے زیادہ AI ڈیزائنر پروٹین اپنی پیش گوئی کی گئی حتمی شکل میں فولڈ ہو گئے۔ یہ کارنامہ ہے، کیونکہ کئی ذیلی اکائیوں کو مخصوص تعداد اور واقفیت میں اکٹھا ہونا تھا۔

پروٹین نے بھی اپنے مطلوبہ اہداف کو پکڑ لیا۔ ایک مثال میں پروٹین کا ڈھانچہ SARS-CoV-2 کا پابند تھا، وائرس جو CoVID-19 کا سبب بنتا ہے۔ AI ڈیزائن نے خاص طور پر وائرس کے اسپائک پروٹین کو شامل کیا، جس کا ہدف CoVID-19 ویکسینز ہے۔

ایک اور مثال میں، AI نے ایک پروٹین ڈیزائن کیا جو خون میں کیلشیم کی سطح کو منظم کرنے کے لیے ایک ہارمون سے منسلک ہوتا ہے۔ نتیجے میں آنے والے امیدوار نے آسانی سے ہدف پر قبضہ کر لیا — اتنا کہ اسے صرف ایک چھوٹی سی رقم کی ضرورت تھی۔ سے خطاب کر رہے ہیں۔ ایم ائی ٹی ٹیکنالوجی کا جائزہ لیں، بیکر نے کہا کہ ایسا لگتا ہے کہ AI پروٹین ڈرگ سلوشنز کو کھینچتا ہے۔پتلی ہوا سے باہر."

"یہ کام ظاہر کرتے ہیں کہ پروٹین ڈیزائن کے لیے ڈفیوژن ماڈل کتنے طاقتور ہو سکتے ہیں،" نے کہا مطالعہ کے مصنف ڈاکٹر جوزف واٹسن۔

کیا AIs سالماتی بھیڑوں کا خواب دیکھتا ہے؟

بیکر کی لیب واحد نہیں ہے جو AI پر مبنی پروٹین ادویات کا پیچھا کرتی ہے۔

بائیو میڈیسن تیار کریں۔میساچوسٹس میں قائم ایک سٹارٹ اپ کی نظریں پروٹین پیدا کرنے کے لیے پھیلاؤ کے ماڈلز پر بھی ہیں۔ ڈب کروما ، ان کا سافٹ ویئر آر ایف ڈفیوژن کی طرح کام کرتا ہے، بشمول بائیو فزیکل رکاوٹوں پر عمل کرنے والے پیدا شدہ پروٹین۔ کمپنی کے مطابق، کروما ایک GPU (گرافکس پروسیسنگ یونٹ) پر صرف چند منٹوں میں بڑے پروٹین — 4,000 سے زیادہ امینو ایسڈ کی باقیات پیدا کر سکتا ہے۔

صرف ریمپنگ کے دوران، یہ واضح ہے کہ آن ڈیمانڈ پروٹین ڈرگ ڈیزائن کی دوڑ جاری ہے۔ آر ایف ڈفیوژن اسٹڈی کے مصنف ڈیوڈ جورجنز نے کہا، "یہ انتہائی دلچسپ ہے، اور یہ واقعی صرف شروعات ہے۔"

تصویری کریڈٹ: ایان ہیڈن/انسٹی ٹیوٹ برائے پروٹین ڈیزائن/یونیورسٹی آف واشنگٹن

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز