بفضل DALL-E ، أصبح السباق لصنع عقاقير بروتينية اصطناعية على ذكاء بيانات PlatoBlockchain. البحث العمودي. عاي.

بفضل DALL-E ، بدأ السباق لصنع أدوية البروتين الاصطناعية

هل تتذكر عندما كان توقع أشكال البروتين باستخدام الذكاء الاصطناعي هو الاختراق العام؟

هذه أخبار قديمة. نأخذ حل جميع تراكيب البروتين تقريبًا المعروف في علم الأحياء ، أن الذكاء الاصطناعي يتحول الآن إلى تحدٍ جديد: تصميم البروتينات من الصفر.

بعيدًا عن السعي الأكاديمي ، يعد هذا المسعى بمثابة تغيير محتمل للعبة لاكتشاف الأدوية. إن القدرة على استنباط أدوية بروتينية لأي هدف معين داخل الجسم - مثل تلك التي تؤدي إلى نمو السرطان وانتشاره - يمكن أن تطلق عالمًا جديدًا من الأدوية لمعالجة أسوأ أعدائنا الطبيين.

لا عجب أن العديد من مراكز الذكاء الاصطناعي القوية تجيب على التحدي. المثير للدهشة هو أنهم التقوا في نهج مماثل. استلهم فريق DeepMind و Meta والدكتور ديفيد بيكر في جامعة واشنطن هذا العام من مصدر غير متوقع: DALL-E و GPT-3.

أحدثت هذه الخوارزميات التوليدية عاصفة في العالم. عند إعطاء بعض التوجيهات البسيطة في اللغة الإنجليزية اليومية ، يمكن للبرامج إنتاج صور محيرة للعقل ، وفقرات من الكتابة الإبداعية ، أو مشاهد أفلام ، وحتى إعادة مزج أحدث تصميمات الموضة. نفس التكنولوجيا الأساسية مؤخرا طعنة عند كتابة كود الكمبيوتر ، يتفوق على ما يقرب من نصف المنافسين من البشر في مهمة برمجة صعبة للغاية.

ما علاقة أي من ذلك بالبروتينات؟

إليكم الأمر: البروتينات هي في الأساس سلاسل من "الحروف" مقولبة في هياكل ثانوية - جمل التفكير - ثم "فقرات" ثلاثية الأبعاد. إذا كان بإمكان الذكاء الاصطناعي إنشاء صور رائعة وكتابة نظيفة ، فلماذا لا تختار التكنولوجيا لإعادة كتابة رمز الحياة؟

تعال هنا الأبطال

البروتين هو مفتاح الحياة. إنها تبني أجسادنا. يدير عمليات الأيض لدينا. إنها تكمن وراء وظائف الدماغ المعقدة. إنه أيضًا أساس لثروة من الأدوية الجديدة التي يمكن أن تعالج بعضًا من أكثر مشاكلنا الصحية التي لا يمكن التغلب عليها حتى الآن - وإنشاء مصادر جديدة للوقود الحيوي ، اللحوم المزروعة في المختبر، أو حتى أشكال حياة جديدة تمامًا من خلال البيولوجيا التركيبية.

في حين أن "البروتين" غالبًا ما يستحضر صورًا لصدور الدجاج ، إلا أن هذه الجزيئات تشبه إلى حد كبير أحجية الليغو المعقدة. يبدأ بناء البروتين بسلسلة من الأحماض الأمينية - فكر في عدد لا يحصى من أضواء عيد الميلاد على خيط - والتي تطوى بعد ذلك إلى هياكل ثلاثية الأبعاد (مثل تجعيدها للتخزين).

قام كل من DeepMind و Baker بإحداث موجات عندما طور كل منهما خوارزميات للتنبؤ ببنية أي بروتين بناءً على تسلسل الأحماض الأمينية الخاصة بهما. لم يكن هذا مسعى بسيطًا. تم تعيين التنبؤات على المستوى الذري.

يرفع تصميم بروتينات جديدة التعقيد إلى مستوى آخر. هذا العام قام مختبر بيكر بطعنه بجهد واحد باستخدام الفحص القديم الجيد تقنيات وأخرى تعتمد عليها هلوسة التعلم العميق. كلا الخوارزميتين قويتان للغاية لإزالة الغموض عن البروتينات الطبيعية وتوليد بروتينات جديدة ، لكن كان من الصعب توسيع نطاقها.

لكن انتظر. يشبه تصميم البروتين نوعًا ما كتابة مقال. إذا كان بإمكان GPT-3 و ChatGPT كتابة حوار معقد باستخدام لغة طبيعية ، فإن نفس التقنية يمكنها أيضًا من الناحية النظرية إعادة تنظيم لغة البروتينات - الأحماض الأمينية - لتشكيل بروتينات وظيفية غير معروفة تمامًا للطبيعة.

إبداع الذكاء الاصطناعي يلتقي مع علم الأحياء

جاءت إحدى العلامات الأولى على نجاح الحيلة من Meta.

في الآونة الأخيرة ورق مطبوع، استفادوا من بنية الذكاء الاصطناعي الكامنة وراء DALL-E و ChatGPT ، وهو نوع من التعلم الآلي يسمى نماذج اللغة الكبيرة (LLMs) ، للتنبؤ ببنية البروتين. بدلاً من تغذية النماذج بكميات كبيرة من النصوص أو الصور ، قام الفريق بدلاً من ذلك بتدريبها على تسلسل الأحماض الأمينية لبروتينات معروفة. باستخدام النموذج ، تنبأت Meta AI أكثر من مليون 600 تراكيب البروتين من خلال قراءة "أحرف" الأحماض الأمينية وحدها - بما في ذلك الأحرف الباطنية من الكائنات الحية الدقيقة في التربة ومياه المحيطات وأجسامنا التي لا نعرف عنها إلا القليل.

والأكثر إثارة للإعجاب ، أن الذكاء الاصطناعي ، المسمى ESMFold ، تعلم في النهاية "الإكمال التلقائي" لتسلسلات البروتين حتى عندما تم حجب بعض أحرف الأحماض الأمينية. على الرغم من أنها ليست دقيقة مثل AlphaFold من DeepMind ، إلا أنها كانت تعمل أسرع بنحو 60 مرة ، مما يجعل من السهل توسيع نطاقها إلى قواعد بيانات أكبر.

أخذ مختبر بيكر وظيفة "الإكمال التلقائي" للبروتين إلى مستوى جديد في نسخة أولية نشرت في وقت سابق من هذا الشهر. إذا كان الذكاء الاصطناعي قادرًا بالفعل على ملء الفراغات عندما يتعلق الأمر بالتنبؤ بتراكيب البروتين ، فمن المحتمل أيضًا أن يولد مبدأ مشابه بروتينات من موجه - في هذه الحالة ، وظيفته البيولوجية المحتملة.

نزل المفتاح إلى نماذج الانتشار، نوع من خوارزمية التعلم الآلي التي تشغل DALL-E. ببساطة ، هذه الشبكات العصبية جيدة بشكل خاص في إضافة الضوضاء ثم إزالتها من أي بيانات معينة - سواء كانت صورًا أو نصوصًا أو تسلسلات بروتينية. أثناء التدريب ، يقومون أولاً بتدمير بيانات التدريب عن طريق إضافة الضوضاء. يتعلم النموذج بعد ذلك استعادة البيانات الأصلية عن طريق عكس العملية من خلال خطوة تسمى تقليل الضوضاء. إنه يشبه إلى حد ما تفكيك جهاز كمبيوتر محمول أو جهاز إلكتروني آخر وإعادة تجميعه معًا لمعرفة كيفية عمل المكونات المختلفة.

نظرًا لأن نماذج الانتشار تبدأ عادةً ببيانات مختلطة (على سبيل المثال ، يتم إعادة ترتيب جميع وحدات البكسل في الصورة إلى ضوضاء) وتتعلم في النهاية إعادة بناء الصورة الأصلية ، فهي فعالة بشكل خاص في إنشاء صور جديدة - أو بروتينات - من عينات تبدو عشوائية.

استخدم مختبر بيكر النهج مع قليل من الصقل لتوقيعهم روز تافولد شبكة التنبؤ الهيكلي. في السابق ، كان إصدار من البرنامج يولد سقالات بروتينية - العمود الفقري للبروتين - في خطوة واحدة فقط. لكن البروتينات ليست نقاطًا موحدة: فلكل منها نقاط ساخنة متعددة تسمح لها بالتمييز الجسدي على بعضها البعض ، مما يؤدي إلى عمليات بيولوجية مختلفة. عندما واجهت RoseTTAFold مشاكل صعبة - مثل تصميم نقاط فعالة للبروتين بأقل قدر من المعرفة - واجهت صعوبات.

كان حل الفريق هو دمج RoseTTAFold مع نموذج الانتشار ، حيث يساعد الأول في خطوة تقليل الضوضاء. الخوارزمية الناتجة ، RoseTTAFold Diffusion (RF Diffusion) ، هي علاقة حب بين توقع بنية البروتين والتوليد الإبداعي. صمم الذكاء الاصطناعي مجموعة واسعة من البروتينات المتقنة مع القليل من التشابه مع أي هياكل بروتينية معروفة ، مقيدة بحدود محددة مسبقًا ولكنها ذات صلة بيولوجيًا.

تصميم البروتينات هو مجرد خطوة أولى. التالي هو ترجمة هذه التصميمات الرقمية إلى بروتينات فعلية ورؤية كيفية عملها في الخلايا. في أحد الاختبارات ، أخذ الفريق 44 مرشحًا يتمتعون بقدرات مضادة للبكتيريا والفيروسات وصنعوا البروتينات داخل الخزانة المضمونة. E. كولاي بكتيريا. أكثر من 80 في المائة من البروتينات المصممة للذكاء الاصطناعي مطوية في شكلها النهائي المتوقع. هذا هو العمل الفذ ، حيث كان على العديد من الوحدات الفرعية أن تتجمع بأرقام واتجاهات محددة.

تمسكت البروتينات أيضًا بأهدافها المقصودة. أحد الأمثلة يحتوي على بنية بروتينية مرتبطة بـ SARS-CoV-2 ، الفيروس المسبب لـ Covid-19. تم صقل تصميم الذكاء الاصطناعي بشكل خاص على البروتين الشائك للفيروس ، وهو هدف لقاحات Covid-19.

في مثال آخر ، صمم الذكاء الاصطناعي بروتينًا يرتبط بهرمون لتنظيم مستويات الكالسيوم في الدم. تمسك المرشح الناتج بسهولة بالهدف - لدرجة أنه يحتاج إلى كمية ضئيلة فقط. يتحدث الى معهد ماساتشوستس للتكنولوجيا تكنولوجي ريفيو، قال بيكر إن الذكاء الاصطناعي يبدو أنه يسحب حلول الأدوية البروتينية "نفذ من الهواء الرفيع."

"تكشف هذه الأعمال مدى قوة نماذج الانتشار لتصميم البروتين ،" محمد مؤلف الدراسة الدكتور جوزيف واتسون.

هل تحلم أنظمة الذكاء الاصطناعي بالأغنام الجزيئية؟

مختبر بيكر ليس الوحيد الذي يلاحق عقاقير البروتين المعتمدة على الذكاء الاصطناعي.

توليد الأدوية الحيوية، وهي شركة ناشئة مقرها ماساتشوستس ، لديها أيضًا أعينها على نماذج الانتشار لتوليد البروتينات. مدبلجة صفاء ، يعمل برنامجهم بشكل مشابه لـ RF Diffusion ، بما في ذلك البروتينات المتولدة التي تلتزم بالقيود الفيزيائية الحيوية. وفقًا للشركة ، يمكن لـ Chroma إنتاج بروتينات كبيرة - أكثر من 4,000 من بقايا الأحماض الأمينية - في بضع دقائق فقط على وحدة معالجة الرسومات (GPU).

أثناء التكثيف ، من الواضح أن السباق نحو تصميم عقار بروتيني حسب الطلب ما زال مستمراً. قال David Juergens ، مؤلف دراسة RF Diffusion ، "إنه أمر مثير للغاية ، وهي حقًا البداية فقط."

الصورة الائتمان: إيان هايدون / معهد تصميم البروتين / جامعة واشنطن

الطابع الزمني:

اكثر من التفرد المحور