طراحی پروتئین کمی شبیه ساخت کابینت است. اولین قدم ساختن ستون فقرات است که پروتئین را کنار هم نگه می دارد. اما بعد از آن قسمت سخت فرا می رسد: تعیین محل نصب لولاها بر روی داربست - یعنی یافتن بهترین "نقاط داغ" - برای قرار دادن درها، قفسه ها و سایر لوازم جانبی که در نهایت کابینت را کاملاً کاربردی می کند.
به نوعی، پروتئین ها نیز دارای نقاط داغ در ساختار خود هستند. درست به نام خود، "محل های عملکردی"، این گوشه ها و شکاف های جذاب، اسکله های پیچیده ای را برای سایر پروتئین ها یا داروها تشکیل می دهند. مکان ها برای انجام بیشتر فرآیندهای بیولوژیکی اساسی ما نقش اساسی دارند. آنها همچنین یک معدن طلای عظیم برای طراحی درمان های جدید و داروهای پزشکی هستند.
مشکل؟ نقشه برداری از سایت های کاربردی دشوار است. دانشمندان به طور سنتی مجبور بودند نواحی مشکوک روی یک پروتئین را یکی یکی جهش دهند - یک اسید آمینه را به اسید آمینه دیگر تغییر دهند - تا نقاط اتصال دقیق را مشخص کنند. مانند یک کارآگاهی که صدها مظنون را بررسی می کند، که ممکن است تعداد زیادی از آنها وجود داشته باشد، بسیار خسته کننده است.
A مطالعه جدید in علم کل گیم بوک را سرنگون کرد. به رهبری دکتر دیوید بیکر در دانشگاه واشنگتن، تیمی از "تخیل" یک هوش مصنوعی بهره بردند تا تعداد بی شماری از سایت های کاربردی را از ابتدا ببینند. این «خلاقیت» یک ذهن ماشینی در بهترین حالت آن است – یک الگوریتم یادگیری عمیق که ناحیه کلی محل عملکرد پروتئین را پیشبینی میکند، اما سپس ساختار را بیشتر میسازد.
به عنوان یک بررسی واقعیت، تیم از نرمافزار جدید برای تولید داروهایی استفاده کرد که با سرطان مبارزه میکنند و واکسنهایی را علیه ویروسهای رایج، حتی گاهی کشنده، طراحی کردند. در یک مورد، ذهن دیجیتال راهحلی ارائه کرد که وقتی در سلولهای جدا شده آزمایش شد، با آنتیبادی موجود علیه یک ویروس معمولی مطابقت کامل داشت. به عبارت دیگر، الگوریتم یک نقطه داغ از یک پروتئین ویروسی را «تصور» کرد و آن را به عنوان هدفی برای طراحی درمانهای جدید آسیبپذیر کرد.
این الگوریتم اولین تلاش یادگیری عمیق برای ساختن پروتئین ها در اطراف عملکرد آنهاست و دری را به روی درمان هایی باز می کند که قبلا غیرقابل تصور بودند. اما این نرم افزار به نقاط حساس پروتئین طبیعی محدود نمی شود. بیکر در بیانیهای مطبوعاتی گفت: «پروتئینهایی که در طبیعت پیدا میکنیم مولکولهای شگفتانگیزی هستند، اما پروتئینهای طراحیشده میتوانند کارهای بسیار بیشتری انجام دهند. این الگوریتم "انجام کارهایی است که هیچ یک از ما فکر نمی کردیم قادر به انجام آنها باشد."
کانون پروتئین
تیم بیکر با پیش بینی پروتئین ها با ذهن مصنوعی غریبه نیست. چند سال پیش، آنها با انتشار Rosetta، نرمافزاری که میتواند ساختار سهبعدی یک پروتئین را تنها بر اساس توالی اسید آمینه آن پیشبینی کند، حوزه زیستشناسی ساختاری را تکان دادند. آنها بیشتر مجتمعهای پروتئینی را نقشهبرداری کردند و «پیچگوشتیهای» پروتئینی را از ابتدا طراحی کردند تا فعل و انفعالات پروتئینی نامطلوب را جدا کنند. اواخر سال گذشته یک را منتشر کردند شبکه یادگیری عمیق trRosetta، یک «معمار» هوش مصنوعی است که نحوه چیدمان رشتههای آمینو اسیدها را در ساختارهای پیچیده در مقیاس نانو تعمیم میدهد.
بیایید پشتیبان گیری کنیم.
به راحتی میتوان پروتئینها را بهعنوان بال مرغ گوشتی و سیخدار تصور کرد که در حال تایپ این جمله هستم. اما در سطح مولکولی، آنها بسیار زیباتر هستند. چندین بلوک لگو - اسیدهای آمینه - را تصور کنید که توسط یک رشته در کنار هم قرار گرفته اند. حالا آن را به اطراف بچرخانید، زنجیره را بچرخانید تا چند بلوک روی یکدیگر بچسبند. این ساختار ظریفی را تشکیل می دهد که اغلب شبیه یک مارپیچ یا ملحفه های چروکیده است. در برخی از پروتئینها، این بلوکهای ساختمانی بیشتر به صورت مجتمعها جمع میشوند - برای مثال، کانالی ایجاد میکنند که مانند یک بزرگراه بینایالتی از طریق غشای محافظ سلول تونل میکند.
پروتئین ها به تک تک فرآیندهای بیولوژیکی نیرو می دهند، اغلب از طریق زنجیره ای از فعل و انفعالات با سایر پروتئین ها یا داروها، که - بسته به شریک زندگی - می تواند عواقب کاملاً متفاوتی ایجاد کند: آیا یک سلول باید زنده بماند یا بمیرد؟ حمله به یک مهاجم بالقوه یا ایستادن؟ به عبارت دیگر، پروتئین ها بلوک های سازنده زندگی هستند و تجزیه ساختار آنها راهی است که می توانیم به زندگی نفوذ کنیم.
نکته اینجاست: همه قسمت های پروتئین یکسان ایجاد نمی شوند. اگر پروتئینی یک بدن انسان باشد، مکانهای عملکردی «دستهای» آن است – جایی که پروتئین یا داروی دیگری را میگیرد، واکنشهای آنزیمی را تحریک میکند یا با پاتوژنهای مهاجم مبارزه میکند. این مکانها که مستقیماً در ساختار پروتئین تعبیه شدهاند، به سختی شناسایی میشوند و حتی بازآفرینی آنها سختتر است.
مطالعه جدید مشکل نسخه ای از روزتا را حل کرده است: با دانش قبلی، آیا ممکن است یک کامپیوتر زنجیره ای از آمینو اسیدها را که به طور طبیعی در یک مکان کاربردی جمع می شوند، در خواب ببیند؟
رویاپرداز و واقع گرا
مشکل ممکن است عجیب به نظر برسد، اما یک مثال قبلی وجود دارد - در زمینه دیگری. OpenAI با استفاده از یک شبکه عصبی، طیف وسیعی از تصاویر را تنها از زیرنویس متنی ایجاد کرد. اسپین آف تولید کننده متن راک استار هوش مصنوعی GPT-3الگوریتم DALL·E تصاویری خارقالعاده اما واقعی را بر اساس پیامهای متنی ساده با شناسایی الگوهای آموزش ایجاد کرد. "عمیقترین و تاریکترین فرورفتگیهای تخیل شما را میگیرد و آن را به چیزی تبدیل میکند که به طرز وحشتناکی مرتبط است." گفت: دکتر هانی فرید در UC Berkeley پس از انتشار اولیه ابزار.
ساختن یک سایت عملکردی پروتئین مشابه است. در اینجا اسیدهای آمینه حروف و محل عملکرد پروتئین تصویر است. ایده یکسان است: شبکه های عصبی را می توان برای دیدن الگوها در داده ها آموزش داد. دکتر جوزف واتسون، نویسنده اصلی این کار جدید، میگوید پس از آموزش، میتوانید به آن دستور بدهید و ببینید که آیا میتواند راهحلی زیبا ایجاد کند. به جز نوشتن یک رمان، این الگوریتم می تواند به بازنویسی زندگی کمک کند.
این تیم با یک ساخته قبلی، trRosetta شروع کرد. این یک شبکه عصبی است که در ابتدا طراحی شده بود تا پروتئینهای جدیدی را بر اساس توالیهای آمینواسید ببیند و در عین حال قادر به پیشبینی ساختار آنها باشد – برخی از آنها به قدری با پروتئینهای طبیعی بیگانه هستند که تیم به عملکرد درونی یادگیری عمیق «توهم» لقب داد. الگوریتم کامل به نظر می رسید: هم می توانست توالی اسید آمینه پروتئین و هم ساختار آن را پیش بینی کند.
سکسکه؟ واقعاً کار نکرد. متقابلا، OG پیش بینی ساختار پروتئین، RoseTTAFold، مانند یک قهرمان اجرا شد. قدرت الگوریتم از طراحی آن ناشی می شود: مدل سازی هر اسید آمینه در مقیاس نانو، ارائه مختصاتی برای هر اتم. مانند سنجاق کردن یک سایت جغرافیایی با استفاده از Google Maps، این یک سطح از حقیقت را برای ساختاری که هوش مصنوعی میتواند بیشتر روی آن ایجاد کند ارائه میکند – نوعی «توهم محدود».
ترجمه؟ RoseTTAFold میتواند یک ساختار عملکردی را پیشبینی کند - خاص برای مشکل مورد نظر - و یک طرح خشن را به عنوان طرح نهایی ارائه دهد.
سپس یک ترفند هوشمندانه دیگر آمد، به نام "inpainting". در اینجا، تیم بخش هایی از توالی یا ساختار پروتئین را پنهان کرد. نرم افزار باید یاد می گرفت که چگونه اطلاعات را از چیزی که اساساً یک شنود رادیویی پر سر و صدا است، رمزگشایی کند، جایی که شما فقط می توانید چند کلمه اول را بشنوید اما سعی کنید با پر کردن جاهای خالی معنای آن را بفهمید. RoseTTAFold "مشکل بازیابی اطلاعات از دست رفته" را با ذوق و شوق حل کرد و توالیها و ساختارهای آمینو اسید را به صورت خودکار تکمیل کرد تا یک منطقه عملکردی مشخص را با وفاداری بالا بسازد.
RoseTTAFold می تواند همزمان با مشکلات ساخت توالی اسیدهای آمینه و ایجاد ستون فقرات برای سایت مقابله کند. این مانند قرار دادن کلمات روی کاغذ است: نویسنده مطمئن می شود که هر حرف در جای درستی قرار گرفته است، در حالی که بررسی می کند که گرامر و معنی منطقی هستند.
زیر سوال بردن ماهیت واقعیت
این تیم با آزمایش ساخت جدید خود، چندین طرح دارو و واکسن تولید کردند که به طور بالقوه می توانند با ویروس ها و سرطان مبارزه کنند یا به مشکلات سلامتی با آهن کم کمک کنند.
برای نویسنده اصلی دکتر جو وانگ، الگوریتم به طور غیر منتظره ای مناسب شد. در حین کار بر روی این پروژه، پسر دو ساله او به دلیل عفونت ریه توسط RSV (ویروس سنسیتیال تنفسی) در بخش اورژانس بستری شد - ویروسی که معمولاً علائم سرماخوردگی را نشان میدهد، اما میتواند در کودکان و نوجوانان کشنده باشد. مسن.
در آن زمان، وانگ از این الگوریتم برای طراحی درمانهای جدید استفاده میکرد که شامل مکانهای بالقوه در RSV برای آزمایش بیشتر واکسنها و داروهای ضد آن میشد. این یک ساختار نسبتاً به خوبی ترسیم شده است. این نرمافزار طرحهایی را توهم زد که دو مکان را برای اتصال واکسنها بهطور بالقوه خلاصه میکرد. آزمایشهایی که با استفاده از پروتئینهای توهمآمیز، بازسازیشده در باکتریها، بهسرعت بر روی آنتیبادیهای موجود قرار گرفتند - نشانهای از عملکرد آنها و اینکه رویکرد یادگیری عمیق کار میکند.
وانگ گفت این حادثه "من را به این امر واداشت که حتی مشکلات "آزمایشی" که ما روی آنها کار می کردیم واقعاً معنی دار بودند.
در چندین آزمایش اضافی، این تیم مکانهای کاربردی را برای یک آنزیم، پروتئینهای متصل به پروتئین و پروتئینهایی طراحی کردند که به یونهای فلزی میچسبند – اساساً نحوه جذب آهن و سایر فلزات مهم.
اگرچه قدرتمند است، اما جایی برای رشد وجود دارد. این روش دری را برای ابهام زدایی از پروتئین های طبیعی باز می کند، اما همچنین به طور بالقوه برای طراحی پروتئین های جدید برای زیست شناسی مصنوعی. بیکر گفت: "اینها رویکردهای جدید بسیار قدرتمندی هستند، اما هنوز جای زیادی برای بهبود وجود دارد."
در مجموع، این یک پیروزی دیگر برای یادگیری عمیق و نمایشی جذاب از نحوه هم افزایی هوش مصنوعی و زیستشناسی است. بیکر میگوید: «یادگیری عمیق، پیشبینی ساختار پروتئین را در دو سال گذشته متحول کرد، ما اکنون در میانه تحول مشابهی در طراحی پروتئین هستیم.
اعتبار تصویر: Ian C. Haydon/موسسه طراحی پروتئین UW. نرم افزار هوش مصنوعی جدید آموزش دیده بر روی ساختارهای پروتئینی می تواند پروتئین های کاربردی از جمله این واکسن های کاندید ویروس تنفسی RSV را در چند ثانیه تولید کند.