Sztuczna inteligencja do projektowania białek otwiera drzwi do leków Ludzie nie mogli wymyślić Inteligencji danych PlatoBlockchain. Wyszukiwanie pionowe. AI.

Sztuczna inteligencja do projektowania białek otwiera drzwi do leków, których ludzie nie mogli wymyślić

obraz

Projektowanie białka jest trochę jak robienie szafki. Pierwszym krokiem jest zbudowanie szkieletu, który utrzymuje białko razem. Ale potem przychodzi trudna część: zastanowienie się, gdzie zainstalować zawiasy na rusztowaniu – to znaczy znalezienie najlepszych „gorących punktów” – aby założyć drzwi, półki i inne elementy mocujące, które ostatecznie sprawią, że szafka będzie w pełni funkcjonalna.

W pewnym sensie białka mają również wbudowane hotspoty w swoich strukturach. Zgodnie ze swoją nazwą „miejsca funkcjonalne”, te intrygujące zakamarki i zakamarki tworzą skomplikowane doki, do których mogą się przyczepić inne białka lub leki. Witryny mają kluczowe znaczenie dla wykonywania większości naszych podstawowych procesów biologicznych. Są także ogromną kopalnią złota do projektowania nowych terapii i leków.

Problem? Witryny funkcjonalne są trudne do zmapowania. Naukowcy tradycyjnie musieli mutować podejrzane obszary na białku jeden po drugim — zamieniając jeden aminokwas na inny — aby precyzyjnie określić miejsca wiązania. Jak detektyw sprawdzający setki podejrzanych, których może być wielu, jest to niezwykle nużące.

A Nowe badania in nauka obalił cały gamebook. Zespół kierowany przez dr Davida Bakera z Uniwersytetu Waszyngtońskiego wykorzystał „wyobraźnię” sztucznej inteligencji, aby wymyślić od zera niezliczone funkcjonalne witryny. To „kreatywność” maszynowego umysłu w najlepszym wydaniu – algorytm głębokiego uczenia, który przewiduje ogólny obszar funkcjonalnego miejsca białka, a następnie dalej rzeźbi strukturę.

W celu sprawdzenia rzeczywistości zespół wykorzystał nowe oprogramowanie do generowania leków zwalczających raka i opracowywania szczepionek przeciwko powszechnym, choć czasami śmiertelnym wirusom. W jednym przypadku umysł cyfrowy wymyślił rozwiązanie, które po przetestowaniu w izolowanych komórkach idealnie pasowało do istniejącego przeciwciała przeciwko powszechnemu wirusowi. Innymi słowy, algorytm „wyobraził sobie” gorący punkt z białka wirusowego, czyniąc je podatnym jako cel do projektowania nowych terapii.

Algorytm jest pierwszym podejściem do głębokiego uczenia się w budowaniu białek wokół ich funkcji, otwierającym drzwi do terapii, które wcześniej były niewyobrażalne. Ale oprogramowanie nie ogranicza się do naturalnych hotspotów białkowych. „Białka, które znajdujemy w naturze, są niesamowitymi cząsteczkami, ale zaprojektowane białka mogą o wiele więcej” – powiedział Baker w komunikacie prasowym. Algorytm „robi rzeczy, do których nikt z nas nie myślał, że będzie w stanie”.

Hotspot białka

Zespół Bakera nie jest obcy przewidywaniu białek za pomocą sztucznych umysłów. Kilka lat temu wstrząsnęli dziedziną biologii strukturalnej, wypuszczając Rosetta, oprogramowanie, które może przewidywać strukturę 3D białka na podstawie samej sekwencji aminokwasowej. Następnie zmapowali kompleksy białkowe i zaprojektowali białkowe „śrubokręty” od podstaw, aby oddzielić niepożądane interakcje białkowe. Pod koniec zeszłego roku wydali sieć głębokiego uczenia nazwany trRosetta, „architekt” AI, który uogólnia sposób, w jaki ciągi aminokwasów układają się w skomplikowane struktury w nanoskali.

Cofnijmy się.

Łatwo wyobrazić sobie białka jako mięsiste, żylaste skrzydełko kurczaka, w które wgryzam się, pisząc to zdanie. Ale na poziomie molekularnym są znacznie bardziej eleganckie. Wyobraź sobie wiele klocków Lego – aminokwasów – trzymanych razem na sznurku. Teraz zakręć nim, przekręcając łańcuch, aż kilka bloków zatrzaśnie się na sobie. Tworzy to delikatną strukturę, która często przypomina spiralę lub pogniecione prześcieradło. W niektórych białkach te cegiełki dalej łączą się w kompleksy – na przykład tworząc kanał, który przechodzi przez ochronną błonę komórki jak patrolowana autostrada międzystanowa.

Białka zasilają każdy pojedynczy proces biologiczny, często poprzez kaskadę interakcji z innymi białkami lub lekami, które – w zależności od partnera – mogą wywołać zupełnie inne konsekwencje: czy komórka powinna żyć, czy umrzeć? Zaatakować potencjalnego najeźdźcę czy wycofać się? Innymi słowy, białka są budulcem życia, a analizując ich strukturę, możemy włamać się do życia.

Oto rzecz: nie wszystkie części białka są sobie równe. Jeśli białko jest ludzkim ciałem, miejscami funkcjonalnymi są jego „ręce” — gdzie chwyta się innego białka lub leku, pobudza reakcje enzymatyczne lub zwalcza inwazyjne patogeny. Osadzone bezpośrednio w strukturze białka, miejsca te są trudne do ustalenia, a jeszcze trudniejsze do odtworzenia.

Nowe badanie zajęło się problemem z wersją Rosetty: czy przy pewnej wcześniejszej wiedzy komputer może wymyślić łańcuch aminokwasów, który naturalnie składa się w funkcjonalne miejsce?

Marzyciel i Realista

Problem może wydawać się egzotyczny, ale jest poprzedni przykład – w innej dziedzinie. Korzystając z sieci neuronowej, OpenAI stworzył szeroką gamę obrazów z samych podpisów tekstowych. Spinoff generatora tekstu rockstar AI GPT-3, algorytm DALL·E generował fantastyczne, ale realistycznie wyglądające obrazy w oparciu o proste podpowiedzi tekstowe, wykrywając wzorce z treningu. „Zabiera najgłębsze, najciemniejsze zakamarki twojej wyobraźni i przekształca je w coś, co jest niesamowicie istotne” powiedziany Dr Hany Farid z UC Berkeley po pierwszym wydaniu narzędzia.

Budowanie funkcjonalnego miejsca białka jest podobne. Tutaj aminokwasy są literami, a miejscem funkcjonalnym białka jest obraz. „Pomysł jest taki sam: sieci neuronowe można wytrenować, aby widzieć wzorce w danych. Po przeszkoleniu możesz dać mu podpowiedź i sprawdzić, czy może wygenerować eleganckie rozwiązanie” – powiedział dr Joseph Watson, główny autor nowej pracy. Z wyjątkiem tego, że zamiast pisać powieść, algorytm może pomóc przepisać życie.

Zespół zaczął od wcześniejszego stworzenia, trRosetta. Jest to sieć neuronowa pierwotnie zaprojektowana do wymyślania nowych białek w oparciu o sekwencje aminokwasowe, jednocześnie będąc w stanie przewidzieć ich strukturę – niektóre tak obce od naturalnych, że zespół nazwał wewnętrzne działanie głębokiego uczenia „halucynacją”. Algorytm wydawał się doskonały: mógł zarówno przewidzieć sekwencję aminokwasową białka, jak i jego strukturę.

Czkawka? To nie zadziałało. W przeciwieństwie, OG przewidywania struktury białek, RoseTTAFfold, wykonywany jak mistrz. Siła algorytmu wynika z jego konstrukcji: modelowania każdego aminokwasu w nanoskali, zapewniając współrzędne każdemu atomowi. Podobnie jak przypinanie lokalizacji geograficznej za pomocą Google Maps, zapewnia to poziom rzetelności struktury, którą sztuczna inteligencja może dalej wtrącać – rodzaj „ograniczonej halucynacji”.

Tłumaczenie? RoseTTAFold może przewidzieć funkcjonalną strukturę — ​​specyficzną dla danego problemu — i opracować wstępny szkic jako ostateczny projekt.

Potem przyszła kolejna sprytna sztuczka, nazwana „malowaniem”. Tutaj zespół ukrył części sekwencji lub struktury białka. Oprogramowanie musiało nauczyć się, jak odszyfrowywać informacje z tego, co w zasadzie jest hałaśliwym przechwyceniem radiowym, w którym można usłyszeć tylko kilka pierwszych słów, ale spróbować zrozumieć ich znaczenie, wypełniając puste miejsca. RoseTTAFold z zapałem zajęło się „problemem odzyskiwania brakujących informacji”, autouzupełniając zarówno sekwencje aminokwasowe, jak i struktury w celu skonstruowania danego regionu funkcjonalnego z wysoką wiernością.

RoseTTAFold może rozwiązać problemy związane z jednoczesnym budowaniem sekwencji aminokwasowych i generowaniem szkieletu witryny. To jak przenoszenie słów na papier: pisarz upewnia się, że każda litera jest we właściwym miejscu, cały czas sprawdzając, czy gramatyka i znaczenie mają sens.

Kwestionowanie natury rzeczywistości

Testując swoje nowe dzieło, zespół opracował kilka projektów leków i szczepionek, które mogą potencjalnie zwalczyć wirusy i raka lub pomóc w problemach zdrowotnych o niskiej zawartości żelaza.

Według głównego autora, dr Jue Wanga, algorytm stał się nieoczekiwanie trafny. Podczas pracy nad projektem jego dwuletni syn został hospitalizowany na oddziale ratunkowym z powodu infekcji płuc RSV (Respiratory Syncytial Virus) – wirusa, który normalnie wykazuje objawy przypominające przeziębienie, ale może być śmiertelny u młodych i Starsi.

W tym czasie Wang używał algorytmu do projektowania nowych terapii, które obejmowały potencjalne strony na RSV do dalszego testowania szczepionek i leków przeciwko. To stosunkowo dobrze odwzorowana struktura. Oprogramowanie wywoływało halucynacje projektów, w których podsumowano dwa miejsca, z którymi mogą potencjalnie wiązać się szczepionki. Testy wykorzystujące halucynowane białka, zrekonstruowane w bakteriach, szybko chwytały istniejące przeciwciała – znak, że są one funkcjonalne i że podejście głębokiego uczenia działa.

Incydent „uświadomił mi, że nawet problemy testowe, nad którymi pracowaliśmy, były w rzeczywistości dość znaczące” – powiedział Wang.

W kilku dodatkowych testach zespół zaprojektował miejsca funkcjonalne dla enzymu, białek wiążących białka i białek, które chwytają jony metali – w skrócie, w jaki sposób absorbujesz żelazo i inne ważne metale.

Chociaż potężny, jest miejsce na rozwój. Metoda ta otwiera drzwi do demistyfikowania naturalnych białek, ale także potencjalnego projektowania nowych dla biologii syntetycznej. „Są to bardzo potężne nowe podejścia, ale wciąż jest wiele do zrobienia” – powiedział Baker.

W sumie jest to kolejna wygrana dla głębokiego uczenia się i fascynująca prezentacja synergii sztucznej inteligencji i biologii. „Głębokie uczenie przekształciło przewidywanie struktury białek w ciągu ostatnich dwóch lat, teraz jesteśmy w trakcie podobnej transformacji projektowania białek” – powiedział Baker.

Źródło: Ian C. Haydon/Instytut Projektowania Białka UW. Nowe oprogramowanie sztucznej inteligencji wyszkolone na strukturach białkowych może w ciągu kilku sekund wygenerować funkcjonalne białka, w tym te potencjalne szczepionki przeciwko wirusowi oddechowemu RSV.

Znak czasu:

Więcej z Centrum osobliwości