Proteindesignande AI öppnar dörren till mediciner Människor kunde inte drömma om PlatoBlockchain-dataintelligens. Vertikal sökning. Ai.

Proteindesignande AI öppnar dörren till mediciner som människor inte kunde drömma om

bild

Att designa ett protein är lite som att göra ett skåp. Det första steget är att bygga ryggraden som håller ihop proteinet. Men sedan kommer det svåra: att ta reda på var man ska installera gångjärn på ställningen – det vill säga hitta de bästa ”hotspots” – att sätta på dörrar, hyllor och andra tillbehör som i slutändan gör skåpet fullt funktionellt.

På ett sätt har proteiner också hotspots inbäddade i sina strukturer. Trogen namnet, "funktionella platser", dessa spännande skrymslen och vrår bildar intrikata bryggor för andra proteiner eller droger att ta tag i. Platserna är centrala för att utföra de flesta av våra grundläggande biologiska processer. De är också en enorm guldgruva för att designa nya behandlingar och medicinska läkemedel.

Problemet? Funktionella platser är svåra att kartlägga. Forskare var traditionellt tvungna att mutera misstänkta områden på ett protein en efter en - byta en aminosyra till en annan - för att spika fast exakta bindningsfläckar. Som en detektiv som screenar hundratals misstänkta, av vilka det kan finnas många, är det extremt tråkigt.

A ny studie in Vetenskap störtade hela spelboken. Under ledning av Dr. David Baker vid University of Washington utnyttjade ett team en AI:s "fantasi" för att skapa en myriad av funktionella webbplatser från grunden. Det är ett maskinsinnes "kreativitet" när den är som bäst - en djupinlärningsalgoritm som förutsäger det allmänna området för ett proteins funktionella plats, men som sedan formar strukturen ytterligare.

Som en verklighetskontroll använde teamet den nya mjukvaran för att generera läkemedel som bekämpar cancer och designar vacciner mot vanliga, men ibland dödliga, virus. I ett fall kom det digitala sinnet på en lösning som, när den testades i isolerade celler, passade perfekt till en befintlig antikropp mot ett vanligt virus. Med andra ord "föreställde" algoritmen en hotspot från ett viralt protein, vilket gjorde det sårbart som mål för att designa nya behandlingar.

Algoritmen är djupinlärningens första försök att bygga proteiner runt deras funktioner, vilket öppnar en dörr till behandlingar som tidigare var otänkbara. Men programvaran är inte begränsad till naturliga proteinhotspots. "Proteinerna vi hittar i naturen är fantastiska molekyler, men designade proteiner kan göra så mycket mer", säger Baker i ett pressmeddelande. Algoritmen är att "göra saker som ingen av oss trodde att den skulle vara kapabel till."

Protein Hotspot

Bakers team är inte främmande för att förutsäga proteiner med konstgjorda sinnen. För några år sedan skakade de det strukturella biologiområdet genom att släppa Rosetta, en programvara som kan förutsäga ett proteins 3D-struktur baserat på enbart dess aminosyrasekvens. De kartlade ytterligare proteinkomplex och designade protein "skruvmejslar" från grunden för att bända isär oönskade proteininteraktioner. I slutet av förra året släppte de en nätverk för djupt lärande kallad trRosetta, en AI "arkitekt" som generaliserar hur strängar av aminosyror ordnar sig i intrikata strukturer på nanoskala.

Låt oss backa.

Det är lätt att föreställa sig proteiner som den köttiga, seniga kycklingvingen jag biter i när jag skriver den här meningen. Men på molekylär nivå är de mycket mer eleganta. Föreställ dig flera legoklossar – aminosyror – som hålls samman av ett snöre. Snurra nu runt den och vrid kedjan tills några block snäpper fast i varandra. Detta bildar en delikat struktur som ofta liknar en spiral eller rufsiga lakan. I vissa proteiner samlas dessa byggstenar ytterligare till komplex - till exempel skapa en kanal som tunnlar genom en cells skyddande membran som en patrullerad mellanstatlig motorväg.

Proteiner driver varje enskild biologisk process, ofta genom en kaskad av interaktioner med andra proteiner eller läkemedel, som – beroende på partner – kan utlösa helt andra konsekvenser: ska en cell leva eller dö? Attackera en potentiell inkräktare eller stå ner? Protein är med andra ord livets byggstenar, och att analysera deras struktur är hur vi kan hacka oss in i livet.

Så här är det: inte alla delar av ett protein är skapade lika. Om ett protein är en människokropp, är funktionella platser dess "händer" - där det griper tag i ett annat protein eller läkemedel, rör upp enzymatiska reaktioner eller bekämpar invaderande patogener. Dessa platser är inbäddade direkt i proteinets struktur och är svåra att fastställa och ännu svårare att återskapa.

Den nya studien tacklade problemet med en version av Rosetta: med viss tidigare kunskap, är det möjligt för en dator att drömma upp en kedja av aminosyror som naturligt viker sig till en funktionell plats?

Drömmaren och realisten

Problemet kan verka exotiskt, men det finns ett tidigare exempel - inom ett annat område. Med hjälp av ett neuralt nätverk skapade OpenAI ett brett utbud av bilder från enbart texttexter. En spinoff av rockstar AI textgenerator GPT-3, genererade DALL·E-algoritmen fantastiska men realistiska bilder baserade på enkla textmeddelanden genom att detektera mönster från träningen. "Den tar de djupaste, mörkaste fördjupningarna i din fantasi och gör den till något som är kusligt relevant," sade Dr. Hany Farid vid UC Berkeley efter verktygets första release.

Att bygga en proteinfunktionell plats är liknande. Här är aminosyror bokstäverna och proteinets funktionella ställe är bilden. "Tanken är densamma: neurala nätverk kan tränas för att se mönster i data. När du väl är utbildad kan du ge det en uppmaning och se om det kan generera en elegant lösning”, säger Dr. Joseph Watson, en huvudförfattare till det nya verket. Förutom att snarare än att skriva en roman, kan algoritmen hjälpa till att skriva om livet.

Teamet började med en tidigare skapelse, trRosetta. Det är ett neuralt nätverk som ursprungligen utformats för att drömma om nya proteiner baserade på aminosyrasekvenser samtidigt som de kan förutsäga deras struktur - några så främmande från naturliga att teamet kallade djupinlärningens inre funktion "hallucination". Algoritmen verkade perfekt: den kunde både förutsäga ett proteins aminosyrasekvens och dess struktur.

Hickan? Det fungerade inte riktigt. I kontrast, OG för förutsägelse av proteinstruktur, RoseTTAFold, uppträdde som en mästare. Algoritmens kraft kommer från dess design: modellering av varje aminosyra i nanoskala, vilket ger koordinater till varje atom. Som att fästa en geografisk plats med hjälp av Google Maps, ger detta en nivå av grundsanning för en struktur som en AI kan riffa vidare på - en sorts "begränsad hallucination".

Översättning? RoseTTAFold kan förutsäga en funktionell struktur – specifik för det aktuella problemet – och komma med en grov skiss som den slutliga designen.

Sedan kom ett annat smart trick, kallat "inpainting". Här gömde teamet delar av proteinsekvensen eller strukturen. Programvaran var tvungen att lära sig att dechiffrera information från vad som i huvudsak är en bullrig radioavlyssning, där du bara kan höra de första orden men försöka förstå dess innebörd genom att fylla i tomrummen. RoseTTAFold tacklade "problemet med återställning av saknad information" med bravur och autokompletterade både aminosyrasekvenser och strukturer för att konstruera en given funktionell region med hög tillförlitlighet.

RoseTTAFold kan ta itu med problemen med att bygga aminosyrasekvenser och samtidigt skapa en ryggrad för platsen. Det är som att sätta ord på papper: skribenten ser till att varje bokstav är på rätt plats, samtidigt som han kontrollerar att grammatiken och betydelsen är vettig.

Ifrågasätter verklighetens natur

Genom att testa sin nya skapelse skapade teamet flera läkemedels- och vaccindesigner som potentiellt skulle kunna bekämpa virus och cancer eller hjälpa till med hälsoproblem med lågt järnhalt.

För huvudförfattaren Dr Jue Wang blev algoritmen oväntat relevant. Under arbetet med projektet lades hans tvåårige son in på akutmottagningen på grund av en lunginfektion av RSV (Respiratory Syncytial Virus) – ett virus som normalt uppvisar förkylningsliknande symtom, men som kan vara dödligt hos unga och äldre.

Vid den tiden använde Wang algoritmen för att designa nya behandlingar, som inkluderade potentiella platser på RSV för att ytterligare testa vacciner och läkemedel mot. Det är en relativt väl kartlagd struktur. Programvaran hallucinerade design som recapitulerade två platser för vacciner att potentiellt binda till. Tester med hallucinerade proteiner, rekonstruerade i bakterier, tog snabbt tag i befintliga antikroppar - ett tecken på att de är funktionella och att djupinlärningsmetoden fungerar.

Incidenten "fick mig att inse att även de "test"-problem vi arbetade med faktiskt var ganska meningsfulla, säger Wang.

I flera ytterligare tester designade teamet funktionella platser för ett enzym, proteinbindande proteiner och proteiner som griper tag i metalljoner - i princip hur du absorberar järn och andra viktiga metaller.

Även om det är kraftfullt, finns det utrymme för tillväxt. Metoden öppnar dörren till att avmystifiera naturliga proteiner, men också potentiellt designa nya för syntetisk biologi. "Det här är mycket kraftfulla nya tillvägagångssätt, men det finns fortfarande mycket utrymme för förbättringar", säger Baker.

Sammantaget är det ytterligare en vinst för djupinlärning och en fascinerande presentation av hur AI och biologi kan samverka. "Deep learning transformerade proteinstrukturen förutsägelse under de senaste två åren, vi är nu mitt uppe i en liknande transformation av proteindesign," sa Baker.

Bildkredit: Ian C. Haydon/UW Institute for Protein Design. Ny programvara för artificiell intelligens som tränas på proteinstrukturer kan generera funktionella proteiner, inklusive dessa kandidatvacciner för respiratoriskt virus RSV, på några sekunder.

Tidsstämpel:

Mer från Singularity Hub