Protein-Designing AI Opens Door to Medicines Humans Couldn’t Dream Up PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Umetna inteligenca za načrtovanje beljakovin odpira vrata do zdravil, o katerih si ljudje ne moremo niti sanjati

slika

Oblikovanje proteina je podobno izdelavi omare. Prvi korak je izgradnja hrbtenice, ki drži beljakovine skupaj. Toda potem pride težji del: ugotoviti, kam namestiti tečaje na oder – to je iskanje najboljših »vročih točk« – za pritrditev vrat, polic in drugih dodatkov, ki končno naredijo omaro popolnoma funkcionalno.

Na nek način imajo tudi proteini vroče točke vgrajene v svoje strukture. V skladu s svojim imenom, »funkcionalna mesta«, ti intrigantni kotički tvorijo zapletene doke, kamor lahko zgrabijo druge beljakovine ali zdravila. Mesta so osrednja za izvajanje večine naših osnovnih bioloških procesov. So tudi ogromen rudnik zlata za načrtovanje novih zdravljenj in zdravil.

Težava? Funkcionalna spletna mesta je težko preslikati. Znanstveniki so morali tradicionalno mutirati sumljiva področja na beljakovini enega za drugim – s preklopom ene aminokisline na drugo – da bi ugotovili natančne vezivne točke. Kot detektiv, ki pregleduje na stotine osumljencev, ki jih je lahko veliko, je izjemno dolgočasno.

A Nova študija in Znanost zrušil celotno knjigo iger. Ekipa, ki jo je vodil dr. David Baker z Univerze v Washingtonu, je izkoristila »domišljijo« umetne inteligence in iz nič izdelala nešteto funkcionalnih spletnih mest. To je »ustvarjalnost« strojnega uma v najboljšem primeru – algoritem globokega učenja, ki napove splošno področje funkcionalnega mesta proteina, a nato strukturo še oblikuje.

Kot preverjanje resničnosti je skupina uporabila novo programsko opremo za ustvarjanje zdravil za boj proti raku in oblikovanje cepiv proti običajnim, čeprav včasih smrtonosnim virusom. V enem primeru je digitalni um našel rešitev, ki se je po testiranju v izoliranih celicah popolnoma ujemala z obstoječim protitelesom proti navadnemu virusu. Z drugimi besedami, algoritem si je "zamislil" vročo točko iz virusnega proteina, zaradi česar je bil ranljiv kot tarča za načrtovanje novih zdravljenj.

Algoritem je prvi vpad globokega učenja v gradnjo beljakovin okoli njihovih funkcij, kar odpira vrata zdravljenju, ki je bilo prej nepredstavljivo. Toda programska oprema ni omejena na naravne vroče točke beljakovin. "Proteini, ki jih najdemo v naravi, so neverjetne molekule, vendar zasnovani proteini lahko naredijo veliko več," je dejal Baker v sporočilu za javnost. Algoritem "dela stvari, za katere nihče od nas ni mislil, da jih bo zmogel."

Protein Hotspot

Bakerjevi ekipi napovedovanje beljakovin z umetnimi umi ni tujec. Pred nekaj leti so pretresli področje strukturne biologije z izdajo Rosetta, programske opreme, ki lahko napove 3D strukturo proteina samo na podlagi njegovega aminokislinskega zaporedja. Nadalje so preslikali beljakovinske komplekse in oblikovali beljakovinske "izvijače" iz nič, da bi ločili neželene interakcije beljakovin. Konec lanskega leta so izdali a omrežje globokega učenja poimenovan trRosetta, »arhitekt« AI, ki posplošuje, kako se nizi aminokislin razporedijo v zapletene strukture na nanometru.

Pojdimo nazaj.

Zlahka si predstavljam beljakovine kot mesnate, žilave piščančje perutnice, v katere grizem, ko tipkam ta stavek. Toda na molekularni ravni so veliko bolj elegantni. Predstavljajte si več lego kock – aminokislin –, ki jih skupaj drži vrvica. Zdaj ga zavrtite in sukajte verigo, dokler se nekateri bloki ne zaskočijo drug na drugega. To tvori občutljivo strukturo, ki je pogosto podobna vijačnici ali zmečkani posteljnini. V nekaterih proteinih se ti gradniki nadalje sestavljajo v komplekse – na primer, izdelajo kanal, ki poteka skozi celično zaščitno membrano kot patruljirana meddržavna avtocesta.

Beljakovine poganjajo vsak posamezen biološki proces, pogosto prek kaskade interakcij z drugimi beljakovinami ali zdravili, ki lahko – odvisno od partnerja – sprožijo popolnoma različne posledice: naj celica živi ali umre? Napasti morebitnega vsiljivca ali odstopiti? Z drugimi besedami, beljakovine so gradniki življenja in razčlenjevanje njihove strukture je način, kako lahko vdremo v življenje.

Tukaj je stvar: niso vsi deli beljakovine enaki. Če je beljakovina človeško telo, so funkcionalna mesta njene »roke« – kjer zgrabi drugo beljakovino ali zdravilo, sproži encimske reakcije ali se bori proti vsiljivim patogenom. Ta mesta, ki so vgrajena neposredno v strukturo beljakovin, je težko določiti in še težje poustvariti.

Nova študija se je problema lotila z različico Rosetta: ali je z nekaj predhodnega znanja mogoče, da računalnik sanja o verigi aminokislin, ki se naravno zložijo v funkcionalno mesto?

Sanjač in realist

Težava se morda zdi eksotična, vendar obstaja prejšnji primer - na drugem področju. Z uporabo nevronske mreže je OpenAI ustvaril široko paleto slik samo iz besedilnih napisov. Izdelek generatorja besedil rockstar AI GPT-3, je algoritem DALL·E ustvaril fantastične, a realistične slike na podlagi preprostih besedilnih pozivov z zaznavanjem vzorcev iz svojega usposabljanja. "Zavzame najgloblje, najtemnejše kotičke vaše domišljije in jo spremeni v nekaj, kar je srhljivo pomembno," je dejal Dr. Hany Farid na UC Berkeley po prvi izdaji orodja.

Izgradnja funkcionalnega mesta beljakovin je podobna. Tu so aminokisline črke, funkcionalno mesto proteina pa slika. »Ideja je enaka: nevronske mreže je mogoče usposobiti, da vidijo vzorce v podatkih. Ko ste enkrat usposobljeni, ga lahko pozovete in preverite, ali lahko ustvari elegantno rešitev,« je povedal dr. Joseph Watson, glavni avtor novega dela. Algoritem bi lahko pomagal prepisati življenje, razen namesto pisanja romana.

Ekipa je začela s prejšnjo kreacijo, trRosetta. To je nevronska mreža, ki je bila prvotno zasnovana za ustvarjanje novih beljakovin na podlagi aminokislinskih zaporedij, hkrati pa je sposobna predvideti njihovo strukturo – nekatere tako tuje od naravnih, da je ekipa notranje delovanje globokega učenja poimenovala »halucinacija«. Algoritem se je zdel popoln: lahko je napovedal aminokislinsko zaporedje beljakovine in njeno strukturo.

Kolcanje? Ni res delovalo. V nasprotju, OG napoved strukture beljakovin, RoseTTAFold, nastopil kot šampion. Moč algoritma izhaja iz njegove zasnove: modeliranje vsake aminokisline na nanometru, zagotavljanje koordinat vsakemu atomu. Podobno kot pripenjanje geografskega mesta z uporabo Google Zemljevidov, to zagotavlja raven temeljne resnice za strukturo, ki jo lahko umetna inteligenca še naprej rifira - nekakšna "omejena halucinacija".

prevod? RoseTTAFold lahko predvidi funkcionalno strukturo – specifično za obravnavani problem – in pripravi grobo skico kot končno zasnovo.

Potem je prišel še en pameten trik, imenovan "inpainting". Tukaj je ekipa skrila dele beljakovinskega zaporedja ali strukture. Programska oprema se je morala naučiti dešifrirati informacije iz tega, kar je v bistvu hrupno radijsko prestrezanje, kjer lahko slišite samo prvih nekaj besed, vendar poskušate razumeti njihov pomen tako, da izpolnite prazna mesta. RoseTTAFold se je z užitkom lotil "problema obnovitve manjkajočih informacij", tako da je samodejno dokončal aminokislinska zaporedja in strukture, da bi z visoko natančnostjo zgradil dano funkcionalno regijo.

RoseTTAFold se lahko spopade s težavami gradnje aminokislinskih zaporedij in ustvarjanja hrbtenice za mesto hkrati. To je kot prelivanje besed na papir: pisec poskrbi, da je vsaka črka na pravem mestu, pri tem pa ves čas preverja, ali sta slovnica in pomen smiselna.

Spraševanje o naravi resničnosti

Skupina je s preizkušanjem svoje nove stvaritve ustvarila več modelov zdravil in cepiv, ki bi se lahko borili proti virusom in raku ali pomagali pri zdravstvenih težavah z nizko vsebnostjo železa.

Za glavnega avtorja dr. Jueja Wanga je algoritem postal nepričakovano primeren. Med delom na projektu je bil njegov dveletni sin hospitaliziran na oddelku za nujne primere zaradi okužbe pljuč z RSV (respiratorni sincicijski virus) – virusom, ki običajno kaže simptome, podobne prehladu, vendar je lahko smrtonosen za mlade in starejših.

Takrat je Wang uporabljal algoritem za načrtovanje novih zdravljenj, ki so vključevala potencialna mesta na RSV za nadaljnje testiranje cepiv in zdravil proti. To je razmeroma dobro začrtana struktura. Programska oprema je halucinirala načrte, ki so povzeli dve mesti za morebitno vezavo cepiv. Testi z uporabo haluciniranih proteinov, rekonstruiranih v bakterijah, so hitro zagrabili obstoječa protitelesa – znak, da delujejo in da pristop globokega učenja deluje.

Incident »me je dal spoznati, da so bile celo 'testne' težave, na katerih smo delali, pravzaprav zelo pomembne,« je dejal Wang.

V več dodatnih testih je ekipa oblikovala funkcionalna mesta za encim, proteine, ki vežejo beljakovine, in proteine, ki zagrabijo kovinske ione – v bistvu, kako absorbirate železo in druge pomembne kovine.

Čeprav je močan, obstaja prostor za rast. Metoda odpira vrata demistificiranju naravnih beljakovin, pa tudi potencialnemu oblikovanju novih za sintetično biologijo. "To so zelo močni novi pristopi, vendar je še veliko prostora za izboljšave," je dejal Baker.

Skupaj je to še ena zmaga za poglobljeno učenje in navdušujoča predstavitev, kako lahko umetna inteligenca in biologija sodelujeta. »Globoko učenje je v zadnjih dveh letih preoblikovalo napoved strukture beljakovin, zdaj smo sredi podobne preobrazbe zasnove beljakovin,« je dejal Baker.

Avtorstvo slike: Ian C. Haydon/Inštitut UW za načrtovanje beljakovin. Nova programska oprema za umetno inteligenco, usposobljena za beljakovinske strukture, lahko v nekaj sekundah ustvari funkcionalne beljakovine, vključno s temi kandidatnimi cepivi za respiratorni virus RSV.

Časovni žig:

Več od Središče singularnosti