AI kan designe helt nye proteiner fra bunden – det er tid til at tale om biosikkerhed

AI kan designe helt nye proteiner fra bunden – det er tid til at tale om biosikkerhed

AI kan designe helt nye proteiner fra bunden – det er tid til at tale om Biosikkerhed PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

For to årtier siden var designdesignerproteiner en drøm.

Nu, takket være AI, er brugerdefinerede proteiner en skilling et dusin. Lavet efter bestilling proteiner har ofte specifikke former eller komponenter, der giver dem evner, der er nye for naturen. Fra længerevarende lægemidler og proteinbaserede vacciner, til grønnere biobrændstoffer og plastik-spisning proteiner, er feltet hurtigt ved at blive en transformativ teknologi.

Tilpasset proteindesign afhænger af deep learning-teknikker. Med store sprogmodeller - AI'en bag OpenAI's blockbuster ChatGPT - der drømmer om millioner af strukturer ud over menneskelig fantasi, er biblioteket af bioaktive designerproteiner klar til at udvide sig hurtigt.

"Det er enormt styrkende," Dr. Neil King ved University of Washington for nylig fortalt Natur. "Ting, der var umulige for halvandet år siden - nu gør du det bare."

Men med stor magt følger et stort ansvar. Efterhånden som nydesignede proteiner i stigende grad vinder indpas til brug inden for medicin og bioteknik, undrer forskere sig nu: Hvad sker der, hvis disse teknologier bruges til uhyggelige formål?

Et nyligt essay i Videnskab fremhæver behovet for biosikkerhed for designerproteiner. I lighed med igangværende samtaler om AI-sikkerhed siger forfatterne, at det er tid til at overveje biosikkerhedsrisici og -politikker, så tilpassede proteiner ikke bliver useriøse.

Essayet er skrevet af to eksperter på området. Den ene, Dr. David Baker, direktøren for Institut for Protein Design ved University of Washington ledede udviklingen af ​​RoseTTAFold - en algoritme, der knækkede det halve årti problem med at afkode proteinstruktur fra dens aminosyresekvenser alene. Den anden, Dr. George Church ved Harvard Medical School, er en pioner inden for genteknologi og syntetisk biologi.

De foreslår, at syntetiske proteiner skal have stregkoder indlejret i hvert nyt proteins genetiske sekvens. Hvis nogen af ​​designerproteinerne bliver en trussel - for eksempel potentielt udløsende et farligt udbrud - ville dens stregkode gøre det nemt at spore tilbage til dets oprindelse.

Systemet giver grundlæggende "et revisionsspor", duoen skriver.

Verdener kolliderer

Designerproteiner er uløseligt knyttet til AI. Det samme er potentielle biosikkerhedspolitikker.

For over et årti siden brugte Bakers laboratorium software til at designe og bygge et protein kaldet Top7. Proteiner er lavet af byggesten kaldet aminosyrer, som hver er kodet inde i vores DNA. Ligesom perler på en snor bliver aminosyrer derefter snoet og rynket til specifikke 3D-former, som ofte går yderligere ind i sofistikerede arkitekturer, der understøtter proteinets funktion.

Top7 kunne ikke "tale" med naturlige cellekomponenter - det havde ingen biologiske effekter. Men selv da holdet indgået at design af nye proteiner gør det muligt at udforske "de store områder af proteinuniverset, der endnu ikke er observeret i naturen."

Indtast AI. Flere strategier tog for nylig fart for at designe nye proteiner ved supersoniske hastigheder sammenlignet med traditionelt laboratoriearbejde.

Den ene er strukturbaseret AI, der ligner billedgenererende værktøjer som DALL-E. Disse AI-systemer er trænet på støjende data og lærer at fjerne støjen for at finde realistiske proteinstrukturer. Kaldet diffusionsmodeller lærer de gradvist proteinstrukturer, der er kompatible med biologi.

En anden strategi bygger på store sprogmodeller. Ligesom ChatGPT finder algoritmerne hurtigt forbindelser mellem protein-"ord" og destillerer disse forbindelser til en slags biologisk grammatik. De proteinstrenge, som disse modeller genererer, vil sandsynligvis foldes til strukturer, som kroppen kan dechifrere. Et eksempel er ProtGPT2, som kan ingeniør aktive proteiner med former, der kan føre til nye egenskaber.

Digital til fysisk

Disse AI-proteindesign-programmer vækker alarmklokkerne. Proteiner er livets byggesten - ændringer kan dramatisk ændre, hvordan celler reagerer på lægemidler, vira eller andre patogener.

Sidste år annoncerede regeringer over hele verden planer om at overvåge AI-sikkerhed. Teknologien var ikke placeret som en trussel. I stedet udformede lovgiverne forsigtigt politikker, der sikrer, at forskning følger lovgivningen om privatlivets fred og styrker økonomien, folkesundheden og det nationale forsvar. I spidsen for anklagen blev Den Europæiske Union enige om AI-loven at begrænse teknologien på visse domæner.

Syntetiske proteiner blev ikke direkte nævnt i reglerne. Det er gode nyheder for at lave designerproteiner, som kunne blive ramt af alt for restriktive reguleringer, skriver Baker og Church. Ny AI-lovgivning er dog på vej, og FN's rådgivende organ om AI skal dele retningslinjer vedr. international regulering i midten af ​​dette år.

Fordi AI-systemerne, der bruges til at fremstille designerproteiner, er højt specialiserede, kan de stadig flyve under regulatoriske radarer - hvis feltet forenes i en global indsats for selvregulering.

Ved 2023 AI Safety Summit, som diskuterede AI-aktiveret proteindesign, var eksperter enige om, at dokumentere hvert nyt proteins underliggende DNA er nøglen. Ligesom deres naturlige modstykker er designerproteiner også bygget af genetisk kode. Logning af alle syntetiske DNA-sekvenser i en database kan gøre det lettere at se røde flag for potentielt skadelige designs - for eksempel hvis et nyt protein har strukturer, der ligner kendte patogene.

Biosikkerhed squasher ikke datadeling. Samarbejde er afgørende for videnskaben, men forfatterne erkender, at det stadig er nødvendigt at beskytte forretningshemmeligheder. Og ligesom i AI kan nogle designerproteiner være potentielt nyttige, men for farlige til at dele åbent.

En vej rundt om denne gåde er direkte at tilføje sikkerhedsforanstaltninger til selve synteseprocessen. For eksempel foreslår forfatterne at tilføje en stregkode - lavet af tilfældige DNA-bogstaver - til hver ny genetisk sekvens. For at bygge proteinet søger en syntesemaskine i dets DNA-sekvens, og først når den finder koden, begynder den at bygge proteinet.

Med andre ord kan de oprindelige designere af proteinet vælge, hvem de vil dele syntesen med – eller om de overhovedet vil dele det – mens de stadig er i stand til at beskrive deres resultater i publikationer.

En stregkodestrategi, der knytter fremstilling af nye proteiner til en syntesemaskine, vil også øge sikkerheden og afskrække dårlige skuespillere, hvilket gør det vanskeligt at genskabe potentielt farlige produkter.

"Hvis en ny biologisk trussel dukker op hvor som helst i verden, kan de tilknyttede DNA-sekvenser spores til deres oprindelse," skrev forfatterne.

Det bliver en hård vej. Designerproteinsikkerhed vil afhænge af global støtte fra videnskabsmænd, forskningsinstitutioner og regeringer, skriver forfatterne. Der har dog været tidligere succeser. Globale grupper har etableret retningslinjer for sikkerhed og deling på andre kontroversielle områder, såsom stamcelleforskning, genteknologi, hjerneimplantater og kunstig intelligens. Selvom det ikke altid blev fulgt -CRISPR babyer er et berygtet eksempel- for det meste har disse internationale retningslinjer hjulpet med at flytte banebrydende forskning fremad på en sikker og retfærdig måde.

For Baker og Church vil åbne diskussioner om biosikkerhed ikke bremse feltet. Det kan snarere samle forskellige sektorer og engagere offentlig diskussion, så tilpasset proteindesign kan trives yderligere.

Billede Credit: University of Washington

Tidsstempel:

Mere fra Singularitet Hub