Tekoälytyökalu paljasti juuri lähes 200 uutta järjestelmää CRISPR-geenien muokkaamiseen

Tekoälytyökalu paljasti juuri lähes 200 uutta järjestelmää CRISPR-geenien muokkaamiseen

Tekoälytyökalu paljasti juuri lähes 200 uutta järjestelmää CRISPR-geenien muokkaukseen PlatoBlockchain Data Intelligencen. Pystysuuntainen haku. Ai.

CRISPR:llä on ongelma: rikkauksien hämmennys.

Siitä lähtien, kun geenien muokkausjärjestelmä on noussut kuuluisuuteen, tutkijat ovat etsineet muunnelmia, jotka ovat tarkkoja ja tarkkoja.

Yhdellä hakumenetelmällä seulotaan CRISPR-Cas9:ään liittyviä geenejä bakteerien ja muiden olentojen DNA:sta. Toinen kehittää keinotekoisesti CRISPR-komponentteja laboratoriossa antaakseen niille parempia terapeuttisia ominaisuuksia, kuten parempaa vakautta, turvallisuutta ja tehokkuutta ihmiskehossa.

Nämä tiedot tallennetaan tietokantoihin, jotka sisältävät miljardeja geneettisiä sekvenssejä. Vaikka näihin kirjastoihin voi olla piilotettuja eksoottisia CRISPR-järjestelmiä, niissä on yksinkertaisesti liian monta hakua.

Tässä kuussa CRISPR:n pioneerin tohtori Feng Zhangin johtama MIT:n ja Harvardin tiimi sai inspiraationsa olemassa olevasta big data -lähestymistavasta ja käytti tekoälyä rajaamaan geneettisten sekvenssien joukkoa kouralliseen, jotka ovat samanlaisia ​​kuin tunnetut CRISPR-järjestelmät.

AI selattiin avoimen lähdekoodin tietokantoja, jotka sisältävät harvinaisten bakteerien genomeja – mukaan lukien ne, joita löytyy panimoista, hiilikaivoksista, kylmiltä Etelämantereen rannoilta ja (ei vitsi) koiran syljestä.

Vain muutamassa viikossa algoritmi osoitti tuhansia mahdollisia uusia biologisia "osia", jotka voisivat muodostaa 188 uutta CRISPR-pohjaista järjestelmää - mukaan lukien jotkut, jotka ovat erittäin harvinaisia.

Useat uusista ehdokkaista erottuivat joukosta. Jotkut voisivat esimerkiksi lukkiutua tarkemmin kohdegeeniin muokkausta varten vähemmillä sivuvaikutuksilla. Muut muunnelmat eivät ole suoraan käyttökelpoisia, mutta ne voivat antaa käsityksen siitä, miten jotkut olemassa olevat CRISPR-järjestelmät toimivat – esimerkiksi ne, jotka kohdistuvat RNA:han, "lähetti"molekyyliin, joka ohjaa soluja rakentamaan proteiineja DNA:sta.

"Biologinen monimuotoisuus on aarreaitta" sanoi Zhang. "Tämän analyysin tekeminen antaa meille mahdollisuuden tappaa kaksi kärpästä yhdellä iskulla: molemmat opiskelevat biologiaa ja voivat myös löytää hyödyllisiä asioita", hän lisä-.

Villi metsästys

Vaikka CRISPR tunnetaan geenien muokkauskyvystään ihmisillä, tutkijat löysivät järjestelmän ensin bakteereista, joissa se taistelee virusinfektioita vastaan.

Tiedemiehet ovat jo pitkään keränneet bakteerinäytteitä nurkista ja koloista ympäri maailmaa. Yhä edullisemman ja tehokkaamman DNA-sekvensoinnin ansiosta monet näistä näytteistä – osa odottamattomista lähteistä, kuten lampivaarasta – on kartoitettu ja talletettu tietokantoihin.

Zhangille ei ole vieras uusien CRISPR-järjestelmien metsästys. "Muutama vuosi sitten aloimme kysyä: 'Mitä on CRISPR:n lisäksi, ja onko luonnossa muita RNA-ohjelmoitavia järjestelmiä?" Zhang kertoi MIT-uutiset aikaisemmin tänä vuonna.

CRISPR koostuu kahdesta rakenteesta. Yksi on "verikoira" -opastava RNA-sekvenssi, yleensä noin 20 emästä pitkä ja joka kohdistuu tiettyyn geeniin. Toinen on saksien kaltainen Cas-proteiini. Kun verikoira on solun sisällä, se löytää kohteen ja sakset leikkaavat geenin. Järjestelmän uudemmat versiot, kuten peruseditointi tai ensisijainen editointi, käyttää erityyppisiä Cas-proteiineja yksikirjaimien DNA-vaihtojen suorittamiseen tai jopa RNA-kohteiden muokkaamiseen.

Takaisin 2021iinZhangin laboratorio jäljitti CRISPR-sukupuun alkuperän ja tunnisti täysin uuden sukulinjan. Nämä järjestelmät, joita kutsutaan nimellä OMEGA, käyttävät vieraita ohjaavia RNA:ita ja proteiinisaksia, mutta ne pystyivät silti helposti katkaisemaan DNA:ta petrimaljoilla viljellyistä ihmissoluista.

Viime aikoina joukkue laajensivat hakuaan uudelle elämänhaaralle: eukaryooteille. Tämän perheen jäsenillä – mukaan lukien kasvit, eläimet ja ihmiset – DNA on tiukasti käärittynä pähkinämäisen rakenteen sisään. Bakteereilla sitä vastoin ei ole näitä rakenteita. Seulomalla sieniä, leviä ja simpukoita (jep, biologinen monimuotoisuus on outoa ja mahtavaa) tiimi löysi Fanzoreiksi kutsumiaan proteiineja, jotka voidaan ohjelmoida uudelleen muokkaamaan ihmisen DNA:ta – ensimmäinen todiste siitä, että CRISPR:n kaltainen mekanismi on olemassa myös eukaryooteissa.

Mutta tavoitteena ei ole metsästää kiiltäviä, uusia geenieditoreja vain sen vuoksi. Pikemminkin se on hyödyntää luonnon geenien muokkauskykyä rakentaaksesi kokoelman geenieditoreja, joista jokaisella on omat vahvuutensa ja jotka voivat hoitaa geneettisiä häiriöitä ja auttaa meitä ymmärtämään kehomme sisäistä toimintaa.

Tiedemiehet ovat yhdessä löytäneet kuusi pääasiallista CRISPR-järjestelmää - jotkut tekevät yhteistyötä esimerkiksi eri Cas-entsyymien kanssa, kun taas toiset ovat erikoistuneet joko DNA:han tai RNA:han.

"Luonto on ihmeellinen. Siellä on niin paljon monimuotoisuutta”, Zhang sanoi. "On luultavasti enemmän RNA-ohjelmoitavia järjestelmiä, ja jatkamme tutkimista ja toivottavasti löydämme lisää."

Biotekniikan Scrabble

Sitä varten tiimi rakensi uuden tekoälyn, FLSHclustin. He muuttivat tekniikan, joka analysoi hämmentävän suuria tietojoukkoja – kuten ohjelmistoja, jotka korostavat yhtäläisyyksiä suurissa dokumenttien, ääni- tai kuvatiedostojen talletuksissa – työkaluksi CRISPR:ään liittyvien geenien metsästämiseen.

Valmistuttuaan algoritmi analysoi geenisekvenssejä bakteereista ja kokosi ne ryhmiin – vähän kuin ryhmittäisi värit sateenkaareksi, ryhmittelemään samanlaiset värit yhteen, jotta etsimäsi sävy on helpompi löytää. Tästä eteenpäin tiimi hioi CRISPR:ään liittyviä geenejä.

Algoritmi kampasi läpi useita avoimen lähdekoodin tietokantoja, mukaan lukien satoja tuhansia bakteerien ja arkkien genomeja ja miljoonia mysteeri-DNA-sekvenssejä. Kaiken kaikkiaan se skannasi miljardeja proteiineja koodaavia geenejä ja ryhmitti ne noin 500 miljoonaan klusteriin. Näissä ryhmä tunnisti 188 geeniä, joita kukaan ei ole vielä yhdistänyt CRISPR:ään ja joista voi muodostua tuhansia uusia CRISPR-järjestelmiä.

Kaksi järjestelmää, jotka on kehitetty mikrobeista sisua eläimistä ja musta meri, käytti 32 emäksen ohjaus-RNA:ta CRISPR-Cas20:ssä käytetyn tavanomaisen 9 emäksen sijaan. Kuten hakukysely, mitä pidempi se on, sitä tarkemmat tulokset ovat. Nämä pidemmät ohjaavat RNA- "kyselyt" viittaavat siihen, että järjestelmillä voisi olla vähemmän sivuvaikutuksia. Toinen järjestelmä on kuin edellinen CRISPR-pohjainen diagnostiikkajärjestelmä nimeltä SHERLOCK, joka voi nopeasti havaita yhden DNA- tai RNA-molekyylin tarttuvasta hyökkääjästä.

Viljellyissä ihmissoluissa testattaessa molemmat järjestelmät pystyivät katkaisemaan yhden juosteen kohteena olevasta geenistä ja lisäämään pieniä geneettisiä sekvenssejä noin 13 prosentin tehokkuudella. Se ei kuulosta paljolta, mutta se on lähtökohta, jota voidaan parantaa.

Tiimi paljasti myös geenejä uudelle CRISPR-järjestelmälle, joka kohdistuu tieteelle aiemmin tuntemattomaan RNA:han. Vaikuttaa siltä, ​​että tämä versio ja kaikki vielä löydettävissä olevat versiot löydettiin vasta perusteellisen tarkastelun jälkeen, etteivät bakteerinäytteet pysty helposti vangitsemaan eri puolilla maailmaa, joten ne ovat luonnossa erittäin harvinaisia.

"Jotkut näistä mikrobisysteemeistä löytyivät yksinomaan hiilikaivosten vedestä." sanoi tutkimuksen kirjoittaja tohtori Soumya Kannan. "Jos joku ei olisi ollut kiinnostunut siitä, emme ehkä olisi koskaan nähneet niitä järjestelmiä."

On vielä liian aikaista tietää, voidaanko näitä järjestelmiä käyttää ihmisen geenien muokkaamiseen. Ne, jotka esimerkiksi pilkkovat DNA:ta satunnaisesti, olisivat hyödyttömiä terapeuttisiin tarkoituksiin. Tekoäly voi kuitenkin louhia valtavan universumin geneettistä tietoa löytääkseen mahdollisia "yksisarvisen" geenisekvenssejä, ja se on nyt muiden tutkijoiden käytettävissä lisätutkimusta varten.

Kuva pistetilanne: NIH

Aikaleima:

Lisää aiheesta Singulaarisuus Hub