Uno strumento di intelligenza artificiale ha appena rivelato quasi 200 nuovi sistemi per l'editing genetico CRISPR

Uno strumento di intelligenza artificiale ha appena rivelato quasi 200 nuovi sistemi per l'editing genetico CRISPR

Uno strumento di intelligenza artificiale ha appena rivelato quasi 200 nuovi sistemi per l'editing genetico CRISPR PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

CRISPR ha un problema: l’imbarazzo della ricchezza.

Da quando il sistema di editing genetico ha raggiunto la fama, gli scienziati hanno cercato varianti con maggiore precisione e accuratezza.

Un metodo di ricerca analizza i geni correlati a CRISPR-Cas9 nel DNA di batteri e altre creature. Un altro sviluppa artificialmente i componenti CRISPR in laboratorio per conferire loro migliori proprietà terapeutiche, come maggiore stabilità, sicurezza ed efficienza all’interno del corpo umano.

Questi dati sono archiviati in database contenenti miliardi di sequenze genetiche. Sebbene possano esserci sistemi CRISPR esotici nascosti in queste librerie, ci sono semplicemente troppe voci da cercare.

Questo mese, un team del MIT e di Harvard guidato dal pioniere del CRISPR, il dottor Feng Zhang, si è ispirato a un approccio esistente basato sui big data e ha utilizzato l’intelligenza artificiale per restringere il mare di sequenze genetiche a una manciata simile ai sistemi CRISPR noti.

L'AI hanno analizzato database open source con genomi di batteri non comuni, compresi quelli trovati nei birrifici, nelle miniere di carbone, nelle fredde coste antartiche e (non sto scherzando) nella saliva dei cani.

In poche settimane, l’algoritmo ha individuato migliaia di potenziali nuove “parti” biologiche che potrebbero costituire 188 nuovi sistemi basati su CRISPR, inclusi alcuni estremamente rari.

Molti dei nuovi candidati si sono distinti. Ad esempio, alcuni potrebbero agganciarsi in modo più preciso al gene bersaglio per l’editing con minori effetti collaterali. Altre varianti non sono direttamente utilizzabili, ma potrebbero fornire informazioni su come funzionano alcuni sistemi CRISPR esistenti, ad esempio quelli che prendono di mira l’RNA, la molecola “messaggero” che dirige le cellule a costruire proteine ​​dal DNA.

“La biodiversità è un vero tesoro” disse Zhang. "Fare questa analisi ci permette di prendere due piccioni con una fava: entrambi studiano la biologia e potenzialmente trovano anche cose utili", ha aggiunto.

Una caccia selvaggia

Sebbene CRISPR sia noto per la sua abilità nell’editing genetico negli esseri umani, gli scienziati hanno scoperto per la prima volta il sistema nei batteri dove combatte le infezioni virali.

Gli scienziati hanno da tempo raccolto campioni di batteri da angoli e fessure di tutto il mondo. Grazie al sequenziamento del DNA sempre più conveniente ed efficiente, molti di questi campioni, alcuni provenienti da fonti inaspettate come la schiuma degli stagni, hanno avuto il loro progetto genetico mappato e depositato in database.

Zhang non è estraneo alla ricerca di nuovi sistemi CRISPR. "Un certo numero di anni fa, abbiamo iniziato a chiederci: 'Cosa c'è oltre CRISPR e ci sono altri sistemi programmabili tramite RNA in natura?'" Zhang detto MIT Notizie all'inizio di quest'anno.

CRISPR è composto da due strutture. Una è una sequenza di RNA guida “bloodhound”, solitamente lunga circa 20 basi, che prende di mira un particolare gene. L'altra è la proteina Cas simile a una forbice. Una volta all'interno della cellula, il segugio trova il bersaglio e le forbici tagliano il gene. Versioni più recenti del sistema, come la modifica di base o primo editing, utilizzare diversi tipi di proteine ​​Cas per eseguire scambi di DNA a lettera singola o persino modificare target di RNA.

Torna in 2021, il laboratorio di Zhang ha tracciato le origini dell'albero genealogico CRISPR, identificando una linea familiare completamente nuova. Soprannominati OMEGA, questi sistemi utilizzano RNA guida estranei e forbici proteiche, ma potrebbero comunque tagliare facilmente il DNA nelle cellule umane coltivate in piastre di Petri.

Più recentemente, la squadra ampliato la loro ricerca ad un nuovo ramo della vita: gli eucarioti. I membri di questa famiglia, comprese piante, animali e esseri umani, hanno il loro DNA strettamente avvolto all'interno di una struttura simile a una noce. I batteri, al contrario, non hanno queste strutture. Esaminando funghi, alghe e vongole (sì, la biodiversità è strana e fantastica), il team ha scoperto proteine ​​chiamate Fanzor che possono essere riprogrammate per modificare il DNA umano: una prima prova che un meccanismo simile a CRISPR esiste anche negli eucarioti.

Ma l’obiettivo non è quello di dare la caccia a nuovi brillanti editor genetici solo per il gusto di farlo. Si tratta piuttosto di sfruttare l'abilità della natura nell'editing genetico per creare una raccolta di editor genetici, ciascuno con i propri punti di forza, in grado di trattare i disturbi genetici e aiutarci a comprendere il funzionamento interno del nostro corpo.

Collettivamente, gli scienziati hanno scoperto sei principali sistemi CRISPR: alcuni collaborano con diversi enzimi Cas, ad esempio, mentre altri sono specializzati nel DNA o nell’RNA.

“La natura è meravigliosa. C'è così tanta diversità”, Zhang disse. "Probabilmente ci sono più sistemi programmabili tramite RNA là fuori, e stiamo continuando a esplorare e, si spera, ne scopriremo di più."

Scarabeo di bioingegneria

Questo è lo scopo per cui il team ha creato la nuova IA, chiamata FLSHclust. Hanno trasformato la tecnologia che analizza set di dati incredibilmente grandi – come i software che evidenziano somiglianze in grandi depositi di documenti, file audio o immagini – in uno strumento per dare la caccia ai geni legati a CRISPR.

Una volta completato, l'algoritmo ha analizzato le sequenze genetiche dei batteri e le ha raccolte in gruppi, un po' come raggruppare i colori in un arcobaleno, raggruppando insieme colori simili in modo che sia più facile trovare la tonalità che stai cercando. Da qui, il team si è concentrato sui geni associati a CRISPR.

L’algoritmo ha analizzato diversi database open source tra cui centinaia di migliaia di genomi di batteri e archaea e milioni di sequenze misteriose di DNA. In totale, ha scansionato miliardi di geni che codificano proteine ​​e li ha raggruppati in circa 500 milioni di cluster. In questi, il team ha identificato 188 geni che nessuno ha ancora associato a CRISPR e che potrebbero costituire migliaia di nuovi sistemi CRISPR.

Due sistemi, sviluppati dai microbi in le budella di animali e il mare nero, ha utilizzato un RNA guida a 32 basi invece dei soliti 20 utilizzati in CRISPR-Cas9. Come una query di ricerca, più lunga è, più precisi saranno i risultati. Queste “query” più lunghe sull’RNA guida suggeriscono che i sistemi potrebbero avere meno effetti collaterali. Un altro sistema è simile a un precedente sistema diagnostico basato su CRISPR chiamato Sherlock, che può rilevare rapidamente una singola molecola di DNA o RNA da un invasore infettivo.

Quando testati su cellule umane in coltura, entrambi i sistemi potrebbero tagliare un singolo filamento del gene preso di mira e inserire piccole sequenze genetiche con un'efficienza di circa il 13%. Non sembra molto, ma è una linea di base che può essere migliorata.

Il team ha anche scoperto i geni per un nuovo sistema CRISPR che prende di mira l’RNA precedentemente sconosciuto alla scienza. Trovata solo dopo un attento esame, sembra che questa versione e tutte quelle ancora da scoprire non siano facilmente catturate campionando batteri in tutto il mondo e siano quindi estremamente rare in natura.

“Alcuni di questi sistemi microbici sono stati trovati esclusivamente nell’acqua delle miniere di carbone”, disse autore dello studio, il dottor Soumya Kannan. "Se qualcuno non fosse stato interessato a questo, forse non avremmo mai visto quei sistemi."

È ancora troppo presto per sapere se questi sistemi possono essere utilizzati nell’editing genetico umano. Quelli che sminuzzano casualmente il DNA, ad esempio, sarebbero inutili a fini terapeutici. Tuttavia, l’intelligenza artificiale può estrarre un vasto universo di dati genetici per trovare potenziali sequenze genetiche di “unicorno” ed è ora a disposizione di altri scienziati per ulteriori esplorazioni.

Immagine di credito: NIH

Timestamp:

Di più da Hub di singolarità