Una herramienta de inteligencia artificial acaba de revelar casi 200 nuevos sistemas para la edición de genes CRISPR

Una herramienta de inteligencia artificial acaba de revelar casi 200 nuevos sistemas para la edición de genes CRISPR

Una herramienta de inteligencia artificial acaba de revelar casi 200 nuevos sistemas para la edición de genes CRISPR PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

CRISPR tiene un problema: una vergüenza de riquezas.

Desde que el sistema de edición de genes saltó a la fama, los científicos han estado buscando variantes con mayor precisión y exactitud.

Un método de búsqueda busca genes relacionados con CRISPR-Cas9 en el ADN de bacterias y otras criaturas. Otro desarrolla artificialmente componentes CRISPR en el laboratorio para darles mejores propiedades terapéuticas, como mayor estabilidad, seguridad y eficiencia dentro del cuerpo humano.

Estos datos se almacenan en bases de datos que contienen miles de millones de secuencias genéticas. Si bien puede haber sistemas CRISPR exóticos ocultos en estas bibliotecas, simplemente hay demasiadas entradas para buscar.

Este mes, un equipo del MIT y Harvard dirigido por el Dr. Feng Zhang, pionero de CRISPR, se inspiró en un enfoque de big data existente y utilizó IA para reducir el mar de secuencias genéticas a un puñado que son similares a los sistemas CRISPR conocidos.

La IA Recorrieron bases de datos de código abierto con genomas de bacterias poco comunes, incluidas las que se encuentran en cervecerías, minas de carbón, costas frías de la Antártida y (no es broma) saliva de perro.

En tan solo unas semanas, el algoritmo identificó miles de nuevas “partes” biológicas potenciales que podrían formar 188 nuevos sistemas basados ​​en CRISPR, incluidos algunos que son extremadamente raros.

Varios de los nuevos candidatos destacaron. Por ejemplo, algunos podrían fijar con mayor precisión el gen objetivo para editarlo con menos efectos secundarios. Otras variaciones no se pueden utilizar directamente, pero podrían proporcionar información sobre cómo funcionan algunos sistemas CRISPR existentes, por ejemplo, los que se dirigen al ARN, la molécula "mensajera" que dirige a las células a construir proteínas a partir del ADN.

"La biodiversidad es un tesoro escondido" dijo Zhang. "Hacer este análisis nos permite matar dos pájaros de un tiro: ambos estudian biología y también potencialmente encuentran cosas útiles", afirma. adicional.

Una caza salvaje

Aunque CRISPR es conocido por su capacidad de edición de genes en humanos, los científicos descubrieron por primera vez el sistema en bacterias donde combate las infecciones virales.

Los científicos llevan mucho tiempo recolectando muestras bacterianas de rincones y recovecos de todo el mundo. Gracias a una secuenciación de ADN cada vez más asequible y eficiente, muchas de estas muestras (algunas de fuentes inesperadas, como la espuma de un estanque) han podido mapear su modelo genético y depositarlo en bases de datos.

Zhang no es ajeno a la búsqueda de nuevos sistemas CRISPR. “Hace varios años, empezamos a preguntarnos: '¿Qué hay más allá de CRISPR? ¿Existen otros sistemas programables por ARN en la naturaleza?'” Zhang les dijo a Noticias del MIT a principios de este año.

CRISPR se compone de dos estructuras. Una es una secuencia de ARN guía tipo “sabueso”, generalmente de unas 20 bases de largo, que se dirige a un gen en particular. La otra es la proteína Cas con forma de tijera. Una vez dentro de una célula, el sabueso encuentra el objetivo y las tijeras cortan el gen. Versiones más recientes del sistema, como edición base o edición principal, utilizan diferentes tipos de proteínas Cas para realizar intercambios de ADN de una sola letra o incluso editar objetivos de ARN.

De vuelta en 2021, el laboratorio de Zhang rastreó los orígenes del árbol genealógico CRISPR, identificando una línea familiar completamente nueva. Estos sistemas, denominados OMEGA, utilizan ARN guía extraños y tijeras de proteínas, pero aún pueden cortar fácilmente ADN en células humanas cultivadas en placas de Petri.

Más recientemente, el equipo amplió su búsqueda a una nueva rama de la vida: los eucariotas. Los miembros de esta familia (incluidas plantas, animales y humanos) tienen su ADN firmemente envuelto dentro de una estructura similar a una nuez. Las bacterias, por el contrario, no tienen estas estructuras. Al examinar hongos, algas y almejas (sí, la biodiversidad es extraña e impresionante), el equipo encontró proteínas a las que llaman Fanzors que pueden reprogramarse para editar el ADN humano, una primera prueba de que también existe un mecanismo similar a CRISPR en los eucariotas.

Pero el objetivo no es cazar nuevos y brillantes editores de genes sólo porque sí. Más bien, se trata de aprovechar la destreza de edición de genes de la naturaleza para construir una colección de editores de genes, cada uno con sus propias fortalezas, que puedan tratar trastornos genéticos y ayudarnos a comprender el funcionamiento interno de nuestro cuerpo.

En conjunto, los científicos han descubierto seis sistemas CRISPR principales: algunos colaboran con diferentes enzimas Cas, por ejemplo, mientras que otros se especializan en ADN o ARN.

“La naturaleza es asombrosa. Hay tanta diversidad”, dijo Zhang. dijo. "Probablemente existan más sistemas programables por ARN y seguimos explorando y, con suerte, descubriremos más".

Scrabble de bioingeniería

Para eso el equipo creó la nueva IA, llamada FLSHclust. Transformaron la tecnología que analiza conjuntos de datos asombrosamente grandes (como software que resalta similitudes en grandes depósitos de archivos de documentos, audio o imágenes) en una herramienta para buscar genes relacionados con CRISPR.

Una vez completado, el algoritmo analizó secuencias genéticas de bacterias y las reunió en grupos, un poco como agrupar colores en un arco iris, agrupando colores similares para que sea más fácil encontrar el tono que buscas. A partir de aquí, el equipo se centró en los genes asociados con CRISPR.

El algoritmo revisó múltiples bases de datos de código abierto, incluidos cientos de miles de genomas de bacterias y arqueas y millones de secuencias misteriosas de ADN. En total, escaneó miles de millones de genes que codifican proteínas y los agrupó en aproximadamente 500 millones de grupos. En ellos, el equipo identificó 188 genes que nadie ha asociado todavía con CRISPR y que podrían formar miles de nuevos sistemas CRISPR.

Dos sistemas, desarrollados a partir de microbios en las agallas de animales y el mar Negro, utilizó un ARN guía de 32 bases en lugar de las 20 habituales utilizadas en CRISPR-Cas9. Al igual que una consulta de búsqueda, cuanto más larga sea, más precisos serán los resultados. Estas “consultas” de ARN guía más largas sugieren que los sistemas podrían tener menos efectos secundarios. Otro sistema es como un sistema de diagnóstico anterior basado en CRISPR llamado sherlock, que puede detectar rápidamente una sola molécula de ADN o ARN de un invasor infeccioso.

Cuando se probaron en células humanas cultivadas, ambos sistemas pudieron cortar una sola hebra del gen objetivo e insertar pequeñas secuencias genéticas con aproximadamente un 13 por ciento de eficiencia. No parece mucho, pero es una base que se puede mejorar.

El equipo también descubrió genes para un nuevo sistema CRISPR dirigido a ARN previamente desconocido para la ciencia. Encontrada solo después de un escrutinio minucioso, parece que esta versión y cualquiera que aún no se haya descubierto no se capturan fácilmente mediante muestras de bacterias en todo el mundo y, por lo tanto, son extremadamente raras en la naturaleza.

"Algunos de estos sistemas microbianos se encontraron exclusivamente en el agua de las minas de carbón". dijo autor del estudio, el Dr. Soumya Kannan. "Si alguien no hubiera estado interesado en eso, es posible que nunca hubiéramos visto esos sistemas".

Todavía es demasiado pronto para saber si estos sistemas se pueden utilizar en la edición de genes humanos. Aquellos que cortan ADN al azar, por ejemplo, serían inútiles para fines terapéuticos. Sin embargo, la IA puede extraer un vasto universo de datos genéticos para encontrar posibles secuencias genéticas de "unicornio" y ahora está disponible para otros científicos para una mayor exploración.

Crédito de la imagen: NIH

Sello de tiempo:

Mas de Centro de Singularidad