Ein KI-Tool hat gerade fast 200 neue Systeme für die CRISPR-Genbearbeitung enthüllt

Ein KI-Tool hat gerade fast 200 neue Systeme für die CRISPR-Genbearbeitung enthüllt

Ein KI-Tool hat gerade fast 200 neue Systeme für die CRISPR-Genbearbeitung PlatoBlockchain Data Intelligence enthüllt. Vertikale Suche. Ai.

CRISPR hat ein Problem: eine Peinlichkeit des Reichtums.

Seitdem das Gen-Editing-System rasant an Popularität gewonnen hat, suchen Wissenschaftler nach Varianten mit höherer Präzision und Genauigkeit.

Eine Suchmethode sucht nach Genen, die mit CRISPR-Cas9 in der DNA von Bakterien und anderen Lebewesen in Zusammenhang stehen. Ein anderer entwickelt CRISPR-Komponenten im Labor künstlich weiter, um ihnen bessere therapeutische Eigenschaften zu verleihen – etwa mehr Stabilität, Sicherheit und Effizienz im menschlichen Körper.

Diese Daten werden in Datenbanken gespeichert, die Milliarden genetischer Sequenzen enthalten. Auch wenn in diesen Bibliotheken möglicherweise exotische CRISPR-Systeme versteckt sind, gibt es einfach zu viele Einträge, um sie zu durchsuchen.

In diesem Monat ließ sich ein Team am MIT und in Harvard unter der Leitung des CRISPR-Pioniers Dr. Feng Zhang von einem bestehenden Big-Data-Ansatz inspirieren und nutzte KI, um das Meer genetischer Sequenzen auf eine Handvoll einzugrenzen, die bekannten CRISPR-Systemen ähneln.

Die KI durchsuchte Open-Source-Datenbanken mit Genomen ungewöhnlicher Bakterien – darunter solche, die in Brauereien, Kohlengruben, an kühlen Küsten der Antarktis und (kein Scherz) Hundespeichel gefunden wurden.

In nur wenigen Wochen hat der Algorithmus Tausende potenzieller neuer biologischer „Teile“ identifiziert, aus denen 188 neue CRISPR-basierte Systeme bestehen könnten – darunter einige, die äußerst selten sind.

Mehrere der neuen Kandidaten stachen hervor. Einige könnten sich beispielsweise präziser auf das Zielgen festlegen, um es mit weniger Nebenwirkungen zu bearbeiten. Andere Variationen sind nicht direkt verwendbar, könnten aber Einblicke in die Funktionsweise einiger bestehender CRISPR-Systeme geben – zum Beispiel solche, die auf RNA abzielen, das „Botenmolekül“, das Zellen anweist, Proteine ​​aus DNA aufzubauen.

„Biodiversität ist eine wahre Schatzkammer“ sagte Zhang. „Durch diese Analyse können wir quasi zwei Fliegen mit einer Klappe schlagen: Biologie studieren und möglicherweise auch nützliche Dinge finden“, sagt er hinzugefügt.

Eine wilde Jagd

Obwohl CRISPR für seine Fähigkeit zur Genbearbeitung beim Menschen bekannt ist, entdeckten Wissenschaftler das System erstmals in Bakterien, wo es Virusinfektionen bekämpft.

Wissenschaftler sammeln seit langem Bakterienproben aus Ecken und Winkeln auf der ganzen Welt. Dank der immer erschwinglicheren und effizienteren DNA-Sequenzierung wurde der genetische Bauplan vieler dieser Proben – einige davon aus unerwarteten Quellen wie Teichschlamm – kartiert und in Datenbanken hinterlegt.

Zhang ist kein Unbekannter auf der Suche nach neuen CRISPR-Systemen. „Vor einigen Jahren begannen wir zu fragen: ‚Was gibt es über CRISPR hinaus und gibt es in der Natur noch andere RNA-programmierbare Systeme?‘“, sagte Zhang sagte MIT-Nachrichten Anfang dieses Jahres.

CRISPR besteht aus zwei Strukturen. Eine davon ist eine „Bluthund“-Leit-RNA-Sequenz, die normalerweise etwa 20 Basen lang ist und auf ein bestimmtes Gen abzielt. Das andere ist das scherenartige Cas-Protein. Sobald der Bluthund in einer Zelle ist, findet er das Ziel und die Schere schneidet das Gen ab. Neuere Versionen des Systems, wie z. B. Basisbearbeitung oder erstklassige Bearbeitung, verwenden Sie verschiedene Arten von Cas-Proteinen, um Einzelbuchstaben-DNA-Austausche durchzuführen oder sogar RNA-Ziele zu bearbeiten.

Zurück in 2021Zhangs Labor verfolgte die Ursprünge des CRISPR-Stammbaums und identifizierte eine völlig neue Familienlinie. Diese als OMEGA bezeichneten Systeme verwenden fremde Leit-RNAs und Proteinscheren, können aber dennoch problemlos DNA in in Petrischalen kultivierten menschlichen Zellen herausschneiden.

In jüngerer Zeit das Team haben ihre Suche erweitert zu einem neuen Lebenszweig: Eukaryoten. Mitglieder dieser Familie – darunter Pflanzen, Tiere und Menschen – haben ihre DNA fest in einer nussähnlichen Struktur verpackt. Bakterien hingegen verfügen nicht über diese Strukturen. Durch das Screening von Pilzen, Algen und Muscheln (ja, die Artenvielfalt ist seltsam und großartig) fand das Team Proteine, die sie Fanzors nennen und die umprogrammiert werden können, um menschliche DNA zu bearbeiten – ein erster Beweis dafür, dass ein CRISPR-ähnlicher Mechanismus auch in Eukaryoten existiert.

Aber das Ziel besteht nicht darin, glänzende, neue Gen-Editoren nur um ihrer selbst willen aufzuspüren. Vielmehr geht es darum, die Fähigkeiten der Natur zur Genbearbeitung zu nutzen, um eine Sammlung von Geneditoren aufzubauen, von denen jeder seine eigenen Stärken hat, die genetische Störungen behandeln und uns helfen können, die inneren Abläufe unseres Körpers zu verstehen.

Insgesamt haben Wissenschaftler sechs Haupt-CRISPR-Systeme entdeckt – einige arbeiten beispielsweise mit verschiedenen Cas-Enzymen zusammen, während andere entweder auf DNA oder RNA spezialisiert sind.

„Die Natur ist erstaunlich. Es gibt so viel Vielfalt“, sagte Zhang sagte. „Es gibt wahrscheinlich noch mehr RNA-programmierbare Systeme, und wir forschen weiter und werden hoffentlich noch mehr entdecken.“

Bioengineering-Scrabble

Dafür hat das Team die neue KI namens FLSHclust entwickelt. Sie verwandelten Technologien, die verwirrend große Datensätze analysieren – etwa Software, die Ähnlichkeiten in großen Dokumenten-, Audio- oder Bilddateien hervorhebt – in ein Werkzeug zur Suche nach Genen, die mit CRISPR in Zusammenhang stehen.

Sobald der Algorithmus fertig war, analysierte er Gensequenzen von Bakterien und gruppierte sie – ein bisschen so, als würde man Farben zu einem Regenbogen gruppieren und ähnliche Farben gruppieren, damit man leichter den gewünschten Farbton findet. Von hier aus konzentrierte sich das Team auf Gene, die mit CRISPR assoziiert sind.

Der Algorithmus durchsuchte mehrere Open-Source-Datenbanken, darunter Hunderttausende Genome von Bakterien und Archaeen sowie Millionen mysteriöser DNA-Sequenzen. Insgesamt wurden Milliarden proteinkodierender Gene gescannt und in etwa 500 Millionen Cluster gruppiert. Darin identifizierte das Team 188 Gene, die noch niemand mit CRISPR in Verbindung gebracht hat und die Tausende neuer CRISPR-Systeme bilden könnten.

Zwei Systeme, entwickelt aus Mikroben der Mut von Tieren und das schwarze Meer, verwendete eine 32-Basen-Guide-RNA anstelle der üblichen 20, die in CRISPR-Cas9 verwendet werden. Wie bei einer Suchanfrage gilt: Je länger sie ist, desto präziser sind die Ergebnisse. Diese längeren „Leit-RNA-Abfragen“ deuten darauf hin, dass die Systeme weniger Nebenwirkungen haben könnten. Ein anderes System wird wie ein früheres CRISPR-basiertes Diagnosesystem bezeichnet Sherlock, das schnell ein einzelnes DNA- oder RNA-Molekül eines infektiösen Eindringlings erkennen kann.

Beim Test in kultivierten menschlichen Zellen konnten beide Systeme einen einzelnen Strang des Zielgens abschneiden und kleine genetische Sequenzen mit einer Effizienz von etwa 13 Prozent einfügen. Das hört sich nicht nach viel an, ist aber eine Grundvoraussetzung, die verbessert werden kann.

Das Team entdeckte außerdem Gene für ein neues CRISPR-System, das auf RNA abzielt, die der Wissenschaft bisher unbekannt war. Erst nach eingehender Prüfung gefunden, scheint es, dass diese Version und alle noch zu entdeckenden Exemplare von Bakterienproben auf der ganzen Welt nicht leicht erfasst werden können und daher in der Natur äußerst selten sind.

„Einige dieser mikrobiellen Systeme wurden ausschließlich im Wasser von Kohlebergwerken gefunden.“ sagte Studienautorin Dr. Soumya Kannan. „Wenn sich jemand dafür nicht interessiert hätte, hätten wir diese Systeme vielleicht nie gesehen.“

Es ist noch zu früh, um zu sagen, ob diese Systeme bei der Bearbeitung menschlicher Gene eingesetzt werden können. Diejenigen, die beispielsweise DNA willkürlich zerhacken, wären für therapeutische Zwecke nutzlos. Die KI kann jedoch ein riesiges Universum genetischer Daten durchsuchen, um potenzielle „Einhorn“-Gensequenzen zu finden, und steht nun anderen Wissenschaftlern zur weiteren Erforschung zur Verfügung.

Bild-Kredit: NIH

Zeitstempel:

Mehr von Singularity Hub