I ricercatori insegnano all'intelligenza artificiale per individuare le mutazioni legate al cancro

I ricercatori insegnano all'intelligenza artificiale per individuare le mutazioni legate al cancro

I ricercatori insegnano all'intelligenza artificiale a individuare le mutazioni legate al cancro PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Le tecniche di machine learning, come il deep learning, si sono dimostrate sorprendentemente efficaci nell'identificare malattie come il cancro al seno. Tuttavia, quando si tratta di identificare le mutazioni a livello genetico, questi modelli non sono stati all'altezza, secondo i ricercatori dell'Università della California di San Diego (UCSD).

In un giornale pubblicato nella rivista Nature Biotechnology questa settimana, i ricercatori dell'università propongono un nuovo framework di machine learning chiamato DeepMosaic che utilizza una combinazione di visualizzazione basata su immagini e modelli di deep learning per identificare le mutazioni genetiche associate a malattie tra cui il cancro e disturbi con collegamenti genetici, come disturbo dello spettro autistico.

L'utilizzo di AI/ML per identificare le malattie è stato un tema caldo negli ultimi anni. Ad esempio, ad agosto, gli scienziati di Harvard dettagliati un sistema di intelligenza artificiale multimodale in grado di prevedere 14 tipi di cancro.

Il problema, secondo il professore dell'UCSD Joe Gleeson, è che la maggior parte di questi modelli non è adatta all'identificazione di mutazioni genetiche, chiamate varianti o mutazioni a mosaico, perché la maggior parte del software sviluppato negli ultimi due decenni è stato addestrato su campioni di cancro.

Poiché le cellule tumorali si dividono così rapidamente, sono relativamente facili da individuare per i programmi per computer, ha spiegato in un'intervista a Il registro. In confronto, le mutazioni del mosaico sono difficili da individuare perché esistono solo in un sottoinsieme di cellule.

Contrariamente a quanto ti è stato insegnato alle elementari, quando le cellule si dividono, non sono una copia perfetta l'una dell'altra. Ci sono piccoli cambiamenti o mutazioni, ha spiegato Gleeson. Queste mutazioni sono generalmente innocue ma a volte portano al cancro o ad altre malattie. Ciò rende i metodi per l'identificazione di mutazioni potenzialmente problematiche così preziosi.

Ma fino a poco tempo fa non c'era "un buon modo per identificare quelle mutazioni dal sequenziamento del DNA", ha detto. "Ciò che presentiamo in questo articolo è un nuovo modo di farlo [che] sfrutta il deep learning".

Immergersi in DeepMosaic

Lo stesso framework DeepMosaic è stato addestrato su 180,000 varianti di mosaico utilizzando nodi GPU Nvidia Kepler K80 ospitati nel cluster di calcolo Comet del San Diego Supercomputing Center.

Disponibile come modello pre-addestrato open source, il framework funziona convertendo le sequenze del genoma in immagini e quindi applica una rete neurale convoluzionale di deep learning per identificare le mutazioni del mosaico, ha detto Xiaoxu Yang, un ricercatore post-dottorato che lavora al progetto Il registro.

E a differenza di alcuni modelli di machine learning, chiunque distribuisca DeepMosaic non dovrebbe aver bisogno di condizionare i propri dati a meno che non preveda di riaddestrare il modello.

Rispetto ai metodi esistenti, i ricercatori affermano che il modello può identificare queste mutazioni con maggiore precisione. E rispetto al processo di verifica manuale richiesto dai metodi convenzionali, è anche ordini di grandezza più veloce, ha osservato Gleeson.

Data una sufficiente potenza della GPU, Yang afferma che DeepMosaic dovrebbe essere in grado di elaborare un intero profilo genomico entro un'ora. E mentre il modello è stato addestrato su Comet, ciò non significa che sia necessario un supercomputer per eseguire o addirittura riaddestrare il modello. È del tutto possibile per qualcuno addestrare DeepMosaic utilizzando una postazione di lavoro personale, ha affermato.

La struttura offre anche vantaggi distinti rispetto ai modelli sviluppati specificamente pensando al cancro, ha affermato Yang. La maggior parte di questi programmi richiede un campione di controllo non canceroso. Ciò rende poco pratico il loro utilizzo per identificare le varianti del mosaico poiché le mutazioni possono essere diffuse su più tessuti.

DeepMosaic "è indipendente dal controllo, il che significa che siamo in grado di esaminare quelle varianti condivise da diversi tessuti", ha affermato.

Sebbene sia migliore per identificare le varianti del mosaico, i ricercatori notano che DeepMosaic, almeno nella sua forma attuale, non è pratico per i campioni di cancro.

Ma come sottolinea Gleeson, essere in grado di identificare con precisione queste mutazioni è un primo passo verso lo sviluppo di trattamenti medici.

Un clone Git lontano

I ricercatori interessati a provare DeepMosaic non dovranno andare lontano. Il framework, la documentazione e le demo necessarie per implementarlo e testarlo sono disponibili per il download in GitHub.

Oltre al modello pre-addestrato, i ricercatori hanno incluso anche tutti gli strumenti necessari per riaddestrare il modello sui propri set di dati.

Secondo Gleeson, c'è ancora molto spazio per migliorare. "Molto del lavoro attualmente nella genetica umana è con gli antenati europei", ha spiegato, aggiungendo che c'è un'opportunità per applicare questi strumenti a diversi antenati.

Oltre a identificare le firme della malattia, DeepMosaic può avere applicazioni in campi adiacenti. "Il nostro modello è molto ben sintonizzato per individuare sottili differenze nei file di sequenze genomiche di una singola persona, ma penso che lo strumento abbia probabilmente applicazioni in altri campi", ha affermato Gleeson. "Ad esempio, in medicina legale, dove si sente molto nelle notizie sulla corrispondenza del DNA con i database pubblici."

Le opportunità di strumenti, come DeepMosaic, per migliorare la salute umana e la comprensione continueranno solo a crescere man mano che il costo del sequenziamento del genoma continua a diminuire, ha aggiunto Yang. ®

Timestamp:

Di più da Il registro