Researchers Teach AI To Pinpoint Mutations Linked To Cancer

Ponovno objavil Platon

Spremljevalci: 0

Tehnike strojnega učenja, kot je globoko učenje, so se izkazale za presenetljivo učinkovite pri prepoznavanju bolezni, kot je rak dojke. Ko pa gre za identifikacijo mutacij na genetski ravni, so ti modeli po mnenju raziskovalcev na kalifornijski univerzi v San Diegu (UCSD) prišli do pomanjkljivosti.

V papirju objavljeno v reviji Nature Biotechnology ta teden so raziskovalci na univerzi predlagali nov okvir strojnega učenja, imenovan DeepMosaic, ki uporablja kombinacijo vizualizacije na podlagi slike in modelov globokega učenja za prepoznavanje genetskih mutacij, povezanih z boleznimi, vključno z rakom, in motnjami z genetskimi povezavami, kot je npr. motnja avtističnega spektra.

Uporaba AI/ML za prepoznavanje bolezni je bila v zadnjih letih vroča tema. Na primer, avgusta so znanstveniki s Harvarda podrobno multimodalni sistem umetne inteligence, ki je sposoben napovedati 14 vrst raka.

Po mnenju profesorja UCSD Joeja Gleesona je težava v tem, da večina teh modelov ni primerna za prepoznavanje genetskih mutacij, imenovanih mozaične različice ali mutacije, ker je bila večina programske opreme, razvite v zadnjih dveh desetletjih, usposobljena na vzorcih raka.

Ker se rakave celice delijo tako hitro, jih računalniški programi razmeroma enostavno opazijo, je pojasnil v intervjuju za Register. Za primerjavo, mozaične mutacije je težko opaziti, ker obstajajo le v podskupini celic.

V nasprotju s tem, kar so vas morda učili v osnovni šoli, ko se celice delijo, niso popolna kopija druga druge. Obstajajo majhne spremembe ali mutacije, je pojasnil Gleeson. Te mutacije so običajno neškodljive, včasih pa povzročijo raka ali druge bolezni. Zaradi tega so metode za prepoznavanje potencialno problematičnih mutacij tako dragocene.

Toda do nedavnega ni bilo "dobrega načina za identifikacijo teh mutacij iz zaporedja DNK," je dejal. "Kar predstavljamo v tem dokumentu, je nov način za to, [ki] izkorišča globoko učenje."

Potapljanje v DeepMosaic

Samo ogrodje DeepMosaic je bilo usposobljeno na 180,000 različicah mozaika z uporabo vozlišč GPU Nvidia Kepler K80, nameščenih v računalniški gruči Comet v San Diegu Supercomputing Center.

Ogrodje, ki je na voljo kot odprtokodni vnaprej usposobljeni model, deluje tako, da pretvori zaporedja genoma v slike in nato uporabi konvolucijsko nevronsko mrežo globokega učenja za prepoznavanje mozaičnih mutacij, je povedal Xiaoxu Yang, podoktorski raziskovalec, ki dela na projektu. Register.

In za razliko od nekaterih modelov strojnega učenja, nikomur, ki uvaja DeepMosaic, ne bi bilo treba pogojovati svojih podatkov, razen če namerava ponovno usposobiti model.

V primerjavi z obstoječimi metodami raziskovalci trdijo, da lahko model identificira te mutacije z večjo natančnostjo. In v primerjavi s postopkom ročnega preverjanja, ki ga zahtevajo običajne metode, je tudi veliko hitrejši, je opozoril Gleeson.

Glede na dovolj konjskih moči GPE, Yang pravi, da bi moral biti DeepMosaic sposoben pregledati celoten genomski profil v eni uri. In čeprav je bil model uren na Cometu, to ne pomeni, da potrebujete superračunalnik za zagon ali celo ponovno usposabljanje modela. Trdil je, da je povsem v okviru možnosti, da nekdo uri DeepMosaic z uporabo osebne delovne postaje.

Okvir ponuja tudi izrazite prednosti v primerjavi z modeli, razvitimi posebej z mislijo na raka, je dejal Yang. Večina teh programov zahteva kontrolni vzorec brez raka. Zaradi tega je njihova uporaba za identifikacijo mozaičnih variant nepraktična, saj se mutacije lahko razširijo na več tkiv.

DeepMosaic "je neodvisen od nadzora, kar pomeni, da lahko pogledamo tiste različice, ki si jih delijo različna tkiva," je dejal.

Medtem ko je boljši za prepoznavanje variant mozaika, raziskovalci ugotavljajo, da DeepMosaic, vsaj v svoji trenutni obliki, ni praktičen za vzorce raka.

Toda kot poudarja Gleeson, je zmožnost natančne identifikacije teh mutacij prvi korak k razvoju zdravljenja.

Klon Git stran

Raziskovalcem, ki jih zanima DeepMosaic, ne bo treba iti daleč. Ogrodje, dokumentacija in predstavitve, potrebne za uvedbo in testiranje, so na voljo za prenos GitHub.

Poleg predhodno usposobljenega modela so raziskovalci vključili tudi vsa orodja, potrebna za ponovno usposabljanje modela na lastnih zbirkah podatkov.

Po mnenju Gleesona je še veliko prostora za izboljšave. "Veliko dela v človeški genetiki je trenutno opravljenega z evropskim poreklom," je pojasnil in dodal, da obstaja priložnost za uporabo teh orodij pri različnih prednikih.

Poleg prepoznavanja znakov bolezni ima lahko DeepMosaic aplikacije na sosednjih poljih. "Naš model je zelo dobro prilagojen za odkrivanje subtilnih razlik v datotekah genomskega zaporedja ene same osebe, vendar mislim, da ima orodje verjetno aplikacije na drugih področjih," je dejal Gleeson. "Na primer v forenziki, kjer v novicah veliko slišimo o ujemanju DNK z javnimi zbirkami podatkov."

Priložnosti za orodja, kot je DeepMosaic, za izboljšanje zdravja in razumevanja ljudi bodo le še rasle, saj bodo stroški sekvenciranja genoma še naprej padali, je dodal Yang. ®