Hõredad närvivõrgud suunavad füüsikud kasulikele andmetele | Quanta ajakiri

Hõredad närvivõrgud suunavad füüsikud kasulikele andmetele | Quanta ajakiri

Hõredad närvivõrgud suunavad füüsikud kasulikele andmetele | Quanta Magazine PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Sissejuhatus

Oletame, et teil on tuhandeleheküljeline raamat, kuid igal lehel on ainult üks rida teksti. Raamatus sisalduva teabe peaksite välja võtma skanneri abil, ainult see konkreetne skanner läbib süstemaatiliselt iga lehe, skaneerides korraga ühe ruuttolli. Selle skanneriga kogu raamatu läbilugemine võtaks kaua aega ja suurem osa ajast kuluks tühja ruumi skannimisele. 

Selline on paljude eksperimentaalfüüsikute elu. Osakeste katsetes koguvad ja analüüsivad detektorid tohutul hulgal andmeid, kuigi ainult väike osa neist sisaldab kasulikku teavet. "Näiteks taevas lendava linnu fotol võib iga piksel olla tähendusrikas," selgitas Kazuhiro Terao, SLAC riikliku kiirendi labori füüsik. Kuid piltidel, mida füüsik vaatab, on sageli vaid väike osa sellest tegelikult oluline. Sellistes tingimustes kulutab iga detaili uurimine asjatult aega ja arvutusressursse.

Aga see hakkab muutuma. Masinõppevahendiga, mida tuntakse hõreda konvolutsioonilise närvivõrguna (SCNN), saavad teadlased keskenduda oma andmete asjakohastele osadele ja ülejäänud välja sõeluda. Teadlased on neid võrke kasutanud, et oluliselt kiirendada nende võimet teha reaalajas andmeanalüüsi. Ja nad kavatsevad kasutada SCNN-e tulevastes või olemasolevates katsetes vähemalt kolmel kontinendil. Lüliti tähistab füüsika kogukonna jaoks ajaloolist muutust. 

"Füüsikas oleme harjunud välja töötama oma algoritme ja arvutuslikke lähenemisviise," ütles Carlos Argüelles-Delgado, Harvardi ülikooli füüsik. "Oleme alati olnud arenduses esirinnas, kuid nüüd on arvutiteadus sageli juhtpositsioonil." 

Vähesed tegelased

Töö, mis viiks SCNN-ideni, algas 2012. aastal, mil Benjamin Graham, siis Warwicki ülikoolis, soovis luua närvivõrgu, mis suudaks ära tunda Hiina käekirja. 

Sel ajal olid selliste piltidega seotud ülesannete peamised tööriistad konvolutsioonilised närvivõrgud (CNN). Hiina käsitsi kirjutamise ülesande jaoks jälgib kirjanik digitaalsel tahvelarvutil tähemärki, luues näiteks 10,000 3 pikslise kujutise. Seejärel liigutaks CNN 3xXNUMX ruudustiku, mida nimetatakse tuumaks üle kogu pildi, tsentreerides tuuma iga piksli peale eraldi. Iga kerneli paigutuse korral teostaks võrk keeruka matemaatilise arvutuse, mida nimetatakse konvolutsiooniks, mis otsis eristavaid tunnuseid.

CNN-id loodi kasutamiseks teabetihedate piltidega, näiteks fotodega. Kuid hiina tähemärki sisaldav pilt on enamasti tühi; teadlased nimetavad selle omadusega andmeid hõredaks. See on kõige tavalisem joon looduses. "Kui tuua näide selle kohta, kui hõre võib maailm olla," ütles Graham, kui Eiffeli torn oleks ümbritsetud võimalikult väikese ristkülikuga, koosneks see ristkülik "99.98% õhust ja ainult 0.02% rauast".

Sissejuhatus

Graham proovis CNN-i lähenemisviisi kohandada nii, et kernel paigutataks ainult 3x3 pildi osadele, mis sisaldavad vähemalt ühte pikslit, millel on nullist erinev väärtus (ja see pole lihtsalt tühi). Sel viisil õnnestus tal luua süsteem, mis suudab tõhusalt tuvastada käsitsi kirjutatud hiina keelt. See võitis 2013. aasta konkursi, tuvastades üksikud tegelased veamääraga vaid 2.61%. (Inimesed said keskmiselt 4.81%.) Järgmisena pööras ta tähelepanu veelgi suuremale probleemile: kolmemõõtmelise objekti tuvastamisele.

2017. aastaks oli Graham kolinud Facebooki AI Researchi ning täiustanud oma tehnikat ja avaldatud the,en detailid esimese SCNN-i jaoks, mis tsentreeris kerneli ainult nullist erineva väärtusega pikslitele (selle asemel, et paigutada kernel mis tahes 3x3 sektsiooni, millel oli vähemalt üks nullist erinev piksel). Just selle üldise idee tõi Terao osakestefüüsika maailma.

Maa-alused kaadrid

Terao on seotud Fermi riikliku kiirendi labori katsetega, mis uurivad neutriinode olemust, mis on üks kõige tabamatumaid teadaolevaid elementaarosakesi. Need on ka massiga (ehkki mitte palju) universumi kõige levinumad osakesed, kuid neid ilmub detektoris harva. Seetõttu on enamik neutriinokatsete andmeid napid ja Terao otsis pidevalt paremaid lähenemisviise andmeanalüüsile. Ta leidis ühe SCNN-idest.

2019. aastal rakendas ta SCNN-e Deep Underground Neutrino Experimenti ehk DUNE andmete simuleerimiseks, millest saab 2026. aastal võrgus maailma suurim neutriinofüüsika eksperiment. Projekti käigus tulistatakse neutriinosid Chicago lähedal asuvast Fermilabist, läbi 800 miili maad maa-alusesse laborisse Lõuna-Dakotas. Teel hakkavad osakesed "võnkuma" kolme teadaoleva neutriinotüübi vahel ja need võnkumised võivad paljastada üksikasjalikud neutriinoomadused.

SCNN-id analüüsisid simuleeritud andmeid kiiremini kui tavalised meetodid ja nõudsid selleks oluliselt vähem arvutusvõimsust. Paljutõotavad tulemused tähendavad, et SCNN-e kasutatakse tõenäoliselt tegeliku katse käigus.

Vahepeal aitas Terao 2021. aastal lisada SCNN-e teisele Fermilabi neutriinokatsele, mida tuntakse MicroBooNE nime all. Siin vaatlevad teadlased neutriinode ja argooni aatomite tuumade kokkupõrgete tagajärgi. Nende interaktsioonide tekitatud jälgi uurides saavad teadlased järeldada üksikasju algsete neutriinode kohta. Selleks vajavad nad algoritmi, mis suudab vaadata piksleid (või tehniliselt nende kolmemõõtmelisi vasteid, mida nimetatakse voksliteks) detektori kolmemõõtmelises esituses ja seejärel määrata, millised pikslid on seotud milliste osakeste trajektooridega.

Kuna andmed on nii hõredad – väikeses detektoris (umbes 170 tonni vedelat argooni) on killuke pisikesi jooni –, on SCNN-id selle ülesande jaoks peaaegu täiuslikud. Terao ütles, et standardse CNN-i korral tuleks pilt kõigi arvutuste tõttu jagada 50 tükiks. "Hõreda CNN-iga analüüsime kogu pilti korraga - ja teeme seda palju kiiremini."

Õigeaegsed päästikud

Üks MicroBooNE kallal töötanud teadlastest oli bakalaureuseõppe praktikant Felix Yu. SCNN-ide võimsusest ja tõhususest muljet avaldanud ta tõi tööriistad endaga kaasa oma järgmisse töökohta, olles magistrandina Harvardi uurimislaboris, mis on ametlikult seotud lõunapoolusel asuva IceCube'i neutriinoobservatooriumiga.

Observatooriumi üks peamisi eesmärke on kinni püüda universumi kõige energilisemad neutriinod ja leida need tagasi nende allikateni, millest enamik asub väljaspool meie galaktikat. Detektor koosneb 5,160 Antarktika jäässe maetud optilisest andurist, millest igal ajahetkel süttib vaid väike osa. Ülejäänud massiiv jääb tumedaks ega ole eriti informatiivne. Mis veelgi hullem, paljud "sündmused", mida detektorid registreerivad, on valepositiivsed ega ole neutriinojahi jaoks kasulikud. Ainult nn trigger-tasandi sündmused teevad kärbe edasiseks analüüsiks ja tuleb teha kohesed otsused, millised on seda nimetust väärt ja millised jäävad jäädavalt tähelepanuta.

Standardsed CNN-id on selle ülesande jaoks liiga aeglased, nii et IceCube'i teadlased on pikka aega tuginenud LineFiti-nimelisele algoritmile, et rääkida neile potentsiaalselt kasulikest tuvastamistest. Kuid see algoritm on ebausaldusväärne, ütles Yu, "mis tähendab, et võime huvitavatest sündmustest ilma jääda." Jällegi on see hõre andmekeskkond, mis sobib ideaalselt SCNN-i jaoks.

Yu – koos tema doktoriõppe nõustaja Argüelles-Delgado ja Madisoni Wisconsini ülikooli magistrandi Jeff Lazariga – hindas seda eelist, näidates värske paber et need võrgud oleksid umbes 20 korda kiiremad kui tüüpilised CNN-id. "See on piisavalt kiire, et käivitada kõik sündmused, mis detektorist väljuvad," ütles Lazar umbes 3,000 sekundis. "See võimaldab meil teha paremaid otsuseid selle kohta, mida välja visata ja mida alles jätta."

Sissejuhatus

Autorid on edukalt kasutanud SCNN-i simulatsioonis, kasutades ametlikke IceCube'i andmeid, ja järgmiseks sammuks on nende süsteemi testimine lõunapooluse arvutussüsteemi koopial. Kui kõik läheb hästi, usub Argüelles-Delgado, et nad peaksid järgmisel aastal Antarktika observatooriumis oma süsteemi paigaldama. Kuid tehnoloogiat võib kasutada veelgi laiemalt. "Me arvame, et [SCNN-id võiksid olla kasulikud] kõigile neutriinoteleskoopidele, mitte ainult IceCube'ile," ütles Argüelles-Delgado.

Peale neutriinode

Massachusettsi Tehnoloogiainstituudi füüsik Philip Harris loodab, et SCNN-id saavad aidata nende kõigi suurimal osakeste põrkeseadmel: CERNi suurel hadronipõrgetil (LHC). Harris kuulis sellisest närvivõrgust MIT-i kolleegilt, arvutiteadlaselt Song Hanilt. "Song on ekspert algoritmide kiireks ja tõhusaks muutmisel," ütles Harris – ideaalne LHC jaoks, kus igas sekundis toimub 40 miljonit kokkupõrget.

Kui nad paar aastat tagasi rääkisid, rääkis Song Harrisele autonoomse sõiduki projektist, mida ta koos oma labori liikmetega ellu viis. Songi meeskond kasutas SCNN-e, et analüüsida 3D-laserkaarte sõiduki ees olevast ruumist, millest suur osa on tühi, et näha, kas ees on takistusi.

Harris ja tema kolleegid seisavad LHC-s silmitsi sarnaste väljakutsetega. Kui kaks prootonit masina sees kokku põrkuvad, tekitab krahh osakestest paisuva kera. Kui üks neist osakestest tabab kollektorit, tekib sekundaarne osakeste dušš. "Kui suudate kaardistada selle vihmasaju kogu ulatuse," ütles Harris, "saate määrata selle põhjustanud osakese energia," mis võib olla erilise huviobjektiks - umbes nagu Higgsi boson, mida füüsikud 2012. aastal avastatud ehk tumeaine osake, mida füüsikud siiani otsivad.

"Probleem, mida proovime lahendada, taandub punktide ühendamisele," ütles Harris, nagu ka isejuhtiv auto võib takistuse tuvastamiseks ühendada laserkaardi punkte.

Harris ütles, et SCNN-id kiirendaksid LHC andmete analüüsi vähemalt 50 korda. "Meie lõppeesmärk on saada [SCNN-id] detektorisse" – see ülesanne nõuab vähemalt aasta paberimajandust ja kogukonnalt täiendavat sisseostu. Kuid tema ja ta kolleegid on lootusrikkad.

Kokkuvõttes on üha tõenäolisem, et SCNN-id – algselt arvutiteaduse maailmas loodud idee – mängivad peagi rolli suurimates neutriinofüüsikas (DUNE), neutriinoastronoomias (IceCube) ja suure energiaga füüsikas (LHC) läbi viidud katsetes. .

Graham ütles, et oli meeldivalt üllatunud, kui sai teada, et SCNN-id on jõudnud osakestefüüsikasse, kuigi ta polnud täiesti šokeeritud. "Abstraktses mõttes," ütles ta, "kosmoses liikuv osake on natuke nagu paberil liikuv pliiatsi ots."

Ajatempel:

Veel alates Kvantamagazin