Jarang Neural Networks Arahkan Fisikawan ke Data Berguna | Majalah Quanta

Jarang Neural Networks Arahkan Fisikawan ke Data Berguna | Majalah Quanta

Jaringan Neural Jarang Mengarahkan Fisikawan ke Data yang Berguna | Majalah Quanta PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Pengantar

Misalkan Anda memiliki buku seribu halaman, tetapi setiap halaman hanya memiliki satu baris teks. Anda seharusnya mengekstrak informasi yang terkandung dalam buku menggunakan pemindai, hanya pemindai khusus ini yang secara sistematis menelusuri setiap halaman, memindai satu inci persegi setiap kali. Butuh waktu lama bagi Anda untuk membaca seluruh buku dengan pemindai itu, dan sebagian besar waktu itu akan terbuang sia-sia untuk memindai ruang kosong. 

Begitulah kehidupan banyak fisikawan eksperimental. Dalam eksperimen partikel, detektor menangkap dan menganalisis sejumlah besar data, meskipun hanya sebagian kecil darinya yang berisi informasi berguna. โ€œDalam foto, katakanlah, seekor burung terbang di langit, setiap piksel bisa bermakna,โ€ jelasnya Kazuhiro Terao, fisikawan di SLAC National Accelerator Laboratory. Namun dalam gambar yang dilihat fisikawan, seringkali hanya sebagian kecil yang benar-benar penting. Dalam keadaan seperti itu, mempelajari setiap detail secara sia-sia menghabiskan waktu dan sumber daya komputasi.

Tapi itu mulai berubah. Dengan alat pembelajaran mesin yang dikenal sebagai jaringan saraf konvolusional jarang (SCNN), peneliti dapat fokus pada bagian yang relevan dari data mereka dan menyaring sisanya. Para peneliti telah menggunakan jaringan ini untuk mempercepat kemampuan mereka dalam melakukan analisis data secara real-time. Dan mereka berencana untuk menggunakan SCNN dalam percobaan yang akan datang atau yang sudah ada di setidaknya tiga benua. Peralihan ini menandai perubahan bersejarah bagi komunitas fisika. 

โ€œDalam fisika, kami terbiasa mengembangkan algoritme dan pendekatan komputasi kami sendiri,โ€ kata Carlos Argรผelles-Delgado, seorang fisikawan di Universitas Harvard. โ€œKami selalu berada di garis depan pengembangan, tetapi sekarang, di ujung komputasi, ilmu komputer sering memimpin.โ€ 

Karakter Jarang

Pekerjaan yang akan mengarah pada SCNN dimulai pada tahun 2012, ketika Benjamin Graham, kemudian di University of Warwick, ingin membuat jaringan saraf yang dapat mengenali tulisan tangan China. 

Alat utama pada saat itu untuk tugas terkait gambar seperti ini adalah jaringan saraf convolutional (CNN). Untuk tugas tulisan tangan Cina, seorang penulis akan melacak karakter pada tablet digital, menghasilkan gambar, katakanlah, 10,000 piksel. CNN kemudian akan memindahkan kisi 3-kali-3 yang disebut kernel di seluruh gambar, memusatkan kernel pada setiap piksel satu per satu. Untuk setiap penempatan kernel, jaringan akan melakukan perhitungan matematis yang rumit yang disebut konvolusi yang mencari fitur pembeda.

CNN dirancang untuk digunakan dengan gambar padat informasi seperti foto. Tapi gambar yang mengandung karakter Cina sebagian besar kosong; peneliti menyebut data dengan properti ini sebagai jarang. Ini adalah fitur umum dari apa pun di dunia alami. โ€œSebagai contoh betapa jarangnya dunia ini,โ€ kata Graham, jika Menara Eiffel terbungkus dalam persegi panjang sekecil mungkin, persegi panjang itu akan terdiri dari โ€œ99.98% udara dan hanya 0.02% besi.โ€

Pengantar

Graham mencoba men-tweak pendekatan CNN sehingga kernel hanya akan ditempatkan pada bagian 3-kali-3 dari gambar yang mengandung setidaknya satu piksel yang memiliki nilai bukan nol (dan tidak hanya kosong). Dengan cara ini, dia berhasil menghasilkan sistem yang dapat mengidentifikasi tulisan tangan Cina secara efisien. Itu memenangkan kompetisi 2013 dengan mengidentifikasi karakter individu dengan tingkat kesalahan hanya 2.61%. (Rata-rata skor manusia adalah 4.81%.) Dia selanjutnya mengalihkan perhatiannya ke masalah yang lebih besar: pengenalan objek tiga dimensi.

Pada 2017, Graham telah pindah ke Riset AI Facebook dan semakin menyempurnakan tekniknya dan diterbitkan itu rincian untuk SCNN pertama, yang memusatkan kernel hanya pada piksel yang memiliki nilai bukan nol (alih-alih menempatkan kernel pada bagian 3-kali-3 mana pun yang memiliki setidaknya satu piksel "bukan nol"). Ide umum inilah yang dibawa Terao ke dunia fisika partikel.

Tembakan Bawah Tanah

Terao terlibat dalam eksperimen di Laboratorium Akselerator Nasional Fermi yang menyelidiki sifat neutrino, di antara partikel elementer yang dikenal paling sulit dipahami. Mereka juga merupakan partikel paling melimpah di alam semesta dengan massa (walaupun tidak banyak), tetapi mereka jarang muncul di dalam detektor. Akibatnya, sebagian besar data untuk percobaan neutrino jarang, dan Terao terus mencari pendekatan yang lebih baik untuk analisis data. Dia menemukan satu di SCNN.

Pada tahun 2019, dia menerapkan SCNN ke simulasi data yang diharapkan dari Deep Underground Neutrino Experiment, atau DUNE, yang akan menjadi eksperimen fisika neutrino terbesar di dunia saat online pada tahun 2026. Proyek ini akan menembakkan neutrino dari Fermilab, tepat di luar Chicago, melalui 800 mil bumi ke laboratorium bawah tanah di South Dakota. Sepanjang jalan, partikel akan "berosilasi" di antara tiga jenis neutrino yang diketahui, dan osilasi ini dapat mengungkapkan sifat neutrino yang terperinci.

SCNN menganalisis data yang disimulasikan lebih cepat daripada metode biasa, dan membutuhkan daya komputasi yang jauh lebih sedikit untuk melakukannya. Hasil yang menjanjikan berarti bahwa SCNN kemungkinan akan digunakan selama percobaan yang sebenarnya.

Sementara itu, pada tahun 2021, Terao membantu menambahkan SCNN ke eksperimen neutrino lain di Fermilab yang dikenal sebagai MicroBooNE. Di sini, para ilmuwan melihat akibat dari tabrakan antara neutrino dan inti atom argon. Dengan memeriksa jejak yang dibuat oleh interaksi ini, peneliti dapat menyimpulkan detail tentang neutrino asli. Untuk melakukan itu, mereka membutuhkan algoritme yang dapat melihat piksel (atau, secara teknis, rekan tiga dimensi mereka disebut voxel) dalam representasi tiga dimensi dari detektor dan kemudian menentukan piksel mana yang terkait dengan lintasan partikel mana.

Karena datanya sangat jarang โ€” segelintir garis kecil di dalam detektor besar (sekitar 170 ton argon cair) โ€” SCNN hampir sempurna untuk tugas ini. Dengan CNN standar, gambar harus dipecah menjadi 50 bagian, karena semua perhitungan harus dilakukan, kata Terao. โ€œDengan CNN yang jarang, kami menganalisis seluruh gambar sekaligus โ€” dan melakukannya lebih cepat.โ€

Pemicu Tepat Waktu

Salah satu peneliti yang bekerja di MicroBooNE adalah mahasiswa magang bernama Felix Yu. Terkesan dengan kekuatan dan efisiensi SCNN, dia membawa peralatan itu bersamanya ke tempat kerja berikutnya sebagai mahasiswa pascasarjana di laboratorium penelitian Harvard yang secara resmi berafiliasi dengan IceCube Neutrino Observatory di Kutub Selatan.

Salah satu tujuan utama observatorium ini adalah mencegat neutrino paling energik di alam semesta dan melacaknya kembali ke sumbernya, yang sebagian besar terletak di luar galaksi kita. Detektor terdiri dari 5,160 sensor optik yang terkubur di es Antartika, hanya sebagian kecil yang menyala pada waktu tertentu. Array lainnya tetap gelap dan tidak terlalu informatif. Lebih buruk lagi, banyak dari "peristiwa" yang direkam oleh detektor adalah positif palsu dan tidak berguna untuk berburu neutrino. Hanya apa yang disebut peristiwa tingkat pemicu yang dapat dipotong untuk analisis lebih lanjut, dan keputusan instan perlu dibuat untuk menentukan mana yang layak untuk penunjukan itu dan mana yang akan diabaikan secara permanen.

CNN standar terlalu lambat untuk tugas ini, jadi ilmuwan IceCube telah lama mengandalkan algoritme yang disebut LineFit untuk memberi tahu mereka tentang deteksi yang berpotensi berguna. Tapi algoritme itu tidak dapat diandalkan, kata Yu, "yang berarti kita bisa melewatkan acara menarik." Sekali lagi, ini adalah lingkungan data yang jarang cocok untuk SCNN.

Yu โ€” bersama dengan Argรผelles-Delgado, penasihat doktoralnya, dan Jeff Lazar, seorang mahasiswa pascasarjana di University of Wisconsin, Madison โ€” menghitung keuntungan itu, dengan menunjukkan dalam makalah baru-baru ini bahwa jaringan ini akan menjadi sekitar 20 kali lebih cepat daripada CNN pada umumnya. โ€œItu cukup cepat untuk dijalankan pada setiap peristiwa yang keluar dari detektor,โ€ sekitar 3,000 setiap detik, kata Lazar. โ€œItu memungkinkan kami untuk membuat keputusan yang lebih baik tentang apa yang harus dibuang dan apa yang harus disimpan.โ€

Pengantar

Penulis juga telah berhasil menggunakan SCNN dalam simulasi menggunakan data resmi IceCube, dan langkah selanjutnya adalah menguji sistem mereka pada replika sistem komputasi Kutub Selatan. Jika semuanya berjalan dengan baik, Argรผelles-Delgado yakin mereka harus memasang sistem mereka di observatorium Antartika tahun depan. Tapi teknologinya bisa melihat penggunaan yang lebih luas. โ€œKami pikir [SCNN dapat menguntungkan] semua teleskop neutrino, bukan hanya IceCube,โ€ kata Argรผelles-Delgado.

Di luar Neutrino

Philip Harris, seorang fisikawan di Massachusetts Institute of Technology, berharap SCNN dapat membantu di penumbuk partikel terbesar dari semuanya: Large Hadron Collider (LHC) di CERN. Harris mendengar tentang jaringan saraf semacam ini dari rekan MIT, ilmuwan komputer Song Han. โ€œSong ahli dalam membuat algoritme dengan cepat dan efisien,โ€ kata Harris โ€” cocok untuk LHC, tempat 40 juta tabrakan terjadi setiap detik.

Ketika mereka berbicara beberapa tahun yang lalu, Song memberi tahu Harris tentang proyek kendaraan otonom yang dia kejar dengan anggota labnya. Tim Song menggunakan SCNN untuk menganalisis peta laser 3D ruang di depan kendaraan, yang sebagian besar kosong, untuk melihat apakah ada penghalang di depan.

Harris dan rekan-rekannya menghadapi tantangan serupa di LHC. Ketika dua proton bertabrakan di dalam mesin, tabrakan itu menciptakan bola yang mengembang yang terbuat dari partikel. Ketika salah satu partikel ini mengenai kolektor, terjadi hujan partikel sekunder. โ€œJika Anda dapat memetakan seluruh pancaran ini,โ€ kata Harris, โ€œAnda dapat menentukan energi partikel yang memunculkannya,โ€ yang mungkin menjadi objek perhatian khusus โ€“ sesuatu seperti boson Higgs, yang fisikawan ditemukan pada tahun 2012, atau partikel materi gelap, yang masih dicari oleh fisikawan.

"Masalah yang kami coba selesaikan adalah menghubungkan titik-titik," kata Harris, seperti halnya mobil self-driving dapat menghubungkan titik-titik peta laser untuk mendeteksi penghalang.

SCNN akan mempercepat analisis data di LHC setidaknya dengan faktor 50, kata Harris. โ€œTujuan akhir kami adalah memasukkan [SCNN] ke dalam detektorโ€ โ€” sebuah tugas yang akan memakan waktu setidaknya satu tahun dokumen dan dukungan tambahan dari komunitas. Tapi dia dan rekan-rekannya berharap.

Secara keseluruhan, semakin besar kemungkinan bahwa SCNN - sebuah ide yang awalnya muncul di dunia ilmu komputer - akan segera memainkan peran dalam eksperimen terbesar yang pernah dilakukan dalam fisika neutrino (DUNE), astronomi neutrino (IceCube), dan fisika energi tinggi (LHC) .

Graham mengatakan dia sangat terkejut mengetahui bahwa SCNN telah mencapai fisika partikel, meskipun dia tidak sepenuhnya terkejut. "Dalam pengertian abstrak," katanya, "sebuah partikel yang bergerak di ruang angkasa mirip dengan ujung pena yang bergerak di atas selembar kertas."

Stempel Waktu:

Lebih dari Majalah kuantitas