Seyrek Sinir Ağları Fizikçileri Yararlı Verilere Yönlendiriyor | Quanta Dergisi

Seyrek Sinir Ağları Fizikçileri Yararlı Verilere Yönlendiriyor | Quanta Dergisi

Seyrek Sinir Ağları Fizikçileri Yararlı Verilere Yönlendiriyor | Quanta Dergisi PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Giriş

Diyelim ki bin sayfalık bir kitabınız var, ancak her sayfada yalnızca tek satırlık bir metin var. Kitapta yer alan bilgileri bir tarayıcı kullanarak çıkarmanız gerekiyor, ancak bu özel tarayıcı sistematik olarak her sayfayı inceliyor ve her seferinde bir inç kareyi tarıyor. O tarayıcıyla tüm kitabı taramanız uzun zaman alır ve bu sürenin çoğu boş alanları taramakla boşa gider. 

Birçok deneysel fizikçinin hayatı böyledir. Parçacık deneylerinde, dedektörler, yalnızca çok küçük bir kısmı yararlı bilgiler içermesine rağmen, büyük miktarda veriyi yakalar ve analiz eder. "Gökyüzünde uçan bir kuşun fotoğrafında her piksel anlamlı olabilir" diye açıkladı. Kazuhiro TeraoSLAC Ulusal Hızlandırıcı Laboratuvarı'nda bir fizikçi. Ancak bir fizikçinin baktığı görüntülerde, genellikle yalnızca küçük bir kısmı gerçekten önemlidir. Bu gibi durumlarda, her ayrıntıyı incelemek gereksiz yere zaman ve hesaplama kaynaklarını tüketir.

Ama bu değişmeye başlıyor. Araştırmacılar, seyrek evrişimli sinir ağı (SCNN) olarak bilinen bir makine öğrenimi aracıyla verilerinin ilgili bölümlerine odaklanabilir ve geri kalanını eleyebilir. Araştırmacılar, gerçek zamanlı veri analizi yapma yeteneklerini büyük ölçüde hızlandırmak için bu ağları kullandılar. Ve en az üç kıtada gelecek veya mevcut deneylerde SCNN'leri kullanmayı planlıyorlar. Geçiş, fizik topluluğu için tarihi bir değişikliği işaret ediyor. 

"Fizikte, kendi algoritmalarımızı ve hesaplamalı yaklaşımlarımızı geliştirmeye alışkınız" dedi. Carlos Argüelles-Delgado, Harvard Üniversitesi'nde bir fizikçi. "Geliştirmede her zaman ön saflarda yer aldık, ancak şimdi, şeylerin hesaplama tarafında, bilgisayar bilimi genellikle başı çekiyor." 

Seyrek Karakterler

SCNN'lere yol açacak çalışmalar 2012 yılında başladı. Benjamin Graham, daha sonra Warwick Üniversitesi'nde Çince el yazısını tanıyabilecek bir sinir ağı yapmak istedi. 

O zamanlar bunun gibi görüntüyle ilgili görevler için önde gelen araçlar evrişimli sinir ağlarıydı (CNN'ler). Çince el yazısı görevi için, bir yazar dijital bir tablette bir karakterin izini sürerek, örneğin 10,000 piksellik bir görüntü üretecektir. CNN daha sonra çekirdek adı verilen 3'e 3'lük bir ızgarayı tüm görüntü boyunca hareket ettirir ve çekirdeği her pikselde ayrı ayrı ortalar. Çekirdeğin her yerleşimi için ağ, ayırt edici özellikleri arayan evrişim adı verilen karmaşık bir matematiksel hesaplama gerçekleştirirdi.

CNN'ler, fotoğraflar gibi bilgi yoğun görüntülerle kullanılmak üzere tasarlanmıştır. Ancak Çince karakter içeren bir resim çoğunlukla boştur; araştırmacılar bu özelliğe sahip verileri seyrek olarak adlandırır. Doğal dünyadaki her şeyin ortak bir özelliğidir. Graham, "Dünyanın ne kadar seyrek olabileceğine bir örnek vermek gerekirse," dedi, Eyfel Kulesi mümkün olan en küçük dikdörtgenin içine alınsaydı, bu dikdörtgen "%99.98 hava ve yalnızca %0.02 demir"den oluşurdu.

Giriş

Graham, CNN yaklaşımını değiştirmeye çalıştı, böylece çekirdek, görüntünün yalnızca sıfırdan farklı bir değere sahip (ve yalnızca boş olmayan) en az bir piksel içeren 3'e 3 bölümlerine yerleştirilecekti. Bu şekilde, el yazısı Çince'yi verimli bir şekilde tanımlayabilen bir sistem üretmeyi başardı. Yalnızca %2013'lik bir hata oranıyla karakterleri tek tek tanımlayarak 2.61 yılında bir yarışma kazandı. (İnsanlar ortalama %4.81 puan aldı.) Daha sonra dikkatini daha da büyük bir soruna çevirdi: üç boyutlu nesne tanıma.

Graham, 2017'de Facebook AI Research'e geçti ve tekniğini daha da geliştirdi ve yayınlanan the ayrıntılar çekirdeği yalnızca sıfır olmayan bir değere sahip piksellere merkezleyen ilk SCNN için (çekirdeği en az bir "sıfır olmayan" piksele sahip herhangi bir 3'e 3 bölüme yerleştirmek yerine). Terao'nun parçacık fiziği dünyasına getirdiği bu genel fikirdi.

Yeraltı Çekimleri

Terao, Fermi Ulusal Hızlandırıcı Laboratuvarında, bilinen en zor temel parçacıklar arasında yer alan nötrinoların doğasını araştıran deneylerle ilgileniyor. Onlar aynı zamanda evrende kütle olarak en çok bulunan parçacıklardır (fazla olmasa da), ancak bir detektörün içinde nadiren ortaya çıkarlar. Sonuç olarak, nötrino deneyleri için verilerin çoğu seyrek ve Terao sürekli olarak veri analizine yönelik daha iyi yaklaşımlar arıyordu. SCNN'lerde bir tane buldu.

2019'da SCNN'leri, 2026'da devreye girdiğinde dünyanın en büyük nötrino fiziği deneyi olacak olan Derin Yeraltı Nötrino Deneyi veya DUNE'dan beklenen verilerin simülasyonlarına uyguladı. Proje, Chicago'nun hemen dışındaki Fermilab'dan nötrinoları vuracak. 800 mil topraktan Güney Dakota'daki bir yeraltı laboratuvarına. Yol boyunca, parçacıklar bilinen üç tip nötrino arasında "salınacak" ve bu salınımlar ayrıntılı nötrino özelliklerini ortaya çıkarabilir.

SCNN'ler, simüle edilmiş verileri sıradan yöntemlerden daha hızlı analiz etti ve bunu yaparken önemli ölçüde daha az hesaplama gücü gerektirdi. Umut verici sonuçlar, SCNN'lerin gerçek deneysel çalışma sırasında kullanılacağı anlamına gelir.

Bu arada 2021'de Terao, Fermilab'da MicroBooNE olarak bilinen başka bir nötrino deneyine SCNN'lerin eklenmesine yardımcı oldu. Burada bilim adamları, nötrinolar ile argon atomlarının çekirdekleri arasındaki çarpışmaların sonrasına bakıyorlar. Araştırmacılar, bu etkileşimler tarafından oluşturulan izleri inceleyerek, orijinal nötrinolar hakkında ayrıntılar çıkarabilirler. Bunu yapmak için, dedektörün üç boyutlu temsilinde piksellere (veya teknik olarak voksel adı verilen üç boyutlu karşılıklarına) bakabilen ve ardından hangi piksellerin hangi parçacık yörüngeleriyle ilişkili olduğunu belirleyebilen bir algoritmaya ihtiyaçları var.

Veriler çok seyrek olduğu için - büyük bir detektör içindeki küçük çizgiler (yaklaşık 170 ton sıvı argon) - SCNN'ler bu görev için neredeyse mükemmel. Terao, standart bir CNN ile, yapılacak tüm hesaplamalar nedeniyle görüntünün 50 parçaya bölünmesi gerektiğini söyledi. "Seyrek bir CNN ile tüm görüntüyü tek seferde analiz ediyoruz ve bunu çok daha hızlı yapıyoruz."

Zamanında Tetikleyiciler

MicroBooNE üzerinde çalışan araştırmacılardan biri Felix Yu adında bir lisans öğrencisiydi. SCNN'lerin gücünden ve verimliliğinden etkilenerek, Güney Kutbu'ndaki IceCube Nötrino Gözlemevi'ne resmi olarak bağlı bir Harvard araştırma laboratuvarında yüksek lisans öğrencisi olarak bir sonraki iş yerine araçları yanında getirdi.

Gözlemevinin temel hedeflerinden biri, evrenin en enerjik nötrinolarını yakalamak ve onları, çoğu galaksimizin dışında bulunan kaynaklarına kadar izlemektir. Dedektör, Antarktika buzuna gömülü 5,160 optik sensörden oluşuyor ve bunların herhangi bir zamanda yalnızca küçük bir kısmı yanıyor. Dizinin geri kalanı karanlık kalır ve özellikle bilgilendirici değildir. Daha da kötüsü, dedektörlerin kaydettiği "olayların" çoğu yanlış pozitiftir ve nötrino avı için kullanışlı değildir. Yalnızca sözde tetik düzeyindeki olaylar, daha fazla analiz için kesinti yapar ve hangilerinin bu atamaya layık olduğuna ve hangilerinin kalıcı olarak göz ardı edileceğine dair anında karar verilmesi gerekir.

Standart CNN'ler bu görev için çok yavaştır. bu nedenle IceCube bilim adamları, onlara potansiyel olarak yararlı tespitler hakkında bilgi vermek için uzun süredir LineFit adlı bir algoritmaya güveniyorlar. Ancak bu algoritma güvenilmez, dedi Yu, "bu da ilginç olayları kaçırıyor olabileceğimiz anlamına geliyor." Yine, bir SCNN için ideal olarak uygun, seyrek bir veri ortamıdır.

Yu - doktora danışmanı Argüelles-Delgado ve Madison, Wisconsin Üniversitesi'nde yüksek lisans öğrencisi olan Jeff Lazar ile birlikte - bu avantajı şu şekilde ölçtü: yeni bir makale bu ağların tipik CNN'lerden yaklaşık 20 kat daha hızlı olacağını. Lazar, "Bu, dedektörden çıkan her olayda çalışacak kadar hızlı," dedi. "Bu, neyi atıp neyi tutacağımız konusunda daha iyi kararlar vermemizi sağlıyor."

Giriş

Yazarlar ayrıca resmi IceCube verilerini kullanarak bir simülasyonda bir SCNN'yi başarıyla kullandılar ve bir sonraki adım, sistemlerini Güney Kutbu bilgi işlem sisteminin bir kopyası üzerinde test etmektir. Her şey yolunda giderse, Argüelles-Delgado sistemlerini gelecek yıl Antarktika gözlemevinde kurmaları gerektiğine inanıyor. Ancak teknoloji daha da geniş kullanım alanı görebilir. Argüelles-Delgado, "[SCNN'lerin] yalnızca IceCube değil, tüm nötrino teleskoplarına fayda sağlayabileceğini düşünüyoruz" dedi.

Nötrinoların Ötesinde

Massachusetts Institute of Technology'de fizikçi olan Philip Harris, SCNN'lerin hepsinin en büyük parçacık çarpıştırıcısında yardımcı olabileceğini umuyor: CERN'deki Büyük Hadron Çarpıştırıcısı (LHC). Harris, bu tür sinir ağlarını bir MIT meslektaşı olan bilgisayar bilimcisi Song Han'dan duydu. Harris, "Song, algoritmaları hızlı ve verimli hale getirme konusunda uzmandır" dedi - saniyede 40 milyon çarpışmanın meydana geldiği LHC için mükemmel.

Birkaç yıl önce konuştuklarında Song, Harris'e laboratuvarının üyeleriyle yürüttüğü bir otonom araç projesinden bahsetti. Song'un ekibi, ileride herhangi bir engel olup olmadığını görmek için aracın önündeki, çoğu boş olan alanın 3B lazer haritalarını analiz etmek için SCNN'leri kullanıyordu.

Harris ve meslektaşları, LHC'de benzer zorluklarla karşılaşıyor. Makinenin içinde iki proton çarpıştığında, çarpışma parçacıklardan oluşan genişleyen bir küre oluşturur. Bu parçacıklardan biri toplayıcıya çarptığında ikincil bir parçacık yağmuru meydana gelir. Harris, "Bu yağmurun tam boyutunu çizebilirseniz," dedi, "onu oluşturan parçacığın enerjisini de belirleyebilirsiniz." 2012'de keşfedilen veya fizikçilerin hala aradığı bir karanlık madde parçacığı.

Harris, "Çözmeye çalıştığımız sorun, noktaları birleştirmekle ilgili," dedi, tıpkı sürücüsüz bir arabanın bir engeli tespit etmek için bir lazer haritasının noktalarını birleştirebilmesi gibi.

Harris, SCNN'lerin LHC'deki veri analizini en az 50 kat hızlandıracağını söyledi. "Nihai hedefimiz [SCNN'leri] dedektöre sokmak" - en az bir yıllık evrak işi ve topluluktan ek katılım gerektirecek bir görev. Ancak o ve meslektaşları umutlu.

Toplamda, başlangıçta bilgisayar bilimi dünyasında tasarlanan bir fikir olan SCNN'lerin yakında nötrino fiziği (DUNE), nötrino astronomisi (IceCube) ve yüksek enerji fiziği (LHC) alanlarında şimdiye kadar yapılmış en büyük deneylerde rol oynaması giderek daha olası hale geliyor. .

Graham, tamamen şok olmamasına rağmen, SCNN'lerin parçacık fiziğine doğru yol aldığını öğrendiğinde hoş bir şekilde şaşırdığını söyledi. "Soyut anlamda," dedi, "uzayda hareket eden bir parçacık, bir parça kağıt üzerinde hareket eden bir kalemin ucu gibidir."

Zaman Damgası:

Den fazla Quanta dergisi