Yeni yaklaşım, karmaşık sistemlerdeki değişikliklerle başa çıkmak için derin sinir ağlarını yeniden eğitiyor

Yeni yaklaşım, karmaşık sistemlerdeki değişikliklerle başa çıkmak için derin sinir ağlarını yeniden eğitiyor

Derin öğrenme sonuçları

ABD'deki iklim araştırmacıları tarafından farklı durumlarla başa çıkmak için derin öğrenme yapay zeka algoritmalarının yeniden eğitilmesine yönelik sistematik bir yaklaşım geliştirildi. Ekip, geleneksel inanışın aksine, algoritmanın daha önceki seviyelerinin yeniden eğitilmesinin, daha sonraki seviyelerin yeniden eğitilmesinden genellikle daha iyi sonuçlar elde ettiğini buldu.

Derin öğrenme, bilgisayar algoritmalarının bir sistemin önemli özelliklerini kendilerine öğrettiği ve genellikle insanların yeteneklerini aşan bir doğrulukla, doğası hakkında sınıflandırmalar yapmayı ve davranışına ilişkin tahminler yapmayı öğrendiği, son derece gelişmiş, bazen tartışmalı bir makine öğrenimi türüdür. Belki de derin öğrenmenin eylem halindeki en ünlü göstergesi, Google'ın AlphaGo programının 2017'de şampiyon go oyuncusu Lee Sedol'e karşı kazandığı zaferdi. Ancak derin öğrenmenin daha pratik uygulamaları var: protein katlanmasını tahmin edebilir, kanserin erken belirtileri için doku biyopsilerini tarayabilir ve hava durumu modellerini tahmin edin.

Ancak derin öğrenme algoritmaları harici bir operatör tarafından programlanmadığı için kolayca yeniden programlanamazlar. Bunun yerine, sistem değişirse algoritmanın yeni sistemden alınan veriler kullanılarak yeniden eğitilmesi gerekir. Günümüzün iklim koşullarını kullanarak eğitilen derin öğrenme algoritmalarının, iklim değişikliğinden etkilenen bir dünyadaki hava koşulları hakkında yararlı tahminler yapması isteniyorsa, bu durum klimatolojide önemlidir. İnsanların aşina olduğu bu önceki deneyimlerin alışılmadık durumlara uyarlanması süreci, bilgisayar bilimcileri tarafından transfer öğrenme olarak bilinir.

Derin gizem

İklim bilimci Pedram Hasanzadeh Teksas'taki Rice Üniversitesi'nden Dr., derin öğrenme algoritmalarının bilgiyi bir dizi katman halinde işlediğini açıklıyor. "Bilgi, bazı bilgileri çıkaran bir katmana giriyor ve ardından bu bilgiyi, daha fazla bilgi çıkaran başka bir katmana gönderiyor." Bu süreç sonuçta çıktıyı üretiyor ancak Hassanzadeh'in açıkladığı gibi, "Hiç kimse her katmanın işinin ne olduğunu tam olarak bilmiyor çünkü hiçbirini tasarlamıyoruz; hepsi öğrenildi." Transfer öğrenimi, bu seviyelerden birini (veya birkaçını) yeniden eğitmek için yeni veri setindeki az miktardaki mevcut veriyi kullanıyor ve Hassanzadeh, "hangi seviyeyi seçtiğinizin önemli" olduğunu söylüyor.

Geleneksel bilgeliğin, sorunun ayrıntılarının ağın en derin katmanlarında (çıktıya en yakın katmanlarda) çözülmesini gerektirdiğini söylüyor. Bu nedenle, transfer öğrenimini gerçekleştirmek için bunların yeniden eğitilmesi en iyisidir. Hassanzadeh şöyle açıklıyor: "Geçmişte yapılan şey, örneğin Google'ın Google Görseller üzerinde bin katmanlı bir ağı eğitmesi ve ardından birisinin az sayıda X-ışını getirmesi ve böylece 998 ve 999. katmanları yeniden eğitmesiydi." Artık o ve meslektaşları bunun yerine sistematik bir yaklaşım benimsediler.

Araştırmacılar, üç farklı koşul altında akışkanların davranışının yüksek çözünürlüklü simülasyonlarını gerçekleştirdiler. Bu verileri, bu spesifik parametrelerin her biri altında sıvıların davranışını tahmin etmek için 10 katmanlı üç derin öğrenme algoritmasını eğitmek için kullandılar. Her durumda Reynolds sayısı (eylemsizlik kuvvetlerinin viskoz kuvvetlere oranı) veya akışkanın girdabı gibi bazı parametreleri değiştirdiler ve yeni akışkanların davranışını tahmin etmek için başka bir dizi yüksek çözünürlüklü simülasyon gerçekleştirdiler. Üç vakanın her birinde, aynı algoritmaları yeni veriler üzerinde eğittiler. Son olarak, yeni verilerin küçük bir alt kümesi üzerinde eski algoritmaların transfer öğrenimini gerçekleştirdiler, her seviyenin yeniden eğitiminin etkisine baktılar ve yeniden eğitilen eski algoritmanın performansını yeni veriler üzerinde sıfırdan eğitilen algoritma ile karşılaştırdılar.

Sığ katmanların yeniden eğitilmesi

Sonuçlar şaşırtıcıydı. Hassanzadeh, "Bu makalede, en sığ katmanların yeniden eğitilecek en iyi katmanlar olduğunu bulduk" diyor. Her katmanın sırasıyla yeniden eğitilmesiyle üretilen tahmin edilen sinyale erişim, onlara her katmanın bu son sinyal üzerindeki etkisine dair bir pencere sağladı. Bu nedenle, her katmanın mevcut her frekansı nasıl değiştirdiğini görmek için her sinyalin spektral analizini kullandılar. Bazı düzeyler düşük frekansları kontrol ediyordu ve algoritmanın düzgün şekilde değişen, makroskobik özelliklerini yakaladıklarından bunları yeniden eğitmek faydalı oldu. Bu arada diğer seviyeler ayrıntıları tahmin ediyordu ve bunları tek başına yeniden eğitmek neredeyse işe yaramazdı. Araştırmacılar herhangi bir durumda en önemli seviyeleri belirlemek için bir protokol sağladılar. Hassanzadeh, "Bu makalede genel bir kuralımız olduğunu söylemek istemedik" diyor. "Artık örneğin orta katmanların yeniden eğitilmek için en iyi olduğu sistemler bulduk."

Ekip, çalışmayı 2014 yılında yayınlanan bir makalede anlatıyor. PNAS Bağlantısı.

Astrofizikçi ve makine öğrenimi uzmanı, "Bunun gerçekten ilginç bir makale olduğunu düşünüyorum" diyor Shirley Ho New York City'deki Flatiron Enstitüsü'nden. Şunları ekliyor: "Öte yandan, diğer birçok bilimsel disiplinde spektral analizi uzun süredir kullanıyoruz, dolayısıyla sanırım soru, bunun birden fazla katmana uygulanmasının önemli bir katkı olup olmadığıdır. Bunun muhtemelen insanların aklında olan ama kimsenin yazmadığı şeylerden biri olduğu hissine kapılıyorum. Bu, bir kere söyleyince herkesin anlayabileceği harika gazetelerden biri olabilir.”

Zaman Damgası:

Den fazla Fizik dünyası