Yeni 'Fizikten Esinlenen' Üretken Yapay Zeka Beklentileri Aşıyor | Quanta Dergisi

Yeni 'Fizikten Esinlenen' Üretken Yapay Zeka Beklentileri Aşıyor | Quanta Dergisi

Yeni 'Fizikten Esinlenen' Üretken Yapay Zeka Beklentileri Aşıyor | Quanta Dergisi PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Giriş

Yapay zeka araçları, özellikle de sinir ağları, fizikçilerin işine yaradı. Bu teknoloji yıllardır araştırmacıların hızlandırıcı deneylerinde parçacık yörüngelerini yeniden yapılandırmasına, yeni parçacıkların kanıtlarını aramasına ve yerçekimsel dalgaları ve dış gezegenleri tespit etmesine yardımcı oldu. Yapay zeka araçlarının fizikçiler için çok şey yapabileceği açık olsa da Massachusetts Teknoloji Enstitüsü'nden fizikçi Max Tegmark'a göre şu andaki soru şu: "Herhangi bir şeyi geri verebilir miyiz?"

Tegmark, fizikçi meslektaşlarının yapay zeka bilimine önemli katkılar sağlayabileceğine inanıyor ve bunu en büyük araştırma önceliği haline getirdi. Fizikçilerin yapay zeka teknolojisinin ilerlemesine yardımcı olabilmelerinin bir yolunun, çalışmaları büyük ölçüde anlaşılmaz olan sinir ağlarının "kara kutu" algoritmalarını, fiziksel süreçlerin iyi anlaşılmış denklemleriyle değiştirmek olacağını söyledi.

Fikir yepyeni değil. Üretken yapay zeka modelleri difüzyona dayalı Örneğin bir fincan kahveye dökülen sütün eşit şekilde yayılmasını sağlayan süreç ilk olarak 2015 yılında ortaya çıktı ve o zamandan bu yana oluşturdukları görüntülerin kalitesi önemli ölçüde arttı. Bu teknoloji DALL·E 2 ve Midjourney gibi popüler görüntü üreten yazılımlara güç veriyor. Şimdi Tegmark ve meslektaşları fizikten ilham alan diğer üretken modellerin difüzyon temelli modeller kadar, hatta daha iyi çalışıp çalışmayacağını öğreniyorlar.

Geçen yılın sonlarında, Tegmark'ın ekibi görüntü üretmeye yönelik gelecek vaat eden yeni bir yöntemi tanıttı. Poisson akış üretken modeli (PFGM). Burada veriler, özellikleri herhangi bir andaki yüklerin dağılımına bağlı olan bir elektrik alanı oluşturmak üzere bir araya gelen yüklü parçacıklar tarafından temsil edilir. Buna Poisson akış modeli denir çünkü yüklerin hareketi, iki yük arasındaki elektrostatik kuvvetin aralarındaki mesafenin karesiyle ters orantılı olarak değiştiğini belirten prensipten türetilen Poisson denklemi tarafından yönetilir (Newton yerçekimi formülüne benzer). .

Bu fiziksel süreç PFGM'nin kalbinde yer alır. "Modelimiz neredeyse tamamen uzayın her noktasındaki elektrik alanının gücü ve yönü ile karakterize edilebilir" dedi. Yılun XuMIT'de yüksek lisans öğrencisi ve makalenin ortak yazarı. "Sinir ağının eğitim sürecinde öğrendiği şey, o elektrik alanının nasıl tahmin edileceğidir." Ve bunu yaparken görüntüler oluşturmayı öğrenebilir çünkü bu modeldeki bir görüntü, bir elektrik alanı tarafından kısa ve öz bir şekilde tanımlanabilmektedir.

Giriş

PFGM, ​​difüzyon temelli yaklaşımlarla üretilenlerle aynı kalitede görüntüler oluşturabilir ve bunu 10 ila 20 kat daha hızlı yapabilir. "Daha önce hiç görmediğimiz bir şekilde fiziksel bir yapı olan elektrik alanını kullanıyor" dedi. Hananel HazanTufts Üniversitesi'nde bilgisayar bilimcisi. "Bu, sinir ağlarımızı geliştirmek için diğer fiziksel olayların kullanılması ihtimalinin kapısını açıyor."

Difüzyon ve Poisson akış modellerinin fizikten alınan denklemlere dayanmasının yanı sıra pek çok ortak noktası vardır. Eğitim sırasında, görüntü oluşturmak için tasarlanan bir yayılma modeli tipik olarak bir resimle (örneğin bir köpek) başlar ve ardından görsel gürültü ekleyerek her pikseli, özellikleri tamamen gizlenene kadar (tamamen ortadan kaldırılmasa da) rastgele bir şekilde değiştirir. Model daha sonra süreci tersine çevirmeye ve orijinaline yakın bir köpek üretmeye çalışıyor. Model, eğitildikten sonra görünüşte boş bir tuvalden başlayarak başarılı bir şekilde köpekleri ve diğer görüntüleri oluşturabiliyor.

Poisson akış modelleri hemen hemen aynı şekilde çalışır. Eğitim sırasında, bir zamanlar keskin olan görüntüye kademeli olarak gürültü eklemeyi içeren ileri bir süreç vardır ve ilk sürüm çoğunlukla kurtarılana kadar modelin bu gürültüyü adım adım gidermeye çalıştığı ters bir süreç vardır. Difüzyon tabanlı üretimde olduğu gibi, sistem en sonunda eğitimde hiç görmediği görüntüleri oluşturmayı öğrenir.

Ancak Poisson modellerinin altında yatan fizik tamamen farklıdır. Difüzyon termodinamik kuvvetler tarafından yönlendirilirken, Poisson akışı elektrostatik kuvvetler tarafından yönlendirilir. İkincisi, çok karmaşık bir elektrik alanı yaratabilen yüklerin bir düzenlemesini kullanan ayrıntılı bir görüntüyü temsil eder. Ancak bu alan, tıpkı sütün bir fincan kahvede doğal olarak dağılması gibi, yüklerin zaman içinde daha eşit bir şekilde yayılmasına neden olur. Sonuç olarak alanın kendisi daha basit ve daha tekdüze hale gelir. Ancak bu gürültüyle dolu tekdüze alan tamamen boş bir sayfa değildir; hâlâ görüntülerin kolayca bir araya getirilebileceği bilgi tohumlarını içeriyor.

2023'ün başlarında ekip Poisson modelini yükseltti. uzatmak tüm model ailesini kapsayacak şekilde tasarlanmıştır. Genişletilmiş sürüm olan PFGM++, yeni bir parametre içerir, DBu, araştırmacıların sistemin boyutsallığını ayarlamasına olanak tanır. Bu büyük bir fark yaratabilir: Bilinen üç boyutlu uzayda, bir yükün ürettiği elektrik alanının gücü, o yüke olan uzaklığın karesiyle ters orantılıdır. Ancak dört boyutta alan kuvveti ters küp yasasını takip eder. Ve uzayın her boyutu ve her değeri için Dbu ilişki biraz farklıdır.

Giriş

Bu tek yenilik, Poisson akış modellerine çok daha fazla değişkenlik kazandırdı; uç durumlarda farklı faydalar sunuldu. Ne zaman D düşükse, örneğin model daha sağlamdır, yani elektrik alanı tahmininde yapılan hatalara karşı daha toleranslıdır. "Model elektrik alanını mükemmel bir şekilde tahmin edemiyor" dedi Ziming LiuMIT'de başka bir yüksek lisans öğrencisi ve her iki makalenin ortak yazarı. “Her zaman bir miktar sapma vardır. Ancak sağlamlık, tahmin hatanız yüksek olsa bile yine de iyi görüntüler oluşturabileceğiniz anlamına gelir." Yani hayallerinizdeki köpeğe sahip olamayabilirsiniz ama yine de köpeğe benzeyen bir şeye sahip olacaksınız.

Diğer uçta ise D yüksek olduğunda sinir ağının eğitilmesi daha kolay hale gelir ve sanatsal becerilerde uzmanlaşmak için daha az veriye ihtiyaç duyulur. Kesin nedeni açıklamak kolay değil, ancak daha fazla boyut olduğunda, modelin takip etmesi gereken daha az elektrik alanına ve dolayısıyla özümlenecek daha az veriye sahip olması gerçeğine borçludur.

Geliştirilmiş model PFGM++, "size bu iki uç nokta arasında enterpolasyon yapma esnekliği sağlıyor" dedi Gül Yu, San Diego'daki Kaliforniya Üniversitesi'nde bilgisayar bilimcisi.

Ve bu aralığın içinde bir yerde ideal bir değer yatıyor D Xu, bunun sağlamlık ile eğitim kolaylığı arasında doğru dengeyi sağladığını söyledi. "Gelecekteki çalışmaların hedeflerinden biri, mümkün olan en iyi noktayı seçebilmemiz için o tatlı noktayı bulmanın sistematik bir yolunu bulmak olacak. D Belirli bir durum için deneme yanılma yöntemine başvurmadan.”

MIT araştırmacılarının bir başka hedefi de, yeni üretken model ailelerine temel oluşturabilecek daha fazla fiziksel süreç bulmayı içeriyor. adlı bir proje aracılığıyla GenPhysEkip zaten umut verici bir aday belirledi: zayıf nükleer kuvvetle ilgili olan Yukawa potansiyeli. Liu, "Bu, parçacık sayısının her zaman korunduğu Poisson akış ve difüzyon modellerinden farklı" dedi. "Yukawa potansiyeli parçacıkları yok etmenize veya bir parçacığı ikiye bölmenize olanak tanır. Böyle bir model, örneğin hücre sayısının aynı kalmasının gerekmediği biyolojik sistemleri simüle edebilir."

Yu, bunun verimli bir araştırma hattı olabileceğini söyledi. "Görüntü oluşturmanın ötesine uzanan potansiyel uygulamalara sahip yeni algoritmalara ve yeni üretken modellere yol açabilir."

Ve PFGM++ tek başına mucitlerinin orijinal beklentilerini çoktan aştı. İlk başta bunu anlamadılar D sonsuza ayarlandığında, güçlendirilmiş Poisson akış modeli bir yayılma modelinden ayırt edilemez hale gelir. Liu bunu bu yılın başlarında yaptığı hesaplamalarda keşfetti.

Mert PilancıStanford Üniversitesi'nden bilgisayar bilimci, bu "birleşmeyi" MIT grubunun çalışmalarından kaynaklanan en önemli sonuç olarak görüyor. "PFGM++ makalesi" dedi, "bu modellerin her ikisinin de daha geniş bir sınıfın parçası olduğunu ortaya koyuyor ve bu da merak uyandırıcı bir soruyu gündeme getiriyor: Üretken yapay zeka için keşfedilmeyi bekleyen, daha da büyük bir birleşmeye işaret eden başka fiziksel modeller olabilir mi? ”

Zaman Damgası:

Den fazla Quanta dergisi