Yeni yürümeye başlayan bir çocuğun gözleri ve kulakları aracılığıyla yeni öğrenilen bir yapay zeka

Yeni yürümeye başlayan bir çocuğun gözleri ve kulakları aracılığıyla yeni öğrenilen bir yapay zeka

Bir Yapay Zeka, Yeni yürümeye başlayan bir çocuğun Platon'un Gözü ve Kulaklarından Dili ÖğrendiBlockchain Veri Zekası. Dikey Arama. Ai.

Sam alnına ilk kez hafif bir kamera taktığında altı aylıktı.

Önümüzdeki bir buçuk yıl boyunca, kamera hayatından kesitler yakaladı. Ailenin evcil hayvanlarının arasında gezindi, ebeveynlerinin yemek pişirmesini izledi ve büyükannesiyle birlikte ön verandada ağladı. Bu arada kamera duyduğu her şeyi kaydetti.

Kulağa sevimli bir yürümeye başlayan çocuk ev videosu gibi gelen şey aslında cesur bir kavram: Yapay zeka dili bir çocuk gibi öğrenebilir mi? Sonuçlar aynı zamanda çocukların erken yaşlarda dil ve kavramları nasıl hızlı bir şekilde edindiklerini de ortaya çıkarabilir.

Yeni bir çalışma in Bilim araştırmacıların Sam'in kayıtlarını bir yapay zekayı dili anlayacak şekilde eğitmek için nasıl kullandıklarını anlatıyor. Yapay zeka, bir çocuğun bir yıldaki yaşam deneyiminin yalnızca küçük bir kısmıyla temel kavramları (örneğin top, kelebek veya kova) kavrayabildi.

Karşılaştırmalı Öğrenme için Çocuğun Görüşü (CVCL) olarak adlandırılan yapay zeka, görme ve sesi eşleştirerek küçük çocuklar olarak öğrenme şeklimizi kabaca taklit ediyor. Bu, aşağıdakiler gibi büyük dil modellerinin benimsediğinden çok farklı bir yaklaşımdır. ChatGPT veya Bard'ın arkasında. Bu modellerin makaleler, şiirler ve hatta podcast senaryoları oluşturma konusundaki esrarengiz yeteneği dünyayı heyecanlandırdı. Ancak bu becerileri geliştirmek için çok çeşitli haber makalelerinden, senaryolardan ve kitaplardan trilyonlarca kelimeyi sindirmeleri gerekiyor.

Çocuklar ise aksine, çok daha az girdiyle öğrenirler ve büyüdükçe öğrendiklerini hızla genelleştirirler. Bilim insanları uzun zamandır yapay zekanın bu yetenekleri yalnızca günlük deneyimlerle yakalayıp yakalayamayacağını merak ediyordu.

NYU Veri Bilimi Merkezi'nden çalışma yazarı Dr. Wai Keen Vong, "İlk kez, tek bir çocuktan gelen gelişimsel olarak gerçekçi girdiyle eğitilmiş bir sinir ağının, kelimeleri görsel karşılıklarıyla ilişkilendirmeyi öğrenebileceğini gösterdik" dedi. Bir basın açıklamasında araştırma hakkında.

Çocuk oyuncağı

Çocuklar sözcükleri ve anlamlarını günlük deneyimlerden kolaylıkla özümserler.

Henüz altı aylıkken, gördükleri şeylerle sözcükler arasında bağlantı kurmaya başlarlar; örneğin, yuvarlak, zıplayan bir şey bir "toptur". İki yaşına geldiklerinde yaklaşık 300 kelimeyi ve kavramlarını biliyorlar.

Bilim adamları bunun nasıl olacağını uzun zamandır tartışıyorlar. Bir teoriye göre çocuklar gördüklerini duyduklarıyla eşleştirmeyi öğrenirler. Bir diğeri, dil öğrenmenin sosyal etkileşim ve akıl yürütme yeteneği gibi daha geniş bir dünya deneyimi gerektirdiğini öne sürüyor.

Yeni yürümeye başlayan çocuklarda geleneksel bilişsel testlerle bu fikirleri birbirinden ayırmak zordur. Ancak bir yapay zekayı bir çocuğun gözleri ve kulakları aracılığıyla eğiterek bir cevap alabiliriz.

M3GAN mı?

Yeni çalışmada zengin bir video kaynağından yararlanıldı: SAYCamAlınlarına bağlanan GoPro benzeri kameralar kullanılarak 6 ila 32 ay arasındaki üç çocuktan toplanan veriler yer alıyor.

Haftada iki kez, kameralar onlar emzirirken, emeklerken ve oynarken yaklaşık bir saatlik görüntü ve ses kaydı yapıyordu. Tüm işitilebilir diyaloglar, konuşmacı veya konuşma değişmeden önce söylenen kelimeler veya cümleler olan "sözlere" dönüştürüldü. Sonuç, bebekler ve küçük çocukların bakış açısından zengin bir multimedya verisidir.

Yeni sistem için ekip, bunları koordine edecek bir "yargıç" içeren iki sinir ağı tasarladı. Biri birinci şahıs görsellerini bir sahnenin kim ve nelerine dönüştürdü; bu bir anne mi yemek pişiriyor? Diğeri ise ses kayıtlarından kelime ve anlamlarını deşifre etti.

Daha sonra iki sistem zamanla ilişkilendirildi, böylece yapay zeka doğru görselleri kelimelerle ilişkilendirmeyi öğrendi. Örneğin yapay zeka, bir bebek görüntüsünü "Bak, bir bebek var" sözleriyle veya bir yoga topu görüntüsünü "Vay be, bu büyük bir top" ile eşleştirmeyi öğrendi. Eğitimle yavaş yavaş yoga topu kavramını bebekten ayırmayı öğrendi.

Vong, "Bu, modele hangi kelimelerin hangi nesnelerle ilişkilendirilmesi gerektiği konusunda bir ipucu sağlıyor" dedi.

Ekip daha sonra yapay zekayı Sam'in hayatının yaklaşık bir buçuk yılına ait videolar üzerinde eğitti. Toplamda, 600,000 yazıya geçirilmiş ifadeyle eşleştirilmiş 37,500'den fazla video karesi oluştu. Rakamlar büyük gibi görünse de, büyük dil modellerini eğitmek için kullanılan veri miktarıyla karşılaştırıldığında bunlar, Sam'in günlük uyanık yaşamının kabaca yüzde biri kadardır ve çok küçüktür.

Bebek Yapay Zekası Yükselişte

Sistemi test etmek için ekip, çocukların dil becerilerini ölçmek için kullanılan ortak bir bilişsel testi uyarladı. Yapay zekaya dört yeni görüntü (bir kedi, bir beşik, bir top ve bir çim) gösterdiler ve hangisinin top olduğunu sordular.

Genel olarak yapay zeka, yaklaşık yüzde 62 oranında doğru görüntüyü seçti. Performans, web'deki 400 milyon görüntü ve metin çifti üzerinde eğitilmiş son teknoloji ürünü bir algoritmayla neredeyse eşleşti; bu, çalışmada yapay zekayı eğitmek için kullanılandan çok daha fazla veriye sahip. Video görüntüleri ile ses arasında bağlantı kurmanın çok önemli olduğunu buldular. Ekip video karelerini ve bunlarla ilgili ifadeleri karıştırdığında model tamamen bozuldu.

Yapay zeka ayrıca kalıpların dışında "düşünebilir" ve yeni durumlara genelleme yapabilir.

Başka bir testte, Sam'in ebeveyninin "Bu bir ördek ve bir kelebek" dediği resimli kitaba bakış açısı üzerine eğitildi. Daha sonra “Kelebeği yapabilir misin?” diye sorulduğunda oyuncak bir kelebeği havaya kaldırdı. Yapay zekanın daha önce hiç görmediği çok renkli kelebek resimleriyle karşılaşıldığında, "kelebek" için dört örnekten üçünü yüzde 80'in üzerinde doğrulukla tespit etti.

Kelime kavramlarının tümü aynı puana sahip değildir. Mesela “kaşık” bir mücadeleydi. Ama şunu belirtmekte fayda var, tıpkı zorlu bir süreç gibi. reCAPTCHAeğitim görüntülerini bir insan için bile çözmek zordu.

Growing Pains

The Yapay zeka, çok modlu makine öğrenimindeki son gelişmelere dayanıyorBir makine beynini eğitmek için metin, resim, ses veya videoyu birleştiren.

Algoritma, yalnızca tek bir çocuğun deneyiminden elde edilen girdilerle, kelimelerin birbirleriyle nasıl ilişki kurduğunu yakalamayı ve kelimelerle görseller ve kavramlar arasında bağlantı kurmayı başardı. Yeni yürümeye başlayan çocukların kelimeleri duymasının ve bunları gördükleriyle eşleştirmesinin kelime dağarcığını geliştirmeye yardımcı olduğunu öne sürüyor.

Bu, sosyal ipuçları ve akıl yürütme gibi diğer beyin süreçlerinin devreye girmediği anlamına gelmiyor. Yazarlar, bu bileşenlerin algoritmaya eklenmesinin algoritmayı potansiyel olarak geliştirebileceğini yazdı.

Ekip deneye devam etmeyi planlıyor. Şimdilik "bebek" yapay zeka yalnızca sabit görüntü çerçevelerinden öğreniyor ve çoğunlukla isimlerden oluşan bir kelime dağarcığına sahip. Video bölümlerinin eğitime entegre edilmesi, videonun hareketi içermesi nedeniyle yapay zekanın fiilleri öğrenmesine yardımcı olabilir.

Konuşma verilerine tonlama eklemek de yardımcı olabilir. Çocuklar, bir annenin "hmm" sesinin ses tonuna bağlı olarak çok farklı anlamlara gelebileceğini erken yaşta öğrenirler.

Ancak genel olarak yapay zeka ile yaşam deneyimlerini birleştirmek, hem makine hem de insan beynini incelemek için güçlü ve yeni bir yöntemdir. Çocuklar gibi öğrenen yeni yapay zeka modelleri geliştirmemize ve beynimizin dil ve kavramları nasıl öğrendiğine dair anlayışımızı yeniden şekillendirmemize yardımcı olabilir.

İmaj Kredisi: Wai Keen Vong

Zaman Damgası:

Den fazla Tekillik Merkezi