Bu DeepMind Yapay Zekası, Sadece İnsanları İzleyerek Hızla Yeni Beceriler Öğreniyor

Bu DeepMind Yapay Zekası, Sadece İnsanları İzleyerek Hızla Yeni Beceriler Öğreniyor

Bu DeepMind AI, Sadece İnsanların PlatoBlockchain Veri Zekasını İzleyerek Yeni Becerileri Hızla Öğreniyor. Dikey Arama. Ai.

İnsanları taklit edecek algoritmaları öğretmek genellikle yüzlerce veya binlerce örnek gerektirir. Ancak Google DeepMind'ın yeni yapay zekası, insan göstericilerden anında yeni beceriler edinebilir.

İnsanlığın en büyük hilelerinden biri birbirimizden hızlı ve verimli bir şekilde bilgi edinme yeteneğimizdir. Genellikle kültürel aktarım olarak adlandırılan bu tür sosyal öğrenme, bir meslektaşımıza yeni bir aracın nasıl kullanılacağını göstermemize veya çocuklarımıza tekerlemeler öğretmemize olanak tanır.

Araştırmacıların süreci makinelerde kopyalamaya çalışması şaşırtıcı değil. Yapay zekanın bir insanı bir görevi tamamlarken izlediği ve daha sonra onun davranışlarını taklit etmeye çalıştığı taklit öğrenme, robotların eğitimi için uzun zamandır popüler bir yaklaşım olmuştur. Ancak günümüzün en gelişmiş derin öğrenme algoritmalarının bile eğiticilerini başarılı bir şekilde kopyalayabilmeleri için genellikle birçok örneği görmesi gerekir.

İnsanlar taklit yoluyla öğrendiğinde, genellikle bir avuç gösteriden sonra yeni görevleri üstlenebilirler. Artık Google DeepMind araştırmacıları, insanlardan sanal bir dünyada gezinmeyi gerçek zamanlı olarak öğrenen aracılarla yapay zekada hızlı sosyal öğrenmeye doğru bir adım attı.

Araştırmacılar, "Ajanlarımız, önceden toplanmış herhangi bir insan verisini kullanmadan, yeni bağlamlarda bir insanı gerçek zamanlı taklit etmeyi başarıyor" diye yazıyorlar. kağıt Doğa İletişim. "Kültürel aktarımı oluşturmaya yetecek kadar şaşırtıcı derecede basit bir dizi bileşen belirledik."

Araştırmacılar, ajanlarını GoalCycle3D adı verilen özel olarak tasarlanmış bir simülatörde eğitti. Simülatör, simülasyonun nasıl çalışması gerektiğine ve hangi yönlerinin değişmesi gerektiğine ilişkin kurallara dayalı olarak neredeyse sonsuz sayıda farklı ortam oluşturmak için bir algoritma kullanır.

Her ortamda küçük damla benzeri AI ajanlar Bir dizi renkli küreden belirli bir sırayla geçmek için engebeli arazide ve çeşitli engellerde gezinmek gerekir. Arazinin engebeli olması, engellerin yoğunluğu ve kürelerin konfigürasyonu ortamlar arasında farklılık gösterir.

Temsilciler, aşağıdakileri kullanarak gezinmek üzere eğitilmiştir: takviye öğrenme. Kürelerden doğru sırayla geçmeleri karşılığında bir ödül kazanırlar ve bu sinyali birçok denemede performanslarını artırmak için kullanırlar. Ancak buna ek olarak ortamlarda, kurs boyunca doğru rotayı zaten bilen, sabit kodlanmış veya bir insan tarafından kontrol edilen uzman bir temsilci de bulunur.

Yapay zeka temsilcileri, birçok eğitim çalışmasıyla yalnızca ortamların nasıl çalıştığının temellerini öğrenmekle kalmıyor, aynı zamanda her sorunu çözmenin en hızlı yolunun uzmanı taklit etmek olduğunu da öğreniyor. Ekip, temsilcilerin dersleri ezberlemek yerine taklit etmeyi öğrendiklerinden emin olmak için onları bir ortamda eğitti ve ardından başka bir ortamda test etti. En önemlisi, eğitimden sonra ekip, temsilcilerinin bir uzmanı taklit edebildiğini ve uzman olmadan da rotayı takip etmeye devam edebildiğini gösterdi.

Bu, standart takviyeli öğrenme yaklaşımlarında birkaç değişiklik yapılmasını gerektirdi.

Araştırmacılar, algoritmanın diğer ajanın yerini tahmin etmesini sağlayarak uzmana odaklanmasını sağladı. Ayrıca ona bir hafıza modülü de verdiler. Eğitim sırasında uzman, ortamlara girip çıkıyor ve aracıyı, kendisi artık mevcut olmadığında yapacağı eylemleri ezberlemeye zorluyordu. Yapay zeka ayrıca çok çeşitli ortamlar üzerinde eğitim aldı ve bu da çok çeşitli olası görevleri görmesini sağladı.

Ancak yaklaşımı daha pratik alanlara dönüştürmek zor olabilir. Önemli bir sınırlama, araştırmacılar yapay zekanın insan gösterilerinden öğrenip öğrenemeyeceğini test ederken, uzman temsilcinin tüm eğitim çalışmaları sırasında bir kişi tarafından kontrol edilmesiydi. Bu, temsilcilerin çeşitli insanlardan bir şeyler öğrenip öğrenemeyeceğini bilmeyi zorlaştırıyor.

Daha da önemlisi, eğitim ortamını rastgele değiştirme yeteneğinin gerçek dünyada yeniden yaratılması zor olacaktır. Temel görev basitti; ince motor kontrolü gerektirmiyordu ve yüksek düzeyde kontrol edilen sanal ortamlarda gerçekleşiyordu.

Yine de yapay zekada sosyal öğrenmenin ilerlemesi memnuniyetle karşılanıyor. Akıllı makinelerin olduğu bir dünyada yaşayacaksak, deneyimimizi ve uzmanlığımızı onlarla paylaşmanın etkili ve sezgisel yollarını bulmak çok önemli olacaktır.

Resim Kredi: Juliana ve Mariana Amorim / Unsplash

Zaman Damgası:

Den fazla Tekillik Merkezi