Google, robotlara insanlara hizmet etmeyi öğretiyor; büyük dil modelleriyle PlatoBlockchain Veri Zekasının anahtarı. Dikey Arama. Ai.

Google, robotlara insanlara hizmet etmeyi öğretiyor - büyük dil modelleriyle anahtar

Video Google'ın en büyük AI dil modeli, web devinin en son araştırmasına göre robotların insan komutlarını anlama ve yorumlamada daha esnek olmasına yardımcı oluyor.

Makineler genellikle çok özel taleplere en iyi şekilde yanıt verir – açık uçlu talepler bazen onları boşa çıkarabilir ve kullanıcıların aklında olmayan sonuçlara yol açabilir. İnsanlar, istenen yanıtı almak için belirli bir şekilde soru sormak gibi, robotlarla katı bir şekilde etkileşim kurmayı öğrenirler.

Ancak Google'ın PaLM-SayCan adlı en yeni sistemi daha akıllı olmayı vaat ediyor. Everyday Robots'un fiziksel cihazı - Google X'ten çıkmış bir başlangıç ​​- başında gözler için kameralar ve bir dizi tekerleğin üzerine oturan uzun düz gövdesinin arkasına sıkıştırılmış bir kıskaçlı bir kol var.  

Aşağıdaki videoda robotu çalışırken izleyebilirsiniz:

Youtube Video

Robota "Daha yeni çalıştım, bana sağlıklı bir atıştırmalık alır mısın?" gibi bir şey sormak. onu bir elma almaya itecek. Google'ın Brain ekibinden bilim adamları, "PaLM-SayCan, bir robotun fiziksel temelli görevleri yerine getirmek için üst düzey metinsel talimatları izlemesini sağlayan, dil modellerinden edinilen bilgiden yararlanmaya yönelik yorumlanabilir ve genel bir yaklaşımdır" açıkladı.

Google en büyük dil modelini tanıttı Avuç içi bu yıl nisan ayında. PaLM, internetten alınan veriler üzerinde eğitildi, ancak açık uçlu metin yanıtları vermek yerine sistem, robotun izlemesi için bir talimat listesi oluşturacak şekilde uyarlandı.

"Kolamı masaya döktüm, nasıl atıp bana temizlemeye yardımcı olacak bir şey getirirsin?" diyerek PaLM'i soruyu anlamaya ve robotun görevi tamamlamak için izleyebileceği adımların bir listesini oluşturmaya yönlendirir, örneğin üzerinden geçmek gibi. kutuyu almak, bir çöp kutusuna atmak ve bir sünger almak.

Ancak PaLM gibi büyük dil modelleri (LLM'ler) söyledikleri hiçbir şeyin anlamını anlamıyor. Bu nedenle araştırmacılar, soyut dili görsel temsillere ve eylemlere dönüştürmek için pekiştirmeli öğrenmeyi kullanarak ayrı bir model eğittiler. Bu şekilde robot, "Kola" kelimesini gazlı içecek kutusunun görüntüsü ile ilişkilendirmeyi öğrenir.

PaLM-SayCan ayrıca, kendi ortamında verilen nesnelere verilen belirli bir eylemi tamamlama olasılığını sıralayan bir yöntem olan “karşılık fonksiyonları”nı da öğrenir. Örneğin, bir sünger algılar ancak yakınında vakum yoksa, robotun bir elektrikli süpürgeye göre bir sünger alma olasılığı daha yüksektir. 

Ekip, "Yöntemimiz SayCan, fiziksel temelli görevlerde LLM'lerdeki bilgiyi çıkarır ve kullanır" dedi. Araştırma kağıdı. LLM (Say), üst düzey bir hedef için yararlı eylemleri belirlemek için bir görev temellendirmesi sağlar ve öğrenilen karşılanabilirlik işlevleri (Can), plan üzerinde neyin gerçekleştirilebileceğini belirlemek için bir dünya temeli sağlar. Takviyeli öğrenmeyi (RL), dünyada mümkün olanın olanaklarını sağlayan dil koşullu değer işlevlerini öğrenmenin bir yolu olarak kullanıyoruz.

Robotun görevden sapmasını önlemek için, yalnızca 101 farklı talimattan eylemleri seçmek üzere eğitilmiştir. Google onu bir mutfağa uyum sağlamak için eğitti – PaLM-SayCan atıştırmalıklar, içecekler alabilir ve basit temizlik görevlerini yerine getirebilir. Araştırmacılar, LLM'lerin, robotların soyut talimatlarla daha karmaşık görevleri güvenli bir şekilde gerçekleştirmesini sağlamanın ilk adımı olduğuna inanıyor.

"Bir dizi gerçek dünyadaki robotik görev üzerindeki deneylerimiz, uzun ufuklu, soyut, doğal dil talimatlarını yüksek bir başarı oranında planlama ve tamamlama yeteneğini gösteriyor. PaLM-SayCan'ın yorumlanabilirliğinin robotlarla güvenli gerçek dünya kullanıcı etkileşimine izin verdiğine inanıyoruz” diyerek sözlerini tamamladılar. ®

Zaman Damgası:

Den fazla Kayıt