Google mengajarkan robot untuk melayani manusia – dengan model bahasa yang besar, kuncinya adalah PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Google mengajarkan robot untuk melayani manusia – dengan model bahasa yang besar kuncinya

Video Model bahasa AI terbesar Google membantu robot menjadi lebih fleksibel dalam memahami dan menafsirkan perintah manusia, menurut penelitian terbaru raksasa web itu.

Mesin biasanya merespons permintaan yang sangat spesifik dengan paling baik – permintaan terbuka terkadang dapat mengabaikannya dan menghasilkan hasil yang tidak terpikirkan oleh pengguna. Orang belajar berinteraksi dengan robot dengan cara yang kaku, seperti mengajukan pertanyaan dengan cara tertentu untuk mendapatkan respons yang diinginkan.

Sistem terbaru Google, dijuluki PaLM-SayCan, bagaimanapun, menjanjikan untuk menjadi lebih pintar. Perangkat fisik dari Everyday Robots – sebuah startup yang berasal dari Google X – memiliki kamera untuk mata di kepalanya dan lengan dengan penjepit yang terselip di belakang bodi lurusnya yang panjang, yang berada di atas satu set roda.  

Anda dapat menonton robot beraksi dalam video di bawah ini:

Youtube Video

Menanyakan pada robot, sesuatu seperti "Saya baru saja berolahraga, bisakah Anda memberi saya camilan sehat?" akan mendorongnya untuk mengambil sebuah apel. “PaLM-SayCan [adalah] pendekatan yang dapat ditafsirkan dan umum untuk memanfaatkan pengetahuan dari model bahasa yang memungkinkan robot mengikuti instruksi tekstual tingkat tinggi untuk melakukan tugas-tugas berbasis fisik,” peneliti peneliti dari tim Otak Google menjelaskan.

Google memperkenalkan model bahasa terbesarnya Telapak pada bulan April tahun ini. PaLM dilatih tentang data yang diambil dari internet, tetapi alih-alih memuntahkan respons teks terbuka, sistem ini diadaptasi untuk menghasilkan daftar instruksi yang harus diikuti robot.

Mengatakan “Saya menumpahkan Coke saya di atas meja, bagaimana Anda akan membuangnya dan membawakan saya sesuatu untuk membantu membersihkan?,” mendorong PaLM untuk memahami pertanyaan dan membuat daftar langkah yang dapat diikuti robot untuk menyelesaikan tugas, seperti melewati untuk mengambil kaleng, membuangnya ke tempat sampah, dan mengambil spons.

Model bahasa besar (LLM) seperti PaLM, bagaimanapun, tidak mengerti arti dari apa pun yang mereka katakan. Untuk alasan ini, para peneliti melatih model terpisah menggunakan pembelajaran penguatan untuk membumikan bahasa abstrak ke dalam representasi dan tindakan visual. Dengan begitu robot belajar mengasosiasikan kata “Coke” dengan gambar kaleng minuman bersoda.

PaLM-SayCan juga mempelajari apa yang disebut "fungsi keterjangkauan" – metode yang memberi peringkat kemungkinan menyelesaikan tindakan tertentu yang diberikan objek di lingkungannya. Robot lebih cenderung mengambil spons daripada penyedot debu, misalnya, jika mendeteksi spons tetapi tidak ada ruang hampa di dekatnya. 

“Metode kami, SayCan, mengekstrak dan memanfaatkan pengetahuan dalam LLM dalam tugas-tugas berbasis fisik,” tim menjelaskan dalam sebuah telaahan. “LLM (Say) menyediakan landasan tugas untuk menentukan tindakan yang berguna untuk tujuan tingkat tinggi dan fungsi keterjangkauan yang dipelajari (Can) memberikan landasan dunia untuk menentukan apa yang mungkin untuk dieksekusi pada rencana tersebut. Kami menggunakan pembelajaran penguatan (RL) sebagai cara untuk mempelajari fungsi nilai terkondisi bahasa yang memberikan keterjangkauan dari apa yang mungkin di dunia.

Untuk mencegah robot menyimpang dari tugas, ia dilatih untuk memilih tindakan dari 101 instruksi yang berbeda saja. Google melatihnya untuk beradaptasi dengan dapur – PaLM-SayCan bisa mendapatkan makanan ringan, minuman, dan melakukan tugas pembersihan sederhana. Para peneliti percaya LLM adalah langkah pertama untuk membuat robot melakukan tugas yang lebih kompleks dengan aman dengan instruksi abstrak.

“Eksperimen kami pada sejumlah tugas robotik dunia nyata menunjukkan kemampuan untuk merencanakan dan menyelesaikan instruksi bahasa alami, abstrak, dan cakrawala panjang dengan tingkat keberhasilan yang tinggi. Kami percaya bahwa interpretasi PaLM-SayCan memungkinkan interaksi pengguna di dunia nyata yang aman dengan robot,” mereka menyimpulkan. ®

Stempel Waktu:

Lebih dari Pendaftaran