AI DeepMind Ini Dengan Cepat Mempelajari Keterampilan Baru Hanya dengan Mengamati Manusia

AI DeepMind Ini Dengan Cepat Mempelajari Keterampilan Baru Hanya dengan Mengamati Manusia

AI DeepMind Ini Dengan Cepat Mempelajari Keterampilan Baru Hanya dengan Mengamati Kecerdasan Data PlatoBlockchain Manusia. Pencarian Vertikal. Ai.

Mengajarkan algoritma untuk meniru manusia biasanya memerlukan ratusan atau ribuan contoh. Namun AI baru dari Google DeepMind dapat mengambil keterampilan baru dari manusia yang melakukan demonstrasi dengan cepat.

Salah satu trik terbesar umat manusia adalah kemampuan kita memperoleh pengetahuan dengan cepat dan efisien dari satu sama lain. Pembelajaran sosial semacam ini, yang sering disebut sebagai transmisi budaya, memungkinkan kita menunjukkan kepada rekan kerja cara menggunakan alat baru atau mengajarkan lagu anak-anak kepada anak-anak kita.

Tidak mengherankan jika para peneliti mencoba mereplikasi proses tersebut pada mesin. Pembelajaran imitasi, dimana AI mengamati manusia menyelesaikan suatu tugas dan kemudian mencoba meniru perilaku mereka, telah lama menjadi pendekatan yang populer untuk melatih robot. Namun algoritme pembelajaran mendalam tercanggih saat ini pun biasanya perlu melihat banyak contoh sebelum berhasil meniru pelatihnya.

Ketika manusia belajar melalui peniruan, mereka sering kali dapat mengambil tugas baru hanya setelah beberapa kali demonstrasi. Kini, peneliti Google DeepMind telah mengambil langkah menuju pembelajaran sosial yang cepat dalam AI dengan agen yang belajar menavigasi dunia virtual dari manusia secara real time.

โ€œAgen kami berhasil meniru manusia secara real-time dalam konteks baru tanpa menggunakan data manusia yang telah dikumpulkan sebelumnya,โ€ tulis para peneliti dalam sebuah pernyataan. kertas masuk Alam Komunikasi. "Kami mengidentifikasi serangkaian bahan sederhana yang cukup untuk menghasilkan transmisi budaya.โ€

Para peneliti melatih agen mereka dalam simulator yang dirancang khusus yang disebut GoalCycle3D. Simulator menggunakan algoritme untuk menghasilkan lingkungan berbeda yang jumlahnya hampir tak terbatas berdasarkan aturan tentang cara simulasi harus beroperasi dan aspek apa yang harus diubah.

Di setiap lingkungan, seperti gumpalan kecil Agen AI harus menavigasi medan yang tidak rata dan berbagai rintangan untuk melewati serangkaian bola berwarna dalam urutan tertentu. Ketidakrataan medan, kepadatan rintangan, dan konfigurasi bola bervariasi antar lingkungan.

Agen dilatih untuk menavigasi penggunaan penguatan pembelajaran. Mereka mendapat hadiah karena melewati bola dalam urutan yang benar dan menggunakan sinyal ini untuk meningkatkan kinerja mereka dalam banyak percobaan. Namun selain itu, lingkungan tersebut juga menampilkan agen ahliโ€”yang diberi kode keras atau dikendalikan oleh manusiaโ€”yang sudah mengetahui rute yang benar melalui jalur tersebut.

Melalui banyak pelatihan yang dijalankan, agen AI tidak hanya mempelajari dasar-dasar cara kerja lingkungan, tetapi juga bahwa cara tercepat untuk menyelesaikan setiap masalah adalah dengan meniru pakarnya. Untuk memastikan para agen belajar meniru dan bukan hanya menghafal kursus, tim melatih mereka di satu lingkungan dan kemudian mengujinya di lingkungan lain. Yang terpenting, setelah pelatihan, tim menunjukkan bahwa agen mereka dapat meniru seorang ahli dan terus mengikuti rute bahkan tanpa ahlinya.

Hal ini memerlukan beberapa penyesuaian pada pendekatan pembelajaran penguatan standar.

Para peneliti membuat algoritma fokus pada pakar dengan memprediksi lokasi agen lainnya. Mereka juga memberinya modul memori. Selama pelatihan, pakar akan keluar masuk lingkungan, memaksa agen untuk mengingat tindakannya ketika agen tersebut sudah tidak ada lagi. AI juga dilatih di berbagai lingkungan, yang memastikan AI dapat melihat berbagai kemungkinan tugas.

Mungkin sulit untuk menerjemahkan pendekatan ini ke ranah yang lebih praktis. Keterbatasan utamanya adalah ketika para peneliti menguji apakah AI dapat belajar dari demonstrasi manusia, agen ahli dikendalikan oleh satu orang selama seluruh pelatihan dijalankan. Hal ini membuat sulit untuk mengetahui apakah agen dapat belajar dari berbagai orang.

Lebih penting lagi, kemampuan untuk mengubah lingkungan pelatihan secara acak akan sulit untuk diciptakan kembali di dunia nyata. Dan tugas mendasarnya sederhana, tidak memerlukan kontrol motorik halus dan dilakukan di lingkungan virtual yang sangat terkontrol.

Namun, kemajuan pembelajaran sosial dalam AI disambut baik. Jika kita ingin hidup di dunia dengan mesin yang cerdas, menemukan cara yang efisien dan intuitif untuk berbagi pengalaman dan keahlian dengan mesin tersebut sangatlah penting.

Gambar Kredit: Juliana dan Mariana Amorim / Unsplash

Stempel Waktu:

Lebih dari Hub Singularity