AI Google Menonton Video Game selama 30,000 Jam—Sekarang Berhasil

AI Google Menonton Video Game selama 30,000 Jam—Sekarang Berhasil

AI Google Menonton Video Game selama 30,000 Jam—Sekarang Membuat Kecerdasan Data PlatoBlockchain Sendiri. Pencarian Vertikal. Ai.

AI terus menghasilkan banyak cahaya dan panas. Model-model terbaik dalam bentuk teks dan gambar—yang sekarang banyak diminati dan dirangkai menjadi produk konsumen—bersaing untuk mendapatkan ukuran inci. OpenAI, Google, dan Anthropic, kurang lebih, saling bersaing.

Maka tidak mengherankan jika para peneliti AI berupaya untuk mendorong model generatif ke wilayah baru. Karena AI membutuhkan data dalam jumlah besar, salah satu cara untuk memperkirakan perkembangan selanjutnya adalah dengan melihat data apa saja yang tersedia secara online, namun sebagian besar masih belum dimanfaatkan.

Video, yang jumlahnya banyak, merupakan langkah berikutnya yang jelas. Memang, bulan lalu, OpenAI melakukan pratinjau AI teks-ke-video baru yang disebut Sora itu membuat penonton tercengang.

Tapi bagaimana dengan video…game?

Minta dan Terima

Ternyata ada cukup banyak video gamer online. Google DeepMind mengatakan pihaknya melatih AI baru, Genie, pada 30,000 jam rekaman video yang dikurasi yang menunjukkan para gamer memainkan platformer sederhana—pikirkan game Nintendo awal—dan sekarang ia dapat membuat contohnya sendiri.

Genie mengubah gambar, foto, atau sketsa sederhana menjadi video game interaktif.

Jika diberikan perintah, misalnya gambar karakter dan lingkungannya, AI kemudian dapat mengambil masukan dari pemain untuk menggerakkan karakter melalui dunianya. Dalam postingan blognya, DeepMind menunjukkan kreasi Genie menavigasi lanskap 2D, berjalan-jalan, atau melompat antar platform. Seperti ular yang memakan ekornya, beberapa dunia ini bahkan bersumber dari gambar yang dihasilkan AI.

Berbeda dengan video game tradisional, Genie menghasilkan dunia interaktif bingkai demi bingkai. Dengan adanya prompt dan perintah untuk bergerak, ia memprediksi frame berikutnya yang paling mungkin terjadi dan membuatnya dengan cepat. Ia bahkan belajar untuk memasukkan kesan paralaks, fitur umum di platformer di mana latar depan bergerak lebih cepat daripada latar belakang.

Khususnya, pelatihan AI tidak menyertakan label. Sebaliknya, Genie belajar menghubungkan perintah masukan—misalnya, ke kiri, kanan, atau melompat—dengan gerakan dalam game hanya dengan mengamati contoh dalam pelatihannya. Artinya, ketika karakter dalam video bergerak ke kiri, tidak ada label yang menghubungkan perintah dengan gerakan tersebut. Genie menemukan bagian itu dengan sendirinya. Artinya, kemungkinan besar, versi mendatang dapat dilatih menggunakan sebanyak mungkin video yang dapat diterapkan di internet.

AI adalah bukti konsep yang mengesankan, tetapi pengembangannya masih sangat awal, dan DeepMind belum berencana untuk mempublikasikan model tersebut.

Game-game itu sendiri adalah dunia berpiksel yang mengalir dengan kecepatan satu frame per detik. Sebagai perbandingan, video game kontemporer bisa mencapai 60 atau 120 frame per detik. Selain itu, seperti semua algoritme generatif, Genie menghasilkan artefak visual yang aneh atau tidak konsisten. Hal ini juga rentan terhadap halusinasi “masa depan yang tidak realistis,” tim menulis dalam makalah mereka yang menjelaskan AI.

Meskipun demikian, ada beberapa alasan untuk percaya bahwa Genie akan berkembang dari sini.

Mencambuk Dunia

Karena AI dapat belajar dari video online yang tidak diberi label dan ukurannya masih kecil—hanya 11 miliar parameter—ada banyak peluang untuk ditingkatkan. Model yang lebih besar yang dilatih dengan lebih banyak informasi cenderung meningkat secara dramatis. Dan dengan a industri yang sedang berkembang berfokus pada inferensi—proses dimana AI terlatih melakukan tugas, seperti menghasilkan gambar atau teks—kemungkinan akan menjadi lebih cepat.

DeepMind mengatakan Genie dapat membantu orang, seperti pengembang profesional, membuat video game. Namun seperti OpenAI—yang percaya bahwa Sora lebih dari sekadar video—tim ini berpikir lebih besar. Pendekatannya bisa lebih dari sekadar video game.

Satu contoh: AI yang bisa mengendalikan robot. Tim tersebut melatih model terpisah dalam video lengan robot yang menyelesaikan berbagai tugas. Model tersebut belajar memanipulasi robot dan menangani berbagai objek.

DeepMind juga mengatakan lingkungan video game yang dihasilkan Genie dapat digunakan untuk melatih agen AI. Ini bukanlah strategi baru. Dalam makalah tahun 2021, yang lain Tim DeepMind menguraikan video game bernama XLand yang dihuni oleh agen AI dan penguasa AI yang menghasilkan tugas dan permainan untuk menantang mereka. Gagasan bahwa langkah besar berikutnya dalam AI akan memerlukan algoritma yang dapat melatih satu sama lain atau menghasilkan data pelatihan sintetis mendapatkan traksi.

Semua ini merupakan serangan terbaru dalam persaingan ketat antara OpenAI dan Google untuk menunjukkan kemajuan dalam AI. Sementara yang lain di lapangan, seperti Antropis, sedang memajukan model multimodal seperti GPT-4, Google dan OpenAI juga tampaknya fokus pada algoritma yang mensimulasikan dunia. Algoritme seperti itu mungkin lebih baik dalam perencanaan dan interaksi. Keduanya akan menjadi keterampilan penting bagi agen AI yang tampaknya ingin diproduksi oleh kedua organisasi.

“Genie dapat diarahkan dengan gambar-gambar yang belum pernah dilihat sebelumnya, seperti foto atau sketsa dunia nyata, sehingga memungkinkan orang untuk berinteraksi dengan dunia maya yang mereka bayangkan—yang pada dasarnya bertindak sebagai model dasar dunia,” tulis para peneliti di jurnal tersebut. Entri blog jin. “Kami fokus pada video game platformer 2D dan robotika namun metode kami bersifat umum dan dapat digunakan pada semua jenis domain, serta dapat diperluas ke kumpulan data internet yang lebih besar.”

Demikian pula, ketika OpenAI mempratinjau Sora bulan lalu, para peneliti menyarankan hal itu mungkin menunjukkan sesuatu yang lebih mendasar: sebuah simulator dunia. Artinya, kedua tim tampaknya melihat cache video online yang sangat besar sebagai cara untuk melatih AI untuk menghasilkan videonya sendiri, ya, tetapi juga agar lebih efektif memahami dan beroperasi di dunia, online atau offline.

Apakah hal ini akan memberikan keuntungan, ataukah akan berkelanjutan dalam jangka panjang, masih menjadi pertanyaan terbuka. Otak manusia beroperasi dengan kekuatan yang setara dengan bola lampu; AI generatif menggunakan seluruh pusat data. Namun sebaiknya jangan meremehkan kekuatan yang ada saat ini—dalam hal bakat, teknologi, otak, dan uang—yang bertujuan untuk tidak hanya meningkatkan AI tetapi juga membuatnya lebih efisien.

Kami telah melihat kemajuan yang mengesankan dalam teks, gambar, audio, dan ketiganya secara bersamaan. Video adalah bahan berikutnya yang dimasukkan ke dalam panci, dan dapat menghasilkan minuman yang lebih manjur.

Gambar Kredit: Google DeepMind

Stempel Waktu:

Lebih dari Hub Singularity