Game Kerajinan Genie AI Google dari Gambar Tunggal

Game Kerajinan Genie AI Google dari Gambar Tunggal

Google telah mengumumkan Genie, sebuah aplikasi untuk membuat game seluler, sebagai bagian dari investasi berkelanjutannya dalam kecerdasan buatan. 

Model AI generatif Genie, yang dikembangkan oleh startup AI Google, DeepMind, mendemonstrasikan demo langsung. Genie mempelajari mekanisme game dari ratusan ribu video gameplay dan dapat menghasilkan game yang dapat dimainkan dengan perintah minimal.

Baca Juga: Figure AI Akan Mengumpulkan $675 juta untuk Robotika Humanoid Pemecahan Tenaga Kerja

Mengungkap Jin

Seperti yang tercantum dalam DeepMind resmi Google posting blog, Genie adalah model dunia dasar yang dilatih menggunakan video online. โ€œBerbagai macam dunia yang dapat dimainkan (dapat dikontrol aksi) dari gambar sintetis, foto, dan bahkan sketsaโ€ dapat dihasilkan oleh model.

Genie, kependekan dari Generative Interactive Environments, dikembangkan dalam kemitraan antara Google dan Universitas British Columbia. Hanya dengan satu gambar, ia dapat menghasilkan platformer 2D side-scrolling seperti Contra dan Super Mario Brothers berdasarkan permintaan pengguna.

Namun, Google DeepMind menyatakan saat pengumuman bahwa mereka memperkenalkan โ€œparadigma baruโ€ untuk kecerdasan buatan generatif (AI) dalam bentuk Genie. Selain itu, perusahaan mengakui munculnya model AI generatif yang mampu menghasilkan konten baru dan kreatif melalui bahasa, gambar, dan bahkan video.

Menurut Google, sebagian besar dari 200,000 jam video game internet publik tanpa pengawasan yang dilatih oleh Genie adalah platformer 2D, bukan game realitas virtual penuh.

Spesifikasi Jin

Dalam hal dimensi, Genie memiliki 11 miliar parameter. Tokenizer video spatiotemporal, model dinamika autoregresif, dan model tindakan laten yang sederhana dan terukur juga disertakan dalam model tersebut. Spesifikasi ini memungkinkan Genie untuk bertindak dalam lingkungan yang dihasilkan frame-by-frame, bahkan tanpa label atau persyaratan khusus domain lainnya saat pelatihan.

Selain itu, Genie dapat diinstruksikan untuk menghasilkan beragam lingkungan yang interaktif dan dapat dikontrol, meskipun telah dilatih tentang data hanya video. Genie dapat membuat lingkungan yang dapat dimainkan hanya dengan satu perintah gambar, tidak seperti banyak model AI generatif yang dapat menghasilkan konten kreatif dengan gambar bahasa dan bahkan video.

Namun, pengembang Google DeepMind Tim Rocktรคschel mengatakan di X (sebelumnya Twitter) bahwa mereka fokus pada skala daripada menambahkan bias induktif.

Dia menambahkan bahwa mereka menggunakan kumpulan data lebih dari 200 ribu jam video dari platformer 2D dan melatih model dunia 11 miliar. Dengan cara tanpa pengawasan, Genie mempelajari beragam tindakan laten yang secara konsisten mengontrol karakter.

Game Kerajinan Genie AI Google dari Gambar Tunggal
Kredit Foto: Google

Kemampuan Jin

Menurut Google Peneliti, Genie didorong oleh tiga model: model dinamis yang memprediksi apa yang akan terjadi pada frame berikutnya, tokenizer video yang mengubah frame video mentah menjadi token diskrit, dan model tindakan laten yang dapat menyimpulkan tindakan antar frame video.

Kemampuan model dasar Genie untuk mengidentifikasi karakter utama game tanpa dilatih tentang tindakan atau anotasi teks adalah salah satu fitur uniknya. Berkat model yang menggerakkannya, pengguna dapat dengan mudah mengontrol karakter dalam sebuah Buatan AI lingkungan realitas maya.

Rocktรคschel juga mengatakan bahwa Genie bisa mengubah media lain menjadi permainan. Genie dapat diminta untuk menciptakan berbagai dunia virtual yang dapat dikendalikan tindakan dari berbagai masukan dalam makalah penelitian Google DeepMind yang menyertainya.

Lebih lanjut, Rocktรคschel mengatakan model tersebut dapat mengubah gambar apa pun menjadi dunia 2D yang dapat dimainkan. Menurutnya, Genie mampu menghidupkan kreasi rancangan manusia seperti sketsa, misalnya karya seni indah dari Seneca dan Caspian, dua pencipta termuda di dunia.

Stempel Waktu:

Lebih dari Berita Meta