Make-A-Video dengan AI & beberapa kata: Lihat alat baru Meta, PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Make-A-Video dengan AI & beberapa kata: Lihat alat baru Meta

Kecerdasan buatan semakin baik dalam menghasilkan gambar sebagai respons terhadap beberapa kata, dengan generator gambar AI yang tersedia untuk umum seperti DALL-E 2 dan Stable Diffusion. Kini, peneliti Meta mengambil AI selangkah lebih maju: mereka menggunakannya untuk membuat video dari perintah teks.

CEO Meta Mark Zuckerberg diposting di Facebook pada hari Kamis tentang penelitian tersebut, Yang disebut Membuat video, dengan klip berdurasi 20 detik yang mengumpulkan beberapa teks petunjuk yang digunakan peneliti Meta dan video yang dihasilkan (sangat pendek). Petunjuknya mencakup “Seekor boneka beruang melukis potret diri”, “Pesawat luar angkasa mendarat di Mars”, “Bayi kungkang dengan topi rajutan mencoba mencari tahu laptop”, dan “Robot berselancar di ombak di lautan”.

Video untuk setiap perintah hanya berdurasi beberapa detik, dan umumnya menampilkan apa yang disarankan oleh perintah tersebut (dengan pengecualian bayi sloth, yang tidak terlalu mirip dengan makhluk sebenarnya), dalam resolusi yang cukup rendah dan agak tersentak-sentak. gaya. Meski begitu, hal ini menunjukkan arah baru yang diambil oleh penelitian AI seiring dengan semakin baiknya sistem dalam menghasilkan gambar dari kata-kata. Namun, jika teknologi ini dirilis secara luas, hal ini akan menimbulkan kekhawatiran serupa yang dipicu oleh sistem teks-ke-gambar, misalnya teknologi tersebut dapat digunakan untuk menyebarkan informasi yang salah melalui video.

Sebuah halaman web untuk Make-A-Video menyertakan klip pendek ini dan lainnya, beberapa di antaranya terlihat cukup realistis, seperti video yang dibuat sebagai respons terhadap perintah “Ikan badut berenang melintasi terumbu karang” atau yang dimaksudkan untuk ditunjukkan “Pasangan muda berjalan di tengah hujan lebat. "

Dalam postingan Facebook-nya, Zuckerberg menunjukkan betapa sulitnya menghasilkan gambar bergerak dari beberapa kata.

“Jauh lebih sulit menghasilkan video dibandingkan foto karena selain menghasilkan setiap piksel dengan benar, sistem juga harus memprediksi bagaimana piksel akan berubah seiring waktu,” tulisnya.

Makalah penelitian mendeskripsikan pekerjaan tersebut menjelaskan bahwa proyek tersebut menggunakan model AI teks-ke-gambar untuk mengetahui bagaimana kata-kata berhubungan dengan gambar, dan teknik AI yang dikenal sebagai belajar tanpa pengawasan — yang mana algoritme meneliti data yang tidak diberi label untuk membedakan pola di dalamnya — untuk melihat video dan menentukan seperti apa gerakan realistisnya.

Seperti halnya sistem AI besar dan populer yang menghasilkan gambar dari teks, para peneliti menunjukkan bahwa model AI text-to-image mereka dilatih berdasarkan data internet – yang berarti model tersebut mempelajari “dan kemungkinan besar membesar-besarkan bias sosial, termasuk bias yang merugikan,” para peneliti menulis. Mereka mencatat bahwa mereka memfilter data untuk “konten NSFW dan kata-kata beracun,” namun karena kumpulan data dapat mencakup jutaan gambar dan teks, mungkin tidak mungkin untuk menghapus semua konten tersebut.

Zuckerberg menulis bahwa Meta berencana membagikan proyek Make-A-Video sebagai demo di masa depan.

The-CNN-Wire™ & © 2022 Cable News Network, Inc., sebuah Perusahaan Penemuan Warner Bros. Seluruh hak cipta.

Stempel Waktu:

Lebih dari Teknologi WRAL