Model pembuatan video sebagai simulator dunia

Model pembuatan video sebagai simulator dunia

Video generation models as world simulators PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Laporan teknis ini berfokus pada (1) metode kami untuk mengubah semua jenis data visual menjadi representasi terpadu yang memungkinkan pelatihan model generatif skala besar, dan (2) evaluasi kualitatif atas kemampuan dan keterbatasan Sora. Detail model dan implementasi tidak disertakan dalam laporan ini.

Banyak penelitian sebelumnya yang mempelajari pemodelan generatif data video menggunakan berbagai metode, termasuk jaringan berulang,[^1][^2] jaringan permusuhan generatif,[^4][^6] transformator autoregresif,[^8] dan model difusi.[^10][^12] Karya-karya ini sering kali berfokus pada kategori data visual yang sempit, pada video yang lebih pendek, atau pada video dengan ukuran tetap. Sora adalah model data visual yang bersifat generalis—dapat menghasilkan video dan gambar dengan durasi, rasio aspek, dan resolusi yang beragam, hingga video definisi tinggi berdurasi satu menit penuh.

Stempel Waktu:

Lebih dari OpenAI