Dünya simülatörleri olarak video oluşturma modelleri

Dünya simülatörleri olarak video oluşturma modelleri

Dünya simülatörleri olarak video oluşturma modelleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Bu teknik rapor, (1) her türden görsel veriyi, üretken modellerin büyük ölçekli eğitimine olanak tanıyan birleşik bir temsile dönüştürme yöntemimize ve (2) Sora'nın yeteneklerinin ve sınırlamalarının niteliksel değerlendirmesine odaklanmaktadır. Model ve uygulama detaylarına bu raporda yer verilmemiştir.

Önceki çalışmaların çoğunda, yinelenen ağlar da dahil olmak üzere çeşitli yöntemler kullanılarak video verilerinin üretken modellenmesi incelendi.[^1][^2] üretken rakip ağlar,[^4][^6] otoregresif transformatörler,[^8] ve difüzyon modelleri.[^10][^12] Bu çalışmalar genellikle dar bir görsel veri kategorisine, daha kısa videolara veya sabit boyutlu videolara odaklanır. Sora genel bir görsel veri modelidir; çeşitli sürelere, en boy oranlarına ve çözünürlüklere yayılan videolar ve görüntülerin yanı sıra bir dakikaya kadar yüksek tanımlı video oluşturabilir.

Zaman Damgası:

Den fazla OpenAI