Sora AI Menghasilkan Video Menakjubkan Secara Instan

Sora AI Menghasilkan Video Menakjubkan Secara Instan

Sora AI Menghasilkan Video Menakjubkan Secara Instan Kecerdasan Data PlatoBlockchain. Pencarian Vertikal. Ai.

Sora, model video generatif baru yang mengesankan yang dibuat oleh OpenAI, dapat mengambil deskripsi teks singkat dan mengubahnya menjadi klip film berdurasi satu menit, rumit, dan berdefinisi tinggi.

OpenAI, perusahaan induk dari chatbot ChatGPT dan pembuat gambar diam DALL-E, termasuk di antara banyak perusahaan yang berlomba-lomba untuk menyempurnakan generator video instan ini. Perusahaan lainnya termasuk perusahaan rintisan seperti Runway dan raksasa teknologi seperti Google dan Meta Platforms Inc., pemilik Facebook dan Instagram.

Teknologi ini mempunyai potensi untuk sepenuhnya menggantikan seniman digital yang kurang terampil sekaligus mempercepat pekerjaan para pembuat film berpengalaman.

Baca Juga: Salah Satu Pendiri OpenAI, Andrej Karpathy, Mundur, Incar Usaha Pribadi

Melepaskan Sora

OpenAI menamai sistem barunya Sora, kata dalam bahasa Jepang untuk langit. Tim pengembangan teknologi, termasuk peneliti Tim Brooks dan Bill Peebles, memilih nama tersebut karena “membangkitkan gagasan tentang potensi kreatif yang tidak terbatas.”

Mereka juga mengatakan perusahaan belum merilis Sora ke publik karena masih melihat risiko yang terkait dengan sistem tersebut. Sebaliknya, OpenAI membagikan teknologi tersebut kepada sekelompok akademisi terpilih dan peneliti luar lainnya yang akan “melakukan tim merah”, sebuah istilah untuk menggambarkan pencarian potensi penyalahgunaan.

Menurut Dr. Brooks, tujuannya di sini adalah untuk memberikan gambaran tentang apa yang akan terjadi sehingga masyarakat dapat melihat kemampuan teknologi ini dan mendapatkan masukan.

OpenAI Menandai Video

OpenAI sudah menandai video yang dibuat oleh sistem dengan tanda air untuk menunjukkan bahwa video tersebut dihasilkan oleh kecerdasan buatan (AI). Namun, perusahaan mengakui bahwa ini dapat dihapus. Mereka menambahkan bahwa mereka juga sulit untuk diidentifikasi.

Menurut OpenAI, mereka mengajarkan kecerdasan buatan (AI) untuk memahami dan mensimulasikan dunia fisik yang bergerak, dengan tujuan melatih model yang membantu orang memecahkan masalah yang memerlukan interaksi di dunia nyata.

Selain itu, mereka juga memberikan akses kepada beberapa seniman visual, desainer, dan pembuat film untuk mendapatkan masukan tentang cara mengembangkan model agar dapat berguna bagi para profesional kreatif.

Mereka membagikan kemajuan penelitian mereka sejak dini untuk mulai bekerja sama dan mendapatkan masukan dari orang-orang di luar OpenAI dan untuk memberikan gambaran kepada publik tentang kemampuan AI yang ada di masa depan.

Mengembangkan Sora

Namun, OpenAI menolak untuk mengungkapkan jumlah video yang dipelajari sistem atau dari mana asalnya. Mereka hanya menyatakan bahwa pelatihan tersebut mencakup video yang tersedia untuk umum dan video yang dilisensikan oleh pemegang hak cipta.

Perusahaan telah digugat beberapa kali karena menggunakan konten berhak cipta. Mereka mungkin mencoba untuk mempertahankan keunggulan dibandingkan pesaingnya, sehingga mereka tidak mengungkapkan apa pun tentang data yang digunakan untuk melatih teknologinya.

Selain itu, model ini memiliki pemahaman bahasa yang mendalam, memungkinkannya menafsirkan perintah secara akurat dan menghasilkan karakter menarik yang menyampaikan emosi dengan jelas. Sora juga dapat menyebabkan beberapa pengambilan gambar yang mempertahankan pengambilan gambar visual dan karakter dalam satu video yang dihasilkan.

OpenAI membagikan perintah untuk membuat video di pegangan X mereka, menyebabkan beberapa reaksi dari pengguna X.

Kelemahan Model

Menurut OpenAI, model saat ini memiliki kelemahan. Ini mungkin memerlukan bantuan untuk secara akurat mensimulasikan fisika dari pemandangan yang kompleks dan mungkin memerlukan bantuan untuk memahami contoh sebab dan akibat yang spesifik. Misalnya, seseorang mungkin menggigit kue, tetapi setelah itu, kue tersebut mungkin tidak memiliki bekas gigitan.

Model tersebut mungkin juga perlu memperjelas detail spasial dari suatu perintah, misalnya, mencampurkan kiri dan kanan, dan mungkin memerlukan bantuan dalam mendeskripsikan peristiwa yang terjadi seiring waktu dengan tepat, seperti mengikuti lintasan kamera tertentu.

Stempel Waktu:

Lebih dari Berita Meta