Sora AI ویدیوهای چشم نواز را فوراً تولید می کند

Sora AI ویدیوهای چشم نواز را فوراً تولید می کند

هوش مصنوعی Sora ویدیوهای چشم نواز را فوراً با هوش داده PlatoBlockchain تولید می کند. جستجوی عمودی Ai.

Sora، یک مدل ویدیویی مولد جدید و چشمگیر ایجاد شده توسط OpenAI، می‌تواند توضیحات متنی مختصری داشته باشد و آن را به یک کلیپ فیلم دقیقه‌ای، پیچیده و با کیفیت بالا تبدیل کند.

OpenAIشرکت مادر چت ربات ChatGPT و تولید کننده تصویر ثابت DALL-E، از جمله شرکت‌هایی است که برای بهبود این تولیدکننده ویدیوی فوری رقابت می‌کنند. شرکت‌های دیگر شامل استارت‌آپ‌هایی مانند Runway و غول‌های فناوری مانند Google و Meta Platforms Inc.، صاحبان فیس‌بوک و اینستاگرام هستند.

این فناوری پتانسیل این را دارد که به طور کامل جایگزین هنرمندان دیجیتال کمتر ماهر شود و در عین حال سرعت کار فیلمسازان باتجربه را افزایش دهد.

همچنین خواندن: آندری کارپاتی، بنیانگذار OpenAI، استعفا می دهد، چشمان سرمایه گذاری شخصی

آزاد کردن سورا

OpenAI سیستم جدید خود را Sora نامگذاری کرد که کلمه ژاپنی به معنای آسمان است. تیم توسعه فناوری، از جمله محققان تیم بروکس و بیل پیبلز، این نام را انتخاب کردند زیرا "ایده پتانسیل خلاقانه بی حد و حصر را تداعی می کند."

آنها همچنین گفتند که این شرکت هنوز Sora را برای عموم منتشر نکرده است زیرا هنوز در حال بررسی خطرات مرتبط با سیستم است. در عوض، OpenAI این فناوری را با گروهی منتخب از دانشگاهیان و سایر محققان خارجی به اشتراک می گذارد که آن را "تیم قرمز" خواهند کرد، اصطلاحی برای توصیف جستجو برای سوء استفاده های احتمالی.

به گفته دکتر بروکس، هدف در اینجا ارائه پیش نمایشی از آنچه در افق است ارائه می شود تا مردم بتوانند قابلیت های این فناوری را ببینند و بازخورد دریافت کنند.

OpenAI ویدیوها را برچسب گذاری می کند

OpenAI قبلاً ویدیوهای ایجاد شده توسط سیستم را با واترمارک برچسب گذاری می کند تا نشان دهد که توسط هوش مصنوعی (AI) تولید شده است. با این حال، شرکت تصدیق می کند که این موارد را می توان حذف کرد. آنها افزودند که شناسایی آنها نیز می تواند چالش برانگیز باشد.

مطابق با OpenAIآنها در حال آموزش هوش مصنوعی (AI) برای درک و شبیه سازی دنیای فیزیکی در حال حرکت هستند، با هدف مدل های آموزشی که به مردم در حل مشکلاتی که نیاز به تعامل در دنیای واقعی دارند کمک می کند.

علاوه بر این، آنها به چندین هنرمند تجسمی، طراح و فیلمساز اجازه دسترسی می دهند تا بازخوردی در مورد چگونگی پیشبرد مدل به دست آورند تا برای حرفه ای های خلاق مفیدترین باشد.

آنها پیشرفت تحقیقات خود را زود به اشتراک می گذارند تا شروع به کار با افراد خارج از OpenAI کنند و از آنها بازخورد دریافت کنند و به مردم این احساس را بدهند که قابلیت های هوش مصنوعی در افق چیست.

در حال توسعه سورا

با این حال، OpenAI از افشای تعداد ویدیوهایی که سیستم از آنها یاد گرفته یا از کجا آمده اند خودداری کرد. آنها فقط اظهار داشتند که این آموزش شامل ویدیوهای در دسترس عموم و ویدیوهای دارای مجوز از صاحبان حق چاپ است.

این شرکت چندین بار به دلیل استفاده از محتوای دارای حق چاپ شکایت کرده است. احتمالاً سعی می کند برتری خود را نسبت به رقبا حفظ کند، بنابراین چیزی در مورد داده های مورد استفاده برای آموزش فناوری های خود فاش نمی کند.

علاوه بر این، این مدل درک عمیقی از زبان دارد و آن را قادر می‌سازد تا به طور دقیق اعلان‌ها را تفسیر کند و شخصیت‌های قانع‌کننده‌ای ایجاد کند که به وضوح احساسات را منتقل می‌کنند. سورا همچنین می تواند چندین عکس ایجاد کند که شات بصری و شخصیت را در یک ویدیوی تولید شده حفظ کند.

OpenAI درخواست تولید یک ویدیو در دسته X خود را به اشتراک گذاشت که باعث واکنش های متعدد کاربران X شد.

نقاط ضعف مدل

طبق گفته OpenAI، مدل فعلی دارای نقاط ضعفی است. ممکن است برای شبیه سازی دقیق فیزیک یک صحنه پیچیده به کمک نیاز داشته باشد و ممکن است برای درک موارد خاصی از علت و معلول به کمک نیاز داشته باشد. برای مثال، ممکن است شخصی یک کوکی گاز بگیرد، اما پس از آن، ممکن است کوکی علامت نیش نداشته باشد.

همچنین ممکن است مدل نیاز به شفاف‌سازی جزئیات فضایی یک درخواست داشته باشد، به‌عنوان مثال، اختلاط چپ و راست، و ممکن است برای توصیف دقیق رویدادهایی که در طول زمان رخ می‌دهند، مانند دنبال کردن یک مسیر دوربین خاص، به کمک نیاز داشته باشد.

تمبر زمان:

بیشتر از متانیوز