ميتا تكشف النقاب عن الجيل التالي من فيديو AI Emu وتحرير Emu

ميتا تكشف النقاب عن الجيل التالي من فيديو AI Emu وتحرير Emu

ميتا تكشف النقاب عن الجيل التالي من فيديو AI Emu وEmu تحرير ذكاء بيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

يشهد مجال الذكاء الاصطناعي التوليدي تطورات سريعة، حيث يمثل عام 2023 خطوة كبيرة في هذا المجال. قدمت شركة Meta، المعروفة سابقًا باسم Facebook، نموذج Emu، وهو نموذج أساسي رائد لتوليد الصور، في حدث Meta Connect لهذا العام. هذا التكنلوجيا يدعم العديد من تجارب الذكاء الاصطناعي عبر مجموعة تطبيقات Meta، لا سيما في أدوات تحرير الصور المدعومة بالذكاء الاصطناعي في Instagram. تتيح هذه الأدوات للمستخدمين تحويل الصور عن طريق تغيير أسلوبهم البصري أو خلفيتهم. علاوة على ذلك، تعمل ميزة Imagine في Meta AI على تسهيل إنشاء صور واقعية داخل الرسائل أو الدردشات الجماعية.

اختراقات في توليد الفيديو: فيديو الاتحاد الاقتصادي والنقدي

ظهر Emu Video كتطور محوري، وذلك باستخدام نموذج Emu لإنشاء تحويل النص إلى فيديو. يقدم هذا النهج المبتكر، المعتمد على نماذج الانتشار، طريقة بسيطة لكنها فعالة لإنشاء مقاطع فيديو عالية الجودة. تتضمن العملية مرحلتين: في البداية إنشاء صور من المطالبات النصية ثم إنشاء مقاطع فيديو مشروطة بكل من النص والصور. تسمح هذه المنهجية المقسمة بالتدريب الفعال لنماذج توليد الفيديو. إن تفوق Emu Video واضح، لأنه لا يتطلب سوى نموذجي نشر لإنتاج مقاطع فيديو بدقة 512 × 512 بمعدل 16 إطارًا في الثانية، وهو تناقض صارخ مع الأساليب السابقة التي تتطلب نماذج متعددة. أظهرت التقييمات البشرية تفضيلًا قويًا لـ Emu Video، حيث يتفوق أدائها على التقنيات السابقة من حيث الجودة والالتزام بالمطالبات النصية.

ثورة في تحرير الصور: تحرير Emu

يمثل برنامج Meta's Emu Edit نقلة نوعية في تحرير الصور، مع التركيز على التعديلات الدقيقة على مستوى البكسل. تتيح هذه الأداة مهام التحرير المعقدة مثل التعديلات المحلية والعالمية، وتعديلات الخلفية، والتحويلات اللونية والهندسية. يتميز Emu Edit بضمان تغيير وحدات البكسل ذات الصلة بتعليمات التحرير فقط، والحفاظ على سلامة الأجزاء غير المستهدفة من الصورة. لتدريب Emu Edit، قامت Meta بتطوير مجموعة بيانات شاملة تضم 10 ملايين عينة مركبة، تتضمن كل منها صورة إدخال، ووصف مهمة تحرير، وصورة إخراج مستهدفة. يُظهر النموذج أداءً استثنائيًا من حيث دقة التعليمات وجودة الصورة.

مستقبل الذكاء الاصطناعي التوليدي في ميتا

تشير هذه التطورات في الذكاء الاصطناعي التوليدي إلى مستقبل يكون فيه التعبير الإبداعي أكثر سهولة وتنوعًا. من المحتمل أن يُحدث Emu Video وEmu Edit ثورة في كيفية إنشاء الأشخاص للوسائط ومشاركتها. إنها توفر أدوات للجميع بدءًا من الفنانين المحترفين وحتى المستخدمين العاديين، مما يتيح أشكالًا جديدة من التعبير والإبداع. على الرغم من أنها ليست بدائل للمبدعين المحترفين، إلا أنها توفر منصة لتعزيز التعبير عن الذات والاستكشاف الإبداعي.

تؤكد تقارير الوسائط على العملية المبسطة لـ Emu Video وإمكانية التحرير الدقيقة على مستوى البكسل لـ Emu Edit. يتم تسليط الضوء على بساطة التكنولوجيا وكفاءتها، إلى جانب قدرتها على إحداث ثورة في تحرير الفيديو والصور. ومع ذلك، تقترب شركة Meta من نشر حلول الذكاء الاصطناعي هذه بحذر، نظرًا للتدقيق الصارم من قبل الجهات التنظيمية. أوضحت Meta أن قدرات الذكاء الاصطناعي الخاصة بها لن تكون متاحة للحملات التسويقية أو السياسية على Facebook وInstagram. ومع ذلك، فإن لوائح الإعلان الأساسية للمنصة حاليًا لا تتناول الذكاء الاصطناعي على وجه التحديد.

مصدر الصورة: Shutterstock

الطابع الزمني:

اكثر من بلوكشين الأخبار