مائیکرو سافٹ کے امیج ٹو ویڈیو ٹول سے متاثر صارفین - VASA-

مائیکروسافٹ کے امیج ٹو ویڈیو ٹول سے متاثر صارفین - VASA-

مائیکروسافٹ کے امیج ٹو ویڈیو ٹول سے متاثر صارفین - VASA- PlatoBlockchain Data Intelligence. عمودی تلاش۔ عی

جیسا کہ AI کی بالادستی کی دوڑ جاری ہے، مائیکروسافٹ اب اپنے تازہ ترین ٹول VASA-1 کے ساتھ لوگوں کی پورٹریٹ تصویروں کو بات کرنے والے چہروں یا ویڈیوز میں تبدیل کرنا چاہتا ہے۔

ٹیک دیو کے ایک تحقیقی مقالے کے مطابق، مائیکروسافٹ اے آئی کی دوڑ کو ایک اور سطح پر لے جا رہا ہے۔ واسا 1، بصری اثر انگیز مہارت (VAS) کے ساتھ مجازی کرداروں کے زندگی بھر بات کرنے والے چہروں کو تخلیق کرنے کا فریم ورک، یہ سب ایک پورٹریٹ سے ہے۔

مزید پڑھئے: ویڈیو گیم انڈسٹری میں AI پر اتحاد کرنے کے لیے رش

پورٹریٹ سے بات کرنے والے چہروں تک

اگرچہ یہ ابھی تک عوام کے لیے دستیاب نہیں ہے، لیکن یہ ٹول ایک ہی پورٹریٹ فوٹو اور اسپیچ آڈیو لیتا ہے اور عین مطابق ہونٹ آڈیو مطابقت پذیری، چہرے کے جاندار رویے، اور حقیقی وقت میں پیدا ہونے والی قدرتی سر کی حرکت کے ساتھ ایک انتہائی حقیقت پسندانہ بات کرنے والے چہرے کی ویڈیو تیار کرتا ہے۔

یہ ٹول ابھی بھی مائیکروسافٹ ریسرچ ٹیم کے ساتھ تحقیقی پیش نظارہ کے مرحلے پر ہے، اور ڈیمو ویڈیوز "متاثر کن نظر آتے ہیں۔"

اگرچہ Nvidia اور Runway جیسی کمپنیوں کے پاس پہلے سے ہی سر کی حرکت اور ہونٹوں کی مطابقت پذیری کی ٹکنالوجی ہے، VASA-1 "بہت زیادہ اعلیٰ معیار اور حقیقت پسندی کا حامل" لگتا ہے، جو منہ کے نمونے کو کم کرتا ہے۔ ٹام گائیڈ.

مزید برآں، آڈیو سے چلنے والی حرکت پذیری کا یہ نقطہ نظر بھی حالیہ جیسا ہے۔ Vlogger AI گوگل ریسرچ کے ذریعہ ماڈل۔

مائیکروسافٹ کے مطابق، جب کہ مظاہرے کی مثالوں میں موجود تمام تصاویر Dall-E کی طرف سے بنائی گئی مصنوعی ہیں، VASA-1 پھر بھی ایک حقیقی تصویر کو متحرک کر سکتا ہے۔

ڈیمو مختلف لوگوں کو تقریباً قدرتی حرکات، چہرے کے تاثرات، آنکھوں کی حرکات کے ساتھ بات کرتے ہوئے دکھاتا ہے "دوسرے ٹولز میں منہ کے اوپر اور نیچے کے ارد گرد کوئی نمونہ نظر نہیں آتا۔"

اسے کام کرنے کے لیے چہرے کے آگے پورٹریٹ اسٹائل کی تصویر کی بھی ضرورت نہیں ہے۔

VASA-1 نے لوگوں سے بات کی۔

پہلے سے ہی، AI کے شائقین X پلیٹ فارم پر اسے "جنگلی" اور "پاگل" کے طور پر بیان کرنے والی ٹیکنالوجی سے متاثر نظر آتے ہیں۔

"ہر ریلیز کے درمیان جو بہتری ہم حاصل کر رہے ہیں وہ ناقابل یقین ہے،" نے کہا لینس ایکنسٹم۔

دوسروں کا خیال ہے کہ دنیا "میڈیا کے مواد کی تخلیق کے طریقے میں زلزلہ کی تبدیلی" اور اسے کس طرح استعمال کرتی ہے۔

"یہ ذہن اڑا دینے والا ہے، حقیقت پسندی سب سے اوپر ہے،" ایک اور پرجوش نے کہا جس کی شناخت سیم کے نام سے ہوئی ہے۔

اگرچہ دوسرے لوگ اس ٹول کی صلاحیتوں کو پہچانتے ہیں، لیکن وہ یہ بھی سوچتے ہیں کہ مائیکروسافٹ کی جانب سے ایسا ٹول متعارف کرانا قدرے غیر ذمہ دارانہ ہے جس میں آسانی سے ہیرا پھیری کی جا سکتی ہے۔ الیکشن ڈیپ فیکس.

"انتخابات سے پہلے اس حق کو چھوڑنے کے لیے جنگجو" لکھا ہے ایکس پلیٹ فارم پر روون چیونگ۔

ایک اور صارف ایون کرسٹل ایک سخت انتباہ کے ساتھ تبصرہ کیا: "مائیکروسافٹ ریسرچ کا VASA-1 ایک گیم چینجر ہے، جو صرف ایک تصویر اور آڈیو سے انتہائی حقیقت پسندانہ AI سے تیار کردہ ویڈیوز بناتا ہے۔"

"امکانات لامتناہی ہیں، کلاسک سنیما لیجنڈز کو زندہ کرنے سے لے کر ذاتی میڈیا تک۔ لیکن آئیے گہرے جعلی خطرات سے چوکنا رہیں۔"

پہلے ہی، دنیا نے الیکشن ڈیپ فیکس کی آمد دیکھی ہے جہاں پروپیگنڈہ پھیلانے کے لیے AI کا استعمال کرتے ہوئے سیاست دانوں کی آوازوں یا تصاویر سے ہیرا پھیری کی گئی ہے۔ اس سال عالمی آبادی کا ایک تہائی حصہ انتخابات کے لیے جا رہا ہے۔

تاہم، مائیکروسافٹ کے محققین نے اشارہ کیا ہے کہ یہ صرف مظاہرے کے لیے ہے اور فی الحال عوامی ریلیز یا اسے ڈویلپرز کے لیے دستیاب کرنے کا کوئی منصوبہ نہیں ہے۔

VASA-1 کیسے کام کرتا ہے؟

ٹامز گائیڈ کے مطابق، محققین خود ماڈل کی اس قابلیت پر حیران ہیں کہ "ایک گانے کے ساتھ مکمل طور پر ہونٹ سنک کر سکتے ہیں، بغیر کسی مسئلے کے گلوکار کے الفاظ کی عکاسی کرتے ہوئے تربیتی ڈیٹاسیٹ میں موسیقی کا استعمال نہ ہونے کے باوجود"۔

مزید برآں، VASA-1 نے مختلف تصویری سٹائل کو ہینڈل کیا جس میں مشہور جیسے تاریخی پورٹریٹ بھی شامل ہیں۔ مونا لیزا.

اس ٹول کو گیمنگ میں اس کی جدید ہونٹ سنک صلاحیتوں کی پشت پر استعمال کیا جا سکتا ہے۔ ماہرین نے کہا ہے کہ یہ وسرجن کے لیے گیم چینجر ثابت ہو سکتا ہے۔

مزید برآں، ٹیکنالوجی سوشل میڈیا ویڈیوز کے لیے اوتار بنانے میں مددگار ثابت ہو سکتی ہے، جیسا کہ Synthesia اور HeyGen جیسی فرموں کے معاملے میں۔

AI پر مبنی فلمیں اور میوزک ویڈیو پروڈکشن بھی زیادہ حقیقت پسندانہ ویڈیوز کے لیے VASA-1 ٹیکنالوجی کا فائدہ اٹھا سکتے ہیں۔

اس بات کے امکانات ہیں کہ مائیکروسافٹ کے اوپن اے آئی میں حصہ لینے کے ساتھ، VASA-1 مستقبل کے شریک کار کا حصہ بن سکتا ہے۔ سورہ انضمام۔"

ٹائم اسٹیمپ:

سے زیادہ میٹا نیوز