Meta Audio2PhotoReal را برای تعاملات Metaverse معرفی می کند

Meta Audio2PhotoReal را برای تعاملات Metaverse معرفی می کند

متا مفهوم دیگری از هوش مصنوعی را وارد صنعت متاورس کرده است. طبق توییت اخیر آلن تی، مربی و توسعه‌دهنده هوش مصنوعی، این شرکت چارچوب جدیدی به نام Audio2Photoreal منتشر کرد.

Audio2Photoreal چارچوبی برای تولید آواتارهای فوتورئالیستی کامل است که به طور طبیعی توسط صدای نویسنده هدایت می شوند. این آواتارها از طریق صدای گفتاری که در حرکت حرکتی انسان ادغام می شود، زنده می شوند.

با توجه به گفتار صوتی خام از افراد، مدلی برای ایجاد حرکات واقعی فوتوریستی مربوطه ایجاد می شود. این سیستم از دو مدل مولد تشکیل شده است که نشان دهنده کدهای بیانی آواتار و حالت بدن است.

بر اساس کلیپ های آپلود شده توسط آلن تی، قسمت های مختلف یک فرد از جمله دهان، دست ها و صورت تحت تاثیر این افزودن قرار می گیرند.

برخی از دموهای منتشر شده شامل چندین نمونه تولید شده، دو مکالمه شخصی، نمونه ای از آواتارهای زن تولید شده و موقعیت های راهنما هستند که مدل انتشار را هدایت می کنند. آلن تی افزود که متاورس با این توسعه سرگرم کننده خواهد بود. در جای دیگر، به نظر می رسد که جامعه فناوری پس از نظرات در مورد این پست هیجان زده است. یک کاربر @EverettWorld توییت, "اگر Metaverse شبیه این است، من وارد هستم!"

با این حال، کاربر دیگری عصبانی شد که دیگر چندان به متا اعتماد ندارد. به گفته @AIandDesign، متا برای انسان مضر است دنبال کل چیز کمبریج آنالیتیکا. کاربر اضافه می کند،

"این همه خیلی باحال است. فقط کاش متا نبود. من دیگه زیاد بهشون اعتماد ندارم بعد از کل کار کمبریج آنالیتیکا، کارم با متا تمام شد. برای بشریت مضر هستند. به معنای واقعی کلمه. من در FB هستم اما فقط برای چیزهای خانوادگی."

فناوری پشت مفهوم Audio2Photoreal

ArXiv، یک پلت فرم اشتراک گذاری تحقیقاتی که برای دانشمندان باز است تا تحقیقات را قبل از بررسی همتایان به اشتراک بگذارند و بینش بیشتری در مورد Audio2Photoreal.

حرکت بدن یک آواتار با استفاده از یک مدل انتشار که به ترتیب با صدا یا متن شرطی شده است، سنتز می شود. برای حرکت صورت، یک مدل پخش با تهویه صوتی از ورودی صدا ساخته شد.

با این حال، بدن و صورت از پویایی بسیار متفاوتی پیروی می کنند، جایی که چهره به شدت با صدای ورودی همبستگی دارد در حالی که بدن همبستگی ضعیف تری با گفتار دارد.

Meta's Audio2Photoreal اکنون به آواتارهای فوتورئالیستی مجهز به صدا اجازه می دهد

Meta's Audio2Photoreal اکنون به آواتارهای فوتورئالیستی مجهز به صدا اجازه می دهد

اهمیت Audio2Photoreal در متاورس 

مشارکت متا در Metaverse با هدف واقعی‌تر کردن اکوسیستم است. این آواتارهای Audio2Photoreal می توانند حالت چهره و حرکات بدن فرد را با استفاده از صدا منعکس کنند.

ارتباطی مشابه زمانی ایجاد می کند که افراد در حال گفتگوی رو در رو هستند. فرد دارای ویژگی های فیزیکی منحصر به فردی مانند قد، رنگ پوست و مو، فرم بدن و سایر ویژگی های دقیق خواهد بود. کار در اکوسیستم متاورس انعطاف پذیرتر می شود زیرا نیازی به وب کم، فیلم یا دوربین گوشی های هوشمند با کیفیت ندارد.

فیس بوک، ایکس و اینستاگرام از اوهایو برای توقف قانون رسانه های اجتماعی شکایت کردند

در یکی دیگر از توسعه‌های اخیر، NetChoice، شرکتی که نماینده پلتفرم‌های رسانه‌های اجتماعی مانند فیس‌بوک، اینستاگرام و X است. طرح دعوی در دادگاه برخلاف قانون جدید رسانه های اجتماعی اوهایو در 5 ژانویه.

این شرکت یک دادخواست 34 صفحه‌ای برای مسدود کردن قانون اعلان والدین رسانه‌های اجتماعی اوهایو منتشر کرد که از 15 ژانویه اجرایی می‌شد، اما فقط برای حساب‌هایی که پس از تاریخ مذکور ایجاد شده‌اند.

قانون رسانه های اجتماعی اصرار دارد که پلتفرم ها باید رضایت والدین خود را برای کاربران 16 ساله یا کمتر دریافت کنند. با این حال، این دادخواست بیان می‌کند که این قانون "موانع قابل توجهی بر روی توانایی برخی افراد زیر سن قانونی برای مشارکت در سخنرانی در آن وب‌سایت‌ها ایجاد می‌کند."

تمبر زمان:

بیشتر از متانیوز