Meta 推出用于 Metaverse 交互的 Audio2PhotoReal

Meta 推出用于 Metaverse 交互的 Audio2PhotoReal

Meta将另一个AI概念引入元宇宙行业。根据人工智能教育者和开发人员 Allen T. 最近的一条推文,该公司发布了一个名为 Audio2Photoreal 的新框架。

音频2照片真实 是一个用于生成全身逼真化身的框架,这些化身由作者的声音自然地由手势驱动。这些化身通过融入人类手势运动的语音音频而变得栩栩如生。

给定个人的原始音频语音,创建一个模型来生成相应的逼真手势。该系统由两个生成模型组成,分别代表化身的表情代码和身体姿势。

根据 Allen T 上传的视频,一个人的不同部位,包括嘴、手和脸,都会受到这种添加的影响。

发布的一些演示包括生成的多个样本、两次个人对话、生成的女性化身样本以及驱动扩散模型的引导姿势。 Allen T. 补充说,随着这一发展,虚拟宇宙将会变得很有趣。在其他地方,科技界在对该帖子发表评论后似乎很兴奋。用户@EverettWorld 啾啾,“如果元宇宙看起来像这样,我就加入!”

然而,另一位用户激动地表示,他不再信任 Meta。根据@AIandDesign 的说法, 元对人类有害 关注整个剑桥分析事件。用户补充说,

“这一切都太酷了。我只是希望这不是 Meta。我不再信任他们了。在经历了整个 Cambridge Analytica 事件之后,我对 Meta 彻底厌倦了。它们对人类有害。字面上地。我在脸书上,但只是为了家庭事务。”

Audio2Photoreal 概念背后的技术

的arXiv是一个精心策划的研究共享平台,供科学家在同行评审之前共享研究成果,提供了更多见解 音频2照片真实.

化身的身体运动是使用分别以音频或文本为条件的扩散模型来合成的。对于面部运动,根据音频输入构建了音频条件扩散模型。

然而,身体和面部遵循高度不同的动态,其中面部与输入音频强相关,而身体与语音相关性较弱。

Meta 的 Audio2Photoreal 现在支持语音驱动的逼真头像

Meta 的 Audio2Photoreal 现在支持语音驱动的逼真头像

Audio2Photoreal 在虚拟宇宙中的重要性 

Meta参与Metaverse的目的是让生态系统更加现实。这些 Audio2Photoreal 化身可以通过使用音频来反映个人的面部表情和身体姿势。

它建立了一种类似于个人面对面交谈的联系。该人将具有独特的身体特征,如身高、皮肤和头发颜色、体型和其他准确的属性。工作于 元界生态系统 变得更加灵活,因为它不需要网络摄像头、视频或高质量的智能手机摄像头。

Facebook、X 和 Instagram 起诉俄亥俄州,要求其停止社交媒体法

在最近的另一项进展中,代表 Facebook、Instagram 和 X 等社交媒体平台的 NetChoice 公司提交了一份 诉讼 5 月 XNUMX 日反对俄亥俄州新的社交媒体法。

该公司发布了一份长达 34 页的诉讼,以阻止俄亥俄州的社交媒体家长通知法案,该法案将于 15 月 XNUMX 日生效,但仅限于该日期之后创建的帐户。

社交媒体法坚持认为,平台应针对 16 岁或以下的用户征得家长同意。然而,诉讼指出,该法律将“对一些未成年人在这些网站上发表言论的能力设置重大障碍。”

时间戳记:

更多来自 元新闻