Meta 推出下一代 AI Emu 视频和 Emu 编辑

Meta 推出下一代 AI Emu 视频和 Emu 编辑

Meta 推出下一代 AI Emu Video 和 Emu Edit PlatoBlockchain 数据智能。垂直搜索。人工智能。

生成式人工智能领域正在快速发展,2023 年标志着该领域取得了重大进展。 Meta(前身为 Facebook)在今年的 Meta Connect 活动中推出了 Emu,这是一种突破性的图像生成基础模型。 这 技术 支撑 Meta 应用程序系列中的众多 AI 体验,尤其是 Instagram 的 AI 图像编辑工具。 这些工具使用户能够通过改变视觉风格或背景来改变照片。 此外,Meta AI 中的 Imagine 功能有助于在消息或群聊中生成逼真的图像。

视频生成的突破:Emu Video

Emu Video 是一项关键的发展,利用 Emu 模型进行文本到视频的生成。 这种基于扩散模型的创新方法为创建高质量视频提供了一种简单而有效的方法。 该过程涉及两个阶段:最初根据文本提示生成图像,然后根据文本和图像创建视频。 这种因式分解的方法可以有效地训练视频生成模型。 Emu Video 的优越性显而易见,因为它只需要两个扩散模型就可以以 512 fps 生成 512×16 的视频,这与之前需要多个模型的方法形成鲜明对比。 人类评估显示出对 Emu Video 的强烈偏好,其性能在质量和对文本提示的遵守方面都优于以前的技术。

彻底改变图像编辑:Emu Edit

Meta 的 Emu Edit 代表了图像编辑的范式转变,专注于精确的像素级更改。 该工具支持复杂的编辑任务,例如局部和全局修改、背景调整以及颜色和几何变换。 Emu Edit 的突出之处在于,它确保仅更改与编辑指令相关的像素,从而保持图像非目标部分的完整性。 为了训练 Emu Edit,Meta 开发了一个包含 10 万个合成样本的广泛数据集,每个样本都包含一个输入图像、一个编辑任务描述和目标输出图像。 该模型在指令忠实度和图像质量方面表现出卓越的性能。

Meta 生成式人工智能的未来

生成人工智能的这些进步预示着未来创意表达将变得更加容易和多样化。 Emu Video 和 Emu Edit 可能会彻底改变人们创建和共享媒体的方式。 他们为从专业艺术家到休闲用户的每个人提供工具,实现新的表达形式和创造力。 虽然它们不能替代专业创作者,但它们提供了增强自我表达和创造性探索的平台。

媒体报道强调Emu Video的简化流程和Emu Edit的精确像素级编辑能力。 该技术的简单性和效率得到了强调,并且具有彻底改变视频和图像编辑的潜力。 然而,鉴于监管机构的严格审查,Meta 谨慎对待这些人工智能解决方案的部署。 Meta 已澄清,其人工智能功能将不适用于 Facebook 和 Instagram 上的营销或政治活动。 尽管如此,该平台的基本广告法规目前并未专门针对人工智能。

图片来源:Shutterstock

时间戳记:

更多来自 Blockchain新闻