Meta 发布用于制作音乐、声音的生成式人工智能

由柏拉图重新发布

关注： 0

Meta 发布了用于制作音乐的生成式人工智能，听起来像是柏拉图区块链数据智能。垂直搜索。人工智能。

Meta 周三发布了 AudioCraft，这是一组三个人工智能模型，能够根据文本描述自动创建声音。

随着采用书面提示并将其转化为图像或更多文本的生成人工智能模型不断成熟，计算机科学家正在研究使用机器学习制作其他形式的媒体。

音频对于人工智能系统来说是很困难的，尤其是音乐，因为软件必须学会在几分钟内产生连贯的模式，并且有足够的创造力来产生朗朗上口或令人愉悦的声音。

“以 44.1 kHz（这是音乐录音的标准质量）采样的几分钟的典型音乐曲目由数百万个时间步组成，”Meta 团队解释道。也就是说，音频生成模型必须输出大量数据才能构建人类友好的曲目。

“相比之下，像 Llama 和 Llama 2 这样基于文本的生成模型所输入的文本被处理为子词，每个样本仅代表几千个时间步。”

这家 Facebook 巨头设想人们使用 AudioCraft 来尝试制作计算机生成的声音，而无需学习演奏任何乐器。该工具包由三个模型组成：MusicGen、AudioGen 和 EnCodec。

MusicGen 接受了 20,000 小时的录音训练，这些录音由 Meta 拥有或授权，并附有相应的文本描述。 AudioGen 更专注于生成声音效果而不是音乐，并接受公共数据的训练。最后，EnCodec 被描述为一种有损神经编解码器，可以高保真度地压缩和解压缩音频信号。

Meta 表示它是 AudioCraft 的“开源”，而且在某种程度上也是如此。创建和训练模型以及运行推理所需的软件可根据开源 MIT 许可证获得。该代码可用于免费（如自由和免费啤酒）和商业应用以及研究项目。

也就是说，模型权重不是开源的。它们是在专门禁止商业用途的知识共享许可下共享的。正如我们看到的骆驼2，每当 Meta 谈论开源内容时，请检查精美的印刷品.

MusicGen 和 AudioGen 在给定输入文本提示的情况下生成声音。您可以在 Meta 的 AudioCraft 上听到根据“风吹着口哨”和“带有朗朗上口的旋律、热带打击乐和欢快的节奏的流行舞曲，非常适合海滩”的描述而创作的短片登陆页面，在这里.

简短的音效很现实，但我们认为类似音乐的音效并不是很好。它们听起来像是重复的、通用的歌曲，用于糟糕的音乐或电梯歌曲，而不是热门单曲。

Meta 的研究人员表示 AudioGen – 已描述在这里深入 – 通过将原始音频转换为一系列标记，并通过将它们转换回高保真音频来重建输入来进行训练。语言模型将输入文本提示的片段映射到音频标记，以学习单词和声音之间的相关性。音乐创使用类似的过程对音乐样本而不是声音效果进行训练。

“不要把这项工作当作一个无法穿透的黑匣子，而是要公开我们如何开发这些模型，并确保它们易于人们使用——无论是研究人员还是整个音乐界——帮助人们理解这些模型可以做什么做，了解他们不能做什么，并有权实际使用它们，”Meta 团队辩称。

“未来，生成式人工智能可以帮助人们在早期原型设计和灰盒阶段更快地获得反馈，从而极大地缩短迭代时间——无论他们是为虚拟世界构建世界的大型开发人员，还是音乐家（业余、专业或否则）正在创作下一个作品，或者是希望提升创意资产水平的中小型企业主。”

您可以获取 AudioCraft 代码相关信息，并用 MusicGen 进行实验相关信息并尝试一下。 ®

SEO 支持的内容和 PR 分发。今天得到放大。
PlatoData.Network 垂直生成人工智能。赋予自己力量。访问这里。
柏拉图爱流。 Web3 智能。知识放大。访问这里。
柏拉图ESG。汽车/电动汽车，碳，清洁科技, 能源，环境，太阳能，废物管理。访问这里。
块偏移量。现代化环境抵消所有权。访问这里。
Sumber: https://go.theregister.com/feed/www.theregister.com/2023/08/02/meta_audiocraft_release/

时间戳记： 2023 年 8 月 2 日

人工智能模型可以武器化，自行破解网站

源群集：

源节点： 1948541

时间戳记： 2024 年 2 月 17 日

人工智能时代——大型模型需要更好的数据库选择

源群集：

源节点： 1955148

时间戳记： 2024 年 3 月 8 日

SETI：人工智能卫星、机器人如何帮助寻找其他星球上的生命

源群集：

源节点： 1810810

时间戳记： 2023 年 3 月 7 日

埃隆·马斯克的 xAI 是什么？我们在这个 Kettle 播客中讨论

源群集：

源节点： 1861284

时间戳记： 2023 年 7 月 12 日

Anthropic 推出最新的人工智能聊天机器人 Claude 2.1

源群集：

源节点： 1916123

时间戳记： 2023 年 11 月 21 日

在网络下水道 4chan 的帖子上训练的人工智能聊天机器人表现不佳——就像人类成员柏拉图区块链数据智能一样。垂直搜索。人工智能。

受过网络下水道 4chan 帖子训练的 AI 聊天机器人表现不佳——就像人类成员一样

源群集：

源节点： 1578407

时间戳记： 2022 年 6 月 9 日

前难民寻求对人工智能提出的法律论点进行新的审判

源群集：

源节点： 1902881

时间戳记： 2023 年 10 月 17 日

拜登总统签署解决人工智能安全问题的行政命令

源群集：

源节点： 1907783

时间戳记： 2023 年 10 月 30 日

Meta推出支持商业用途的Llama 2模型

源群集：

源节点： 1862216

时间戳记： 2023 年 7 月 18 日

得克萨斯大学教授因怀疑人工智能而隐瞒成绩

源群集：

源节点： 1837063

时间戳记： 2023 年 5 月 17 日

CISA 和 NCSC 牵头努力提高人工智能安全标准

源群集：

源节点： 1918415

时间戳记： 2023 年 11 月 27 日

开源许可证需要不断发展以应对人工智能

源群集：

源节点： 1851346

时间戳记： 2023 年 6 月 23 日

Meta 发布用于制作音乐和声音的生成式人工智能

由柏拉图重新发布

更多来自注册

SETI：人工智能卫星、机器人如何帮助寻找其他星球上的生命

埃隆·马斯克的 xAI 是什么？我们在这个 Kettle 播客中讨论

Anthropic 推出最新的人工智能聊天机器人 Claude 2.1

受过网络下水道 4chan 帖子训练的 AI 聊天机器人表现不佳——就像人类成员一样

前难民寻求对人工智能提出的法律论点进行新的审判

Meta推出支持商业用途的Llama 2模型

得克萨斯大学教授因怀疑人工智能而隐瞒成绩

CISA 和 NCSC 牵头努力提高人工智能安全标准

开源许可证需要不断发展以应对人工智能

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理

更多来自 注册

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理

更多来自注册