人工智能被用来生成一切 图片 至 文本 至 人工蛋白质,现在列表中又增加了一个东西:演讲。 上周研究人员从 微软发表论文 在一个名为 VALL-E 的新人工智能上,它可以根据仅三秒长的样本准确模拟任何人的声音。 VALL-E 并不是第一个创建的语音模拟器,但它的构建方式与其前身不同,并且可能会带来更大的潜在误用风险。
大多数现有的文本转语音模型使用波形(声波随时间在介质中移动时的图形表示)来创建假声音,调整音调或音高等特征以近似给定的声音。 不过,VALL-E 采集了某人的声音样本并将其分解为称为令牌的组件,然后使用这些令牌根据它已经了解的关于该声音的“规则”创建新的声音。 如果一个声音特别低沉,或者一个说话者以鼻音的方式发出他们的 A,或者他们比平均水平更单调,这些都是 AI 可以拾取并能够复制的特征。
该模型基于一种称为 Meta编码解码器,它刚刚在 10 月的这一部分发布。 该工具使用三部分系统将音频压缩到比 MP3 小 XNUMX 倍,而不会降低质量; 它的创造者希望它的用途之一是提高通过低带宽连接进行的通话中的语音和音乐质量。
为了训练 VALL-E,它的创造者使用了一个名为 图书馆之光,其 60,000 小时的英语演讲主要由有声读物旁白组成。 当合成的声音与训练库中的一种声音(其中有超过 7,000 种,所以这应该不会太高)相似时,该模型会产生最佳结果。
除了重现某人的声音,VALL-E 还模拟了三秒样本中的音频环境。 通过电话录制的剪辑听起来与亲自录制的不同,如果您在走路或开车时说话,这些场景的独特声学效果会被考虑在内。
一些 样本 听起来相当逼真,而其他人仍然非常明显是计算机生成的。 但是声音之间存在明显的差异。 您可以看出它们是基于具有不同说话风格、音高和语调模式的人。
创建 VALL-E 的团队知道它很容易被坏人利用; 从伪造政客或名人的声音片段到使用熟悉的声音通过电话索要金钱或信息,有无数种方法可以利用这项技术。 他们明智地避免公开 VALL-E 的代码,并在论文末尾附上一份道德声明(这对阻止任何想将 AI 用于邪恶目的的人没有太大作用)。
类似工具的出现和落入坏人之手可能只是时间问题。 研究人员建议,可以通过构建检测模型来衡量音频片段是真实的还是合成的,来减轻像 VALL-E 这样的模型所带来的风险。 如果我们需要 AI 来保护我们免受 AI 的侵害,那么如何知道这些技术是否产生了净积极影响? 时间会证明一切。
图片来源: Shutterstock.com/cha茶
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://singularityhub.com/2023/01/12/microsofts-new-ai-can-clone-your-voice-in-just-3-seconds/
- 000
- 10
- 7
- a
- Able
- 关于
- 账号管理
- 准确
- 添加
- 优点
- AI
- 所有类型
- 已经
- 和
- 另一个
- 任何人
- 音频
- 可使用
- 坏
- 基于
- before
- 作为
- 最佳
- 之间
- 休息
- 建筑物
- 建
- 被称为
- 呼叫
- 携带
- 名人
- 特点
- 剪辑
- 码
- 组件
- 计算机生成的
- 连接
- 可以
- 创建信息图
- 创建
- 创作者
- 信用
- 深
- 检测
- 差异
- 不同
- 向下
- 驾驶
- 容易
- 英语
- 环境
- 伦理
- 一切
- 现有
- 相当
- 假
- 秋季
- 熟悉
- 姓氏:
- 止
- 生成
- GitHub上
- 特定
- 更大的
- 手
- 有
- HOURS
- 创新中心
- HTTPS
- 影响力故事
- 改善
- in
- 包括
- 信息
- IT
- 知道
- 名:
- 知道
- 自学资料库
- 容易
- 清单
- 长
- 离
- 制成
- 制作
- 问题
- 中等
- 模型
- 模型
- 钱
- 更多
- 移动
- 音乐
- 需求
- 净
- 全新
- 十月
- 一
- 秩序
- 其它
- 纸类
- 部分
- 尤其
- 模式
- 员工
- 人
- 电话
- 挑
- 沥青
- 球场
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 政治家
- 积极
- 潜力
- 当下
- 主要
- 保护
- 公然
- 目的
- 质量
- 真实
- 现实
- 记录
- 发布
- 请求
- 研究人员
- 成果
- 风险
- 风险
- 情景
- 秒
- 存在Shutterstock
- 类似
- 模拟器
- 小
- So
- 听起来
- 喇叭
- 发言
- 言语
- 弹簧
- 个人陈述
- 仍
- 系统
- 采取
- 需要
- 说
- 团队
- 技术
- 专业技术
- 文字转语音
- 其
- 事
- 三
- 通过
- 次
- 时
- 至
- 令牌
- TONE
- 也有
- 工具
- 工具
- 培训
- 产品培训
- 调整
- 独特
- us
- 使用
- 音色
- VOICES
- 步行
- 波浪
- 方法
- 周
- 是否
- 这
- 而
- WHO
- 将
- 将
- 错误
- 错误的手
- 产量
- 完全
- 您一站式解决方案
- 和风网