在 Amazon Polly PlatoBlockchain Data Intelligence 中使用相同的 TTS 语音角色为多种语言的内容创建音频。 垂直搜索。 哎。

在 Amazon Polly 中为具有相同 TTS 语音角色的多语言内容创建音频

亚马逊波莉 是一项领先的基于云的服务,可将文本转换为逼真的语音。 在采用神经文本转语音 (NTTS) 之后,我们不断扩展我们可用语音的组合,以便以支持的语言提供多种不同的说话者。 今天,我们很高兴地宣布四个新成员:佩德罗说美国西班牙语,丹尼尔说德语,利亚姆说加拿大法语,亚瑟说英国英语。 与我们产品组合中的所有神经语音一样,这些语音以目标语言提供流利的母语发音。 然而,这四种声音的独特之处在于它们都基于相同的声音角色。

Pedro、Daniel、Liam 和 Arthur 以现有的美国英语 Matthew 声音为蓝本。 虽然客户继续欣赏 Matthew 的自然和专业的音质,但该声音迄今为止仅服务于讲英语的流量。 现在,使用深度学习方法,我们将语言和说话者身份解耦,这使我们能够在多种语言中保持类似母语的流利度,而无需从同一说话者那里获取多语言数据。 在实践中,这意味着我们将美国英语 Matthew 语音的声音特征转换为美国西班牙语、德语、加拿大法语和英国英语,为 Amazon Polly 客户开辟了新的机会。

在五个地区提供类似的声音可以释放巨大的业务增长潜力。 首先,具有全球足迹的客户可以跨语言和地区创建一致的用户体验。 例如,支持多种语言的交互式语音响应 (IVR) 系统现在可以服务于不同的客户群,而不会改变品牌的感觉。 所有其他 TTS 用例也是如此,例如为新闻文章、教育材料或播客配音。

其次,语音非常适合 Amazon Polly 客户,他们正在寻找五种支持语言中任何一种的外语短语的本地发音。

第三,发布 Pedro、Daniel、Liam 和 Arthur 为我们的客户提供服务,这些客户喜欢美国西班牙语、德语、加拿大法语和英国英语的 Amazon Polly NTTS,但正在寻找高质量的男性声音——他们可以使用这些声音来创建音频对于单语内容,并期望与这些语言中的其他 NTTS 语音相媲美的顶级质量。

最后,我们开发的用于创建新的男性 NTTS 声音的技术也可用于 品牌之声. 得益于此,Brand Voice 客户不仅可以享受为其品牌量身定制的独特 NTTS 语音,还可以在为国际观众服务的同时保持一致的体验。

示例用例

让我们探索一个示例用例来演示这在实践中意味着什么。 熟悉 Matthew 的 Amazon Polly 客户仍然可以通过选择以通常的方式使用此语音 马修 在 Amazon Polly 控制台上输入他们希望听到的任何美国英语文本。 在以下场景中,我们为 IVR 系统生成音频样本(“对于英语,请按一个”):

由于此版本,您现在可以扩展用例以提供不同语言的一致音频体验。 所有新的声音听起来都很自然,并保持了类似母语的口音。

  • 要生成英式英语语音,请选择 Arthur(“对于英语,请按一个”):
  • 要使用美国西班牙语使用者,请选择 Pedro(“Para español, por赞成 marque dos”):
  • Daniel 提供德语支持(“Für Deutsch drücken Sie bitte die Drei”):
  • 您可以通过选择 Liam(“Pour le français, veuillez appuyer sur le quatre”)来合成加拿大法语的文本:

请注意,除了口音不同之外,英国英语 Arthur 语音对输入文本的本地化方式与美国英语 Matthew 语音不同。 例如,亚瑟将“1/2/22”读作“1 年 2022 月 2 日”,而马修将其读作“2022 年 XNUMX 月 XNUMX 日”。

现在让我们结合这些提示:

结论

Pedro、Daniel、Liam 和 Arthur 仅可作为神经 TTS 语音使用,因此为了享受它们,您需要在其中一个中使用神经引擎 支持NTTS的AWS区域. 这些都是高质量的 单语声音 在他们的目标语言中。 他们的角色在不同语言之间是一致的这一事实是一个额外的好处,我们希望这将使使用多种语言的内容的客户感到高兴。 有关更多详细信息,请查看我们的 Amazon Polly 完整列表 文字转语音 , 神经 TTS 定价, 服务限制常见问题,并访问我们的 定价页面.


作者简介

在 Amazon Polly PlatoBlockchain Data Intelligence 中使用相同的 TTS 语音角色为多种语言的内容创建音频。 垂直搜索。 哎。帕特里克·怀奈纳 是一名语言工程师,致力于英语、德语和西班牙语的文本到语音转换。 他拥有语音和语言处理方面的背景,他的兴趣在于将机器学习应用于 TTS 前端解决方案,尤其是在资源匮乏的环境中。 在空闲时间,他喜欢听电子音乐和学习新语言。

在 Amazon Polly PlatoBlockchain Data Intelligence 中使用相同的 TTS 语音角色为多种语言的内容创建音频。 垂直搜索。 哎。玛塔·斯莫拉雷克 是 Amazon Text-to-Speech 团队的高级项目经理,专注于联络中心 TTS 用例。 她定义了进入市场的计划,使用客户反馈来构建产品路线图并协调 TTS 语音发布。 工作之余,她喜欢和家人一起去露营。

时间戳记:

更多来自 AWS机器学习