eMagazines 如何利用 Amazon Polly 为学龄儿童 PlatoBlockchain Data Intelligence 配音文章。 垂直搜索。 哎。

eMagazines 如何利用 Amazon Polly 为学龄儿童发声文章

这是 ReadAlong.ai 的母公司 eMagazines 的首席执行官兼创始人 Andrew Degenholtz 的客座帖子。 eMagazines 的技术将印刷产品无缝转换为优质的数字和音频体验。 利用亚马逊技术,ReadAlong.ai 为出版商提供了一种简单的交钥匙方式,只需一行代码即可将音频添加到他们的网站。

电子杂志 支持出版商跨数字平台向读者提供高质量的新闻内容。 我们的 ReadAlong.ai 品牌允许我们的客户通过在传统的文本优先出版格式中添加音频来加深与读者的联系。 2020 年 XNUMX 月,我们帮助 TIME for Kids 推出了面向学龄儿童的热门杂志的数字版本。 当大流行迫使学校关闭并且家庭需要高质量的教育工具来补充课堂学习材料时,这种高级订阅产品帮助他们的用户过渡到数字化。

在这篇文章中,我们分享了我们如何为 TIME for Kids 创建一种自动化方式,通过 ReadAlong.ai 为早期读者和预读者无缝添加音频,它使用 亚马逊波莉 技术。

为什么 TIME for Kids 决定开始为他们的文章创建音频旁白?

添加带有自动滚动和突出显示文本的音频支持预读者和仍在学习阅读的学生。 边听边读有助于词汇发展和阅读理解,同时提供口头和书面形式的新词更有可能被学习。 一个 来自国家幼儿发展、教学和学习中心的报告 指出发育中的大脑甚至在学习说话之前就需要听到语言,甚至婴儿的大脑在他们说出第一句话之前几个月就已经准备好说话。 不仅如此,该报告还透露,听故事朗读有助于扩大进入年轻词汇和理解领域的单词的数量和种类。 Scholastic 专家报告 被阅读还可以帮助早期读者“专注于不间断地阅读单词的声音,并提供流利阅读的模型”,并指出音频等资源可以帮助儿童学习如何倾听,这是学习阅读的先决条件。

我们解决的业务挑战是什么?

TIME for Kids 最初通过聘请配音演员录制他们的故事来解决预读者的可访问性问题。 他们的音频播放按钮的早期迭代使用 HTML 音频播放器,没有速度变化或滚动页面或突出显示文本的选项。 这种体验既昂贵又耗时,而且用户体验也没有达到应有的吸引力。 TIME for Kids 甚至无法查看有关游戏或完成率的基本数据。

为什么选择 Amazon Polly?

我们之所以选择 Amazon Polly,是因为它的 API 和 Web 服务支持我们实现流程自动化和让客户更轻松的目标。

Amazon Polly 的神经网络 文字转语音 合成在句子上下文中表达单词的工作做得最好,并且语音质量的一致性允许文章渲染的自动化。

此外,Amazon Polly 提供响应式 API 和强大的 SSML 支持. 这为需要更多控制来改变变形的情况提供支持,并且在文本包含具有挑战性的名称(人、品牌、公司)或单词和短语替换(以特定方式读出缩写词或首字母缩略词)的情况下提供支持。

Amazon Polly还支持 语言符号,这对于突出显示当前正在读出的文本至关重要。

对于 TIME for Kids,Kevin 的声音显然是赢家。 TIME for Kids 喜欢 Kevin 声音的平易近人的声音——他们想要一个听起来像孩子的声音,以帮助建立与年轻读者的联系感。 聆听使用 Kevin 语音的 TIME for Kids 文章示例.

技术挑战

TIME for Kids 需要为其网站提供教育音频解决方案。 它需要是一种高度自动化且摩擦力极低的一次性设置。 该解决方案还需要处理每天动态添加的新文章。 当用户收听音频时,页面需要随着文本滚动并突出显示当前正在大声朗读的句子。

我们面临的部分挑战是可靠地以编程方式确定应该大声朗读哪些内容。 在典型的发布环境中,音频播放器需要阅读文章标题和内容,但要避免阅读页眉和页脚文本、导航栏以及某些类型的广告或标题。 我们的页面分析解决方案结合了正负查询选择器。 对于每个配置,由一组具有相同结构和布局的文章定义, http://readalong.ai 解决方案支持一组允许列表选择器和一组拒绝列表选择器,它们一起捕获用于合成语音的适当内容。

此外,TIME for Kids 网站带来了许多技术挑战,因为有些页面仅供付费订阅者使用,而有些则对公众开放。 TIME for Kids 提供四个年级特定版本、教材、课程指南和每个问题的每周虚拟学习计划,以及工作表和测验。 因此,每篇文章都有针对不同阅读水平的英语和西班牙语的多个版本——有些文章在两种语言中都有多达七种不同的阅读水平。

我们的方案

我们创建了一个简单的插入式脚本,允许 TIME for Kids 只在他们想要提供音频的任何页面的标题中添加一行代码。 该脚本自动化了从页面内容交付到音频合成再到网页集成的所有内容。 自学年开始以来,我们已将 Kevin 和 Lupe 的声音(分别用于英语和西班牙语内容)添加到关于 timeforkids.com。

我们的解决方案允许自动内容交付和音频合成,这意味着每次添加新页面时都无需登录仪表板、FTP、Dropbox 或以其他方式将新文章内容发送到 ReadAlong.ai。 这 用户友好的解决方案后端 还允许 TIME for Kids 轻松进行单词替换,包括全局规则,为基于上下文的发音和难懂的名称、品牌或首字母缩略词提供音频合成器引擎词典提示。

除了定位和设置启动器和播放器的样式以匹配 TIME for Kids 网站设计之外,作为定制的一部分,我们还添加了在文章被大声朗读时突出显示和滚动文本的功能,这是支持儿童参与的另一个有用工具学习识别单词并将它们与声音联系起来。 我们将此功能定制为可见但不会分散注意力,因此音频和视觉元素可以协同工作以帮助年轻读者。 为了支持这一增强功能,我们实现了 详细的单词和句子级元数据 在 Amazon Polly 中可用,以提供流畅的突出显示体验,帮助读者在遇到新单词和概念时跟进。 这允许收听者在他们查看浏览器上突出显示的内容时识别他们所听到的内容。

我们还为 Amazon Polly Kevin 和 Lupe 语音创建了一个默认值,从 速度较慢,因此默认步速为 9 倍,而不是 1 倍,这是帮助早期读者和预读者更好地访问内容的另一种方式。 听众可以将默认语音速度降低到 75 倍或提高到 1.5 倍,以适应更多的阅读水平。

为客户带来的商业利益

在他们的网站上安装了我们的产品后,TIME for Kids 能够以可扩展的方式表达他们的内容。 他们以两种不同的语言(英语和西班牙语)和七种不同的阅读水平逐篇提供内容。

他们现在还能够轻松地实时收集和分析数据,包括播放率和完成率,并查看最受欢迎的文章以及音频参与度最高的文章。

我们现在知道,55% 的点击收听文章的孩子完成了 100% 的文章,66% 的收听文章的孩子完成了一半以上的文章。 这些显着的完成率增强了收益,并确认听众对技术感到满意并且声音是相关的。 ReadAlong.ai 音频还帮助 TIME for Kids 推广其高级辅助功能,包括具有西班牙语翻译和朗读功能的关键文章,因为音频的存在与其他好处一起在每篇文章的预览中突出显示(例如西班牙语翻译)。

TIME for Kids 课程总监 Stacy Bien 对解决方案和参与数据印象深刻,他说:

“这真是一件美丽的事情。 该解决方案将帮助许多早期读者发展他们的阅读技能并轻松阅读更多内容。 对我们来说,我们已经看到了参与度的巨大提升。 再加上易用性和成本效益,这使它成为一个灌篮高手。”

结论

随读随读 使用 Amazon Polly 帮助 TIME for Kids 简化了将高质量音频配音内容添加到其高级订阅产品的过程。 我们的解决方案使客户能够显着提高产品时间、精度和成本。 例如,画外音艺术家通常会花费 1 小时或更长时间来录制文章、编辑音频并掌握最终的音频输出。 现在,一旦将 ReadAlong.ai 脚本添加到站点,当创建新文章时,内容会自动处理,而画外音艺术家、音频编辑器或管理员无需花费任何时间。 音频可以准确地阅读文章,很少需要调整,从而为时间和成本节省了宝贵且不可估量的成本。

收集到的 KPI 告诉我们,这不仅成为 TIME for Kids 团队管理音频功能的一种简单方法,而且最终用户(处于阅读能力发展初期的孩子)将该功能用作他们的另一个工具阅读路径。


关于作者

eMagazines 如何利用 Amazon Polly 为学龄儿童 PlatoBlockchain Data Intelligence 配音文章。 垂直搜索。 哎。安德鲁·德根霍尔茨 是 eMagazines 的 CEO 和创始人 随读随读,并且是他于 1999 年创立的 ValueMags 的总裁。Degenholtz 拥有西北大学的市场营销硕士学位和穆伦伯格学院的学士学位。 此前,他是经审计媒体联盟数字版工作组的成员,该工作组旨在开发获取数字杂志订户的最佳实践。

时间戳记:

更多来自 AWS机器学习