Створюйте аудіо для вмісту кількома мовами за допомогою однакового голосу TTS у Amazon Polly PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Створюйте аудіо для вмісту кількома мовами за допомогою одного голосу TTS в Amazon Polly

Амазонка Поллі є провідним хмарним сервісом, який перетворює текст у реальне мовлення. Після впровадження Neural Text-to-Speech (NTTS) ми постійно розширюємо наше портфоліо доступних голосів, щоб надати широкий вибір різних мовців підтримуваними мовами. Сьогодні ми раді оголосити про чотири нові доповнення: Педро говорить іспанською в США, Деніел – німецькою, Ліам – канадською французькою та Артур – британською англійською. Як і всі нейронні голоси в нашому портфоліо, ці голоси пропонують вільну, рідну вимову на цільових мовах. Однак унікальність цих чотирьох голосів полягає в тому, що всі вони засновані на одному голосі.

Педро, Деніел, Ліам і Артур були створені за зразком існуючого американського англійського голосу Метью. Хоча клієнти продовжують цінувати Метью за його природність і професійну якість звучання, голос поки що обслуговував виключно англомовний трафік. Тепер, використовуючи методи глибокого навчання, ми відокремили мову та ідентичність мовця, що дозволило нам зберегти вільне володіння багатьма мовами, як рідною мовою, без необхідності отримувати багатомовні дані від одного і того ж носія. На практиці це означає, що ми перенесли вокальні характеристики американського англійського голосу Метью на американську іспанську, німецьку, канадську французьку та британську англійську, відкриваючи нові можливості для клієнтів Amazon Polly.

Наявність схожого голосу, доступного в п’яти регіонах, відкриває великий потенціал для зростання бізнесу. Перш за все, клієнти з глобальним присутністю можуть створити послідовний користувацький досвід у різних мовах і регіонах. Наприклад, система інтерактивного голосового реагування (IVR), яка підтримує кілька мов, тепер може обслуговувати різні сегменти клієнтів, не змінюючи відчуття бренду. Те саме стосується всіх інших випадків використання TTS, таких як озвучування статей новин, навчальних матеріалів або подкастів.

По-друге, голоси добре підходять для клієнтів Amazon Polly, які шукають рідну вимову іноземних фраз будь-якою з п’яти підтримуваних мов.

По-третє, випуск Педро, Деніела, Ліама та Артура служить нашим клієнтам, яким подобається Amazon Polly NTTS іспанською, німецькою, канадською, французькою та британською англійською мовами, але вони шукають високоякісний чоловічий голос — вони можуть використовувати ці голоси для створення аудіо для одномовного вмісту та очікуйте найвищої якості, яка є на одному рівні з іншими голосами NTTS на цих мовах.

Нарешті, технологію, яку ми розробили для створення нових чоловічих голосів NTTS, також можна використовувати Голоси бренду. Завдяки цьому клієнти Brand Voice можуть не тільки насолоджуватися унікальним голосом NTTS, який відповідає їхньому бренду, але й зберігати постійний досвід, обслуговуючи міжнародну аудиторію.

Приклад використання

Давайте розглянемо приклад використання, щоб продемонструвати, що це означає на практиці. Клієнти Amazon Polly, знайомі з Matthew, все ще можуть використовувати цей голос у звичайний спосіб, вибираючи Метью на консолі Amazon Polly і вводити будь-який текст, який вони хочуть почути, вимовлений американською англійською. У наступному сценарії ми створюємо зразки аудіо для системи IVR («Для англійської мови, будь ласка, натисніть один»):

Завдяки цьому випуску тепер ви можете розширити варіант використання, щоб забезпечити послідовне аудіо на різних мовах. Усі нові голоси звучать природно та зберігають рідний акцент.

  • Щоб створити мовлення британською англійською, виберіть Артур («Для англійської мови, будь ласка, натисніть один»):
  • Щоб використовувати іспанську мову в США, виберіть Педро ("Para español, por favor marque dos"):
  • Даніель пропонує підтримку німецькою мовою («Für Deutsch drücken Sie bitte die Drei»):
  • Ви можете синтезувати текст канадською французькою мовою, вибравши Ліам (“Pour le français, veuillez appuyer sur le quatre”):

Зауважте, що окрім розмови з іншим акцентом, голос британського англійського Артура локалізує введений текст інакше, ніж голос американського англійського Метью. Наприклад, «1/2/22» Артур читатиме як «1 лютого 2022 року», тоді як Метью читатиме це як «2 січня 2022 року».

Тепер давайте об’єднаємо ці підказки:

Висновок

Педро, Деніел, Ліам і Артур доступні лише як голоси Neural TTS, тому, щоб насолоджуватися ними, вам потрібно використовувати Neural Engine в одному з Регіони AWS, які підтримують NTTS. Ці високоякісні одномовні голоси їхніми цільовими мовами. Той факт, що їхні персони однакові на різних мовах, є додатковою перевагою, яка, ми сподіваємося, порадує клієнтів, які працюють із вмістом кількома мовами. Щоб дізнатися більше, перегляньте наш повний список Amazon Polly голоси для синтезу мовлення , Ціни Neural TTS, ліміти обслуговування та Питання і відповіді, та відвідайте наш цінова сторінка.


Про авторів

Створюйте аудіо для вмісту кількома мовами за допомогою однакового голосу TTS у Amazon Polly PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Патрик Вайнайна є мовним інженером, який працює над синтезом мовлення для англійської, німецької та іспанської мов. Маючи досвід обробки мовлення та мови, його інтереси полягають у машинному навчанні в застосуванні до інтерфейсних рішень TTS, особливо в умовах низьких ресурсів. У вільний час любить слухати електронну музику та вивчати нові мови.

Створюйте аудіо для вмісту кількома мовами за допомогою однакового голосу TTS у Amazon Polly PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Марта Смоларек є старшим менеджером програм у команді Amazon Text-to-Speech, де вона зосереджена на прикладі використання TTS Contact Center. Вона визначає ініціативи виходу на ринок, використовує відгуки клієнтів для створення дорожньої карти продукту та координує голосові запуски TTS. Поза роботою вона любить ходити в похід з родиною.

Часова мітка:

Більше від AWS Машинне навчання