Создавайте аудио для контента на нескольких языках с одним и тем же голосовым персонажем TTS в Amazon Polly PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Создавайте аудио для контента на нескольких языках с одним и тем же голосовым персонажем TTS в Amazon Polly.

Amazon Polly — ведущий облачный сервис, который преобразует текст в реалистичную речь. После принятия Neural Text-to-Speech (NTTS) мы постоянно расширяли наш портфель доступных голосов, чтобы обеспечить широкий выбор отдельных говорящих на поддерживаемых языках. Сегодня мы рады объявить о четырех новых дополнениях: Педро говорит по-испански в США, Даниэль говорит по-немецки, Лиам говорит по-канадски по-французски, а Артур говорит на британском английском. Как и все голоса Neural в нашем портфолио, эти голоса обеспечивают беглое естественное произношение на целевых языках. Однако уникальность этих четырех голосов заключается в том, что все они основаны на одном и том же голосовом образе.

Педро, Даниэль, Лиам и Артур были смоделированы на основе существующего американского английского голоса Мэтью. В то время как клиенты продолжают ценить Мэтью за его естественность и профессиональное качество звучания, голос до сих пор обслуживал исключительно англоязычный трафик. Теперь, используя методы глубокого обучения, мы отделили язык и личность говорящего, что позволило нам сохранить беглость речи на многих языках без необходимости получать многоязычные данные от одного и того же носителя. На практике это означает, что мы перенесли вокальные характеристики американского английского голоса Мэтью на американский испанский, немецкий, канадский французский и британский английский, открыв новые возможности для клиентов Amazon Polly.

Наличие похожего голоса, доступного в пяти регионах, открывает большой потенциал для роста бизнеса. Прежде всего, клиенты с глобальным присутствием могут создать единый пользовательский интерфейс на разных языках и в разных регионах. Например, система интерактивного голосового ответа (IVR), поддерживающая несколько языков, теперь может обслуживать различные сегменты клиентов, не изменяя при этом ощущения бренда. То же самое касается всех других случаев использования TTS, таких как озвучивание новостных статей, учебных материалов или подкастов.

Во-вторых, голоса хорошо подходят для клиентов Amazon Polly, которые ищут естественное произношение иностранных фраз на любом из пяти поддерживаемых языков.

В-третьих, выпуск Pedro, Daniel, Liam и Arthur предназначен для наших клиентов, которым нравится Amazon Polly NTTS на испанском, немецком, канадском французском и британском английском языках, но которым нужен высококачественный мужской голос — они могут использовать эти голоса для создания аудио. для одноязычного контента и ожидать высочайшего качества, не уступающего другим голосам NTTS на этих языках.

Наконец, технология, которую мы разработали для создания новых мужских голосов NTTS, также может быть использована для Голоса бренда. Благодаря этому клиенты Brand Voice могут не только наслаждаться уникальным голосом NTTS, адаптированным к их бренду, но и поддерживать постоянный опыт обслуживания международной аудитории.

Пример использования

Давайте рассмотрим пример использования, чтобы продемонстрировать, что это означает на практике. Клиенты Amazon Polly, знакомые с Мэтью, по-прежнему могут использовать этот голос обычным способом, выбрав Мэтью на консоли Amazon Polly и ввести любой текст, который они хотят услышать на английском языке США. В следующем сценарии мы генерируем образцы аудио для системы IVR («Для английского языка нажмите один»):

Благодаря этому выпуску теперь вы можете расширить вариант использования, чтобы обеспечить единообразное воспроизведение звука на разных языках. Все новые голоса звучат естественно и сохраняют родной акцент.

  • Чтобы сгенерировать речь на британском английском, выберите Артур («Для английского нажмите один»):
  • Чтобы использовать говорящего на испанском языке в США, выберите Pedro («Para español, por Favor marque dos»):
  • Даниэль предлагает поддержку на немецком языке («Für Deutsch drücken Sie bitte die Drei»):
  • Вы можете синтезировать текст на канадском французском языке, выбрав Liam («Pour le français, veuillez appuyer sur le quatre»):

Обратите внимание, что помимо речи с другим акцентом, голос Артура на английском языке в Великобритании будет локализовать вводимый текст иначе, чем голос Мэтью на английском языке в США. Например, «1» будет прочитано Артуром как «2 февраля 22 года», тогда как Мэтью прочитает это как «1 января 2022 года».

Теперь давайте объединим эти подсказки:

Заключение

Педро, Даниэль, Лиам и Артур доступны только в качестве голосов Neural TTS, поэтому, чтобы насладиться ими, вам нужно использовать Neural engine в одном из голосов. Регионы AWS, поддерживающие NTTS. это высококачественные одноязычные голоса на их целевых языках. Тот факт, что их персонажи одинаковы для разных языков, является дополнительным преимуществом, которое, как мы надеемся, порадует клиентов, работающих с контентом на нескольких языках. Для получения более подробной информации просмотрите наш полный список Amazon Polly речевые голоса , Цены на нейронные TTS, лимиты обслуживанияи Часто задаваемые вопросы, и посетите наш ценах.


Об авторах

Создавайте аудио для контента на нескольких языках с одним и тем же голосовым персонажем TTS в Amazon Polly PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Патрик Вайнайна инженер по языку, работающий над преобразованием текста в речь для английского, немецкого и испанского языков. Имея опыт работы с речью и языковой обработкой, он интересуется машинным обучением применительно к интерфейсным решениям TTS, особенно в условиях ограниченных ресурсов. В свободное время любит слушать электронную музыку и изучать новые языки.

Создавайте аудио для контента на нескольких языках с одним и тем же голосовым персонажем TTS в Amazon Polly PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Марта Смоларек — старший менеджер программы в команде Amazon Text-to-Speech, где она сосредоточена на сценарии использования Contact Center TTS. Она определяет инициативы по выходу на рынок, использует отзывы клиентов для создания дорожной карты продукта и координирует запуск голосовых систем TTS. Помимо работы, она любит ходить в походы со своей семьей.

Отметка времени:

Больше от Машинное обучение AWS