Crie áudio para conteúdo em vários idiomas com a mesma persona de voz TTS no Amazon Polly PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Crie áudio para conteúdo em vários idiomas com a mesma persona de voz TTS no Amazon Polly

Amazon Polly é um serviço líder baseado em nuvem que converte texto em fala realista. Após a adoção do Neural Text-to-Speech (NTTS), expandimos continuamente nosso portfólio de vozes disponíveis para fornecer uma ampla seleção de falantes distintos nos idiomas suportados. Hoje, temos o prazer de anunciar quatro novas adições: Pedro falando espanhol americano, Daniel falando alemão, Liam falando francês canadense e Arthur falando inglês britânico. Assim como todas as vozes neurais em nosso portfólio, essas vozes oferecem pronúncia fluente e nativa em seus idiomas de destino. No entanto, o que é único nessas quatro vozes é que todas são baseadas na mesma persona de voz.

Pedro, Daniel, Liam e Arthur foram modelados a partir de uma voz já existente do inglês americano Matthew. Embora os clientes continuem a apreciar Matthew por sua naturalidade e qualidade de som profissional, a voz até agora atendeu exclusivamente ao tráfego de língua inglesa. Agora, usando métodos de aprendizado profundo, separamos o idioma e a identidade do falante, o que nos permitiu preservar a fluência nativa em muitos idiomas sem precisar obter dados multilíngues do mesmo falante. Na prática, isso significa que transferimos as características vocais da voz do inglês americano Matthew para o espanhol americano, alemão, francês canadense e inglês britânico, abrindo novas oportunidades para os clientes do Amazon Polly.

Ter uma voz com som semelhante disponível em cinco localidades abre um grande potencial para o crescimento dos negócios. Em primeiro lugar, os clientes com presença global podem criar uma experiência de usuário consistente em todos os idiomas e regiões. Por exemplo, um sistema de resposta de voz interativa (IVR) que suporta vários idiomas agora pode atender a diferentes segmentos de clientes sem alterar a sensação da marca. O mesmo vale para todos os outros casos de uso de TTS, como dar voz a artigos de notícias, materiais educativos ou podcasts.

Em segundo lugar, as vozes são adequadas para clientes do Amazon Polly que procuram uma pronúncia nativa de frases estrangeiras em qualquer um dos cinco idiomas suportados.

Em terceiro lugar, o lançamento de Pedro, Daniel, Liam e Arthur atende nossos clientes que gostam do Amazon Polly NTTS em espanhol dos EUA, alemão, francês canadense e inglês britânico, mas estão procurando uma voz masculina de alta qualidade - eles podem usar essas vozes para criar áudio para conteúdo monolíngue e espere qualidade superior que está no mesmo nível de outras vozes NTTS nesses idiomas.

Por fim, a tecnologia que desenvolvemos para criar as novas vozes masculinas NTTS também pode ser usada para Vozes da marca. Graças a isso, os clientes do Brand Voice podem não apenas desfrutar de uma voz NTTS exclusiva e adaptada à sua marca, mas também manter uma experiência consistente ao atender um público internacional.

Caso de uso de exemplo

Vamos explorar um exemplo de caso de uso para demonstrar o que isso significa na prática. Os clientes do Amazon Polly familiarizados com Matthew ainda podem usar essa voz da maneira usual, escolhendo Mateus no console do Amazon Polly e inserindo qualquer texto que eles desejam ouvir falado em inglês dos EUA. No cenário a seguir, geramos amostras de áudio para um sistema IVR (“Para inglês, pressione um”):

Graças a esta versão, agora você pode expandir o caso de uso para oferecer uma experiência de áudio consistente em diferentes idiomas. Todas as novas vozes soam naturais e mantêm um sotaque nativo.

  • Para gerar fala em inglês britânico, escolha Arthur (“Para inglês, pressione um”):
  • Para usar um falante de espanhol americano, escolha Pedro (“Para español, por favor marque dos”):
  • Daniel oferece suporte em alemão (“Für Deutsch drücken Sie bitte die Drei”):
  • Você pode sintetizar texto em francês canadense escolhendo Liam (“Pour le français, veuillez appuyer sur le quatre”):

Observe que, além de falar com um sotaque diferente, a voz de Arthur em inglês do Reino Unido localizará o texto de entrada de maneira diferente da voz de Matthew em inglês dos EUA. Por exemplo, “1/2/22” será lido por Arthur como “1º de fevereiro de 2022”, enquanto Matthew o lerá como “2 de janeiro de 2022”.

Agora vamos combinar esses prompts:

Conclusão

Pedro, Daniel, Liam e Arthur estão disponíveis apenas como vozes Neural TTS, portanto, para apreciá-los, você precisa usar o mecanismo Neural em um dos Regiões AWS com suporte para NTTS. Estes são de alta qualidade vozes monolíngues em suas línguas-alvo. O fato de suas personas serem consistentes em vários idiomas é um benefício adicional, que esperamos encantar os clientes que trabalham com conteúdo em vários idiomas. Para obter mais detalhes, consulte nossa lista completa de Amazon Polly vozes text-to-speech , Preços do TTS neural, limites de serviço e Perguntas Frequentes: , e visite nosso página de preços.


Sobre os autores

Crie áudio para conteúdo em vários idiomas com a mesma persona de voz TTS no Amazon Polly PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Patrick Wainaina é um engenheiro de idiomas que trabalha com conversão de texto em fala para inglês, alemão e espanhol. Com experiência em processamento de fala e linguagem, seus interesses estão no aprendizado de máquina aplicado a soluções de front-end TTS, principalmente em configurações de poucos recursos. Em seu tempo livre, gosta de ouvir música eletrônica e aprender novos idiomas.

Crie áudio para conteúdo em vários idiomas com a mesma persona de voz TTS no Amazon Polly PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Marta Smolarek é gerente de programa sênior na equipe de conversão de texto em fala da Amazon, onde está focada no caso de uso do Contact Center TTS. Ela define as iniciativas de Go-to-Market, usa o feedback do cliente para construir o roteiro do produto e coordena os lançamentos de voz do TTS. Fora do trabalho, ela adora ir acampar com a família.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS