Opret lyd til indhold på flere sprog med den samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Opret lyd til indhold på flere sprog med den samme TTS-stemmepersona i Amazon Polly

Amazon Polly er en førende cloud-baseret tjeneste, der konverterer tekst til naturtro tale. Efter indførelsen af ​​Neural Text-to-Speech (NTTS) har vi løbende udvidet vores portefølje af tilgængelige stemmer for at kunne tilbyde et bredt udvalg af forskellige talere på understøttede sprog. I dag er vi glade for at kunne annoncere fire nye tilføjelser: Pedro taler amerikansk spansk, Daniel taler tysk, Liam taler canadisk fransk, og Arthur taler britisk engelsk. Som med alle de neurale stemmer i vores portefølje tilbyder disse stemmer flydende, indfødte udtale på deres målsprog. Det unikke ved disse fire stemmer er dog, at de alle er baseret på den samme stemmepersona.

Pedro, Daniel, Liam og Arthur blev modelleret efter en eksisterende amerikansk engelsk Matthew-stemme. Mens kunderne fortsat sætter pris på Matthew for hans naturlighed og professionelt klingende kvalitet, har stemmen hidtil udelukkende tjent engelsktalende trafik. Nu, ved hjælp af dyb-læringsmetoder, afkoblede vi sprog og talerens identitet, hvilket gjorde det muligt for os at bevare indfødt-lignende flydende sprog på tværs af mange sprog uden at skulle indhente flersprogede data fra den samme taler. I praksis betyder det, at vi har overført vokalegenskaberne af den amerikansk engelske Matthew-stemme til amerikansk spansk, tysk, canadisk fransk og britisk engelsk, hvilket åbner nye muligheder for Amazon Polly-kunder.

At have en stemme med lignende lyd tilgængelig i fem lokaliteter åbner op for et stort potentiale for virksomhedsvækst. Først og fremmest kan kunder med et globalt fodaftryk skabe en ensartet brugeroplevelse på tværs af sprog og regioner. For eksempel kan et interaktivt stemmesvar (IVR), der understøtter flere sprog, nu betjene forskellige kundesegmenter uden at ændre mærkets fornemmelse. Det samme gælder for alle andre TTS-brugssager, såsom stemmeafgivelse af nyhedsartikler, undervisningsmateriale eller podcasts.

For det andet passer stemmerne godt til Amazon Polly-kunder, der leder efter en indfødt udtale af fremmede sætninger på et af de fem understøttede sprog.

For det tredje betjener frigivelsen af ​​Pedro, Daniel, Liam og Arthur vores kunder, der kan lide Amazon Polly NTTS på amerikansk spansk, tysk, canadisk fransk og britisk engelsk, men som leder efter en maskulin stemme af høj kvalitet – de kan bruge disse stemmer til at skabe lyd for etsproget indhold og forventer topkvalitet, der er på niveau med andre NTTS-stemmer på disse sprog.

Endelig kan teknologien vi har udviklet til at skabe de nye mandlige NTTS-stemmer også bruges til Brand Stemmer. Takket være dette kan Brand Voice-kunder ikke kun nyde en unik NTTS-stemme, der er skræddersyet til deres brand, men også bevare en ensartet oplevelse, mens de betjener et internationalt publikum.

Eksempel på use case

Lad os udforske et eksempel på use case for at demonstrere, hvad dette betyder i praksis. Amazon Polly-kunder, der kender Matthew, kan stadig bruge denne stemme på den sædvanlige måde ved at vælge Matthew på Amazon Polly-konsollen og indtaste enhver tekst, de ønsker at høre talt på amerikansk engelsk. I følgende scenarie genererer vi lydprøver til et IVR-system ("For engelsk, tryk venligst på en"):

Takket være denne udgivelse kan du nu udvide use casen til at levere en ensartet lydoplevelse på forskellige sprog. Alle de nye stemmer lyder naturligt og bevarer en native-lignende accent.

  • For at generere tale på britisk engelsk skal du vælge Arthur ("For engelsk, tryk på en"):
  • For at bruge en amerikansk spansktalende skal du vælge Pedro ("Para español, por favor marque dos"):
  • Daniel tilbyder support på tysk ("Für Deutsch drücken Sie bitte die Drei"):
  • Du kan syntetisere tekst på canadisk fransk ved at vælge Liam ("Pour le français, veuillez appuyer sur le quatre"):

Bemærk, at bortset fra at tale med en anden accent, vil den engelske Arthur-stemme lokalisere inputteksten anderledes end den amerikansk engelske Matthew-stemme. For eksempel vil "1/2/22" blive læst af Arthur som "den 1. februar 2022", mens Matthew vil læse det som "2. januar 2022."

Lad os nu kombinere disse prompter:

Konklusion

Pedro, Daniel, Liam og Arthur er kun tilgængelige som neurale TTS-stemmer, så for at nyde dem skal du bruge den neurale motor i en af AWS-regioner, der understøtter NTTS. Disse er af høj kvalitet ensprogede stemmer på deres målsprog. Det faktum, at deres personas er ensartede på tværs af sprog, er en yderligere fordel, som vi håber vil glæde kunder, der arbejder med indhold på flere sprog. For flere detaljer, se vores fulde liste over Amazon Polly tekst-til-tale stemmer , Neural TTS-prissætning, servicegrænserog Ofte Stillede Spørgsmål, og besøg vores pris side.


Om forfatterne

Opret lyd til indhold på flere sprog med den samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Patryk Wainaina er en sprogingeniør, der arbejder med tekst-til-tale til engelsk, tysk og spansk. Med en baggrund i tale- og sprogbehandling ligger hans interesser i maskinlæring som anvendt på TTS frontend-løsninger, især i lav-ressource indstillinger. I sin fritid nyder han at lytte til elektronisk musik og lære nye sprog.

Opret lyd til indhold på flere sprog med den samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Marta Smolarek er Senior Program Manager i Amazon Text-to-Speech-teamet, hvor hun er fokuseret på Contact Center TTS use case. Hun definerer Go-to-Market-initiativer, bruger kundefeedback til at opbygge produktkøreplanen og koordinerer TTS-stemmelanceringer. Uden for arbejdet elsker hun at tage på camping med sin familie.

Tidsstempel:

Mere fra AWS maskinindlæring