Lag lyd for innhold på flere språk med samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Lag lyd for innhold på flere språk med samme TTS-stemmepersona i Amazon Polly

Amazon Polly er en ledende skybasert tjeneste som konverterer tekst til naturtro tale. Etter innføringen av Neural Text-to-Speech (NTTS), har vi kontinuerlig utvidet vår portefølje av tilgjengelige stemmer for å kunne tilby et bredt utvalg av distinkte høyttalere på støttede språk. I dag er vi glade for å kunngjøre fire nye tillegg: Pedro snakker amerikansk spansk, Daniel snakker tysk, Liam snakker kanadisk fransk, og Arthur snakker britisk engelsk. Som med alle de nevrale stemmene i porteføljen vår, tilbyr disse stemmene flytende, innfødt uttale på målspråkene deres. Det unike med disse fire stemmene er imidlertid at de alle er basert på samme stemmepersona.

Pedro, Daniel, Liam og Arthur ble modellert etter en eksisterende amerikansk engelsk Matthew-stemme. Mens kundene fortsetter å sette pris på Matthew for hans naturlighet og profesjonelt klingende kvalitet, har stemmen så langt utelukkende tjent engelsktalende trafikk. Nå, ved hjelp av dyplæringsmetoder, koblet vi språk og høyttaleridentitet, noe som gjorde at vi kunne bevare flytende morsmål på tvers av mange språk uten å måtte skaffe flerspråklige data fra den samme foredragsholderen. I praksis betyr dette at vi overførte vokalegenskapene til den amerikanske engelske Matthew-stemmen til amerikansk spansk, tysk, kanadisk fransk og britisk engelsk, og åpnet nye muligheter for Amazon Polly-kunder.

Å ha en stemme med lignende lyd tilgjengelig i fem lokaliteter åpner for et stort potensial for forretningsvekst. Først av alt kan kunder med et globalt fotavtrykk skape en konsistent brukeropplevelse på tvers av språk og regioner. For eksempel kan et interaktivt stemmesvar (IVR)-system som støtter flere språk nå betjene ulike kundesegmenter uten å endre følelsen av merkevaren. Det samme gjelder for alle andre TTS-brukstilfeller, som for eksempel å stemme nyhetsartikler, undervisningsmateriell eller podcaster.

For det andre passer stemmene godt for Amazon Polly-kunder som leter etter en innfødt uttale av utenlandske fraser på et av de fem støttede språkene.

For det tredje, frigjøring av Pedro, Daniel, Liam og Arthur betjener våre kunder som liker Amazon Polly NTTS på amerikansk spansk, tysk, kanadisk fransk og britisk engelsk, men som leter etter en maskulin stemme av høy kvalitet – de kan bruke disse stemmene til å lage lyd for enspråklig innhold og forvent topp kvalitet som er på nivå med andre NTTS-stemmer på disse språkene.

Til slutt kan teknologien vi har utviklet for å lage de nye mannlige NTTS-stemmene også brukes til Merkestemmer. Takket være dette kan Brand Voice-kunder ikke bare nyte en unik NTTS-stemme som er skreddersydd for deres merkevare, men også beholde en konsistent opplevelse mens de betjener et internasjonalt publikum.

Eksempel på bruk

La oss utforske et eksempel på bruksområdet for å demonstrere hva dette betyr i praksis. Amazon Polly-kunder som er kjent med Matthew kan fortsatt bruke denne stemmen på vanlig måte ved å velge Matthew på Amazon Polly-konsollen og skrive inn teksten de ønsker å høre på amerikansk engelsk. I følgende scenario genererer vi lydprøver for et IVR-system ("For engelsk, vennligst trykk en"):

Takket være denne utgivelsen kan du nå utvide bruksområdet for å levere en konsistent lydopplevelse på forskjellige språk. Alle de nye stemmene er naturlig klingende og opprettholder en innfødt-lignende aksent.

  • For å generere tale på britisk engelsk, velg Arthur ("For engelsk, vennligst trykk en"):
  • For å bruke en amerikansk spansktalende, velg Pedro ("Para español, por favor marque dos"):
  • Daniel tilbyr støtte på tysk ("Für Deutsch drücken Sie bitte die Drei"):
  • Du kan syntetisere tekst på kanadisk fransk ved å velge Liam ("Pour le français, veuillez appuyer sur le quatre"):

Merk at bortsett fra å snakke med en annen aksent, vil den britiske engelske Arthur-stemmen lokalisere inndatateksten annerledes enn den amerikanske engelske Matthew-stemmen. For eksempel vil "1/2/22" bli lest av Arthur som "den 1. februar 2022", mens Matthew vil lese det som "2. januar 2022."

La oss nå kombinere disse ledetekstene:

konklusjonen

Pedro, Daniel, Liam og Arthur er kun tilgjengelig som nevrale TTS-stemmer, så for å nyte dem må du bruke nevralmotoren i en av AWS-regioner som støtter NTTS. Disse er av høy kvalitet enspråklige stemmer på målspråkene deres. Det faktum at deres personas er konsistente på tvers av språk er en ekstra fordel, som vi håper vil glede kunder som arbeider med innhold på flere språk. For mer informasjon, se vår fullstendige liste over Amazon Polly tekst-til-tale-stemmer , Nevrale TTS-priser, servicegrenserog Spørsmål og svar, og besøk vår pris side.


Om forfatterne

Lag lyd for innhold på flere språk med samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Patryk Wainaina er en språkingeniør som jobber med tekst-til-tale for engelsk, tysk og spansk. Med bakgrunn innen tale- og språkbehandling, ligger hans interesser i maskinlæring som brukt på TTS-front-end-løsninger, spesielt i innstillinger med lite ressurser. På fritiden liker han å høre på elektronisk musikk og lære nye språk.

Lag lyd for innhold på flere språk med samme TTS-stemmepersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Marta Smolarek er senior programleder i Amazons tekst-til-tale-team, hvor hun er fokusert på kontaktsenteret TTS-bruk. Hun definerer Go-to-Market-initiativer, bruker tilbakemeldinger fra kunder for å bygge produktveikartet og koordinerer TTS-talelanseringer. Utenom jobben elsker hun å dra på camping med familien.

Tidstempel:

Mer fra AWS maskinlæring