Skapa ljud för innehåll på flera språk med samma TTS-röstpersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Skapa ljud för innehåll på flera språk med samma TTS-röstpersona i Amazon Polly

Amazon Polly är en ledande molnbaserad tjänst som omvandlar text till verklighetstroget tal. Efter antagandet av Neural Text-to-Speech (NTTS) har vi kontinuerligt utökat vår portfölj av tillgängliga röster för att kunna erbjuda ett brett urval av distinkta talare på språk som stöds. Idag är vi glada att kunna presentera fyra nya tillägg: Pedro talar amerikansk spanska, Daniel talar tyska, Liam talar kanadensisk franska och Arthur talar brittisk engelska. Som med alla neurala röster i vår portfölj erbjuder dessa röster ett flytande, inhemskt uttal på sina målspråk. Det unika med dessa fyra röster är dock att de alla är baserade på samma röstpersona.

Pedro, Daniel, Liam och Arthur var modellerade på en befintlig amerikansk engelsk Matthew-röst. Medan kunderna fortsätter att uppskatta Matthew för hans naturlighet och professionellt klingande kvalitet, har rösten hittills uteslutande tjänat engelsktalande trafik. Nu, med hjälp av metoder för djupinlärning, frikopplade vi språk och talaridentitet, vilket gjorde det möjligt för oss att bevara flytande som modersmål över många språk utan att behöva erhålla flerspråkig information från samma talare. I praktiken betyder det att vi överförde de sångegenskaper hos den amerikanska engelska Matthew-rösten till amerikansk spanska, tyska, kanadensiska franska och brittisk engelska, vilket öppnade nya möjligheter för Amazon Polly-kunder.

Att ha en liknande röst tillgänglig på fem platser öppnar upp stor potential för affärstillväxt. Först och främst kan kunder med ett globalt fotavtryck skapa en konsekvent användarupplevelse över språk och regioner. Till exempel kan ett interaktivt röstsvarssystem (IVR) som stöder flera språk nu betjäna olika kundsegment utan att ändra känslan av varumärket. Detsamma gäller för alla andra TTS-användningsfall, som t.ex. röstande nyhetsartiklar, utbildningsmaterial eller poddsändningar.

För det andra passar rösterna bra för Amazon Polly-kunder som letar efter ett inhemskt uttal av främmande fraser på något av de fem språk som stöds.

För det tredje, att släppa Pedro, Daniel, Liam och Arthur betjänar våra kunder som gillar Amazon Polly NTTS på amerikansk spanska, tyska, kanadensiska franska och brittisk engelska men letar efter en maskulin röst av hög kvalitet – de kan använda dessa röster för att skapa ljud för enspråkigt innehåll och förvänta dig toppkvalitet som är i nivå med andra NTTS-röster på dessa språk.

Slutligen kan tekniken vi har utvecklat för att skapa de nya manliga NTTS-rösterna också användas för Märkesröster. Tack vare detta kan Brand Voice-kunder inte bara njuta av en unik NTTS-röst som är skräddarsydd för deras varumärke, utan också behålla en konsekvent upplevelse samtidigt som de betjänar en internationell publik.

Exempel på användningsfall

Låt oss utforska ett exempel på användningsfall för att visa vad detta betyder i praktiken. Amazon Polly-kunder som är bekanta med Matthew kan fortfarande använda den här rösten på vanligt sätt genom att välja Matthew på Amazon Polly-konsolen och ange vilken text de vill höra talad på amerikansk engelska. I följande scenario genererar vi ljudprover för ett IVR-system ("För engelska, vänligen tryck ett"):

Tack vare den här utgåvan kan du nu utöka användningsfallet för att leverera en konsekvent ljudupplevelse på olika språk. Alla nya röster låter naturligt och har en infödd accent.

  • För att generera tal på brittisk engelska, välj Arthur ("För engelska, vänligen tryck en"):
  • För att använda en amerikansk spansktalande, välj Pedro ("Para español, por favor marque dos"):
  • Daniel erbjuder support på tyska ("Für Deutsch drücken Sie bitte die Drei"):
  • Du kan syntetisera text på kanadensisk franska genom att välja Liam ("Pour le français, veuillez appuyer sur le quatre"):

Observera att förutom att tala med en annan accent, kommer den brittiska engelska Arthur-rösten att lokalisera inmatningstexten annorlunda än den amerikanska engelska Matthew-rösten. Till exempel kommer "1/2/22" att läsas av Arthur som "den 1:a februari 2022", medan Matthew kommer att läsa det som "2 januari 2022."

Låt oss nu kombinera dessa uppmaningar:

Slutsats

Pedro, Daniel, Liam och Arthur är endast tillgängliga som Neural TTS-röster, så för att kunna njuta av dem måste du använda Neural-motorn i en av AWS-regioner som stöder NTTS. Dessa är av hög kvalitet enspråkiga röster på sina målspråk. Det faktum att deras personligheter är konsekventa på olika språk är en ytterligare fördel, som vi hoppas kommer att glädja kunder som arbetar med innehåll på flera språk. För mer information, se vår fullständiga lista över Amazon Polly text-till-tal-röster , Neural TTS-prissättning, servicegränseroch Vanliga frågoroch besök vår prissida.


Om författarna

Skapa ljud för innehåll på flera språk med samma TTS-röstpersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Patryk Wainaina är en språkingenjör som arbetar med text-till-tal för engelska, tyska och spanska. Med en bakgrund inom tal- och språkbehandling ligger hans intressen i maskininlärning som tillämpas på TTS front-end-lösningar, särskilt i låga resurser. På fritiden tycker han om att lyssna på elektronisk musik och lära sig nya språk.

Skapa ljud för innehåll på flera språk med samma TTS-röstpersona i Amazon Polly PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.Märta Smolarek är Senior Program Manager i Amazon Text-to-Speech-teamet, där hon är fokuserad på Contact Center TTS-användningsfallet. Hon definierar Go-to-Market-initiativ, använder kundfeedback för att bygga produktfärdplanen och koordinerar TTS röstlanseringar. Utanför jobbet älskar hon att campa med sin familj.

Tidsstämpel:

Mer från AWS maskininlärning