Creați sunet pentru conținut în mai multe limbi cu aceeași persoană vocală TTS în Amazon Polly PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Creați sunet pentru conținut în mai multe limbi cu aceeași persoană vocală TTS în Amazon Polly

Amazon Polly este un serviciu de vârf bazat pe cloud care convertește textul în vorbire reală. După adoptarea Neural Text-to-Speech (NTTS), ne-am extins continuu portofoliul de voci disponibile pentru a oferi o selecție largă de vorbitori distincti în limbile acceptate. Astăzi, suntem încântați să anunțăm patru noi adăugări: Pedro vorbește spaniola americană, Daniel vorbește germană, Liam vorbește franceza canadiană și Arthur vorbește engleza britanică. Ca și în cazul tuturor vocilor Neurale din portofoliul nostru, aceste voci oferă o pronunție fluentă, nativă, în limbile țintă. Cu toate acestea, ceea ce este unic la aceste patru voci este că toate se bazează pe aceeași persoană vocală.

Pedro, Daniel, Liam și Arthur au fost modelați după o voce existentă a lui Matthew, engleză americană. În timp ce clienții continuă să-l aprecieze pe Matthew pentru naturalețea și calitatea sa profesională, vocea a servit până acum exclusiv traficului vorbitor de limba engleză. Acum, folosind metode de învățare profundă, am decuplat limba și identitatea vorbitorului, ceea ce ne-a permis să păstrăm fluența nativă în multe limbi, fără a fi nevoie să obținem date multilingve de la același vorbitor. În practică, aceasta înseamnă că am transferat caracteristicile vocale ale vocii din engleza americană Matthew în spaniolă americană, germană, franceză canadiană și engleză britanică, deschizând noi oportunități pentru clienții Amazon Polly.

Având o voce similară disponibilă în cinci locații, deblochează un mare potențial pentru creșterea afacerii. În primul rând, clienții cu amprentă globală pot crea o experiență de utilizator consistentă în diferite limbi și regiuni. De exemplu, un sistem de răspuns vocal interactiv (IVR) care acceptă mai multe limbi poate servi acum diferite segmente de clienți fără a schimba simțul mărcii. Același lucru este valabil și pentru toate celelalte cazuri de utilizare TTS, cum ar fi exprimarea articolelor de știri, materiale educaționale sau podcasturi.

În al doilea rând, vocile sunt potrivite pentru clienții Amazon Polly care caută o pronunție nativă a frazelor străine în oricare dintre cele cinci limbi acceptate.

În al treilea rând, lansarea lui Pedro, Daniel, Liam și Arthur servește clienților noștri cărora le place Amazon Polly NTTS în spaniolă americană, germană, franceză canadiană și engleză britanică, dar caută o voce masculină de înaltă calitate - pot folosi aceste voci pentru a crea sunet. pentru conținut monolingv și așteptați-vă la o calitate superioară, care este la egalitate cu alte voci NTTS în aceste limbi.

În cele din urmă, tehnologia pe care am dezvoltat-o ​​pentru a crea noile voci masculine NTTS poate fi de asemenea folosită Brand Voices. Datorită acestui fapt, clienții Brand Voice se pot bucura nu numai de o voce NTTS unică, adaptată mărcii lor, dar și să păstreze o experiență consecventă în timp ce servesc un public internațional.

Exemplu de caz de utilizare

Să explorăm un exemplu de caz de utilizare pentru a demonstra ce înseamnă acest lucru în practică. Clienții Amazon Polly familiarizați cu Matthew pot folosi în continuare această voce în mod obișnuit, alegând Matei pe consola Amazon Polly și introducând orice text pe care doresc să-l audă vorbit în engleza americană. În următorul scenariu, generăm mostre audio pentru un sistem IVR („Pentru engleză, vă rugăm să apăsați unul”):

Datorită acestei versiuni, acum puteți extinde cazul de utilizare pentru a oferi o experiență audio consistentă în diferite limbi. Toate noile voci sună natural și păstrează un accent nativ.

  • Pentru a genera un discurs în engleza britanică, alegeți Arthur („Pentru engleză, vă rugăm să apăsați unul”):
  • Pentru a folosi un vorbitor de spaniolă din SUA, alegeți Pedro („Para español, por favor marque dos”):
  • Daniel oferă asistență în limba germană („Für Deutsch drücken Sie bitte die Drei”):
  • Puteți sintetiza text în franceză canadiană alegând Liam („Pour le français, veuillez appuyer sur le quatre”):

Rețineți că, în afară de a vorbi cu un accent diferit, vocea Arthur engleză britanică va localiza textul introdus diferit de vocea Matthew engleză din SUA. De exemplu, „1/2/22” va fi citit de Arthur ca „1 februarie 2022”, în timp ce Matthew îl va citi ca „2 ianuarie 2022”.

Acum să combinăm aceste solicitări:

Concluzie

Pedro, Daniel, Liam și Arthur sunt disponibile numai ca voci Neural TTS, așa că pentru a vă bucura de ele, trebuie să utilizați motorul Neural într-una dintre Regiunile AWS care acceptă NTTS. Acestea sunt de înaltă calitate voci monolingve în limbile lor țintă. Faptul că personajele lor sunt consecvente în diferite limbi este un beneficiu suplimentar, care sperăm că va încânta clienții care lucrează cu conținut în mai multe limbi. Pentru mai multe detalii, consultați lista noastră completă de Amazon Polly voci text-to-speech , Prețuri Neural TTS, limitele serviciului, și Întrebări frecvente, și vizitați-ne pagina de prețuri.


Despre Autori

Creați sunet pentru conținut în mai multe limbi cu aceeași persoană vocală TTS în Amazon Polly PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Patryk Wainaina este un inginer lingvistic care lucrează la text-to-speech pentru engleză, germană și spaniolă. Cu o experiență în procesarea vorbirii și a limbajului, interesele sale sunt în învățarea automată, așa cum este aplicată soluțiilor front-end TTS, în special în setările cu resurse reduse. În timpul liber, îi place să asculte muzică electronică și să învețe limbi noi.

Creați sunet pentru conținut în mai multe limbi cu aceeași persoană vocală TTS în Amazon Polly PlatoBlockchain Data Intelligence. Căutare verticală. Ai.Marta Smolarek este Senior Program Manager în echipa Amazon Text-to-Speech, unde se concentrează pe cazul de utilizare Contact Center TTS. Ea definește inițiativele Go-to-Market, folosește feedbackul clienților pentru a construi foaia de parcurs al produsului și coordonează lansările vocale TTS. În afara serviciului, îi place să meargă în camping cu familia ei.

Timestamp-ul:

Mai mult de la Învățare automată AWS