Amazon Polly est une texte pour parler service qui utilise des technologies avancées d'apprentissage en profondeur pour synthétiser la parole humaine au son naturel. Il est utilisé dans une variété de cas d'utilisation, tels que les systèmes de centre de contact, offrant des expériences utilisateur conversationnelles avec des voix de type humain pour la vérification automatisée de l'état en temps réel, les demandes de compte et de facturation automatisées, et par des agences de presse comme The Washington Post. pour permettre aux lecteurs d'écouter les articles de presse.
À ce jour, Amazon Polly fournit plus de 60 voix dans plus de 30 variantes linguistiques. Amazon Polly utilise également le contexte pour prononcer certains mots différemment en fonction du temps du verbe et d'autres informations contextuelles. Par exemple, "lire" dans "je lis un livre" (au présent) et "je vais lire un livre" (au futur) se prononce différemment.
Cependant, dans certaines situations, vous souhaiterez peut-être personnaliser la façon dont Amazon Polly prononce un mot. Par exemple, vous devrez peut-être faire correspondre la prononciation avec le dialecte local ou la langue vernaculaire. Les noms de choses (par exemple, Tomate peut être prononcé comme Tom-ah-à or tom-ay-à), les personnes, les rues ou les lieux sont souvent prononcés de différentes manières.
Dans cet article, nous montrons comment vous pouvez tirer parti des lexiques pour créer des prononciations personnalisées. Vous pouvez appliquer des lexiques pour des cas d'utilisation tels que l'édition, l'éducation ou les centres d'appels.
Personnaliser la prononciation à l'aide de la balise SSML
Supposons que vous diffusiez un podcast populaire d'Australie et que vous utilisiez la voix Amazon Polly Australian English (Olivia) pour convertir votre script en un discours de type humain. Dans l'un de vos scripts, vous souhaitez utiliser des mots inconnus de la voix d'Amazon Polly. Par exemple, vous souhaitez envoyer des vœux Mātariki (Nouvel An Māori) à vos auditeurs néo-zélandais. Pour de tels scénarios, Amazon Polly prend en charge la prononciation phonétique, que vous pouvez utiliser pour obtenir une prononciation proche de la prononciation correcte dans la langue étrangère.
Vous pouvez utiliser le Langage de balisage de synthèse vocale (SMSML) pour suggérer une prononciation phonétique dans l'attribut ph. Laissez-moi vous montrer comment vous pouvez utiliser Balise SSML.
Tout d'abord, connectez-vous à votre Console AWS et recherchez Amazon Polly dans la barre de recherche en haut. Sélectionnez Amazon Polly, puis choisissez le bouton Essayer Polly.
Dans la console Amazon Polly, sélectionnez Anglais australien dans la liste déroulante des langues et saisissez le texte suivant dans la zone de texte d'entrée, puis cliquez sur Écouter pour tester la prononciation.
Je vous souhaite à tous un très joyeux Mātariki.
Exemple de discours sans appliquer la prononciation phonétique :
Si vous entendez l'exemple de discours ci-dessus, vous remarquerez que la prononciation de Matariki - un mot qui ne fait pas partie de l'anglais australien - n'est pas tout à fait juste. Voyons maintenant comment, dans de tels scénarios, nous pouvons utiliser la prononciation phonétique en utilisant Balise SSML pour personnaliser le discours produit par Amazon Polly.
Pour utiliser les balises SSML, activez l'option SSML dans la console Amazon Polly. Ensuite, copiez et collez le script SSML suivant contenant la prononciation phonétique pour Matariki spécifié à l'intérieur de l'attribut ph du étiqueter.
Avec la étiqueter, Amazon Polly utilise la prononciation spécifiée par l'attribut ph au lieu de la prononciation standard associée par défaut à la langue utilisée par la voix sélectionnée.
Exemple de discours après application de la prononciation phonétique :
Si vous entendez le son de l'échantillon, vous remarquerez que nous avons opté pour une prononciation différente pour certaines voyelles (par exemple, ā) pour qu'Amazon Polly synthétise les sons les plus proches de la prononciation correcte. Maintenant, vous pourriez avoir une question, comment puis-je générer la transcription phonétique "mA:.tA:.ri.ki » pour le mot Matariki?
Vous pouvez créer des transcriptions phonétiques en vous référant au Tables de phonèmes et de visèmes pour les langues prises en charge. Dans l'exemple ci-dessus, nous avons utilisé le phonèmes pour l'anglais australien.
Amazon Polly offre une prise en charge dans deux alphabets phonétiques : IPA et X-Sampa. L'avantage de X-Sampa est qu'il s'agit de caractères ASCII standard, il est donc plus facile de taper la transcription phonétique avec un clavier normal. Vous pouvez utiliser IPA ou X-Sampa pour générer vos transcriptions, mais assurez-vous de rester cohérent avec votre choix, en particulier lorsque vous utilisez un fichier de lexique que nous aborderons dans la section suivante.
Chaque phonème de la table des phonèmes représente un son de la parole. Les lettres en gras dans le "Exemple" colonne du tableau Phonème/Visème dans la page en anglais australien liée ci-dessus représentent la partie du mot à laquelle correspond le « phonème ». Par exemple, le phonème /j/ représente le son qu'un anglophone australien émet lorsqu'il prononce la lettre « y » dans « oui ».
Personnaliser la prononciation à l'aide de lexiques
Les balises de phonème conviennent à des situations ponctuelles pour personnaliser des cas isolés, mais elles ne sont pas évolutives. Si vous traitez un énorme volume de texte, géré par différents éditeurs et réviseurs, nous vous recommandons d'utiliser des lexiques. À l'aide de lexiques, vous pouvez obtenir une cohérence dans l'ajout de prononciations personnalisées et simultanément réduire l'effort manuel d'insertion de balises de phonème dans le script.
Une bonne pratique consiste à tester la prononciation personnalisée sur la console Amazon Polly à l'aide de la tag, vous créez une bibliothèque de prononciations personnalisées à l'aide lexiques. Une fois le fichier de lexiques téléchargé, Amazon Polly appliquera automatiquement les prononciations phonétiques spécifiées dans le fichier de lexiques et éliminera le besoin de fournir manuellement un étiqueter.
Créer un fichier de lexique
Un fichier de lexique contient la correspondance entre les mots et leurs prononciations phonétiques. Spécification du lexique de prononciation (PLS) est une recommandation du W3C pour spécifier des informations de prononciation interopérables. Voici un exemple de document PLS :
Assurez-vous que vous utilisez la valeur correcte pour le xml:lang
champ. Utilisation en-AU
si vous chargez le fichier de lexique à utiliser avec la voix Amazon Polly Australian English. Pour une liste complète des langues prises en charge, reportez-vous à Langues prises en charge par Amazon Polly.
Pour spécifier une prononciation personnalisée, vous devez ajouter un élément qui est un conteneur pour une entrée lexicale avec un ou plusieurs <grapheme>
élément et une ou plusieurs informations de prononciation fournies à l'intérieur <phoneme>
.
La <grapheme>
l'élément contient le texte décrivant le orthographe des élément. Vous pouvez utiliser un <grapheme>
pour spécifier le mot dont vous souhaitez personnaliser la prononciation. Vous pouvez ajouter plusieurs <grapheme>
éléments pour spécifier toutes les variantes de mots, par exemple avec ou sans macrons. Le <grapheme>
L'élément est sensible à la casse et, lors de la synthèse vocale, la chaîne Amazon Polly correspond aux mots de votre script que vous convertissez en parole. Si une correspondance est trouvée, il utilise le élément, qui décrit comment le se prononce pour générer une transcription phonétique.
Vous pouvez également utiliser <alias>
pour les abréviations couramment utilisées. Dans l'exemple précédent d'un fichier de lexique, NZ est utilisé comme alias pour New Zealand. Cela signifie que chaque fois qu'Amazon Polly rencontre "NZ" (avec la casse correspondante) dans le corps du texte, il lira ces deux lettres comme "Nouvelle-Zélande".
Pour plus d'informations sur le format de fichier lexique, voir Spécification du lexique de prononciation (PLS) Version 1.0 sur le site Web du W3C.
Vous pouvez enregistrer un fichier de lexique au format .pls ou .xml avant de le télécharger sur Amazon Polly.
Téléchargez et appliquez le fichier de lexique
Téléchargez votre fichier de lexique sur Amazon Polly en suivant les instructions suivantes :
- Sur la console Amazon Polly, choisissez Lexiques dans le volet de navigation.
- Selectionnez Télécharger le lexique.
- Saisissez un nom pour le lexique, puis choisissez un fichier lexique.
- Choisissez le fichier à télécharger.
- Selectionnez Télécharger le lexique.
Si un lexique portant le même nom (que ce soit un fichier .pls ou .xml) existe déjà, le téléchargement du lexique écrase le lexique existant.
Vous pouvez maintenant appliquer le lexique pour personnaliser la prononciation.
- Selectionnez Text-to-Speech dans le volet de navigation.
- Développer vous paramètres supplémentaires.
- allumer Personnaliser la prononciation.
- Choisissez le lexique dans le menu déroulant.
Vous pouvez aussi choisir Télécharger le lexique pour télécharger un nouveau fichier de lexique (ou une nouvelle version).
C'est une bonne pratique de contrôler la version du fichier de lexique dans un référentiel de code source. Le fait de conserver les prononciations personnalisées dans un fichier de lexique garantit que vous pouvez vous référer de manière cohérente aux prononciations phonétiques de certains mots dans l'ensemble de l'organisation. Gardez également à l'esprit les limites du lexique de prononciation mentionnées sur Quotas dans Amazon Polly .
Testez la prononciation après avoir appliqué le lexique
Effectuons un test rapide en utilisant "Wishing all my listeners in NZ, a very Happy Mātariki" comme texte d'entrée.
Nous pouvons comparer les fichiers audio avant et après l'application du lexique.
Avant d'appliquer le lexique :
Après application du lexique :
Conclusion
Dans cet article, nous avons expliqué comment personnaliser les prononciations d'acronymes ou de mots couramment utilisés qui ne se trouvent pas dans la langue sélectionnée dans Amazon Polly. Vous pouvez utiliser Balise SSML idéale pour insérer des personnalisations ponctuelles ou à des fins de test. Nous vous recommandons d'utiliser Lexicon pour créer un ensemble cohérent de prononciations pour les mots fréquemment utilisés dans votre organisation. Cela permet à vos rédacteurs de contenu de passer du temps à écrire au lieu de la tâche fastidieuse d'ajouter des prononciations phonétiques dans le script de manière répétitive. Vous pouvez essayer cela dans votre compte AWS sur la console Amazon Polly.
Résumé des ressources
À propos des auteurs
Ratan Kumar est un architecte de solutions basé à Auckland, en Nouvelle-Zélande. Il travaille avec de grandes entreprises clientes en les aidant à concevoir et à créer des applications Internet sécurisées, rentables et fiables à l'aide du cloud AWS. Il est passionné par la technologie et aime partager ses connaissances à travers des articles de blog et des sessions de twitch.
Maciek Tegi est concepteur audio principal et chef de produit pour Polly Brand Voices. Il a travaillé à titre professionnel dans l'industrie technologique, les films, les publicités et la localisation de jeux. En 2013, il a été le premier ingénieur du son embauché dans l'équipe Alexa Text-To-Speech. Maciek a participé à la sortie de 12 voix Alexa TTS dans différents pays, de plus de 20 voix Polly et de 4 voix de célébrités Alexa. Maciek est un triathlète et un joueur de guitare acoustique passionné.
- "
- 100
- 116
- Qui sommes-nous
- Compte
- atteindre
- à travers
- Avancée
- Alexa
- Tous
- déjà
- Amazon
- applications
- Application
- acoustique
- Australie
- auto
- Automatisation
- AWS
- before
- profiter
- facturation
- BLOG
- Blogue
- corps
- frontière
- Box
- brand
- construire
- Appelez-nous
- Compétences
- cas
- Célébrité
- certaines
- Selectionnez
- plus
- le cloud
- code
- Colonne
- Console
- contact
- Contenant
- contient
- contenu
- des bactéries
- rentable
- d'exportation
- couverture
- engendrent
- La création
- Customiser
- Clients
- livrer
- démontrer
- Conception
- Développeur
- différent
- pendant
- Éducation
- effort
- éléments
- éliminé
- ingénieur
- Anglais
- Entrer
- Entreprise
- notamment
- exemple
- existant
- Expériences
- Prénom
- Abonnement
- étranger
- le format
- trouvé
- avenir
- jeu
- générer
- Bien
- l'
- heureux vous
- aider
- Comment
- HTTPS
- majeur
- humain
- industrie
- d'information
- contribution
- Internet
- interopérable
- impliqué
- IT
- en gardant
- spécialisées
- langue
- Langues
- gros
- apprentissage
- Levier
- Bibliothèque
- Liste
- locales
- FAIT DU
- gérés
- manager
- Manuel
- manuellement
- cartographie
- Match
- assorti
- veux dire
- mentionné
- pourrait
- l'esprit
- PLUS
- Films
- plusieurs
- noms
- Navigation
- Nouvel An
- New Zealand
- nouvelles
- Ordinaire
- Offres Speciales
- Option
- organisation
- Autre
- partie
- passionné
- Personnes
- joueur
- Podcast
- Populaire
- Poteaux
- pratique
- représentent
- Directeur
- processus
- Produit
- Produit
- professionels
- fournir
- fournit
- Édition
- des fins
- question
- Rapide
- lecteurs
- en temps réel
- recommander
- réduire
- fiable
- dépôt
- représentent
- représente
- évolutive
- Escaliers intérieurs
- Rechercher
- sécurisé
- choisi
- service
- brainstorming
- set
- partage
- So
- solide
- Solutions
- quelques
- code source
- Speaker
- spécification
- passer
- Standard
- Statut
- rester
- courant
- Support
- Appareils
- Les soutiens
- Système
- équipe
- technologie
- industrie technologique
- Les technologies
- Technologie
- tester
- Essais
- Washington Post
- Avec
- fiable
- aujourd'hui
- top
- Twitch
- utilisé
- Plus-value
- variété
- version
- Voix
- VOIX
- le volume
- W3
- Washington
- Site Web
- que
- Wikipédia
- sans
- des mots
- travaillé
- vos contrats
- écriture
- XML
- an