Δημιουργήστε ήχο για περιεχόμενο σε πολλές γλώσσες με την ίδια φωνή TTS στο Amazon Polly PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Δημιουργήστε ήχο για περιεχόμενο σε πολλές γλώσσες με την ίδια φωνή TTS στο Amazon Polly

Amazon Polly είναι μια κορυφαία υπηρεσία που βασίζεται σε σύννεφο που μετατρέπει το κείμενο σε ρεαλιστική ομιλία. Μετά την υιοθέτηση του Neural Text-to-Speech (NTTS), επεκτείνουμε συνεχώς το χαρτοφυλάκιο των διαθέσιμων φωνών, προκειμένου να παρέχουμε μια ευρεία επιλογή διαφορετικών ομιλητών σε υποστηριζόμενες γλώσσες. Σήμερα, είμαστε στην ευχάριστη θέση να ανακοινώσουμε τέσσερις νέες προσθήκες: ο Pedro που μιλάει ισπανικά των ΗΠΑ, ο Daniel μιλά γερμανικά, ο Liam μιλά καναδικά γαλλικά και ο Arthur που μιλά βρετανικά αγγλικά. Όπως συμβαίνει με όλες τις φωνές Neural στο χαρτοφυλάκιό μας, αυτές οι φωνές προσφέρουν άπταιστη, μητρική προφορά στις γλώσσες-στόχους τους. Ωστόσο, αυτό που είναι μοναδικό σε αυτές τις τέσσερις φωνές είναι ότι όλες βασίζονται στην ίδια φωνή.

Ο Πέδρο, ο Ντάνιελ, ο Λίαμ και ο Άρθουρ βασίστηκαν στο πρότυπο μιας υπάρχουσας αγγλικής φωνής του Μάθιου των ΗΠΑ. Ενώ οι πελάτες συνεχίζουν να εκτιμούν τον Matthew για τη φυσικότητα και την ποιότητα του επαγγελματικού του ήχου, η φωνή μέχρι στιγμής εξυπηρετούσε αποκλειστικά την αγγλόφωνη επισκεψιμότητα. Τώρα, χρησιμοποιώντας μεθόδους βαθιάς μάθησης, αποσυνδέσαμε την ταυτότητα της γλώσσας και του ομιλητή, κάτι που μας επέτρεψε να διατηρήσουμε τη μητρική ευχέρεια σε πολλές γλώσσες χωρίς να χρειάζεται να λάβουμε πολύγλωσσα δεδομένα από τον ίδιο ομιλητή. Στην πράξη, αυτό σημαίνει ότι μεταφέραμε τα φωνητικά χαρακτηριστικά της αγγλικής φωνής Matthew των ΗΠΑ στα ισπανικά, γερμανικά, καναδικά γαλλικά και βρετανικά αγγλικά των ΗΠΑ, ανοίγοντας νέες ευκαιρίες για τους πελάτες του Amazon Polly.

Η ύπαρξη μιας παρόμοιας φωνής διαθέσιμης σε πέντε τοπικές ρυθμίσεις ξεκλειδώνει μεγάλες δυνατότητες για επιχειρηματική ανάπτυξη. Πρώτα απ 'όλα, οι πελάτες με παγκόσμιο αποτύπωμα μπορούν να δημιουργήσουν μια συνεπή εμπειρία χρήστη σε διάφορες γλώσσες και περιοχές. Για παράδειγμα, ένα σύστημα διαδραστικής φωνητικής απόκρισης (IVR) που υποστηρίζει πολλές γλώσσες μπορεί πλέον να εξυπηρετεί διαφορετικά τμήματα πελατών χωρίς να αλλάξει την αίσθηση της επωνυμίας. Το ίδιο ισχύει για όλες τις άλλες περιπτώσεις χρήσης TTS, όπως η εκφώνηση άρθρων ειδήσεων, εκπαιδευτικό υλικό ή podcast.

Δεύτερον, οι φωνές είναι κατάλληλες για πελάτες του Amazon Polly που αναζητούν μια εγγενή προφορά ξένων φράσεων σε οποιαδήποτε από τις πέντε υποστηριζόμενες γλώσσες.

Τρίτον, η κυκλοφορία των Pedro, Daniel, Liam και Arthur εξυπηρετεί τους πελάτες μας που τους αρέσει το Amazon Polly NTTS στα Αμερικάνικα Ισπανικά, Γερμανικά, Καναδικά Γαλλικά και Βρετανικά Αγγλικά, αλλά αναζητούν μια αντρική φωνή υψηλής ποιότητας—μπορούν να χρησιμοποιήσουν αυτές τις φωνές για να δημιουργήσουν ήχο για μονόγλωσσο περιεχόμενο και να περιμένετε κορυφαία ποιότητα που είναι εφάμιλλη με άλλες φωνές NTTS σε αυτές τις γλώσσες.

Τέλος, η τεχνολογία που έχουμε αναπτύξει για τη δημιουργία των νέων ανδρικών φωνών NTTS μπορεί επίσης να χρησιμοποιηθεί Φωνές επωνυμίας. Χάρη σε αυτό, οι πελάτες του Brand Voice μπορούν όχι μόνο να απολαμβάνουν μια μοναδική φωνή NTTS που είναι προσαρμοσμένη στην επωνυμία τους, αλλά και να διατηρούν μια συνεπή εμπειρία ενώ εξυπηρετούν ένα διεθνές κοινό.

Παράδειγμα περίπτωσης χρήσης

Ας διερευνήσουμε ένα παράδειγμα χρήσης για να δείξουμε τι σημαίνει αυτό στην πράξη. Οι πελάτες του Amazon Polly που είναι εξοικειωμένοι με τον Matthew μπορούν ακόμα να χρησιμοποιήσουν αυτήν τη φωνή με τον συνηθισμένο τρόπο επιλέγοντας Ματθαίος στην κονσόλα Amazon Polly και πληκτρολογώντας οποιοδήποτε κείμενο θέλουν να ακούσουν στα Αγγλικά των ΗΠΑ. Στο ακόλουθο σενάριο, δημιουργούμε δείγματα ήχου για ένα σύστημα IVR ("Για Αγγλικά, πατήστε ένα"):

Χάρη σε αυτήν την έκδοση, μπορείτε τώρα να επεκτείνετε την περίπτωση χρήσης για να προσφέρετε μια συνεπή εμπειρία ήχου σε διαφορετικές γλώσσες. Όλες οι νέες φωνές έχουν φυσικό ήχο και διατηρούν μια προφορά που μοιάζει με αυτόχθονα.

  • Για να δημιουργήσετε ομιλία στα βρετανικά αγγλικά, επιλέξτε Arthur ("Για Αγγλικά, πατήστε ένα"):
  • Για να χρησιμοποιήσετε ένα ομιλητή ισπανικών ΗΠΑ, επιλέξτε Pedro ("Para español, por favor marque dos"):
  • Ο Daniel προσφέρει υποστήριξη στα γερμανικά (“Für Deutsch drücken Sie bitte die Drei”):
  • Μπορείτε να συνθέσετε κείμενο στα καναδικά γαλλικά επιλέγοντας Liam (“Pour le français, veuillez appuyer sur le quatre”):

Λάβετε υπόψη ότι, εκτός από το να μιλάει με διαφορετική προφορά, η φωνή του Αγγλικού Αρθουρ του Ηνωμένου Βασιλείου θα εντοπίζει το κείμενο εισαγωγής διαφορετικά από τη φωνή των Αγγλικών ΗΠΑ Matthew. Για παράδειγμα, το «1/2/22» θα διαβαστεί από τον Άρθουρ ως «1η Φεβρουαρίου 2022», ενώ ο Μάθιου θα το διαβάσει ως «2 Ιανουαρίου 2022».

Τώρα ας συνδυάσουμε αυτές τις προτροπές:

Συμπέρασμα

Οι Pedro, Daniel, Liam και Arthur είναι διαθέσιμοι μόνο ως φωνές Neural TTS, επομένως για να τις απολαύσετε, πρέπει να χρησιμοποιήσετε τη μηχανή Neural σε ένα από τα Περιφέρειες AWS που υποστηρίζουν NTTS. Αυτά είναι υψηλής ποιότητας μονόγλωσσες φωνές στις γλώσσες-στόχους τους. Το γεγονός ότι τα πρόσωπα τους είναι συνεπή σε όλες τις γλώσσες είναι ένα επιπλέον πλεονέκτημα, το οποίο ελπίζουμε ότι θα ευχαριστήσει τους πελάτες που εργάζονται με περιεχόμενο σε πολλές γλώσσες. Για περισσότερες λεπτομέρειες, ανατρέξτε στην πλήρη λίστα του Amazon Polly φωνές μετατροπής κειμένου σε ομιλία , Τιμολόγηση νευρωνικού TTS, όρια υπηρεσιών, να FAQs, και επισκεφθείτε το δικό μας σελίδα τιμολόγησης.


Σχετικά με τους Συγγραφείς

Δημιουργήστε ήχο για περιεχόμενο σε πολλές γλώσσες με την ίδια φωνή TTS στο Amazon Polly PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Patryk Wainaina είναι Μηχανικός Γλωσσών που εργάζεται στη μετατροπή κειμένου σε ομιλία για Αγγλικά, Γερμανικά και Ισπανικά. Με υπόβαθρο στην επεξεργασία του λόγου και της γλώσσας, τα ενδιαφέροντά του έγκεινται στη μηχανική εκμάθηση όπως εφαρμόζεται στις λύσεις front-end TTS, ιδιαίτερα σε ρυθμίσεις χαμηλών πόρων. Στον ελεύθερο χρόνο του, του αρέσει να ακούει ηλεκτρονική μουσική και να μαθαίνει νέες γλώσσες.

Δημιουργήστε ήχο για περιεχόμενο σε πολλές γλώσσες με την ίδια φωνή TTS στο Amazon Polly PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μάρτα Σμόλαρεκ είναι Ανώτερη Διευθύντρια Προγράμματος στην ομάδα του Amazon Text-to-Speech, όπου επικεντρώνεται στην περίπτωση χρήσης του Contact Center TTS. Καθορίζει πρωτοβουλίες Go-to-Market, χρησιμοποιεί τα σχόλια των πελατών για να δημιουργήσει τον οδικό χάρτη του προϊόντος και συντονίζει τις φωνητικές εκδόσεις TTS. Εκτός δουλειάς, της αρέσει να πηγαίνει για κάμπινγκ με την οικογένειά της.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS