Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe

Εάν εργάζεστε σε μια χώρα με πολλές επίσημες γλώσσες ή σε πολλές περιοχές, τα αρχεία ήχου σας μπορεί να περιέχουν διαφορετικές γλώσσες. Οι συμμετέχοντες μπορεί να μιλούν εντελώς διαφορετικές γλώσσες ή μπορεί να αλλάζουν μεταξύ τους. Σκεφτείτε μια κλήση εξυπηρέτησης πελατών για να αναφέρετε ένα πρόβλημα σε μια περιοχή με σημαντικό πολύγλωσσο πληθυσμό. Αν και η συνομιλία θα μπορούσε να ξεκινήσει σε μία γλώσσα, είναι εφικτό ο πελάτης να αλλάξει σε άλλη γλώσσα για να περιγράψει το πρόβλημα, ανάλογα με το επίπεδο άνεσης ή τις προτιμήσεις χρήσης σε άλλες γλώσσες. Με παρόμοιο τρόπο, ο εκπρόσωπος εξυπηρέτησης πελατών μπορεί να κάνει μετάβαση μεταξύ γλωσσών κατά τη μεταφορά οδηγιών λειτουργίας ή αντιμετώπισης προβλημάτων.

Με τουλάχιστον 3 δευτερόλεπτα ήχου, Μεταγραφή Amazon μπορεί να αναγνωρίσει αυτόματα και να δημιουργήσει αποτελεσματικά μεταγραφές στις γλώσσες που ομιλούνται στον ήχο χωρίς να χρειάζεται ο άνθρωπος να καθορίσει τις γλώσσες. Αυτό ισχύει για διάφορες περιπτώσεις χρήσης, όπως η μεταγραφή κλήσεων πελατών, η μετατροπή φωνητικών μηνυμάτων σε κείμενο, η καταγραφή αλληλεπιδράσεων σε συσκέψεις, η παρακολούθηση των επικοινωνιών του φόρουμ χρηστών ή η παρακολούθηση της παραγωγής περιεχομένου πολυμέσων και των ροών εργασιών τοπικής προσαρμογής.

Αυτή η ανάρτηση περιγράφει τα βήματα για τη μεταγραφή ενός πολυγλωσσικού αρχείου ήχου χρησιμοποιώντας το Amazon Transcribe. Συζητάμε πώς να διαθέσουμε αρχεία ήχου στο Amazon Transcribe και να ενεργοποιήσουμε τη μεταγραφή πολύγλωσσων αρχείων ήχου κατά την κλήση των API του Amazon Transcribe.

Επισκόπηση λύσεων

Το Amazon Transcribe είναι μια υπηρεσία AWS που σας διευκολύνει να μετατρέψετε την ομιλία σε κείμενο. Η προσθήκη λειτουργιών ομιλίας σε κείμενο σε οποιαδήποτε εφαρμογή είναι απλή με τη βοήθεια του Amazon Transcribe, μιας υπηρεσίας αυτόματης αναγνώρισης ομιλίας (ASR). Μπορείτε να εισπράξετε είσοδο ήχου χρησιμοποιώντας το Amazon Transcript, να δημιουργήσετε σαφείς μεταγραφές που είναι εύκολο να διαβαστούν και να ελεγχθούν, να αυξήσετε την ακρίβεια με την προσαρμογή και να φιλτράρετε πληροφορίες για την προστασία του απορρήτου του πελάτη.

Η λύση χρησιμοποιεί επίσης Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3), μια υπηρεσία αποθήκευσης αντικειμένων που έχει σχεδιαστεί για αποθήκευση και ανάκτηση οποιουδήποτε όγκου δεδομένων από οπουδήποτε. Είναι μια απλή υπηρεσία αποθήκευσης που προσφέρει κορυφαία στον κλάδο αντοχή, διαθεσιμότητα, απόδοση, ασφάλεια και ουσιαστικά απεριόριστη επεκτασιμότητα με πολύ χαμηλό κόστος. Όταν αποθηκεύετε δεδομένα στο Amazon S3, εργάζεστε με πόρους γνωστούς ως κουβάδες και αντικειμένων. Ένας κουβάς είναι ένα δοχείο για αντικείμενα. Ένα αντικείμενο είναι ένα αρχείο και κάθε μεταδεδομένο που περιγράφει το αρχείο.

Σε αυτήν την ανάρτηση, σας καθοδηγούμε στα ακόλουθα βήματα για να εφαρμόσετε μια λύση πολυγλωσσικής μεταγραφής ήχου:

  1. Δημιουργήστε έναν κάδο S3.
  2. Ανεβάστε το αρχείο ήχου σας στον κάδο.
  3. Δημιουργήστε την εργασία μεταγραφής.
  4. Ελέγξτε το αποτέλεσμα της εργασίας.

Προϋποθέσεις

Για αυτήν την καθοδήγηση, θα πρέπει να έχετε τις ακόλουθες προϋποθέσεις:

Το Amazon Transcribe παρέχει την επιλογή αποθήκευσης των μεταγραφόμενων αποτελεσμάτων είτε σε έναν κάδο S3 που διαχειρίζεται η υπηρεσία είτε διαχειρίζεται από τον πελάτη. Για αυτήν την ανάρτηση, έχουμε το Amazon Transcribe να γράφει τα αποτελέσματα σε έναν κάδο S3 που διαχειρίζεται η υπηρεσία.

Σημειώστε ότι το Amazon Transcribe είναι μια Τοπική υπηρεσία και τα τελικά σημεία του Amazon Transcribe API που καλούνται πρέπει να βρίσκονται στην ίδια περιοχή με τους κάδους S3.

Δημιουργήστε έναν κάδο S3 για να αποθηκεύσετε τα αρχεία εισόδου ήχου σας

Για να δημιουργήσετε τον κάδο S3, ολοκληρώστε τα παρακάτω βήματα:

  1. Στην κονσόλα Amazon S3, επιλέξτε Δημιουργία κάδου.
  2. Για Όνομα κάδου, εισαγάγετε ένα παγκοσμίως μοναδικό όνομα για τον κάδο.
  3. Για Περιοχή AWS, επιλέξτε την ίδια περιοχή με τα τελικά σημεία του Amazon Transcribe API.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  4. Αφήστε όλες τις προεπιλογές ως έχουν.
  5. Επιλέξτε Δημιουργία κάδου.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Ανεβάστε το αρχείο ήχου σας στον κάδο S3

Ανεβάστε το πολύγλωσσο αρχείο ήχου σας στον κάδο S3 του λογαριασμού σας AWS. Για τους σκοπούς αυτής της άσκησης, χρησιμοποιούμε το παρακάτω δείγμα πολυγλωσσικό αρχείο ήχου. Καταγράφει μια κλήση υποστήριξης πελατών που περιλαμβάνει αγγλικές και ισπανικές γλώσσες.

  1. Στην κονσόλα Amazon S3, επιλέξτε Κουβάδες στο παράθυρο πλοήγησης.
  2. Επιλέξτε τον κάδο που δημιουργήσατε προηγουμένως για την αποθήκευση των αρχείων ήχου εισόδου.
  3. Επιλέξτε Μεταφόρτωση.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  4. Επιλέξτε Προσθήκη αρχείων.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  5. Επιλέξτε το αρχείο ήχου που θέλετε να μεταγράψετε από τον τοπικό σας υπολογιστή.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  6. Επιλέξτε Μεταφόρτωση.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το αρχείο ήχου σας θα είναι σύντομα διαθέσιμο στον κάδο S3.

Δημιουργήστε την εργασία μεταγραφής

Με το αρχείο ήχου που έχει μεταφορτωθεί, δημιουργούμε τώρα μια εργασία μεταγραφής.

  1. Στην κονσόλα Amazon Transcribe, επιλέξτε Εργασίες μεταγραφής στο παράθυρο πλοήγησης.
  2. Επιλέξτε Δημιουργήστε εργασία.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  3. Για Όνομα, πληκτρολογήστε ένα μοναδικό όνομα για την εργασία.
    Αυτό θα είναι επίσης το όνομα του αρχείου μεταγραφής εξόδου.
  4. Για ΡΥΘΜΙΣΕΙΣ ΓΛΩΣΣΑΣ, Επιλέξτε Αυτόματη αναγνώριση πολλαπλών γλωσσών.
    Αυτή η δυνατότητα επιτρέπει στο Amazon Transcribe να αναγνωρίζει και να μεταγράφει αυτόματα όλες τις γλώσσες που ομιλούνται στο αρχείο ήχου.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  5. Για Επιλογές γλώσσας για αυτόματη αναγνώριση γλώσσας, αφήστε το μη επιλεγμένο.
    Το Amazon Transcribe αναγνωρίζει και μεταγράφει αυτόματα όλες τις γλώσσες που μιλούνται στον ήχο. Για να βελτιώσετε την ακρίβεια της μεταγραφής, μπορείτε προαιρετικά να επιλέξετε δύο ή περισσότερες γλώσσες που γνωρίζετε ότι ομιλούνταν στον ήχο.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  6. Για Τύπος μοντέλου, μόνο το Γενικό μοντέλο η επιλογή είναι διαθέσιμη τη στιγμή της σύνταξης αυτής της ανάρτησης.
  7. Για Εισαγωγή δεδομένων, επιλέξτε Αναζήτηση S3.
  8. Επιλέξτε το αρχείο πηγής ήχου που ανεβάσαμε προηγουμένως.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  9. Για Δεδομένα εξόδου, μπορείτε να επιλέξετε είτε Κάδος S3 με διαχείριση υπηρεσιών or Κάδος S3 που καθορίζεται από τον πελάτη. Για αυτήν την ανάρτηση, επιλέξτε Κάδος S3 με διαχείριση υπηρεσιών.
    Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.
  10. Επιλέξτε Επόμενο.
  11. Επιλέξτε Δημιουργήστε εργασία.

Ελέγξτε το αποτέλεσμα της εργασίας

Όταν ολοκληρωθεί η εργασία μεταγραφής, ανοίξτε την εργασία μεταγραφής.
Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Κάντε κύλιση προς τα κάτω στο Προεπισκόπηση μεταγραφής Ενότητα. Η ηχητική μεταγραφή εμφανίζεται στο Κείμενο αυτί. Η μεταγραφή περιλαμβάνει τόσο το αγγλικό όσο και το ισπανικό μέρος της συνομιλίας.
Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Μπορείτε προαιρετικά να κατεβάσετε ένα αντίγραφο της μεταγραφής ως αρχείο JSON, το οποίο θα μπορούσατε να χρησιμοποιήσετε για περαιτέρω αναλυτικά στοιχεία μετά την κλήση.

εκκαθάριση

Για να αποφύγετε μελλοντικές χρεώσεις, αδειάστε και διαγράψτε τον κάδο S3 που δημιουργήσατε για την αποθήκευση του αρχείου πηγής ήχου εισόδου. Βεβαιωθείτε ότι έχετε αποθηκεύσει τα αρχεία αλλού, γιατί αυτό θα αφαιρέσει οριστικά όλα τα αντικείμενα που περιέχονται στον κάδο. Στην κονσόλα Amazon Transcribe, επιλέξτε και διαγράψτε την εργασία που δημιουργήθηκε προηγουμένως για τη μεταγραφή.

Συμπέρασμα

Σε αυτήν την ανάρτηση, δημιουργήσαμε μια ροή εργασίας από άκρο σε άκρο για την αυτοματοποίηση της αναγνώρισης και μεταγραφής πολύγλωσσων αρχείων ήχου, χωρίς να γράψουμε κανέναν κώδικα. Χρησιμοποιήσαμε τη νέα λειτουργία στο Amazon Transcribe για να αναγνωρίζουμε αυτόματα διαφορετικές γλώσσες σε ένα αρχείο ήχου και να μεταγράφουμε σωστά κάθε γλώσσα.

Για περισσότερες πληροφορίες, ανατρέξτε στο Ταυτοποίηση γλώσσας με εργασίες μεταγραφής παρτίδας.


Σχετικά με τους Συγγραφείς

Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Murtuza Bootwala είναι Senior Solutions Architect στο AWS με ενδιαφέρον για τις τεχνολογίες AI/ML. Του αρέσει να συνεργάζεται με πελάτες για να τους βοηθήσει να επιτύχουν τα επιχειρηματικά τους αποτελέσματα. Εκτός δουλειάς, του αρέσουν οι υπαίθριες δραστηριότητες και να περνά χρόνο με την οικογένεια.

Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Βίκτορ Ρότζο είναι παθιασμένος με την AI/ML και την ανάπτυξη λογισμικού. Βοήθησε να τεθεί σε λειτουργία η Amazon Alexa στις ΗΠΑ και το Μεξικό. Έφερε επίσης το Amazon Textract στους AWS Partners και απέκτησε το AWS Contact Center Intelligence (CCI). Αυτή τη στιγμή είναι ο παγκόσμιος ηγέτης τεχνολογίας για Συνεργάτες Τεχνητής Νοημοσύνης για συνομιλία.

Αυτόματη αναγνώριση γλωσσών σε πολύγλωσσο ήχο χρησιμοποιώντας το Amazon Transcribe PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Μπάμπου Σρινιβασάν είναι μια AWS Sr. Specialist SA (Language AI Services) με έδρα το Σικάγο. Επικεντρώνεται στο Amazon Transcribe (από ομιλία σε κείμενο), βοηθώντας τους πελάτες μας να χρησιμοποιούν υπηρεσίες τεχνητής νοημοσύνης για την επίλυση επιχειρηματικών προβλημάτων. Εκτός δουλειάς, του αρέσει η ξυλουργική και η παράσταση μαγικών παραστάσεων.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS