Μεταγραφή Amazon είναι μια πλήρως διαχειριζόμενη υπηρεσία αυτόματης αναγνώρισης ομιλίας (ASR) που σας καθιστά εύκολη την προσθήκη δυνατοτήτων ομιλίας σε κείμενο στις εφαρμογές σας. Σήμερα, είμαστε στην ευχάριστη θέση να ανακοινώσουμε ένα σύστημα βάσης ομιλίας επόμενης γενιάς πολλών δισεκατομμυρίων παραμέτρων που τροφοδοτείται από μοντέλο που επεκτείνει την αυτόματη αναγνώριση ομιλίας σε πάνω από Γλώσσες 100. Σε αυτήν την ανάρτηση, συζητάμε μερικά από τα οφέλη αυτού του συστήματος, πώς το χρησιμοποιούν οι εταιρείες και πώς να ξεκινήσετε. Παρέχουμε επίσης ένα παράδειγμα της εξόδου μεταγραφής παρακάτω.
Το μοντέλο θεμελίωσης ομιλίας του Transcribe εκπαιδεύεται χρησιμοποιώντας τους καλύτερους στην κατηγορία, αυτοεποπτευόμενους αλγόριθμους για την εκμάθηση των εγγενών καθολικών μοτίβων της ανθρώπινης ομιλίας σε όλες τις γλώσσες και τις προφορές. Εκπαιδεύεται σε εκατομμύρια ώρες δεδομένων ήχου χωρίς ετικέτα από περισσότερες από 100 γλώσσες. Οι συνταγές εκπαίδευσης βελτιστοποιούνται μέσω έξυπνης δειγματοληψίας δεδομένων για την εξισορρόπηση των δεδομένων εκπαίδευσης μεταξύ των γλωσσών, διασφαλίζοντας ότι οι παραδοσιακά υποεκπροσωπούμενες γλώσσες φτάνουν επίσης σε υψηλά επίπεδα ακρίβειας.
Η Carbyne είναι μια εταιρεία λογισμικού που αναπτύσσει λύσεις κέντρων επαφής βασισμένες σε σύννεφο, κρίσιμες για την αποστολή για ανταποκριτές κλήσεων έκτακτης ανάγκης. Η αποστολή της Carbyne είναι να βοηθήσει τους ανταποκριτές έκτακτης ανάγκης να σώσουν ζωές και η γλώσσα δεν μπορεί να εμποδίσει τους στόχους τους. Δείτε πώς χρησιμοποιούν το Amazon Transcribe για να επιδιώξουν την αποστολή τους:
«Η Carbyne Live Audio Translation που λειτουργεί με τεχνητή νοημοσύνη στοχεύει άμεσα στη βελτίωση της απόκρισης έκτακτης ανάγκης για τα 68 εκατομμύρια Αμερικανούς που μιλούν άλλη γλώσσα εκτός των αγγλικών στο σπίτι, επιπλέον των έως και 79 εκατομμυρίων ξένων επισκεπτών στη χώρα ετησίως. Αξιοποιώντας το νέο πολύγλωσσο μοντέλο βάσης της Amazon Transcribe που τροφοδοτεί το ASR, η Carbyne θα είναι ακόμα καλύτερα εξοπλισμένη για να εκδημοκρατίσει τις υπηρεσίες έκτακτης ανάγκης που σώζουν ζωές, επειδή το Every. Πρόσωπο. Μετράει."
– Alex Dizengof, Συνιδρυτής και CTO της Carbyne.
Αξιοποιώντας το μοντέλο βάσης ομιλίας, το Amazon Transcribe προσφέρει σημαντική βελτίωση ακρίβειας μεταξύ 20% και 50% στις περισσότερες γλώσσες. Στην τηλεφωνική ομιλία, η οποία είναι ένας τομέας πρόκλησης και με σπάνια δεδομένα, η βελτίωση της ακρίβειας κυμαίνεται μεταξύ 30% και 70%. Εκτός από τη σημαντική βελτίωση της ακρίβειας, αυτό το μεγάλο μοντέλο ASR προσφέρει επίσης βελτιώσεις στην αναγνωσιμότητα με πιο ακριβή σημεία στίξης και κεφαλαία. Με την έλευση της γενετικής τεχνητής νοημοσύνης, χιλιάδες επιχειρήσεις χρησιμοποιούν το Amazon Transcribe για να ξεκλειδώσουν πλούσιες πληροφορίες από το ηχητικό τους περιεχόμενο. Με σημαντικά βελτιωμένη ακρίβεια και υποστήριξη για περισσότερες από 100 γλώσσες, το Amazon Transcribe θα επηρεάσει θετικά όλες αυτές τις περιπτώσεις χρήσης. Όλοι οι υπάρχοντες και οι νέοι πελάτες που χρησιμοποιούν το Amazon Transcribe σε λειτουργία δέσμης μπορούν να έχουν πρόσβαση στην αναγνώριση ομιλίας που υποστηρίζεται από το μοντέλο βάσης ομιλίας χωρίς να χρειάζεται καμία αλλαγή είτε στο τελικό σημείο του API είτε στις παραμέτρους εισαγωγής.
Το νέο σύστημα ASR προσφέρει πολλά βασικά χαρακτηριστικά σε όλες τις 100+ γλώσσες που σχετίζονται με την ευκολία χρήσης, την προσαρμογή, την ασφάλεια του χρήστη και το απόρρητο. Αυτά περιλαμβάνουν λειτουργίες όπως αυτόματη σημεία στίξης, προσαρμοσμένο λεξιλόγιο, αυτόματη αναγνώριση γλώσσας, διάκριση ομιλητή, βαθμολογίες εμπιστοσύνης σε επίπεδο λέξης και προσαρμοσμένο φίλτρο λεξιλογίου. Η εκτεταμένη υποστήριξη του συστήματος για διαφορετικούς τόνους, περιβάλλοντα θορύβου και ακουστικές συνθήκες σάς δίνει τη δυνατότητα να παράγετε πιο ακριβείς εξόδους και έτσι σας βοηθά να ενσωματώσετε αποτελεσματικά τεχνολογίες φωνής στις εφαρμογές σας.
Ενεργοποιημένη από την υψηλή ακρίβεια του Amazon Transcribe σε διαφορετικές προφορές και συνθήκες θορύβου, την υποστήριξή του για μεγάλο αριθμό γλωσσών και το εύρος των συνόλων χαρακτηριστικών προστιθέμενης αξίας, χιλιάδες επιχειρήσεις θα εξουσιοδοτηθούν να ξεκλειδώστε πλούσιες πληροφορίες από το ηχητικό περιεχόμενό τους, καθώς και αυξήστε την προσβασιμότητα και την ανακάλυψη του περιεχομένου ήχου και βίντεο σε διάφορους τομείς. Για παράδειγμα, τα κέντρα επικοινωνίας μεταγράφουν και αναλύουν τις κλήσεις πελατών για να εντοπίσουν πληροφορίες και στη συνέχεια να βελτιώσουν την εμπειρία των πελατών και την παραγωγικότητα των πρακτόρων. Οι παραγωγοί περιεχομένου και οι διανομείς πολυμέσων δημιουργούν αυτόματα υπότιτλους χρησιμοποιώντας το Amazon Transcribe για να βελτιώσουν την προσβασιμότητα του περιεχομένου.
Ξεκινήστε με το Amazon Transcribe
Μπορείτε να χρησιμοποιήσετε το Διεπαφή γραμμής εντολών AWS (AWS CLI), Κονσόλα διαχείρισης AWS, και διάφορα SDK AWS για μεταγραφές παρτίδων και συνεχίστε να χρησιμοποιείτε το ίδιο StartTranscriptionJob
API για να λαμβάνετε πλεονεκτήματα απόδοσης από το βελτιωμένο μοντέλο ASR χωρίς να χρειάζεται να κάνετε αλλαγές κώδικα ή παραμέτρους στο τέλος σας. Για περισσότερες πληροφορίες σχετικά με τη χρήση του AWS CLI και της κονσόλας, ανατρέξτε στο Μεταγραφή με το AWS CLI και Μεταγραφή με την Κονσόλα διαχείρισης AWS, Αντίστοιχα.
Το πρώτο βήμα είναι να ανεβάσετε τα αρχεία πολυμέσων σας σε ένα Απλή υπηρεσία αποθήκευσης Amazon Κάδος (Amazon S3), μια υπηρεσία αποθήκευσης αντικειμένων που έχει σχεδιαστεί για αποθήκευση και ανάκτηση οποιουδήποτε όγκου δεδομένων από οπουδήποτε. Το Amazon S3 προσφέρει κορυφαία στον κλάδο αντοχή, διαθεσιμότητα, απόδοση, ασφάλεια και ουσιαστικά απεριόριστη επεκτασιμότητα με πολύ χαμηλό κόστος. Μπορείτε να επιλέξετε να αποθηκεύσετε τη μεταγραφή σας στον δικό σας κάδο S3 ή να χρησιμοποιήσετε το Amazon Transcript έναν ασφαλή προεπιλεγμένο κάδο. Για να μάθετε περισσότερα σχετικά με τη χρήση των κάδων S3, βλ Δημιουργία, διαμόρφωση και εργασία με κάδους Amazon S3.
Έξοδος μεταγραφής
Το Amazon Transcribe χρησιμοποιεί αναπαράσταση JSON για την έξοδο του. Παρέχει το αποτέλεσμα μεταγραφής σε δύο διαφορετικές μορφές: μορφή κειμένου και μορφή με στοιχεία. Δεν αλλάζει τίποτα όσον αφορά το τελικό σημείο του API ή τις παραμέτρους εισόδου.
Η μορφή κειμένου παρέχει τη μεταγραφή ως μπλοκ κειμένου, ενώ η αναλυτική μορφή παρέχει τη μεταγραφή με τη μορφή έγκαιρης παραγγελίας μεταγραφόμενων στοιχείων, μαζί με πρόσθετα μεταδεδομένα ανά στοιχείο. Και οι δύο μορφές υπάρχουν παράλληλα στο αρχείο εξόδου.
Ανάλογα με τις δυνατότητες που επιλέγετε κατά τη δημιουργία της εργασίας μεταγραφής, το Amazon Transcribe δημιουργεί πρόσθετες και εμπλουτισμένες προβολές του αποτελέσματος της μεταγραφής. Δείτε το ακόλουθο παράδειγμα κώδικα:
Οι απόψεις είναι οι εξής:
- Οι μεταγραφές – Εκπροσωπείται από την
transcripts
στοιχείο, περιέχει μόνο τη μορφή κειμένου της μεταγραφής. Σε σενάρια πολλαπλών ηχείων, πολλών καναλιών, η συνένωση όλων των μεταγραφών παρέχεται ως ενιαίο μπλοκ. - Ηχεία – Εκπροσωπείται από την
speaker_labels
στοιχείο, περιέχει το κείμενο και τις αναλυτικές μορφές της μεταγραφής ομαδοποιημένες ανά ομιλητή. Είναι διαθέσιμο μόνο όταν είναι ενεργοποιημένη η λειτουργία πολλαπλών ηχείων. - Κανάλια – Εκπροσωπείται από την
channel_labels
στοιχείο, περιέχει το κείμενο και τις αναλυτικές μορφές της μεταγραφής, ομαδοποιημένες ανά κανάλι. Είναι διαθέσιμο μόνο όταν είναι ενεργοποιημένη η λειτουργία πολλών καναλιών. - FX Εργαλεία – Εκπροσωπείται από την
items
στοιχείο, περιέχει μόνο την αναλυτική μορφή της μεταγραφής. Σε σενάρια πολλαπλών ηχείων, πολλών καναλιών, τα στοιχεία εμπλουτίζονται με πρόσθετες ιδιότητες, υποδεικνύοντας το ηχείο και το κανάλι. - Τομείς – Εκπροσωπείται από την
segments
στοιχείο, περιέχει το κείμενο και τις αναλυτικές μορφές της μεταγραφής, ομαδοποιημένες κατά εναλλακτική μεταγραφή. Είναι διαθέσιμο μόνο όταν είναι ενεργοποιημένη η δυνατότητα εναλλακτικών αποτελεσμάτων.
Συμπέρασμα
Στην AWS, καινοτομούμε συνεχώς για λογαριασμό των πελατών μας. Επεκτείνοντας τη γλωσσική υποστήριξη στο Amazon Transcribe σε περισσότερες από 100 γλώσσες, δίνουμε τη δυνατότητα στους πελάτες μας να εξυπηρετούν χρήστες από διαφορετικά γλωσσικά υπόβαθρα. Αυτό όχι μόνο ενισχύει την προσβασιμότητα, αλλά ανοίγει επίσης νέους δρόμους για επικοινωνία και ανταλλαγή πληροφοριών σε παγκόσμια κλίμακα. Για να μάθετε περισσότερα σχετικά με τα χαρακτηριστικά που αναφέρονται σε αυτήν την ανάρτηση, ρίξτε μια ματιά σελίδα δυνατοτήτων και τι νέα ανάρτηση.
Σχετικά με τους συγγραφείς
Σουμίτ Κουμάρ είναι Κύριος Διευθυντής Προϊόντων, Τεχνικός στην ομάδα AWS AI Language Services. Έχει 10ετή εμπειρία διαχείρισης προϊόντων σε διάφορους τομείς και είναι παθιασμένος με την AI/ML. Εκτός δουλειάς, ο Sumit λατρεύει τα ταξίδια και του αρέσει να παίζει κρίκετ και Lawn-Tennis.
Βιβέκ Σινγκ είναι Ανώτερος Διευθυντής, Διαχείριση Προϊόντων στην ομάδα AWS AI Language Services. Είναι επικεφαλής της ομάδας προϊόντων Amazon Transcribe. Πριν ενταχθεί στην AWS, κατείχε ρόλους διαχείρισης προϊόντων σε διάφορους άλλους οργανισμούς της Amazon, όπως πληρωμές καταναλωτών και λιανική. Ο Vivek ζει στο Seattle, WA και του αρέσει το τρέξιμο και η πεζοπορία.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :έχει
- :είναι
- :δεν
- $UP
- 10
- 100
- 14
- 24
- 7
- a
- Σχετικα
- πρόσβαση
- προσιτότητα
- ακρίβεια
- ακριβής
- απέναντι
- προσθέτω
- Επιπλέον
- Πρόσθετος
- έλευση
- Πράκτορας
- AI
- AI / ML
- Απευθύνεται
- alex
- αλγόριθμοι
- Όλα
- κατά μήκος
- Επίσης
- εναλλακτική λύση
- Amazon
- Μεταγραφή Amazon
- Amazon υπηρεσίες Web
- Αμερικανοί
- ποσό
- an
- αναλύσει
- και
- Ανακοινώστε
- ανακοινώνει
- Ετησίως
- κάθε
- οπουδήποτε
- api
- εφαρμογές
- ΕΙΝΑΙ
- AS
- At
- ήχου
- Αυτόματο
- αυτομάτως
- διαθεσιμότητα
- διαθέσιμος
- λεωφόρους
- AWS
- υπόβαθρα
- Υπόλοιπο
- BE
- επειδή
- χάρη
- παρακάτω
- οφέλη
- Καλύτερα
- μεταξύ
- Αποκλεισμός
- και οι δύο
- πλάτος
- χτισμένο
- αλλά
- by
- κλήση
- κλήσεις
- CAN
- δυνατότητες
- κεφαλοποίηση
- περιπτώσεις
- Κέντρο
- Κέντρα
- πρόκληση
- αλλαγή
- Αλλαγές
- Κανάλι
- κανάλια
- έλεγχος
- Επιλέξτε
- Συνιδρυτής
- κωδικός
- Επικοινωνία
- Εταιρείες
- εταίρα
- Ολοκληρώθηκε το
- Συνθήκες
- εμπιστοσύνη
- Διαμόρφωση
- πρόξενος
- συνεχώς
- καταναλωτής
- επικοινωνήστε μαζί μας
- κέντρο επαφών
- Περιέχει
- περιεχόμενο
- ΣΥΝΕΧΕΙΑ
- Κόστος
- χώρα
- δημιουργεί
- δημιουργία
- κρίκετ
- ΚΟΤ
- έθιμο
- πελάτης
- εμπειρία του πελάτη
- Πελάτες
- παραμετροποίηση
- ημερομηνία
- Προεπιλογή
- παραδίδει
- εκδημοκρατίζω
- αναπτύσσεται
- διαφορετικές
- κατευθείαν
- συζητήσουν
- συζήτηση
- διανομείς
- διάφορα
- τομέα
- domains
- αντοχή
- ευκολία
- ευκολία στη χρήση
- αποτελεσματικά
- είτε
- στοιχείο
- embed
- επείγον
- την εξουσία
- ενεργοποιήσετε
- ενεργοποιημένη
- δίνει τη δυνατότητα
- τέλος
- Τελικό σημείο
- Αγγλικά
- ενισχυμένη
- Ενισχύει
- εμπλουτισμένος
- εξασφαλίζοντας
- επιχειρήσεις
- περιβάλλοντα
- εξοπλισμένο
- Even
- Κάθε
- παράδειγμα
- ανταλλαγή
- υπάρχουν
- υφιστάμενα
- επεκτάθηκε
- επεκτείνεται
- εμπειρία
- επέκταση
- Χαρακτηριστικό
- Χαρακτηριστικά
- Αρχεία
- Αρχεία
- φιλτράρισμα
- Όνομα
- Εξής
- εξής
- Για
- ξένος
- μορφή
- μορφή
- Θεμέλιο
- από
- πλήρως
- παράγουν
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- παίρνω
- Παγκόσμιο
- παγκόσμια κλίμακα
- Στόχοι
- ευτυχισμένος
- Έχω
- he
- Ήρωας
- βοήθεια
- βοήθεια
- βοηθά
- εδώ
- hi
- Ψηλά
- Αρχική
- ΩΡΕΣ
- Πως
- Πώς να
- HTML
- http
- HTTPS
- ανθρώπινος
- Αναγνώριση
- προσδιορίσει
- Επίπτωση
- βελτίωση
- βελτιωθεί
- βελτίωση
- βελτιώσεις
- in
- περιλαμβάνουν
- Αυξάνουν
- κορυφαία στον κλάδο
- πληροφορίες
- συμφυής
- καινοτόμος
- εισαγωγή
- ιδέες
- παράδειγμα
- σε
- IT
- αντικειμένων
- ΤΟΥ
- Δουλειά
- ενώνει
- jpg
- json
- Κλειδί
- Γλώσσα
- Γλώσσες
- large
- Οδηγεί
- ΜΑΘΑΊΝΩ
- επίπεδα
- μόχλευσης
- γραμμή
- ζω
- ζωές
- αγαπά
- Χαμηλός
- κάνω
- ΚΑΝΕΙ
- διαχειρίζεται
- διαχείριση
- διευθυντής
- Εικόνες / Βίντεο
- Μεταδεδομένα
- εκατομμύριο
- εκατομμύρια
- Αποστολή
- Τρόπος
- μοντέλο
- περισσότερο
- πλέον
- χρειάζονται
- Νέα
- επόμενη γενιά
- Θόρυβος
- τίποτα
- αριθμός
- αντικείμενο
- of
- προσφορές
- on
- αποκλειστικά
- ανοίγει
- βελτιστοποιημένη
- or
- οργανώσεις
- ΑΛΛΑ
- δικός μας
- έξω
- παραγωγή
- εξόδους
- εκτός
- επί
- δική
- Παράλληλο
- παράμετρος
- παράμετροι
- παθιασμένος
- πρότυπα
- πληρωμές
- για
- επίδοση
- person
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- παιχνίδι
- θετικώς
- Θέση
- τροφοδοτείται
- Κύριος
- Πριν
- μυστικότητα
- παράγει
- Παραγωγούς
- Προϊόν
- διαχείριση προϊόντων
- υπεύθυνος προϊόντων
- παραγωγικότητα
- ιδιότητες
- παρέχουν
- παρέχεται
- παρέχει
- επιδιώκω
- φθάσουν
- αναγνώριση
- παραπέμπω
- σχετίζεται με
- αντιπροσώπευση
- εκπροσωπούνται
- σεβασμός
- αντίστοιχα
- απάντησης
- αποτέλεσμα
- Αποτελέσματα
- λιανική πώληση
- Πλούσιος
- ρόλους
- τρέξιμο
- Ασφάλεια
- ίδιο
- Αποθήκευση
- Απεριόριστες δυνατότητες
- Κλίμακα
- σενάρια
- Σιάτλ
- προστατευμένο περιβάλλον
- ασφάλεια
- δείτε
- τμήματα
- επιλέξτε
- αρχαιότερος
- εξυπηρετούν
- υπηρεσία
- Υπηρεσίες
- Σέτς
- διάφοροι
- σημαντικός
- σημαντικά
- Απλούς
- ενιαίας
- έξυπνος
- λογισμικό
- Λύσεις
- μερικοί
- μιλούν
- Ομιλητής
- Ηχεία
- ομιλία
- Αναγνώριση ομιλίας
- ομιλία σε κείμενο
- ξεκίνησε
- Κατάσταση
- Βήμα
- χώρος στο δίσκο
- κατάστημα
- ειλικρινής
- Ακολούθως
- ουσιώδης
- υπότιτλους
- τέτοιος
- υποστήριξη
- σύστημα
- Τεχνικός
- Τεχνολογίες
- κείμενο
- από
- ότι
- Η
- τους
- εκ τούτου
- Αυτοί
- αυτοί
- αυτό
- χιλιάδες
- Μέσω
- έγκαιρος
- προς την
- σήμερα
- παραδοσιακά
- εκπαιδευμένο
- Εκπαίδευση
- Αντίγραφο
- Μετάφραση
- ταξίδι
- δύο
- Παγκόσμιος
- απεριόριστες
- ξεκλειδώσετε
- χρήση
- Χρήστες
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- ποικιλία
- διάφορα
- πολύ
- Βίντεο
- εμφανίσεις
- πρακτικώς
- επισκέπτες
- Φωνή
- Τρόπος..
- we
- ιστός
- διαδικτυακές υπηρεσίες
- καλωσόρισμα
- ΛΟΙΠΌΝ
- πότε
- ενώ
- Ποιό
- Ο ΟΠΟΊΟΣ
- θα
- με
- χωρίς
- Εργασία
- εργαζόμενος
- χρόνια
- Εσείς
- Σας
- zephyrnet