Transcriere Amazon este un serviciu de recunoaștere automată a vorbirii (ASR) complet gestionat, care vă permite să adăugați posibilități de conversie a vorbirii în text la aplicațiile dvs. Astăzi, suntem bucuroși să anunțăm un sistem bazat pe model de bază de vorbire de ultimă generație, cu mai multe miliarde de parametri, care extinde recunoașterea automată a vorbirii la peste Limbile 100. În această postare, discutăm câteva dintre beneficiile acestui sistem, cum îl folosesc companiile și cum să începeți. De asemenea, oferim mai jos un exemplu de transcriere.
Modelul de bază al vorbirii Transscribe este antrenat folosind algoritmi auto-supravegheați, cei mai buni din clasă, pentru a învăța modelele universale inerente ale vorbirii umane în diferite limbi și accente. Este antrenat pe milioane de ore de date audio neetichetate din peste 100 de limbi. Rețetele de antrenament sunt optimizate prin eșantionarea inteligentă a datelor pentru a echilibra datele de antrenament între limbi, asigurându-se că limbile subreprezentate în mod tradițional ating, de asemenea, niveluri ridicate de precizie.
Carbyne este o companie de software care dezvoltă soluții de centre de contact bazate pe cloud, esențiale pentru misiuni pentru respondenții la apeluri de urgență. Misiunea lui Carbyne este de a ajuta personalul de intervenție în situații de urgență să salveze vieți, iar limbajul nu le poate împiedica atingerea obiectivelor. Iată cum folosesc Amazon Transcribe pentru a-și îndeplini misiunea:
„Carbyne Live Audio Translation, bazată pe inteligență artificială, are ca scop direct îmbunătățirea răspunsului la situații de urgență pentru cei 68 de milioane de americani care vorbesc o altă limbă decât engleza acasă, pe lângă cei până la 79 de milioane de vizitatori străini care vin anual în țară. Folosind noul model de fundație multilingv al Amazon Transcribe alimentat cu ASR, Carbyne va fi și mai bine echipat pentru a democratiza serviciile de urgență care salvează vieți, deoarece Every. Persoană. Contează.”
– Alex Dizengof, co-fondator și CTO al Carbyne.
Prin valorificarea modelului de bază pentru vorbire, Amazon Transcribe oferă o îmbunătățire semnificativă a preciziei între 20% și 50% în majoritatea limbilor. În vorbirea de telefonie, care este un domeniu provocator și cu date limitate, îmbunătățirea acurateței este între 30% și 70%. Pe lângă îmbunătățirea substanțială a preciziei, acest model mare ASR oferă, de asemenea, îmbunătățiri ale lizibilității, cu punctuație și majuscule mai precise. Odată cu apariția IA generativă, mii de întreprinderi folosesc Amazon Transcribe pentru a debloca informații bogate din conținutul lor audio. Cu acuratețe îmbunătățită semnificativ și suport pentru peste 100 de limbi, Amazon Transcribe va avea un impact pozitiv asupra tuturor acestor cazuri de utilizare. Toți clienții existenți și noi care folosesc Amazon Transcribe în modul lot pot accesa recunoașterea vorbirii bazată pe modelul de bază de vorbire fără a fi nevoie de nicio modificare a punctului final API sau a parametrilor de intrare.
Noul sistem ASR oferă mai multe funcții cheie în toate cele peste 100 de limbi legate de ușurința în utilizare, personalizare, siguranța utilizatorului și confidențialitate. Acestea includ funcții precum punctuația automată, vocabularul personalizat, identificarea automată a limbii, diarizarea vorbitorului, scorurile de încredere la nivel de cuvânt și filtrul de vocabular personalizat. Suportul extins al sistemului pentru diferite accente, medii de zgomot și condiții acustice vă permite să produceți ieșiri mai precise și, prin urmare, vă ajută să încorporați eficient tehnologiile vocale în aplicațiile dvs.
Activată de acuratețea ridicată a Amazon Transcribe în diferite accente și condiții de zgomot, de suportul pentru un număr mare de limbi și de multitudinea de funcții cu valoare adăugată, mii de întreprinderi vor fi împuternicite să deblocați informații bogate din conținutul lor audio, precum și creșteți accesibilitatea și descoperirea conținutului lor audio și video pe diferite domenii. De exemplu, centrele de contact transcriu și analizează apelurile clienților pentru a identifica informații și, ulterior, pentru a îmbunătăți experiența clienților și productivitatea agenților. Producătorii de conținut și distribuitorii media generează automat subtitrări folosind Amazon Transcribe pentru a îmbunătăți accesibilitatea conținutului.
Începeți cu Amazon Transcribe
Aveți posibilitatea să utilizați Interfața liniei de comandă AWS (AWS CLI), Consola de administrare AWS, și diverse SDK-uri AWS pentru transcrieri în loturi și continuați să utilizați același lucru StartTranscriptionJob
API pentru a obține beneficii de performanță din modelul ASR îmbunătățit, fără a fi nevoie să faceți nicio modificare de cod sau parametri din partea dvs. Pentru mai multe informații despre utilizarea AWS CLI și a consolei, consultați Transcriere cu AWS CLI și Transcrierea cu AWS Management Console, respectiv.
Primul pas este să încărcați fișierele media într-un Serviciul Amazon de stocare simplă Bucket (Amazon S3), un serviciu de stocare a obiectelor creat pentru a stoca și a prelua orice cantitate de date de oriunde. Amazon S3 oferă durabilitate, disponibilitate, performanță, securitate și scalabilitate practic nelimitată la un cost foarte scăzut. Puteți alege să vă salvați transcrierea în propriul dvs. bucket S3 sau să solicitați Amazon Transcribe să folosească un securizat implicit. Pentru a afla mai multe despre utilizarea compartimentelor S3, consultați Crearea, configurarea și lucrul cu compartimente Amazon S3.
Ieșire de transcriere
Amazon Transcribe folosește reprezentarea JSON pentru ieșirea sa. Oferă rezultatul transcripției în două formate diferite: format text și format detaliat. Nu se modifică nimic în ceea ce privește punctul final API sau parametrii de intrare.
Formatul text oferă transcrierea ca un bloc de text, în timp ce formatul detaliat oferă transcrierea sub formă de articole transcrise ordonate în timp util, împreună cu metadate suplimentare per articol. Ambele formate există în paralel în fișierul de ieșire.
În funcție de caracteristicile pe care le selectați atunci când creați jobul de transcriere, Amazon Transcribe creează vizualizări suplimentare și îmbogățite ale rezultatului transcripției. Vedeți următorul exemplu de cod:
Vizualizările sunt după cum urmează:
- transcrieri – Reprezentat de
transcripts
element, conține doar formatul text al transcripției. În scenariile cu mai multe difuzoare, cu mai multe canale, concatenarea tuturor transcrierilor este furnizată ca un singur bloc. - Difuzoare – Reprezentat de
speaker_labels
element, conține textul și formatele detaliate ale transcripției grupate după vorbitor. Este disponibil numai când funcția cu mai multe difuzoare este activată. - Canale – Reprezentat de
channel_labels
element, conține textul și formatele detaliate ale transcripției, grupate pe canal. Este disponibil numai atunci când funcția multicanal este activată. - articole – Reprezentat de
items
element, acesta conține doar formatul detaliat al transcripției. În scenariile cu mai multe difuzoare, mai multe canale, articolele sunt îmbogățite cu proprietăți suplimentare, indicând difuzorul și canalul. - segmente – Reprezentat de
segments
element, conține textul și formatele detaliate ale transcripției, grupate după transcriere alternativă. Este disponibil numai atunci când funcția de rezultate alternative este activată.
Concluzie
La AWS, inovăm în mod constant în numele clienților noștri. Prin extinderea suportului lingvistic în Amazon Transcribe la peste 100 de limbi, le permitem clienților noștri să servească utilizatori din medii lingvistice diverse. Acest lucru nu numai că îmbunătățește accesibilitatea, dar deschide și noi căi de comunicare și schimb de informații la scară globală. Pentru a afla mai multe despre caracteristicile discutate în această postare, consultați pagina cu caracteristici și ce postare noua.
Despre autori
Sumit Kumar este manager principal de produs, tehnic la echipa AWS AI Language Services. Are 10 ani de experiență în managementul produselor într-o varietate de domenii și este pasionat de AI/ML. În afara serviciului, lui Sumit îi place să călătorească și îi place să joace cricket și Lawn-Tennis.
Vivek Singh este Senior Manager, Product Management la echipa AWS AI Language Services. El conduce echipa de produse Amazon Transcribe. Înainte de a se alătura AWS, a deținut funcții de management de produs în diverse alte organizații Amazon, cum ar fi plățile pentru consumatori și retailul. Vivek locuiește în Seattle, WA și îi place să alerge și să facă drumeții.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :are
- :este
- :nu
- $UP
- 10
- 100
- 14
- 24
- 7
- a
- Despre Noi
- acces
- accesibilitate
- precizie
- precis
- peste
- adăuga
- plus
- Suplimentar
- venire
- Agent
- AI
- AI / ML
- vizează
- alex
- algoritmi
- TOATE
- de-a lungul
- de asemenea
- alternativă
- Amazon
- Transcriere Amazon
- Amazon Web Services
- Americanii
- sumă
- an
- analiza
- și
- anunța
- Anunțuri
- Anual
- Orice
- oriunde
- api
- aplicatii
- SUNT
- AS
- At
- audio
- Automat
- în mod automat
- disponibilitate
- disponibil
- căi
- AWS
- fundaluri
- Sold
- BE
- deoarece
- folosul
- de mai jos
- Beneficiile
- Mai bine
- între
- Bloca
- atât
- lăţime
- construit
- dar
- by
- apel
- apeluri
- CAN
- capacități
- capitalizare
- cazuri
- Centru
- Centre
- provocare
- Schimbare
- Modificări
- Canal
- canale
- verifica
- Alege
- Co-fondator
- cod
- Comunicare
- Companii
- companie
- Terminat
- Condiții
- încredere
- configurarea
- Consoleze
- mereu
- consumator
- contactați-ne
- centru de contact
- conține
- conţinut
- continua
- A costat
- ţară
- creează
- Crearea
- crichet
- CTO
- personalizat
- client
- experienta clientului
- clienţii care
- personalizare
- de date
- Mod implicit
- Oferă
- democratiza
- dezvoltă
- diferit
- direct
- discuta
- discutat
- distribuitori
- diferit
- domeniu
- domenii
- durabilitate
- uşura
- ușurință în utilizare
- în mod eficient
- oricare
- element
- încastra
- caz de urgență
- împuternicit
- permite
- activat
- permite
- capăt
- Punct final
- Engleză
- sporită
- Îmbunătăţeşte
- îmbogățit
- asigurare
- Companii
- medii
- echipat
- Chiar
- Fiecare
- exemplu
- schimb
- exista
- existent
- extins
- se extinde
- experienţă
- extindere
- Caracteristică
- DESCRIERE
- Fișier
- Fişiere
- filtru
- First
- următor
- urmează
- Pentru
- străin
- formă
- format
- Fundație
- din
- complet
- genera
- generativ
- AI generativă
- obține
- Caritate
- Scala globala
- Goluri
- fericit
- Avea
- he
- Held
- ajutor
- ajutor
- ajută
- aici
- hi
- Înalt
- Acasă
- ORE
- Cum
- Cum Pentru a
- HTML
- http
- HTTPS
- uman
- Identificare
- identifica
- Impactul
- îmbunătăţi
- îmbunătățit
- îmbunătățire
- îmbunătățiri
- in
- include
- Crește
- lider în industrie
- informații
- inerent
- inovatoare
- intrare
- perspective
- instanță
- în
- IT
- articole
- ESTE
- Loc de munca
- aderarea
- jpg
- JSON
- Cheie
- limbă
- Limbă
- mare
- Conduce
- AFLAȚI
- nivelurile de
- efectului de pârghie
- Linie
- trăi
- Locuiește
- iubeste
- Jos
- face
- FACE
- gestionate
- administrare
- manager
- Mass-media
- Metadata
- milion
- milioane
- Misiune
- mod
- model
- mai mult
- cele mai multe
- au nevoie
- Nou
- generație următoare
- Zgomot
- nimic
- număr
- obiect
- of
- promoții
- on
- afară
- deschide
- optimizate
- or
- organizații
- Altele
- al nostru
- afară
- producție
- iesiri
- exterior
- peste
- propriu
- Paralel
- parametru
- parametrii
- pasionat
- modele
- plăți
- pentru
- performanță
- persoană
- Plato
- Informații despre date Platon
- PlatoData
- joc
- pozitiv
- Post
- alimentat
- Principal
- anterior
- intimitate
- produce
- Producătorii
- Produs
- management de produs
- manager de produs
- productivitate
- proprietăţi
- furniza
- prevăzut
- furnizează
- urmări
- ajunge
- recunoaştere
- trimite
- legate de
- reprezentare
- reprezentate
- respect
- respectiv
- răspuns
- rezultat
- REZULTATE
- cu amănuntul
- Bogat
- rolurile
- funcţionare
- Siguranţă
- acelaşi
- Economisiți
- scalabilitate
- Scară
- scenarii
- Seattle
- sigur
- securitate
- vedea
- segmente
- selecta
- senior
- servi
- serviciu
- Servicii
- Seturi
- câteva
- semnificativ
- semnificativ
- simplu
- singur
- inteligent
- Software
- soluţii
- unele
- vorbi
- Vorbitor
- difuzoare
- discurs
- Recunoaștere a vorbirii
- vorbire-text
- început
- Stare
- Pas
- depozitare
- stoca
- simplu
- Ulterior
- substanțial
- subtitrari
- astfel de
- a sustine
- sistem
- echipă
- Tehnic
- Tehnologii
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- decât
- acea
- lor
- astfel
- Acestea
- ei
- acest
- mii
- Prin
- oportun
- la
- astăzi
- tradiţional
- dresat
- Pregătire
- Copie
- Traducere
- călătorie
- Două
- Universal
- nelimitat
- deschide
- utilizare
- Utilizator
- utilizatorii
- utilizări
- folosind
- varietate
- diverse
- foarte
- Video
- vizualizari
- practic
- vizitatori
- Voce
- Cale..
- we
- web
- servicii web
- bun venit
- BINE
- cand
- întrucât
- care
- OMS
- voi
- cu
- fără
- Apartamente
- de lucru
- ani
- Tu
- Ta
- zephyrnet