Amazoni transkribeerimine on täielikult hallatav automaatse kõnetuvastuse (ASR) teenus, mis muudab teie rakendustele kõne tekstiks funktsioonide lisamise lihtsaks. Täna on meil hea meel teatada järgmise põlvkonna mitme miljardi parameetriga kõnealuse mudelipõhisest süsteemist, mis laiendab automaatset kõnetuvastust 100 keeled. Selles postituses käsitleme mõningaid selle süsteemi eeliseid, kuidas ettevõtted seda kasutavad ja kuidas alustada. Allpool pakume ka transkriptsiooniväljundi näidet.
Transkribeerimise kõne alusmudel on koolitatud oma klassi parimate enesejärelevalvega algoritmide abil, et õppida tundma inimkõnele omaseid universaalseid mustreid erinevates keeltes ja aktsentides. See on koolitatud miljonite tundide sildistamata heliandmetele enam kui 100 keelest. Treeningretseptid on optimeeritud nutika andmeproovi abil, et tasakaalustada koolitusandmeid keelte vahel, tagades, et ka traditsiooniliselt alaesindatud keeled saavutavad kõrge täpsustaseme.
Carbyne on tarkvaraettevõte, mis arendab pilvepõhiseid missioonikriitilisi kontaktikeskuste lahendusi hädaabikõnedele reageerijatele. Carbyne'i missioon on aidata kiirreageerijatel elusid päästa ja keel ei tohi nende eesmärkide saavutamist takistada. Siin on, kuidas nad kasutavad Amazon Transcribe'i oma missiooni täitmiseks:
„AI-toega Carbyne Live Audio Translation on otseselt suunatud sellele, et aidata parandada hädaolukordadele reageerimist 68 miljonil ameeriklasel, kes räägivad kodus muud keelt peale inglise keele, lisaks sellele, et riiki külastab aastas kuni 79 miljonit väliskülalist. Kasutades Amazon Transcribe'i uut mitmekeelset ASR-i põhimudelit, on Carbyne veelgi paremini varustatud elupäästvate hädaabiteenuste demokratiseerimiseks, sest iga. Isik. Loeb.”
– Alex Dizengof, Carbyne'i kaasasutaja ja tehnoloogiadirektor.
Kasutades kõne alusmudelit, parandab Amazon Transcribe enamikus keeltes märkimisväärset täpsust 20–50%. Telefonikõne puhul, mis on väljakutseid pakkuv ja andmemahukas valdkond, on täpsuse paranemine 30–70%. Lisaks täpsuse olulisele paranemisele pakub see suur ASR-mudel ka loetavuse täiustusi täpsemate kirjavahemärkide ja suurtähtede kasutamisega. Generatiivse tehisintellekti tulekuga kasutavad tuhanded ettevõtted Amazon Transcribe'i, et avada oma helisisust rikkalikke teadmisi. Oluliselt täiustatud täpsuse ja enam kui 100 keele toega mõjutab Amazon Transcribe positiivselt kõiki selliseid kasutusjuhtumeid. Kõik olemasolevad ja uued kliendid, kes kasutavad Amazon Transcribe'i pakettrežiimis, pääsevad juurde kõnealuse mudelipõhisele kõnetuvastusele, ilma et oleks vaja API lõpp-punkti ega sisendparameetreid muuta.
Uus ASR-süsteem pakub mitmeid põhifunktsioone kõigis 100+ keeles, mis on seotud kasutuslihtsuse, kohandamise, kasutaja ohutuse ja privaatsusega. Nende hulka kuuluvad sellised funktsioonid nagu automaatsed kirjavahemärgid, kohandatud sõnavara, automaatne keeletuvastus, kõneleja päevik, sõnataseme usaldusskoorid ja kohandatud sõnavarafilter. Süsteemi laiendatud tugi erinevatele aktsentidele, mürakeskkondadele ja akustilistele tingimustele võimaldab teil toota täpsemaid väljundeid ja aitab seeläbi oma rakendustesse tõhusalt manustada kõnetehnoloogiaid.
Tänu rakenduse Amazon Transcribe suurele täpsusele erinevate aktsentide ja müratingimuste korral, paljude keelte toetamisel ja lisandväärtusega funktsioonide komplektidel on tuhandetel ettevõtetel õigus avada rikkalikku teavet nende helisisu kohta ning suurendada nende heli- ja videosisu juurdepääsetavust ja leitavust erinevates domeenides. Näiteks kontaktikeskused transkribeerivad ja analüüsivad kliendikõnesid, et tuvastada teadmisi ning seejärel parandada kliendikogemust ja agendi tootlikkust. Sisutootjad ja meedialevitajad loovad sisu juurdepääsetavuse parandamiseks automaatselt subtiitreid kasutades Amazon Transcribe.
Alustage Amazon Transcribe'iga
Võite kasutada AWS-i käsurea liides (AWS CLI), AWS-i juhtimiskonsoolja mitmesugused AWS-i SDK-d partii transkriptsioonide jaoks ja jätkake sama kasutamist StartTranscriptionJob
API, et saada täiustatud ASR-mudelist jõudluse eeliseid, ilma et peaksite ise koodi või parameetrite muutma. Lisateavet AWS-i CLI ja konsooli kasutamise kohta leiate aadressilt Transkribeerimine AWS-i CLI-ga ja Transkribeerimine AWS-i halduskonsooliga, Vastavalt.
Esimene samm on oma meediumifailid üles laadida Amazoni lihtne salvestusteenus (Amazon S3) ämber, objektide salvestusteenus, mis on loodud mis tahes hulga andmete salvestamiseks ja toomiseks kõikjalt. Amazon S3 pakub väga madalate kuludega tööstusharu juhtivat vastupidavust, kättesaadavust, jõudlust, turvalisust ja praktiliselt piiramatut mastaapsust. Saate salvestada oma ärakirja oma S3 ämbrisse või lasta Amazon Transcribeil kasutada turvalist vaikeämbrit. Lisateavet S3 ämbrite kasutamise kohta vt Amazon S3 ämbrite loomine, konfigureerimine ja nendega töötamine.
Transkriptsiooni väljund
Amazon Transcribe kasutab oma väljundiks JSON-i esitust. See annab transkriptsioonitulemuse kahes erinevas vormingus: tekstivormingus ja üksikvormingus. API lõpp-punkti ega sisendparameetrite osas ei muutu midagi.
Tekstivorming pakub ärakirja tekstiplokina, samas kui üksikvorming pakub ärakirja õigeaegselt tellitud transkribeeritud üksustena koos täiendavate metaandmetega üksuse kohta. Mõlemad vormingud eksisteerivad väljundfailis paralleelselt.
Olenevalt funktsioonidest, mille valite transkriptsioonitöö loomisel, loob Amazon Transcribe transkriptsioonitulemustest täiendavad ja rikastatud vaated. Vaadake järgmist näidiskoodi:
Vaated on järgmised:
- Skriptid – esindab
transcripts
element, sisaldab see ainult ärakirja tekstivormingut. Mitme kõlariga ja mitme kanaliga stsenaariumide korral on kõigi transkriptsioonide konkateneerimine ette nähtud ühe plokina. - KÕLARID – esindab
speaker_labels
element, see sisaldab kõneleja järgi rühmitatud ärakirja teksti ja üksikasjalikku vormingut. See on saadaval ainult siis, kui mitme kõlari funktsioon on lubatud. - Kanalid – esindab
channel_labels
element, sisaldab see ärakirja teksti ja üksikasjalikku vormingut kanalite kaupa rühmitatuna. See on saadaval ainult siis, kui mitme kanali funktsioon on lubatud. - Kirjed – esindab
items
element, sisaldab see ainult ärakirja üksikasjalikku vormingut. Mitme kõlariga ja mitme kanaliga stsenaariumide korral on üksusi rikastatud täiendavate omadustega, mis näitavad kõlarit ja kanalit. - Segmendid – esindab
segments
element, sisaldab see ärakirja teksti ja üksikasjalikku vormingut, mis on rühmitatud alternatiivse transkriptsiooni järgi. See on saadaval ainult siis, kui alternatiivsete tulemuste funktsioon on lubatud.
Järeldus
AWS-is teeme oma klientide nimel pidevalt uuendusi. Laiendades Amazon Transcribe’i keeletoe enam kui 100 keelele, võimaldame oma klientidel teenindada erineva keelelise taustaga kasutajaid. See mitte ainult ei paranda juurdepääsetavust, vaid avab ka uusi võimalusi suhtluseks ja teabevahetuseks ülemaailmsel tasandil. Selles postituses käsitletud funktsioonide kohta lisateabe saamiseks vaadake funktsioonide leht ja mis on uus postitus.
Autoritest
Sumit Kumar on AWS AI Language Services meeskonna peamine tootejuht, tehniline. Tal on 10-aastane tootehalduse kogemus erinevates valdkondades ja ta on kirglik AI/ML-i vastu. Väljaspool tööd armastab Sumit reisida ning talle meeldib mängida kriketit ja murutennist.
Vivek Singh on AWS AI Language Services meeskonna tootejuhtimise vanemjuht. Ta juhib Amazon Transcribe’i tootemeeskonda. Enne AWS-iga liitumist töötas ta tootehalduses erinevates Amazoni organisatsioonides, nagu tarbijamaksed ja jaekaubandus. Vivek elab Seattle'is, WA ja talle meeldib jooksmine ja matkamine.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :on
- :on
- :mitte
- $ UP
- 10
- 100
- 14
- 24
- 7
- a
- MEIST
- juurdepääs
- kättesaadavus
- täpsus
- täpne
- üle
- lisama
- lisamine
- Täiendavad lisad
- Advent
- Agent
- AI
- AI / ML
- eesmärk
- Alex
- algoritme
- Materjal: BPA ja flataatide vaba plastik
- mööda
- Ka
- alternatiiv
- Amazon
- Amazoni transkribeerimine
- Amazon Web Services
- Ameeriklased
- summa
- an
- analüüsima
- ja
- Teatama
- teatab
- Aastas
- mistahes
- kuskil
- API
- rakendused
- OLEME
- AS
- At
- heli-
- Automaatne
- automaatselt
- kättesaadavus
- saadaval
- teed
- AWS
- taustaga
- Saldo
- BE
- sest
- nimel
- alla
- Kasu
- Parem
- vahel
- Blokeerima
- mõlemad
- laius
- ehitatud
- kuid
- by
- helistama
- Kutsub
- CAN
- võimeid
- Kapitaliseerimine
- juhtudel
- keskus
- Centers
- raske
- muutma
- Vaidluste lahendamine
- Kanal
- kanalid
- kontrollima
- Vali
- Asutaja
- kood
- KOMMUNIKATSIOON
- Ettevõtted
- ettevõte
- Lõpetatud
- Tingimused
- usaldus
- seadistamine
- konsool
- pidevalt
- tarbija
- kontakt
- kõnekeskus
- sisaldab
- sisu
- jätkama
- Maksma
- riik
- loob
- loomine
- kriket
- CTO
- tava
- klient
- Kliendi kogemus
- Kliendid
- kohandamine
- andmed
- vaikimisi
- annab
- demokratiseerima
- arendab
- erinev
- otse
- arutama
- arutatud
- edasimüüjate
- mitu
- domeen
- Domeenid
- vastupidavus
- leevendada
- kasutusmugavus
- tõhusalt
- kumbki
- element
- Embed
- avarii
- volitatud
- võimaldama
- lubatud
- võimaldab
- lõpp
- Lõpp-punkt
- Inglise
- tõhustatud
- Parandab
- rikastatud
- tagades
- ettevõtete
- keskkondades
- varustatud
- Isegi
- Iga
- näide
- vahetamine
- eksisteerima
- olemasolevate
- laiendatud
- laieneb
- kogemus
- laiendades
- tunnusjoon
- FUNKTSIOONID
- fail
- Faile
- filtreerida
- esimene
- Järel
- järgneb
- eest
- välis-
- vorm
- formaat
- Sihtasutus
- Alates
- täielikult
- tekitama
- generatiivne
- Generatiivne AI
- saama
- Globaalne
- globaalses mastaabis
- Eesmärgid
- õnnelik
- Olema
- he
- Held
- aitama
- aidates
- aitab
- siin
- hi
- Suur
- Avaleht
- Lahtiolekuajad
- Kuidas
- Kuidas
- HTML
- http
- HTTPS
- inim-
- Identifitseerimine
- identifitseerima
- mõju
- parandama
- paranenud
- paranemine
- parandusi
- in
- sisaldama
- Suurendama
- juhtivad
- info
- omane
- uuenduslik
- sisend
- teadmisi
- Näiteks
- sisse
- IT
- kirjed
- ITS
- töö
- liitumine
- jpg
- Json
- Võti
- keel
- Keeled
- suur
- Leads
- Õppida
- taset
- võimendav
- joon
- elama
- Elab
- armastab
- Madal
- tegema
- TEEB
- juhitud
- juhtimine
- juht
- Meedia
- Metaandmed
- miljon
- miljonid
- missioon
- viis
- mudel
- rohkem
- kõige
- vajav
- Uus
- järgmise põlvkonna
- müra
- mitte midagi
- number
- objekt
- of
- Pakkumised
- on
- ainult
- Avaneb
- optimeeritud
- or
- organisatsioonid
- Muu
- meie
- välja
- väljund
- väljundid
- väljaspool
- üle
- enda
- Parallel
- parameeter
- parameetrid
- kirglik
- mustrid
- maksed
- kohta
- jõudlus
- inimene
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängimine
- positiivselt
- post
- sisse
- Peamine
- Eelnev
- privaatsus
- tootma
- Tootjad
- Toode
- tootehaldus
- tootejuht
- tootlikkus
- omadused
- anda
- tingimusel
- annab
- jätkama
- jõudma
- tunnustamine
- viitama
- seotud
- esindamine
- esindatud
- suhtes
- vastavalt
- vastus
- kaasa
- Tulemused
- jaemüük
- Rikas
- rollid
- jooksmine
- ohutus
- sama
- Säästa
- Skaalautuvus
- Skaala
- stsenaariumid
- Seattle
- kindlustama
- turvalisus
- vaata
- segmendid
- valima
- vanem
- teenima
- teenus
- Teenused
- Komplektid
- mitu
- märkimisväärne
- märgatavalt
- lihtne
- ühekordne
- nutikas
- tarkvara
- Lahendused
- mõned
- rääkima
- Kõneleja
- kõlarid
- kõne
- Kõnetuvastus
- kõnest tekstiks
- alustatud
- olek
- Samm
- ladustamine
- salvestada
- lihtne
- Järgnevalt
- mahukas
- subtiitrid
- selline
- toetama
- süsteem
- meeskond
- Tehniline
- Tehnoloogiad
- tekst
- kui
- et
- .
- oma
- sellega
- Need
- nad
- see
- tuhandeid
- Läbi
- õigeaegne
- et
- täna
- traditsiooniliselt
- koolitatud
- koolitus
- Ümberkirjutus
- Tõlge
- reisima
- kaks
- Universaalne
- piiramatu
- avamine
- kasutama
- Kasutaja
- Kasutajad
- kasutusalad
- kasutamine
- sort
- eri
- väga
- Video
- vaated
- praktiliselt
- Külastajad
- Hääl
- Tee..
- we
- web
- veebiteenused
- teretulnud
- Hästi
- millal
- samas kui
- mis
- WHO
- will
- koos
- ilma
- Töö
- töö
- aastat
- sa
- Sinu
- sephyrnet