Amazonski prepis je popolnoma upravljana storitev samodejnega prepoznavanja govora (ASR), ki vam omogoča enostavno dodajanje zmogljivosti govora v besedilo vašim aplikacijam. Danes z veseljem napovedujemo sistem naslednje generacije z več milijardami parametrov, ki ga poganja model, ki samodejno prepoznavanje govora razširja na več Jeziki 100. V tej objavi razpravljamo o nekaterih prednostih tega sistema, o tem, kako ga podjetja uporabljajo in kako začeti. Spodaj nudimo tudi primer izpisa prepisa.
Govorni temeljni model storitve Transcribe se usposablja z najboljšimi samonadzorovanimi algoritmi za učenje inherentnih univerzalnih vzorcev človeškega govora v različnih jezikih in naglasih. Učen je na milijonih ur neoznačenih zvočnih podatkov iz več kot 100 jezikov. Recepti za usposabljanje so optimizirani s pametnim vzorčenjem podatkov za uravnoteženje podatkov o usposabljanju med jeziki, kar zagotavlja, da tudi tradicionalno premalo zastopani jeziki dosegajo visoke ravni natančnosti.
Carbyne je programsko podjetje, ki razvija v oblaku temelječe rešitve za kritične kontaktne centre za reševalce klicev v sili. Poslanstvo Carbyne je pomagati reševalcem pri reševanju življenj, jezik pa ne more ovirati njihovih ciljev. Evo, kako uporabljajo Amazon Transcribe za uresničevanje svojega poslanstva:
»Carbyne Live Audio Translation, ki ga poganja umetna inteligenca, je neposredno namenjen pomoči pri izboljšanju odziva v nujnih primerih za 68 milijonov Američanov, ki doma govorijo jezik, ki ni angleščina, poleg do 79 milijonov tujih obiskovalcev v državi letno. Z izkoriščanjem novega večjezičnega temeljnega modela Amazon Transcribe, ki ga poganja ASR, bo Carbyne še bolje opremljen za demokratizacijo urgentnih služb, ki rešujejo življenja, saj Vsak. Oseba. Šteje.”
– Alex Dizengof, soustanovitelj in tehnični direktor podjetja Carbyne.
Z izkoriščanjem modela osnove govora Amazon Transcribe zagotavlja znatno izboljšanje natančnosti med 20 % in 50 % v večini jezikov. Pri telefonskem govoru, ki je zahtevna in s podatki redka domena, je izboljšanje natančnosti med 30 % in 70 %. Poleg bistvenega izboljšanja natančnosti ta veliki model ASR zagotavlja tudi izboljšave v berljivosti z natančnejšimi ločili in velikimi črkami. S prihodom generativne umetne inteligence na tisoče podjetij uporablja Amazon Transcribe za odklepanje bogatih vpogledov v svoje zvočne vsebine. Z bistveno izboljšano natančnostjo in podporo za več kot 100 jezikov bo Amazon Transcribe pozitivno vplival na vse takšne primere uporabe. Vse obstoječe in nove stranke, ki uporabljajo Amazon Transcribe v paketnem načinu, lahko dostopajo do prepoznavanja govora, ki ga poganja model temeljnega govora, ne da bi bilo treba spreminjati končno točko API ali vhodne parametre.
Novi sistem ASR ponuja več ključnih funkcij v vseh 100+ jezikih, povezanih z enostavno uporabo, prilagajanjem, varnostjo uporabnikov in zasebnostjo. Te vključujejo funkcije, kot so samodejna ločila, besedišče po meri, samodejno prepoznavanje jezika, diarizacija govorca, rezultati zaupanja na ravni besed in filter besedišča po meri. Razširjena podpora sistema za različne poudarke, hrupna okolja in akustične pogoje vam omogoča ustvarjanje natančnejših izhodov in vam tako pomaga učinkovito vgraditi glasovne tehnologije v vaše aplikacije.
Na tisoče podjetij, ki jih omogočajo visoka natančnost Amazon Transcribe v različnih naglasih in pogojih hrupa, njegova podpora za veliko število jezikov in njegova širina naborov funkcij z dodano vrednostjo, bodo lahko odkleniti bogate vpoglede iz njihove zvočne vsebine ter povečati dostopnost in vidnost njihove zvočne in video vsebine na različnih področjih. Na primer, kontaktni centri prepisujejo in analizirajo klice strank, da prepoznajo vpoglede in posledično izboljšajo izkušnjo strank in produktivnost agentov. Proizvajalci vsebin in distributerji medijev samodejno ustvarijo podnapise z uporabo Amazon Transcribe za izboljšanje dostopnosti vsebine.
Začnite uporabljati Amazon Transcribe
Lahko uporabite Vmesnik ukazne vrstice AWS (AWS CLI), Konzola za upravljanje AWS, in različne SDK-ji za AWS za paketne transkripcije in še naprej uporabljajte isto StartTranscriptionJob
API za izboljšanje zmogljivosti izboljšanega modela ASR, ne da bi vam bilo treba spreminjati kodo ali parametre. Za več informacij o uporabi AWS CLI in konzole glejte Prepisovanje z AWS CLI in Prepisovanje s konzolo za upravljanje AWSOz.
Prvi korak je nalaganje medijskih datotek v Preprosta storitev shranjevanja Amazon (Amazon S3) bucket, storitev za shranjevanje predmetov, zgrajena za shranjevanje in pridobivanje poljubne količine podatkov od koder koli. Amazon S3 ponuja vodilno vzdržljivost, razpoložljivost, zmogljivost, varnost in praktično neomejeno razširljivost po zelo nizki ceni. Izberete lahko, da svoj prepis shranite v svoje vedro S3 ali pa naročite Amazon Transcribe, da uporabi varno privzeto vedro. Če želite izvedeti več o uporabi veder S3, glejte Ustvarjanje, konfiguriranje in delo z vedri Amazon S3.
Izhod transkripcije
Amazon Transcribe za svoj izpis uporablja predstavitev JSON. Zagotavlja rezultat prepisa v dveh različnih formatih: besedilni format in razčlenjeni format. Nič se ne spremeni glede na končno točko API ali vhodne parametre.
Besedilni format zagotavlja prepis kot blok besedila, medtem ko razčlenjeni format zagotavlja prepis v obliki pravočasno urejenih prepisanih elementov, skupaj z dodatnimi metapodatki na element. Oba formata obstajata vzporedno v izhodni datoteki.
Odvisno od funkcij, ki jih izberete pri ustvarjanju opravila prepisa, Amazon Transcribe ustvari dodatne in obogatene poglede rezultata prepisa. Oglejte si naslednji primer kode:
Pogledi so naslednji:
- Prepisi – ki ga zastopa
transcripts
element, vsebuje samo besedilni format prepisa. V scenarijih z več zvočniki in več kanali je veriženje vseh prepisov zagotovljeno kot en sam blok. - Zvočniki – ki ga zastopa
speaker_labels
element, vsebuje besedilo in razčlenjene oblike zapisov, razvrščene po govorcih. Na voljo je le, če je omogočena funkcija več zvočnikov. - Kanali – ki ga zastopa
channel_labels
vsebuje besedilo in razčlenjene formate transkripta, razvrščene po kanalih. Na voljo je le, če je omogočena funkcija več kanalov. - predmeti – ki ga zastopa
items
vsebuje le razčlenjeno obliko prepisa. V scenarijih z več zvočniki in več kanali so elementi obogateni z dodatnimi lastnostmi, ki označujejo zvočnik in kanal. - Segmenti – ki ga zastopa
segments
element, vsebuje besedilo in razčlenjene formate prepisa, razvrščene po alternativnem prepisu. Na voljo je le, če je omogočena funkcija alternativnih rezultatov.
zaključek
Pri AWS nenehno uvajamo inovacije v korist naših strank. Z razširitvijo jezikovne podpore v storitvi Amazon Transcribe na več kot 100 jezikov našim strankam omogočamo, da služijo uporabnikom iz različnih jezikovnih okolij. To ne le povečuje dostopnost, ampak tudi odpira nove poti za komunikacijo in izmenjavo informacij v svetovnem merilu. Če želite izvedeti več o funkcijah, obravnavanih v tej objavi, si oglejte stran s funkcijami in kaj je novega objava.
O avtorjih
Sumit Kumar je glavni produktni vodja, tehnična ekipa AWS AI Language Services. Ima 10 let izkušenj z upravljanjem izdelkov na različnih področjih in je navdušen nad AI/ML. Zunaj službe Sumit rad potuje in uživa v igranju kriketa in tenisa na travi.
Vivek Singh je višji vodja oddelka za upravljanje izdelkov v skupini za jezikovne storitve AWS AI. Vodi skupino izdelkov Amazon Transcribe. Preden se je pridružil AWS, je opravljal vloge produktnega menedžmenta v različnih drugih Amazonovih organizacijah, kot sta potrošniška plačila in maloprodaja. Vivek živi v Seattlu, WA in uživa v teku in pohodništvu.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :ima
- : je
- :ne
- $GOR
- 10
- 100
- 14
- 24
- 7
- a
- O meni
- dostop
- dostopnost
- natančnost
- natančna
- čez
- dodajte
- Poleg tega
- Dodatne
- prihod
- Agent
- AI
- AI / ML
- Namerjen
- alex
- algoritmi
- vsi
- skupaj
- Prav tako
- alternativa
- Amazon
- Amazonski prepis
- Amazon Web Services
- Američani
- znesek
- an
- analizirati
- in
- Objavi
- Igro
- letno
- kaj
- kjerkoli
- API
- aplikacije
- SE
- AS
- At
- audio
- Samodejno
- samodejno
- razpoložljivost
- Na voljo
- poti
- AWS
- ozadja
- Ravnovesje
- BE
- ker
- ime
- spodaj
- Prednosti
- Boljše
- med
- Block
- tako
- širina
- zgrajena
- vendar
- by
- klic
- poziva
- CAN
- Zmogljivosti
- Kapitalizacija
- primeri
- center
- centri
- izziv
- spremenite
- Spremembe
- Channel
- kanali
- preveriti
- Izberite
- So-ustanovitelj
- Koda
- Komunikacija
- Podjetja
- podjetje
- Končana
- Pogoji
- zaupanje
- konfiguriranje
- Konzole
- nenehno
- Potrošnik
- kontakt
- kontaktni center
- Vsebuje
- vsebina
- naprej
- strošek
- država
- ustvari
- Ustvarjanje
- kriket
- CTO
- po meri
- stranka
- Izkušnje s strankami
- Stranke, ki so
- customization
- datum
- privzeto
- daje
- demokratizirati
- razvija
- drugačen
- neposredno
- razpravlja
- razpravljali
- distributerji
- razne
- domena
- domen
- trajnost
- enostavnost
- Enostavnost uporabe
- učinkovito
- bodisi
- element
- Embed
- v sili
- pooblaščena
- omogočajo
- omogočena
- omogoča
- konec
- Končna točka
- Angleščina
- okrepljeno
- Izboljša
- obogatena
- zagotoviti
- podjetja
- okolja
- opremljena
- Tudi
- Tudi vsak
- Primer
- Izmenjava
- obstajajo
- obstoječih
- razširiti
- širi
- izkušnje
- razširitev
- Feature
- Lastnosti
- file
- datoteke
- filter
- prva
- po
- sledi
- za
- tuji
- obrazec
- format
- Fundacija
- iz
- v celoti
- ustvarjajo
- generativno
- Generativna AI
- dobili
- Globalno
- globalni obseg
- Cilji
- srečna
- Imajo
- he
- Hero
- pomoč
- pomoč
- Pomaga
- tukaj
- hi
- visoka
- Domov
- URE
- Kako
- Kako
- HTML
- http
- HTTPS
- človeškega
- Identifikacija
- identificirati
- vpliv
- izboljšanje
- izboljšalo
- Izboljšanje
- Izboljšave
- in
- vključujejo
- Povečajte
- vodilne
- Podatki
- inherentno
- inoviranje
- vhod
- vpogledi
- primer
- v
- IT
- Izdelkov
- ITS
- Job
- pridružil
- jpg
- json
- Ključne
- jezik
- jeziki
- velika
- Interesenti
- UČITE
- ravni
- vzvod
- vrstica
- v živo
- živi
- ljubi
- nizka
- Znamka
- IZDELA
- upravlja
- upravljanje
- upravitelj
- mediji
- metapodatki
- milijonov
- milijoni
- Mission
- način
- Model
- več
- Najbolj
- potrebujejo
- Novo
- Naslednja generacija
- hrup
- nič
- Številka
- predmet
- of
- Ponudbe
- on
- samo
- Odpre
- optimizirana
- or
- organizacije
- Ostalo
- naši
- ven
- izhod
- izhodi
- zunaj
- več
- lastne
- vzporedno
- parameter
- parametri
- strastno
- vzorci
- Plačila
- za
- performance
- oseba
- platon
- Platonova podatkovna inteligenca
- PlatoData
- igranje
- pozitivno
- Prispevek
- poganja
- , ravnateljica
- Predhodna
- zasebnost
- proizvodnjo
- Proizvajalci
- Izdelek
- upravljanje izdelkov
- produktni vodja
- produktivnost
- Lastnosti
- zagotavljajo
- če
- zagotavlja
- zasledovati
- dosežejo
- Priznanje
- glejte
- povezane
- zastopanje
- zastopan
- spoštovanje
- oziroma
- Odgovor
- povzroči
- Rezultati
- Trgovina na drobno
- Rich
- vloge
- tek
- Varnost
- Enako
- Shrani
- Prilagodljivost
- Lestvica
- scenariji
- Seattle
- zavarovanje
- varnost
- glej
- segmentih
- izberite
- višji
- služijo
- Storitev
- Storitve
- Kompleti
- več
- pomemben
- bistveno
- Enostavno
- sam
- pametna
- Software
- rešitve
- nekaj
- govorijo
- Zvočniki
- zvočniki
- govor
- Prepoznavanje govora
- govor v besedilo
- začel
- Status
- Korak
- shranjevanje
- trgovina
- naravnost
- Kasneje
- precejšen
- podnapisi
- taka
- podpora
- sistem
- skupina
- tehnični
- Tehnologije
- besedilo
- kot
- da
- O
- njihove
- s tem
- te
- jih
- ta
- tisoče
- skozi
- pravočasno
- do
- danes
- tradicionalno
- usposobljeni
- usposabljanje
- Prepis
- prevod
- potovanja
- dva
- Universal
- neomejeno
- odklepanje
- uporaba
- uporabnik
- Uporabniki
- uporablja
- uporabo
- raznolikost
- različnih
- zelo
- Video
- ogledov
- praktično
- Obiskovalci
- Voice
- način..
- we
- web
- spletne storitve
- dobrodošli
- Dobro
- kdaj
- medtem ko
- ki
- WHO
- bo
- z
- brez
- delo
- deluje
- let
- Vi
- Vaša rutina za
- zefirnet