Amazon átirat egy teljesen felügyelt automatikus beszédfelismerő (ASR) szolgáltatás, amely egyszerűvé teszi a beszéd-szövegké alakítás képességeinek hozzáadását alkalmazásaihoz. Örömmel jelentjük be a következő generációs, többmilliárd paraméterű beszéd alapmodell-alapú rendszert, amely az automatikus beszédfelismerést több mint egyre kiterjeszti. 100 nyelvek. Ebben a bejegyzésben megvitatjuk ennek a rendszernek néhány előnyeit, azt, hogy a vállalatok hogyan használják, és hogyan kezdjük el. Az alábbiakban példát is mutatunk az átírás kimenetére.
A Transcribe beszéd-alapozási modelljét a kategóriájában legjobb, önfelügyelt algoritmusok segítségével képezték ki, hogy megtanulják az emberi beszéd univerzális nyelveken és akcentusokon átívelő bennük rejlő mintáit. Több millió órányi, több mint 100 nyelvből származó, címkézetlen hangadatra van kiképezve. A képzési recepteket intelligens adatmintavételezéssel optimalizálták, hogy kiegyensúlyozzák a képzési adatokat a nyelvek között, így biztosítva, hogy a hagyományosan alulreprezentált nyelvek is nagy pontossági szintet érjenek el.
A Carbyne egy olyan szoftvercég, amely felhőalapú, kritikus kapcsolati központ megoldásokat fejleszt a segélyhívók számára. A Carbyne küldetése, hogy segítsen a segélyhívóknak életeket menteni, és a nyelv nem akadályozhatja céljaikat. Íme, hogyan használják az Amazon Transcribe-t küldetésük teljesítésére:
„A mesterséges intelligencia által működtetett Carbyne Live Audio Translation közvetlen célja, hogy segítse a sürgősségi reagálás javítását annak a 68 millió amerikainak, akik otthonukban az angoltól eltérő nyelvet beszélnek, valamint az országba évente 79 millió külföldi látogatót is. Az Amazon Transcribe új, többnyelvű, ASR-t működtető alapmodelljének kihasználásával a Carbyne még jobban fel lesz szerelve az életmentő segélyszolgálatok demokratizálására, mert minden. Személy. Számít.”
– Alex Dizengof, a Carbyne társalapítója és műszaki igazgatója.
A beszédalap-modell kihasználásával az Amazon Transcribe jelentős, 20–50%-os pontossági javulást biztosít a legtöbb nyelven. A telefonos beszéd esetében, amely egy kihívásokkal teli és adatszegény tartomány, a pontosság javulása 30% és 70% között van. A pontosság jelentős javulása mellett ez a nagyméretű ASR-modell az olvashatóságot is javítja pontosabb írásjelekkel és nagybetűkkel. A generatív mesterséges intelligencia megjelenésével vállalatok ezrei használják az Amazon Transcribe-t, hogy gazdag betekintést nyerjenek hangtartalmaikból. A jelentősen megnövekedett pontosság és több mint 100 nyelv támogatása révén az Amazon Transcribe pozitív hatással lesz minden ilyen használati esetre. Az Amazon Transcribe kötegelt módban használó összes meglévő és új ügyfél hozzáférhet a beszédalap-modell által vezérelt beszédfelismeréshez anélkül, hogy módosítania kellene az API végpontját vagy a bemeneti paramétereket.
Az új ASR rendszer számos kulcsfontosságú funkciót kínál a több mint 100 nyelven a könnyű használat, a testreszabás, a felhasználói biztonság és az adatvédelem terén. Ezek közé tartoznak az olyan szolgáltatások, mint az automatikus írásjelek, az egyéni szókincs, az automatikus nyelvazonosítás, a beszélő naplózása, a szószintű megbízhatósági pontszámok és az egyéni szókincsszűrő. A rendszer kibővített támogatása a különböző akcentusokhoz, zajkörnyezetekhez és akusztikai feltételekhez lehetővé teszi, hogy pontosabb kimeneteket állítson elő, és ezáltal segíti a hangtechnológiák hatékony beágyazását az alkalmazásokba.
Az Amazon Transcribe különféle ékezetek és zajviszonyok közötti nagy pontossága, nagyszámú nyelv támogatása, valamint a hozzáadott értékkel rendelkező funkciók széles skálája révén több ezer vállalkozás lesz képes arra, hogy gazdag betekintést nyerhet hangtartalmaikból, valamint növelheti audio- és videotartalmaik hozzáférhetőségét és felfedezhetőségét a különböző tartományokban. Például a kapcsolattartó központok átírják és elemzik az ügyfélhívásokat, hogy betekintést nyerjenek, és ezt követően javítsák az ügyfélélményt és az ügynöki termelékenységet. A tartalomgyártók és a médiaforgalmazók automatikusan létrehoznak feliratokat az Amazon Transcribe segítségével a tartalom hozzáférhetőségének javítása érdekében.
Kezdje el az Amazon Transcribe használatát
Használhatja a AWS parancssori interfész (AWS CLI), AWS felügyeleti konzol, és különböző AWS SDK-k kötegelt átírásokhoz, és továbbra is ugyanazt használja StartTranscriptionJob
API, amellyel teljesítményelőnyökhöz juthat a továbbfejlesztett ASR-modellből anélkül, hogy bármilyen kód- vagy paramétermódosítást kellene végrehajtania. Az AWS parancssori felület és a konzol használatával kapcsolatos további információkért lásd: Átírás az AWS CLI-vel és a Átírás az AWS felügyeleti konzollal, Ill.
Az első lépés a médiafájlok feltöltése egy Amazon egyszerű tárolási szolgáltatás (Amazon S3) bucket, egy objektumtároló szolgáltatás, amely bárhonnan tetszőleges mennyiségű adat tárolására és lekérésére készült. Az Amazon S3 iparágvezető tartósságot, rendelkezésre állást, teljesítményt, biztonságot és gyakorlatilag korlátlan méretezhetőséget kínál nagyon alacsony költségek mellett. Dönthet úgy, hogy az átiratát saját S3 tárolójába menti, vagy az Amazon Transcribe biztonságos alapértelmezett tárolót használ. Ha többet szeretne megtudni az S3 kanalak használatáról, lásd: Amazon S3 tárolók létrehozása, konfigurálása és a velük való munka.
Átírási kimenet
Az Amazon Transcribe JSON-reprezentációt használ a kimenethez. Az átírás eredményét két különböző formátumban biztosítja: szöveges és tételes formátumban. Semmi sem változik az API-végpont vagy a bemeneti paraméterek tekintetében.
A szöveges formátum az átiratot szövegblokkként biztosítja, míg a tételes formátum az átiratot időben rendezett átírt elemek formájában, cikkenként további metaadatokkal együtt. Mindkét formátum párhuzamosan létezik a kimeneti fájlban.
Az átírási feladat létrehozásakor kiválasztott szolgáltatásoktól függően az Amazon Transcribe további és gazdagított nézeteket hoz létre az átírási eredményről. Lásd a következő példakódot:
A nézetek a következők:
- Átiratok – Képviseli a
transcripts
elemet, csak az átirat szövegformátumát tartalmazza. Több hangszórós, többcsatornás forgatókönyvekben az összes átirat összefűzése egyetlen blokkként történik. - Hangszórók, hangfalak, hangsávok, házimozi hangrendszer – Képviseli a
speaker_labels
elemet, ez tartalmazza az átirat szövegét és tételes formátumait beszélők szerint csoportosítva. Csak akkor érhető el, ha a több hangszóró funkció engedélyezve van. - Csatornák – Képviseli a
channel_labels
elemet, csatornánként csoportosítva tartalmazza az átirat szövegét és tételes formátumait. Csak akkor érhető el, ha a többcsatornás funkció engedélyezve van. - tételek – Képviseli a
items
elemet, csak az átirat tételes formátumát tartalmazza. Több hangszórós, többcsatornás forgatókönyvekben az elemek további tulajdonságokkal gazdagodnak, jelezve a hangszórót és a csatornát. - Szegmensek – Képviseli a
segments
elem, az átirat szövegét és tételes formátumait tartalmazza, alternatív átírás szerint csoportosítva. Csak akkor érhető el, ha az alternatív eredmények funkció engedélyezve van.
Következtetés
Az AWS-nél folyamatosan újítunk ügyfeleink érdekében. Az Amazon Transcribe nyelvi támogatásának több mint 100 nyelvre való kiterjesztésével lehetővé tesszük ügyfeleink számára, hogy különféle nyelvi hátterű felhasználókat szolgáljanak ki. Ez nemcsak a hozzáférhetőséget javítja, hanem új utakat nyit meg a kommunikáció és az információcsere számára globális szinten. Ha többet szeretne megtudni az ebben a bejegyzésben tárgyalt funkciókról, nézze meg funkciók oldal és a mi új bejegyzés.
A szerzőkről
Sumit Kumar az AWS AI Language Services csapatának műszaki fő termékmenedzsere. 10 éves termékmenedzsment tapasztalattal rendelkezik számos területen, és szenvedélyesen rajong az AI/ML-ért. A munkán kívül Sumit szeret utazni, krikettezni és gyepteniszezni.
Vivek Singh az AWS AI Language Services csapatának termékmenedzsmentért felelős vezető menedzsere. Ő vezeti az Amazon Transcribe termékcsapatát. Mielőtt csatlakozott az AWS-hez, termékmenedzseri pozíciókat töltött be számos más Amazon-szervezetnél, például a fogyasztói fizetéseknél és a kiskereskedelemnél. Vivek Seattle-ben (WA) él, és szeret futni és túrázni.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :van
- :is
- :nem
- $ UP
- 10
- 100
- 14
- 24
- 7
- a
- Rólunk
- hozzáférés
- megközelíthetőség
- pontosság
- pontos
- át
- hozzá
- mellett
- További
- megérkezés
- Ügynök
- AI
- AI / ML
- célzó
- alex
- algoritmusok
- Minden termék
- mentén
- Is
- alternatív
- amazon
- Amazon átirat
- Az Amazon Web Services
- Amerikaiak
- összeg
- an
- elemez
- és a
- bejelent
- bejelenti
- Évente
- bármilyen
- bárhol
- api
- alkalmazások
- VANNAK
- AS
- At
- hang-
- Automatikus
- automatikusan
- elérhetőség
- elérhető
- utakat
- AWS
- háttérrel
- Egyenleg
- BE
- mert
- nevében
- lent
- Előnyök
- Jobb
- között
- Blokk
- mindkét
- szélesség
- épült
- de
- by
- hívás
- kéri
- TUD
- képességek
- tőkésítés
- esetek
- Központ
- Centers
- kihívást
- változik
- Változások
- csatorna
- csatornák
- ellenőrizze
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- Társalapító
- kód
- közlés
- Companies
- vállalat
- Befejezett
- Körülmények
- bizalom
- konfigurálása
- Konzol
- állandóan
- fogyasztó
- kapcsolat
- kapcsolatközpont
- tartalmaz
- tartalom
- folytatódik
- Költség
- ország
- teremt
- létrehozása
- krikett
- CTO
- szokás
- vevő
- Vásárlói élmény
- Ügyfelek
- testreszabás
- dátum
- alapértelmezett
- szállít
- demokratizálni
- fejleszt
- különböző
- közvetlenül
- megvitatni
- tárgyalt
- forgalmazók
- számos
- domain
- domainek
- tartósság
- könnyű
- egyszerű használat
- hatékonyan
- bármelyik
- elem
- Beágyaz
- vészhelyzet
- felhatalmazott
- lehetővé
- engedélyezve
- lehetővé teszi
- végén
- Endpoint
- Angol
- fokozott
- Javítja
- dúsított
- biztosítása
- Vállalatok
- környezetek
- felszerelt
- Még
- Minden
- példa
- csere
- létezik
- létező
- kiterjesztett
- kitágul
- tapasztalat
- kiterjedő
- Funkció
- Jellemzők
- filé
- Fájlok
- szűrő
- vezetéknév
- következő
- következik
- A
- külföldi
- forma
- formátum
- Alapítvány
- ból ből
- teljesen
- generál
- nemző
- Generatív AI
- kap
- Globális
- világviszonylatban
- Célok
- boldog
- Legyen
- he
- hős
- segít
- segít
- segít
- itt
- hi
- Magas
- Kezdőlap
- NYITVATARTÁS
- Hogyan
- How To
- HTML
- http
- HTTPS
- emberi
- Azonosítás
- azonosítani
- Hatás
- javul
- javított
- javulás
- fejlesztések
- in
- tartalmaz
- Növelje
- iparágvezető
- információ
- velejáró
- újító
- bemenet
- meglátások
- példa
- bele
- IT
- tételek
- ITS
- Munka
- csatlakozott
- jpg
- json
- Kulcs
- nyelv
- Nyelvek
- nagy
- vezetékek
- TANUL
- szintek
- erőfölény
- vonal
- él
- életek
- szeret
- Elő/Utó
- csinál
- KÉSZÍT
- sikerült
- vezetés
- menedzser
- Média
- Metaadatok
- millió
- Több millió
- Küldetés
- Mód
- modell
- több
- a legtöbb
- igénylő
- Új
- következő generációs
- Zaj
- semmi
- szám
- tárgy
- of
- Ajánlatok
- on
- csak
- nyit
- optimalizált
- or
- szervezetek
- Más
- mi
- ki
- teljesítmény
- kimenetek
- kívül
- felett
- saját
- Párhuzamos
- paraméter
- paraméterek
- szenvedélyes
- minták
- kifizetések
- mert
- teljesítmény
- person
- Plató
- Platón adatintelligencia
- PlatoData
- játék
- pozitívan
- állás
- powered
- Fő
- Előzetes
- magánélet
- gyárt
- Termelők
- Termékek
- termékmenedzsment
- termék menedzser
- termelékenység
- ingatlanait
- ad
- feltéve,
- biztosít
- folytatni
- el
- elismerés
- utal
- összefüggő
- képviselet
- képviselők
- tisztelet
- illetőleg
- válasz
- eredményez
- Eredmények
- kiskereskedelem
- Gazdag
- szerepek
- futás
- Biztonság
- azonos
- Megtakarítás
- skálázhatóság
- Skála
- forgatókönyvek
- Seattle
- biztonság
- biztonság
- lát
- szegmensek
- válasszuk
- idősebb
- szolgál
- szolgáltatás
- Szolgáltatások
- Szettek
- számos
- jelentős
- jelentősen
- Egyszerű
- egyetlen
- okos
- szoftver
- Megoldások
- néhány
- beszél
- Hangszóró
- hangszórók
- beszéd
- Speech Recognition
- beszéd-szöveg
- kezdődött
- Állapot
- Lépés
- tárolás
- tárolni
- egyértelmű
- Később
- lényeges
- feliratok
- ilyen
- támogatás
- rendszer
- csapat
- Műszaki
- Technologies
- szöveg
- mint
- hogy
- A
- azok
- ezáltal
- Ezek
- ők
- ezt
- ezer
- Keresztül
- időszerű
- nak nek
- Ma
- hagyományosan
- kiképzett
- Képzések
- Másolat
- Fordítás
- utazás
- kettő
- Egyetemes
- korlátlan
- kinyit
- használ
- használó
- Felhasználók
- használ
- segítségével
- fajta
- különféle
- nagyon
- videó
- nézetek
- gyakorlatilag
- látogató
- Hang
- Út..
- we
- háló
- webes szolgáltatások
- fogadtatás
- JÓL
- amikor
- mivel
- ami
- WHO
- lesz
- val vel
- nélkül
- Munka
- dolgozó
- év
- te
- A te
- zephyrnet