Amazonin transkriptio on täysin hallittu automaattinen puheentunnistuspalvelu (ASR), jonka avulla voit helposti lisätä puheesta tekstiksi -ominaisuuksia sovelluksiisi. Tänään meillä on ilo ilmoittaa seuraavan sukupolven monen miljardin parametrin puheperusmalliin perustuvasta järjestelmästä, joka laajentaa automaattisen puheentunnistuksen yli 100-kielellä.. Tässä viestissä keskustelemme joistakin tämän järjestelmän eduista, kuinka yritykset käyttävät sitä ja miten pääset alkuun. Annamme alla myös esimerkin transkriptiotuloksesta.
Transcriben puheperusmalli on koulutettu käyttämällä luokkansa parhaita, itsevalvottuja algoritmeja ihmisten puheen luontaisten universaalien mallien oppimiseksi eri kielillä ja aksenteilla. Se on koulutettu miljoonia tunteja merkitsemättömälle äänidatalle yli 100 kielestä. Harjoitusreseptit on optimoitu älykkään datanäytteenoton avulla tasapainottamaan harjoitusdataa kielten välillä, mikä varmistaa, että myös perinteisesti aliedustetut kielet saavuttavat korkean tarkkuustason.
Carbyne on ohjelmistoyritys, joka kehittää pilvipohjaisia, kriittisiä yhteyskeskusratkaisuja hätäpuheluille. Carbynen tehtävänä on auttaa pelastushenkilöstöä pelastamaan ihmishenkiä, eikä kieli voi häiritä heidän tavoitteitaan. Näin he käyttävät Amazon Transcribea tehtäviensä toteuttamiseen:
"Tekoälykäyttöisen Carbyne Live Audio Translationin tarkoituksena on suoraan auttaa parantamaan hätäapua 68 miljoonalle amerikkalaiselle, jotka puhuvat muuta kieltä kuin englantia kotonaan, lisäksi maassa vierailee vuosittain jopa 79 miljoonaa ulkomaalaista vierasta. Hyödyntämällä Amazon Transcriben uutta monikielistä perusmallia, joka on varustettu ASR:llä, Carbyne on entistä paremmin varusteltu demokratisoimaan hengenpelastuspalveluita, koska jokainen. Henkilö. Laskee.”
– Alex Dizengof, Carbynen perustaja ja teknologiajohtaja.
Hyödyntämällä puheperusmallia, Amazon Transcribe tarjoaa merkittävän 20–50 prosentin tarkkuuden parannuksen useimmilla kielillä. Puhelinpuheessa, joka on haastava ja niukasti dataa sisältävä alue, tarkkuusparannus on 30–70 prosenttia. Huomattavan tarkkuuden parantamisen lisäksi tämä suuri ASR-malli parantaa myös luettavuutta tarkemmilla välimerkeillä ja isoilla kirjaimilla. Generatiivisen tekoälyn myötä tuhannet yritykset käyttävät Amazon Transcribea avatakseen monipuolisia oivalluksia äänisisällöstään. Huomattavasti parannetun tarkkuuden ja yli 100 kielen tuen ansiosta Amazon Transcribe vaikuttaa myönteisesti kaikkiin tällaisiin käyttötapauksiin. Kaikki nykyiset ja uudet asiakkaat, jotka käyttävät Amazon Transcribea erätilassa, voivat käyttää puheen perustan mallipohjaista puheentunnistusta tarvitsematta muuttaa API-päätepistettä tai syöttöparametreja.
Uusi ASR-järjestelmä tarjoaa useita keskeisiä ominaisuuksia kaikilla yli 100 kielellä, jotka liittyvät helppokäyttöisyyteen, mukauttamiseen, käyttäjien turvallisuuteen ja yksityisyyteen. Näitä ominaisuuksia ovat esimerkiksi automaattiset välimerkit, mukautettu sanasto, automaattinen kielentunnistus, puhujien päiväkirja, sanatason luottamuspisteet ja mukautettu sanastosuodatin. Järjestelmän laajennettu tuki erilaisille korostuksille, meluympäristöille ja akustisille olosuhteille mahdollistaa tarkempien tulosteiden tuottamisen ja auttaa siten upottamaan ääniteknologioita tehokkaasti sovelluksiisi.
Amazon Transcriben korkea tarkkuus eri korostuksilla ja meluolosuhteilla, sen tuki useille kielille ja laaja lisäarvoa tuottava ominaisuussarja mahdollistaa tuhannet yritykset avata monipuolisia oivalluksia heidän äänisisällöstään sekä parantaa heidän ääni- ja videosisältönsä käytettävyyttä ja löydettävyyttä eri aloilla. Yhteyskeskukset esimerkiksi litteroivat ja analysoivat asiakaspuhelut tunnistaakseen oivalluksia ja parantaakseen asiakaskokemusta ja agentin tuottavuutta. Sisällöntuottajat ja median jakelijat luovat automaattisesti tekstityksiä Amazon Transcriben avulla sisällön saatavuuden parantamiseksi.
Aloita Amazon Transcriben käyttö
Voit käyttää AWS-komentoriviliitäntä (AWS CLI), AWS-hallintakonsolija erilaisia AWS SDK: t erätranskriptioille ja jatka samaa käyttöä StartTranscriptionJob
API saadaksesi suorituskykyetuja parannetusta ASR-mallista ilman, että sinun tarvitsee tehdä koodin tai parametrien muutoksia. Lisätietoja AWS CLI:n ja konsolin käytöstä on kohdassa Transkriboidaan AWS CLI:llä ja Transkriptio AWS-hallintakonsolillaVastaavasti.
Ensimmäinen askel on ladata mediatiedostot tiedostoon Amazonin yksinkertainen tallennuspalvelu (Amazon S3) bucket, objektitallennuspalvelu, joka on suunniteltu tallentamaan ja hakemaan minkä tahansa määrän tietoa mistä tahansa. Amazon S3 tarjoaa alan johtavan kestävyyden, saatavuuden, suorituskyvyn, turvallisuuden ja käytännössä rajattoman skaalautuvuuden erittäin alhaisilla kustannuksilla. Voit tallentaa transkription omaan S3-säilöön tai pyytää Amazon Transcribea käyttämään suojattua oletussäilöä. Lisätietoja S3-kauhojen käytöstä on kohdassa Amazon S3 -ämpärien luominen, määrittäminen ja käyttäminen.
Transkriptiotulostus
Amazon Transcribe käyttää tulostukseensa JSON-esitystä. Se tarjoaa transkriptiotuloksen kahdessa eri muodossa: tekstimuodossa ja eriteltyssä muodossa. Mikään ei muutu suhteessa API-päätepisteeseen tai syöttöparametreihin.
Tekstimuoto tarjoaa transkription tekstilohkona, kun taas eritelty muoto tarjoaa transkription oikea-aikaisesti tilattujen litteroitujen kohteiden muodossa sekä lisämetatietoja kohdetta kohti. Molemmat muodot ovat rinnakkain tulostiedostossa.
Riippuen ominaisuuksista, jotka valitset transkriptiotyötä luodessasi, Amazon Transcribe luo lisänäkymiä transkriptiotuloksesta. Katso seuraava esimerkkikoodi:
Näkemykset ovat seuraavat:
- Tekstitystiedostojen – Edustaja
transcripts
elementti, se sisältää vain transkription tekstimuodon. Monen kaiuttimen ja monikanavaisissa skenaarioissa kaikkien transkriptien ketjutus tarjotaan yhtenä lohkona. - kaiuttimet – Edustaja
speaker_labels
elementti, se sisältää tekstin ja transkription eritellyt muodot puhujien mukaan ryhmiteltynä. Se on käytettävissä vain, kun monikaiutinominaisuus on käytössä. - Kanavat – Edustaja
channel_labels
elementti, se sisältää tekstin ja transkription eritellyt muodot kanavakohtaisesti ryhmiteltynä. Se on käytettävissä vain, kun monikanavaominaisuus on käytössä. - kohdetta – Edustaja
items
elementti, se sisältää vain transkription eritellyn muodon. Monen kaiuttimen ja monikanavaisissa skenaarioissa kohteet on rikastettu lisäominaisuuksilla, jotka osoittavat kaiuttimen ja kanavan. - Segmentit – Edustaja
segments
elementti, se sisältää tekstin ja transkription eritellyt muodot ryhmiteltynä vaihtoehtoisen transkription mukaan. Se on käytettävissä vain, kun vaihtoehtoiset tulokset -ominaisuus on käytössä.
Yhteenveto
Me AWS:llä innovoimme jatkuvasti asiakkaidemme puolesta. Laajentamalla Amazon Transcriben kielituen yli 100 kielelle annamme asiakkaillemme mahdollisuuden palvella käyttäjiä erilaisista kielitaustoista. Tämä ei ainoastaan lisää saavutettavuutta, vaan myös avaa uusia väyliä viestintään ja tiedonvaihtoon maailmanlaajuisesti. Saat lisätietoja tässä viestissä käsitellyistä ominaisuuksista tutustumalla ominaisuudet -sivu ja mitä uutta postausta.
Tietoja kirjoittajista
Sumit Kumar on AWS AI Language Services -tiimin päätuotepäällikkö, tekninen. Hänellä on 10 vuoden tuotehallinnan kokemus useilta eri aloilta ja hän on intohimoinen tekoälyn/ML:n suhteen. Työn ulkopuolella Sumit rakastaa matkustamista ja nauttii kriketistä ja tennistä.
Vivek Singh on AWS AI Language Services -tiimin tuotehallinnan johtaja. Hän johtaa Amazon Transcribe -tuotetiimiä. Ennen AWS:lle tuloaan hän toimi tuotehallintatehtävissä useissa muissa Amazon-organisaatioissa, kuten kuluttajamaksuissa ja vähittäiskaupassa. Vivek asuu Seattlessa, WA ja nauttii juoksemisesta ja vaelluksesta.
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :on
- :On
- :ei
- $ YLÖS
- 10
- 100
- 14
- 24
- 7
- a
- Meistä
- pääsy
- saavutettavuus
- tarkkuus
- tarkka
- poikki
- lisätä
- Lisäksi
- lisä-
- tulo
- Agentti
- AI
- AI / ML
- jonka tarkoituksena
- alex
- algoritmit
- Kaikki
- pitkin
- Myös
- vaihtoehto
- Amazon
- Amazonin transkriptio
- Amazon Web Services
- Amerikkalaiset
- määrä
- an
- analysoida
- ja
- Ilmoittaa
- ilmoittaa
- Vuosittain
- Kaikki
- kaikkialla
- api
- sovellukset
- OVAT
- AS
- At
- audio-
- automaattisesti
- automaattisesti
- saatavuus
- saatavissa
- väyliä
- AWS
- taustat
- Balance
- BE
- koska
- puolesta
- alle
- Hyödyt
- Paremmin
- välillä
- Tukkia
- sekä
- leveys
- rakennettu
- mutta
- by
- soittaa
- Puhelut
- CAN
- kyvyt
- arvo
- tapauksissa
- keskus
- keskuksissa
- haastava
- muuttaa
- Muutokset
- Kanava
- kanavat
- tarkastaa
- Valita
- Perustaja
- koodi
- Viestintä
- Yritykset
- yritys
- Valmistunut
- olosuhteet
- luottamus
- konfigurointi
- Console
- alituisesti
- kuluttaja
- ottaa yhteyttä
- yhteyskeskukseen
- sisältää
- pitoisuus
- jatkaa
- Hinta
- maa
- luo
- Luominen
- kriketti
- CTO
- asiakassuhde
- asiakas
- asiakaskokemus
- Asiakkaat
- räätälöinnin
- tiedot
- oletusarvo
- Antaa
- demokratisoida
- kehittää
- eri
- suoraan
- pohtia
- keskusteltiin
- jakelijat
- useat
- verkkotunnuksen
- verkkotunnuksia
- kestävyys
- helpottaa
- helppokäyttöisyys
- tehokkaasti
- myöskään
- elementti
- Upottaa
- hätä
- valtuudet
- mahdollistaa
- käytössä
- mahdollistaa
- loppu
- päätepiste
- Englanti
- tehostettu
- Parantaa
- rikastettu
- varmistamalla
- yrityksille
- ympäristöissä
- varustettu
- Jopa
- Joka
- esimerkki
- Vaihdetaan
- olla
- olemassa
- laajeni
- laajenee
- experience
- ulottuu
- Ominaisuus
- Ominaisuudet
- filee
- Asiakirjat
- suodattaa
- Etunimi
- jälkeen
- seuraa
- varten
- ulkomainen
- muoto
- muoto
- perusta
- alkaen
- täysin
- tuottaa
- generatiivinen
- Generatiivinen AI
- saada
- Global
- maailmanlaajuinen mittakaava
- Tavoitteet
- onnellinen
- Olla
- he
- sankari
- auttaa
- auttaa
- auttaa
- tätä
- hi
- Korkea
- Etusivu
- TUNTIA
- Miten
- Miten
- HTML
- http
- HTTPS
- ihmisen
- Tunnistaminen
- tunnistaa
- Vaikutus
- parantaa
- parani
- parannus
- parannuksia
- in
- sisältää
- Kasvaa
- alan johtava
- tiedot
- luontainen
- innovoidaan
- panos
- oivalluksia
- esimerkki
- tulee
- IT
- kohdetta
- SEN
- Job
- tuloaan
- jpg
- json
- avain
- Kieli
- kielet
- suuri
- Liidit
- OPPIA
- tasot
- vipuvaikutuksen
- linja
- elää
- Lives
- rakastaa
- Matala
- tehdä
- TEE
- onnistui
- johto
- johtaja
- Media
- Metadata
- miljoona
- miljoonia
- Tehtävä
- tila
- malli
- lisää
- eniten
- tarvitsevat
- Uusi
- seuraavan sukupolven
- Melu
- ei mitään
- numero
- objekti
- of
- Tarjoukset
- on
- vain
- avautuu
- optimoitu
- or
- organisaatioiden
- Muut
- meidän
- ulos
- ulostulo
- lähdöt
- ulkopuolella
- yli
- oma
- Parallel
- parametri
- parametrit
- intohimoinen
- kuviot
- maksut
- varten
- suorituskyky
- henkilö
- Platon
- Platonin tietotieto
- PlatonData
- pelaa
- positiivisesti
- Kirje
- powered
- Pääasiallinen
- Aikaisempi
- yksityisyys
- tuottaa
- tuottajat
- Tuotteet
- tuotehallinta
- tuotepäällikkö
- tuottavuus
- ominaisuudet
- toimittaa
- mikäli
- tarjoaa
- jatkaa
- tavoittaa
- tunnustaminen
- katso
- liittyvä
- edustus
- edustettuina
- kunnioittaminen
- vastaavasti
- vastaus
- johtua
- tulokset
- vähittäiskauppa
- Rikas
- roolit
- juoksu
- Turvallisuus
- sama
- Säästä
- skaalautuvuus
- Asteikko
- skenaariot
- Seattle
- turvallinen
- turvallisuus
- nähdä
- segmentit
- valita
- vanhempi
- palvella
- palvelu
- Palvelut
- Setit
- useat
- merkittävä
- merkittävästi
- Yksinkertainen
- single
- fiksu
- Tuotteemme
- Ratkaisumme
- jonkin verran
- puhua
- Kaiutin
- kaiuttimet
- puhe
- Puheentunnistus
- puheen tekstiksi
- alkoi
- Tila
- Vaihe
- Levytila
- verkkokaupasta
- suora
- Myöhemmin
- merkittävä
- tekstitys
- niin
- tuki
- järjestelmä
- joukkue-
- Tekninen
- Technologies
- teksti
- kuin
- että
- -
- heidän
- siten
- Nämä
- ne
- tätä
- tuhansia
- Kautta
- ajankohtainen
- että
- tänään
- perinteisesti
- koulutettu
- koulutus
- Jäljennös
- Kääntäminen
- matkustaa
- kaksi
- Yleismaailmallinen
- rajoittamaton
- avata
- käyttää
- käyttäjä
- Käyttäjät
- käyttötarkoituksiin
- käyttämällä
- lajike
- eri
- hyvin
- Video
- näkymät
- käytännössä
- Vierailijat
- Ääni
- Tapa..
- we
- verkko
- verkkopalvelut
- tervetuloa
- HYVIN
- kun
- taas
- joka
- KUKA
- tulee
- with
- ilman
- Referenssit
- työskentely
- vuotta
- Voit
- Sinun
- zephyrnet