Tekstityksen luominen videosisällölle asettaa haasteita riippumatta siitä, kuinka suuri tai pieni organisaatio on. Vastatakseen näihin haasteisiin, Amazonin transkriptio on hyödyllinen ominaisuus, joka mahdollistaa tekstityksen luomisen suoraan palvelussa. Aloittaminen ei vaadi koneoppimista (ML) tai koodin kirjoittamista. Tämä viesti opastaa sinua määrittämään koodittoman työnkulun videotekstityksen luomiseen Amazon Transcriben avulla Amazon Web Services -tililläsi.
Tekstitykset vs. tekstitykset
Ehdot tekstitys ja suljetut kuvatekstit käytetään yleisesti vaihtokelpoisina, ja molemmat viittaavat näytöllä näkyvään puhuttuun tekstiin. Pääasiallinen ero tekstitysten ja tekstitysten välillä (perustuu alan ja saavutettavuuden määritelmiin) on kuitenkin se, että tekstitykset sisältävät sekä puhutun sanan transkription että kuvauksen taustamusiikista tai ääniraidalla esiintyvistä äänistä rikkaamman esteettömyyskokemuksen saavuttamiseksi. . Tämä viesti keskittyy vain litteroitujen puhuttujen tekstitystiedostojen luomiseen automaattisen puheentunnistustekniikan (ASR) avulla, jotka eivät sisällä puhujan tunnistusta, äänitehosteita tai musiikin kuvauksia. Amazon Transcribe tukee alan standardeja SubRip Text (*.srt) ja Web Video Text Tracks (*.vtt) -muotoja tekstityksen luominen.
Seuraava kuva näyttää esimerkin tekstityksistä, jotka on kytketty päälle verkkovideosoittimessa.
Tekstitykset hyödyttävät videoiden tekijöitä laajentamalla heidän videosisältönsä kattavuutta ja kattavuutta. Näyttämällä videon puhutun ääniosan näytöllä tekstitykset tuovat ääni-/videosisältöä suuremmalle yleisölle, mukaan lukien ne, jotka puhuvat muuta kieltä kuin ne, jotka ovat ympäristössä, jossa ääntä ei kuulu.
Vaikka tekstityksen edut ovat selvät, videoiden tekijät ovat perinteisesti kohdanneet esteitä tekstityksen luomisessa. Esteitä syntyy perinteisen luomisprosessin aikaa vievistä ja resursseja vaativista vaatimuksista, jotka vaativat suuresti manuaalista työtä. Perinteiset tekstitysmenetelmät ovat manuaalisia, ja niiden valmistuminen voi kestää päivistä viikkoihin, joten ne eivät välttämättä ole yhteensopivia kaikkien tuotantoaikataulujen kanssa. Samoin monet yritykset käyttävät manuaalisia transkriptiopalveluita, mutta nämä prosessit eivät usein skaalaudu ja ovat kalliita ylläpitää. Amazon Transcribe helpottaa puheen muuntamista tekstiksi ML-pohjaisten tekniikoiden avulla ja auttaa videoiden luojia ratkaisemaan nämä ongelmat.
Ratkaisun yleiskatsaus
Tässä viestissä käydään läpi kooditon työnkulku tekstitysten luomiseksi Amazonin yksinkertainen tallennuspalvelu (Amazon S3) ja Amazon Transcribe.
Amazon S3 on objektitallennus, joka on suunniteltu tallentamaan ja hakemaan minkä tahansa määrän tietoa mistä tahansa. Tämä viesti käy läpi prosessin luoda S3-ämpäri ja lataa äänitiedosto. Kun käyttäjät tallentavat tietoja Amazon S3:een, he käyttävät resursseja, jotka tunnetaan nimellä ämpärit ja objektit. A ämpäri on säiliö esineille. An objekti on tiedosto ja kaikki sitä kuvaavat metatiedot.
Amazon Transcribe on ASR-palvelu, joka käyttää täysin hallittuja ja jatkuvasti koulutettuja ML-malleja muuntaakseen ääni-/videotiedostoja tekstiksi. Amazon Transcribe -tulot ja -lähdöt on tallennettu Amazon S3:een. Amazon Transcribe ottaa äänidatan, joko mediatiedoston Amazon S3 -ämpäriin tai mediavirran, ja muuntaa sen tekstidataksi. Amazon Transcriben avulla voit syöttää äänisyötteen, tuottaa helposti luettavia transkriptioita suurella tarkkuudella, mukauttaa tulostuksesi verkkotunnuskohtaista sanastoa varten käyttämällä mukautetut kielimallit (CLM) ja mukautetut sanastotja suodattaa sisältöä asiakkaiden tietosuojan varmistamiseksi. Asiakkaat voivat käyttää Amazon Transcribea useisiin yrityssovelluksiin, mukaan lukien puhepohjaisten asiakaspalvelupuheluiden transkriptio, tekstityksen luominen ääni-/videosisällölleja suorittaa (tekstipohjaista) sisältöanalyysiä ääni-/videosisällössä. Tässä viestissä esittelemme transkriptiotyön luomista ja työn tulosten tarkistamista.
Jos haluat videon esittelyn, katso Amazon Transcribe -videovälipalajakso Videon tekstityksen luominen ilman koodin kirjoittamista.
Edellytykset
Jotta voit käydä ratkaisun läpi, sinulla on oltava seuraavat edellytykset:
- An AWS-tili riittävällä AWS-henkilöllisyyden ja käyttöoikeuksien hallinta (IAM) käyttöoikeudet
- Ääni-/videotiedosto, jossa on puhuttuja sanoja Amazon Transcribe -tuettu kieli ja a tuettu syöttömuoto
Jos sinulla ei vielä ole esimerkkiääni-/videotiedostoa, voit luoda sellaisen tietokoneen tai älypuhelimen videotallennussovelluksella. Varmista, että puhut selkeästi mikrofoniin varmistaaksesi parhaan mahdollisen transkription laadun tallennuksen aikana. Toinen vaihtoehto on löytää ilmainen lataus, joka sisältää puhuttua sanaa, kuten podcasttai tässä viestissä oleva video esittely, jonka Amazon Transcribe voi käyttää. Tallennetun tai ladatun tiedoston on oltava käytettävissä työpöydälläsi, jotta se voidaan ladata AWS-tilillesi.
Ennen kuin aloitat, tarkista Amazonin transkriptio ja Amazon S3 palvelun hinnoittelun hintasivut.
Luo S3-kauhat
Tätä viestiä varten luomme kaksi S3-ämpäriä pitääksemme tulon ja lähdön erillään.
- Valitse Amazon S3 -konsolissa Luo ämpäri.
- Anna jokaiselle ämpärille maailmanlaajuisesti ainutlaatuinen nimi.
- Käytä oletusasetuksia varmistaaksesi organisaatiosi käytäntöjen noudattamisen.
- Enable ämpäriversiointi ja oletusarvoinen palvelinpuolen salaus (Suositus).
- Valita Luo ämpäri.
Seuraava kuvakaappaus näyttää syöttöalueen kokoonpanon.
S3-syötteen ämpäri on nyt valmis ääni-/videotiedoston lataamista varten. Tämän julkaisun aikaan Amazon Transcriben enimmäissyöttökoko on 2 Gt. Jos videotiedosto ylittää tämän määrän tai on a muodossa, jota Amazon Transcribe ei tue natiivisti, harkitse käyttöä AWS Elemental MediaConvert että luoda vain äänilähtö. Tämä on hyödyllistä, koska äänitiedostot ovat tyypillisesti paljon pienempiä kuin videotiedostot ja Amazon Transcribe vaatii vain ääniraidan, ei videoraitaa, transkriptioiden ja tekstitysten luomiseen.
Lataa lähdetiedosto S3-ämpäriin
Voit ladata lähdetiedoston suorittamalla seuraavat vaiheet:
- Valitse syöttöalue Amazon S3 -konsolissa.
- Valita Lataa.
- Valitse tiedosto työpöydältä.
- Hyväksy oletustallennusluokka ja salausasetukset tai muokkaa niitä organisaatiosi käytäntöjen mukaisesti.
- Valita Lataa.
Luo transkriptiotyö
Kun syöttötiedosto on valmis Amazon S3:ssa, luomme nyt transkriptiotyön Amazon Transcribessa.
- On Amazon Transcribe -konsoli, valitse Litterointityöt navigointipaneelissa.
- Valita Luo työpaikka.
Tämä läpikäynti käyttää suurelta osin oletusasetuksia; Sinun tulee kuitenkin valita organisaatiosi vaatimuksiin parhaiten sopiva kokoonpano.
- varten Nimi, kirjoita nimi tälle työlle ja tuloksena olevalle tiedostolle.
- varten Kieliasetuksetvalitse Tietty kieli.
- varten Kieli, valitse syöttötiedoston lähdekieli.
- varten Mallityyppi¸ valitse Yleinen malli.
Käytämme tässä esittelyssä yleistä mallia, mutta suosittelemme tutustumaan koulutukseen ja käyttöön mukautetut kielimallit parantaa tarkkuutta tietyissä käyttötapauksissa, kuten toimialakohtaisissa termeissä tai lyhenteissä. Jos haluat syventää mukautettuja kielimalleja, katso Amazon Transcribe -videovälipala Mukautettujen kielimallien (CLM) käyttö transkription tarkkuuden parantamiseksi.
- varten Syötä tiedoston sijainti S3:ssa, valitse Selaa S3: ta.
- Valitse litteroitava syöttöalue ja ääni-/videotiedosto.
- varten Lähtötietojen sijaintityypin tiedotvalitse Asiakkaan määrittelemä S3-kauha.
- varten Tulosta tiedoston kohde S3:lle, valitse Selaa S3: ta.
- Valitse juuri luotu tulostusalue.
- Tekstityksen tiedostomuoto osio tarjoaa kaksi tärkeintä vaihtoehtoa koko viestissä. Voit valita *.srt- ja *.vtt-muotoiset tulosteet osaksi Amazon Transcribe -transkriptiotyötä. Tätä kirjoitettaessa toisen tai molempien valitseminen ei lisää Amazon Transcribe -työhön lisäkustannuksia.
Tämä arvo viittaa peräkkäisen ensimmäisen tekstityksen aloitusnumeroon. Jos et ole varma, mikä arvo valita, 1 on yleisin.
- Kun asetukset ovat paikoillaan, valitse seuraava.
- Määritä mahdolliset valinnaiset asetukset tarpeidesi mukaan.
Amazon Transcribe tarjoaa vaihtoehtoja äänen tunnistamiseen kanavat or kaiuttimet, vaihtoehtoisia tuloksia, PII:n muokkaus, sanaston suodatusja mukautettu sanasto. Tässä viestissä voit ohittaa nämä määritysvaihtoehdot. Jos haluat syventää työn määritysvaihtoehtoja, katso Amazon Transcribe -videovälipalajaksot mukautettu sanasto, mukautetut kielimallitja sanaston suodatus.
Tarkista työn tulos
Transkriptiotyö videon tekstityksen luomiseksi alkaa. Työn tila, kuten seuraavassa kuvakaappauksessa näkyy, näkyy työn tietopaneelissa. Kun työ on valmis, valitse lähtötietojen sijainti löytääksesi äskettäin luodut tekstitykset S3-alueesta.
Tekstitykset tunnistetaan *.srt- tai *.vtt-laajennuksista. Kun valitset kohteen S3-ämpäristä, sinulla on mahdollisuus ladata tiedosto.
Koska nämä tekstitykset ovat pelkkää tekstiä, mikä tahansa tekstieditori voi tarkastella ja muokata tuloksena olevaa transkriptiota. *.srt- ja *.vtt-tiedostojen vertaaminen paljastaa monia yhtäläisyyksiä ja pieniä eroja.
Seuraavassa on esimerkki *.srt-muodosta:
Seuraavassa on esimerkki *.vtt-muodosta:
Numerot osoittavat järjestyksen, jossa tekstitys näkyy. Aikakoodi osoittaa, milloin tekstitys on näkyvissä. Teksti on itse tekstitysteksti.
Kaikki muutokset tai versiot ovat nyt mahdollisia suoraan tekstieditorissa, ja ne ovat yhteensopivia, kun ne tallennetaan *.srt- tai *.vtt-laajennuksella. Voit myös esikatsella muutoksia itse videoalustalla, videonmuokkaussovelluksessa tai videosoittimessa.
VLC on suosittu avoimen lähdekoodin ja monialustainen videosoitin, joka tukee *.srt- ja *.vtt-tekstitystä. Toistaaksesi tekstitykset automaattisesti VLC:ssä olevan videon yli, aseta sekä alkuperäinen video että tekstitystiedosto samaan hakemistoon täsmälleen samalla tiedostonimellä ennen tiedostotunnistetta.
Nyt kun avaat videotiedoston VLC:ssä, tekstitystiedoston pitäisi tunnistaa ja toistaa automaattisesti videosoitin-ikkunassa.
Puhdistaa
Vältäksesi tulevia maksuja, tyhjä ja poistaa tuloon ja ulostuloon käytetyt S3-kauhat. Varmista, että sinulla on kaikki tarvittavat tiedostot tallennettuna, sillä tämä poistaa pysyvästi kaikki ämpärien sisältämät objektit. Käytössä Literaattikonsoli, valitse ja poista työt, joita ei enää tarvita.
Yhteenveto
Olet nyt luonut täydellisen päästä päähän -tekstityksen luontityönkulun tehostaaksesi ja nopeuttaaksesi videon tekstityksen luontiprosessia, ja kaikki ilman koodin kirjoittamista. Loit muutamassa minuutissa S3-tallennusämpärit, latasit tiedoston Amazon S3:een ja käytit Amazon Transcribea tekstityksen luomiseen. Voit sitten ladata tuloksena saadut *.srt- ja *.vtt-tekstitystiedostot tarkistettavaksi ja ladata ne kohdealustalle.
Tämä työnkulku keskittyi äänen/videon tekstityksiin, jotka on luotu käyttämällä Amazon Transcriben automaattista puheentunnistustekniikkaa (ASR) erityisesti videotyönkulkuja varten. Tämä työnkulku ei yksinään korvaa ihmispohjaista tekstitysprosessia, joka pystyy täyttämään korkeammat esteettömyysstandardit, mukaan lukien kaiuttimen tunnistaminen, äänitehosteet, musiikin kuvaus ja kopiointitarkistus. Voit käyttää tässä viestissä kuvattua tekstinmuokkausmenetelmää lisätäksesi nämä elementit, kun alkuperäinen Amazon Transcribe -työ on valmis. Lisäksi voit tutkia edistyneempää selainpohjaista tekstityksen luomista, esikatselua ja kopiointia. Sisällön lokalisointi AWS:ssä ratkaisu, jonka AWS Solution Architects on tarkistanut ja joka sisältää toteutusopas. Tämä ratkaisu tarjoaa lisäominaisuuksia, kuten selaimen esikatselu ja tekstitysten muokkaus, tekstityksen käännös powered by Amazon Käännä, ja tarjoamat tietokonenäköominaisuudet Amazonin tunnistus.
Jos pidit tästä esittelystä Amazon Transcriben kyvystä luoda tekstityksiä, harkitse lisäominaisuuksien ja -ominaisuuksien syventämistä nopeuttaaksesi ääni- ja videotyönkulkuasi. Katso lisätietoja ja koodiesimerkkejä tekstityksen luomisen automatisoinnista ja skaalauksesta Videon tekstityksen luominen. Onnea tutkimiseen ja tekstityksen luomisen työnkulkuun.
kirjailijasta
Jason O'Malley on AWS:n vanhempi kumppaniratkaisuarkkitehti, joka tukee media-, viestintä- ja teknologiateollisuuden ratkaisuja suunnittelevia kumppaneita. Ennen AWS:ään liittymistään Jason vietti 13 vuotta media- ja viihdeteollisuudessa sellaisissa yrityksissä, kuten Conan O'Brien's Team Coco, WarnerMedia ja Media.Monks. Jason aloitti uransa televisiotuotannossa ja jälkituotannossa ennen kuin rakensi median työtaakkaa AWS:lle. Kun Jason ei luo ratkaisuja kumppaneille ja asiakkaille, hänet voidaan löytää seikkailemasta vaimonsa ja poikansa kanssa tai lukemassa kestävästä kehityksestä.
- Coinsmart. Euroopan paras Bitcoin- ja kryptopörssi.
- Platoblockchain. Web3 Metaverse Intelligence. Tietoa laajennettu. VAPAA PÄÄSY.
- CryptoHawk. Altcoinin tutka. Ilmainen kokeilu.
- Lähde: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- Meistä
- kiihdyttää
- pääsy
- saavutettavuus
- Tili
- lisä-
- osoite
- kehittynyt
- Kaikki
- jo
- Amazon
- Amazon Web Services
- määrä
- Toinen
- kaikkialla
- Hakemus
- sovellukset
- yleisö
- audio-
- automaattisesti
- automatisointi
- saatavissa
- AWS
- tausta
- hyödyttää
- Hyödyt
- PARAS
- reunus
- Rakentaminen
- liiketoiminta
- Business Applications
- kyvyt
- kuvatekstit
- Ura
- tapauksissa
- haasteet
- maksut
- Valita
- luokka
- suljettu
- koodi
- Yhteinen
- Yhteydenpito
- Yritykset
- monimutkainen
- noudattaminen
- tietokone
- Konfigurointi
- Console
- Kontti
- pitoisuus
- luoda
- luotu
- Luominen
- luominen
- luojat
- asiakassuhde
- asiakas
- Asiakaspalvelu
- Asiakkaat
- tiedot
- syvempää
- osoittaa
- levityspinnalta
- on kuvattu
- pöytä-
- yksityiskohdat
- kehittämällä
- vaikea
- suoraan
- ei
- verkkotunnuksen
- download
- toimittaja
- vaikutukset
- vaivaa
- elementtejä
- kannustaa
- salaus
- enter
- Viihde
- ympäristö
- olennainen
- esimerkki
- experience
- tutkimus
- tutkia
- laajennukset
- kohtasi
- Ominaisuus
- Ominaisuudet
- Etunimi
- keskityttiin
- keskittyy
- jälkeen
- muoto
- Eteenpäin
- löytyi
- tulevaisuutta
- general
- tuottaa
- tuottaa
- Maailmanlaajuisesti
- hyvä
- hyödyllinen
- auttaa
- Korkea
- korkeampi
- vuokraus
- Miten
- Kuitenkin
- HTTPS
- valtava
- Tunnistaminen
- Identiteetti
- kuva
- toteuttaa
- parani
- sisältää
- Mukaan lukien
- Osallisuus
- indeksi
- teollisuus
- panos
- yhdistää
- kysymykset
- IT
- itse
- Job
- Työpaikat
- tunnettu
- Kieli
- suurempi
- oppiminen
- Taso
- sijainti
- onni
- kone
- koneoppiminen
- ylläpitää
- TEE
- onnistui
- tapa
- manuaalinen
- käsin
- asia
- Media
- menetelmät
- ML
- malli
- mallit
- lisää
- eniten
- Musiikki
- suunnistus
- välttämätön
- numero
- numerot
- tarjotaan
- Tarjoukset
- avata
- Vaihtoehto
- Vaihtoehdot
- tilata
- organisaatio
- osa
- erityinen
- kumppani
- kumppani
- foorumi
- Pelaa
- soitin
- pelaa
- politiikkaa
- kehno
- Suosittu
- mahdollinen
- preview
- hinnoittelu
- ensisijainen
- prosessi
- Prosessit
- tuottaa
- tuotanto
- tarjoaa
- laatu
- tavoittaa
- Lukeminen
- jäädä
- tarvitaan
- vaatimukset
- Esittelymateriaalit
- tulokset
- arviot
- Asteikko
- skaalaus
- Näytön
- palvelu
- Palvelut
- asetus
- esitetty
- Yksinkertainen
- Koko
- pieni
- älypuhelin
- vankka
- ratkaisu
- Ratkaisumme
- Joku
- poika
- Kaiutin
- kaiuttimet
- erityisesti
- standardi
- standardit
- Alkaa
- alkoi
- alkaa
- Tila
- Levytila
- verkkokaupasta
- virta
- tuki
- Tuetut
- Tukea
- Tukee
- kestävyys
- ottaen
- joukkue-
- Technologies
- Elektroniikka
- televisio
- Lähde
- siksi
- Kautta
- aika
- aikaavievä
- Otsikko
- raita
- perinteinen
- perinteisesti
- koulutus
- Kääntäminen
- tyypillisesti
- unique
- käyttää
- Käyttäjät
- käyttää
- arvo
- lajike
- seulottu
- Video
- Näytä
- visio
- Katso
- verkko
- verkkopalvelut
- vaikka
- sisällä
- ilman
- sanoja
- Referenssit
- kirjoittaminen
- vuotta
- tuotto
- youtube