Subtiitrite loomine videosisule esitab väljakutseid olenemata sellest, kui suur või väike organisatsioon on. Nende väljakutsetega toimetulemiseks Amazoni transkribeerimine sisaldab abistavat funktsiooni, mis võimaldab luua subtiitreid otse teenuses. Alustamiseks pole vaja masinõpet (ML) ega koodi kirjutamist. See postitus juhendab teid koodita töövoo seadistamisel video subtiitrite loomiseks Amazon Transcribe'i abil teie Amazon Web Services'i kontol.
Subtiitrid vs subtiitrid
Tingimused subtiitrid ja suletud pealdised kasutatakse tavaliselt vaheldumisi ja mõlemad viitavad ekraanil kuvatavale suulisele tekstile. Peamine erinevus subtiitrite ja subtiitrite vahel (põhineb tööstusharu ja juurdepääsetavuse määratlustel) seisneb aga selles, et subtiitrid sisaldavad nii öeldud sõna transkriptsiooni kui ka taustamuusika või heliribal esinevate helide kirjeldust, et pakkuda rikkalikumat juurdepääsetavust. . See postitus keskendub ainult transkribeeritud suulise sõna subtiitrifailide loomisele automaatse kõnetuvastuse (ASR) tehnoloogia abil, mis ei sisalda kõlarite tuvastamist, heliefekte ega muusika kirjeldusi. Amazon Transcribe toetab tööstusharu standardseid SubRip Text (*.srt) ja Web Video Text Tracks (*.vtt) vorminguid subtiitrite loomine.
Järgmisel pildil on näide veebivideopleieris sisse lülitatud subtiitrite kohta.
Subtiitrid toovad videoloojatele kasu, laiendades nii nende videosisu ulatust kui ka kaasatust. Kuvades ekraanil video suulise heliosa, muudavad subtiitrid heli-/videosisu kättesaadavaks suuremale vaatajaskonnale, sealhulgas neile, kes ei räägi emakeelt ja kes on keskkonnas, kus heli on kuuldamatu.
Kuigi subtiitrite eelised on selged, on videoloojad subtiitrite loomisel traditsiooniliselt seisnud silmitsi takistustega. Takistused tekivad traditsioonilise loomisprotsessi aja- ja ressursimahukate nõuete tõttu, mis sõltuvad suuresti käsitsi pingutusest. Traditsioonilised subtiitrimeetodid on käsitsi ja nende valmimine võib kesta päevi kuni nädalaid ning seetõttu ei pruugi see kõigi tootmisgraafikutega ühilduda. Samuti kasutavad paljud ettevõtted käsitsi transkriptsiooniteenuseid, kuid need protsessid sageli ei ulatu ja on kulukad. Amazon Transcribe muudab kõne tekstiks teisendamise ML-põhiste tehnoloogiate abil lihtsaks ja aitab videoloojatel neid probleeme lahendada.
Lahenduse ülevaade
See postitus tutvustab subtiitrite loomiseks koodivaba töövoogu Amazoni lihtne salvestusteenus (Amazon S3) ja Amazon Transcribe.
Amazon S3 on objektide salvestusruum, mis on loodud mis tahes hulga andmete salvestamiseks ja hankimiseks kõikjalt. See postitus viib läbi protsessi kuni luua S3 ämber ja laadige üles helifail. Kui kasutajad salvestavad andmeid Amazon S3-sse, töötavad nad ressurssidega, mida nimetatakse ämbriteks ja objektideks. A kopp on konteiner esemete jaoks. An objekt on fail ja kõik seda faili kirjeldavad metaandmed.
Amazon Transcribe on ASR-teenus, mis kasutab heli-/videofailide tekstiks teisendamiseks täielikult hallatud ja pidevalt koolitatud ML-mudeleid. Amazon Transcribe'i sisendid ja väljundid salvestatakse Amazon S3-sse. Amazon Transcribe võtab heliandmeid, kas Amazon S3 ämbris oleva meediumifaili või meediumivoo, ja teisendab need tekstiandmeteks. Amazon Transcribe võimaldab teil neelata helisisendit, toota suure täpsusega hõlpsasti loetavaid ärakirju, kohandada oma väljundit domeenipõhise sõnavara jaoks, kasutades kohandatud keelemudelid (CLM) ja kohandatud sõnavaradja filtreerida sisu klientide privaatsuse tagamiseks. Kliendid saavad valida, kas kasutada Amazon Transcribe'i mitmesuguste ärirakenduste jaoks, sealhulgas kõnepõhiste klienditeeninduskõnede transkriptsioon, subtiitrite genereerimine audio/video sisuleja läbi viia (tekstipõhine) sisuanalüüs heli/video sisu kohta. Selle postituse jaoks demonstreerime transkriptsioonitöö loomist ja töö väljundi ülevaatamist.
Kui eelistate videoülevaadet, vaadake Amazon Transcribe'i videosuupistete episoodi Video subtiitrite loomine ilma koodi kirjutamata.
Eeldused
Lahenduse läbimiseks peavad teil olema järgmised eeltingimused.
- An AWS-i konto piisavaga AWS-i identiteedi- ja juurdepääsuhaldus (IAM) kasutajaõigused
- Heli-/videofail, milles on öeldud sõnu Amazon Transscribe toetatud keel ja a toetatud sisendvorming
Kui teil pole veel heli-/videofaili näidisfaili, saate selle luua arvuti või nutitelefoni videosalvestusrakenduse abil. Veenduge, et räägiksite selgelt mikrofoni, et tagada salvestamisel kõrgeim transkriptsioonikvaliteet. Teine võimalus on leida tasuta allalaaditav fail, mis sisaldab suulist sõna, näiteks podcastvõi selles postituses esitatud videoülevaade, mida Amazon Transcribe saab alla neelata. Salvestatud või allalaaditud failile peab teie AWS-i kontole üleslaadimiseks olema juurdepääs teie töölaual.
Enne alustamist vaadake üle Amazoni transkribeerimine ja Amazon S3 teenuste hinnakujunduse lehtedel.
Looge S3 ämbrid
Selle postituse jaoks loome kaks S3 ämbrit, et hoida sisend ja väljund lahus.
- Amazon S3 konsoolil valige Loo ämber.
- Andke igale ämbrile globaalselt kordumatu nimi.
- Kasutage vaikesätteid, et tagada vastavus oma organisatsiooni eeskirjadele.
- Võimaldama ämbri versioonimine ja vaikimisi serveripoolne krüptimine (soovitatav).
- Vali Loo ämber.
Järgmine ekraanipilt näitab sisendsalve konfiguratsiooni.
S3-salv on nüüd heli-/videofaili üleslaadimiseks valmis. Selle avaldamise ajal oli Amazon Transcribe'i maksimaalne sisendi suurus on 2 GB. Kui videofail ületab selle koguse või on a vormingus, mida Amazon Transcribe algselt ei toeta, kaaluge kasutamist AWS Elemental MediaConvert et luua ainult heliväljund. See on kasulik, kuna helifailid on tavaliselt palju väiksemad kui videofailid ja Amazon Transcribe vajab transkriptsioonide ja subtiitrite loomiseks ainult heliriba, mitte videorada.
Laadige lähtefail üles S3 ämbrisse
Lähtefaili üleslaadimiseks toimige järgmiselt.
- Valige Amazon S3 konsoolil oma sisendsalv.
- Vali Täiendava.
- Valige fail oma töölaualt.
- Nõustuge vaikesalvestusklassi ja krüpteerimisseadetega või muutke neid oma organisatsiooni poliitikate alusel.
- Vali Täiendava.
Looge transkriptsioonitöö
Kui sisendfail on Amazon S3-s valmis, loome nüüd rakenduses Amazon Transcribe transkriptsioonitöö.
- Kohta Amazon Transscribe konsool, vali Transkriptsioonitööd navigeerimispaanil.
- Vali Loo töökoht.
See ülevaade kasutab suures osas vaikevalikuid; siiski peaksite valima konfiguratsiooni, mis vastab teie organisatsiooni nõuetele kõige paremini.
- eest Nimi, sisestage selle töö ja tulemuseks oleva faili nimi.
- eest Keele seadedvalige Konkreetne keel.
- eest Keel, valige sisendfaili lähtekeel.
- eest Mudelitüüp¸ vali Üldmudel.
Kasutame selle demo jaoks üldist mudelit, kuid soovitame teil uurida koolitust ja kasutamist kohandatud keelemudelid täpsuse parandamiseks konkreetsetel kasutusjuhtudel (nt tööstusharuspetsiifilised terminid või akronüümid). Kohandatud keelemudelitesse sügavamaks sukeldumiseks vaadake Amazon Transcribei videosnäkki Kohandatud keelemudelite (CLM) kasutamine transkriptsiooni täpsuse suurendamiseks.
- eest Sisestage faili asukoht S3-s, vali Sirvige S3.
- Valige transkribeeritav sisendsalv ja heli-/videofail.
- eest Väljundandmete asukoha tüübi teavevalige Kliendi määratud S3 kopp.
- eest Väljundi faili sihtkoht S3-le, vali Sirvige S3.
- Valige äsja loodud väljundsalv.
. Subtiitrite failivorming jaotis pakub kogu selle postituse kahte kõige olulisemat valikut. Saate valida *.srt- ja *.vtt-vormingus väljundid Amazoni transkriptsioonitöö osana. Selle kirjutamise ajal ei too ühe või mõlema valimine Amazon Transcribe'i tööle lisakulusid.
See väärtus viitab järjestikuse esimese subtiitri algusnumbrile. Kui te pole kindel, millist väärtust valida, 1 on kõige tavalisem.
- Kui seaded on paigas, valige järgmine.
- Seadistage kõik valikulised sätted vastavalt oma vajadustele.
Amazon Transcribe pakub helituvastusvõimalusi kanalid or kõlarid, alternatiivsed tulemused, PII redigeerimine, sõnavara filtreerimineja kohandatud sõnavara. Selle konkreetse postituse puhul võite need konfiguratsioonivalikud vahele jätta. Töö konfiguratsioonivalikutesse sügavamaks sukeldumiseks vaadake Amazon Transcribe'i suupistete videolõike kohandatud sõnavara, kohandatud keelemudelidja sõnavara filtreerimine.
Vaadake üle töö väljund
Video subtiitrite loomiseks algab transkribeerimistöö. Töö olek, nagu on näidatud järgmisel ekraanipildil, kuvatakse töö üksikasjade paneelil. Kui töö on lõpetatud, valige väljundandmete asukoht, et leida S3 ämbris vastloodud subtiitrid.
Subtiitrid tuvastatakse laiendite *.srt või *.vtt järgi. Kui valite objekti S3 ämbris, on teil võimalus fail alla laadida.
Kuna need subtiitrid on lihtteksti vormingus, saavad kõik tekstiredaktorid saadud transkriptsiooni vaadata ja redigeerida. Failide *.srt ja *.vtt võrdlemine toob esile palju sarnasusi, kuid väikeste erinevustega.
Järgmine on *.srt-vormingu näide:
Järgmine on *.vtt-vormingu näide:
Numbrid näitavad subtiitrite kuvamise järjekorda. Ajakood näitab, millal subtiitreid kuvatakse. Tekst on alapealkirja tekst ise.
Kõik muudatused või redaktsioonid on nüüd võimalikud otse tekstiredaktoris ja ühilduvad ka siis, kui need salvestatakse laiendiga *.srt või *.vtt. Saate vaadata muudatusi ka videoplatvormil endal, videotöötlusrakenduses või videopleieris.
VLC on populaarne avatud lähtekoodiga ja platvormideülene videopleier, mis toetab *.srt ja *.vtt subtiitreid. VLC-s oleva video subtiitrite automaatseks esitamiseks asetage nii algne video kui ka subtiitrite fail samasse kataloogi täpselt sama failinimega enne faililaiendit.
Nüüd, kui avate videofaili VLC-s, peaks subtiitrifail videopleieri aknas automaatselt tuvastama ja taasesitama.
Koristage
Edaspidiste tasude vältimiseks tühi ja kustutama sisendiks ja väljundiks kasutatavad S3 ämbrid. Veenduge, et kõik vajalikud failid oleksid salvestatud, kuna see eemaldab jäädavalt kõik ämbrites olevad objektid. peal Transkribeerimise konsool, valige ja kustutage kõik tööd, mida enam ei vajata.
Järeldus
Olete nüüd loonud täieliku täieliku subtiitrite loomise töövoo, et täiustada ja kiirendada video subtiitrite loomise protsessi ning seda kõike ilma koodi kirjutamata. Mõne minutiga lõite S3 salvestusruumid, laadisite faili Amazon S3-sse ja kasutasite subtiitrite loomiseks teenust Amazon Transcribe. Seejärel saate tulemuseks olevad *.srt- ja *.vtt-alapealkirjafailid ülevaatamiseks alla laadida ja sihtplatvormile üles laadida.
See töövoog keskendus spetsiaalselt video töövoogude jaoks mõeldud heli-/videosubtiitritele, mis on loodud Amazon Transcribe'i automaatse kõnetuvastuse (ASR) tehnoloogia abil. Ainuüksi see töövoog ei asenda inimpõhist subtiitrite kirjutamise protsessi, mis vastab kõrgematele juurdepääsetavuse standarditele, sealhulgas kõlarite tuvastamise, heliefektide, muusika kirjelduse ja kopeerimise täpsuse ülevaatuse kohta. Saate kasutada selles postituses kirjeldatud teksti redigeerimise meetodit, et lisada need elemendid pärast esialgse Amazoni transkriptsioonitöö lõpetamist. Lisaks saate täiustatud brauseripõhise subtiitrite loomise, eelvaate ja kopeerimise jaoks uurida Sisu lokaliseerimine AWS-is lahendus, mille on kontrollinud AWS Solution Architects ja mis sisaldab rakendamise juhend. See lahendus pakub lisafunktsioone, nagu brauseris eelvaade ja subtiitrite redigeerimine, subtiitrite tõlge toidab Amazoni tõlgeja arvuti nägemisvõimalused, mida pakub Amazon Rekognitsioon.
Kui teile meeldis see Amazon Transcribe'i subtiitrite loomise võime tutvustamine, kaaluge oma heli-/videotöövoogude kiirendamiseks täiendavate funktsioonide ja võimalustega tutvumist. Täiendavate üksikasjade ja koodinäidiste saamiseks subtiitrite loomise automatiseerimise ja skaleerimise toetamiseks vt Video subtiitrite loomine. Edu teile uurimisel ja subtiitrite loomise töövoo arendamisel.
Teave Autor
Jason O'Malley on AWS-i vanempartnerlahenduste arhitekt, kes toetab partnereid, kes arendavad meedia-, kommunikatsiooni- ja tehnoloogiatööstuse lahendusi. Enne AWS-iga liitumist töötas Jason 13 aastat meedia- ja meelelahutustööstuses sellistes ettevõtetes nagu Conan O'Brieni Team Coco, WarnerMedia ja Media.Monks. Jason alustas oma karjääri televisiooni tootmise ja järeltootmise alal, enne kui AWS-is meedia töökoormust ehitas. Kui Jason ei loo partneritele ja klientidele lahendusi, võib teda leida koos naise ja pojaga seiklemas või jätkusuutlikkuse kohta lugemas.
- Münditark. Euroopa parim Bitcoini ja krüptobörs.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. TASUTA PÄÄS.
- CryptoHawk. Altcoini radar. Tasuta prooviversioon.
- Allikas: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- MEIST
- kiirendama
- juurdepääs
- kättesaadavus
- konto
- Täiendavad lisad
- aadress
- edasijõudnud
- Materjal: BPA ja flataatide vaba plastik
- juba
- Amazon
- Amazon Web Services
- summa
- Teine
- kuskil
- taotlus
- rakendused
- publik
- heli-
- Automaatne
- automatiseerimine
- saadaval
- AWS
- tagapõhi
- kasu
- Kasu
- BEST
- piir
- Ehitus
- äri
- Business Applications
- võimeid
- tekste
- Karjäär
- juhtudel
- väljakutseid
- koormuste
- Vali
- klass
- suletud
- kood
- ühine
- Side
- Ettevõtted
- keeruline
- Vastavus
- arvuti
- konfiguratsioon
- konsool
- Konteiner
- sisu
- looma
- loodud
- loomine
- loomine
- loojad
- tava
- klient
- Kasutajatugi
- Kliendid
- andmed
- sügavam
- näitama
- juurutamine
- kirjeldatud
- lauaarvuti
- detailid
- arenev
- raske
- otse
- Ei tee
- domeen
- lae alla
- toimetaja
- mõju
- jõupingutusi
- elemendid
- julgustama
- krüpteerimist
- sisene
- meelelahutus
- keskkond
- oluline
- näide
- kogemus
- uurimine
- uurima
- laiendused
- silmitsi seisnud
- tunnusjoon
- FUNKTSIOONID
- esimene
- keskendunud
- keskendub
- Järel
- formaat
- edasi
- avastatud
- tulevik
- Üldine
- tekitama
- teeniva
- Ülemaailmselt
- hea
- kasulik
- aitab
- Suur
- rohkem
- palkama
- Kuidas
- aga
- HTTPS
- tohutu
- Identifitseerimine
- Identity
- pilt
- rakendada
- paranenud
- hõlmab
- Kaasa arvatud
- Kaasamine
- indeks
- tööstus
- sisend
- integreerima
- küsimustes
- IT
- ise
- töö
- Tööturg
- teatud
- keel
- suurem
- õppimine
- Tase
- liising
- õnn
- masin
- masinõpe
- säilitada
- TEEB
- juhitud
- viis
- käsiraamat
- käsitsi
- küsimus
- Meedia
- meetodid
- ML
- mudel
- mudelid
- rohkem
- kõige
- muusika
- NAVIGATSIOON
- vajalik
- number
- numbrid
- pakutud
- Pakkumised
- avatud
- valik
- Valikud
- et
- organisatsioon
- osa
- eriline
- partner
- partnerid
- inimesele
- mängima
- mängija
- mängimine
- Poliitika
- vaene
- populaarne
- võimalik
- Eelvaade
- hinnapoliitika
- esmane
- protsess
- Protsessid
- tootma
- Produktsioon
- annab
- kvaliteet
- jõudma
- Lugemine
- jääma
- nõutav
- Nõuded
- Vahendid
- Tulemused
- läbi
- Skaala
- ketendamine
- Ekraan
- teenus
- Teenused
- kehtestamine
- näidatud
- lihtne
- SUURUS
- väike
- nutikas telefon
- tahke
- lahendus
- Lahendused
- Keegi
- selle
- Kõneleja
- kõlarid
- eriti
- standard
- standardite
- algus
- alustatud
- algab
- olek
- ladustamine
- salvestada
- oja
- toetama
- Toetatud
- Toetamine
- Toetab
- Jätkusuutlikkus
- võtmine
- meeskond
- Tehnoloogiad
- Tehnoloogia
- televisioon
- Allikas
- seetõttu
- Läbi
- aeg
- aega võttev
- Kapslid
- jälgida
- traditsiooniline
- traditsiooniliselt
- koolitus
- Tõlge
- tüüpiliselt
- ainulaadne
- kasutama
- Kasutajad
- ära kasutama
- väärtus
- sort
- kontrollitud
- Video
- vaade
- nägemus
- Watch
- web
- veebiteenused
- kuigi
- jooksul
- ilma
- sõnad
- Töö
- kirjutamine
- aastat
- saak
- youtube