Ustvarjanje podnapisov za video vsebino predstavlja izziv ne glede na to, kako velika ali majhna je organizacija. Za reševanje teh izzivov, Amazonski prepis ima koristno funkcijo, ki omogoča ustvarjanje podnapisov neposredno v storitvi. Za začetek ni potrebno strojno učenje (ML) ali pisanje kode. Ta objava vas vodi skozi nastavitev poteka dela brez kode za ustvarjanje video podnapisov z uporabo Amazon Transcribe v vašem računu Amazon Web Services.
Podnapisi v primerjavi s podnapisi
Pogoji podnapisi in zaprti napisi se običajno uporabljata izmenično in se oba nanašata na izgovorjeno besedilo, prikazano na zaslonu. Vendar je primarna razlika med podnapisi in podnapisi (glede na definicije panoge in dostopnosti) ta, da zaprti podnapisi vsebujejo tako prepis izgovorjene besede kot tudi opis glasbe v ozadju ali zvokov, ki se pojavljajo v zvočnem posnetku za bogatejšo izkušnjo dostopnosti. . Ta objava se osredotoča le na ustvarjanje prepisanih datotek s podnapisi z govorjenimi besedami s tehnologijo samodejnega prepoznavanja govora (ASR), ki ne vsebujejo identifikacije govorca, zvočnih učinkov ali glasbenih opisov. Amazon Transcribe podpira industrijske standardne formate SubRip Text (*.srt) in Web Video Text Tracks (*.vtt) za ustvarjanje podnapisov.
Naslednja slika prikazuje primer podnapisov, vklopljenih v spletnem video predvajalniku.
Podnapisi koristijo ustvarjalcem videoposnetkov, saj razširijo doseg in vključenost njihove video vsebine. S prikazom govorjenega zvočnega dela videa na zaslonu podnapisi naredijo avdio/video vsebino dostopno širšemu občinstvu, vključno s tistimi, ki niso govorci maternega jezika, in tistimi, ki so v okolju, kjer zvok ni slišen.
Čeprav so prednosti podnapisov jasne, se ustvarjalci videoposnetkov tradicionalno soočajo z ovirami pri ustvarjanju podnapisov. Ovire nastanejo zaradi časovno potratnih in zahtevnih zahtev tradicionalnega procesa ustvarjanja, ki je močno odvisen od ročnega truda. Tradicionalni načini podnaslavljanja so ročni in lahko trajajo od dni do tednov, zato morda niso združljivi z vsemi urniki produkcije. Podobno številna podjetja uporabljajo storitve ročnega prepisovanja, vendar ti postopki pogosto niso prilagodljivi in so dragi za vzdrževanje. Amazon Transcribe vam olajša pretvorbo govora v besedilo s tehnologijami, ki temeljijo na ML, in pomaga ustvarjalcem videov pri reševanju teh težav.
Pregled rešitev
Ta objava se sprehodi skozi potek dela brez kode za ustvarjanje podnapisov z uporabo Preprosta storitev shranjevanja Amazon (Amazon S3) in Amazon Transcribe.
Amazon S3 je shramba objektov, zgrajena za shranjevanje in pridobivanje poljubne količine podatkov od koder koli. Ta objava vodi skozi postopek do ustvarite vedro S3 in naložite zvočno datoteko. Ko uporabniki shranjujejo podatke v Amazon S3, delajo z viri, znanimi kot vedra in objekti. A vedro je vsebnik za predmete. An predmet je datoteka in vsi metapodatki, ki opisujejo to datoteko.
Amazon Transcribe je storitev ASR, ki uporablja popolnoma upravljane in nenehno izobražene modele ML za pretvorbo avdio/video datotek v besedilo. Vhodi in izhodi Amazon Transcribe so shranjeni v Amazon S3. Amazon Transcribe vzame zvočne podatke, bodisi medijsko datoteko v vedru Amazon S3 ali medijski tok, in jih pretvori v besedilne podatke. Amazon Transcribe vam omogoča, da zaužijete zvočni vnos, ustvarite lahko berljive prepise z visoko stopnjo natančnosti, prilagodite izhod za domensko specifično besedišče z uporabo jezikovni modeli po meri (CLM) in pojmi po meriin filtrirajte vsebino, da zagotovite zasebnost strank. Stranke se lahko odločijo za uporabo Amazon Transcribe za različne poslovne aplikacije, vključno z transkripcija glasovnih klicev storitev za stranke, generiranje podnapisov na avdio/video vsebinein izvajati (besedilno) analizo vsebine na avdio/video vsebino. Za to objavo prikazujemo ustvarjanje opravila prepisa in pregled izhoda opravila.
Če imate raje video navodila, si oglejte epizodo video prigrizkov Amazon Transcribe Ustvarjanje video podnapisov brez pisanja kode.
Predpogoji
Za sprehod skozi rešitev morate imeti naslednje predpogoje:
- An AWS račun z zadostno AWS upravljanje identitete in dostopa (IAM) uporabniške pravice
- Avdio/video datoteka z izgovorjenimi besedami v Jezik, ki ga podpira Amazon Transcribe in v a podprti vnosni format
Če še nimate vzorčne avdio/video datoteke, jo lahko ustvarite z aplikacijo za snemanje videa v računalniku ali pametnem telefonu. Prepričajte se, da jasno govorite v mikrofon, da med snemanjem zagotovite najvišjo raven kakovosti prepisa. Druga možnost je, da poiščete prosto dostopen prenos z izgovorjeno besedo, kot je podcastali video navodila v tej objavi, ki jih lahko zaužije Amazon Transcribe. Posneta ali prenesena datoteka mora biti dostopna na vašem namizju za nalaganje v vaš račun AWS.
Preden začnete, preglejte Amazonski prepis in Amazon S3 strani s cenami za cene storitev.
Ustvarite vedra S3
Za to objavo ustvarimo dve vedri S3, da bosta vhod in izhod ločena.
- Na konzoli Amazon S3 izberite Ustvari vedro.
- Vsakemu vedru dajte globalno edinstveno ime.
- Uporabite privzete nastavitve, da zagotovite skladnost s pravilniki vaše organizacije.
- Omogoči različico vedra in privzeto šifriranje na strani strežnika (priporočljivo).
- Izberite Ustvari vedro.
Naslednji posnetek zaslona prikazuje konfiguracijo za vhodno vedro.
Vedro S3 za vnos je zdaj pripravljeno za nalaganje avdio/video datoteke. V času te objave je največja velikost vnosa za Amazon Transcribe je 2 GB. Če video datoteka presega to količino ali je v a format, ki ga Amazon Transcribe izvorno ne podpira, razmislite o uporabi AWS Elemental MediaConvert do ustvarite samo zvočni izhod. To je koristno, ker so zvočne datoteke običajno veliko manjše od video datotek in Amazon Transcribe za ustvarjanje transkripcij in podnapisov potrebuje samo zvočni posnetek in ne video posnetka.
Naložite izvorno datoteko v vedro S3
Če želite naložiti izvorno datoteko, izvedite naslednje korake:
- Na konzoli Amazon S3 izberite svoje vnosno vedro.
- Izberite Pošiljanje.
- Izberite datoteko na namizju.
- Sprejmite privzeti razred shranjevanja in nastavitve šifriranja ali jih spremenite glede na politike vaše organizacije.
- Izberite Pošiljanje.
Ustvarite opravilo prepisa
Ko je vhodna datoteka pripravljena v Amazon S3, zdaj ustvarimo opravilo prepisa v Amazon Transcribe.
- o Konzola Amazon Transcribe, izberite Naloge za prepisovanje v podoknu za krmarjenje.
- Izberite Ustvari službo.
Ta sprehod v veliki meri uporablja privzete možnosti; vendar morate izbrati konfiguracijo, ki najbolj ustreza zahtevam vaše organizacije.
- za Ime, vnesite ime za to opravilo in nastalo datoteko.
- za Jezikovne nastavitvetako, da izberete Določen jezik.
- za Jezik, izberite izvorni jezik vhodne datoteke.
- za Vrsta modela¸ izberite Splošni model.
Za to predstavitev uporabljamo splošni model, vendar vas spodbujamo, da raziščete usposabljanje in uporabo jezikovni modeli po meri za izboljšano natančnost za posebne primere uporabe, kot so izrazi ali akronimi, specifični za panogo. Za globlji potop v jezikovne modele po meri si oglejte video prigrizek Amazon Transcribe Uporaba jezikovnih modelov po meri (CLM) za povečanje natančnosti prepisa.
- za Vnesite lokacijo datoteke na S3, izberite Prebrskaj S3.
- Izberite vnosno vedro in zvočno/video datoteko, ki jo želite prepisati.
- za Informacije o vrsti lokacije izhodnih podatkovtako, da izberete Stranka določi vedro S3.
- za Cilj izhodne datoteke na S3, izberite Prebrskaj S3.
- Izberite novo ustvarjeno izhodno vedro.
O Format datoteke s podnapisi ponuja dve najbolj bistveni možnosti te celotne objave. Kot del opravila prepisa Amazon Transcribe lahko izberete formatirana izhoda *.srt in *.vtt. V času tega pisanja izbira enega ali obeh ne pomeni nobenih dodatnih stroškov za delo Amazon Transcribe.
Ta vrednost se nanaša na začetno številko prvega podnapisa v zaporedju. Če niste prepričani, katero vrednost izbrati, 1 je najpogostejši.
- Ko so nastavitve na mestu, izberite Naslednji.
- Konfigurirajte vse izbirne nastavitve glede na vaše potrebe.
Amazon Transcribe predstavlja možnosti za zvočno identifikacijo za kanali or zvočniki, alternativni rezultati, Redakcija PII, filtriranje besediščain besednjak po meri. Za to posebno objavo lahko te konfiguracijske možnosti preskočite. Za globlji potop v možnosti konfiguracije opravil si oglejte epizode video prigrizkov Amazon Transcribe za besednjak po meri, jezikovni modeli po meriin filtriranje besedišča.
Preglejte rezultate opravila
Začne se prepisovanje za ustvarjanje podnapisov videoposnetkov. Stanje opravila, kot je prikazano na naslednjem posnetku zaslona, je prikazano na plošči s podrobnostmi opravila. Ko je opravilo končano, izberite lokacijo izhodnih podatkov, da poiščete novo ustvarjene podnapise v vedru S3.
Podnapise prepoznate po končnici *.srt ali *.vtt. Ko izberete predmet v vedru S3, imate možnost prenesti datoteko.
Ker so ti podnapisi v obliki navadnega besedila, si lahko kateri koli urejevalnik besedila ogleda in uredi nastali prepis. Primerjava datotek *.srt in *.vtt razkrije veliko podobnosti z majhnimi razlikami.
Sledi primer zapisa *.srt:
Sledi primer zapisa *.vtt:
Številke označujejo vrstni red prikaza podnapisov. Časovna koda označuje, kdaj je prikazan podnapis. Besedilo je samo besedilo podnapisov.
Vse spremembe ali revizije so zdaj možne neposredno v urejevalniku besedila in ostanejo združljive, ko so shranjene s pripono *.srt ali *.vtt. Spremembe si lahko ogledate tudi na sami video platformi, v aplikaciji za urejanje videa ali v video predvajalniku.
VLC je priljubljen odprtokodni in večplatformski video predvajalnik, ki podpira *.srt in *.vtt podnapise. Če želite samodejno predvajati podnapise prek videoposnetka v VLC, postavite izvirni videoposnetek in datoteko s podnapisi v isti imenik s popolnoma enakim imenom datoteke pred pripono datoteke.
Zdaj, ko odprete video datoteko v VLC, bi morala datoteka s podnapisi samodejno zaznati in predvajati v oknu video predvajalnika.
Čiščenje
Da bi se izognili prihodnjim stroškom, prazen in odstrani vedra S3, ki se uporabljajo za vnos in izhod. Prepričajte se, da imate shranjene vse potrebne datoteke, saj boste s tem trajno odstranili vse predmete v vedrih. Na Konzola za prepis, izberite in izbrišite vsa opravila, ki jih ne potrebujete več.
zaključek
Zdaj ste ustvarili celoten potek dela za ustvarjanje podnapisov od konca do konca, da povečate in pospešite postopek ustvarjanja video podnapisov, in vse to brez pisanja kode. V nekaj minutah ste ustvarili vedra za shranjevanje S3, naložili datoteko v Amazon S3 in uporabili Amazon Transcribe za ustvarjanje podnapisov. Nato lahko prenesete nastale datoteke s podnapisi *.srt in *.vtt za pregled in jih naložite na ciljno platformo.
Ta delovni tok je bil osredotočen na avdio/video podnapise, ustvarjene s tehnologijo samodejnega prepoznavanja govora (ASR) v storitvi Amazon Transcribe posebej za video delovne tokove. Samo ta potek dela ni nadomestek za človeški postopek zaprtih podnapisov, ki je sposoben izpolniti višje standarde za dostopnost, vključno z identifikacijo zvočnikov, zvočnimi učinki, opisom glasbe in pregledom natančnosti kopiranja. Uporabite lahko metodo urejanja besedila, opisano v tej objavi, da dodate te elemente, ko je prvotno opravilo Amazon Transcribe končano. Poleg tega lahko za naprednejše ustvarjanje podnapisov v brskalniku, predogled in kopiranje urejanja raziščete uvajanje Lokalizacija vsebine na AWS rešitev, ki jo je preveril AWS Solution Architects in vključuje vodnik za izvajanje. Ta rešitev ponuja dodatne funkcije, kot so predogled in urejanje podnapisov v brskalniku, prevod podnapisov omogoča Amazon prevod, in zmogljivosti računalniškega vida, ki jih ponuja Amazonsko ponovno vžiganje.
Če ste uživali v tej predstavitvi zmožnosti Amazon Transcribe za ustvarjanje podnapisov, razmislite o tem, da bi se globlje poglobili v dodatne funkcije in zmožnosti za pospešitev vaših avdio/video delovnih tokov. Za dodatne podrobnosti in vzorce kode za podporo avtomatiziranju in spreminjanju ustvarjanja podnapisov glejte Ustvarjanje video podnapisov. Vso srečo pri raziskovanju in razvijanju poteka dela za ustvarjanje podnapisov.
O Author
Jason O'Malley je starejši arhitekt partnerskih rešitev pri AWS, ki podpira partnerje pri arhitekturi medijskih, komunikacijskih in tehnoloških rešitev. Preden se je Jason pridružil AWS, je bil 13 let v medijski in zabavni industriji v podjetjih, vključno s Team Coco Conana O'Briena, WarnerMedia in Media.Monks. Jason je svojo kariero začel v televizijski produkciji in postprodukciji, preden je medijske delovne obremenitve zgradil na AWS. Ko Jason ne ustvarja rešitev za partnerje in stranke, ga lahko najdemo na pustolovščini s svojo ženo in sinom ali bere o trajnosti.
- Coinsmart. Najboljša evropska borza bitcoinov in kriptovalut.
- Platoblockchain. Web3 Metaverse Intelligence. Razširjeno znanje. PROST DOSTOP.
- CryptoHawk. Altcoin radar. Brezplačen preizkus.
- Vir: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- O meni
- pospeši
- dostop
- dostopnost
- Račun
- Dodatne
- Naslov
- napredno
- vsi
- že
- Amazon
- Amazon Web Services
- znesek
- Še ena
- kjerkoli
- uporaba
- aplikacije
- Občinstvo
- audio
- Samodejno
- avtomatizacija
- Na voljo
- AWS
- ozadje
- koristi
- Prednosti
- BEST
- meja
- Building
- poslovni
- Poslovne aplikacije
- Zmogljivosti
- napisi
- Kariera
- primeri
- izzivi
- Stroški
- Izberite
- razred
- zaprto
- Koda
- Skupno
- Communications
- Podjetja
- kompleksna
- skladnost
- računalnik
- konfiguracija
- Konzole
- Posoda
- vsebina
- ustvarjajo
- ustvaril
- Ustvarjanje
- Oblikovanje
- Ustvarjalci
- po meri
- stranka
- Za stranke
- Stranke, ki so
- datum
- globlje
- izkazati
- uvajanja
- opisano
- desktop
- Podrobnosti
- razvoju
- težko
- neposredno
- Ne
- domena
- prenesi
- urednik
- Učinki
- prizadevanje
- elementi
- spodbujanje
- šifriranje
- Vnesite
- Zabava
- okolje
- bistvena
- Primer
- izkušnje
- raziskovanje
- raziskuje
- razširitve
- soočen
- Feature
- Lastnosti
- prva
- osredotočena
- Osredotoča
- po
- format
- Naprej
- je pokazala,
- Prihodnost
- splošno
- ustvarjajo
- ustvarjajo
- Globalno
- dobro
- pomoč
- Pomaga
- visoka
- več
- najem
- Kako
- Vendar
- HTTPS
- velika
- Identifikacija
- identiteta
- slika
- izvajati
- izboljšalo
- vključuje
- Vključno
- Inkluzivnost
- Indeks
- Industrija
- vhod
- integrirati
- Vprašanja
- IT
- sam
- Job
- Delovna mesta
- znano
- jezik
- večja
- učenje
- Stopnja
- kraj aktivnosti
- sreča
- stroj
- strojno učenje
- vzdrževati
- IZDELA
- upravlja
- Način
- Navodilo
- ročno
- Matter
- mediji
- Metode
- ML
- Model
- modeli
- več
- Najbolj
- Glasba
- ostalo
- potrebno
- Številka
- številke
- ponujen
- Ponudbe
- odprite
- Možnost
- možnosti
- Da
- Organizacija
- del
- zlasti
- partner
- partnerji
- platforma
- Predvajaj
- predvajalnik
- igranje
- politike
- slaba
- Popular
- mogoče
- predogled
- cenitev
- primarni
- Postopek
- Procesi
- proizvodnjo
- proizvodnja
- zagotavlja
- kakovost
- dosežejo
- reading
- ostajajo
- obvezna
- Zahteve
- viri
- Rezultati
- pregleda
- Lestvica
- skaliranje
- Zaslon
- Storitev
- Storitve
- nastavitev
- pokazale
- Enostavno
- Velikosti
- majhna
- pametni telefon
- trdna
- Rešitev
- rešitve
- nekdo
- svoje
- Zvočniki
- zvočniki
- posebej
- standardna
- standardi
- Začetek
- začel
- začne
- Status
- shranjevanje
- trgovina
- tok
- podpora
- Podprti
- Podpora
- Podpira
- Trajnostni razvoj
- ob
- skupina
- Tehnologije
- Tehnologija
- televizija
- Vir
- zato
- skozi
- čas
- zamudno
- Naslov
- sledenje
- tradicionalna
- tradicionalno
- usposabljanje
- prevod
- tipično
- edinstven
- uporaba
- Uporabniki
- uporabiti
- vrednost
- raznolikost
- preverjeno
- Video
- Poglej
- Vizija
- Watch
- web
- spletne storitve
- medtem
- v
- brez
- besede
- delo
- pisanje
- let
- donos
- youtube