A videotartalom feliratozása kihívásokat jelent, függetlenül attól, hogy mekkora vagy kicsi a szervezet. Ezeknek a kihívásoknak a megoldásához, Amazon átirat van egy hasznos funkciója, amely lehetővé teszi a feliratok létrehozását közvetlenül a szolgáltatáson belül. Az induláshoz nincs szükség gépi tanulásra (ML) vagy kódírásra. Ez a bejegyzés végigvezeti Önt egy kód nélküli munkafolyamat beállításán a videófeliratok létrehozásához az Amazon Transcribe használatával az Amazon Web Services-fiókjában.
Feliratok kontra feliratok
A feltételek feliratok és a Zárt képaláírás gyakran felcserélhetően használják, és mindkettő a képernyőn megjelenő beszélt szövegre vonatkozik. A feliratok és a feliratok közötti elsődleges különbség (az iparági és a kisegítő lehetőségek definíciói alapján) azonban az, hogy a feliratok egyaránt tartalmazzák a kimondott szó átírását, valamint a háttérzene vagy a hangsávon belüli hangok leírását a gazdagabb akadálymentesítési élmény érdekében. . Ez a bejegyzés csak az automatikus beszédfelismerő (ASR) technológiával készült átírt kimondott feliratfájlok létrehozására összpontosít, amelyek nem tartalmaznak hangszóró azonosítást, hangeffektusokat vagy zeneleírásokat. Az Amazon Transcribe támogatja az iparági szabványnak megfelelő SubRip Text (*.srt) és Web Video Text Tracks (*.vtt) formátumokat feliratkészítés.
A következő képen látható egy példa a webes videolejátszóban bekapcsolt feliratokra.
A feliratok a videókészítők javát szolgálják azáltal, hogy kiterjesztik videótartalmuk elérhetőségét és befogadóképességét. A videó elhangzott részének a képernyőn történő megjelenítésével a feliratok nagyobb közönség számára teszik elérhetővé az audio-/videotartalmat, beleértve azokat is, akik nem anyanyelvi beszélők, vagy olyan környezetben, ahol a hang nem hallható.
Bár a feliratok előnyei egyértelműek, a videókészítők hagyományosan akadályokba ütköznek a feliratok létrehozása során. Akadályok merülnek fel a hagyományos alkotási folyamat idő- és erőforrásigényes követelményei miatt, amelyek nagymértékben támaszkodnak a kézi erőfeszítésre. A hagyományos feliratozási módszerek manuálisak, és napokig vagy hetekig tarthatnak, ezért előfordulhat, hogy nem kompatibilisek minden gyártási ütemtervvel. Hasonlóképpen sok vállalat használ kézi átírási szolgáltatásokat, de ezek a folyamatok gyakran nem méretezhetők, és költséges a fenntartásuk. Az Amazon Transcribe megkönnyíti a beszéd szöveggé konvertálását ML-alapú technológiák segítségével, és segít a videókészítőknek ezeknek a problémáknak a megoldásában.
Megoldás áttekintése
Ez a bejegyzés egy kód nélküli munkafolyamatot mutat be a feliratok használatával Amazon egyszerű tárolási szolgáltatás (Amazon S3) és Amazon Transcribe.
Az Amazon S3 egy objektumtároló, amely bárhonnan tetszőleges mennyiségű adat tárolására és lekérésére készült. Ez a bejegyzés a folyamatot mutatja be hozzon létre egy S3 vödröt és töltsön fel egy hangfájlt. Amikor a felhasználók adatokat tárolnak az Amazon S3-ban, akkor a gyűjtőhelyeknek és objektumoknak nevezett erőforrásokkal dolgoznak. A vödör egy tároló az objektumok számára. An tárgy egy fájl és minden olyan metaadat, amely leírja a fájlt.
Az Amazon Transcribe egy ASR-szolgáltatás, amely teljesen felügyelt és folyamatosan betanított ML-modelleket használ az audio/video fájlok szöveggé alakításához. Az Amazon Transcribe bemeneteit és kimeneteit az Amazon S3 tárolja. Az Amazon Transcribe hangadatokat vesz át, akár egy Amazon S3-tárolóban lévő médiafájlt, akár egy médiafolyamot, és szöveges adatokká alakítja át. Az Amazon Transcribe lehetővé teszi a hangbemenetek feldolgozását, könnyen olvasható átiratok készítését nagy pontossággal, a kimenet testreszabását a tartományspecifikus szókincshez. egyedi nyelvi modellek (CLM) és egyéni szókincsekés szűrje a tartalmat az ügyfelek adatainak védelme érdekében. Az ügyfelek választhatják az Amazon Transcribe használatát számos üzleti alkalmazáshoz, beleértve hangalapú ügyfélszolgálati hívások átírása, feliratok generálása audio/video tartalomhozés (szöveg alapú) tartalomelemzés elvégzése audio/video tartalomról. Ebben a bejegyzésben bemutatjuk egy átírási feladat létrehozását és a feladat kimenetének áttekintését.
Ha inkább egy videós áttekintést szeretne, tekintse meg az Amazon Transcribe videós snack-epizódot Videófeliratok létrehozása kód írása nélkül.
Előfeltételek
A megoldás végrehajtásához a következő előfeltételeknek kell megfelelniük:
- An AWS-fiók elegendő AWS Identity and Access Management (IAM) user privileges
- An audio/video file with spoken words in an Amazon Transcribe supported language és a supported input format
Ha még nincs minta audio-/videofájlja, létrehozhat egyet a számítógépén vagy okostelefonján található videorögzítő alkalmazás segítségével. Győződjön meg róla, hogy tisztán beszél a mikrofonba, hogy rögzítés közben a legmagasabb szintű átírási minőséget biztosítsa. Egy másik lehetőség, hogy talál egy ingyenesen letölthető, kimondott szót tartalmazó letöltést, például egy podcastvagy az ebben a bejegyzésben található videós bemutató, amit az Amazon Transcribe bekebelezhet. A rögzített vagy letöltött fájlnak elérhetőnek kell lennie az asztalon az AWS-fiókba való feltöltéshez.
Mielőtt elkezdené, tekintse át a Amazon átirat és a Amazon S3 árképzési oldalakon a szolgáltatás díjazásához.
Hozza létre az S3 vödröket
Ehhez a bejegyzéshez két S3 gyűjtőt hozunk létre, hogy a bemenet és a kimenet elkülönüljön.
- Az Amazon S3 konzolon válassza a lehetőséget Vödör létrehozása.
- Adjon minden csoportnak globálisan egyedi nevet.
- Használja az alapértelmezett beállításokat, hogy biztosítsa szervezete irányelveinek való megfelelést.
- engedélyezése vödör verziókészítés és a alapértelmezett szerveroldali titkosítás (ajánlott).
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Vödör létrehozása.
A következő képernyőképen a beviteli vödör konfigurációja látható.
Az S3 bemeneti tároló most készen áll az audio/video fájl feltöltésére. Jelen publikáció idején a Az Amazon Transcribe maximális bemeneti mérete 2 GB. Ha a videofájl meghaladja ezt a mennyiséget, vagy a olyan formátumot, amelyet az Amazon Transcribe natívan nem támogat, fontolja meg a használatát AWS Elemental MediaConvert nak nek hozzon létre egy csak audio kimenetet. Ez azért előnyös, mert az audiofájlok általában sokkal kisebbek, mint a videofájlok, és az Amazon Transcribe csak a hangsávot igényli, és nem a videosávot az átiratok és feliratok generálásához.
Töltse fel a forrásfájlt az S3 tárolóba
A forrásfájl feltöltéséhez hajtsa végre a következő lépéseket:
- Az Amazon S3 konzolon válassza ki a beviteli tárolót.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Feltöltés.
- Válassza ki a fájlt az asztalról.
- Fogadja el az alapértelmezett tárolási osztályt és titkosítási beállításokat, vagy módosítsa azokat a szervezet házirendjei alapján.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Feltöltés.
Hozzon létre egy átírási feladatot
Miután a bemeneti fájl készen áll az Amazon S3-ban, most létrehozunk egy átírási feladatot az Amazon Transcribe-ban.
- A Amazon Transcribe konzol, választ Átírási munkák a navigációs ablaktáblában.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.
Ez az áttekintés nagyrészt az alapértelmezett beállításokat használja; azonban a szervezete követelményeinek leginkább megfelelő konfigurációt kell kiválasztania.
- A Név, adja meg a feladat nevét és a kapott fájlt.
- A Nyelvi beállításokválassza Konkrét nyelv.
- A Nyelv, válassza ki a bemeneti fájl forrásnyelvét.
- A Modelltípus¸ válassza ki Általános modell.
Ehhez a bemutatóhoz az általános modellt használjuk, de javasoljuk, hogy fedezze fel a képzést és a használatot egyedi nyelvi modellek a fokozott pontosság érdekében meghatározott használati esetekre, például iparág-specifikus kifejezésekre vagy betűszavakra. Ha mélyebbre szeretne merülni az egyéni nyelvi modellekben, nézze meg az Amazon Transcribe videós nassolnivalóját Egyéni nyelvi modellek (CLM) használata az átírási pontosság növelésére.
- A Adja meg a fájl helyét az S3-on, választ Böngésszen az S3-ban.
- Válassza ki az átírni kívánt bemeneti tárolót és audio/video fájlt.
- A Kimeneti adatok helyének típusaválassza A vevő által megadott S3 vödör.
- A Kimeneti fájl rendeltetési helye az S3-on, választ Böngésszen az S3-ban.
- Válassza ki az újonnan létrehozott kimeneti tárolót.
A Felirat fájlformátum szakasz a teljes bejegyzés két legfontosabb lehetőségét tartalmazza. Kiválaszthatja a *.srt és *.vtt formátumú kimeneteket az Amazon Transcribe átírási feladat részeként. Az írás idején az egyik vagy mindkettő kiválasztása nem jár többletköltséggel az Amazon Transcribe feladattal kapcsolatban.
- Ehhez a bejegyzéshez válassza ki mindkettőt SRT és a VTT.
- A Adja meg a kezdő indexet, választ 0 or 1.
Ez az érték a sorozat első feliratának kezdőszámára vonatkozik. Ha nem biztos abban, hogy melyik értéket válassza, 1 a leggyakoribb.
- Ha a beállítások a helyükön vannak, válasszon Következő.
- Konfigurálja az opcionális beállításokat igényei szerint.
Az Amazon Transcribe lehetőségeket kínál a hangazonosításhoz csatornák or hangszórók, alternatív eredmények, Személyazonosításra alkalmas adatok szerkesztése, szókincsszűrésés egyéni szókincs. Ennél a bejegyzésnél kihagyhatja ezeket a konfigurációs beállításokat. Ha mélyebbre szeretne merülni a munkakonfigurációs lehetőségekben, tekintse meg az Amazon Transcribe videós snack-epizódjait egyéni szókincs, egyedi nyelvi modellekés szókincsszűrés.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Állás létrehozása.
Tekintse át a munka kimenetét
Megkezdődik a videófeliratok létrehozásához szükséges átírási feladat. A feladat állapota, amint az a következő képernyőképen látható, megjelenik a feladat részletei panelen. Amikor a feladat befejeződött, válassza ki a kimeneti adatok helyét, hogy megkeresse az újonnan létrehozott feliratokat az S3 tárolóban.
A feliratokat a *.srt vagy *.vtt kiterjesztések azonosítják. Amikor kiválasztja az objektumot az S3 vödörben, lehetősége van a fájl letöltésére.
Mivel ezek a feliratok egyszerű szöveges formátumúak, bármely szövegszerkesztő megtekintheti és szerkesztheti az eredményül kapott átírást. A *.srt és *.vtt fájlok összehasonlítása sok hasonlóságot tár fel, apró eltérésekkel.
A következő példa az *.srt formátumra:
A következő példa a *.vtt formátumra:
A számok a felirat megjelenítési sorrendjét jelzik. Az időkód jelzi, hogy mikor jelenik meg a felirat. A szöveg maga a felirat szövege.
Bármilyen módosítás vagy átdolgozás most közvetlenül a szövegszerkesztőben lehetséges, és a *.srt vagy *.vtt kiterjesztéssel mentve is kompatibilis marad. Megtekintheti a változások előnézetét magán a videoplatformon, egy videószerkesztő alkalmazáson belül vagy egy videolejátszón belül.
VLC egy népszerű nyílt forráskódú és többplatformos videolejátszó, amely támogatja a *.srt és *.vtt feliratokat. A VLC-n belüli videón belüli feliratok automatikus lejátszásához helyezze az eredeti videót és a feliratfájlt is ugyanabba a könyvtárba, pontosan ugyanazzal a fájlnévvel a fájlkiterjesztés előtt.
Most, amikor megnyitja a videofájlt a VLC-n belül, a feliratfájlnak automatikusan észlelnie kell és le kell játszania a videolejátszó ablakában.
Tisztítsuk meg
A jövőbeni költségek elkerülése érdekében üres és a töröl a bemenetre és a kimenetre használt S3 vödrök. Győződjön meg arról, hogy az összes szükséges fájlt tárolta, mert ez véglegesen eltávolítja a gyűjtőkon belüli összes objektumot. A Átírási konzol, válassza ki és törölje azokat a feladatokat, amelyekre már nincs szükség.
Következtetés
Létrehozott egy teljes, végpontok közötti feliratkészítési munkafolyamatot, amely kiegészíti és felgyorsítja a videófelirat-létrehozási folyamatot, és mindezt kód írása nélkül. Néhány perc alatt létrehozta az S3-as tárolóhelyeket, feltöltött egy fájlt az Amazon S3-ra, és az Amazon Transcribe-t használta feliratok létrehozásához. Ezután letöltheti az eredményül kapott *.srt és *.vtt feliratfájlokat ellenőrzés céljából, és feltöltheti őket a célplatformra.
Ez a munkafolyamat az Amazon Transcribe automatikus beszédfelismerő (ASR) technológiájával létrehozott hang-/videofeliratokra összpontosított, kifejezetten a videó munkafolyamatokhoz. Ez a munkafolyamat önmagában nem helyettesíti az emberi alapú feliratozási folyamatot, amely képes megfelelni a magasabb szintű akadálymentesítési követelményeknek, beleértve a hangszóró azonosítását, a hangeffektusokat, a zeneleírást és a másolás pontosságának ellenőrzését. Az ebben a bejegyzésben leírt szövegszerkesztési módszerrel hozzáadhatja ezeket az elemeket, miután a kezdeti Amazon Transcribe feladat befejeződött. Ezen túlmenően a fejlettebb böngésző alapú feliratok létrehozásához, előnézetéhez és másoláshoz felfedezheti a Tartalomhonosítás az AWS-en megoldást, amelyet az AWS Solution Architects ellenőriz, és amely tartalmaz egy végrehajtási útmutató. Ez a megoldás további funkciókat kínál, mint pl a böngészőn belüli előnézet és a feliratok szerkesztése, felirat fordítás powered by Amazon Translateés az általa kínált számítógépes látási lehetőségeket Amazon felismerés.
Ha tetszett ez a bemutató az Amazon Transcribe feliratkészítési képességéről, fontolja meg, hogy mélyebbre merüljön a további funkciókban és képességekben, hogy felgyorsítsa audio/videó munkafolyamatait. További részletekért és kódmintákért, amelyek támogatják a feliratok létrehozásának automatizálását és méretezését, lásd: Videófeliratok készítése. Sok sikert a felfedezéshez és a feliratkészítési munkafolyamat fejlesztéséhez.
A szerzőről
Jason O'Malley az AWS Sr. Partner Solutions Architect munkatársa, aki támogatja a média-, kommunikációs és technológiai iparági megoldások kidolgozását végző partnereket. Mielőtt csatlakozott volna az AWS-hez, Jason 13 évet töltött a média- és szórakoztatóiparban olyan cégeknél, mint a Conan O'Brien's Team Coco, a WarnerMedia és a Media.Monks. Jason a televíziós gyártásban és utómunkálatokban kezdte pályafutását, mielőtt az AWS-re építette volna a médiaterhelést. Amikor Jason nem a partnereinek és az ügyfeleknek hoz létre megoldásokat, akkor feleségével és fiával kalandozva, vagy a fenntarthatóságról olvas.
- Coinsmart. Európa legjobb Bitcoin- és kriptográfiai tőzsdéje.
- Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. SZABAD HOZZÁFÉRÉS.
- CryptoHawk. Altcoin radar. Ingyenes próbaverzió.
- Source: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- Rólunk
- gyorsul
- hozzáférés
- megközelíthetőség
- Fiók
- További
- cím
- fejlett
- Minden termék
- már
- amazon
- Az Amazon Web Services
- összeg
- Másik
- bárhol
- Alkalmazás
- alkalmazások
- közönség
- hang-
- Automatikus
- automatizálás
- elérhető
- AWS
- háttér
- haszon
- Előnyök
- BEST
- határ
- Épület
- üzleti
- Üzleti alkalmazások
- képességek
- feliratok
- Karrier
- esetek
- kihívások
- díjak
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- osztály
- zárt
- kód
- Közös
- távközlés
- Companies
- bonyolult
- teljesítés
- számítógép
- Configuration
- Konzol
- Konténer
- tartalom
- teremt
- készítette
- létrehozása
- teremtés
- alkotók
- szokás
- vevő
- Vevőszolgálat
- Ügyfelek
- dátum
- mélyebb
- bizonyítani
- bevezetéséhez
- leírt
- asztali
- részletek
- fejlesztése
- nehéz
- közvetlenül
- Nem
- domain
- letöltés
- szerkesztő
- hatások
- erőfeszítés
- elemek
- ösztönzése
- titkosítás
- belép
- Szórakozás
- Környezet
- alapvető
- példa
- tapasztalat
- kutatás
- feltárása
- kiterjesztések
- szembe
- Funkció
- Jellemzők
- vezetéknév
- összpontosított
- koncentrál
- következő
- formátum
- Előre
- talált
- jövő
- általános
- generál
- generáló
- globálisan
- jó
- hasznos
- segít
- Magas
- <p></p>
- bérel
- Hogyan
- azonban
- HTTPS
- hatalmas
- Azonosítás
- Identitás
- kép
- végre
- javított
- magában foglalja a
- Beleértve
- befogadás
- index
- ipar
- bemenet
- integrálni
- kérdések
- IT
- maga
- Munka
- Állások
- ismert
- nyelv
- nagyobb
- tanulás
- szint
- elhelyezkedés
- szerencse
- gép
- gépi tanulás
- fenntartása
- KÉSZÍT
- sikerült
- mód
- kézikönyv
- kézzel
- Anyag
- Média
- mód
- ML
- modell
- modellek
- több
- a legtöbb
- zene
- Navigáció
- elengedhetetlen
- szám
- számok
- felajánlott
- Ajánlatok
- nyitva
- opció
- Opciók
- érdekében
- szervezet
- rész
- különös
- partner
- partnerek
- emelvény
- játszani
- játékos
- játék
- Politikák
- szegény
- Népszerű
- lehetséges
- Preview
- árazás
- elsődleges
- folyamat
- Folyamatok
- gyárt
- Termelés
- biztosít
- világítás
- el
- Olvasás
- marad
- kötelező
- követelmények
- Tudástár
- Eredmények
- Kritika
- Skála
- skálázás
- Képernyő
- szolgáltatás
- Szolgáltatások
- beállítás
- mutatott
- Egyszerű
- Méret
- kicsi
- okostelefon
- szilárd
- megoldások
- Megoldások
- Valaki
- a
- Hangszóró
- hangszórók
- kifejezetten
- standard
- szabványok
- kezdet
- kezdődött
- kezdődik
- Állapot
- tárolás
- tárolni
- folyam
- támogatás
- Támogatott
- Támogató
- Támogatja
- Fenntarthatóság
- bevétel
- csapat
- Technologies
- Technológia
- televízió
- The Source
- ebből adódóan
- Keresztül
- idő
- időigényes
- Cím
- vágány
- hagyományos
- hagyományosan
- Képzések
- Fordítás
- jellemzően
- egyedi
- használ
- Felhasználók
- hasznosít
- érték
- fajta
- megvizsgálták
- videó
- Megnézem
- látomás
- Nézz
- háló
- webes szolgáltatások
- míg
- belül
- nélkül
- szavak
- Munka
- írás
- év
- Hozam
- youtube