Crearea de subtitrări pe conținut video prezintă provocări, indiferent cât de mare sau mică este organizația. Pentru a aborda aceste provocări, Transcriere Amazon are o caracteristică utilă care permite crearea de subtitrări direct în cadrul serviciului. Nu este necesară învățarea automată (ML) sau scrierea de cod pentru a începe. Această postare vă îndrumă prin configurarea unui flux de lucru fără cod pentru crearea de subtitrări video folosind Amazon Transcribe în contul dvs. Amazon Web Services.
Subtitrări vs. subtitrări
Termenii subtitrari și Subtitrări închise sunt utilizate în mod obișnuit în mod interschimbabil și ambele se referă la textul vorbit afișat pe ecran. Cu toate acestea, o diferență principală între subtitrări și subtitrări (pe baza definițiilor de industrie și de accesibilitate) este că subtitrările conțin atât transcrierea cuvântului rostit, cât și o descriere a muzicii de fundal sau a sunetelor care apar în pista audio pentru o experiență de accesibilitate mai bogată. . Această postare se concentrează doar pe crearea de fișiere de subtitrare a cuvintelor rostite transcrise folosind tehnologia de recunoaștere automată a vorbirii (ASR) care nu conține identificarea vorbitorului, efecte sonore sau descrieri muzicale. Amazon Transcribe acceptă formatele standard SubRip Text (*.srt) și Web Video Text Tracks (*.vtt) pentru crearea subtitrarilor.
Următoarea imagine arată un exemplu de subtitrări activate într-un player video web.
Subtitrarile beneficiază creatorii de videoclipuri, extinzând atât acoperirea, cât și incluziunea conținutului lor video. Afișând pe ecran porțiunea audio vorbită a unui videoclip, subtitrările fac conținutul audio/video accesibil unui public mai larg, inclusiv celor care nu vorbesc limba maternă și cei care se află într-un mediu în care sunetul este inaudibil.
Deși beneficiile subtitrarilor sunt clare, creatorii de videoclipuri s-au confruntat în mod tradițional cu obstacole în crearea subtitrarilor. Obstacolele apar din cauza cerințelor consumatoare de timp și de resurse ale procesului tradițional de creație, care se bazează în mare măsură pe efortul manual. Metodele tradiționale de subtitrare sunt manuale și pot dura câteva zile până la săptămâni până la finalizare și, prin urmare, este posibil să nu fie compatibile cu toate programele de producție. De asemenea, multe companii utilizează servicii de transcriere manuală, dar aceste procese adesea nu se extind și sunt costisitoare de întreținut. Amazon Transcribe vă ajută să convertiți vorbirea în text folosind tehnologii bazate pe ML și îi ajută pe creatorii de videoclipuri să abordeze aceste probleme.
Prezentare generală a soluțiilor
Această postare trece printr-un flux de lucru fără cod pentru generarea de subtitrări folosind Serviciul Amazon de stocare simplă (Amazon S3) și Amazon Transcribe.
Amazon S3 este stocarea obiectelor construită pentru a stoca și a prelua orice cantitate de date de oriunde. Această postare parcurge procesul către creați o cupă S3 și încărcați un fișier audio. Când utilizatorii stochează date în Amazon S3, aceștia lucrează cu resurse cunoscute sub numele de găleți și obiecte. A găleată este un recipient pentru obiecte. Un obiect este un fișier și orice metadate care descriu acel fișier.
Amazon Transcribe este un serviciu ASR care utilizează modele ML complet gestionate și instruite continuu pentru a converti fișierele audio/video în text. Intrările și ieșirile Amazon Transcribe sunt stocate în Amazon S3. Amazon Transcribe preia date audio, fie un fișier media într-o găleată Amazon S3, fie un flux media și le convertește în date text. Amazon Transcribe vă permite să ingerați intrare audio, să produceți transcrieri ușor de citit cu un grad ridicat de acuratețe, să vă personalizați rezultatul pentru vocabularul specific domeniului folosind modele de limbaj personalizate (CLM) și vocabulare personalizate, și Filtrați conținutul pentru a asigura confidențialitatea clienților. Clienții pot alege să folosească Amazon Transcribe pentru o varietate de aplicații de afaceri, inclusiv transcrierea apelurilor de serviciu pentru clienți bazate pe voce, generarea de subtitrări pe conținut audio/video, și efectuează analize de conținut (pe bază de text). asupra conținutului audio/video. Pentru această postare, demonstrăm crearea unui job de transcriere și revizuirea rezultatelor jobului.
Dacă preferați o prezentare video, consultați episodul cu gustări video Amazon Transcribe Crearea de subtitrări video fără a scrie niciun cod.
Cerințe preliminare
Pentru a parcurge soluția, trebuie să aveți următoarele cerințe preliminare:
- An Cont AWS cu suficient Gestionarea identității și accesului AWS (IAM) user privileges
- An audio/video file with spoken words in an Amazon Transcribe supported language și în a supported input format
Dacă nu aveți deja o mostră de fișier audio/video, puteți crea unul folosind o aplicație de înregistrare video de pe computer sau smartphone. Asigurați-vă că vorbiți clar în microfon pentru a asigura cel mai înalt nivel de calitate a transcripției atunci când înregistrați. O altă opțiune este să găsești o descărcare disponibilă gratuit, cu cuvinte rostite, cum ar fi un podcast, Sau tutorialul video oferit în această postare, care poate fi ingerat de Amazon Transcribe. Fișierul înregistrat sau descărcat trebuie să fie accesibil pe desktop pentru a fi încărcat în contul dvs. AWS.
Înainte de a începe, examinați Transcriere Amazon și Amazon S3 pagini de prețuri pentru prețurile serviciilor.
Creați gălețile S3
Pentru această postare, creăm două compartimente S3 pentru a menține intrarea și ieșirea separate.
- În consola Amazon S3, alegeți Creați găleată.
- Dați fiecărei găleți un nume unic la nivel global.
- Utilizați setările implicite pentru a asigura conformitatea cu politicile organizației dvs.
- Permite versiunea cu găleată și criptare implicită pe partea serverului (recomandat).
- Alege Creați găleată.
Următoarea captură de ecran arată configurația pentru compartimentul de intrare.
Bucket-ul S3 pentru intrare este acum gata să aibă fișierul audio/video încărcat. La momentul acestei publicații, dimensiunea maximă de intrare pentru Amazon Transcribe este de 2 GB. Dacă fișierul video depășește această sumă sau este într-un format care nu este acceptat nativ de Amazon Transcribe, ia în considerare utilizarea AWS Elemental MediaConvert la creați o ieșire numai audio. Acest lucru este benefic deoarece fișierele audio sunt de obicei mult mai mici decât fișierele video și Amazon Transcribe necesită doar pista audio, și nu pista video, pentru a genera transcripții și subtitrări.
Încărcați fișierul sursă în compartimentul S3
Pentru a încărca fișierul sursă, parcurgeți următorii pași:
- Pe consola Amazon S3, selectați compartimentul de intrare.
- Alege Încărcați.
- Alegeți fișierul de pe desktop.
- Acceptați clasa de stocare implicită și setările de criptare sau modificați-le în funcție de politicile organizației dvs.
- Alege Încărcați.
Creați o lucrare de transcriere
Cu fișierul de intrare gata în Amazon S3, acum creăm un job de transcriere în Amazon Transcribe.
- Pe Consola Amazon Transcribe, alege Lucrări de transcriere în panoul de navigare.
- Alege Creați loc de muncă.
Această explicație folosește în mare măsură opțiunile implicite; cu toate acestea, ar trebui să alegeți configurația care se potrivește cel mai bine cerințelor organizației dumneavoastră.
- Pentru Nume si Prenume, introduceți un nume pentru această lucrare și fișierul rezultat.
- Pentru Setările de limbă, Selectați Limbajul specific.
- Pentru Limbă, alegeți limba sursă a fișierului de intrare.
- Pentru Tipul modeluluiSelectați Model general.
Folosim modelul general pentru această demonstrație, dar vă încurajăm să explorați antrenamentul și utilizarea modele de limbaj personalizate pentru o precizie îmbunătățită pentru cazuri de utilizare specifice, cum ar fi termeni sau acronime specifici industriei. Pentru o scufundare mai profundă în modelele lingvistice personalizate, urmăriți gustarea video Amazon Transcribe Utilizarea modelelor de limbaj personalizat (CLM) pentru a spori acuratețea transcripției.
- Pentru Introduceți locația fișierului pe S3, alege Răsfoiți S3.
- Alegeți grupul de intrare și fișierul audio/video care urmează să fie transcris.
- Pentru Informații despre tipul locației datelor de ieșire, Selectați Bucket S3 specificat de client.
- Pentru Destinația fișierului de ieșire pe S3, alege Răsfoiți S3.
- Alegeți grupul de ieșire nou creat.
Format de fișier cu subtitrare secțiunea oferă cele mai esențiale două opțiuni ale întregului post. Puteți selecta ieșirile formatate *.srt și *.vtt ca parte a lucrării de transcriere Amazon Transcribe. La momentul scrierii acestui articol, selectarea unuia sau a ambelor nu adaugă niciun cost suplimentar la jobul Amazon Transcribe.
- Pentru această postare, selectați ambele SRT și VTT.
- Pentru Specificați indexul de pornire, alege 0 or 1.
Această valoare se referă la numărul de început al primului subtitrare în secvență. Dacă nu sunteți sigur ce valoare să alegeți, 1 este cel mai frecvent.
- Când setările sunt la locul lor, alegeți Pagina Următoare →.
- Configurați orice setări opționale în funcție de nevoile dvs.
Amazon Transcribe prezintă opțiuni pentru identificarea audio pentru canale or difuzoare, rezultate alternative, Redactarea PII, filtrarea vocabularului, și vocabular personalizat. Pentru această postare specială, puteți sări peste aceste opțiuni de configurare. Pentru o scufundare mai profundă în opțiunile de configurare a locurilor de muncă, urmăriți episoadele de gustări video Amazon Transcribe pentru vocabular personalizat, modele de limbaj personalizate, și filtrarea vocabularului.
Examinați rezultatul lucrării
Începe lucrarea de transcriere pentru a vă crea subtitrări video. Starea lucrării, așa cum se arată în următoarea captură de ecran, este afișată în panoul cu detaliile jobului. Când lucrarea este finalizată, alegeți locația datelor de ieșire pentru a localiza subtitrările nou create în compartimentul S3.
Subtitrările sunt identificate prin extensiile *.srt sau *.vtt. Când selectați obiectul din găleata S3, aveți opțiunea de a descărca fișierul.
Deoarece aceste subtitrări sunt în format text simplu, orice editor de text poate vizualiza și edita transcrierea rezultată. Compararea fișierelor *.srt și *.vtt relevă multe asemănări, cu diferențe subtile.
Următorul este un exemplu de format *.srt:
Următorul este un exemplu de format *.vtt:
Numerele indică ordinea în care este afișată subtitrarea. Codul de timp indică momentul în care este afișată subtitrarea. Textul este însuși textul subtitrării.
Orice modificări sau revizuiri sunt acum posibile direct în editorul de text și rămân compatibile atunci când sunt salvate cu extensia *.srt sau *.vtt. De asemenea, puteți previzualiza modificările pe platforma video în sine, într-o aplicație de editare video sau într-un player video.
VLC este un popular player video open-source și multiplatformă care acceptă subtitrări *.srt și *.vtt. Pentru a reda automat subtitrarea unui videoclip în VLC, plasați atât videoclipul original, cât și fișierul de subtitrare în același director, cu exact același nume de fișier înaintea extensiei de fișier.
Acum, când deschideți fișierul video în VLC, fișierul de subtitrare ar trebui să detecteze și să fie redat automat în fereastra playerului video.
A curăța
Pentru a evita costurile viitoare, gol și șterge gălețile S3 utilizate pentru intrare și ieșire. Asigurați-vă că aveți toate fișierele necesare stocate, deoarece acest lucru va elimina definitiv toate obiectele conținute în găleți. Pe Consola de transcriere, selectați și ștergeți toate lucrările care nu mai sunt necesare.
Concluzie
Acum ați creat un flux de lucru complet de creare a subtitrarilor de la capăt la capăt pentru a vă mări și accelera procesul de creare a subtitrarilor video, și totul fără a scrie niciun cod. În câteva minute, ați creat compartimente de stocare S3, ați încărcat un fișier pe Amazon S3 și ați folosit Amazon Transcribe pentru crearea subtitrarilor. Puteți descărca apoi fișierele de subtitrare *.srt și *.vtt rezultate pentru examinare și să le încărcați pe platforma de destinație.
Acest flux de lucru s-a concentrat pe subtitrări audio/video create folosind tehnologia de recunoaștere automată a vorbirii (ASR) din Amazon Transcribe special pentru fluxurile de lucru video. Acest flux de lucru în sine nu înlocuiește un proces de subtitrări bazat pe oameni, care este capabil să îndeplinească standarde mai înalte de accesibilitate, inclusiv identificarea difuzorului, efectele sonore, descrierea muzicii și revizuirea corectitudinii editării. Puteți utiliza metoda de editare a textului descrisă în această postare pentru a adăuga aceste elemente după finalizarea jobului inițial Amazon Transcribe. În plus, pentru crearea, previzualizarea și editarea de copii mai avansate bazate pe browser, puteți explora implementarea Localizare de conținut pe AWS soluție care este verificată de AWS Solution Architects și include un ghid de implementare. Această soluție oferă caracteristici suplimentare, cum ar fi previzualizarea în browser și editarea subtitrarilor, traducere subtitrare realizată de Traducerea Amazon, și capabilitățile de viziune computerizată oferite de Amazon Rekognition.
Dacă v-a plăcut această demonstrație a capacității Amazon Transcribe de a crea subtitrări, luați în considerare să explorați mai profund funcțiile și capabilitățile suplimentare pentru a vă accelera fluxurile de lucru audio/video. Pentru detalii suplimentare și mostre de cod pentru a sprijini automatizarea și scalarea creării subtitrarilor, consultați Crearea de subtitrări video. Mult succes în explorarea și dezvoltarea fluxului de lucru pentru crearea subtitrarilor.
Despre autor
Jason O'Malley este arhitect senior de soluții pentru parteneri la AWS, care sprijină partenerii care proiectează soluții pentru industria media, comunicații și tehnologie. Înainte de a se alătura AWS, Jason a petrecut 13 ani în industria media și a divertismentului la companii precum Team Coco a lui Conan O'Brien, WarnerMedia și Media.Monks. Jason și-a început cariera în producția și post-producția de televiziune înainte de a construi sarcini de lucru media pe AWS. Când Jason nu creează soluții pentru parteneri și clienți, el poate fi găsit aventurându-se cu soția și fiul său sau citind despre durabilitate.
- Coinsmart. Cel mai bun schimb de Bitcoin și Crypto din Europa.
- Platoblockchain. Web3 Metaverse Intelligence. Cunoștințe amplificate. ACCES LIBER.
- CryptoHawk. Radar Altcoin. Încercare gratuită.
- Source: https://aws.amazon.com/blogs/machine-learning/create-video-subtitles-with-amazon-transcribe-using-this-no-code-workflow/
- "
- 10
- 100
- 7
- Despre Noi
- accelera
- acces
- accesibilitate
- Cont
- Suplimentar
- adresa
- avansat
- TOATE
- deja
- Amazon
- Amazon Web Services
- sumă
- O alta
- oriunde
- aplicație
- aplicatii
- audiență
- audio
- Automat
- automatizarea
- disponibil
- AWS
- fundal
- beneficia
- Beneficiile
- CEL MAI BUN
- frontieră
- Clădire
- afaceri
- Aplicații pentru afaceri
- capacități
- legende
- Carieră
- cazuri
- provocări
- taxe
- Alege
- clasă
- închis
- cod
- Comun
- Comunicații
- Companii
- complex
- conformitate
- calculator
- Configuraţie
- Consoleze
- Recipient
- conţinut
- crea
- a creat
- Crearea
- creaţie
- Creatorii
- personalizat
- client
- Serviciu clienți
- clienţii care
- de date
- Mai adânc
- demonstra
- Implementarea
- descris
- desktop
- detalii
- în curs de dezvoltare
- dificil
- direct
- Nu
- domeniu
- Descarca
- editor
- efecte
- efort
- element
- încuraja
- criptare
- Intrați
- Divertisment
- Mediu inconjurator
- esenţial
- exemplu
- experienţă
- explorare
- explora
- extensii
- cu care se confruntă
- Caracteristică
- DESCRIERE
- First
- concentrat
- se concentrează
- următor
- format
- Înainte
- găsit
- viitor
- General
- genera
- generator
- La nivel global
- bine
- util
- ajută
- Înalt
- superior
- închiriere
- Cum
- Totuși
- HTTPS
- mare
- Identificare
- Identitate
- imagine
- punerea în aplicare a
- îmbunătățit
- include
- Inclusiv
- inclusivitate
- index
- industrie
- intrare
- integra
- probleme de
- IT
- în sine
- Loc de munca
- Locuri de munca
- cunoscut
- limbă
- mai mare
- învăţare
- Nivel
- locaţie
- noroc
- maşină
- masina de învățare
- menține
- FACE
- gestionate
- manieră
- manual
- manual
- materie
- Mass-media
- Metode
- ML
- model
- Modele
- mai mult
- cele mai multe
- Muzică
- Navigare
- necesar
- număr
- numere
- oferit
- promoții
- deschide
- Opțiune
- Opţiuni
- comandă
- organizație
- parte
- special
- partener
- parteneri
- platformă
- Joaca
- player
- joc
- Politicile
- sărac
- Popular
- posibil
- Anunţ
- de stabilire a prețurilor
- primar
- proces
- procese
- produce
- producere
- furnizează
- calitate
- ajunge
- Citind
- rămâne
- necesar
- Cerinţe
- Resurse
- REZULTATE
- revizuiască
- Scară
- scalare
- Ecran
- serviciu
- Servicii
- instalare
- indicat
- simplu
- Mărimea
- mic
- smartphone
- solid
- soluţie
- soluţii
- Cineva
- fiu
- Vorbitor
- difuzoare
- specific
- standard
- standarde
- Începe
- început
- începe
- Stare
- depozitare
- stoca
- curent
- a sustine
- Suportat
- De sprijin
- Sprijină
- Durabilitate
- luare
- echipă
- Tehnologii
- Tehnologia
- televiziune
- Sursa
- prin urmare
- Prin
- timp
- consumă timp
- Titlu
- urmări
- tradiţional
- tradiţional
- Pregătire
- Traducere
- tipic
- unic
- utilizare
- utilizatorii
- folosi
- valoare
- varietate
- verificat
- Video
- Vizualizare
- viziune
- Ceas
- web
- servicii web
- în timp ce
- în
- fără
- cuvinte
- Apartamente
- scris
- ani
- Randament
- youtube