Maak video-ondertitels met Amazon Transcribe met behulp van deze workflow zonder code

Heruitgegeven door Plato

volgers: 0

Het maken van ondertitels op video-inhoud vormt een uitdaging, hoe groot of klein de organisatie ook is. Om die uitdagingen aan te gaan, Amazon Transcribe heeft een handige functie die het maken van ondertitels rechtstreeks binnen de service mogelijk maakt. Er is geen machine learning (ML) of code schrijven vereist om aan de slag te gaan. Dit bericht helpt je bij het opzetten van een workflow zonder code voor het maken van video-ondertitels met Amazon Transcribe binnen je Amazon Web Services-account.

Ondertiteling versus ondertiteling

De voorwaarden ondertitels en Gesloten bijschriften worden vaak door elkaar gebruikt en beide verwijzen naar gesproken tekst die op het scherm wordt weergegeven. Een belangrijk verschil tussen ondertitels en ondertitels (gebaseerd op branche- en toegankelijkheidsdefinities) is echter dat ondertitels zowel de transcriptie van het gesproken woord als een beschrijving van achtergrondmuziek of geluiden in de audiotrack bevatten voor een rijkere toegankelijkheidservaring . Dit bericht richt zich alleen op het maken van getranscribeerde ondertitelbestanden met gesproken woord met behulp van automatische spraakherkenningstechnologie (ASR) die geen sprekeridentificatie, geluidseffecten of muziekbeschrijvingen bevatten. Amazon Transcribe ondersteunt de industriestandaard SubRip Text (*.srt) en Web Video Text Tracks (*.vtt) formaten voor ondertitel maken.

De volgende afbeelding toont een voorbeeld van ondertitels die zijn ingeschakeld in een webvideospeler.

Ondertitels zijn gunstig voor videomakers door zowel het bereik als de inclusiviteit van hun video-inhoud te vergroten. Door het gesproken audiogedeelte van een video op het scherm weer te geven, maken ondertitels audio/video-inhoud toegankelijk voor een groter publiek, inclusief degenen die niet-moedertaalsprekers zijn en degenen die zich in een omgeving bevinden waar geluid onhoorbaar is.

Hoewel de voordelen van ondertitels duidelijk zijn, hebben videomakers van oudsher te maken gehad met obstakels bij het maken van ondertitels. Obstakels ontstaan door de tijdrovende en arbeidsintensieve vereisten van het traditionele creatieproces dat sterk afhankelijk is van handmatige inspanning. Traditionele ondertitelingsmethoden zijn handmatig en kunnen dagen tot weken duren om te voltooien, en zijn daarom mogelijk niet compatibel met alle productieschema's. Evenzo maken veel bedrijven gebruik van handmatige transcriptieservices, maar deze processen zijn vaak niet schaalbaar en duur in onderhoud. Amazon Transcribe maakt het je gemakkelijk om spraak om te zetten in tekst met behulp van op ML gebaseerde technologieën en helpt videomakers deze problemen op te lossen.

Overzicht oplossingen

Dit bericht doorloopt een workflow zonder code voor het genereren van ondertitels met behulp van Amazon eenvoudige opslagservice (Amazon S3) en Amazon Transcribe.

Amazon S3 is objectopslag die is gebouwd om elke hoeveelheid gegevens overal op te slaan en op te halen. Dit bericht doorloopt het proces om maak een S3-bucket en upload een audiobestand. Wanneer gebruikers gegevens opslaan in Amazon S3, werken ze met bronnen die bekend staan als buckets en objecten. EEN emmer is een container voor objecten. Een object is een bestand en alle metagegevens die dat bestand beschrijven.

Amazon Transcribe is een ASR-service die volledig beheerde en continu getrainde ML-modellen gebruikt om audio-/videobestanden naar tekst om te zetten. Amazon Transcribe-invoer en -uitvoer worden opgeslagen in Amazon S3. Amazon Transcribe neemt audiogegevens, ofwel een mediabestand in een Amazon S3-bucket of een mediastream, en converteert deze naar tekstgegevens. Met Amazon Transcribe kunt u audio-invoer opnemen, gemakkelijk leesbare transcripties produceren met een hoge mate van nauwkeurigheid, uw uitvoer aanpassen voor domeinspecifieke woordenschat met aangepaste taalmodellen (CLM) en aangepaste vocabulaires en inhoud filteren om de privacy van klanten te waarborgen. Klanten kunnen ervoor kiezen om Amazon Transcribe te gebruiken voor een verscheidenheid aan zakelijke toepassingen, waaronder: transcriptie van spraakgestuurde klantenservicegesprekken, generatie van ondertitels op audio/video-inhoud en (tekstgebaseerde) inhoudsanalyse uitvoeren op audio/video-inhoud. Voor dit bericht demonstreren we het maken van een transcriptietaak en het beoordelen van de taakuitvoer.

Als je de voorkeur geeft aan een video-walkthrough, raadpleeg dan de Amazon Transcribe-videosnack-aflevering Video-ondertiteling maken zonder code te schrijven.

Voorwaarden

Om door de oplossing te lopen, moet u aan de volgende vereisten voldoen:

An AWS-account met voldoende AWS Identiteits- en toegangsbeheer (IAM) gebruikersrechten
Een audio-/videobestand met gesproken woorden in een Amazon Transcribe ondersteunde taal en in een ondersteund invoerformaat

Als u nog geen voorbeeldaudio-/videobestand heeft, kunt u er een maken met een video-opnametoepassing op uw computer of smartphone. Zorg ervoor dat u duidelijk in de microfoon spreekt om het hoogste niveau van transcriptiekwaliteit te garanderen tijdens het opnemen. Een andere optie is om een gratis beschikbare download te vinden met gesproken woord, zoals een podcastof de video-walkthrough in dit bericht, dat kan worden ingenomen door Amazon Transcribe. Het opgenomen of gedownloade bestand moet toegankelijk zijn op uw bureaublad om te uploaden naar uw AWS-account.

Bekijk voordat u aan de slag gaat de Amazon Transcribe en Amazon S3 prijspagina's voor serviceprijzen.

Maak de S3-buckets

Voor dit bericht maken we twee S3-buckets om de invoer en uitvoer gescheiden te houden.

Kies op de Amazon S3-console Maak een bucket.
Geef elke bucket een globaal unieke naam.
Gebruik de standaardinstellingen om naleving van het beleid van uw organisatie te garanderen.
Enable bucketversiebeheer en standaard versleuteling aan de serverzijde (aanbevolen).
Kies Maak een bucket.

De volgende schermafbeelding toont de configuratie voor de invoerbucket.

De S3-bucket voor invoer is nu klaar om het audio-/videobestand te uploaden. Op het moment van deze publicatie was de maximale invoergrootte voor Amazon Transcribe is 2 GB. Als het videobestand dat aantal overschrijdt of in een formaat dat niet standaard wordt ondersteund door Amazon Transcribe, overweeg om te gebruiken AWS Elementaire MediaConvert naar een uitgang met alleen audio maken. Dit is gunstig omdat audiobestanden doorgaans veel kleiner zijn dan videobestanden en Amazon Transcribe alleen de audiotrack nodig heeft, en niet de videotrack, om transcripties en ondertitels te genereren.

Upload het bronbestand naar de S3-bucket

Voer de volgende stappen uit om uw bronbestand te uploaden:

Selecteer op de Amazon S3-console uw invoerbucket.
Kies Uploaden.
Kies het bestand vanaf uw bureaublad.
Accepteer de standaard instellingen voor opslagklasse en versleuteling of pas ze aan op basis van het beleid van uw organisatie.
Kies Uploaden.

Een transcriptietaak maken

Nu het invoerbestand gereed is in Amazon S3, maken we nu een transcriptietaak in Amazon Transcribe.

Op de Amazon Transcribe-console, kiezen Transcriptietaken in het navigatievenster.
Kies Baan creëren.

Deze walkthrough maakt grotendeels gebruik van standaardopties; u moet echter de configuratie kiezen die het beste past bij de vereisten van uw organisatie.

Voor Naam, voer een naam in voor deze taak en het resulterende bestand.
Voor Taal instellingenselecteer specifieke taal.
Voor Taal, kies de brontaal van het invoerbestand.
Voor Model type¸ selecteren Algemeen model.

We gebruiken het algemene model voor deze demo, maar we moedigen u aan om training en gebruik te verkennen aangepaste taalmodellen voor verbeterde nauwkeurigheid voor specifieke gebruikssituaties, zoals branchespecifieke termen of acroniemen. Voor een diepere duik in aangepaste taalmodellen, bekijk de Amazon Transcribe-videosnack Aangepaste taalmodellen (CLM) gebruiken om de nauwkeurigheid van de transcriptie te verbeteren.

Voor Invoer bestandslocatie op S3, kiezen Blader door S3.
Kies de invoerbak en het audio-/videobestand dat moet worden getranscribeerd.
Voor Uitvoergegevens locatietype infoselecteer Door de klant gespecificeerde S3-bak.
Voor Uitvoerbestandsbestemming op S3, kiezen Blader door S3.
Kies de nieuw gemaakte uitvoerbucket.

De Ondertitel bestandsformaat sectie biedt de twee meest essentiële opties van dit hele bericht. U kunt de *.srt- en *.vtt-geformatteerde uitvoer selecteren als onderdeel van de Amazon Transcribe-transcriptietaak. Op het moment van schrijven voegt het selecteren van een of beide geen extra kosten toe aan de Amazon Transcribe-taak.

Selecteer beide voor dit bericht SRT en Mountainbike.
Voor Specificeer de startindex, kiezen 0 or 1.

Deze waarde verwijst naar het startnummer van de eerste ondertitel in volgorde. Als u niet zeker weet welke waarde u moet kiezen, 1 is de meest voorkomende.

Wanneer de instellingen aanwezig zijn, kiest u: Volgende.
Configureer eventuele optionele instellingen volgens uw behoeften.

Amazon Transcribe presenteert opties voor audio-identificatie voor kanalen or speakers, alternatieve resultaten, PII redactie, woordenschat filteren en aangepaste woordenschat. Voor dit specifieke bericht kunt u deze configuratie-opties overslaan. Voor een diepere duik in taakconfiguratie-opties, bekijk de Amazon Transcribe-videosnacks-afleveringen voor: aangepaste woordenschat, aangepaste taalmodellen en woordenschat filteren.

Kies Baan creëren.

Bekijk de taakoutput

De transcriptietaak om uw video-ondertitels te maken begint. De taakstatus, zoals weergegeven in de volgende schermafbeelding, wordt weergegeven in het paneel met taakdetails. Wanneer de taak is voltooid, kiest u de locatie van de uitvoergegevens om de nieuw gemaakte ondertitels in de S3-bucket te vinden.

Ondertitels worden geïdentificeerd door de extensie *.srt of *.vtt. Wanneer u het object in de S3-bucket selecteert, heeft u de mogelijkheid om het bestand te downloaden.

Omdat deze ondertitels in platte tekst zijn, kan elke teksteditor de resulterende transcriptie bekijken en bewerken. Het vergelijken van de *.srt- en *.vtt-bestanden onthult veel overeenkomsten, met subtiele verschillen.

Het volgende is een voorbeeld van de *.srt-indeling:

1
00:00:00,240 --> 00:00:04,440
Transcribing audio can be complex, time consuming and expensive. 2
00:00:04,600 --> 00:00:07,250
You either need to hire someone to do it manually, 3
00:00:07,490 --> 00:00:10,790
implement applications that are difficult to maintain, or use 4
00:00:10,790 --> 00:00:13,920
hard to integrate services that yield poor results. 5
00:00:14,540 --> 00:00:17,290
Amazon Transcribe takes a huge leap forward.

Het volgende is een voorbeeld van de *.vtt-indeling:

WEBVTT 1
00:00:00.240 --> 00:00:04.440
Transcribing audio can be complex, time consuming and expensive. 2
00:00:04.600 --> 00:00:07.250
You either need to hire someone to do it manually, 3
00:00:07.490 --> 00:00:10.790
implement applications that are difficult to maintain, or use 4
00:00:10.790 --> 00:00:13.920
hard to integrate services that yield poor results. 5
00:00:14.540 --> 00:00:17.290
Amazon Transcribe takes a huge leap forward.

De cijfers geven de volgorde aan waarin de ondertiteling wordt weergegeven. De tijdcode geeft aan wanneer de ondertitel wordt weergegeven. De tekst is de ondertiteltekst zelf.

Alle wijzigingen of revisies zijn nu rechtstreeks in de teksteditor mogelijk en blijven compatibel wanneer ze worden opgeslagen met de extensie *.srt of *.vtt. U kunt wijzigingen ook bekijken op het videoplatform zelf, in een videobewerkingstoepassing of in een videospeler.

VLC is een populaire open-source en platformonafhankelijke videospeler die ondertitels *.srt en *.vtt ondersteunt. Om automatisch ondertitels over een video af te spelen binnen VLC, plaatst u zowel de originele video als het ondertitelbestand in dezelfde map met exact dezelfde bestandsnaam voor de bestandsextensie.

Wanneer u nu het videobestand in VLC opent, zou het ondertitelbestand automatisch moeten detecteren en afspelen in het videospelervenster.

Opruimen

Om toekomstige kosten te voorkomen, leeg en verwijderen de S3-buckets die worden gebruikt voor invoer en uitvoer. Zorg ervoor dat u alle benodigde bestanden hebt opgeslagen, want hierdoor worden alle objecten in de buckets permanent verwijderd. Op de Transcribeerconsole, selecteer en verwijder alle taken die niet langer nodig zijn.

Conclusie

Je hebt nu een complete end-to-end workflow voor het maken van ondertitels gemaakt om je proces voor het maken van ondertitels voor video's te verbeteren en te versnellen, en dat allemaal zonder code te hoeven schrijven. Binnen een paar minuten heb je S3-opslagbuckets gemaakt, een bestand geüpload naar Amazon S3 en Amazon Transcribe gebruikt voor het maken van ondertitels. U kunt dan de resulterende *.srt- en *.vtt-ondertitelbestanden downloaden om ze te bekijken en ze uploaden naar het bestemmingsplatform.

Deze workflow was gericht op audio-/video-ondertitels die zijn gemaakt met behulp van de automatische spraakherkenningstechnologie (ASR) in Amazon Transcribe, speciaal voor videoworkflows. Deze workflow alleen is geen vervanging voor een op mensen gebaseerd ondertitelingsproces, dat in staat is om te voldoen aan hogere normen voor toegankelijkheid, waaronder sprekeridentificatie, geluidseffecten, muziekbeschrijving en recensie van kopieerbewerkingen op nauwkeurigheid. Je kunt de tekstbewerkingsmethode gebruiken die in dit bericht wordt beschreven om deze elementen toe te voegen nadat de eerste Amazon Transcribe-taak is voltooid. Voor meer geavanceerde browsergebaseerde ondertitelcreatie, preview en kopieerbewerking, kunt u de implementatie van de Contentlokalisatie op AWS oplossing die is doorgelicht door AWS Solution Architects en een implementatie gids. Deze oplossing biedt extra functies zoals: in-browser preview en bewerken van ondertitels, ondertitel vertaling mogelijk gemaakt door Amazon Vertalen, en computer vision-mogelijkheden aangeboden door Amazon Rekognition.

Als je genoten hebt van deze demonstratie van het vermogen van Amazon Transcribe om ondertitels te maken, overweeg dan om een diepere duik te nemen in extra functies en mogelijkheden om je audio/video-workflows te versnellen. Voor aanvullende details en codevoorbeelden ter ondersteuning van het automatiseren en schalen van het maken van ondertitels, zie: Video-ondertiteling maken. Veel succes bij het verkennen en ontwikkelen van je workflow voor het maken van ondertitels.

Over de auteur

Jason O'Malley is een Sr. Partner Solutions Architect bij AWS en ondersteunt partners bij het ontwerpen van media-, communicatie- en technologie-industrieoplossingen. Voordat hij bij AWS kwam, werkte Jason 13 jaar in de media- en entertainmentindustrie bij bedrijven als Conan O'Brien's Team Coco, WarnerMedia en Media.Monks. Jason begon zijn carrière in televisieproductie en postproductie voordat hij media-workloads opbouwde op AWS. Als Jason geen oplossingen bedenkt voor partners en klanten, is hij te vinden op avontuur met zijn vrouw en zoon, of leest hij over duurzaamheid.

Tijdstempel: 10 mei 2022

Tijdstempel: Jan 10, 2023

Maak video-ondertitels met Amazon Transcribe met behulp van deze workflow zonder code

Heruitgegeven door Plato

Ondertiteling versus ondertiteling

Overzicht oplossingen

Voorwaarden

Maak de S3-buckets

Upload het bronbestand naar de S3-bucket

Een transcriptietaak maken

Bekijk de taakoutput

Opruimen

Conclusie

Over de auteur

Meer van AWS-machine learning

Verbeter de nauwkeurigheid van de transcriptie van klant-agent-oproepen met aangepaste woordenschat in Amazon Transcribe

Aankondiging van de bijgewerkte ServiceNow-connector (V2) voor Amazon Kendra

Hoe serviceproviders natuurlijke taalverwerking kunnen gebruiken om inzichten te verkrijgen uit klanttickets met Amazon Comprehend

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account