Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe

Heruitgegeven door Plato

volgers: 0

Als u actief bent in een land met meerdere officiële talen of in meerdere regio's, kunnen uw audiobestanden verschillende talen bevatten. Deelnemers kunnen totaal verschillende talen spreken of wisselen tussen talen. Overweeg om een klantenservice te bellen om een probleem te melden in een gebied met een aanzienlijke meertalige bevolking. Hoewel het gesprek in één taal kan beginnen, is het mogelijk dat de klant naar een andere taal overschakelt om het probleem te beschrijven, afhankelijk van het comfortniveau of de gebruiksvoorkeuren met andere talen. Op dezelfde manier kan de medewerker van de klantenservice wisselen tussen talen terwijl hij bedienings- of probleemoplossingsinstructies geeft.

Met minimaal 3 seconden audio, Amazon Transcribe kan automatisch transcripties identificeren en efficiënt genereren in de talen die in de audio worden gesproken zonder dat mensen de talen hoeven te specificeren. Dit is van toepassing op verschillende use-cases, zoals het transcriberen van klantoproepen, het omzetten van voicemails in tekst, het vastleggen van interacties tijdens vergaderingen, het volgen van communicatie met gebruikersforums of het monitoren van de productie van media-inhoud en lokalisatieworkflows.

Dit bericht doorloopt de stappen voor het transcriberen van een meertalig audiobestand met Amazon Transcribe. We bespreken hoe u audiobestanden beschikbaar kunt maken voor Amazon Transcribe en transcriptie van meertalige audiobestanden kunt inschakelen bij het aanroepen van Amazon Transcribe API's.

Overzicht oplossingen

Amazon Transcribe is een AWS-service waarmee u eenvoudig spraak naar tekst kunt converteren. Spraak-naar-tekstfunctionaliteit toevoegen aan elke toepassing is eenvoudig met behulp van Amazon Transcribe, een geautomatiseerde spraakherkenningsservice (ASR). U kunt audio-invoer opnemen met Amazon Transcribe, duidelijke transcripties maken die gemakkelijk te lezen en te beoordelen zijn, de nauwkeurigheid vergroten met maatwerk en informatie filteren om de privacy van de klant te beschermen.

De oplossing maakt ook gebruik van Amazon eenvoudige opslagservice (Amazon S3), een objectopslagservice die is gebouwd om elke hoeveelheid gegevens overal op te slaan en op te halen. Het is een eenvoudige opslagservice die toonaangevende duurzaamheid, beschikbaarheid, prestaties, beveiliging en vrijwel onbeperkte schaalbaarheid biedt tegen zeer lage kosten. Wanneer u gegevens opslaat in Amazon S3, werkt u met bronnen die bekend staan als emmers en objecten. Een emmer is een container voor objecten. Een object is een bestand en alle metagegevens die het bestand beschrijven.

In dit bericht leiden we u door de volgende stappen om een meertalige audiotranscriptieoplossing te implementeren:

Maak een S3-bucket.
Upload uw audiobestand naar de bucket.
Maak de transcriptietaak.
Controleer de taakuitvoer.

Voorwaarden

Voor deze walkthrough moet u aan de volgende vereisten voldoen:

Amazon Transcribe biedt de optie om getranscribeerde uitvoer op te slaan in een door een service beheerde of door een klant beheerde S3-bucket. Voor dit bericht hebben we Amazon Transcribe de resultaten naar een door een service beheerde S3-bucket laten schrijven.

Houd er rekening mee dat Amazon Transcribe een regionale service is en dat de aangeroepen Amazon Transcribe API-eindpunten zich in dezelfde regio moeten bevinden als de S3-buckets.

Maak een S3-bucket om uw audio-invoerbestanden op te slaan

Voer de volgende stappen uit om uw S3-bucket te maken:

Kies op de Amazon S3-console Maak een bucket.
Voor Bucketnaam, voert u een wereldwijd unieke naam in voor de bucket.
Voor AWS-regio, kies dezelfde regio als uw Amazon Transcribe API-eindpunten.
Laat alle standaardinstellingen zoals ze zijn.
Kies Maak een bucket.

Upload uw audiobestand naar de S3-bucket

Upload uw meertalige audiobestand naar de S3-bucket in uw AWS-account. Voor deze oefening gebruiken we het volgende voorbeeld meertalig audiobestand. Het registreert een klantondersteuningsgesprek met Engelse en Spaanse talen.

Kies op de Amazon S3-console Emmers in het navigatievenster.
Kies de bucket die u eerder hebt gemaakt voor het opslaan van de ingevoerde audiobestanden.
Kies Uploaden.
Kies Bestanden toevoegen.
Kies het audiobestand dat u wilt transcriberen vanaf uw lokale computer.
Kies Uploaden.

Uw audiobestand is binnenkort beschikbaar in de S3-bucket.

Maak de transcriptietaak

Nu het audiobestand is geüpload, maken we nu een transcriptietaak.

Kies op de Amazon Transcribe-console: Transcriptietaken in het navigatievenster.
Kies Baan creëren.
Voor Naam, voer een unieke naam voor de taak in.
Dit is ook de naam van het uitvoertranscriptiebestand.
Voor Taal instellingenselecteer Automatische identificatie van meerdere talen.
Met deze functie kan Amazon Transcribe automatisch alle talen die in het audiobestand worden gesproken identificeren en transcriberen.
Voor Taalopties voor automatische taalidentificatie, laat het ongeselecteerd.
Amazon Transcribe identificeert en transcribeert automatisch alle talen die in de audio worden gesproken. Om de nauwkeurigheid van de transcriptie te verbeteren, kunt u optioneel twee of meer talen selecteren waarvan u weet dat ze in de audio zijn gesproken.
Voor Model type, alleen de Algemeen model optie is beschikbaar op het moment van schrijven van dit bericht.
Voor Invoergegevens, kiezen Blader door S3.
Kies het audiobronbestand dat we eerder hebben geüpload.
Voor Gegevens uitvoeren, kunt u een van beide selecteren Door service beheerde S3-bucket or Door de klant gespecificeerde S3-bak. Selecteer voor dit bericht Door service beheerde S3-bucket.
Kies Volgende.
Kies Baan creëren.

Bekijk de taakoutput

Wanneer de transcriptietaak is voltooid, opent u de transcriptietaak.

Blader omlaag naar de Transcriptievoorbeeld sectie. De audiotranscriptie wordt weergegeven op het Tekst tabblad. De transcriptie bevat zowel het Engelse als het Spaanse gedeelte van het gesprek.

U kunt optioneel een kopie van het transcript downloaden als een JSON-bestand, dat u voor verder gebruik zou kunnen gebruiken analyses na het gesprek.

Opruimen

Om toekomstige kosten te voorkomen, leegt en verwijdert u de S3-bucket die u hebt gemaakt voor het opslaan van het ingevoerde audiobronbestand. Zorg ervoor dat u de bestanden ergens anders hebt opgeslagen, want hierdoor worden alle objecten in de bucket permanent verwijderd. Selecteer en verwijder de taak die eerder voor de transcriptie is gemaakt op de Amazon Transcribe-console.

Conclusie

In dit bericht hebben we een end-to-end workflow gemaakt om de identificatie en transcriptie van meertalige audiobestanden te automatiseren, zonder enige code te schrijven. We hebben de nieuwe functionaliteit in Amazon Transcribe gebruikt om automatisch verschillende talen in een audiobestand te identificeren en elke taal correct te transcriberen.

Raadpleeg voor meer informatie Taalidentificatie met batchtranscriptietaken.

Over de auteurs

Murtuza Bootwala is een Senior Solutions Architect bij AWS met interesse in AI/ML-technologieën. Hij werkt graag samen met klanten om hen te helpen hun bedrijfsresultaten te behalen. Buiten zijn werk houdt hij van buitenactiviteiten en tijd doorbrengen met zijn gezin.

Victor Red heeft een passie voor AI/ML en softwareontwikkeling. Hij hielp Amazon Alexa aan de praat te krijgen in de VS en Mexico. Ook bracht hij Amazon Textract naar AWS Partners en kreeg AWS Contact Center Intelligence (CCI) van de grond. Hij is momenteel de Global Tech Leader voor Conversational AI Partners.

Baboe Srinivasan is een AWS Sr. Specialist SA (Language AI Services) gevestigd in Chicago. Hij richt zich op Amazon Transcribe (spraak naar tekst), waarbij hij onze klanten helpt AI-diensten te gebruiken om zakelijke problemen op te lossen. Buiten zijn werk houdt hij van houtbewerking en het uitvoeren van goochelshows.

Tijdstempel: 14 december 202214 december 2022

Tijdstempel: Juni 12, 2023

Identificeer automatisch talen in meertalige audio met Amazon Transcribe

Heruitgegeven door Plato

Overzicht oplossingen

Voorwaarden

Maak een S3-bucket om uw audio-invoerbestanden op te slaan

Upload uw audiobestand naar de S3-bucket

Maak de transcriptietaak

Bekijk de taakoutput

Opruimen

Conclusie

Over de auteurs

Meer van AWS-machine learning

Visualiseer uw Amazon Lookout for Metrics-afwijkingsresultaten met Amazon QuickSight

Versnel grootschalige neurale netwerktraining op CPU's met ThirdAI en AWS Graviton | Amazon-webservices

Voer meerdere deep learning-modellen uit op GPU met Amazon SageMaker multi-model endpoints

Amazon SageMaker Automatic Model Tuning kiest nu automatisch afstemmingsconfiguraties om de bruikbaarheid en kostenefficiëntie te verbeteren | Amazon-webservices

Hoe xarvio Digital Farming Solutions zijn ontwikkeling versnelt met de georuimtelijke mogelijkheden van Amazon SageMaker

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account