Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Identificeer automatisch talen in meertalige audio met Amazon Transcribe

Als u actief bent in een land met meerdere officiële talen of in meerdere regio's, kunnen uw audiobestanden verschillende talen bevatten. Deelnemers kunnen totaal verschillende talen spreken of wisselen tussen talen. Overweeg om een ​​klantenservice te bellen om een ​​probleem te melden in een gebied met een aanzienlijke meertalige bevolking. Hoewel het gesprek in één taal kan beginnen, is het mogelijk dat de klant naar een andere taal overschakelt om het probleem te beschrijven, afhankelijk van het comfortniveau of de gebruiksvoorkeuren met andere talen. Op dezelfde manier kan de medewerker van de klantenservice wisselen tussen talen terwijl hij bedienings- of probleemoplossingsinstructies geeft.

Met minimaal 3 seconden audio, Amazon Transcribe kan automatisch transcripties identificeren en efficiënt genereren in de talen die in de audio worden gesproken zonder dat mensen de talen hoeven te specificeren. Dit is van toepassing op verschillende use-cases, zoals het transcriberen van klantoproepen, het omzetten van voicemails in tekst, het vastleggen van interacties tijdens vergaderingen, het volgen van communicatie met gebruikersforums of het monitoren van de productie van media-inhoud en lokalisatieworkflows.

Dit bericht doorloopt de stappen voor het transcriberen van een meertalig audiobestand met Amazon Transcribe. We bespreken hoe u audiobestanden beschikbaar kunt maken voor Amazon Transcribe en transcriptie van meertalige audiobestanden kunt inschakelen bij het aanroepen van Amazon Transcribe API's.

Overzicht oplossingen

Amazon Transcribe is een AWS-service waarmee u eenvoudig spraak naar tekst kunt converteren. Spraak-naar-tekstfunctionaliteit toevoegen aan elke toepassing is eenvoudig met behulp van Amazon Transcribe, een geautomatiseerde spraakherkenningsservice (ASR). U kunt audio-invoer opnemen met Amazon Transcribe, duidelijke transcripties maken die gemakkelijk te lezen en te beoordelen zijn, de nauwkeurigheid vergroten met maatwerk en informatie filteren om de privacy van de klant te beschermen.

De oplossing maakt ook gebruik van Amazon eenvoudige opslagservice (Amazon S3), een objectopslagservice die is gebouwd om elke hoeveelheid gegevens overal op te slaan en op te halen. Het is een eenvoudige opslagservice die toonaangevende duurzaamheid, beschikbaarheid, prestaties, beveiliging en vrijwel onbeperkte schaalbaarheid biedt tegen zeer lage kosten. Wanneer u gegevens opslaat in Amazon S3, werkt u met bronnen die bekend staan ​​als emmers en objecten. Een emmer is een container voor objecten. Een object is een bestand en alle metagegevens die het bestand beschrijven.

In dit bericht leiden we u door de volgende stappen om een ​​meertalige audiotranscriptieoplossing te implementeren:

  1. Maak een S3-bucket.
  2. Upload uw audiobestand naar de bucket.
  3. Maak de transcriptietaak.
  4. Controleer de taakuitvoer.

Voorwaarden

Voor deze walkthrough moet u aan de volgende vereisten voldoen:

Amazon Transcribe biedt de optie om getranscribeerde uitvoer op te slaan in een door een service beheerde of door een klant beheerde S3-bucket. Voor dit bericht hebben we Amazon Transcribe de resultaten naar een door een service beheerde S3-bucket laten schrijven.

Houd er rekening mee dat Amazon Transcribe een regionale service is en dat de aangeroepen Amazon Transcribe API-eindpunten zich in dezelfde regio moeten bevinden als de S3-buckets.

Maak een S3-bucket om uw audio-invoerbestanden op te slaan

Voer de volgende stappen uit om uw S3-bucket te maken:

  1. Kies op de Amazon S3-console Maak een bucket.
  2. Voor Bucketnaam, voert u een wereldwijd unieke naam in voor de bucket.
  3. Voor AWS-regio, kies dezelfde regio als uw Amazon Transcribe API-eindpunten.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  4. Laat alle standaardinstellingen zoals ze zijn.
  5. Kies Maak een bucket.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Upload uw audiobestand naar de S3-bucket

Upload uw meertalige audiobestand naar de S3-bucket in uw AWS-account. Voor deze oefening gebruiken we het volgende voorbeeld meertalig audiobestand. Het registreert een klantondersteuningsgesprek met Engelse en Spaanse talen.

  1. Kies op de Amazon S3-console Emmers in het navigatievenster.
  2. Kies de bucket die u eerder hebt gemaakt voor het opslaan van de ingevoerde audiobestanden.
  3. Kies Uploaden.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  4. Kies Bestanden toevoegen.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  5. Kies het audiobestand dat u wilt transcriberen vanaf uw lokale computer.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  6. Kies Uploaden.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Uw audiobestand is binnenkort beschikbaar in de S3-bucket.

Maak de transcriptietaak

Nu het audiobestand is geüpload, maken we nu een transcriptietaak.

  1. Kies op de Amazon Transcribe-console: Transcriptietaken in het navigatievenster.
  2. Kies Baan creëren.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  3. Voor Naam, voer een unieke naam voor de taak in.
    Dit is ook de naam van het uitvoertranscriptiebestand.
  4. Voor Taal instellingenselecteer Automatische identificatie van meerdere talen.
    Met deze functie kan Amazon Transcribe automatisch alle talen die in het audiobestand worden gesproken identificeren en transcriberen.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  5. Voor Taalopties voor automatische taalidentificatie, laat het ongeselecteerd.
    Amazon Transcribe identificeert en transcribeert automatisch alle talen die in de audio worden gesproken. Om de nauwkeurigheid van de transcriptie te verbeteren, kunt u optioneel twee of meer talen selecteren waarvan u weet dat ze in de audio zijn gesproken.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  6. Voor Model type, alleen de Algemeen model optie is beschikbaar op het moment van schrijven van dit bericht.
  7. Voor Invoergegevens, kiezen Blader door S3.
  8. Kies het audiobronbestand dat we eerder hebben geüpload.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  9. Voor Gegevens uitvoeren, kunt u een van beide selecteren Door service beheerde S3-bucket or Door de klant gespecificeerde S3-bak. Selecteer voor dit bericht Door service beheerde S3-bucket.
    Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
  10. Kies Volgende.
  11. Kies Baan creëren.

Bekijk de taakoutput

Wanneer de transcriptietaak is voltooid, opent u de transcriptietaak.
Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Blader omlaag naar de Transcriptievoorbeeld sectie. De audiotranscriptie wordt weergegeven op het Tekst tabblad. De transcriptie bevat zowel het Engelse als het Spaanse gedeelte van het gesprek.
Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

U kunt optioneel een kopie van het transcript downloaden als een JSON-bestand, dat u voor verder gebruik zou kunnen gebruiken analyses na het gesprek.

Opruimen

Om toekomstige kosten te voorkomen, leegt en verwijdert u de S3-bucket die u hebt gemaakt voor het opslaan van het ingevoerde audiobronbestand. Zorg ervoor dat u de bestanden ergens anders hebt opgeslagen, want hierdoor worden alle objecten in de bucket permanent verwijderd. Selecteer en verwijder de taak die eerder voor de transcriptie is gemaakt op de Amazon Transcribe-console.

Conclusie

In dit bericht hebben we een end-to-end workflow gemaakt om de identificatie en transcriptie van meertalige audiobestanden te automatiseren, zonder enige code te schrijven. We hebben de nieuwe functionaliteit in Amazon Transcribe gebruikt om automatisch verschillende talen in een audiobestand te identificeren en elke taal correct te transcriberen.

Raadpleeg voor meer informatie Taalidentificatie met batchtranscriptietaken.


Over de auteurs

Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.Murtuza Bootwala is een Senior Solutions Architect bij AWS met interesse in AI/ML-technologieën. Hij werkt graag samen met klanten om hen te helpen hun bedrijfsresultaten te behalen. Buiten zijn werk houdt hij van buitenactiviteiten en tijd doorbrengen met zijn gezin.

Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.Victor Red heeft een passie voor AI/ML en softwareontwikkeling. Hij hielp Amazon Alexa aan de praat te krijgen in de VS en Mexico. Ook bracht hij Amazon Textract naar AWS Partners en kreeg AWS Contact Center Intelligence (CCI) van de grond. Hij is momenteel de Global Tech Leader voor Conversational AI Partners.

Identificeer automatisch talen in meertalige audio met behulp van Amazon Transcribe PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.Baboe Srinivasan is een AWS Sr. Specialist SA (Language AI Services) gevestigd in Chicago. Hij richt zich op Amazon Transcribe (spraak naar tekst), waarbij hij onze klanten helpt AI-diensten te gebruiken om zakelijke problemen op te lossen. Buiten zijn werk houdt hij van houtbewerking en het uitvoeren van goochelshows.

Tijdstempel:

Meer van AWS-machine learning