Oversæt flere kildesprogsdokumenter til flere målsprog ved hjælp af Amazon Translate PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Oversæt flere kildesprogsdokumenter til flere målsprog ved hjælp af Amazon Translate

Virksomheder skal oversætte forretningskritisk indhold såsom marketingmateriale, instruktionsmanualer og produktkataloger på tværs af flere sprog for at kommunikere med et globalt publikum af kunder, partnere og interessenter. At identificere kildesproget i hvert dokument, før du kalder et oversættelsesjob, skaber kompleksitet og tilføjer endnu et trin til din arbejdsgang. For eksempel kræver en international produktvirksomhed med sine kundesupportaktiviteter placeret i deres virksomhedskontor, at deres agenter oversætter e-mails eller dokumenter for at understøtte kundeanmodninger. Tidligere skulle de opsætte arbejdsgange for at identificere dominerende sprog i hvert dokument, gruppere dem efter sprogtype og oprette et batch-oversættelsesjob for hvert kildesprog. Nu, Amazon Oversæt's automatiske sprogdetektionsfunktion til batch-oversættelsesjob giver dig mulighed for at oversætte en batch af dokumenter på forskellige sprog med et enkelt oversættelsesjob. Dette fjerner behovet for, at du skal orkestrere dokumentoversættelses-workflowet, der krævede dominerende sprogidentifikation og gruppering. Amazon Translate tillader også oversættelse til flere målsprog til oversættelse (op til 10 sprog). Et enkelt oversættelsesjob kan oversætte dokumenter til flere målsprog. Denne funktion eliminerer behovet for at oprette separate batchjob for individuelle målsprog. Kunder kan nu oprette dokumentation på flere sprog, alt sammen med et enkelt API-kald.

I dette indlæg demonstrerer vi, hvordan man oversætter dokumenter til flere målsprog i et batch-oversættelsesjob.

Løsningsoversigt

Automatisk registrering af kildesprog til batch-oversættelsesjob giver dig mulighed for at oversætte dokumenter skrevet på forskellige understøttede sprog i en enkelt handling. Du kan også angive op til 10 sprog som mål. Jobbet behandler hvert dokument, identificerer det dominerende kildesprog og oversætter det til målsproget. Amazon Translate bruger Amazon Comprehend at bestemme det dominerende sprog i hvert af dine kildedokumenter, og bruger det som kildesprog.

I de følgende afsnit demonstrerer vi, hvordan man opretter et batch-oversættelsesjob via AWS Management Console eller AWS SDK.

Opret et batch-oversættelsesjob via konsol

I dette eksempel konfigurerer vi Amazon Translate batch-oversættelse til automatisk at registrere kildesproget og oversætte det til engelsk og hindi ved hjælp af input og output Amazon Simple Storage Service (Amazon S3) skovlplaceringer angivet.

Dernæst opretter vi en AWS identitets- og adgangsstyring (IAM) rolle, der bliver klargjort som en del af konfigurationen. Rollen får adgang til input og output S3 buckets.

Når jobbet er oprettet, kan du overvåge fremskridtene for batchoversættelsesjobbet i Oversættelsesjob sektion.

afsnittet oversættelsesjob

Når oversættelsesopgaven er fuldført, kan du navigere til output S3-bøttens placering og observere, at dokumenterne er blevet oversat til deres målsprog. Vores input bestod af to filer, sample-doc.txt , sample-doc-2.txt, på to forskellige sprog. Hvert dokument blev oversat til to målsprog, for i alt fire dokumenter.

udgang S3 spand

Opret et batch-oversættelsesjob via AWS SDK

Den følgende Python Boto3-kode bruger batch-oversættelseskaldet til at oversætte dokumenter i din S3-kilde. Angiv følgende parametre:

  • InputDataConfig – Angiv S3-bøttens placering af dine inputdokumenter
  • OutputDataConfig – Angiv S3-bøttens placering af dine outputdokumenter
  • DataAccessRoleArn – Opret en IAM-rolle, der giver Amazon Translate tilladelse til at få adgang til dine input og output S3-bøtter
  • Kildesprogkode: Brug auto
  • Målsprogkoder: Vælg op til 10 målsprog
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

Ryd op

For at rydde op efter brug af denne opløsning skal du udføre følgende trin:

  1. Slet S3-bøtterne som du har skabt.
  2. Slet IAM-roller som du sætter op.
  3. Slet alle andre ressourcer, du har konfigureret til dette indlæg.

Konklusion

Med nutidens behov for at have en global rækkevidde med begrænsede ressourcer hjælper Amazon Translate dig med at forenkle dine flersprogede behandlingsarbejdsgange. Med introduktionen af ​​automatisk registrering af det dominerende sprog i dit kildedokument til batch-oversættelsesjob og oversættelse af dem til op til 10 målsprog, kan du fokusere på din forretningslogik i stedet for at håndtere den operationelle byrde ved at sortere dokumenter og administrere flere batch-oversættelser job.

Vi stræber efter at tilføje funktioner til vores service, der gør det nemmere for vores kunder at innovere. Prøv denne løsning, og fortæl os, hvordan dette hjalp med at forenkle din dokumentbehandlingsarbejdsbelastning.


Om forfatterne

Oversæt flere kildesprogsdokumenter til flere målsprog ved hjælp af Amazon Translate PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Kishore Dhamodaran er Senior Solutions Architect hos AWS. Kishore hjælper strategiske kunder med deres cloud-virksomhedsstrategi og migrationsrejse, og udnytter hans mangeårige branche- og cloud-erfaring.

Oversæt flere kildesprogsdokumenter til flere målsprog ved hjælp af Amazon Translate PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Sid Padgaonkar er Sr. Product Manager for Amazon Translate, AWS's naturlige sprogbehandlingstjeneste. I weekenden vil du finde ham spille squash og udforske madscenen i Stillehavet NW.

Tidsstempel:

Mere fra AWS maskinindlæring