Oversett dokumenter fra flere kildespråk til flere målspråk ved å bruke Amazon Translate PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Oversett dokumenter fra flere kildespråk til flere målspråk ved hjelp av Amazon Translate

Bedrifter må oversette forretningskritisk innhold som markedsføringsmateriell, bruksanvisninger og produktkataloger på tvers av flere språk for å kommunisere med et globalt publikum av kunder, partnere og interessenter. Å identifisere kildespråket i hvert dokument før du kaller en oversettelsesjobb skaper kompleksitet og legger til et nytt trinn i arbeidsflyten din. For eksempel krever et internasjonalt produktselskap med kundestøttevirksomhet lokalisert på bedriftskontoret at agentene deres oversetter e-poster eller dokumenter for å støtte kundeforespørsler. Tidligere måtte de sette opp arbeidsflyter for å identifisere dominerende språk i hvert dokument, gruppere dem etter språktype og sette opp en batch-oversettelsesjobb for hvert kildespråk. Nå, Amazon Oversett's automatiske språkdeteksjonsfunksjon for batch-oversettelsesjobber lar deg oversette en gruppe dokumenter på forskjellige språk med en enkelt oversettelsesjobb. Dette fjerner behovet for at du skal organisere arbeidsflyten for dokumentoversettelse som krevde dominerende språkidentifikasjon og gruppering. Amazon Translate tillater også oversettelse til flere målspråk for oversettelse (opptil 10 språk). En enkelt oversettelsesjobb kan oversette dokumenter til flere målspråk. Denne funksjonen eliminerer behovet for å lage separate batch-jobber for individuelle målspråk. Kunder kan nå lage dokumentasjon på flere språk, alt med ett enkelt API-kall.

I dette innlegget viser vi hvordan du oversetter dokumenter til flere målspråk i en batch-oversettelsesjobb.

Løsningsoversikt

Automatisk gjenkjenning av kildespråk for batch-oversettelsesjobber lar deg oversette dokumenter skrevet på forskjellige støttede språk i en enkelt operasjon. Du kan også angi opptil 10 språk som mål. Jobben behandler hvert dokument, identifiserer det dominerende kildespråket og oversetter det til målspråket. Amazon Translate bruker Amazon Comprehend for å bestemme det dominerende språket i hvert av kildedokumentene dine, og bruker det som kildespråk.

I de følgende delene viser vi hvordan du oppretter en batch-oversettelsesjobb via AWS-administrasjonskonsoll eller AWS SDK.

Opprett en batch-oversettelsesjobb via konsollen

I dette eksemplet konfigurerer vi Amazon Translate batch-oversettelse til automatisk å oppdage kildespråket og oversette det til engelsk og hindi, ved å bruke input og output Amazon enkel lagringstjeneste (Amazon S3) skuffeplasseringer oppgitt.

Deretter lager vi en AWS identitets- og tilgangsadministrasjon (IAM)-rolle som blir klargjort som en del av konfigurasjonen. Rollen gis tilgang til input og output S3-bøttene.

Etter at jobben er opprettet, kan du overvåke fremdriften til batchoversettelsesjobben i Oversettelsesjobber seksjon.

delen for oversettelsesjobber

Når oversettelsesjobben er fullført, kan du navigere til S3-utgangen og se at dokumentene er oversatt til målspråket. Innspillet vårt besto av to filer, sample-doc.txt og sample-doc-2.txt, på to forskjellige språk. Hvert dokument ble oversatt til to målspråk, for totalt fire dokumenter.

utgang S3 bøtte

Opprett en batch-oversettelsesjobb via AWS SDK

Følgende Python Boto3-kode bruker batchoversettelseskallet til å oversette dokumenter i S3-kilden din. Spesifiser følgende parametere:

  • InputDataConfig – Oppgi S3-bøtteplasseringen for inndatadokumentene dine
  • OutputDataConfig – Oppgi S3-bøtteplasseringen for utdatadokumentene dine
  • DataAccessRoleArn – Opprett en IAM-rolle som gir Amazon Translate tillatelse til å få tilgang til inn- og utdata S3-bøttene dine
  • Kildespråkkode: Bruk auto
  • Målspråkkoder: Velg opptil 10 målspråk
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

Rydd opp

For å rydde opp etter bruk av denne løsningen, fullfør følgende trinn:

  1. Slett S3-bøttene som du opprettet.
  2. Slett IAM-roller som du setter opp.
  3. Slett eventuelle andre ressurser du har konfigurert for dette innlegget.

konklusjonen

Med dagens behov for å ha en global rekkevidde med begrensede ressurser, hjelper Amazon Translate deg med å forenkle arbeidsflytene dine på flere språk. Med introduksjonen av automatisk oppdagelse av det dominerende språket i kildedokumentet ditt for batch-oversettelsesjobber, og oversette dem til opptil 10 målspråk, kan du fokusere på forretningslogikken din i stedet for å håndtere den operasjonelle byrden med å sortere dokumenter og administrere flere batch-oversettelse arbeidsplasser.

Vi streber etter å legge til funksjoner i tjenesten vår som gjør det enklere for våre kunder å innovere. Prøv denne løsningen og fortell oss hvordan dette bidro til å forenkle dokumentbehandlingsarbeidet.


Om forfatterne

Oversett dokumenter fra flere kildespråk til flere målspråk ved å bruke Amazon Translate PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Kishore Dhamodaran er Senior Solutions Architect hos AWS. Kishore hjelper strategiske kunder med deres skybedriftsstrategi og migrasjonsreise, og utnytter hans mangeårige industri- og skyerfaring.

Oversett dokumenter fra flere kildespråk til flere målspråk ved å bruke Amazon Translate PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Sid Padgaonkar er senior produktsjef for Amazon Translate, AWS sin naturlige språkbehandlingstjeneste. I helgene finner du ham spille squash og utforske matscenen i Stillehavet NW.

Tidstempel:

Mer fra AWS maskinlæring