Amazon Translate PlatoBlockchain Data Intelligence를 사용하여 여러 소스 언어 문서를 여러 대상 언어로 번역합니다. 수직 검색. 일체 포함.

Amazon Translate를 사용하여 여러 소스 언어 문서를 여러 대상 언어로 번역

기업은 마케팅 자료, 사용 설명서, 제품 카탈로그와 같은 비즈니스 크리티컬 콘텐츠를 여러 언어로 번역하여 전 세계 고객, 파트너 및 이해 관계자와 소통해야 합니다. 번역 작업을 호출하기 전에 각 문서에서 소스 언어를 식별하면 복잡성이 발생하고 작업 흐름에 또 다른 단계가 추가됩니다. 예를 들어, 본사에 고객 지원 운영이 있는 국제적인 제품 회사는 에이전트가 고객 요청을 지원하기 위해 이메일이나 문서를 번역하도록 요구합니다. 이전에는 각 문서에서 주요 언어를 식별하고 언어 유형별로 그룹화하고 각 소스 언어에 대한 일괄 번역 작업을 설정하는 워크플로를 설정해야 했습니다. 지금, 아마존 번역일괄 번역 작업을 위한 의 자동 언어 감지 기능을 사용하면 한 번의 번역 작업으로 여러 언어로 된 일괄 문서를 번역할 수 있습니다. 이렇게 하면 주요 언어 식별 및 그룹화가 필요한 문서 번역 워크플로를 조정할 필요가 없습니다. Amazon Translate는 또한 번역을 위해 여러 대상 언어로 번역할 수 있습니다(최대 10개 언어). 단일 번역 작업으로 문서를 여러 대상 언어로 번역할 수 있습니다. 이 기능을 사용하면 개별 대상 언어에 대해 별도의 배치 작업을 생성할 필요가 없습니다. 이제 고객은 단일 API 호출로 여러 언어로 문서를 작성할 수 있습니다.

이 게시물에서는 일괄 번역 작업에서 문서를 여러 대상 언어로 번역하는 방법을 시연합니다.

솔루션 개요

일괄 번역 작업에 대한 소스 언어 자동 감지를 통해 지원되는 다양한 언어로 작성된 문서를 단일 작업으로 번역할 수 있습니다. 또한 최대 10개 언어를 대상으로 제공할 수 있습니다. 작업은 각 문서를 처리하고 지배적인 소스 언어를 식별하여 대상 언어로 번역합니다. Amazon Translate 사용 아마존 이해 각 소스 문서에서 지배적인 언어를 결정하고 이를 소스 언어로 사용합니다.

다음 섹션에서는 AWS 관리 콘솔 또는 AWS SDK.

콘솔을 통해 일괄 번역 작업 생성

이 예에서는 소스 언어를 자동으로 감지하고 입력 및 출력을 사용하여 영어 및 힌디어로 번역하도록 Amazon Translate 배치 번역을 구성합니다. 아마존 단순 스토리지 서비스 (Amazon S3) 버킷 위치가 제공되었습니다.

다음으로 우리는 AWS 자격 증명 및 액세스 관리 (IAM) 구성의 일부로 프로비저닝되는 역할. 역할에는 입력 및 출력 S3 버킷에 대한 액세스 권한이 부여됩니다.

작업이 생성된 후 일괄 번역 작업의 진행 상황을 다음에서 모니터링할 수 있습니다. 번역 작업 안내

번역 작업 섹션

번역 작업이 완료되면 출력 S3 버킷 위치로 이동하여 문서가 대상 언어로 번역되었는지 확인할 수 있습니다. 우리의 입력은 두 개의 파일로 구성되어 있습니다. sample-doc.txtsample-doc-2.txt, 두 가지 다른 언어로. 각 문서는 총 XNUMX개의 문서에 대해 두 개의 대상 언어로 번역되었습니다.

출력 S3 버킷

AWS SDK를 통해 일괄 번역 작업 생성

다음 Python Boto3 코드는 배치 번역 호출을 사용하여 소스 S3 버킷의 문서를 번역합니다. 다음 매개변수를 지정합니다.

  • 입력 데이터 구성 – 입력 문서의 S3 버킷 위치 제공
  • 출력 데이터 구성 – 출력 문서의 S3 버킷 위치 제공
  • 데이터액세스역할Arn – 입력 및 출력 S3 버킷에 액세스할 수 있는 Amazon Translate 권한을 부여하는 IAM 역할 생성
  • 소스 언어 코드: 사용 auto
  • TargetLanguageCodes: 최대 10개의 대상 언어 선택
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

정리

이 솔루션을 사용한 후 정리하려면 다음 단계를 완료하십시오.

  1. S3 버킷 삭제 당신이 만든.
  2. IAM 역할 삭제 당신이 설정한.
  3. 이 게시물에 대해 설정한 다른 모든 리소스를 삭제합니다.

결론

오늘날 제한된 리소스로 전 세계에 서비스를 제공해야 하는 상황에서 Amazon Translate는 다국어 처리 워크플로를 단순화하는 데 도움이 됩니다. 일괄 번역 작업을 위해 소스 문서에서 주요 언어를 자동으로 감지하고 최대 10개의 대상 언어로 번역하면 문서를 정렬하고 여러 일괄 번역을 관리하는 운영 부담을 처리하는 대신 비즈니스 논리에 집중할 수 있습니다. 직업.

우리는 고객이 더 쉽게 혁신할 수 있도록 서비스에 기능을 추가하기 위해 노력합니다. 이 솔루션을 사용해 보고 이것이 문서 처리 워크로드를 단순화하는 데 어떻게 도움이 되었는지 알려주십시오.


저자 소개

Amazon Translate PlatoBlockchain Data Intelligence를 사용하여 여러 소스 언어 문서를 여러 대상 언어로 번역합니다. 수직 검색. 일체 포함.키쇼어 다모다란 AWS의 수석 솔루션 아키텍트입니다. Kishore는 다년간의 업계 및 클라우드 경험을 활용하여 클라우드 엔터프라이즈 전략 및 마이그레이션 여정을 통해 전략적 고객을 지원합니다.

Amazon Translate PlatoBlockchain Data Intelligence를 사용하여 여러 소스 언어 문서를 여러 대상 언어로 번역합니다. 수직 검색. 일체 포함.시드 파드가온카르 AWS의 자연어 처리 서비스인 Amazon Translate의 선임 제품 관리자입니다. 주말에는 그가 스쿼시를 치고 태평양 NW에서 음식 현장을 탐험하는 것을 볼 수 있습니다.

타임 스탬프 :

더보기 AWS 기계 학습