Amazon Translate PlatoBlockchain Data Intelligence を使用して、複数のソース言語ドキュメントを複数のターゲット言語に翻訳します。垂直検索。あい。

Amazon Translate を使用して複数のソース言語ドキュメントを複数のターゲット言語に翻訳する

企業は、マーケティング資料、取扱説明書、製品カタログなどのビジネスに不可欠なコンテンツを複数の言語に翻訳して、世界中の顧客、パートナー、利害関係者とコミュニケーションをとる必要があります。 翻訳ジョブを呼び出す前に各ドキュメントのソース言語を特定すると、複雑さが増し、ワークフローに別のステップが追加されます。 たとえば、顧客サポート業務が本社オフィスにある国際的な製品会社では、顧客の要求をサポートするために、エージェントが電子メールまたはドキュメントを翻訳する必要があります。 以前は、ワークフローを設定して各ドキュメントの主要な言語を識別し、言語タイプごとにグループ化し、ソース言語ごとにバッチ翻訳ジョブを設定する必要がありました。 今、 Amazon翻訳のバッチ翻訳ジョブ用の自動言語検出機能を使用すると、10 回の翻訳ジョブでさまざまな言語のドキュメントのバッチを翻訳できます。 これにより、主要言語の識別とグループ化を必要とするドキュメント翻訳ワークフローを調整する必要がなくなります。 Amazon Translate では、翻訳対象の複数のターゲット言語 (最大 XNUMX 言語) への翻訳も可能です。 XNUMX つの翻訳ジョブで、ドキュメントを複数のターゲット言語に翻訳できます。 この機能により、ターゲット言語ごとに個別のバッチ ジョブを作成する必要がなくなります。 お客様は、単一の API 呼び出しで、複数の言語でドキュメントを作成できるようになりました。

この投稿では、バッチ翻訳ジョブでドキュメントを複数のターゲット言語に翻訳する方法を示します。

ソリューションの概要

バッチ翻訳ジョブのソース言語の自動検出により、サポートされているさまざまな言語で書かれたドキュメントを 10 回の操作で翻訳できます。 ターゲットとして最大 XNUMX の言語を指定することもできます。 ジョブは各ドキュメントを処理し、主要なソース言語を識別して、それをターゲット言語に翻訳します。 Amazon Translate の使用 Amazon Comprehend を使用して、各ソース ドキュメントの主要言語を決定し、それをソース言語として使用します。

以下のセクションでは、 AWSマネジメントコンソール またはAWS SDK。

コンソールから一括翻訳ジョブを作成する

この例では、ソース言語を自動的に検出し、入力と出力を使用して英語とヒンディー語に翻訳するように Amazon Translate バッチ翻訳を設定します。 Amazon シンプル ストレージ サービス (Amazon S3) バケットの場所が提供されます。

次に、 AWS IDおよびアクセス管理 構成の一部としてプロビジョニングされる (IAM) ロール。 このロールには、入力および出力 S3 バケットへのアクセスが付与されます。

ジョブが作成されたら、バッチ翻訳ジョブの進行状況を監視できます。 翻訳の仕事 のセクションから無料でダウンロードできます。

翻訳ジョブセクション

翻訳ジョブが完了したら、出力 S3 バケットの場所に移動し、ドキュメントがターゲット言語に翻訳されたことを確認できます。 入力は XNUMX つのファイルで構成され、 sample-doc.txt および sample-doc-2.txt、XNUMX つの異なる言語で。 各文書は XNUMX つのターゲット言語に翻訳され、合計 XNUMX つの文書が作成されました。

出力 S3 バケット

AWS SDK を使用してバッチ翻訳ジョブを作成する

次の Python Boto3 コードは、バッチ翻訳呼び出しを使用して、ソース S3 バケット内のドキュメントを翻訳します。 次のパラメータを指定します。

  • 入力データ構成 – 入力ドキュメントの S3 バケットの場所を提供します
  • 出力データ構成 – 出力ドキュメントの S3 バケットの場所を提供します
  • データアクセスロールArn – 入力および出力 S3 バケットにアクセスするためのアクセス許可を Amazon Translate に付与する IAM ロールを作成します。
  • ソース言語コード: つかいます auto
  • ターゲット言語コード: 最大 10 のターゲット言語を選択
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

クリーンアップ

このソリューションを使用した後にクリーンアップするには、次の手順を実行します。

  1. S3バケットを削除します あなたが作成したもの。
  2. IAM ロールを削除する あなたが設定したこと。
  3. この投稿用に設定したその他のリソースをすべて削除します。

まとめ

限られたリソースでグローバルにリーチする必要がある今日、Amazon Translate は多言語処理ワークフローを簡素化するのに役立ちます。 バッチ翻訳ジョブの原文ドキュメントの主要言語を自動的に検出し、最大 10 のターゲット言語に翻訳する機能の導入により、ドキュメントの並べ替えや複数のバッチ翻訳の管理という運用上の負担に対処するのではなく、ビジネス ロジックに集中できます。仕事。

私たちは、お客様がイノベーションを容易に行えるように、サービスに機能を追加するよう努めています。 このソリューションを試して、これがドキュメント処理のワークロードを簡素化するのにどのように役立ったかをお知らせください。


著者について

Amazon Translate PlatoBlockchain Data Intelligence を使用して、複数のソース言語ドキュメントを複数のターゲット言語に翻訳します。垂直検索。あい。キショアダモダラン AWSのシニアソリューションアーキテクトです。 Kishoreは、長年の業界とクラウドの経験を活用して、戦略的な顧客のクラウドエンタープライズ戦略と移行の過程を支援します。

Amazon Translate PlatoBlockchain Data Intelligence を使用して、複数のソース言語ドキュメントを複数のターゲット言語に翻訳します。垂直検索。あい。シド・パドガオンカー AWS の自然言語処理サービスである Amazon Translate のシニア プロダクト マネージャーです。 週末には、彼がスカッシュをしたり、パシフィック ノースウェストのフード シーンを探索したりしています。

タイムスタンプ:

より多くの AWS機械学習