Terjemahkan beberapa dokumen bahasa sumber ke beberapa bahasa target menggunakan Amazon Translate PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Terjemahkan beberapa dokumen bahasa sumber ke beberapa bahasa target menggunakan Amazon Translate

Perusahaan perlu menerjemahkan konten penting bisnis seperti materi pemasaran, buku petunjuk, dan katalog produk dalam berbagai bahasa untuk berkomunikasi dengan khalayak global pelanggan, mitra, dan pemangku kepentingan. Mengidentifikasi bahasa sumber di setiap dokumen sebelum memanggil pekerjaan terjemahan menciptakan kerumitan dan menambahkan langkah lain ke alur kerja Anda. Misalnya, perusahaan produk internasional dengan operasi dukungan pelanggannya yang berlokasi di kantor perusahaannya mengharuskan agen mereka untuk menerjemahkan email atau dokumen untuk mendukung permintaan pelanggan. Sebelumnya, mereka harus menyiapkan alur kerja untuk mengidentifikasi bahasa dominan di setiap dokumen, mengelompokkannya berdasarkan jenis bahasa, dan menyiapkan tugas terjemahan batch untuk setiap bahasa sumber. Sekarang, Amazon TerjemahanFitur deteksi bahasa otomatis untuk pekerjaan terjemahan batch memungkinkan Anda menerjemahkan sekumpulan dokumen dalam berbagai bahasa dengan satu pekerjaan terjemahan. Ini menghilangkan kebutuhan Anda untuk mengatur alur kerja terjemahan dokumen yang memerlukan identifikasi dan pengelompokan bahasa dominan. Amazon Translate juga memungkinkan terjemahan ke beberapa bahasa target untuk terjemahan (hingga 10 bahasa). Pekerjaan terjemahan tunggal dapat menerjemahkan dokumen ke beberapa bahasa target. Fitur ini meniadakan kebutuhan untuk membuat tugas batch terpisah untuk masing-masing bahasa target. Pelanggan kini dapat membuat dokumentasi dalam berbagai bahasa, semuanya dengan satu panggilan API.

Dalam postingan ini, kami mendemonstrasikan cara menerjemahkan dokumen ke beberapa bahasa target dalam pekerjaan terjemahan batch.

Ikhtisar solusi

Deteksi otomatis bahasa sumber untuk pekerjaan terjemahan batch memungkinkan Anda menerjemahkan dokumen yang ditulis dalam berbagai bahasa yang didukung dalam satu operasi. Anda juga dapat menyediakan hingga 10 bahasa sebagai target. Pekerjaan memproses setiap dokumen, mengidentifikasi bahasa sumber yang dominan, dan menerjemahkannya ke bahasa target. Penggunaan Amazon Translate Amazon Comprehend untuk menentukan bahasa dominan di setiap dokumen sumber Anda, dan menggunakannya sebagai bahasa sumber.

Di bagian berikut, kami mendemonstrasikan cara membuat tugas terjemahan batch melalui Konsol Manajemen AWS atau AWS SDK.

Buat tugas terjemahan batch melalui konsol

Dalam contoh ini, kami mengonfigurasi terjemahan batch Amazon Translate untuk secara otomatis mendeteksi bahasa sumber dan menerjemahkannya ke bahasa Inggris dan Hindi, menggunakan input dan output Layanan Penyimpanan Sederhana Amazon (Amazon S3) lokasi bucket disediakan.

Selanjutnya, kita membuat sebuah Identitas AWS dan Manajemen Akses (IAM) yang disediakan sebagai bagian dari konfigurasi. Peran diberikan akses ke bucket S3 input dan output.

Setelah pekerjaan dibuat, Anda dapat memantau kemajuan pekerjaan terjemahan batch di Pekerjaan penerjemahan bagian.

bagian pekerjaan penerjemahan

Saat pekerjaan terjemahan selesai, Anda dapat menavigasi ke lokasi bucket keluaran S3 dan mengamati bahwa dokumen telah diterjemahkan ke bahasa targetnya. Masukan kami terdiri dari dua file, sample-doc.txt dan sample-doc-2.txt, dalam dua bahasa yang berbeda. Setiap dokumen diterjemahkan ke dalam dua bahasa target, dengan total empat dokumen.

ember keluaran S3

Buat tugas terjemahan batch melalui AWS SDK

Kode Python Boto3 berikut menggunakan panggilan terjemahan batch untuk menerjemahkan dokumen di bucket sumber S3 Anda. Tentukan parameter berikut:

  • Konfigurasi Data Masukan โ€“ Berikan lokasi bucket S3 untuk dokumen masukan Anda
  • OutputDataConfig โ€“ Berikan lokasi bucket S3 dari dokumen keluaran Anda
  • DataAccessRoleArn โ€“ Buat peran IAM yang memberi Amazon Translate izin untuk mengakses bucket S3 input dan output Anda
  • Kode Bahasa Sumber: Gunakan auto
  • Kode Bahasa Target: Pilih hingga 10 bahasa target
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

Membersihkan

Untuk membersihkan setelah menggunakan solusi ini, selesaikan langkah-langkah berikut:

  1. Hapus ember S3 yang Anda buat.
  2. Hapus peran IAM yang Anda atur.
  3. Hapus sumber daya lain yang Anda siapkan untuk pos ini.

Kesimpulan

Dengan kebutuhan saat ini untuk memiliki jangkauan global dengan sumber daya terbatas, Amazon Translate membantu Anda menyederhanakan alur kerja pemrosesan multibahasa Anda. Dengan pengenalan otomatis mendeteksi bahasa dominan dalam dokumen sumber Anda untuk pekerjaan terjemahan batch, dan menerjemahkannya hingga 10 bahasa target, Anda dapat fokus pada logika bisnis Anda daripada berurusan dengan beban operasional menyortir dokumen dan mengelola beberapa terjemahan batch pekerjaan.

Kami berusaha untuk menambahkan fitur ke layanan kami yang memudahkan pelanggan kami berinovasi. Coba solusi ini dan beri tahu kami bagaimana ini membantu menyederhanakan beban kerja pemrosesan dokumen Anda.


Tentang penulis

Terjemahkan beberapa dokumen bahasa sumber ke beberapa bahasa target menggunakan Amazon Translate PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Kishore Dhamodaran adalah Arsitek Solusi Senior di AWS. Kishore membantu pelanggan strategis dengan strategi perusahaan cloud dan perjalanan migrasi mereka, memanfaatkan pengalaman industri dan cloud selama bertahun-tahun.

Terjemahkan beberapa dokumen bahasa sumber ke beberapa bahasa target menggunakan Amazon Translate PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Sid Padgaonkar adalah Sr. Product Manager untuk Amazon Translate, layanan pemrosesan bahasa alami AWS. Pada akhir pekan Anda akan menemukan dia bermain squash dan menjelajahi dunia kuliner di Pacific NW.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS