Dịch nhiều tài liệu ngôn ngữ nguồn sang nhiều ngôn ngữ đích bằng cách sử dụng Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Dịch nhiều tài liệu ngôn ngữ nguồn sang nhiều ngôn ngữ đích bằng Amazon Translate

Các doanh nghiệp cần dịch nội dung quan trọng trong kinh doanh như tài liệu tiếp thị, hướng dẫn sử dụng và danh mục sản phẩm sang nhiều ngôn ngữ để giao tiếp với khán giả toàn cầu gồm khách hàng, đối tác và các bên liên quan. Việc xác định ngôn ngữ nguồn trong từng tài liệu trước khi gọi công việc dịch sẽ tạo ra sự phức tạp và thêm một bước nữa vào quy trình làm việc của bạn. Ví dụ: một công ty sản phẩm quốc tế có các hoạt động hỗ trợ khách hàng đặt tại văn phòng công ty của họ yêu cầu các đại lý của họ dịch email hoặc tài liệu để hỗ trợ các yêu cầu của khách hàng. Trước đây, họ phải thiết lập quy trình công việc để xác định ngôn ngữ chiếm ưu thế trong từng tài liệu, nhóm chúng theo loại ngôn ngữ và thiết lập công việc dịch hàng loạt cho từng ngôn ngữ nguồn. Hiện nay, Amazon DịchTính năng phát hiện ngôn ngữ tự động của công việc dịch hàng loạt cho phép bạn dịch một loạt tài liệu bằng nhiều ngôn ngữ khác nhau chỉ bằng một công việc dịch. Điều này loại bỏ nhu cầu bạn sắp xếp quy trình dịch tài liệu yêu cầu nhận dạng và nhóm ngôn ngữ chính. Amazon Translate cũng cho phép dịch sang nhiều ngôn ngữ mục tiêu để dịch (tối đa 10 ngôn ngữ). Một công việc dịch thuật duy nhất có thể dịch tài liệu sang nhiều ngôn ngữ mục tiêu. Tính năng này loại bỏ nhu cầu tạo các công việc hàng loạt riêng biệt cho các ngôn ngữ mục tiêu riêng lẻ. Giờ đây, khách hàng có thể tạo tài liệu bằng nhiều ngôn ngữ, tất cả chỉ bằng một lệnh gọi API.

Trong bài đăng này, chúng tôi trình bày cách dịch tài liệu sang nhiều ngôn ngữ mục tiêu trong một công việc dịch hàng loạt.

Tổng quan về giải pháp

Tự động phát hiện ngôn ngữ nguồn cho công việc dịch hàng loạt cho phép bạn dịch các tài liệu được viết bằng nhiều ngôn ngữ được hỗ trợ khác nhau chỉ trong một thao tác. Bạn cũng có thể cung cấp tối đa 10 ngôn ngữ làm mục tiêu. Công việc xử lý từng tài liệu, xác định ngôn ngữ nguồn chiếm ưu thế và dịch nó sang ngôn ngữ đích. Amazon Dịch sử dụng Amazon hiểu để xác định ngôn ngữ chính trong từng tài liệu nguồn của bạn và sử dụng ngôn ngữ đó làm ngôn ngữ nguồn.

Trong các phần sau, chúng tôi trình bày cách tạo một công việc dịch hàng loạt thông qua Bảng điều khiển quản lý AWS hoặc AWS SDK.

Tạo công việc dịch hàng loạt qua bảng điều khiển

Trong ví dụ này, chúng tôi định cấu hình bản dịch hàng loạt của Amazon Translate để tự động phát hiện ngôn ngữ nguồn và dịch ngôn ngữ đó sang tiếng Anh và tiếng Hindi, sử dụng đầu vào và đầu ra Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) đã cung cấp vị trí bộ chứa.

Tiếp theo, chúng ta tạo một Quản lý truy cập và nhận dạng AWS (IAM) vai trò được cung cấp như một phần của cấu hình. Vai trò được cấp quyền truy cập vào bộ chứa S3 đầu vào và đầu ra.

Sau khi công việc được tạo, bạn có thể theo dõi tiến độ của công việc dịch hàng loạt trong Công việc dịch thuật phần.

chuyên mục công việc dịch thuật

Khi công việc dịch hoàn tất, bạn có thể điều hướng đến vị trí bộ chứa S3 đầu ra và quan sát xem tài liệu đã được dịch sang ngôn ngữ đích của chúng chưa. Đầu vào của chúng tôi bao gồm hai tệp, sample-doc.txtsample-doc-2.txt, bằng hai ngôn ngữ khác nhau. Mỗi tài liệu được dịch sang hai ngôn ngữ mục tiêu, tổng cộng là bốn tài liệu.

đầu ra thùng S3

Tạo tác vụ dịch hàng loạt thông qua AWS SDK

Mã Python Boto3 sau đây sử dụng lệnh gọi dịch hàng loạt để dịch tài liệu trong bộ chứa S3 nguồn của bạn. Chỉ định các tham số sau:

  • Cấu hình dữ liệu đầu vào – Cung cấp vị trí bộ chứa S3 của tài liệu đầu vào của bạn
  • Cấu hình dữ liệu đầu ra – Cung cấp vị trí bộ chứa S3 của tài liệu đầu ra của bạn
  • Truy cập dữ liệuVai tròArn – Tạo vai trò IAM cho phép Amazon Translate truy cập vào bộ chứa S3 đầu vào và đầu ra của bạn
  • NguồnNgôn ngữMã: Sử dụng auto
  • Mã ngôn ngữ mục tiêu: Chọn tối đa 10 ngôn ngữ mục tiêu
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

Làm sạch

Để làm sạch sau khi sử dụng giải pháp này, hãy hoàn thành các bước sau:

  1. Xóa các nhóm S3 mà bạn đã tạo ra.
  2. Xóa vai trò IAM mà bạn thiết lập.
  3. Xóa mọi tài nguyên khác mà bạn đã thiết lập cho bài đăng này.

Kết luận

Với nhu cầu tiếp cận toàn cầu ngày nay với nguồn lực hạn chế, Amazon Translate giúp bạn đơn giản hóa quy trình xử lý đa ngôn ngữ của mình. Với việc giới thiệu tính năng tự động phát hiện ngôn ngữ chiếm ưu thế trong tài liệu nguồn của bạn cho các công việc dịch hàng loạt và dịch chúng sang tối đa 10 ngôn ngữ mục tiêu, bạn có thể tập trung vào logic kinh doanh của mình thay vì xử lý gánh nặng vận hành của việc phân loại tài liệu và quản lý nhiều bản dịch hàng loạt việc làm.

Chúng tôi cố gắng thêm các tính năng vào dịch vụ của mình để giúp khách hàng đổi mới dễ dàng hơn. Hãy thử giải pháp này và cho chúng tôi biết giải pháp này đã giúp đơn giản hóa khối lượng công việc xử lý tài liệu của bạn như thế nào.


Giới thiệu về tác giả

Dịch nhiều tài liệu ngôn ngữ nguồn sang nhiều ngôn ngữ đích bằng cách sử dụng Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Kishore Dhamodaran là Kiến trúc sư Giải pháp Cấp cao tại AWS. Kishore giúp khách hàng chiến lược với chiến lược doanh nghiệp đám mây và hành trình di chuyển của họ, tận dụng nhiều năm kinh nghiệm trong ngành và đám mây của anh ấy.

Dịch nhiều tài liệu ngôn ngữ nguồn sang nhiều ngôn ngữ đích bằng cách sử dụng Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Sid Padgaonkar là Giám đốc sản phẩm cấp cao của Amazon Translate, dịch vụ xử lý ngôn ngữ tự nhiên của AWS. Vào cuối tuần, bạn sẽ thấy anh ấy chơi bóng quần và khám phá bối cảnh ẩm thực ở Tây Bắc Thái Bình Dương.

Dấu thời gian:

Thêm từ Học máy AWS