Переведите документы с нескольких исходных языков на несколько целевых языков с помощью Amazon Translate PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Перевод документов с нескольких исходных языков на несколько целевых языков с помощью Amazon Translate

Предприятиям необходимо переводить критически важный для бизнеса контент, такой как маркетинговые материалы, руководства по эксплуатации и каталоги продуктов, на несколько языков, чтобы общаться с глобальной аудиторией клиентов, партнеров и заинтересованных сторон. Определение исходного языка в каждом документе перед вызовом задания на перевод создает сложности и добавляет еще один шаг в ваш рабочий процесс. Например, международная производственная компания, где операции по поддержке клиентов расположены в их корпоративном офисе, требует от своих агентов перевода электронных писем или документов для поддержки запросов клиентов. Раньше им приходилось настраивать рабочие процессы для определения доминирующего языка в каждом документе, группировать их по типу языка и настраивать задание пакетного перевода для каждого исходного языка. В настоящее время, Amazon TranslateФункция автоматического определения языка для пакетных заданий на перевод позволяет вам переводить пакет документов на разные языки с помощью одного задания на перевод. Это избавляет вас от необходимости организовывать рабочий процесс перевода документов, требующий идентификации и группировки доминирующего языка. Amazon Translate также позволяет выполнять перевод на несколько целевых языков для перевода (до 10 языков). Одно задание на перевод может переводить документы на несколько целевых языков. Эта функция избавляет от необходимости создавать отдельные пакетные задания для отдельных целевых языков. Теперь клиенты могут создавать документацию на нескольких языках с помощью одного вызова API.

В этом посте мы покажем, как переводить документы на несколько целевых языков в задании на пакетный перевод.

Обзор решения

Автоматическое определение исходного языка для заданий пакетного перевода позволяет переводить документы, написанные на различных поддерживаемых языках, за одну операцию. Вы также можете указать до 10 языков в качестве целей. Задание обрабатывает каждый документ, определяет доминирующий исходный язык и переводит его на целевой язык. Amazon Translate использует Amazon Comprehend чтобы определить доминирующий язык в каждом из ваших исходных документов и использовать его в качестве исходного языка.

В следующих разделах мы покажем, как создать задание на пакетный перевод с помощью Консоль управления AWS или SDK AWS.

Создайте задание на пакетный перевод через консоль

В этом примере мы настраиваем пакетный перевод Amazon Translate для автоматического определения исходного языка и перевода его на английский и хинди, используя ввод и вывод. Простой сервис хранения Amazon (Amazon S3) указаны местоположения корзин.

Далее мы создаем Управление идентификацией и доступом AWS (IAM), которая предоставляется как часть конфигурации. Роли предоставляется доступ к входным и выходным корзинам S3.

После создания задания вы можете следить за ходом выполнения задания пакетного перевода в Работа переводчика .

раздел вакансий переводчика

Когда задание на перевод будет завершено, вы можете перейти к расположению выходной корзины S3 и убедиться, что документы были переведены на целевой язык. Наш ввод состоял из двух файлов, sample-doc.txt и sample-doc-2.txt, на двух разных языках. Каждый документ был переведен на два целевых языка, всего четыре документа.

выходной ковш S3

Создание задания пакетного перевода с помощью AWS SDK

Следующий код Python Boto3 использует вызов пакетного перевода для перевода документов в исходной корзине S3. Укажите следующие параметры:

  • Инпутданныеконфиг - Укажите местоположение корзины S3 для ваших входных документов.
  • Конфигурация выходных данных - Укажите местоположение корзины S3 для ваших выходных документов.
  • DataAccessRoleArn – Создайте роль IAM, которая дает Amazon Translate разрешение на доступ к вашим корзинам ввода и вывода S3.
  • ИсходныйЯзыкКод: Использовать auto
  • Коды целевых языков: выберите до 10 целевых языков.
import boto3

client = boto3.client('translate')


def lambda_handler(event, context):

    response = client.start_text_translation_job(
        JobName='auto-translate-multi-language-sdk',
        InputDataConfig={
            'S3Uri': 's3://<>/input-sdk',
            'ContentType': 'text/plain'
        },
        OutputDataConfig={
            'S3Uri': 's3://<>/output-sdk',
        },
        DataAccessRoleArn='<>',
        SourceLanguageCode='auto',
        TargetLanguageCodes=[
            'en', 'hi'
        ]
    )

Убирать

Для очистки после использования этого решения выполните следующие действия:

  1. Удалить корзины S3 что вы создали.
  2. Удалить роли IAM что вы настроили.
  3. Удалите любые другие ресурсы, которые вы настроили для этого поста.

Заключение

Учитывая сегодняшнюю потребность в глобальном охвате при ограниченных ресурсах, Amazon Translate поможет вам упростить рабочие процессы многоязычной обработки. С введением автоматического определения доминирующего языка в исходном документе для заданий пакетного перевода и их перевода на 10 целевых языков вы можете сосредоточиться на своей бизнес-логике, а не заниматься операционным бременем сортировки документов и управления несколькими пакетными переводами. рабочие места.

Мы стремимся добавлять в наш сервис функции, которые облегчают нашим клиентам внедрение инноваций. Попробуйте это решение и сообщите нам, как оно помогло упростить ваши рабочие нагрузки по обработке документов.


Об авторах

Переведите документы с нескольких исходных языков на несколько целевых языков с помощью Amazon Translate PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Кишор Дхамодаран является старшим архитектором решений в AWS. Кишор помогает стратегическим клиентам с их стратегией облачного предприятия и миграцией, используя свой многолетний опыт работы в отрасли и облачных вычислений.

Переведите документы с нескольких исходных языков на несколько целевых языков с помощью Amazon Translate PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.Сид Падгаонкар — старший менеджер по продукту Amazon Translate, службы обработки естественного языка AWS. По выходным вы найдете его играющим в сквош и исследующим гастрономическую сцену Тихоокеанского Северо-Запада.

Отметка времени:

Больше от Машинное обучение AWS

Запускайте несколько генеративных моделей ИИ на графическом процессоре, используя многомодельные конечные точки Amazon SageMaker с TorchServe, и сэкономьте до 75 % на затратах на логические выводы | Веб-сервисы Amazon

Исходный узел: 1887176
Отметка времени: сентябрь 6, 2023