Amazon Translate — это служба нейронного машинного перевода, которая обеспечивает быстрый, качественный, доступный и настраиваемый языковой перевод. В этом посте показано, как вы можете маскировать ненормативную лексику и фразы с помощью строки grawlix («?$#@$»).
Amazon Translate обычно выбирает чистые слова для перевода. Но в некоторых ситуациях вы хотите, чтобы слова, которые обычно считаются ненормативной лексикой, не появлялись в переведенном выводе. Например, когда вы переводите титры к видео или содержимое субтитров или включаете внутриигровой чат и хотите, чтобы переведенный контент соответствовал возрасту и не содержал ненормативной лексики, Amazon Translate позволяет маскировать ненормативные слова и фразы с помощью маскировка ненормативной лексики параметр. Вы можете применить маскировку ненормативной лексики к обоим перевод в реальном времени or асинхронная пакетная обработка в Amazon Translate. При использовании Amazon Translate с включенной маскировкой ненормативной лексики пятисимвольная последовательность ?$#@$ используется для маскировки каждого ненормативного слова или фразы независимо от количества символов. Amazon Translate определяет каждое непристойное слово или фразу буквально, а не контекстуально.
Обзор решения
Чтобы замаскировать ненормативную лексику в выходных данных перевода, можно включить параметр ненормативной лексики в дополнительных настройках консоли Amazon Translate при выполнении переводов с помощью Amazon Translate как в режиме реального времени, так и в асинхронной пакетной обработке запросов. В следующих разделах показано использование маскировки ненормативной лексики для запросов на перевод в режиме реального времени через консоль Amazon Translate. Интерфейс командной строки AWS (интерфейс командной строки AWS) или с помощью SDK для перевода Amazon (Питон Бото3).
Консоль Amazon Translate
Чтобы продемонстрировать обработку ненормативной лексики с помощью перевода в реальном времени, мы используем следующий образец текста на французском языке, который содержит слово, которое считается ненормативной лексикой для перевода на английский язык:
Выполните следующие шаги в консоли Amazon Translate:
- Выберите Французский (фр) как Язык источника.
- Выберите Английский (В) как Язык перевода.
- Введите текст предыдущего примера в поле Язык источника текстовая область.
Переведенный текст появится под Язык перевода. Он содержит слово, которое считается ненормативной лексикой в английском языке.
- Расширьте Дополнительные настройки и включить профанация.
Слово теперь заменено строкой grawlix ?$#@$.
Интерфейс командной строки AWS
Вызов translate-text
Команда AWS CLI с --settings Profanity=MASK
маскирует ненормативную лексику в переведенном тексте.
Следующие команды AWS CLI отформатированы для Unix, Linux и macOS. Для Windows замените обратную косую черту () Символ продолжения Unix в конце каждой строки с символом вставки (
^
).
Вы получите ответ, подобный следующему фрагменту:
Amazon Translate SDK (Python Boto3)
В следующем коде Python 3 используется вызов перевода в реальном времени с настройкой ненормативной лексики:
Заключение
Вы можете использовать параметр маскирования ненормативной лексики, чтобы маскировать слова и фразы, которые считаются ненормативной лексикой, чтобы ваш переведенный текст оставался чистым и соответствовал вашим бизнес-требованиям. Чтобы узнать больше обо всех способах настройки переводов, см. Настройка ваших переводов с помощью Amazon Translate.
Об авторах
Шива Раджамани является архитектором корпоративных решений в AWS из Бостона. Ему нравится тесно сотрудничать с клиентами и поддерживать их цифровую трансформацию и внедрение AWS. Его основные направления - бессерверные решения, интеграция приложений и безопасность. Вне работы он любит активный отдых и смотрит документальные фильмы.
Судханшу Малхотра является архитектором корпоративных решений для AWS из Бостона. Он энтузиаст технологий, которому нравится помогать клиентам находить инновационные решения сложных бизнес-задач. Его основными областями деятельности являются DevOps, машинное обучение и безопасность. Когда он не работает с клиентами на пути к облаку, ему нравится читать, ходить в походы и исследовать новые кухни.
Уотсон Дж. Шриватсан является старшим менеджером по продукту Amazon Translate, сервиса обработки естественного языка AWS. По выходным он исследует природу на северо-западе Тихого океана.
- "
- 100
- О нас
- активно
- дополнительный
- Принятие
- Все
- Amazon
- Применение
- ПЛОЩАДЬ
- автоматический
- AWS
- граница
- бизнес
- призывают
- Подписи
- проблемы
- облако
- код
- комплекс
- Консоли
- содержит
- содержание
- Основные
- Клиенты
- Интернет
- цифровое преобразование
- документальные фильмы
- позволяет
- Английский
- Предприятие
- пример
- БЫСТРО
- Фокус
- после
- Французский
- Управляемость
- Как
- HTTPS
- инновационный
- интеграции.
- IT
- язык
- УЧИТЬСЯ
- изучение
- линия
- Linux
- машина
- обучение с помощью машины
- MacOS
- менеджер
- маска
- Маски
- Опция
- на открытом воздухе
- Тихий океан
- фразы
- Продукт
- Reading
- реального времени
- заменить
- Требования
- ответ
- Run
- SDK
- безопасность
- Serverless
- обслуживание
- установка
- Решения
- Технологии
- Через
- трансформация
- Переводы
- использование
- Видео
- КТО
- окна
- слова
- Работа
- работает