Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Застосуйте маскування нецензурної лексики в Amazon Translate

Amazon Translate – це служба нейронного машинного перекладу, яка забезпечує швидкий, високоякісний, доступний і настроюваний мовний переклад. У цій публікації показано, як можна маскувати нецензурні слова та фрази за допомогою рядка grawlix (“?$#@$”).

Amazon Translate зазвичай вибирає чисті слова для вашого перекладу. Але в деяких ситуаціях потрібно запобігти появі слів, які зазвичай вважаються нецензурними, у вихідних результатах перекладу. Наприклад, коли ви перекладаєте субтитри до відео чи вміст субтитрів або вмикаєте чат у грі, і ви хочете, щоб перекладений вміст відповідав віку та не мав ненормативної лексики, Amazon Translate дозволяє маскувати нецензурні слова та фрази за допомогою маскування нецензурної лексики налаштування. Ви можете застосувати маскування ненормативної лексики до обох переклад в режимі реального часу or асинхронна пакетна обробка в Amazon Translate. Під час використання Amazon Translate із увімкненим маскуванням ненормативної лексики послідовність із п’яти символів ?$#@$ використовується для маскування кожного нецензурного слова чи фрази, незалежно від кількості символів. Amazon Translate виявляє кожне нецензурне слово чи фразу буквально, а не контекстно.

Огляд рішення

Щоб замаскувати нецензурні слова та фрази у виведених результатах перекладу, ви можете ввімкнути опцію ненормативної лексики в додаткових налаштуваннях на консолі Amazon Translate, коли ви запускаєте переклади за допомогою Amazon Translate як через запити в реальному часі, так і через асинхронну пакетну обробку. У наступних розділах демонструється використання маскування ненормативної лексики для запитів на переклад у реальному часі через консоль Amazon Translate, Інтерфейс командного рядка AWS (AWS CLI), або з Amazon Translate SDK (Python Boto3).

Консоль Amazon Translate

Щоб продемонструвати роботу з нецензурною лексикою за допомогою перекладу в режимі реального часу, ми використовуємо наведений нижче зразок тексту французькою мовою, який містить слово, яке вважається ненормативним для перекладу англійською мовою:

Ne sois pas une xxxxx

Виконайте наступні дії на консолі Amazon Translate:

  1. Вибирати французька (fr) в якості Мова оригіналу.
  2. Вибирати англійська (В) в якості Мова перекладу.
  3. Введіть попередній приклад тексту в Мова джерела область тексту.

Перекладений текст відображається під Мова перекладу. Він містить слово, яке в англійській мові вважається нецензурним.
Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

  1. Розширювати Додаткові налаштування і включити Богохульство.

Слово тепер замінено на рядок grawlix ?$#@$.
Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

CLI AWS

Виклик translate-text Команда AWS CLI з --settings Profanity=MASK маскує нецензурні слова та фрази у вашому перекладеному тексті.

Наступні команди AWS CLI відформатовано для Unix, Linux і macOS. Для Windows замініть зворотну косу риску () Символ продовження Unix у кінці кожного рядка з кареткою (^).

aws translate translate-text --text <<INPUT TEXT>> --source-language-code fr --target-language-code en --settings Profanity=MASK

Ви отримуєте відповідь, подібну до наступного фрагмента:

{ "TranslatedText": "<output text with ?$#@$>", "SourceLanguageCode": "fr", "TargetLanguageCode": "en", "AppliedSettings": { "Profanity": "MASK" }
}

Amazon Translate SDK (Python Boto3)

У наступному коді Python 3 використовується виклик перекладу в реальному часі з налаштуванням ненормативної лексики:

import boto3
import json translate = boto3.client('translate') SOURCE_TEXT = ("<Sample Input Text>") OUTPUT_LANG_CODE = 'en' result = translate.translate_text( Text=SOURCE_TEXT, SourceLanguageCode='auto', TargetLanguageCode=OUTPUT_LANG_CODE, Settings={'Profanity': 'MASK'}
) print("Translated Text:{}".format(result['TranslatedText']))

Висновок

Ви можете використовувати налаштування маскування ненормативної лексики, щоб маскувати слова та фрази, які вважаються ненормативними, щоб ваш перекладений текст був чистим і відповідав вимогам вашого бізнесу. Щоб дізнатися більше про всі способи налаштування перекладів, див Налаштування ваших перекладів за допомогою Amazon Translate.


Про авторів

Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Шіва Раджамані є архітектором корпоративних рішень у Бостоні в AWS. Йому подобається тісно співпрацювати з клієнтами та підтримувати їхню цифрову трансформацію та впровадження AWS. Його основні сфери уваги — це безсерверність, інтеграція додатків та безпека. Поза роботою він любить активний відпочинок і дивитися документальні фільми.

Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai. Судханшу Малхотра є бостонським архітектором корпоративних рішень для AWS. Він ентузіаст технологій, який із задоволенням допомагає клієнтам знаходити інноваційні рішення складних бізнес-завдань. Основні сфери його діяльності — DevOps, машинне навчання та безпека. Коли він не працює з клієнтами на шляху до хмари, він із задоволенням читає, ходить у походи та вивчає нові кухні.

Застосуйте маскування ненормативної лексики в Amazon Translate PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Ватсон Г. Шриватсан є старшим менеджером із продуктів Amazon Translate, служби обробки природної мови AWS. У вихідні дні ви знайдете його, досліджуючи природу на північному заході Тихого океану.

Часова мітка:

Більше від AWS Машинне навчання