Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。

AmazonTranslateで冒とく的な表現のマスキングを適用する

Amazon翻訳 は、高速、高品質、手頃な価格のカスタマイズ可能な言語翻訳を提供するニューラル機械翻訳サービスです。この投稿では、grawlix 文字列 (“?$#@$”) を使用して冒涜的な単語やフレーズをマスクする方法を示します。

Amazon Translate は通常、翻訳出力にクリーンな単語を選択します。ただし、状況によっては、一般的に冒涜的な用語とみなされている単語が翻訳された出力に表示されないようにしたい場合があります。たとえば、ビデオキャプションや字幕コンテンツを翻訳するとき、またはゲーム内チャットを有効にするときに、翻訳されたコンテンツを年齢に応じて冒涜的な表現を排除したい場合、Amazon Translate では、 冒とく的なマスキング 設定。冒涜的なマスキングを両方に適用できます リアルタイム翻訳 or 非同期バッチ処理 アマゾン翻訳で。冒涜的なマスクを有効にして Amazon Translate を使用する場合、文字数に関係なく、5 文字のシーケンス ?$#@$ を使用して各冒涜的な単語やフレーズがマスクされます。 Amazon Translate は、文脈に応じてではなく、それぞれの冒涜的な単語やフレーズを文字通りに検出します。

ソリューションの概要

翻訳出力内の冒涜的な単語やフレーズをマスクするには、リアルタイムおよび非同期のバッチ処理リクエストを通じて Amazon Translate で翻訳を実行するときに、Amazon Translate コンソールの追加設定で冒涜オプションを有効にします。次のセクションでは、Amazon Translate コンソールを介したリアルタイム翻訳リクエストに対する冒涜マスキングの使用方法を示します。 AWSコマンドラインインターフェイス (AWS CLI)、または Amazon 翻訳 SDK (Python Boto3)。

Amazon 翻訳コンソール

リアルタイム翻訳による冒涜的な表現の処理を示すために、英語に翻訳されるべき冒涜的とみなされる単語を含むフランス語の次のサンプル テキストを使用します。

Ne sois pas une xxxxx

Amazon Translate コンソールで次の手順を実行します。

  1. 選択する フランス語(fr) として ソース言語.
  2. 選択する 英語 (中) として Target Language.
  3. 前述の例のテキストを Source Language テキスト領域。

翻訳されたテキストは以下に表示されます 目標とする言語。英語では冒涜とみなされる単語が含まれています。
Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。

  1. 詳細 その他の設定 有効にする 冒涜.

この単語は grawlix 文字列 ?$#@$ に置き換えられます。
Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。

AWSCLI

を呼び出す translate-text AWS CLIコマンドと --settings Profanity=MASK 翻訳されたテキスト内の冒涜的な単語やフレーズをマスクします。

次の AWS CLI コマンドは、Unix、Linux、macOS 用に形式化されています。 Windows の場合は、バックスラッシュ () 各行の末尾にキャレット付きの Unix 継続文字 (^).

aws translate translate-text --text <<INPUT TEXT>> --source-language-code fr --target-language-code en --settings Profanity=MASK

次のスニペットのような応答が返されます。

{ "TranslatedText": "<output text with ?$#@$>", "SourceLanguageCode": "fr", "TargetLanguageCode": "en", "AppliedSettings": { "Profanity": "MASK" }
}

Amazon 翻訳 SDK (Python Boto3)

次の Python 3 コードは、冒涜設定を使用したリアルタイム翻訳呼び出しを使用します。

import boto3
import json translate = boto3.client('translate') SOURCE_TEXT = ("<Sample Input Text>") OUTPUT_LANG_CODE = 'en' result = translate.translate_text( Text=SOURCE_TEXT, SourceLanguageCode='auto', TargetLanguageCode=OUTPUT_LANG_CODE, Settings={'Profanity': 'MASK'}
) print("Translated Text:{}".format(result['TranslatedText']))

まとめ

冒涜的なマスキング設定を使用して、冒涜的な単語やフレーズをマスクし、翻訳されたテキストをクリーンな状態に保ち、ビジネス要件を満たすことができます。翻訳をカスタマイズするすべての方法の詳細については、以下を参照してください。 Amazon Translate を使用した翻訳のカスタマイズ.


著者について

Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。シヴァ・ラジャマニ ボストンを拠点とするAWSのエンタープライズソリューションアーキテクトです。 彼は顧客と緊密に協力し、顧客のデジタルトランスフォーメーションとAWS採用の旅をサポートすることを楽しんでいます。 彼の重点分野は、サーバーレス、アプリケーション統合、およびセキュリティです。 仕事以外では、野外活動やドキュメンタリー鑑賞を楽しんでいます。

Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。 スダンシュ・マルホトラ ボストンを拠点とする AWS のエンタープライズ ソリューション アーキテクトです。彼はテクノロジー愛好家であり、顧客が複雑なビジネス課題に対する革新的なソリューションを見つけられるよう支援することに喜びを感じています。彼の主な焦点分野は、DevOps、機械学習、セキュリティです。顧客のクラウドへの移行に対応していないときは、読書、ハイキング、新しい料理の探索を楽しんでいます。

Amazon Translate PlatoBlockchain Data Intelligence で冒涜的なマスキングを適用します。 垂直検索。 あい。ワトソン・G・スリヴァトサン は、AW​​S の自然言語処理サービスである Amazon Translate のシニアプロダクトマネージャーです。週末には、彼が太平洋岸北西部でアウトドアを探索している姿が見られます。

タイムスタンプ:

より多くの AWS機械学習