亚马逊翻译 是一种神经机器翻译服务,可提供快速、高质量、价格合理且可定制的语言翻译。 这篇文章展示了如何使用 grawlix 字符串 (“?$#@$”) 掩盖亵渎的单词和短语。
Amazon Translate 通常会为您的翻译输出选择干净的单词。 但在某些情况下,您希望防止通常被视为亵渎术语的单词出现在翻译的输出中。 例如,当您翻译视频字幕或字幕内容,或启用游戏内聊天时,并且您希望翻译的内容适合年龄且没有任何亵渎性内容时,Amazon Translate 允许您使用 亵渎掩饰 环境。 您可以对两者都应用亵渎屏蔽 实时翻译 or 异步批处理 在亚马逊翻译中。 使用启用了亵渎屏蔽的 Amazon Translate 时,无论字符数如何,都会使用五个字符序列 ?$#@$ 来屏蔽每个亵渎词或短语。 Amazon Translate 从字面上检测每个亵渎的词或短语,而不是根据上下文检测。
解决方案概述
要屏蔽翻译输出中的亵渎词和短语,当您通过实时和异步批处理请求使用 Amazon Translate 运行翻译时,您可以在 Amazon Translate 控制台的其他设置下启用亵渎性选项。 以下部分演示了通过 Amazon Translate 控制台对实时翻译请求使用亵渎屏蔽, AWS命令行界面 (AWS CLI),或使用 亚马逊翻译软件开发工具包 (Python Boto3)。
亚马逊翻译控制台
为了演示通过实时翻译处理亵渎行为,我们使用以下法语示例文本,其中包含一个被认为是亵渎的词,要翻译成英语:
在 Amazon Translate 控制台上完成以下步骤:
- 法语 (fr) 作为 源语言.
- 英语 (In)的 作为 目标语言.
- 在 源语言 文字区域。
翻译后的文本出现在 目标语言. 它包含一个在英语中被认为是亵渎的词。
- 扩大 其他设置 并启用 亵渎.
命令行界面
呼叫 translate-text
AWS CLI 命令 --settings Profanity=MASK
掩盖翻译文本中的亵渎词和短语。
以下 AWS CLI 命令针对 Unix、Linux 和 macOS 进行了格式化。 对于 Windows,请替换反斜杠 () 每行末尾的 Unix 连续字符,带有插入符号 (
^
).
您会收到类似以下代码段的响应:
Amazon Translate 开发工具包 (Python Boto3)
以下 Python 3 代码使用带有亵渎设置的实时翻译调用:
结论
您可以使用亵渎屏蔽设置来屏蔽被视为亵渎的单词和短语,以保持翻译文本的简洁并满足您的业务需求。 要了解有关自定义翻译的所有方式的更多信息,请参阅 使用 Amazon Translate 自定义您的翻译.
作者简介
西瓦·拉贾曼尼(Siva Rajamani) 是AWS的波士顿企业解决方案架构师。 他喜欢与客户紧密合作,并支持他们的数字化转型和AWS采纳之旅。 他关注的核心领域是无服务器,应用程序集成和安全性。 在工作之余,他喜欢户外活动和观看纪录片。
苏丹舒·马尔霍特拉 是 AWS 的波士顿企业解决方案架构师。 他是一位技术爱好者,乐于帮助客户找到应对复杂业务挑战的创新解决方案。 他关注的核心领域是 DevOps、机器学习和安全。 当他不与客户一起进行云之旅时,他喜欢阅读、远足和探索新美食。
沃森·斯里瓦桑 是AWS的自然语言处理服务Amazon Translate的高级产品经理。 在周末,您会发现他探索太平洋西北地区的户外活动。