Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Áp dụng mặt nạ ngôn từ tục tĩu trong Amazon Dịch

Amazon Dịch là một dịch vụ dịch máy thần kinh cung cấp bản dịch ngôn ngữ nhanh chóng, chất lượng cao, giá cả phải chăng và có thể tùy chỉnh. Bài đăng này chỉ ra cách bạn có thể che dấu các từ và cụm từ tục tĩu bằng một chuỗi grawlix (“? $ # @ $”).

Amazon Dịch thường chọn các từ sạch cho đầu ra bản dịch của bạn. Nhưng trong một số tình huống, bạn muốn ngăn các từ thường được coi là thuật ngữ tục tĩu xuất hiện trong bản dịch đầu ra. Ví dụ: khi bạn đang dịch phụ đề video hoặc nội dung phụ đề hoặc bật trò chuyện trong trò chơi và bạn muốn nội dung đã dịch phù hợp với lứa tuổi và không có bất kỳ ngôn từ tục tĩu nào, Amazon Dịch cho phép bạn che những từ và cụm từ tục tĩu bằng cách sử dụng mặt nạ thô tục cài đặt. Bạn có thể áp dụng mặt nạ tục tĩu cho cả hai dịch thời gian thực or xử lý hàng loạt không đồng bộ trong Amazon Dịch. Khi sử dụng Amazon Dịch có bật tính năng che dấu ngôn từ tục tĩu, chuỗi năm ký tự? $ # @ $ Được sử dụng để che dấu từng từ hoặc cụm từ tục tĩu, bất kể số lượng ký tự. Amazon Dịch phát hiện từng từ hoặc cụm từ tục tĩu theo nghĩa đen, không theo ngữ cảnh.

Tổng quan về giải pháp

Để che dấu các từ và cụm từ tục tĩu trong bản dịch xuất ra, bạn có thể bật tùy chọn tục tĩu trong cài đặt bổ sung trên bảng điều khiển Amazon Dịch khi bạn chạy bản dịch với Amazon Dịch cả thông qua các yêu cầu xử lý hàng loạt theo thời gian thực và không đồng bộ. Các phần sau đây chứng minh việc sử dụng mặt nạ ngôn từ tục tĩu cho các yêu cầu dịch trong thời gian thực qua bảng điều khiển Amazon Translate, Giao diện dòng lệnh AWS (AWS CLI), hoặc với SDK dịch của Amazon (Trăn Boto3).

Bảng điều khiển Amazon Dịch

Để chứng minh việc xử lý ngôn từ tục tĩu với bản dịch thời gian thực, chúng tôi sử dụng văn bản mẫu sau bằng tiếng Pháp có chứa một từ được coi là tục tĩu được dịch sang tiếng Anh:

Ne sois pas une xxxxx

Hoàn thành các bước sau trên bảng điều khiển Amazon Dịch:

  1. Chọn Tiếng Pháp (fr) như Ngôn ngữ nguồn.
  2. Chọn Tiếng Anh (Trong) như Ngôn ngữ mục tiêu.
  3. Nhập văn bản ví dụ trước vào Ngôn ngữ nguồn khu vực văn bản.

Văn bản đã dịch xuất hiện bên dưới Ngôn ngữ mục tiêu. Nó chứa một từ được coi là tục tĩu trong tiếng Anh.
Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

  1. Mở rộng Cài đặt thêm và cho phép Lời tục tĩu.

Từ bây giờ được thay thế bằng chuỗi grawlix? $ # @ $.
Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

AWSCLI

Gọi translate-text Lệnh AWS CLI với --settings Profanity=MASK che các từ và cụm từ tục tĩu trong văn bản đã dịch của bạn.

Các lệnh AWS CLI sau được định dạng cho Unix, Linux và macOS. Đối với Windows, hãy thay thế dấu gạch chéo ngược () Ký tự tiếp tục Unix ở cuối mỗi dòng với dấu mũ (^).

aws translate translate-text --text <<INPUT TEXT>> --source-language-code fr --target-language-code en --settings Profanity=MASK

Bạn nhận được phản hồi như đoạn mã sau:

{ "TranslatedText": "<output text with ?$#@$>", "SourceLanguageCode": "fr", "TargetLanguageCode": "en", "AppliedSettings": { "Profanity": "MASK" }
}

SDK dịch của Amazon (Python Boto3)

Mã Python 3 sau sử dụng lệnh gọi dịch thời gian thực với cài đặt ngôn từ tục tĩu:

import boto3
import json translate = boto3.client('translate') SOURCE_TEXT = ("<Sample Input Text>") OUTPUT_LANG_CODE = 'en' result = translate.translate_text( Text=SOURCE_TEXT, SourceLanguageCode='auto', TargetLanguageCode=OUTPUT_LANG_CODE, Settings={'Profanity': 'MASK'}
) print("Translated Text:{}".format(result['TranslatedText']))

Kết luận

Bạn có thể sử dụng cài đặt che dấu ngôn từ tục tĩu để che dấu các từ và cụm từ được coi là tục tĩu nhằm giữ cho văn bản đã dịch của bạn sạch sẽ và đáp ứng các yêu cầu kinh doanh của bạn. Để tìm hiểu thêm về tất cả các cách bạn có thể tùy chỉnh bản dịch của mình, hãy tham khảo Tùy chỉnh bản dịch của bạn bằng Amazon Dịch.


Về các tác giả

Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Siva Rajamani là Kiến trúc sư Giải pháp Doanh nghiệp có trụ sở tại Boston tại AWS. Anh ấy thích làm việc chặt chẽ với khách hàng và hỗ trợ hành trình chuyển đổi kỹ thuật số cũng như áp dụng AWS của họ. Các lĩnh vực trọng tâm của ông là không máy chủ, tích hợp ứng dụng và bảo mật. Ngoài công việc, anh ấy thích các hoạt động ngoài trời và xem phim tài liệu.

Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái. Sudhanshu Malhotra là Kiến trúc sư Giải pháp Doanh nghiệp của AWS có trụ sở tại Boston. Anh ấy là một người đam mê công nghệ, người thích giúp khách hàng tìm ra các giải pháp sáng tạo cho những thách thức kinh doanh phức tạp. Các lĩnh vực trọng tâm chính của anh ấy là DevOps, máy học và bảo mật. Khi không làm việc với khách hàng trong chuyến hành trình lên đám mây của họ, anh ấy thích đọc sách, đi bộ đường dài và khám phá các món ăn mới.

Áp dụng tính năng che giấu ngôn từ tục tĩu trong Amazon Translate PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Watson G. Srivathsan là Giám đốc sản phẩm của Sr. cho Amazon Translate, dịch vụ xử lý ngôn ngữ tự nhiên của AWS. Vào cuối tuần, bạn sẽ thấy anh ấy khám phá ngoài trời ở Tây Bắc Thái Bình Dương.

Dấu thời gian:

Thêm từ Học máy AWS