Sự gia tăng các hoạt động xã hội trực tuyến như mạng xã hội hoặc trò chơi trực tuyến thường chứa đựng hành vi thù địch hoặc hung hãn có thể dẫn đến các biểu hiện không được yêu cầu như lời nói căm thù, bắt nạt trên mạng hoặc quấy rối. Ví dụ: nhiều cộng đồng chơi game trực tuyến cung cấp chức năng trò chuyện bằng giọng nói để tạo điều kiện giao tiếp giữa những người dùng của họ. Mặc dù trò chuyện thoại thường hỗ trợ những câu nói đùa thân thiện và nói chuyện rác rưởi nhưng nó cũng có thể dẫn đến các vấn đề như lời nói căm thù, bắt nạt trên mạng, quấy rối và lừa đảo. Việc gắn cờ ngôn ngữ có hại giúp các tổ chức duy trì cuộc trò chuyện một cách văn minh và duy trì môi trường trực tuyến an toàn và toàn diện để người dùng tạo, chia sẻ và tham gia một cách tự do. Ngày nay, nhiều công ty chỉ dựa vào người kiểm duyệt để xem xét nội dung độc hại. Tuy nhiên, việc mở rộng quy mô người điều hành để đáp ứng những nhu cầu này với đủ chất lượng và tốc độ là rất tốn kém. Do đó, nhiều tổ chức có nguy cơ phải đối mặt với tỷ lệ mất người dùng cao, tổn hại về danh tiếng và các khoản phạt theo quy định. Ngoài ra, người điều hành thường bị ảnh hưởng tâm lý khi xem xét nội dung độc hại.
Phiên âm Amazon là dịch vụ nhận dạng giọng nói tự động (ASR) giúp các nhà phát triển dễ dàng thêm khả năng chuyển giọng nói thành văn bản vào ứng dụng của họ. Hôm nay, chúng tôi vui mừng thông báo Phát hiện độc tính của Amazon Transcribe, một khả năng được hỗ trợ bởi máy học (ML) sử dụng cả tín hiệu dựa trên âm thanh và văn bản để xác định và phân loại nội dung độc hại dựa trên giọng nói trong bảy danh mục, bao gồm quấy rối tình dục, lời nói căm thù, đe dọa, lạm dụng, thô tục, lăng mạ và ngôn ngữ đồ họa . Ngoài văn bản, tính năng Phát hiện độc tính còn sử dụng các tín hiệu giọng nói như âm sắc và cao độ để tập trung vào mục đích độc hại trong lời nói.
Đây là một cải tiến từ các hệ thống kiểm duyệt nội dung tiêu chuẩn được thiết kế để chỉ tập trung vào các điều khoản cụ thể mà không tính đến mục đích. Hầu hết các doanh nghiệp đều có SLA từ 7–15 ngày để xem xét nội dung do người dùng báo cáo vì người kiểm duyệt phải nghe các tệp âm thanh dài để đánh giá xem liệu cuộc trò chuyện có trở nên độc hại hay không và khi nào. Với tính năng Phát hiện độc tính của Amazon Transcribe, người kiểm duyệt chỉ xem xét phần cụ thể của tệp âm thanh bị gắn cờ về nội dung độc hại (so với toàn bộ tệp âm thanh). Nội dung mà người kiểm duyệt phải xem xét đã giảm 95%, cho phép khách hàng giảm SLA xuống chỉ còn vài giờ, cũng như cho phép họ chủ động kiểm duyệt nhiều nội dung hơn ngoài những nội dung được người dùng gắn cờ. Nó sẽ cho phép các doanh nghiệp tự động phát hiện và kiểm duyệt nội dung trên quy mô lớn, cung cấp một môi trường trực tuyến an toàn và toàn diện, đồng thời thực hiện hành động trước khi hành động đó có thể khiến người dùng rời bỏ hoặc gây thiệt hại về danh tiếng. Các mô hình dùng để phát hiện nội dung độc hại được Amazon Transcribe duy trì và cập nhật định kỳ để duy trì độ chính xác và mức độ liên quan.
Trong bài đăng này, bạn sẽ học cách:
- Xác định nội dung có hại trong lời nói bằng tính năng Phát hiện độc tính của Amazon Transcribe
- Sử dụng bảng điều khiển Amazon Transcribe để phát hiện độc tính
- Tạo công việc sao chép có tính năng phát hiện độc tính bằng cách sử dụng Giao diện dòng lệnh AWS (AWS CLI) và Python SDK
- Sử dụng phản hồi API phát hiện độc tính của Amazon Transcribe
Phát hiện độc tính trong cuộc trò chuyện âm thanh bằng Amazon Transcribe Toxicity Development
Amazon Transcribe hiện cung cấp giải pháp đơn giản dựa trên ML để gắn cờ ngôn ngữ có hại trong các cuộc trò chuyện bằng giọng nói. Tính năng này đặc biệt hữu ích cho mạng xã hội, trò chơi và các nhu cầu chung, loại bỏ nhu cầu khách hàng cung cấp dữ liệu của riêng họ để đào tạo mô hình ML. Tính năng Phát hiện độc tính phân loại nội dung âm thanh độc hại thành bảy loại sau và cung cấp điểm tin cậy (0–1) cho mỗi danh mục:
- Lời tục tĩu – Lời nói có chứa các từ, cụm từ hoặc từ viết tắt mang tính bất lịch sự, thô tục hoặc mang tính xúc phạm.
- Bài phát biểu ghét – Lời nói chỉ trích, lăng mạ, tố cáo hoặc hạ nhục một người hoặc một nhóm người vì lý do nhận dạng (như chủng tộc, dân tộc, giới tính, tôn giáo, khuynh hướng tình dục, khả năng và nguồn gốc quốc gia).
- Tình dục – Lời nói thể hiện sự quan tâm, hoạt động hoặc kích thích tình dục bằng cách đề cập trực tiếp hoặc gián tiếp đến các bộ phận cơ thể, đặc điểm cơ thể hoặc giới tính.
- Xúc phạm – Lời nói bao gồm ngôn ngữ hạ thấp, sỉ nhục, chế giễu, xúc phạm hoặc coi thường. Loại ngôn ngữ này cũng được dán nhãn là bắt nạt.
- Bạo lực hoặc đe dọa – Lời nói bao gồm các mối đe dọa tìm cách gây đau đớn, tổn thương hoặc thù địch đối với một người hoặc một nhóm.
- Đồ họa – Lời nói sử dụng hình ảnh mô tả trực quan và sống động đến khó chịu. Loại ngôn ngữ này thường dài dòng một cách có chủ ý để khuếch đại sự khó chịu của người nhận.
- Quấy rối hoặc lạm dụng – Lời nói nhằm mục đích ảnh hưởng đến sức khỏe tâm lý của người nhận, bao gồm các thuật ngữ hạ thấp và khách quan hóa.
Bạn có thể truy cập tính năng Phát hiện độc tính thông qua bảng điều khiển Amazon Transcribe hoặc bằng cách gọi trực tiếp các API bằng AWS CLI hoặc AWS SDK. Trên bảng điều khiển Amazon Transcribe, bạn có thể tải lên các tệp âm thanh mà bạn muốn kiểm tra mức độ độc hại và nhận kết quả chỉ sau vài cú nhấp chuột. Amazon Transcribe sẽ xác định và phân loại nội dung độc hại, chẳng hạn như quấy rối, lời nói căm thù, nội dung khiêu dâm, bạo lực, lăng mạ và tục tĩu. Amazon Transcribe cũng cung cấp điểm tin cậy cho từng danh mục, cung cấp thông tin chuyên sâu có giá trị về mức độ độc hại của nội dung. Tính năng Phát hiện độc tính hiện có sẵn trong API Amazon Transcribe tiêu chuẩn để xử lý hàng loạt và hỗ trợ tiếng Anh Mỹ.
Hướng dẫn sử dụng bảng điều khiển Amazon Transcribe
Để bắt đầu, hãy đăng nhập vào Bảng điều khiển quản lý AWS và truy cập Amazon Transcribe. Để tạo công việc phiên âm mới, bạn cần tải các tệp đã ghi của mình lên một Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) trước khi chúng có thể được xử lý. Trên trang cài đặt âm thanh, như minh họa trong ảnh chụp màn hình sau, hãy bật Phát hiện độc tính và tiến hành tạo công việc mới. Amazon Transcribe sẽ xử lý công việc sao chép ở chế độ nền. Khi công việc tiến triển, bạn có thể mong đợi trạng thái sẽ thay đổi thành Hoàn thành khi quá trình kết thúc.
Để xem lại kết quả của công việc phiên âm, hãy chọn công việc đó từ danh sách công việc để mở. Cuộn xuống Bản xem trước phiên âm phần kiểm tra kết quả trên Độc tính chuyển hướng. Giao diện người dùng hiển thị các phân đoạn phiên mã được mã hóa màu để biểu thị mức độ độc tính, được xác định bằng điểm tin cậy. Để tùy chỉnh màn hình, bạn có thể sử dụng các thanh chuyển đổi trong Bộ lọc ngăn. Các thanh này cho phép bạn điều chỉnh ngưỡng và lọc các loại độc tính tương ứng.
Ảnh chụp màn hình sau đây đã che đi các phần của văn bản phiên âm do có thông tin nhạy cảm hoặc độc hại.
API phiên mã với yêu cầu phát hiện độc tính
Trong phần này, chúng tôi hướng dẫn bạn tạo công việc sao chép có tính năng phát hiện độc tính bằng các giao diện lập trình. Nếu tệp âm thanh chưa có trong bộ chứa S3, hãy tải tệp đó lên để đảm bảo Amazon Transcribe có quyền truy cập. Tương tự như việc tạo một tác vụ phiên âm trên console, khi gọi tác vụ, bạn cần cung cấp các thông số sau:
- Phiên âmTên công việc – Chỉ định một tên công việc duy nhất.
- MediaFileUri – Nhập vị trí URI của file âm thanh trên Amazon S3. Amazon Transcribe hỗ trợ các định dạng âm thanh sau: MP3, MP4, WAV, FLAC, AMR, OGG hoặc WebM
- Mật ngữ – Đặt thành
en-US
. Tính đến thời điểm viết bài này, Phát hiện độc tính chỉ hỗ trợ tiếng Anh Mỹ. - Loại độc tính - Vượt qua
ALL
giá trị để bao gồm tất cả các danh mục phát hiện độc tính được hỗ trợ.
Sau đây là ví dụ về cách bắt đầu công việc sao chép với tính năng phát hiện độc tính được kích hoạt bằng Python3:
Bạn có thể gọi cùng một công việc sao chép bằng tính năng phát hiện độc tính bằng lệnh AWS CLI sau:
API phiên mã với phản hồi phát hiện độc tính
Đầu ra JSON phát hiện độc tính của Amazon Transcribe sẽ bao gồm các kết quả sao chép trong trường kết quả. Việc kích hoạt tính năng phát hiện độc tính sẽ thêm một trường bổ sung được gọi là toxicityDetection
dưới trường kết quả. toxicityDetection
bao gồm danh sách các mục được sao chép với các tham số sau:
- văn bản – Văn bản được sao chép thô
- độc tính – Điểm tin cậy phát hiện (giá trị trong khoảng 0–1)
- đố – Điểm tự tin cho từng loại lời nói độc hại
- thời gian bắt đầu – Vị trí bắt đầu phát hiện trong file âm thanh (giây)
- thời gian kết thúc – Vị trí kết thúc phát hiện trong file âm thanh (giây)
Sau đây là mẫu phản hồi phát hiện độc tính viết tắt mà bạn có thể tải xuống từ bảng điều khiển:
Tổng kết
Trong bài đăng này, chúng tôi đã cung cấp thông tin tổng quan về tính năng Phát hiện độc tính của Amazon Transcribe mới. Chúng tôi cũng đã mô tả cách bạn có thể phân tích cú pháp đầu ra JSON phát hiện độc tính. Để biết thêm thông tin, hãy xem bảng điều khiển Amazon Transcribe và dùng thử API phiên âm với tính năng Phát hiện độc tính.
Tính năng Phát hiện độc tính của Amazon Transcribe hiện có sẵn ở các Khu vực AWS sau: Miền Đông Hoa Kỳ (Ohio), Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Sydney), Châu Âu (Ireland) và Châu Âu (London). Để tìm hiểu thêm, hãy truy cập Phiên âm Amazon.
Tìm hiểu thêm về kiểm duyệt nội dung trên AWS và của chúng tôi kiểm duyệt nội dung các trường hợp sử dụng ML. Hãy bước bước đầu tiên về phía hợp lý hóa các hoạt động kiểm duyệt nội dung của bạn với AWS.
Giới thiệu về tác giả
Trương Lana là Kiến trúc sư giải pháp cấp cao tại nhóm AWS WWSO AI Services, chuyên về AI và ML để kiểm duyệt nội dung, thị giác máy tính và xử lý ngôn ngữ tự nhiên. Với chuyên môn của mình, cô tận tâm quảng bá các giải pháp AI/ML của AWS và hỗ trợ khách hàng chuyển đổi các giải pháp kinh doanh của họ trong nhiều ngành khác nhau, bao gồm truyền thông xã hội, trò chơi, thương mại điện tử và quảng cáo & tiếp thị.
Sumit Kumar là Giám đốc sản phẩm cấp cao, Kỹ thuật tại nhóm Dịch vụ ngôn ngữ AI của AWS. Anh ấy có 10 năm kinh nghiệm quản lý sản phẩm trên nhiều lĩnh vực khác nhau và đam mê AI/ML. Ngoài công việc, Sumit thích đi du lịch và chơi cricket và quần vợt sân cỏ.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Ô tô / Xe điện, Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- BlockOffsets. Hiện đại hóa quyền sở hữu bù đắp môi trường. Truy cập Tại đây.
- nguồn: https://aws.amazon.com/blogs/machine-learning/flag-harmful-language-in-spoken-conversations-with-amazon-transcribe-toxicity-detection/
- : có
- :là
- :không phải
- 10
- 100
- 16
- 17
- 20
- 24
- 7
- 95%
- a
- có khả năng
- Giới thiệu
- lạm dụng
- truy cập
- cho phù hợp
- Kế toán
- chính xác
- ngang qua
- Hoạt động
- hoạt động
- hoạt động
- thêm vào
- Ngoài ra
- Thêm
- Quảng cáo
- tích cực
- AI
- Dịch vụ AI
- AI / ML
- Tất cả
- cho phép
- Đã
- Ngoài ra
- Mặc dù
- đàn bà gan dạ
- Phiên âm Amazon
- Amazon Web Services
- trong số
- an
- và
- Thông báo
- api
- API
- các ứng dụng
- LÀ
- AS
- Á
- Châu á Thái Bình Dương
- trợ giúp
- At
- tiêu hao
- âm thanh
- Tự động
- tự động
- có sẵn
- AWS
- lý lịch
- thanh
- cơ sở
- BE
- đã trở thành
- bởi vì
- trước
- hành vi
- giữa
- Ngoài
- thân hình
- cả hai
- Nghỉ giải lao
- bắt nạt
- kinh doanh
- by
- gọi là
- gọi
- CAN
- khả năng
- đố
- Phân loại
- Nguyên nhân
- thay đổi
- kiểm tra
- Chọn
- Phân loại
- Giao tiếp
- Cộng đồng
- Các công ty
- hoàn thành
- Hoàn thành
- máy tính
- Tầm nhìn máy tính
- sự tự tin
- An ủi
- chứa
- nội dung
- Conversation
- cuộc hội thoại
- phủ
- tạo
- Tạo
- dế
- Phê bình
- Hiện nay
- khách hàng
- tùy chỉnh
- dữ liệu
- Ngày
- dành riêng
- mô tả
- thiết kế
- phát hiện
- Phát hiện
- xác định
- phát triển
- trực tiếp
- trực tiếp
- Giao diện
- khác nhau
- lĩnh vực
- xuống
- tải về
- hai
- thương mại điện tử
- mỗi
- Đông
- dễ dàng
- hay
- loại bỏ
- cho phép
- kích hoạt
- cho phép
- cuối
- Tiếng Anh
- đảm bảo
- đăng ký hạng mục thi
- doanh nghiệp
- Toàn bộ
- Môi trường
- đặc biệt
- dân tộc
- Châu Âu
- đánh giá
- ví dụ
- ví dụ
- kích thích
- mong đợi
- đắt tiền
- kinh nghiệm
- chuyên môn
- thêm
- tạo điều kiện
- phải đối mặt với
- thất bại
- Đặc tính
- vài
- lĩnh vực
- Tập tin
- Các tập tin
- lọc
- đầu cuối
- Tên
- được gắn cờ
- Tập trung
- tiếp theo
- Trong
- thân thiện
- từ
- chức năng
- chơi game
- Giới Tính
- Tổng Quát
- được
- Go
- Đi
- Đồ họa
- Nhóm
- hướng dẫn
- có hại
- Có
- he
- giúp
- cô
- tại đây
- Cao
- GIỜ LÀM VIỆC
- Độ đáng tin của
- Hướng dẫn
- Tuy nhiên
- HTML
- http
- HTTPS
- Nhân loại
- xác định
- Bản sắc
- if
- tác động
- nhập khẩu
- cải thiện
- in
- bao gồm
- bao gồm
- Bao gồm
- Bao gồm
- Tăng lên
- chỉ
- chỉ
- các ngành công nghiệp
- thông tin
- những hiểu biết
- Xúc phạm
- dự định
- ý định
- Ý định
- cố ý
- quan tâm
- giao diện
- trong
- ireland
- IT
- mặt hàng
- Việc làm
- jpg
- json
- chỉ
- Giữ
- Ngôn ngữ
- dẫn
- LEARN
- học tập
- Cấp
- Dòng
- Danh sách
- địa điểm thư viện nào
- London
- yêu
- máy
- học máy
- duy trì
- LÀM CHO
- quản lý
- giám đốc
- nhiều
- Marketing
- Phương tiện truyền thông
- Gặp gỡ
- ML
- kiểu mẫu
- mô hình
- điều độ
- chi tiết
- hầu hết
- phải
- tên
- quốc dân
- Tự nhiên
- Xử lý ngôn ngữ tự nhiên
- Cần
- nhu cầu
- mạng lưới
- Mới
- tại
- of
- cung cấp
- thường
- Ohio
- on
- Trực tuyến
- chơi game trực tuyến
- có thể
- mở
- Hoạt động
- or
- Oregon
- tổ chức
- nguồn gốc
- vfoXNUMXfipXNUMXhfpiXNUMXufhpiXNUMXuf
- ra
- đầu ra
- bên ngoài
- tổng quan
- riêng
- Hòa bình
- trang
- Đau
- thông số
- tham gia
- các bộ phận
- vượt qua
- đam mê
- người
- cụm từ
- vật lý
- Pitch
- plato
- Thông tin dữ liệu Plato
- PlatoDữ liệu
- chơi
- phần
- vị trí
- Bài đăng
- sự hiện diện
- vấn đề
- quá trình
- Xử lý
- xử lý
- Sản phẩm
- quản lý sản phẩm
- giám đốc sản xuất
- LỢI NHUẬN
- Lập trình
- Thúc đẩy
- cho
- cung cấp
- cung cấp
- cung cấp
- Python
- chất lượng
- Cuộc đua
- Giá
- Nguyên
- sẵn sàng
- công nhận
- ghi lại
- giảm
- Giảm
- tài liệu tham khảo
- vùng
- nhà quản lý
- sự liên quan
- tôn giáo
- dựa
- Báo cáo
- phản ứng
- kết quả
- Kết quả
- xem xét
- xem xét
- Nguy cơ
- an toàn
- tương tự
- Quy mô
- mở rộng quy mô
- lừa đảo
- Điểm số
- di chuyển
- sdk
- giây
- Phần
- tìm kiếm
- phân khúc
- phân đoạn
- cao cấp
- nhạy cảm
- dịch vụ
- DỊCH VỤ
- định
- thiết lập
- XNUMX
- tình dục
- Tình dục
- Chia sẻ
- chị ấy
- thể hiện
- Chương trình
- đăng ký
- tương tự
- Đơn giản
- Mạng xã hội
- truyền thông xã hội
- Mạng xã hội
- chỉ duy nhất
- giải pháp
- Giải pháp
- chuyên
- riêng
- phát biểu
- Speech Recognition
- chuyển lời nói thành văn bản
- tốc độ
- nói
- Tiêu chuẩn
- Bắt đầu
- bắt đầu
- Bắt đầu
- Trạng thái
- Bước
- là gắn
- như vậy
- đủ
- Hỗ trợ
- Hỗ trợ
- sydney
- hệ thống
- Hãy
- nói
- nhóm
- Kỹ thuật
- về
- thử nghiệm
- việc này
- Sản phẩm
- cung cấp their dịch
- Them
- Kia là
- họ
- điều này
- các mối đe dọa
- Thông qua
- thời gian
- đến
- bây giờ
- đối với
- đối với
- Train
- biến đổi
- đi du lịch
- đúng
- thử
- kiểu
- ui
- Dưới
- độc đáo
- không được yêu cầu
- cập nhật
- us
- sử dụng
- đã sử dụng
- người sử dang
- Người sử dụng
- sử dụng
- sử dụng
- Quý báu
- giá trị
- nhiều
- thông qua
- Bạo lực
- virginia
- tầm nhìn
- Truy cập
- Giọng nói
- vs
- tầm thường
- chờ đợi
- muốn
- we
- web
- các dịch vụ web
- TỐT
- hướng Tây
- khi nào
- trong khi
- sẽ
- với
- không có
- từ
- Công việc
- viết
- năm
- nhưng
- Bạn
- trên màn hình
- zephyrnet