在线社区正在推动游戏、社交媒体、电子商务、约会和电子学习等行业的用户参与度。 这些在线社区的成员信任平台所有者提供一个安全和包容的环境,让他们可以自由地消费内容和做出贡献。 内容审核员通常负责审核用户生成的内容并检查其安全性并符合您的使用条款。 然而,不适当内容的规模、复杂性和种类不断增加,使得人工审核工作流程无法扩展且成本高昂。 其结果是形成贫穷、有害和非包容性的社区,从而导致用户脱离并对社区和企业产生负面影响。
与用户生成的内容一样,机器生成的内容也给内容审核带来了新的挑战。 它会自动创建高度真实的内容,这些内容可能在规模上不合适或有害。 该行业正面临着自动审核人工智能生成的内容以保护用户免受有害内容侵害的新挑战。
在这篇文章中,我们介绍了毒性检测,这是来自 亚马逊领悟 它可以帮助您自动检测用户或机器生成的文本中的有害内容。 这包括纯文本、从图像中提取的文本以及从音频或视频内容转录的文本。
使用 Amazon Comprehend 检测文本内容中的毒性
Amazon Comprehend 是一项自然语言处理 (NLP) 服务,它使用机器学习 (ML) 来发现文本中有价值的见解和联系。 它提供了一系列 ML 模型,可以通过 API 接口进行预训练或定制。 Amazon Comprehend 现在提供了一种基于 NLP 的简单解决方案,用于检测文本中的有毒内容。
Amazon Comprehend 毒性检测 API 为文本内容分配总体毒性评分,范围为 0-1,表明其有毒的可能性。 它还将文本分为以下七个类别,并为每个类别提供置信度分数:
- 仇恨言论 – 基于身份(无论是种族、民族、性别认同、宗教、性取向、能力、国籍或其他身份群体)批评、侮辱、谴责或非人化个人或群体的言论。
- GRAPHIC – 使用视觉描述性的、详细的和令人不快的生动图像的演讲。 这种语言常常变得冗长,以放大对接受者的侮辱、不适或伤害。
- 骚扰或虐待 – 在说话者和听者之间施加破坏性权力动态的言论(无论意图如何),试图影响接受者的心理健康,或客观化一个人。
- SEXUAL – 通过直接或间接提及身体部位、身体特征或性别来表明性兴趣、活动或性唤起的言语。
- 暴力或威胁 – 包含威胁、试图对个人或团体造成痛苦、伤害或敌意的言论。
- 侮辱 – 包含贬低、羞辱、嘲笑、侮辱或贬低语言的言论。
- 亵渎 – 包含不礼貌、粗俗或冒犯性的单词、短语或缩写词的言论。
您可以通过使用以下命令直接调用来访问毒性检测 API: AWS命令行界面 (AWS CLI) 和 AWS 开发工具包。 Amazon Comprehend 中的毒性检测目前支持英语版本。
用例
文本审核在管理用户生成的各种格式的内容(包括社交媒体帖子、在线聊天消息、论坛讨论、网站评论等)方面发挥着至关重要的作用。 此外,接受视频和音频内容的平台可以使用此功能来调节转录的音频内容。
生成式人工智能和大语言模型(LLM)的出现代表了人工智能领域的最新趋势。 因此,越来越需要响应式解决方案来管理法学硕士生成的内容。 Amazon Comprehend 毒性检测 API 非常适合满足这一需求。
Amazon Comprehend 毒性检测 API 请求
您最多可以向毒性检测 API 发送 10 个文本段,每个文本段的大小限制为 1 KB。 请求中的每个文本段都是独立处理的。 在以下示例中,我们生成一个名为的 JSON 文件 toxicity_api_input.json
包含文本内容,包括三个用于审核的示例文本片段。 请注意,在示例中,亵渎词语被屏蔽为 XXXX。
您可以使用 AWS CLI 使用前面包含文本内容的 JSON 文件来调用毒性检测 API:
Amazon Comprehend 毒性检测 API 响应
毒性检测 API 响应 JSON 输出将包括毒性分析结果 ResultList
领域。 ResultList
列出文本段项,序列表示 API 请求中接收文本序列的顺序。 毒性代表检测的总体置信度得分(0-1 之间)。 标签包括带有置信度分数的毒性标签列表,按毒性类型分类。
以下代码显示了来自毒性检测 API 的基于上一节中的请求示例的 JSON 响应:
在前面的 JSON 中,第一个文本段被认为是安全的,毒性分数较低。 然而,第二和第三文本片段的毒性分数分别为 73% 和 98%。 对于第二部分,Amazon Comprehend 检测到高毒性分数 VIOLENCE_OR_THREAT
; 对于第三段,它检测到 PROFANITY
具有高毒性评分。
使用 Python SDK 的示例请求
以下代码片段演示了如何利用Python SDK调用毒性检测API。 此代码接收与前面演示的 AWS CLI 命令相同的 JSON 响应。
总结
在这篇文章中,我们概述了新的 Amazon Comprehend 毒性检测 API。 我们还描述了如何解析 API 响应 JSON。 欲了解更多信息,请参阅 理解API文档。
Amazon Comprehend 毒性检测现已在四个区域全面推出:us-east-1、us-west-2、eu-west-1 和 ap-southeast-2。
要了解有关内容审核的更多信息,请参阅 AWS 内容审核指南。 迈出第一步 使用 AWS 简化您的内容审核操作.
作者简介
张拉娜 是 AWS WWSO AI 服务团队的高级解决方案架构师,专注于内容审核、计算机视觉、自然语言处理和生成 AI 的 AI 和 ML。 凭借自己的专业知识,她致力于推广 AWS AI/ML 解决方案,并协助客户转变其跨不同行业的业务解决方案,包括社交媒体、游戏、电子商务、媒体、广告和营销。
拉维沙SK 是 AWS 的高级产品经理和技术人员,专注于 AI/ML。 她在不同领域的数据分析和机器学习方面拥有超过 10 年的经验。 在业余时间,她喜欢阅读、在厨房尝试和探索新的咖啡店。
- :具有
- :是
- :在哪里
- $UP
- 1
- 10
- 100
- 118
- 12
- 13
- 54
- 7
- a
- 对,能力--
- 关于
- 接受
- ACCESS
- 横过
- 活动
- 解决
- 广告
- 影响
- AI
- 人工智能服务
- AI / ML
- 还
- Amazon
- 亚马逊领悟
- 亚马逊网络服务
- 放大
- an
- 分析
- 分析
- 和
- 另一个
- API
- 保健
- AS
- 协助
- At
- 音频
- 作者
- 自动
- 可使用
- AWS
- 基于
- 基础
- BE
- 作为
- 之间
- 身体
- 带
- 商业
- by
- 呼叫
- 调用
- CAN
- 类别
- 挑战
- 查
- 客户
- 码
- 咖啡
- 注释
- 地区
- 社体的一部分
- 复杂
- 兼容
- 理解
- 一台
- 计算机视觉
- 信心
- 连接
- 所以
- 考虑
- 消耗
- 包含
- 内容
- 贡献
- 创建
- 批评
- 关键
- 目前
- 合作伙伴
- 定制
- data
- 数据分析
- 成人约会
- 专用
- 证明
- 演示
- 描述
- 详细
- 检测
- 检测
- 没
- 不同
- 直接
- 直接
- 讨论
- 破坏性
- 不同
- 文件
- 做
- 域名
- 门
- 驾驶
- 动力学
- 电子商务行业
- 每
- 此前
- 电子商务
- 或
- 出现
- 就业
- 订婚
- 英语
- 环境
- 种族
- 不断增加
- 所有的
- 例子
- 昂贵
- 体验
- 专门知识
- 探索
- 面对
- 专栏
- 部分
- 文件
- (名字)
- 专注焦点
- 以下
- 针对
- 论坛
- 四
- 新鲜
- 止
- 赌博
- 性别
- 通常
- 生成
- 产生
- 生成的
- 生成式人工智能
- Go
- 图形
- 团队
- 成长
- 伤害
- 有害
- he
- 帮助
- 这里
- 高
- 高度
- 他
- 创新中心
- How To
- 但是
- HTTP
- HTTPS
- 人
- i
- 理想
- 身分
- 图片
- 影响力故事
- 进口
- in
- 包括
- 包括
- 包含
- 包容
- 独立地
- 表示
- 行业
- 行业中的应用:
- 造成
- 信息
- 伤
- 可行的洞见
- 侮辱
- 意图
- 兴趣
- 接口
- 成
- 介绍
- IT
- 项目
- JPG
- JSON
- 标签
- 语言
- 大
- 最新
- 学习用品
- 学习
- 喜欢
- 可能性
- 极限
- Line
- 清单
- 书单
- 低
- 机
- 机器学习
- 制成
- 制作
- 男子
- 经理
- 管理的
- 营销
- 材料
- 可能..
- 媒体
- 成员
- 条未读消息
- ML
- 模型
- 适度
- 更多
- 此外
- 姓名
- 命名
- National
- 自然
- 自然语言处理
- 需求
- 负
- 全新
- NLP
- 现在
- 对象
- of
- 进攻
- 优惠精选
- 经常
- on
- 在线
- 在线社区
- 运营
- or
- 秩序
- 起源
- 产量
- 超过
- 最划算
- 简介
- 业主
- 面包
- 部分
- 人
- 短语
- 的
- 朴素
- 平台
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 播放
- 扮演
- 贫困
- 帖子
- 帖子
- 功率
- 以前
- 处理
- 产品
- 产品经理
- 亵渎
- 促进
- 保护
- 提供
- 提供
- 提供
- 心理
- 蟒蛇
- 种族
- 范围
- 范围
- 阅读
- 现实
- 收到
- 接收
- 参考
- 引用
- 而不管
- 地区
- 宗教
- 代表
- 请求
- 分别
- 响应
- 响应
- 导致
- 检讨
- 右
- 角色
- s
- 安全
- 同
- 鳞片
- 得分了
- SDK
- sdk
- 其次
- 部分
- 寻找
- 寻求
- 段
- 中模板
- 提交
- 前辈
- 序列
- 服务
- 特色服务
- 会议
- XNUMX所
- 性生活
- 有性
- 她
- 商店
- 作品
- 尺寸
- 片段
- So
- 社会
- 社会化媒体
- 社交媒体帖子
- 方案,
- 解决方案
- 喇叭
- 专业
- 言语
- 步
- 简单的
- 这样
- 支持
- 采取
- 团队
- 文案
- 条款
- 文本
- 这
- 其
- 那里。
- 博曼
- 他们
- 第三
- Free Introduction
- 威胁
- 三
- 通过
- 次
- 至
- 向
- 转型
- 趋势
- 信任
- 类型
- 揭露
- 使用
- 用户
- 用户
- 使用
- 运用
- 利用
- 有价值
- 各种
- 视频
- 愿景
- 视觉
- 生动
- 普通
- 想
- we
- 卷筒纸
- Web服务
- 您的网站
- 为
- 什么是
- 这
- 为什么
- 将
- 话
- 工作流程
- 年
- 完全
- 您一站式解决方案
- 和风网