公司越来越依赖用户生成的图像和视频来进行参与。 从鼓励客户分享产品图像的电子商务平台到推广用户生成的视频和图像的社交媒体公司,使用用户内容进行参与是一种强大的策略。 然而,确保用户生成的内容符合您的政策并为您的用户营造一个安全的在线社区可能具有挑战性。
目前,许多公司依靠人工审核员或对用户投诉做出反应性响应来管理不当的用户生成内容。 这些方法无法扩展,无法以足够的质量或速度有效调节数百万张图像和视频,从而导致用户体验不佳、实现规模化的成本高昂,甚至对品牌声誉造成潜在损害。
在这篇文章中,我们讨论如何使用自定义审核功能 亚马逊重新认识 提高预先训练的内容审核 API 的准确性。
Amazon Rekognition 中的内容审核
Amazon Rekognition 是一项托管人工智能 (AI) 服务,提供预先训练和可自定义的计算机视觉功能,以从图像和视频中提取信息和见解。 其中一种能力是 Amazon Rekognition 内容审核,它检测图像和视频中不适当或不需要的内容。 Amazon Rekognition 使用分层分类法,通过 10 个顶级审核类别(例如暴力、露骨、酒精或毒品)和 35 个二级类别来标记不当或不需要的内容。 电子商务、社交媒体和游戏等行业的客户可以使用 Amazon Rekognition 中的内容审核来保护其品牌声誉并培育安全的用户社区。
通过使用 Amazon Rekognition 进行图像和视频审核,人工审核员必须审核数量少得多的内容,通常是内容审核模型已标记的总容量的 1-5%。 这使公司能够专注于更有价值的活动,并且仍然以现有成本的一小部分实现全面的审核覆盖。
Amazon Rekognition 自定义审核简介
现在,您可以使用自定义审核功能提高针对特定于业务的数据的 Rekognition 审核模型的准确性。 您可以在不到 20 小时的时间内使用少至 1 张带注释的图像来训练自定义适配器。 这些适配器扩展了调节模型的功能,以更高精度检测用于训练的图像。 在这篇文章中,我们使用包含安全图像和酒精饮料图像(被认为不安全)的示例数据集来提高酒精适度标签的准确性。
经过训练的适配器的唯一ID可以提供给现有的 检测审核标签 使用此适配器处理图像的 API 操作。 每个适配器只能由用于训练适配器的 AWS 账户使用,确保用于训练的数据在该 AWS 账户中保持安全。 借助自定义审核功能,您可以定制 Rekognition 预训练审核模型,以提高特定审核用例的性能,而无需任何机器学习 (ML) 专业知识。 您可以继续享受完全托管的审核服务的优势,以及自定义审核的按使用付费定价模式。
解决方案概述
训练自定义审核适配器涉及五个步骤,您可以使用 AWS管理控制台 或API接口:
- 建立专案
- 上传训练数据
- 为图像分配真实标签
- 训练适配器
- 使用适配器
让我们使用控制台更详细地完成这些步骤。
建立专案
项目是存储适配器的容器。 您可以使用不同的训练数据集在项目中训练多个适配器,以评估哪个适配器最适合您的特定用例。 要创建您的项目,请完成以下步骤:
- 在Amazon Rekognition控制台上,选择 自定义审核 在导航窗格中。
- 创建项目.
- 针对 项目名,为您的项目输入一个名称。
- 针对 适配器名称,输入适配器的名称。
- (可选)输入适配器的描述。
上传训练数据
您可以从少至 20 个示例图像开始,以调整审核模型以检测更少的误报(适合您的业务但由模型标记为审核标签的图像)。 为了减少漏报(不适合您的业务但未标记审核标签的图像),您需要从 50 张示例图像开始。
您可以从以下选项中进行选择,为适配器训练提供图像数据集:
完成以下步骤:
- 对于此帖子,请选择 从S3存储桶导入图像 并输入您的 S3 URI。
与任何 ML 训练过程一样,在 Amazon Rekognition 中训练自定义审核适配器需要两个单独的数据集:一个用于训练适配器,另一个用于评估适配器。 您可以上传单独的测试数据集,也可以选择自动拆分训练数据集以进行训练和测试。
- 对于此帖子,请选择 自动拆分.
- 选择 启用自动更新 确保在启动新版本的内容审核模型时系统自动重新训练适配器。
- 创建项目.
为图像分配真实标签
如果您上传未注释的图像,您可以使用 Amazon Rekognition 控制台根据审核分类提供图像标签。 在下面的示例中,我们训练一个适配器以更高的准确度检测隐藏的酒精,并用标签酒精标记所有此类图像。 不被视为不当的图像可以标记为安全。
训练适配器
标记完所有图像后,选择 开始训练 启动培训过程。 Amazon Rekognition 将使用上传的图像数据集来训练适配器模型,以提高为训练提供的特定类型图像的准确性。
自定义审核适配器训练完成后,您可以查看所有适配器详细信息(adapterID
, test
和 training
清单文件)中 适配器性能 部分。
适配器性能 与预训练的调节模型相比,该部分显示了误报和漏报的改进。 我们训练的用于增强酒精标签检测的适配器将测试图像中的假阴性率降低了 73%。 换句话说,与预先训练的调节模型相比,适配器现在可以准确预测多出 73% 的图像的酒精调节标签。 然而,由于没有使用假阳性样本进行训练,因此在假阳性方面没有观察到任何改善。
使用适配器
您可以使用新训练的适配器执行推理以提高准确性。 为此,请调用 Amazon Rekognition DetectModerationLabel
具有附加参数的 API, ProjectVersion
,这是唯一的 AdapterID
适配器的。 以下是使用以下命令的示例命令 AWS命令行界面 (AWS CLI):
以下是使用的示例代码片段 Python Boto3 库:
培训最佳实践
为了最大限度地提高适配器的性能,建议使用以下最佳实践来培训适配器:
- 样本图像数据应捕获您想要提高调节模型准确性的代表性误差
- 您不仅可以引入误报和漏报的错误图像,还可以提供真阳性和真阴性以提高性能
- 提供尽可能多的带注释的图像用于训练
结论
在这篇文章中,我们深入概述了新的 Amazon Rekognition 自定义审核功能。 此外,我们还详细介绍了使用控制台执行训练的步骤,包括获得最佳结果的最佳实践。 有关更多信息,请访问 Amazon Rekognition 控制台并探索自定义审核功能。
Amazon Rekognition 自定义审核 现已在所有提供 Amazon Rekognition 的 AWS 区域全面推出。
进一步了解 AWS 上的内容审核。 迈出第一步 使用 AWS 简化您的内容审核操作.
作者简介
希普拉卡诺里亚 是 AWS 的首席产品经理。 她热衷于利用机器学习和人工智能的力量帮助客户解决最复杂的问题。 在加入 AWS 之前,Shipra 在 Amazon Alexa 工作了 4 年多,在那里她在 Alexa 语音助手上推出了许多与生产力相关的功能。
阿卡什深 是西雅图的软件开发工程经理。 他喜欢从事计算机视觉、人工智能和分布式系统方面的工作。 他的使命是帮助客户利用 AWS Rekognition 解决复杂问题并创造价值。 工作之余,他喜欢徒步旅行和旅行。
张拉娜 是 AWS WWSO AI 服务团队的高级解决方案架构师,专注于内容审核、计算机视觉、自然语言处理和生成 AI 的 AI 和 ML。 凭借自己的专业知识,她致力于推广 AWS AI/ML 解决方案,并协助客户转变其跨不同行业的业务解决方案,包括社交媒体、游戏、电子商务、媒体、广告和营销。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- PlatoData.Network 垂直生成人工智能。 赋予自己力量。 访问这里。
- 柏拉图爱流。 Web3 智能。 知识放大。 访问这里。
- 柏拉图ESG。 碳, 清洁科技, 能源, 环境, 太阳能, 废物管理。 访问这里。
- 柏拉图健康。 生物技术和临床试验情报。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/announcing-rekogniton-custom-moderation-enhance-accuracy-of-pre-trained-rekognition-moderation-models-with-your-data/
- :是
- :不是
- :在哪里
- 1
- 10
- 100
- 118
- 150
- 20
- 35%
- 50
- 7
- 9
- a
- 阿卡什
- 关于
- 账号管理
- 准确
- 横过
- 活动
- 适应
- 额外
- 附加信息
- 地址
- 广告
- AI
- 人工智能服务
- AI / ML
- 酒精
- Alexa的
- 所有类型
- 已经
- 还
- Amazon
- 亚马逊重新认识
- 亚马逊网络服务
- an
- 和
- 宣布
- 另一个
- 任何
- API
- 方法
- 适当
- 保健
- 人造的
- 人工智能
- 人工智能(AI)
- AS
- 评估
- 助理
- 协助
- At
- 作者
- 自动
- 可使用
- AWS
- 基于
- BE
- before
- 开始
- 好处
- 最佳
- 最佳实践
- 都
- 品牌
- 瞻
- 商业
- 但是
- by
- 呼叫
- CAN
- 能力
- 能力
- 捕获
- 案件
- 类别
- 挑战
- 客户
- 码
- 地区
- 社体的一部分
- 公司
- 相比
- 投诉
- 完成
- 复杂
- 全面
- 一台
- 计算机视觉
- 考虑
- 一贯
- 安慰
- 容器
- 内容
- 继续
- 价格
- 成本
- 覆盖
- 创建信息图
- 创造价值
- 目前
- 习俗
- 合作伙伴
- 定制
- data
- 数据集
- 专用
- 深
- 描述
- 细节
- 详细
- 详情
- 检测
- 检测
- 研发支持
- 不同
- 讨论
- 显示器
- 分布
- 分布式系统
- 不同
- do
- 别
- 毒品
- 电子商务行业
- 每
- 电子商务
- 只
- 或
- enable
- 使
- 鼓励
- 订婚
- 工程师
- 提高
- 增强
- 享受
- 确保
- 保证
- 输入
- 错误
- 故障
- 评估
- 甚至
- 例子
- 现有
- 体验
- 专门知识
- 探索
- 延长
- 提取
- false
- 专栏
- 特征
- 少数
- 少
- 档
- (名字)
- 五
- 已标记
- 专注焦点
- 以下
- 针对
- 培育
- 寄养
- 分数
- 止
- 充分
- 此外
- 赌博
- 通常
- 生成的
- 生成式人工智能
- 得到
- 陆运
- 伤害
- 有
- he
- 帮助
- 这里
- 老旧房屋
- 高
- 更高
- 他的
- 小时
- 创新中心
- How To
- 但是
- HTML
- HTTP
- HTTPS
- 人
- ID
- 图片
- 图片
- 改善
- 改善
- 改进
- 改善
- in
- 其他
- 深入
- 包含
- 日益
- 行业
- 信息
- 开始
- 可行的洞见
- 房源搜索
- 接口
- IT
- 加盟
- 标签
- 标签
- 语言
- 推出
- 信息
- 学习
- 减
- Line
- 清单
- 机
- 机器学习
- 管理
- 管理
- 颠覆性技术
- 经理
- 许多
- 营销
- 生产力
- 媒体
- 百万
- 使命
- ML
- 模型
- 模型
- 适度
- 更多
- 最先进的
- 许多
- 多
- 姓名
- 自然
- 自然语言处理
- 旅游导航
- 负
- 底片
- 全新
- 新
- 没有
- 现在
- of
- 优惠精选
- on
- 一
- 在线
- 仅由
- 操作
- 运营
- 最佳
- 附加选项
- or
- 其他名称
- 学校以外
- 超过
- 简介
- 面包
- 参数
- 多情
- 为
- 演出
- 性能
- 执行
- 施行
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 政策
- 贫困
- 积极
- 可能
- 帖子
- 潜力
- 功率
- 强大
- 做法
- 预测
- 呈现
- 价格
- 定价模型
- 校长
- 问题
- 过程
- 处理
- 产品
- 产品经理
- 项目
- 促进
- 保护
- 提供
- 提供
- 质量
- 率
- 建议
- 减少
- 减少
- 地区
- 依靠
- 遗迹
- 代表
- 声誉
- 必须
- 需要
- 回应
- 响应
- 成果
- 检讨
- 安全
- 样本数据集
- 鳞片
- 西雅图
- 部分
- 安全
- 前辈
- 分开
- 服务
- 特色服务
- 集
- Share
- 她
- 应该
- 小
- 片段
- 社会
- 社会化媒体
- 软件
- 软件开发
- 解决方案
- 解决
- 专业
- 具体的
- 速度
- 花费
- 分裂
- 开始
- 步
- 步骤
- 仍
- 商店
- 策略
- 这样
- 足够
- 系统
- 产品
- 采取
- 任务
- 任务
- 分类
- 团队
- test
- 测试
- 比
- 这
- 其
- 博曼
- Free Introduction
- 通过
- 至
- 顶级
- 合计
- 培训
- 熟练
- 产品培训
- 转型
- 旅游
- true
- 真相
- 二
- 类型
- 一般
- 独特
- 无用
- 上传
- 使用
- 用例
- 用过的
- 用户
- 用户体验
- 用户
- 使用
- 运用
- 有价值
- 折扣值
- 版本
- 视频
- 视频
- 查看
- 暴力
- 愿景
- 参观
- 音色
- 体积
- 走
- 想
- 是
- we
- 卷筒纸
- Web服务
- 为
- ,尤其是
- 这
- 将
- 中
- 也完全不需要
- 话
- 工作
- 工作流程
- 加工
- 年
- 完全
- 您一站式解决方案
- 和风网