新的和改进的内容审核工具

图片

我们正在引入一种新的和改进的内容审核工具: 审核端点 改进了我们之前的内容过滤器,今天免费提供给 OpenAI API 开发人员。

为了帮助开发人员保护他们的应用程序免受可能的误用,我们推出了更快、更准确的 审核端点. 此端点为 OpenAI API 开发人员提供免费访问 基于 GPT 检测不受欢迎内容的分类器——一个实例 使用人工智能系统 协助对这些系统进行人工监督。 我们还发布了两个 技术论文 描述我们的方法和 数据集 用于评估。

当给出文本输入时,审核端点会评估内容是否是性的、仇恨的、暴力的或宣扬自残的——我们禁止的内容 内容政策. 端点已经过训练,可以快速、准确并在一系列应用程序中稳健地执行。 重要的是,这减少了产品“说”错话的机会,即使在大规模部署给用户时也是如此。 因此,人工智能可以在教育等敏感环境中释放优势,否则无法放心使用。

输入文本

暴力

自残

有性

审核端点

审核端点可帮助开发人员从我们的基础设施投资中受益。 而不是构建和维护自己的分类器——这是一个广泛的过程,正如我们在我们的文档中所记录的那样 ——他们可以通过单个 API 调用访问准确的分类器。

作为 OpenAI 的一部分 承诺让人工智能生态系统更安全,我们提供此端点以允许免费审核所有 OpenAI API 生成的内容。 例如, 在世界上是 OpenAI API 的客户,使用 Moderation 端点来帮助他们基于 AI 的虚拟角色“停留在脚本上”。 通过利用 OpenAI 的技术,Inworld 可以专注于他们的核心产品——创造令人难忘的角色。

此外,我们欢迎使用端点来审核内容 不能 使用 OpenAI API 生成。 在一种情况下,公司 NGL – 一个专注于安全的匿名消息传递平台 – 使用审核端点来检测其应用程序中的仇恨语言和欺凌行为。 NGL 发现这些分类器能够泛化到最新的俚语,让他们随着时间的推移保持更加自信。 使用审核端点监控非 API 流量处于私人测试阶段,需要付费。 如果您有兴趣,请联系我们 支持@openai.com.


通过签出开始使用审核端点 文件. 有关训练过程和模型性能的更多详细信息,请参阅我们的 . 我们还发布了一个 评估数据集,具有在这些类别中标记的 Common Crawl 数据,我们希望这将促进该领域的进一步研究。

时间戳记:

更多来自 OpenAI