新的和改进的内容审核工具

由柏拉图重新发布

关注： 0

我们正在引入一种新的和改进的内容审核工具：审核端点改进了我们之前的内容过滤器，今天免费提供给 OpenAI API 开发人员。

为了帮助开发人员保护他们的应用程序免受可能的误用，我们推出了更快、更准确的审核端点. 此端点为 OpenAI API 开发人员提供免费访问基于 GPT 检测不受欢迎内容的分类器——一个实例使用人工智能系统协助对这些系统进行人工监督。我们还发布了两个技术论文描述我们的方法和数据集用于评估。

当给出文本输入时，审核端点会评估内容是否是性的、仇恨的、暴力的或宣扬自残的——我们禁止的内容内容政策. 端点已经过训练，可以快速、准确并在一系列应用程序中稳健地执行。重要的是，这减少了产品“说”错话的机会，即使在大规模部署给用户时也是如此。因此，人工智能可以在教育等敏感环境中释放优势，否则无法放心使用。

输入文本

暴力

自残

恨

有性

审核端点

审核端点可帮助开发人员从我们的基础设施投资中受益。而不是构建和维护自己的分类器——这是一个广泛的过程，正如我们在我们的文档中所记录的那样纸——他们可以通过单个 API 调用访问准确的分类器。

作为 OpenAI 的一部分承诺至让人工智能生态系统更安全，我们提供此端点以允许免费审核所有 OpenAI API 生成的内容。例如，在世界上是 OpenAI API 的客户，使用 Moderation 端点来帮助他们基于 AI 的虚拟角色“停留在脚本上”。通过利用 OpenAI 的技术，Inworld 可以专注于他们的核心产品——创造令人难忘的角色。

此外，我们欢迎使用端点来审核内容不能使用 OpenAI API 生成。在一种情况下，公司 NGL – 一个专注于安全的匿名消息传递平台 – 使用审核端点来检测其应用程序中的仇恨语言和欺凌行为。 NGL 发现这些分类器能够泛化到最新的俚语，让他们随着时间的推移保持更加自信。使用审核端点监控非 API 流量处于私人测试阶段，需要付费。如果您有兴趣，请联系我们支持@openai.com.

通过签出开始使用审核端点文件. 有关训练过程和模型性能的更多详细信息，请参阅我们的纸. 我们还发布了一个评估数据集，具有在这些类别中标记的 Common Crawl 数据，我们希望这将促进该领域的进一步研究。

时间戳记： 2022 年 8 月 10 日2022 年 8 月 10 日

时间戳记： 2023 年 8 月 22 日

新的和改进的内容审核工具

由柏拉图重新发布

更多来自 OpenAI

发现后端系统的细节

人工智能的民主投入

OpenAI 如何应对 2024 年全球大选

超级对齐快速拨款

DALL·E: Outpainting 介绍

开放人工智能法典

前沿风险和准备

人工智能系统应该如何表现，谁来决定？

语言模型可以解释语言模型中的神经元

GPT-3.5 Turbo 微调和 API 更新

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理