新しく改善されたコンテンツモデレーションツール

プラトン再発行

フォロワー： 0

新しく改善されたコンテンツモデレーションツールを導入します。モデレートエンドポイントは、以前のコンテンツフィルターを改良したもので、OpenAI API 開発者は今日から無料で利用できます。

開発者がアプリケーションを誤用の可能性から保護できるようにするために、より高速で正確なモデレートエンドポイント. このエンドポイントは、OpenAI API 開発者に無料でアクセスできるようにします。 GPT ベース望ましくないコンテンツを検出する分類子 — のインスタンス AI システムの使用これらのシステムの人間による監視を支援します。また、両方をリリースしました技術論文私たちの方法論とデータセット評価に使用されます。

テキスト入力が与えられると、モデレーションエンドポイントは、コンテンツが性的、憎悪、暴力、または自傷行為を助長するものであるかどうかを評価します。コンテンツポリシー. エンドポイントは、迅速かつ正確で、さまざまなアプリケーションで確実に機能するようにトレーニングされています。重要なことは、これにより、大規模なユーザーに展開された場合でも、製品が間違ったことを「言う」可能性が減少することです。その結果、AI は、他の方法では自信を持って使用できなかった、教育などの機密設定で利点を引き出すことができます。

入力テキスト

暴力

自傷

嫌い

性的な

モデレートエンドポイント

モデレーションエンドポイントは、開発者がインフラストラクチャへの投資から利益を得るのに役立ちます。独自の分類器を構築して維持するのではなく、大規模なプロセスです。紙—代わりに、XNUMX 回の API 呼び出しで正確な分類子にアクセスできます。

OpenAI の一部としてコミットメント〜へ AIエコシステムをより安全にする、このエンドポイントを提供して、OpenAI API によって生成されたすべてのコンテンツを無料でモデレートできるようにします。例えば、インワールドOpenAI API の顧客であるは、モデレーションエンドポイントを使用して、AI ベースの仮想キャラクターが「台本通りに」作業できるようにしています。 OpenAI のテクノロジーを活用することで、Inworld はコア製品である印象的なキャラクターの作成に集中できます。

さらに、エンドポイントを使用してコンテンツを管理することを歓迎します OpenAI API で生成されます。あるケースでは、同社は NGL – 安全性に重点を置いた匿名メッセージングプラットフォーム – モデレーションエンドポイントを使用して、アプリケーション内の憎悪に満ちた言葉やいじめを検出します。 NGL は、これらの分類子が最新のスラングに一般化できることを発見し、時間の経過とともに自信を維持できるようにしました。 API 以外のトラフィックを監視するためのモデレーションエンドポイントの使用はプライベートベータ版であり、料金が発生します。ご興味のある方は、こちらまでお問い合わせください。 support@openai.com.

チェックアウトして、モデレーションエンドポイントの使用を開始するドキュメンテーション. トレーニングプロセスとモデルのパフォーマンスの詳細については、紙. また、評価データセット、これらのカテゴリ内でラベル付けされた Common Crawl データを特徴としています。これにより、この分野のさらなる研究が促進されることを願っています。

タイムスタンプ： 2022 年 8 月 10 日2022 年 8 月 10 日

タイムスタンプ： 2023 年 8 月 22 日

新しく改善されたコンテンツモデレーションツール

プラトン再発行

より多くの OpenAI

バックエンドシステムの特徴を発見する

AI への民主的なインプット

OpenAI は 2024 年の世界選挙にどう臨むか

スーパーアライメント高速グラント

DALL・E: Outpainting の紹介

OpenAIコーデックス

フロンティアのリスクと備え

AI システムはどのように動作し、誰が決定する必要がありますか?

言語モデルは言語モデルでニューロンを説明できる

GPT-3.5 Turbo の微調整と API のアップデート

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー