DALL・E2のバイアスを減らし、安全性を向上させる

フォロワー： 0

今日、私たちは、DALL・Eが世界の人口の多様性をより正確に反映する人々の画像を生成するように、新しい技術を実装しています。この手法は、「消防士」のように人種や性別を指定しない人物を説明するプロンプトがDALL・Eに表示される場合に、システムレベルで適用されます。

内部評価によると、この手法を適用した後、ユーザーはDALL・E画像にさまざまな背景の人々が含まれていると言う可能性が12倍高くなりました。より多くのデータとフィードバックを収集するにつれて、この手法を徐々に改善する予定です。

CEOの写真

生成する

緩和前

緩和後

2月から、限られた人数でDALL・E XNUMXの研究のプレビューを開始しました。これにより、システムの機能と制限をよりよく理解し、安全システムを改善することができました。

このプレビューフェーズでは、初期のユーザーが機密性の高い偏った画像にフラグを立て、この新しい緩和策の通知と評価に役立っています。

DALL・EのようなAIシステムが、トレーニングデータのバイアスをどのように反映し、さまざまな方法でそれらに対処できるかについて、引き続き調査を行っています。

調査のプレビュー中に、安全システムを改善するために次のような他の措置を講じました。

リアルな顔を含む画像のアップロードを拒否し、有名人や著名な政治家を含む公人の肖像を作成しようとすることで、DALL・Eが悪用されて欺瞞的なコンテンツを作成するリスクを最小限に抑えます。
コンテンツフィルターをより正確にすることで、コンテンツフィルターが私たちの違反するプロンプトや画像のアップロードをより効果的にブロックできるようにしますコンテンツポリシークリエイティブな表現を可能にしながら。
誤用を防ぐために自動化された人間の監視システムを改良します。

これらの改善により、より多くのユーザーをDALL・Eに招待できるという自信を得ることができました。

アクセスの拡大は私たちの重要な部分です責任を持ってAIシステムを導入するそれは私たちが実際の使用についてもっと学び、私たちの安全システムを繰り返し続けることを可能にするからです。