Cohere、OpenAI、および AI21 Labs は、大規模な言語モデルを開発または展開するあらゆる組織に適用できるベスト プラクティスの予備セットを開発しました。読み書きできるコンピューターが登場し、日常生活に根本的な影響を与える可能性があります。人間とマシンのインタラクションの未来は可能性と期待に満ちていますが、強力なテクノロジーは慎重に導入する必要があります。
以下の共同声明は、AI の進歩によってもたらされる世界的な課題に対処するためのコミュニティ構築に向けた一歩を示すものであり、参加を希望する他の組織が連絡を取ることをお勧めします。
言語モデルの展開に関する共同勧告
大規模な言語モデル(LLM)のプロバイダーが、人間の能力を強化するという完全な約束を達成するために、このテクノロジーのリスクを軽減するのに役立ついくつかの重要な原則をお勧めします。
これらの原則は、APIを介してLLMを提供した経験に基づいて特別に開発されましたが、リリース戦略(オープンソーシングや企業内での使用など)に関係なく役立つことを願っています。 LLMの商用利用とそれに伴う安全上の考慮事項は新しく進化しているため、これらの推奨事項は時間の経過とともに大幅に変化すると予想されます。 私たちは、LLMの制限と誤用の手段について積極的に学び、対処しており、今後、より広いコミュニティと協力して、これらの原則と実践を更新していきます。
私たちは、他のLLMプロバイダーがそれらから学び、採用し、LLMの開発と展開に関する公開討論を進めることを期待して、これらの原則を共有しています。
誤用を禁止する
使用ガイドラインと利用規約を公開する スパム、詐欺、またはアストロターフィングなどによる個人、コミュニティ、および社会への重大な危害を禁止する方法でのLLMの使用。 使用ガイドラインでは、LLMの使用に特別な精査が必要なドメインを指定し、保護された特性に基づいて人を分類するなど、適切ではないリスクの高いユースケースを禁止する必要があります。
使用ガイドラインを実施するためのシステムとインフラストラクチャを構築する。 これには、レート制限、コンテンツフィルタリング、本番アクセス前のアプリケーション承認、異常なアクティビティの監視、およびその他の緩和策が含まれる場合があります。
意図しない危害を軽減する
有害なモデルの動作を積極的に軽減する。 ベストプラクティスには、制限を適切に評価するための包括的なモデル評価、コーパスのトレーニングにおける潜在的なバイアスの原因を最小限に抑える方法、人間のフィードバックから学ぶなどの危険な行動を最小限に抑えるための手法が含まれます。
既知の弱点と脆弱性を文書化する、バイアスや安全でないコードを生成する能力など。場合によっては、予防措置を講じても、意図しない危害の可能性を完全に排除することはできません。 ドキュメントには、モデルとユースケース固有の安全のベストプラクティスも含める必要があります。
利害関係者と思慮深く協力する
多様なバックグラウンドを持つチームを構築する 幅広い意見を求めます。 言語モデルが現実世界の多様性の中でどのように機能するかを特徴づけて対処するには、多様な視点が必要です。チェックを外すと、バイアスが強化されたり、一部のグループで機能しなくなったりする可能性があります。
LLMの安全性と誤用に関して学んだ教訓を公開する 広範な採用を可能にし、ベストプラクティスに関する業界を超えた反復を支援するため。
言語モデルのサプライチェーンにおけるすべての労働を尊重して扱う。 たとえば、プロバイダーは、モデル出力を社内でレビューする作業条件について高い基準を設定し、ベンダーを明確に指定された基準に保つ必要があります(たとえば、ラベラーが特定のタスクをオプトアウトできるようにする)。
LLMプロバイダーとして、これらの原則を公開することは、より安全な大規模言語モデルの開発と展開を共同で導くための最初のステップを表しています。 言語モデルによる意図しない危害を減らし、悪意のある使用を防ぐための他の機会を特定するために、お互いに、そして他の当事者と協力し続けることを楽しみにしています。
他団体からの支援
「LLM には多くの期待が寄せられていますが、取り組む必要がある本質的な安全性に関する重大な問題があります。これらのベスト プラクティスは、これらのモデルの害を最小限に抑え、潜在的な利点を最大化するための重要なステップとして機能します。」
—人類学
「大規模言語モデル (LLM) がますます強力になり、表現力が豊かになるにつれて、リスク軽減がますます重要になっています。私たちは、被害を軽減し、特に注意が必要な領域をユーザーに強調するために積極的に努めるこれらの取り組みやその他の取り組みを歓迎します。ここで概説された原則は、世界的な議論への重要な貢献です。」
—ジョン バンセマー氏、CyberAI プロジェクト ディレクター兼セキュリティおよび新興テクノロジー センター (CSET) シニアフェロー
「Google は、危害、偏見、虚偽表示のリスクを軽減するために、モデルとトレーニング データを分析する際の包括的な戦略の重要性を確認します。これは、AI の安全性に関する原則と文書化を促進するために、これらの AI プロバイダーがとった思慮深い一歩です。」
—Google クラウド プラットフォーム (GCP)
「大規模な言語モデルなどの基礎モデルの安全性に対する社会的関心が高まっています。私たちは、Cohere、OpenAI、および AI21 Labs が、モデル開発者の観点から責任ある開発と展開のための高レベルの原則を概説するための最初の一歩を踏み出したことを賞賛します。やるべきことはまだたくさんあり、より詳細な原則とコミュニティ規範を策定するには、学界、産業界、市民社会からのより多くの声を集めることが不可欠であると考えています。最近の記事で述べたように、 ブログ投稿重要なのは最終結果だけではなく、プロセスの正当性です。」
—パーシー・リアン、スタンフォード基礎モデル研究センター (CRFM) 所長
巻き込まれる
言語モデルを開発している場合、またはそのリスクの軽減に取り組んでいる場合は、ぜひご相談ください。までご連絡ください。 bestpractices@openai.com.
- 能力
- 私たちについて
- アクセス
- 達成する
- Action
- アクティビティ
- 住所
- アドレッシング
- 養子縁組
- 進める
- AI
- すべて
- API
- 適用可能な
- 申し込み
- 適切な
- なぜなら
- になる
- 以下
- 利点
- BEST
- ベストプラクティス
- 建物
- 機能
- 例
- チェーン
- 課題
- 変化する
- クラウド
- クラウドプラットフォーム
- コード
- 協力します
- 環境、テクノロジーを推奨
- コマーシャル
- コミュニティ
- コミュニティ
- 会社
- 完全に
- 包括的な
- コンピューター
- 条件
- 検討事項
- コンテナ
- コンテンツ
- 続ける
- 会話
- データ
- 展開する
- 展開
- 詳細な
- 開発する
- 発展した
- 開発者
- 開発
- 開発
- 勤勉
- 取締役
- 多様性
- ドメイン
- 努力
- 排除する
- 新興の
- enable
- 奨励する
- 従事する
- 確保する
- 本質的な
- 評価
- 進化
- 例
- 興奮した
- 期待する
- 体験
- 表現力豊かな
- フィードバック
- フィルタリング
- 名
- Foundation
- 詐欺
- フル
- 根本的に
- 未来
- グローバル
- でログイン
- グループの
- 成長
- ガイドライン
- 助けます
- こちら
- ハイ
- リスクが高い
- 特徴
- 期待している
- 認定条件
- HTTPS
- 人間
- 識別する
- 影響
- 重要性
- 重要
- include
- ますます
- 個人
- 産業を変えます
- インフラ
- 固有の
- 相互作用
- 問題
- IT
- キー
- 既知の
- 労働
- ラボ
- 言語
- 大
- LEARN
- 学んだ
- 学習
- 合法性
- 教訓
- 愛
- 機械
- 材料
- 事態
- モデル
- モニタリング
- 他には?
- ニーズ
- 操作する
- 機会
- 注文
- 組織
- 組織
- その他
- 参加する
- のワークプ
- 視点
- 視点
- プラットフォーム
- 可能性
- 潜在的な
- 強力な
- プロセス
- 作り出す
- 生産
- プロジェクト
- 約束
- 推進する
- 保護された
- 提供
- 公共
- 出版
- RE
- リーチ
- 現実の世界
- 推薦する
- 減らします
- に対する
- リリース
- 表し
- 必要
- 研究
- 責任
- リスク
- リスク
- より安全な
- 安全性
- セキュリティ
- セッションに
- いくつかの
- シェアリング
- 重要
- 社会
- 社会
- 一部
- スパム
- 特に
- 規格
- 都道府県
- ステートメント
- 作戦
- 戦略
- 供給
- サプライチェーン
- システム
- 取得
- Talk
- テクニック
- テクノロジー
- 条件
- 介して
- 時間
- touch
- に向かって
- トレーニング
- アップデイト
- つかいます
- ユースケース
- users
- ベンダー
- 声
- 歓迎
- while
- 誰
- 広範囲
- 以内
- 仕事
- 働いていました
- ワーキング
- 世界
- でしょう