在此类研究中,人工智能 (AI) 公司 Anthropic 开发了一种大型语言模型 (LLM),该模型已针对用户社区的价值判断进行了微调。
人工智能发展更加民主意味着什么? 为了找到答案,我们与 @collect_intel 使用 @usepolis 根据约 1000 名美国人的意见制定人工智能宪法。 然后我们使用宪法人工智能训练了一个模型。 pic.twitter.com/ZKaXw5K9sU
— 人择 (@AnthropicAI) 2023 年 10 月 17 日
许多面向公众的法学硕士在开发时都设有护栏——规定特定行为的编码指令——以试图限制不需要的输出。 例如,Anthropic 的 Claude 和 OpenAI 的 ChatGPT 通常会针对与暴力或有争议主题相关的输出请求向用户提供预设的安全响应。
然而,正如无数专家指出的那样,护栏和其他干预技术可能会剥夺用户的代理权。被认为可以接受的东西并不总是有用的,被认为有用的东西也并不总是可以被接受的。道德或基于价值的判断的定义可能因文化、民众和时期的不同而有所不同。
相关新闻: 英国将在 XNUMX 月峰会上针对潜在的人工智能威胁
对此的一种可能的补救措施是允许用户决定人工智能模型的价值调整。 Anthropic 的“集体宪政人工智能”实验就是针对这一“混乱挑战”的尝试。
Anthropic 与 Polis 和 Collective Intelligence Project 合作,挖掘了 1,000 名不同人群的用户,并要求他们通过民意调查回答一系列问题。
挑战的核心是让该机构的用户能够确定什么是适当的,而不会让他们接触到不适当的输出。 这涉及征求用户价值,然后将这些想法实施到已经训练过的模型中。
Anthropic 使用一种名为“Constitutional AI”的方法来 直接 它努力调整法学硕士的安全性和实用性。从本质上讲,这涉及为模型提供一系列必须遵守的规则,然后训练它在整个过程中实施这些规则,就像宪法作为许多国家治理的核心文件一样。
在集体宪法人工智能实验中,Anthropic 试图将基于群体的反馈整合到模型的宪法中。结果, 根据 根据 Anthropic 的一篇博客文章,这似乎是一项科学上的成功,因为它阐明了实现允许法学硕士产品的用户确定其集体价值观这一目标的进一步挑战。
团队必须克服的困难之一是为基准测试过程提出一种新颖的方法。 由于该实验似乎是此类实验中的第一个,并且它依赖于 Anthropic 的宪法人工智能方法,因此没有既定的测试来将基本模型与众包值调整的模型进行比较。
最终,似乎实现了用户投票反馈数据的模型在有偏差的输出方面“略微”优于基本模型。
根据博客文章:
“我们对这个过程感到兴奋的不仅仅是最终的模型。 我们相信,这可能是公众作为一个群体有意指导大型语言模型行为的首批实例之一。 我们希望世界各地的社区能够利用此类技术来训练满足其需求的特定文化和特定环境的模型。”
- :具有
- :是
- $UP
- 000
- 1
- 17
- a
- 关于
- 可接受
- 实现
- 横过
- 驳
- 机构
- AI
- AI聊天机器人
- AI模型
- 对准
- 让
- 允许
- 已经
- 时刻
- 美国人
- an
- 和
- 回答
- 人类的
- 出现
- 出现
- 适当
- 国家 / 地区
- 围绕
- 人造的
- 人工智能
- 人工智能(AI)
- AS
- At
- 尝试
- 尝试
- 基地
- 基于
- BE
- 很
- 行为
- 相信
- 标杆
- 之间
- 偏
- 博客
- 建立
- 建
- by
- 被称为
- CAN
- 中心
- 挑战
- 挑战
- 聊天机器人
- ChatGPT
- Cointelegraph
- 合作
- 集体
- 未来
- 地区
- 社体的一部分
- 比较
- 考虑
- 规程
- 争议
- 核心
- data
- 定义
- 民主的
- 人口统计
- 确定
- 发达
- 研发支持
- 听写
- 困难
- 针对
- 不同
- 文件
- 不
- 工作的影响。
- 本质上
- 成熟
- 例子
- 兴奋
- 实验
- 反馈
- 找到最适合您的地方
- 公司
- 姓氏:
- 针对
- 止
- 进一步
- 给
- 给予
- 目标
- 治理
- 团队
- 民政事务总署
- 有
- 抱有希望
- HTTPS
- 思路
- 实施
- 实施
- 实施
- in
- 说明
- 整合
- 房源搜索
- 故意地
- 成
- 参与
- IT
- 它的
- JPG
- 判断
- 类
- 语言
- 大
- 让
- 喜欢
- 极限
- 清单
- LLM
- 许多
- 可能..
- 意味着
- 成员
- 方法
- 研究方法
- 模型
- 模型
- 道德
- 更多
- 许多
- 必须
- 联合国
- 需要
- 小说
- 十一月
- of
- on
- 一
- 意见
- or
- 其他名称
- 输出
- 跑赢
- 产量
- 输出
- 克服
- 合作
- 期
- 地方
- 计划
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 可能
- 帖子
- 潜力
- 过程
- 产品
- 项目
- 国家
- 有疑问吗?
- 有关
- 要求
- 响应
- 导致
- 成果
- 抢劫
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 实现安全
- .
- 系列
- 服务
- 服务
- 具体的
- 学习
- 成功
- 螺纹
- 目标
- 团队
- 技术
- test
- 比
- 这
- 区域
- 世界
- 其
- 他们
- 然后
- 那里。
- Free Introduction
- 那些
- 虽然?
- 威胁
- 始终
- 次
- 至
- Topics
- 向
- 培训
- 熟练
- 产品培训
- 一般
- 无用
- 使用
- 用户
- 用户
- 使用
- 运用
- 折扣值
- 基于价值
- 价值观
- 通过
- 投票
- 是
- we
- 什么是
- 这
- 将
- 也完全不需要
- 世界
- 和风网