在一项开创性研究中,北卡罗来纳大学教堂山分校的一个团队揭示了 OpenAI 的 ChatGPT 和 Google 的 Bard 等大型语言模型 (LLM) 中数据保留的紧迫问题。
尽管尝试删除,这些人工智能模型的复杂性仍在继续出现 敏感数据,引发一场关于信息安全和人工智能伦理的激烈对话。
“不可删除”的数据难题
研究人员着手调查如何消除法学硕士中的敏感信息。 然而,他们偶然发现了一个启示。 删除此类数据非常困难,但验证删除也同样面临挑战。 一旦接受了广泛的数据集训练,这些人工智能庞然大物就将数据隐藏在复杂的参数和权重迷宫中。
当这种困境变得不祥时 AI模型 无意中泄露敏感数据,例如个人标识符或财务记录,可能为恶意用途奠定基础。
研究人员发现像 ChatGPT 这样的法学硕士即使在“删除”数据后也会输出敏感数据 – https://t.co/P5QG8eGxwE
— ⚡️收藏家约翰⚡️ (@JohnTheCollectr) 2023 年 10 月 2 日
而且,问题的核心在于这些模型的设计蓝图。 初步阶段包括对庞大数据库进行培训并进行微调,以确保输出的一致性。 GPT 中封装的术语“生成式预训练 Transformer”让我们可以一睹这一机制。
北卡罗来纳大学的学者们阐述了一个假设场景,即拥有大量敏感银行数据的法学硕士成为潜在威胁。 人工智能开发人员采用的现代护栏不足以缓解这种担忧。
这些保护措施,例如硬编码提示或称为人类反馈强化学习 (RLHF) 的范式,在遏制不良输出方面发挥着至关重要的作用。 然而,他们仍然将数据隐藏在模型的深渊中,只需重新措辞提示即可调用。
弥合安全差距
尽管部署了最先进的模型编辑方法(例如一级模型编辑),北卡罗来纳大学团队发现仍然可以访问大量事实信息。 他们的研究结果显示,通过白盒和黑盒攻击,事实可以分别在 38% 和 29% 的情况下复活。
在他们的探索中,研究人员使用了一种称为 GPT-J 的模型。 它拥有 6 亿个参数,与庞大的 GPT-3.5 相比简直是小巫见大巫。 ChatGPT 的基本模型 具有 170 亿个参数。 这种鲜明的对比暗示了从无根据的数据中清理 GPT-3.5 等大型模型所面临的巨大挑战。
此外,北卡罗来纳大学的学者们制定了新的防御方法,以保护法学硕士免受特定的“提取攻击”。 这些邪恶的计划利用模型的护栏来窃取敏感数据。 尽管如此,该论文还是不祥地暗示了一场永恒的猫捉老鼠的游戏,防御策略将永远追赶不断发展的进攻策略。
微软授权核心团队支持人工智能
与此相关的是,人工智能领域的蓬勃发展推动了微软等科技巨头冒险进入未知领域。 微软最近组建了一个核电团队来支持人工智能计划,这突显了人工智能和能源资源不断增长的需求以及相互交织的未来。 随着人工智能模型的发展,它们对能源的需求不断增长,为满足这种不断增长的需求的创新解决方案铺平了道路。
微软将组建核电团队支持人工智能:报告https://t.co/OvAGclfMnt#News #crypto #Bitcoin #机器学习 #微软 #新闻 #技术 https://t.co/OvAGclfMnt
— 加密突发新闻:最新加密和比特币新闻 (@CryptoBreakNews) 2023 年 10 月 1 日
关于法学硕士中数据保留和删除的讨论超越了学术走廊。 它需要进行彻底的检查和全行业的对话,以建立一个强大的框架,确保数据安全,同时培育人工智能的增长和潜力。
北卡罗来纳大学研究人员的这一尝试是朝着理解并最终解决“不可删除”数据问题迈出的重大一步,距离使人工智能成为数字时代更安全的工具又近了一步。
- :具有
- :是
- :在哪里
- 1
- 7
- a
- 学者
- 无障碍
- 后
- 年龄
- AI
- AI模型
- an
- 和
- 食欲
- 围绕
- AS
- At
- 攻击
- 尝试
- 银行业
- BE
- 成为
- 很
- 巨兽
- 亿
- 比特币
- 比特币新闻
- 蓝图
- 加强
- 破坏
- 突发新闻
- 新兴
- 但是
- by
- 喵星人
- 挑战
- 追逐
- ChatGPT
- 接近
- 相干
- 相比
- 复杂
- 关心
- 现代的
- 继续
- 对比
- 谈话
- 核心
- 可以
- 精雕细琢
- 加密
- 遏制
- data
- 数据安全
- 数据库
- 数据集
- 国防
- 防卫
- 代表
- 需求
- 需求
- 部署
- 设计
- 开发
- 对话
- 数字
- 数字时代
- 论述
- 发现
- 开始
- 就业
- 封装
- 能源
- 确保
- 确保
- 等于
- 伦理
- 甚至
- 终于
- 发展
- 演变
- 膨胀
- 利用
- 正确
- 秋季
- 反馈
- 金融
- 找到最适合您的地方
- 发现
- 鱼
- 针对
- 永远
- 申请
- 训练
- 培育
- 骨架
- 止
- 未来
- 游戏
- 一瞥
- 谷歌的
- 基础
- 成长
- 事业发展
- 海港
- 有
- 提示
- 但是
- HTTPS
- 人
- 身份标识
- in
- 不经意间
- 信息
- 信息安全
- 项目
- 创新
- 交织
- 成
- 错综复杂
- 调查
- 问题
- IT
- 它的
- 已知
- 语言
- 大
- 大
- 最新
- 泄漏
- 学习
- 离开
- 光
- 喜欢
- LLM
- 制作
- 措施
- 机制
- 聚体
- 方法
- 微软
- 模型
- 模型
- 纪念
- 全新
- 消息
- 北
- 北卡罗来纳州
- 核
- 核电
- 培育
- of
- 进攻
- 优惠精选
- on
- 一旦
- or
- 输出
- 产量
- 纸类
- 范例
- 参数
- 铺路
- 永久
- 执着地
- 个人
- 相
- 创举
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 播放
- 构成
- 潜力
- 可能
- 功率
- 紧迫
- 市场问题
- 推进的
- 保护
- 探索
- 准备
- 境界
- 最近
- 记录
- 有关
- 保持
- 研究人员
- 资源
- 分别
- 保留
- 揭密
- 启示
- 健壮
- 角色
- 更安全
- 脚本
- 方案
- 学者
- 保安
- 敏感
- 严重
- 棚
- Shield
- 短
- 显著
- 解决方案
- 解决
- 具体的
- 与之形成鲜明
- 国家的最先进的
- 步
- 仍
- 策略
- 步幅
- 学习
- 大量
- 这样
- SUPPORT
- 策略
- 团队
- 科技
- 术语
- 领土
- 这
- 其
- 博曼
- 他们
- Free Introduction
- 威胁
- 通过
- 次
- 至
- 工具
- 向
- 熟练
- 产品培训
- 超越
- 变压器
- true
- 原来
- 未知
- 下划线
- 理解
- 大学
- 上
- 使用
- 利用
- 广阔
- 冒险
- 验证
- 重要
- 方法..
- ,尤其是
- 而
- 中
- 将
- 和风网