使用中途生成
NeurIPS 2023 会议于 10 月 16 日至 XNUMX 日在充满活力的新奥尔良市举行,特别强调了生成式人工智能和大型语言模型 (LLM)。鉴于该领域最近取得的突破性进展,这些主题主导讨论也就不足为奇了。
今年会议的核心主题之一是寻求更高效的人工智能系统。研究人员和开发人员正在积极寻找构建人工智能的方法,不仅比目前的法学硕士学习速度更快,而且在消耗更少的计算资源的同时拥有增强的推理能力。这种追求对于实现通用人工智能 (AGI) 至关重要,这一目标在可预见的未来似乎越来越容易实现。
NeurIPS 2023 的受邀演讲反映了这些动态且快速发展的兴趣。来自人工智能研究各个领域的演讲者分享了他们的最新成果,为了解人工智能前沿发展提供了一个窗口。在本文中,我们深入研究这些演讲,提取并讨论关键要点和经验教训,这对于理解人工智能创新的当前和未来前景至关重要。
NextGenAI:扩展的错觉和生成人工智能的未来
In 他的谈话,慕尼黑路德维希马克西米利安大学计算机视觉与学习小组负责人 Björn Ommer 分享了他的实验室如何开发稳定扩散、他们从这个过程中学到的一些经验教训以及最近的进展,包括我们如何将扩散模型与流匹配、检索增强和 LoRA 近似等。
关键外包:
- 在生成式人工智能时代,我们从关注视觉模型中的感知(即对象识别)转向预测缺失的部分(例如,使用扩散模型生成图像和视频)。
- 20 年来,计算机视觉一直专注于基准研究,这有助于关注最突出的问题。在生成式人工智能中,我们没有任何可以优化的基准,这为每个人朝着自己的方向发展打开了空间。
- 扩散模型通过基于分数、稳定的训练过程和高效的样本编辑结合了以前的生成模型的优点,但由于马尔可夫链较长,因此价格昂贵。
- 强似然模型面临的挑战是,大多数比特都涉及人眼几乎无法感知的细节,而编码最重要的语义只需要几个比特。仅靠扩展并不能解决这个问题,因为计算资源需求的增长速度比 GPU 供应的增长速度快 9 倍。
- 建议的解决方案是结合扩散模型和卷积网络的优点,特别是卷积表示局部细节的效率和扩散模型对于远程上下文的表达能力。
- Björn Ommer 还建议使用流量匹配方法来从小型潜在扩散模型合成高分辨率图像。
- 提高图像合成效率的另一种方法是专注于场景合成,同时使用检索增强来填充细节。
- 最后,他介绍了用于受控随机视频合成的 iPoke 方法。
如果这些深入的内容对您有用, 订阅我们的 AI 邮件列表 当我们发布新材料时被提醒。
负责任的人工智能的多面性
In 她的演讲谷歌研究院的研究科学家 Lora Aroyo 强调了传统机器学习方法的一个关键局限性:它们依赖于将数据作为正面或负面示例进行二元分类。她认为,这种过度简单化忽视了现实世界场景和内容固有的复杂主观性。通过各种用例,阿罗约展示了内容的模糊性和人类观点的自然差异如何常常导致不可避免的分歧。她强调将这些分歧视为有意义的信号而不是噪音的重要性。
以下是此次演讲的要点:
- 人类劳动者之间的分歧可能会富有成效。洛拉·阿罗约(Lora Aroyo)没有将所有回答视为正确或错误,而是引入了“分歧真理”,这是一种通过利用评估者分歧来评估数据可靠性的分布真理方法。
- 即使对于专家来说,数据质量也很困难,因为专家和大众劳动者一样意见不一。这些分歧可能比单个专家的回答提供更多信息。
- 在安全评估任务中,专家们对 40% 的例子意见不一。我们需要收集更多这样的例子并利用它们来改进模型和评估指标,而不是试图解决这些分歧。
- Lora Aroyo 也展示了他们的 安全与多样性 根据数据内容和注释者来检查数据的方法。
- 该方法生成了一个基准数据集,其中不同人口统计群体的评级者(总共 2.5 万个评级)的 LLM 安全判断存在差异。
- 对于 20% 的对话,很难确定聊天机器人的响应是安全还是不安全,因为将其标记为安全或不安全的受访者数量大致相同。
- 评估者和数据的多样性在评估模型中起着至关重要的作用。未能承认广泛的人类观点和内容中存在的模糊性可能会阻碍机器学习性能与现实世界期望的一致性。
- 80% 的人工智能安全工作已经相当不错,但剩下的 20% 需要加倍努力来解决边缘情况和无限多样性空间中的所有变体。
一致性统计、自我生成的经验以及为什么年轻人比当前的人工智能聪明得多
In 她的谈话印第安纳大学伯明顿分校杰出教授 Linda Smith 探讨了婴幼儿学习过程中的数据稀疏性这一主题。她特别关注对象识别和名称学习,深入研究婴儿自我生成经验的统计数据如何为数据稀疏的挑战提供潜在的解决方案。
关键外包:
- 到三岁时,孩子们就已经具备了在各个领域一次性学习的能力。在四岁生日前不到 16,000 个小时的醒着时间里,他们成功地学习了 1,000 多种物体类别,掌握了母语的语法,并吸收了周围环境的文化和社会细微差别。
- 琳达·史密斯博士和她的团队发现了人类学习的三个原则,可以让孩子们从如此稀疏的数据中捕捉到如此多的信息:
- 学习者控制输入,每时每刻都在塑造和构建输入。例如,在生命的最初几个月,婴儿倾向于更多地观察具有简单边缘的物体。
- 由于婴儿的知识和能力不断发展,因此他们遵循的课程受到高度限制。他们接触到的数据是以极其重要的方式组织的。例如,4个月以下的婴儿看脸的时间最多,每小时大约15分钟,而12个月以上的婴儿主要关注手,每小时观察手的时间约为20分钟。
- 学习片段由一系列相互关联的经历组成。空间和时间的相关性创造了连贯性,这反过来又促进了对一次性事件的持久记忆的形成。例如,当随机呈现各种玩具时,孩子们通常会关注一些“最喜欢”的玩具。他们使用重复的模式来玩这些玩具,这有助于更快地学习物体。
- 瞬时(工作)记忆比感觉输入持续的时间更长。增强学习过程的属性包括多模态、关联、预测关系和过去记忆的激活。
- 为了快速学习,您需要生成数据的机制和学习机制之间的联盟。
草图绘制:核心工具、学习增强和自适应鲁棒性
Jelani Nelson,加州大学伯克利分校电气工程和计算机科学教授, 引入了数据“草图”的概念 – 数据集的内存压缩表示,仍然可以回答有用的查询。尽管演讲的技术性很强,但它很好地概述了一些基本的绘图工具,包括最新的进展。
要点:
- CountSketch 是核心绘图工具,于 2002 年首次推出,旨在解决“重击者”问题,报告给定项目流中最常见项目的一小部分列表。 CountSketch 是第一个用于此目的的已知次线性算法。
- 重量级的两个非流媒体应用程序包括:
- 基于内点的方法 (IPM),为线性规划提供渐近最快的已知算法。
- HyperAttention 方法解决了法学硕士中使用的长上下文日益复杂所带来的计算挑战。
- 最近的许多工作都集中在设计对自适应交互具有鲁棒性的草图。主要思想是利用自适应数据分析的见解。
超越缩放面板
本篇 关于大型语言模型的精彩小组 会议由康奈尔理工大学副教授、Hugging Face 研究员 Alexander Rush 主持。其他参与者包括:
- Aakanksha Chowdhery – Google DeepMind 研究科学家,研究兴趣包括系统、LLM 预训练和多模态。她是开发 PaLM、Gemini 和 Pathways 的团队的一员。
- Angela Fan – Meta Generative AI 研究科学家,研究兴趣包括对齐、数据中心和多语言。她参与了Llama-2和Meta AI Assistant的开发。
- Percy Liang – 斯坦福大学教授,研究创造者、开源和生成代理。他是斯坦福大学基础模型研究中心(CRFM)的主任,也是Together AI的创始人。
讨论集中在四个关键主题:(1) 架构和工程,(2) 数据和对齐,(3) 评估和透明度,以及 (4) 创建者和贡献者。
以下是该小组的一些要点:
- 训练当前的语言模型本质上并不困难。训练像 Llama-2-7b 这样的模型的主要挑战在于基础设施要求以及多个 GPU、数据中心等之间协调的需要。但是,如果参数数量足够小以允许在单个 GPU 上进行训练,即使是本科生也能做到。
- 虽然自回归模型通常用于文本生成,扩散模型通常用于生成图像和视频,但已经进行了反转这些方法的实验。具体来说,在 Gemini 项目中,利用自回归模型来生成图像。也有人探索使用扩散模型来生成文本,但这些尚未被证明足够有效。
- 鉴于用于训练模型的英语数据有限,研究人员正在探索替代方法。一种可能性是结合文本、视频、图像和音频来训练多模态模型,期望从这些替代模态中学到的技能可以转移到文本中。另一种选择是使用合成数据。值得注意的是,合成数据经常混合到真实数据中,但这种整合不是随机的。在线发布的文本通常会经过人工管理和编辑,这可能会为模型训练增加额外的价值。
- 开放基础模型通常被认为有利于创新,但可能对人工智能安全有害,因为它们可能被恶意行为者利用。然而,梁珀西博士认为,开放模型也对安全做出了积极贡献。他认为,通过易于访问,它们为更多研究人员提供了进行人工智能安全研究并审查模型是否存在潜在漏洞的机会。
- 与五年前相比,如今,注释数据需要更多注释领域的专业知识。然而,如果人工智能助手未来的表现符合预期,我们将从用户那里收到更多有价值的反馈数据,从而减少对注释者大量数据的依赖。
基础模型系统和系统基础模型
In 这个演讲斯坦福大学计算机科学系副教授 Christopher Ré 展示了基础模型如何改变我们构建的系统。他还探讨了如何有效地构建基础模型,借鉴数据库系统研究的见解,并讨论了比 Transformer 更高效的基础模型架构。
以下是本次演讲的主要内容:
- 基础模型可以有效解决“1000 次削减导致死亡”的问题,其中每个单独的任务可能相对简单,但任务的广度和多样性带来了重大挑战。数据清理问题就是一个很好的例子,法学硕士现在可以帮助更有效地解决这个问题。
- 随着加速器变得越来越快,内存常常成为瓶颈。这是数据库研究人员几十年来一直在解决的问题,我们可以采用他们的一些策略。例如,Flash Attention 方法通过阻塞和积极融合来最小化输入输出流:每当我们访问一条信息时,我们都会对其执行尽可能多的操作。
- 有一种新的架构,植根于信号处理,可能比 Transformer 模型更有效,特别是在处理长序列方面。信号处理提供稳定性和效率,为 S4 等创新模型奠定基础。
数字健康干预中的在线强化学习
In 她的谈话哈佛大学统计与计算机科学教授 Susan Murphy 分享了他们在开发用于数字健康干预的在线 RL 算法时面临的一些挑战的第一个解决方案。
以下是演讲中的一些要点:
- Susan Murphy 博士讨论了她一直在从事的两个项目:
- HeartStep,根据智能手机和可穿戴追踪器的数据建议活动,以及
- 用于口腔健康指导的 Oralytics,其中干预措施基于从电子牙刷收到的参与数据。
- 在为人工智能代理制定行为策略时,研究人员必须确保它是自主的,并且可以在更广泛的医疗保健系统中可行地实施。这需要确保个人参与所需的时间是合理的,并且建议的行动在道德上是合理的,在科学上也是合理的。
- 开发用于数字健康干预的 RL 代理的主要挑战包括处理高噪声水平,因为人们过着自己的生活,即使他们愿意,也可能并不总是能够响应消息,以及管理强烈的、延迟的负面影响。
如您所见,NeurIPS 2023 让我们对人工智能的未来有了启发性的了解。受邀演讲强调了更高效、资源意识型模型的趋势以及对超越传统范式的新颖架构的探索。
喜欢这篇文章吗? 注册以获取更多AI研究更新。
当我们发布更多像这样的摘要文章时,我们会通知您。
相关
- :具有
- :是
- :不是
- :在哪里
- $UP
- 000
- 1
- 10
- 10日
- 11
- 12
- 12个月
- 125
- 13
- 14
- 15%
- 154
- 16
- 16日
- 17
- 20
- 20 年
- 2023
- 32
- 35%
- 41
- 58
- 7
- 70
- 710
- 8
- 9
- a
- 对,能力--
- Able
- 关于
- 加速器
- ACCESS
- 无障碍
- 成就
- 实现
- 承认
- 横过
- 行动
- 活化
- 积极地
- 活动
- 演员
- 自适应
- 加
- 额外
- 地址
- 地址
- 解决
- 采用
- 进步
- 优点
- 年龄
- 经纪人
- 中介代理
- 侵略性
- 德盛
- 前
- AI
- AI助手
- 研究
- 人工智能系统
- 艾滋病
- 亚历山大
- 算法
- 算法
- 对准
- 所有类型
- 联盟
- 让
- 单
- 已经
- 还
- 替代
- 尽管
- 时刻
- 歧义
- 其中
- an
- 分析
- 和
- 另一个
- 任何
- 应用领域
- 的途径
- 方法
- 约
- 保健
- 争论
- 主张
- 刊文
- 刊文
- 人造的
- 人工智能
- AS
- 评估
- 助理
- 助理
- 律师
- 协会
- 品种
- At
- 达到
- 关注我们
- 音频
- 自主性
- 可用性
- 基于
- BE
- 因为
- 成为
- 很
- 行为
- 作为
- 基准
- 基准
- 有利
- 伯克利
- 之间
- 超越
- 混合
- 混纺
- 闭塞
- 借贷
- 都
- 宽度
- 更广泛
- 建立
- 但是
- by
- 来了
- CAN
- 能力
- 捕获
- 例
- 类别
- Center
- 中心
- 链
- 挑战
- 挑战
- 变
- 聊天机器人
- 儿童
- 克里斯托弗
- 城市
- 程
- 清洁
- 教练
- 收集
- 组合
- 结合
- 相比
- 复杂
- 复杂
- 写作
- 计算
- 一台
- 计算机科学
- 计算机视觉
- 计算
- 概念
- 进行
- 研讨会 首页
- 建设
- 消费
- 内容
- 上下文
- 上下文
- 不断
- 贡献
- 贡献者
- 控制
- 受控
- 对话
- 协调
- 核心
- 康奈尔
- 正确
- 相关
- 可以
- 创建信息图
- 创作者
- 人群
- 关键
- 文化
- 策展
- 电流
- 课程设置
- 前沿
- data
- 数据分析
- 数据中心
- 数据库
- 处理
- 几十年
- 十二月
- 决定
- DeepMind
- 延迟
- 钻研
- 需求
- 需求
- 人口统计学
- 证明
- 问题类型
- 设计
- 细节
- 详情
- 开发
- 发达
- 开发
- 发展
- 研发支持
- 发展
- 难
- 扩散
- 数字
- 数字健康
- 方向
- 副总经理
- 发现
- 讨论
- 讨论
- 讨论
- 讨论
- 杰出的
- 多元化
- 域
- 域名
- 占主导地位
- 别
- 加倍
- dr
- 两
- ,我们将参加
- 动态
- e
- 每
- 边缘
- 有效
- 影响
- 效率
- 高效
- 有效
- 努力
- 工作的影响。
- 或
- 电子
- 出现
- 重点
- 强调
- enable
- 使
- 编码
- 从事
- 订婚
- 工程师
- 提高
- 增强
- 更多
- 确保
- 保证
- 环境
- 等于
- 特别
- 必要
- 等
- 评估
- 评估
- 甚至
- 事件
- 每个人
- 发展
- 演变
- 例子
- 例子
- 优秀
- 期望
- 期望
- 预期
- 昂贵
- 体验
- 体验
- 实验
- 技术专家
- 专门知识
- 专家
- 剥削
- 勘探
- 探讨
- 探讨
- 探索
- 裸露
- 广泛
- 眼
- 面部彩妆
- 面孔
- 功能有助于
- 失败
- 风扇
- 快
- 最快
- 反馈
- 少数
- 少
- 部分
- 填
- 姓氏:
- 五
- Flash
- 流
- 流动
- 专注焦点
- 重点
- 遵循
- 针对
- 可预见的
- 训练
- 基金会
- 创办人
- 四
- 第四
- 频繁
- 频繁
- 止
- 根本
- 聚变
- 未来
- 双子座
- 其他咨询
- 一般情报
- 生成
- 发电
- 代
- 生成的
- 生成式人工智能
- 特定
- 给
- 一瞥
- Go
- 目标
- 非常好
- 谷歌
- GPU
- 图形处理器
- 奠基
- 团队
- 组的
- 成长
- 民政事务总署
- 处理
- 手
- 有害
- 治理
- 哈佛
- 哈佛大学
- 有
- he
- 头
- 健康管理
- 医疗保健
- 重
- 保持
- 帮助
- 帮助
- 这里
- 高
- 高分辨率
- 突出
- 高度
- 阻碍
- 他的
- 小时
- HOURS
- 创新中心
- How To
- 但是
- HTTP
- HTTPS
- 人
- 人类
- i
- 主意
- if
- 照明
- 图片
- 图片
- 实施
- 重要性
- 重要
- 改善
- in
- 深入
- 包括
- 包括
- 包含
- 增加
- 日益
- 个人
- 必然
- 无限
- 信息
- 信息
- 基础设施
- 固有
- 本质
- 創新
- 创新
- 输入
- 可行的洞见
- 例
- 代替
- 积分
- 房源搜索
- 相互作用
- 互联
- 利益
- 干预
- 成
- 介绍
- 邀请
- IT
- 项目
- JPG
- 判断
- 键
- 知道
- 知识
- 已知
- 实验室
- 标签
- 景观
- 语言
- 大
- 持久
- 最新
- 铺设
- 铅
- 领导
- 学习用品
- 知道
- 学习者
- 学习
- 可以学习
- 遗产
- 减
- 教训
- 让
- 各级
- 谎言
- 光
- 喜欢
- 可能性
- 局限性
- 有限
- 琳达
- 清单
- 生活
- LLM
- 本地
- 长
- 不再
- 看
- 寻找
- 机
- 机器学习
- 邮件
- 主要
- 管理
- 管理的
- 许多
- 主
- 匹配
- 材料
- 事项
- 最大宽度
- 可能..
- 有意义的
- 机制
- 回忆
- 内存
- 聚体
- 条未读消息
- 元
- 方法
- 指标
- 可能
- 百万
- 最小化
- 分钟
- 失踪
- 模型
- 模型
- 时刻
- 个月
- 更多
- 更高效
- 最先进的
- 移动
- 许多
- 多
- 必须
- 姓名
- 本地人
- 自然
- 需求
- 负
- 全新
- 新奥尔良
- 没有
- 噪声
- 不包含
- 注意
- 小说
- 现在
- 细微之处
- 数
- 对象
- 对象
- of
- 提供
- 提供
- 优惠精选
- 经常
- 老年人
- on
- 一
- 在线
- 仅由
- 打开
- 开放源码
- 打开
- 运营
- 机会
- 优化
- 附加选项
- or
- 口腔健康
- 举办
- 奥尔良
- 其他名称
- 其他参加者
- 其它
- 我们的
- 超过
- 简介
- 己
- 棕榈
- 面板
- 范式
- 参数
- 部分
- 与会者
- 参加
- 特别
- 尤其
- 部分
- 过去
- 途径
- 模式
- 员工
- 为
- 知觉
- 演出
- 性能
- 观点
- 片
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 似是而非
- 扮演
- 政策
- 构成
- 积极
- 积极
- 拥有
- 可能性
- 可能
- 潜力
- 可能
- 预测
- 当下
- 呈现
- 以前
- 主要
- 小学
- 原则
- 市场问题
- 问题
- 程序
- 过程
- 过程
- 处理
- 生成
- 生产力
- 教授
- 深深
- 代码编程
- 项目
- 项目
- 突出
- 成熟
- 提供
- 提供
- 出版
- 目的
- 追求
- 质量
- 查询
- 探索
- 相当
- 种族
- 随机
- 范围
- 快
- 急速
- 宁
- 评分
- 真实
- 真实的世界
- 合理
- 接收
- 收到
- 最近
- 承认
- 建议
- 减少
- 反射
- 关系
- 相对
- 释放
- 可靠性
- 信赖
- 其余
- 重复的
- 报告
- 表示
- 代表
- 要求
- 必须
- 岗位要求
- 研究
- 研究员
- 研究人员
- 解决
- 资源
- 回应
- 受访者
- 响应
- 回复
- 提供品牌战略规划
- 检讨
- 健壮
- 角色
- 根
- περίπου
- 赶
- 安全
- 实现安全
- 缩放
- 情景
- 现场
- 科学
- 科学
- 科学家
- 看到
- 寻求
- 似乎
- 看到
- 语义
- 系列
- 成型
- 共用的,
- 她
- 作品
- 签署
- 信号
- 信号
- 显著
- 显著
- 简易
- 单
- 技能
- 小
- 聪明
- 智能手机
- So
- 社会
- 方案,
- 解决方案
- 解决
- 一些
- 听起来
- 来源
- 太空
- 空间的
- 特别是
- 花
- 稳定性
- 稳定
- 斯坦福
- 斯坦福大学
- 统计
- 仍
- 策略
- 流
- 优势
- 强烈
- 结构化
- 这样
- 提示
- 概要
- 供应
- 惊
- Susan
- 句法
- 合成
- 合成的
- 综合数据
- 系统
- 产品
- 投资讯息
- 需要
- 谈论
- 会谈
- 任务
- 任务
- 团队
- 科技
- 文案
- 易于
- 条款
- 文本
- 比
- 这
- 未来
- 其
- 他们
- 主题
- 那里。
- 博曼
- 他们
- Free Introduction
- 那些
- 三
- 通过
- 次
- 至
- 一起
- 工具
- 工具
- 热门
- 主题
- Topics
- 合计
- 向
- 跟踪器
- 传统
- 产品培训
- 转让
- 变压器
- 用户评论透明
- 治疗
- 趋势
- 真相
- 试图
- 转
- 二
- 一般
- 下
- 经历
- 理解
- 大学
- 最新动态
- 使用
- 用过的
- 用户
- 运用
- 平时
- 利用
- 有价值
- 折扣值
- 各种
- 各个
- 充满活力
- 视频
- 视频
- 观点
- 愿景
- 漏洞
- W3
- 是
- 方法
- we
- 耐磨
- 井
- 为
- 什么是
- ,尤其是
- 每当
- 而
- 是否
- 这
- 而
- WHO
- 为什么
- 宽
- 大范围
- 将
- 窗口
- 希望
- 工作
- 加工
- 错误
- 年
- 但
- 完全
- 年轻
- 和风网