英特尔实验室周三展示了其最大的神经拟态计算机,这是一个由 1.15 亿个神经元组成的系统,据称该系统大致类似于猫头鹰的大脑。
但别担心,英特尔还没有重现《辐射》 机器人大脑。英特尔的 Hala Point 不是有机神经元和突触网络,而是在硅中模拟它们。
在大约 20 W 的功率下,我们的大脑在处理任何给定时刻从各种感官流入的大量信息时效率惊人。英特尔和 IBM 在过去几年中一直在探索神经形态领域,旨在模拟大脑的神经元和突触网络,以构建能够比传统加速器更有效地处理信息的计算机。
效率如何?据英特尔介绍,其最新系统是一个大约相当于微波炉大小、功耗为 6 W 的 2,600U 盒子,据称可以在 15 位精度下实现高达 8 TOPS/W 的深度神经网络效率。从这个角度来看,Nvidia 最强大的系统,基于 Blackwell 的 GB200 NVL72,甚至还没有发货, 管理 INT6 时仅为 8 TOPS/W,而其当前的 DGX H100 系统可以管理约 3.1 TOPS/W。
这一性能是通过 1,152 个英特尔 Loihi 2 处理器实现的,这些处理器拼接在一个三维网格中,总共有 1.15 亿个神经元、128 亿个突触、140,544 个处理核心和 2,300 个嵌入式 x86 核心,用于处理所需的辅助计算。让事情继续前进。
需要明确的是,这些不是典型的 x86 核心。 “它们是非常非常简单的小型 x86 内核。它们与我们最新的核心或 Atom 处理器完全不同。”英特尔神经拟态计算总监 Mike Davies 说道。 注册.
如果 Loihi 2 响起铃声,那是因为该芯片已被 敲打 早在 2021 年,它就作为首批使用英特尔 7 纳米工艺技术生产的芯片之一首次亮相。
尽管年代久远,英特尔表示,基于 Loihi 的系统能够解决某些人工智能推理和优化问题,速度比传统 CPU 和 GPU 架构快 50 倍,同时功耗降低 100 倍。这些数字似乎是 实现 [PDF] 将单个 Loihi 2 芯片与 Nvidia 的微型 Jetson Orin Nano 和 Core i9 i9-7920X CPU 进行比较。
先别扔掉你的 GPU
虽然这听起来令人印象深刻,但 Davies 承认,其神经拟态加速器尚未准备好在所有工作负载上取代 GPU。 “无论如何,这都不是通用人工智能加速器,”他说。
其一,可以说是人工智能最受欢迎的应用程序,为 ChatGPT 等应用程序提供支持的大型语言模型 (LLM),不会在 Hala Point 上运行,至少目前还不会。
“目前我们不会将任何法学硕士映射到 Hala Point。我们不知道该怎么做。坦率地说,神经形态研究领域并没有神经形态版本的变压器。”戴维斯说,并指出目前有一些关于如何实现这一目标的有趣研究。
话虽如此,戴维斯的团队已经在 Hala Point 上成功运行了传统的深度神经网络(一种多层感知器),但也有一些注意事项。
“如果你能够稀疏网络活动和网络中的电导率,那么你就能获得真正非常大的收益,”他说。 “这意味着它必须处理连续的输入信号……视频流或音频流,样本之间存在某种相关性。”
英特尔实验室在论文中展示了 Loihi 2 在视频和音频处理方面的潜力 出版 [PDF] 去年年底。在测试中他们发现,与传统架构相比,该芯片在能源效率、延迟和信号处理吞吐量方面取得了显着提升,有时超过了三个数量级。然而,最大的收益确实是以较低的准确性为代价的。
以低功耗和低延迟处理实时数据的能力使该技术对自动驾驶汽车、无人机和机器人等应用具有吸引力。
另一个有希望的用例是组合优化问题,例如必须在繁忙的市中心行驶的送货车辆的路线规划。
这些工作负载的解决起来极其复杂,因为必须即时考虑车速、事故和车道封闭等微小变化。传统的计算架构不太适合这种指数级的复杂性,这就是为什么我们看到如此多的量子计算供应商 瞄准 优化问题。
然而,戴维斯认为,英特尔的神经拟态计算平台“比其他实验研究替代方案成熟得多”。
成长空间
戴维斯表示,还有很大的空间有待释放。 “我很遗憾地说,由于软件限制,它至今还没有得到充分利用,”他在谈到 Loihi 2 芯片时说道。
识别硬件瓶颈和软件优化是英特尔实验室在桑迪亚部署原型的部分原因。
“了解这些限制,特别是在硬件层面,是让这些系统投入使用的一个非常重要的部分,”戴维斯说。 “我们可以解决硬件问题,我们可以改进它,但我们需要知道优化的方向。”
这并不是桑迪亚的研究人员第一次接触英特尔的神经拟态技术。在一篇论文中 出版 2022 年初,研究人员发现该技术具有 HPC 和 AI 潜力。然而,这些实验使用了英特尔的第一代 Loihi 芯片,该芯片的神经元数量大约是其后继芯片的八分之一(128,000 个对 1 万个)。 ®
- :具有
- :是
- :不是
- :在哪里
- 000
- 1
- 100x
- 140
- 15%
- 152
- 20
- 2021
- 2022
- 300
- 600
- 7
- a
- 对,能力--
- 关于
- 加速器
- 加速器
- 事故
- 根据
- 占
- 实现
- 活动
- 年龄
- AI
- 目标
- 所有类型
- 沿
- 还
- 替代品
- an
- 和
- 任何
- 什么
- 出现
- 应用领域
- 应用领域
- 应用
- 架构
- 保健
- 竞技场
- 按理说
- 主张
- AS
- At
- 原子
- 吸引力
- 音频
- 自主性
- 自主车辆
- 背部
- BE
- 因为
- 很
- 钟
- 大
- 亿
- 边界
- 瓶颈
- 盒子
- 大脑
- 建立
- 忙碌
- 但是
- by
- CAN
- 能力
- 案件
- Center
- 一定
- 更改
- ChatGPT
- 芯片
- 碎屑
- 城市
- 清除
- 点击
- CO
- 如何
- 相比
- 复杂
- 复杂
- 计算
- 一台
- 电脑
- 计算
- 消费
- 连续
- 常规
- 核心
- 相关
- 电流
- data
- 天
- 首次亮相
- 深
- 交货
- 证明
- 部署
- DID
- 方向
- 副总经理
- do
- 母鹿
- 不
- 不
- 无人机电调
- 每
- 早
- 效率
- 效率
- 高效
- 有效
- 八年级
- 嵌入式
- 能源
- 特别
- 甚至
- 所有的
- 超额
- 试验
- 实验
- 剥削
- 探索
- 指数
- 余波
- 远
- 快
- 少数
- 部分
- 姓氏:
- 第一次
- 固定
- 针对
- 发现
- 止
- 充分
- 收益
- 一般用途
- 越来越
- 特定
- GPU
- 图形处理器
- 格
- 民政事务总署
- 处理
- 手
- 硬件
- 有
- 有
- he
- 净空
- 高
- 创新中心
- How To
- 但是
- HPC
- HTTPS
- i
- IBM
- if
- 重要
- 有声有色
- 改善
- in
- 令人难以置信
- 信息
- 输入
- 代替
- 英特尔
- 有趣
- 成
- 问题
- IT
- 它的
- JPG
- 只是
- 保持
- 类
- 知道
- 实验室
- 车道
- 语言
- 大
- 最大
- 名:
- 去年
- 晚了
- 潜伏
- 最新
- 最少
- 减
- Level
- 喜欢
- 限制
- LLM
- 低
- 降低
- 制成
- 管理
- 许多
- 制图
- 成熟
- 手段
- 可能
- 麦克风
- 百万
- 模型
- 时刻
- 更多
- 最先进的
- 最受欢迎的产品
- 许多
- 纳米
- National
- 导航
- 必要
- 需求
- 网络
- 网络
- 神经
- 神经网络
- 神经网络
- 神经形态计算
- 神经元
- 注意
- 现在
- 数字
- Nvidia公司
- of
- on
- 一
- 优化
- 优化
- 优化
- or
- 订单
- 有机
- 其他名称
- 我们的
- 输出
- 纸类
- 部分
- 过去
- 性能
- 透视
- 规划行程
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 大量
- 点
- 热门
- 潜力
- 功率
- 强大
- 供电
- 平台精度
- 问题
- 过程
- 处理
- 处理器
- 生成
- 承诺
- 原型
- 放
- 量子
- 量子计算
- 相当
- RE
- 准备
- 实时的
- 实时数据
- 真
- 原因
- 更换
- 据说
- 研究
- 研究人员
- 揭密
- 机器人
- περίπου
- 路线
- 运行
- 运行
- s
- 说
- 样品
- 对工资盗窃
- 说
- 看到
- 船
- 如图
- 信号
- 显著
- 硅
- 简易
- 单
- 尺寸
- 小
- So
- 软件
- 解决
- 解决
- 一些
- 东西
- 有时
- 听起来
- 速度
- 花费
- 仍
- 流
- 流
- 成功
- 合适的
- 出奇
- 突触
- 系统
- 产品
- 采取
- 需要
- 团队
- 科技
- 测试
- 比
- 这
- 其
- 他们
- 那里。
- 博曼
- 他们
- 事
- Free Introduction
- 那些
- 三
- 三维
- 吞吐量
- 扔
- 次
- 至
- 一起
- 告诉
- 合计
- 传统
- 变压器
- 普遍
- 理解
- 解锁
- 使用
- 用例
- 用过的
- 运用
- Ve
- 汽车
- 车辆
- 厂商
- 版本
- 非常
- 视频
- vs
- W
- we
- 周三
- 井
- 什么是
- ,尤其是
- 这
- 而
- 为什么
- 韩元
- 担心
- 止跌
- 年
- 年
- 但
- 完全
- 您一站式解决方案
- 和风网