什么是 GPU?推动人工智能繁荣的芯片及其价值数万亿美元的原因

什么是 GPU?推动人工智能繁荣的芯片及其价值数万亿美元的原因

什么是 GPU?推动人工智能繁荣的芯片及其价值数万亿美元柏拉图区块链数据智能。垂直搜索。人工智能。

随着世界争相利用最新一波人工智能技术,一种高科技硬件已成为一种令人惊讶的热门商品:图形处理单元或 GPU。

顶级 GPU 的售价 数万美元,领先厂商Nvidia已经看到了它的市场估值 飙升至2万亿美元大关 随着对其产品的需求激增。

GPU 也不仅仅是高端人工智能产品。手机、笔记本电脑和游戏机中也有功能较弱的 GPU。

现在您可能想知道:GPU 到底是什么?是什么让它们如此特别?

什么是 GPU?

GPU 最初设计的主要目的是快速生成和显示复杂的 3D 场景和对象,例如视频游戏中涉及的场景和对象。 计算机辅助设计 软件。现代 GPU 还可以处理以下任务: 解压 视频流。

大多数计算机的“大脑”是一个称为中央处理单元(CPU)的芯片。 CPU 可用于生成图形场景和解压缩视频,但与 GPU 相比,它们在执行这些任务时通常速度慢得多且效率低。 CPU 更适合一般计算任务,例如文字处理和浏览网页。

GPU 与 CPU 有何不同?

典型的现代 CPU 由 8 到 16 个“颜色,”每个都可以按顺序处理复杂的任务。

另一方面,GPU 拥有数千个相对较小的核心,这些核心被设计为同时(“并行”)工作,以实现快速的整体处理。这使得它们非常适合需要大量简单操作的任务,这些操作可以同时完成,而不是一个接一个地完成。

传统 GPU 有两种主要类型。

首先,有独立芯片,通常出现在大型台式计算机的附加卡中。第二种是将 GPU 与 CPU 组合在同一芯片封装中,这种技术常见于笔记本电脑和 PlayStation 5 等游戏机中。在这两种情况下,CPU 都控制 GPU 的工作。

为什么 GPU 对人工智能如此有用?

事实证明,GPU 的用途不仅仅限于生成图形场景。

背后的许多机器学习技术 人工智能,如 深度神经网络,严重依赖各种形式的矩阵乘法。

这是一种数学运算,其中将非常大的数字集相乘并相加。这些操作非常适合并行处理,因此可以由 GPU 快速执行。

GPU 的下一步是什么?

由于核心数量及其运行速度的增加,GPU 的数字处理能力正在稳步增强。这些改进主要是由以下公司芯片制造的改进推动的: TSMC 在台湾

单个晶体管(任何计算机芯片的基本组件)的尺寸正在减小,从而允许在相同大小的物理空间中放置更多晶体管。

然而,这并不是故事的全部。虽然传统 GPU 对于人工智能相关的计算任务很有用,但它们并不是最优的。

正如 GPU 最初旨在通过提供专门的图形处理来加速计算机一样,也有一些加速器旨在加速机器学习任务。这些加速器通常称为数据中心 GPU。

AMD 和 Nvidia 等公司制造的一些最受欢迎的加速器最初是传统 GPU。随着时间的推移,他们的设计不断发展,以更好地处理各种机器学习任务,例如通过支持更高效的“大脑漂浮” 数字格式。

其他加速器,例如 Google 的 张量处理单元 和 Tentorrent 的 Tensix 核心,是为了加速深度神经网络而从头开始设计的。

数据中心 GPU 和其他 AI 加速器通常比传统 GPU 附加卡配备更多内存,这对于训练大型 AI 模型至关重要。人工智能模型越大,它的能力就越强,也就越准确。

为了进一步加快训练速度并处理更大的 AI 模型(例如 ChatGPT),可以将许多数据中心 GPU 汇集在一起​​形成超级计算机。这需要更复杂的软件来正确利用可用的数字处理能力。另一种方法是 创建一个非常大的加速器, 如那个 ”晶圆级处理器》由 Cerebras 制作。

专用芯片是未来吗?

CPU 也没有停滞不前。 AMD 和 Intel 的最新 CPU 内置了低级指令,可以加速深度神经网络所需的数字运算。这一附加功能主要有助于“推理”任务,即使用已经在其他地方开发的人工智能模型。

为了首先训练人工智能模型,仍然需要大型类似 GPU 的加速器。

可以为特定的机器学习算法创建更专业的加速器。例如,最近一家名为 Groq 的公司生产了一款“语言处理单元” (LPU) 专门为运行类似于 ChatGPT 的大型语言模型而设计。

然而,创建这些专用处理器需要大量的工程资源。历史表明,任何给定的机器学习算法的使用和流行度往往会达到顶峰然后减弱,因此昂贵的专用硬件可能很快就会过时。

然而,对于普通消费者来说,这不太可能成为问题。您使用的产品中的 GPU 和其他芯片可能会悄悄变得更快。

本文重新发表 谈话 根据知识共享许可。 阅读 原创文章.

图片来源: Nvidia公司

时间戳记:

更多来自 奇异枢纽