以太网的进步将终结 InfiniBand 在人工智能网络中的领先地位

以太网的进步将终结 InfiniBand 在人工智能网络中的领先地位

以太网的进步将结束 InfiniBand 在 AI 网络柏拉图区块链数据智能领域的领先地位。垂直搜索。人工智能。

以太网标准即将进行的三项改进将使其成为托管人工智能工作负载的更好替代方案,这将使供应商支持该技术作为 Nvidia InfiniBand 套件的替代品,后者将在未来两年占据主导地位。

这是分析公司 Gartner 在本周发表的一篇题​​为“新兴技术:生成人工智能网络的主要趋势”的文章中的观点。该论文由 Gartner 新兴技术和趋势小组成员、总监分析师 Anushree Verma 撰写,预计到 25 年,供应商和云等技术提供商对 InfiniBand 的采用率将达到 2026% 左右,并保持这一水平。

以太网将在当年被提供商实现相同的采用率,然后在十年内加速到超过百分之八十的提供商提供以太网的程度。

技术提供商的这一转变意味着,到 2028 年,45% 的新一代人工智能工作负载将在以太网上运行,而目前这一比例还不到 20%。

由于以太网正在改进,这种转变将会到来。 Gartner 目前将其评为人工智能培训“不理想”,但 Verma 强调了三项创新,她认为这将使以太网成为 InfiniBand 的有力竞争者,甚至是更出色的竞争者:

  • 基于融合以太网的 RDMA (RoCE) – 将允许通过以太网在设备之间直接进行内存访问,从而提高性能并降低 CPU 利用率;
  • 无损以太网——将带来先进的流量控制、改进的拥塞处理、散列改进、缓冲和先进的流量遥测,从而提高现代交换机的功能;
  • 超以太网联盟 (UEC) 2024 年规范 – 专门为使以太网 AI 做好准备而设计。

由于以太网是开放的,Verma 预计许多供应商将实施上述三项创新,为买家提供选择并创造竞争。

相比之下,InfiniBand 比以太网更昂贵,并且这种情况将持续五年。 Verna 认为它“具有可扩展性限制,并且需要特殊技能来管理”,这意味着一些网络设计人员会避免使用它,以防它变得难以管理的复杂性。

尽管如此,她预计 30% 的生成式 AI 工作负载将在 InfiniBand 上运行,而目前这一比例还不到 20%。

与用于承载生成人工智能流量的网络中光学互连的兴起相比,这一增长相形见绌。 Verna 发现,目前用于人工智能工作负载的网络中只有不到 25% 采用互连技术,但预测到 2030 年这一比例将上升至 XNUMX%。

她警告说,虽然该技术拥有英特尔、台积电和 HPE 等大力支持,但它要到 2028 年左右才会得到广泛使用。一旦成熟,用户可以期望它将计算集群的可扩展性提高到 100Tbit/秒以上,同时也比电气开关需要更少的功率。

PCIe 也在兴起,当与使用 PCIe 的服务器配合使用 CXL 规范跨总线共享内存时,Gartner 预计两者都将在 AI 工作负载中流行。

Verna 再次预测,普及还需要几年时间:CXL 于 2023 年初首次亮相,她认为大规模采用将在 2026 年开始,同时她预计 PCIe 6.0 的实施将会加速。

Verna 建议用户“评估早期采用机会,通过在设计阶段与领先技术提供商建立合作伙伴关系来获得竞争优势”,并确保他们了解上述技术。

对于那些考虑 InfiniBand 的人,她写道,有必要“通过评估基于 InfiniBand 的交换机与基于超以太网的交换机,重新评估网络选择的性能、可靠性、可扩展性和价格。” ®

时间戳记:

更多来自 注册