通过集中化助长人工智能火力

由柏拉图重新发布

关注： 0

赞助功能源源不断的革命性技术和发现——火、农业、轮子、印刷机和互联网等等——深刻地塑造了人类的发展和文明。人工智能 (AI) 正在继续这种创新循环。

研究公司 IDC 甚至得出结论，人工智能确实是几乎“一切”的答案。 IDC 数据和分析副总裁 Rasmus Andsbjerg 表示：“现实是，人工智能为我们目前面临的一切提供了解决方案。人工智能可以成为快速数字化转型之旅的源泉，在通货膨胀率惊人的时候节省成本，并在劳动力短缺时支持自动化工作。”

当然，在所有行业和职能中，最终用户组织开始发现人工智能的好处，因为越来越强大的算法和底层基础设施的出现可以实现更好的决策和更高的生产力。

383.3 年，人工智能 (AI) 市场的全球收入总计 2021 亿美元，包括以 AI 为中心和非 AI 为中心的应用程序的相关软件、硬件和服务。这比上一年增长了 20.7%。最近的国际数据公司 (IDC) 全球半年人工智能跟踪器.

同样，将人工智能软件部署到云端继续呈现稳步增长。 IDC 预计新购买的 AI 软件的云版本将在 2022 年超过本地部署。

天空是人工智能的极限

AI 专家 Run:ai 的首席技术官 Ronen Dar 博士为 AI 创建了一个计算管理平台，他认为天空是新兴企业 AI 领域的极限。

“人工智能是我们看到的一个增长非常迅速的市场。在企业方面，我们看到了对机器学习和人工智能的需求和采用。而且我认为现在这里有一项新技术正在带来将改变世界的新功能；这将彻底改变企业，”Dar 指出。

人们也越来越清楚地认识到需要开始探索和试验 AI，并了解如何将 AI 集成到业务模型中。

Dar 认为人工智能可以为改善现有企业业务流程带来“惊人的好处”：“在优化和证明当前业务方面，我们看到了很多围绕人工智能和机器学习的用例，这些用例正在改善运营和决策制定方式围绕供求关系。”

他指出，基于神经网络的新型深度学习模型可以改进流程、决策制定以及金融服务行业欺诈检测等关键业务流程的准确性。医疗保健是人工智能潜力“巨大”的另一个领域，特别是在帮助医生做出更好的临床决策以及帮助发现和开发新药方面。

而且，展望未来，Dar 预测人工智能技术将有助于提供全新的商业机会，这些机会目前在自动驾驶汽车和沉浸式游戏等领域是不存在的。

需要克服的基础设施障碍

尽管 AI 和机器学习在企业中具有明显的潜力，但 Dar 承认 AI 的商业部署受到基础设施供应问题的阻碍。他建议公司首先需要研究人工智能进入组织的方式。

通常，这涉及一个不协调的、逐个部门的流程，不同的团队独立地配置技术和资源，从而导致孤立的部署。 IT 无法有效控制这些临时项目，也无法了解正在发生的事情。这使得计算 AI 基础设施支出的 ROI 变得困难甚至不可能。

“这是一个经典问题：过去是影子 IT，现在是影子 AI，”Dar 说。

此外，AI/ML 所需的最先进基础设施是一项投资，因为企业需要强大的 GPU 加速计算硬件来处理非常复杂的数据和训练模型。

“AI 团队需要大量的计算能力来训练模型，通常使用 GPU，而 GPU 是优质的数据中心资源，可能会被孤立并且无法有效利用，”Dar 说。 “这肯定会导致很多钱被浪费。”

例如，这种孤立的基础设施可能导致利用率水平低于 10%。

根据 Run:ai 民意调查， 2021 年人工智能基础设施状况调查，于 2021 年 87 月发布，12% 的受访者表示他们遇到了某种程度的 GPU/计算资源分配问题，其中 83% 的受访者表示这种情况经常发生。因此，61% 的受访公司表示他们没有充分利用 GPU 和 AI 硬件。事实上，近三分之二 (XNUMX%) 的受访者表示他们的 GPU 和 AI 硬件大多处于“中等”利用率水平。

人工智能的中心化

为了解决这些问题，Dar 提倡集中提供 AI 资源。 Run:AI 开发了一个用于 AI 的计算管理平台，可以集中和虚拟化 GPU 计算资源。通过将 GPU 集中到一个虚拟层中并自动安排工作负载以实现 100% 的利用率，与部门级别的孤立系统相比，这种方法具有优势。

集中化基础架构可以重新获得控制权和可见性，同时将数据科学家从管理基础架构的开销中解放出来。 AI 团队共享一个通用的 AI 计算资源，该资源可以随着需求的增加或减少而动态调高和调低，从而消除需求瓶颈和利用不足的时期。

Dar 认为，这种方法可以帮助组织充分利用他们的硬件，并将数据科学家从底层资源限制的约束中解放出来。所有这些都意味着他们可以运行更多的工作并将更多的人工智能模型投入生产。

伦敦国王学院领导、位于圣托马斯医院的伦敦医学影像与人工智能价值医疗中心提供了一个例子。它使用医学图像和电子医疗保健数据来训练用于计算机视觉和自然语言处理的复杂深度学习算法。这些算法用于创建用于有效筛查、更快诊断和个性化治疗的新工具。

该中心意识到其遗留的 AI 基础设施存在效率问题：GPU 总利用率低于 30%，某些组件处于“显着”闲置期。在通过采用基于 Run:ai 平台的集中式 AI 计算配置模型来解决这些问题后，其 GPU 利用率提高了 110%，同时实验速度和整体研究效率也得到了同步提高。

“我们的实验可能需要几天或几分钟，使用的是一点点计算能力或整个集群，”伦敦国王学院人工智能副教授兼高级讲师兼人工智能中心首席技术官 M. Jorge Cardoso 博士说。 “缩短获得结果的时间确保我们可以提出和回答更多关于人们健康和生活的关键问题，”

集中 AI GPU 资源也为 Wayve 带来了宝贵的商业利益，Wayve 是一家总部位于伦敦的公司，为自动驾驶汽车开发 AI 软件。它的技术旨在不依赖传感，而是专注于更高的智能，以在密集的城市地区实现更好的自动驾驶。

Wayve 的车队学习循环涉及数据收集、管理、模型训练、重新模拟和模型部署到车队之前的许可模型的连续循环。该公司的主要 GPU 计算消耗来自 Fleet Learning Loop 生产培训。它使用完整数据集训练产品基线，并通过车队学习循环的迭代不断重新训练以收集新数据。

该公司开始意识到它正在遭受 GPU 调度“恐怖”的困扰：尽管将近 100% 的可用 GPU 资源分配给了研究人员，但在最初完成测试时只有不到 45% 得到利用。

“由于 GPU 是静态分配给研究人员的，当研究人员不使用分配给他们的 GPU 时，其他人无法访问它们，从而产生一种错觉，即即使许多 GPU 闲置，用于模型训练的 GPU 也已满负荷运转”，Wayve 指出。

与 Run:ai 合作通过消除孤岛和消除资源的静态分配解决了这个问题。创建了共享 GPU 池，允许团队访问更多 GPU 并运行更多工作负载，从而使他们的利用率提高了 35%。

镜像 CPU 效率提升

与近年来 VMware 为服务器 CPU 的最大容量使用方式带来显着效率改进的方式类似，新的创新正在涌现，以优化 AI 计算工作负载的 GPU 使用效率。

“如果你想想在 CPU 上运行的软件堆栈，它是用大量 VMware 和虚拟化构建的，”Dar 解释道。 “GPU 在数据中心中相对较新，而用于人工智能和虚拟化的软件——例如 NVIDIA 人工智能企业 ——也是最近的发展。”

“我们在该领域带来了先进的技术，具有部分 GPU、工作交换等功能。允许工作负载有效地共享 GPU，”Dar 说，并补充说正在计划进一步的增强。

Run:ai 与 NVIDIA 密切合作，以改进和简化 GPU 在企业中的使用。最近的合作包括为在云中使用 GPU 的公司提供多云 GPU 灵活性，以及与 NVIDIA Triton 推理服务器软件来简化在生产中部署模型的过程。

鉴于历史进程中的重大创新对人类和世界产生了深远影响，Dar 指出，需要谨慎利用人工智能的力量，以最大限度地发挥其潜在优势，同时应对潜在劣势。他将人工智能与最原始的创新进行了比较：火。

“它就像火，带来了很多伟大的事物，改变了人类的生活。火灾也带来了危险。所以人类知道如何与火共存，”Dar 说。 “我认为这在人工智能中也是如此。”

由 Run:ai 赞助。

时间戳记： 2022 年 11 月 16 日2022 年 11 月 17 日

英特尔推迟了 Mobileye IPO 再次遭遇减速

源群集：

源节点： 1590950

时间戳记： 2022 年 7 月 11 日

研究人员表示，法学硕士似乎通过类比推理

源群集：

源节点： 1869283

时间戳记： 2023 年 7 月 31 日

招聘广告、Alphabet 衍生品都指向人工智能可持续发展工作

源群集：

源节点： 1959824

时间戳记： 2024 年 3 月 12 日

三星与韩国 IT 巨头 Naver 合作打造 AI 超大规模芯片 PlatoBlockchain 数据智能。垂直搜索。人工智能。

三星、韩国 IT 巨头 Naver 打造 AI 超大规模芯片

源群集：

源节点： 1767787

时间戳记： 2022 年 12 月 6 日

AWS 首次推出生成式 AI 产品，非常聪明，你可能会花两次钱

源群集：

源节点： 1825220

时间戳记： 2023 年 4 月 14 日

印度寻求全球标准来阻止人工智能伤害人类柏拉图区块链数据智能。垂直搜索。人工智能。

印度寻求全球标准来阻止人工智能危害人类

源群集：

源节点： 1761331

时间戳记： 2022 年 11 月 23 日

OpenAI 恢复 ChatGPT 的互联网浏览权限

源群集：

源节点： 1895226

时间戳记： 2023 年 9 月 27 日

Meta 的 Llama 2 未开源

源群集：

源节点： 1863496

时间戳记： 2023 年 7 月 21 日

OpenAI 宣布为企业用户推出 ChatGPT 等级

源群集：

源节点： 1883776

时间戳记： 2023 年 8 月 29 日

英国寻求轻触式 AI 立法，因为行业领导者呼吁 LLM 暂停

源群集：

源节点： 1819929

时间戳记： 2023 年 3 月 29 日

微软将 OpenAI 最新的 DALL-E 3 模型引入 Bing

源群集：

源节点： 1898793

时间戳记： 2023 年 10 月 4 日

管理人员，运气不好，人工智能即将取代你的工作

源群集：

源节点： 1961723

时间戳记： 2024 年 4 月 5 日

用中心化来点燃 AI 之火

由柏拉图重新发布

更多来自注册

英特尔推迟了 Mobileye IPO 再次遭遇减速

研究人员表示，法学硕士似乎通过类比推理

三星、韩国 IT 巨头 Naver 打造 AI 超大规模芯片

AWS 首次推出生成式 AI 产品，非常聪明，你可能会花两次钱

印度寻求全球标准来阻止人工智能危害人类

OpenAI 恢复 ChatGPT 的互联网浏览权限

Meta 的 Llama 2 未开源

英国寻求轻触式 AI 立法，因为行业领导者呼吁 LLM 暂停

微软将 OpenAI 最新的 DALL-E 3 模型引入 Bing

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理

更多来自 注册

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理

更多来自注册