NEC 推出免费的“FireDucks”软件,用于使用 Python 加速数据分析

NEC 推出免费的“FireDucks”软件,用于使用 Python 加速数据分析

东京,19 年 2023 月 XNUMX 日——(JCN 新闻专线)—— NEC公司 (东京证券交易所代码:6701)今天宣布推出“FireDucks”(1),这是一款免费软件程序,旨在加速表数据分析库“pandas”,该库用于使用世界上使用最广泛的编程语言 Python 进行分析今天。 这款新开发的软件能够以比现有产品快 16 倍 (2) 的速度执行数据分析所需的数据准备,显着缩短数据分析时间并降低计算成本。

FireDucks 的测试版现已在线免费提供(https://fireducks-dev.github.io/).

近年来,收集大量数据变得比以往任何时候都更加容易,包括来自销售点 (POS) 终端的销售数据、电子商务和金融交易数据。 为了从此类数据中提取有价值的分析结果,数据科学家越来越需要使用人工智能 (AI) 和机器学习 (ML) 对其进行分析。

然而,为了准备数据分析,必须首先对大型数据集进行预处理。 据说数据科学家花费了大约 45%(3) 的时间来准备数据,这已成为一个主要问题。 此外,数据量的激增以及人工智能和机器学习的发展导致计算复杂性增加。 因此,更高的计算成本(例如云成本)以及随之而来的功耗和二氧化碳排放量的增加也成为问题。

鉴于此,NEC着手开发FireDucks,这是一款旨在加速pandas的软件程序。 为了开发该软件,NEC 利用了其在三十多年的超级计算机开发经验中积累的高性能编程技术和加速专业知识。

通过向公众免费提供 FireDucks 测试版,NEC 希望为减少数据科学家分析数据的工作时间做出贡献,并通过节约电力和降低二氧化碳排放来解决环境问题。

特征

1. 加速性能FireDucks 能够将使用 pandas 创建的软件程序加速最多 16 倍,平均约五倍(2)。 这将数据科学家花在数据分析上的总时间减少了大约 30%(4)。

所有核心的并行利用和计算量的减少是这种加速水平的主要原因。 FireDucks 利用多核 CPU 的每个核心来高效地并行处理大型数据集。 此外,不是按照程序中指定的相同顺序和范围执行处理,而是预先从整个处理中识别产生结果所需的数据集,这意味着只需要对这些数据集执行处理。 这反过来又可以加速处理。

NEC 推出免费的“FireDucks”软件,用于使用 Python PlatoBlockchain 数据智能加速数据分析。垂直搜索。人工智能。

2.高兼容性

该软件的另一个特点是与pandas的高度兼容性。 虽然某些库能够实现比 pandas 更快的处理速度,但它们需要多个步骤,包括重写程序。 另一方面,FireDucks 可以轻松应用,因为只需重写程序的一行即可执行分析和编码,就像使用 pandas 一样。

实际结果

丰田技术开发公司(5) (TTDC)在实际操作中使用FireDucks时获得了以下结果。

  • 使用内部 AI 框架 (Spicy MINT) 将数据分析时间减少 60%
  • 分析 PC 的运行时间减少 76%

在以下网站上可以查看使用 FireDucks 的 TTDC 员工与开发团队成员的访谈,以提供有关新开发软件的反馈。 (网址: https://www.nec.com/en/global/rd/technologies/202312/index.html)

未来的计划

通过免费提供FireDucks的测试版并让数据科学家能够实际使用它,NEC将努力改进其功能,同时验证其有效性,目标是在2024财年将其商业化。

(1)本软件是在日本新能源产业技术综合开发机构(NEDO)的支持下开发的
(2)根据基于TPCx-BB基准的NEC测试结果
(3)2020年数据科学现状(https://shorturl.at/klyW1)
(4)基于NEC内部进行的计算
(5)关于丰田技术开发公司(TTDC):专注于通过尖端信息和技术驱动的综合解决方案构建最佳的产品开发环境

关于NEC公司

NEC Corporation已确立了自己在IT和网络技术集成方面的领导者的地位,同时宣传了“编排更美好世界”的品牌主张。 NEC通过提供安全性,安全性,公平性和效率的社会价值,促进企业和社区适应社会和市场中发生的快速变化,从而促进一个更加可持续的世界,每个人都有机会发挥自己的全部潜力。 有关更多信息,请访问NEC,网址为: https://www.nec.com.

时间戳记:

更多来自 JCN新闻专线