Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

Amazon SageMaker Autopilot 现在支持时间序列数据

亚马逊SageMaker自动驾驶仪 根据您的数据自动构建、训练和调整最佳机器学习 (ML) 模型,同时让您保持完全控制和可见性。 我们最近公布了 支持 Autopilot 中的时间序列数据. 您可以使用 Autopilot 来处理时间序列数据或一般序列数据的回归和分类任务。 时间序列数据是一种特殊类型的序列数据,其中数据点以均匀的时间间隔收集。

手动准备数据、选择正确的 ML 模型并优化其参数是一项复杂的任务,即使对于专业从业者来说也是如此。 尽管存在可以找到最佳模型及其参数的自动化方法,但这些方法通常无法处理以序列形式出现的数据,例如随时间记录的网络流量、电力消耗或家庭开支。 由于这些数据采取在不同时间点获取的观测值的形式,连续的观测值不能被视为彼此独立,需要作为一个整体进行处理。 您可以使用 Autopilot 解决处理顺序数据的各种问题。 例如,您可以对随时间记录的网络流量进行分类以识别恶意活动,或根据个人信用记录确定个人是否有资格获得抵押贷款。 您提供包含时间序列数据的数据集,Autopilot 处理其余部分,通过专门的特征转换处理顺序数据并代表您找到最佳模型。

Autopilot 消除了构建 ML 模型的繁重工作,并帮助您根据数据自动构建、训练和调整最佳 ML 模型。 Autopilot 在您的数据上运行多种算法,并在完全托管的计算基础架构上调整它们的超参数。 在这篇文章中,我们演示了如何使用 自动驾驶仪 解决时间序列数据的分类和回归问题。 有关创建和训练 Autopilot 模型的说明,请参阅 Amazon SageMaker Autopilot的客户流失预测.

使用 Autopilot 进行时间序列数据分类

作为一个运行示例,我们考虑时间序列上的多类问题 数据集 UWave手势库X,包含加速度计传感器的等距读数,同时执行八种预定义手势之一。 为简单起见,我们只考虑加速度计的 X 维度。 任务是建立一个分类模型,将时间序列数据从传感器读数映射到预定义的手势。 下图以 CSV 格式显示数据集的第一行。 整个表格由 896 行和两列组成:第一列是手势标签,第二列是传感器读数的时间序列。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

使用 Amazon SageMaker Data Wrangler 将数据转换为正确的格式

除了接受数字、分类和标准文本列之外,Autopilot 现在还接受序列输入列。 如果您的时间序列数据不遵循这种格式,您可以通过 亚马逊SageMaker数据牧马人. Data Wrangler 将为 ML 聚合和准备数据所需的时间从几周缩短到几分钟。 使用 Data Wrangler,您可以简化数据准备和特征工程的过程,并从单个可视化界面完成数据准备工作流程的每个步骤,包括数据选择、清理、探索和可视化。 例如,考虑相同的数据集但输入格式不同:每个手势(由 ID 指定)是加速度计的等距测量序列。 垂直存储时,每一行都包含一个时间戳和一个值。 下图比较了原始格式和序列格式的数据。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

要使用 Data Wrangler 将此数据集转换为前面描述的格式,请从 亚马逊简单存储服务 (亚马逊 S3)。 然后使用 时间序列按变换分组,如以下屏幕截图所示,然后以 CSV 格式将数据导出回 Amazon S3。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

当数据集处于其指定格式时,您可以继续使用 Autopilot。 要查看 Data Wrangler 的其他时间序列转换器,请参阅 使用 Amazon SageMaker Data Wrangler 准备时间序列数据.

启动 AutoML 作业

与 Autopilot 支持的其他输入类型一样,数据集的每一行都是不同的观察值,每一列都是一个特征。 在此示例中,我们有一个包含时间序列数据的列,但您可以有多个时间序列列。 您还可以有多个具有不同输入类型的列,例如时间序列、文本和数字。

创建一个 Autopilot 实验,将数据集放在 S3 存储桶中并在其中创建一个新实验 亚马逊SageMaker Studio. 如以下屏幕截图所示,您必须指定实验名称、数据集的 S3 位置、输出工件的 S3 位置以及要预测的列名称。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

Autopilot 分析数据,生成 ML 管道,并在此分类任务上运行默认的 250 次超参数优化迭代。 如下模型排行榜所示,Autopilot 精度达到 0.821,一键部署最佳模型。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

此外,Autopilot 会生成一个 数据探索报告,您可以在其中可视化和探索您的数据。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

透明度是 Autopilot 的基础。 您可以在候选定义笔记本中检查和修改生成的 ML 管道。 下面的截图展示了 Autopilot 如何推荐一系列管道,结合时间序列转换器 TSFeatureExtractor 使用不同的 ML 算法,例如梯度增强决策树和线性模型。 这 TSFeatureExtractor 为您提取数百个时间序列特征,然后将其馈送到下游算法以进行预测。 有关时间序列功能的完整列表,请参阅 提取特征概述.

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。

结论

在这篇文章中,我们演示了如何使用 SageMaker Autopilot 只需单击几下即可解决时间序列分类和回归问题。

有关自动驾驶仪的更多信息,请参阅 亚马逊SageMaker自动驾驶仪. 要探索 SageMaker 的相关功能,请参阅 亚马逊SageMaker数据牧马人.


作者简介

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。尼基塔·伊夫金 是应用科学家,Amazon SageMaker Data Wrangler。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。安妮米尔伯特 是一名从事 Amazon SageMaker 自动模型调整的软件开发工程师。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。瓦莱里奥·佩罗内 是一名应用科学经理,负责 Amazon SageMaker 自动模型调整和自动驾驶仪。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。梅加娜·萨蒂什 是一名从事 Amazon SageMaker 自动模型调整的软件开发工程师。

Amazon SageMaker Autopilot 现在支持时间序列数据 PlatoBlockchain 数据智能。 垂直搜索。 哎。 阿里·塔克比里 是 AI/ML 专家解决方案架构师,通过使用机器学习帮助客户解决他们在 AWS 云上的业务挑战。

时间戳记:

更多来自 AWS机器学习