预测性维护在汽车行业至关重要,因为它可以避免意外的机械故障和影响运营的反应性维护活动。 通过预测车辆故障并安排维护和维修,您将减少停机时间、提高安全性并提高生产力水平。
如果我们可以将深度学习技术应用于导致车辆故障、意外停机和维修成本的常见领域,会怎样?
在这篇文章中,我们向您展示如何训练和部署模型来预测车队故障概率 亚马逊SageMaker JumpStart。 SageMaker Jumpstart 是机器学习 (ML) 中心 亚马逊SageMaker,为各种问题类型提供预先训练的公开可用模型,以帮助您开始使用 ML。 帖子中概述的解决方案可在 GitHub上.
SageMaker JumpStart 解决方案模板
SageMaker JumpStart 为许多常见的 ML 使用案例提供一键式端到端解决方案。 探索以下用例,了解有关可用解决方案模板的更多信息:
SageMaker JumpStart 解决方案模板涵盖了各种用例,每个用例下都提供了几个不同的解决方案模板(本文中的解决方案, 车队的预测性维护, 在里面 解决方案 部分)。 从 SageMaker JumpStart 登录页面选择最适合您的使用案例的解决方案模板。 有关每个用例下的特定解决方案以及如何启动 SageMaker JumpStart 解决方案的更多信息,请参阅 解决方案模板.
解决方案概述
针对汽车车队的 AWS 预测性维护解决方案将深度学习技术应用于导致车辆故障、意外停机和维修成本的常见领域。 它可以作为您在短时间内获得概念验证的初始构建块。 该解决方案包含 SageMaker 中的数据准备和可视化功能,允许您为数据集训练和优化深度学习模型的超参数。 您可以使用自己的数据或尝试使用合成数据集作为此解决方案的一部分的解决方案。 该版本随着时间的推移处理车辆传感器数据。 后续版本将处理维护记录数据。
下图演示了如何将此解决方案与 SageMaker 组件结合使用。 作为解决方案的一部分,使用以下服务:
- Amazon S3 - 我们用 亚马逊简单存储服务 (Amazon S3) 存储数据集
- SageMaker 笔记本 – 我们使用笔记本来预处理和可视化数据,并训练深度学习模型
- SageMaker端点 – 我们使用端点来部署经过训练的模型
工作流程包括以下步骤:
- 从包含车辆数据和传感器日志的车队管理系统中创建历史数据摘录。
- 训练 ML 模型后,将部署 SageMaker 模型工件。
- 联网车辆将传感器日志发送至 AWS IoT核心 (或者,通过 HTTP 接口)。
- 传感器日志通过以下方式保存 亚马逊 Kinesis 数据流水线.
- 传感器日志发送至 AWS Lambda 用于查询模型以做出预测。
- Lambda 将传感器日志发送到 Sagemaker 模型推理以进行预测。
- 预测仍然存在 亚马逊极光.
- 汇总结果显示在 亚马逊QuickSight 仪表板。
- 有关预测故障概率的实时通知将发送至 亚马逊简单通知服务 (亚马逊 SNS)。
- Amazon SNS 将通知发送回联网车辆。
该解决方案由六个笔记本组成:
- 0_demo.ipynb – 我们的解决方案的快速预览
- 1_简介.ipynb – 简介和解决方案概述
- 2_data_preparation.ipynb – 准备样本数据集
- 3_数据_可视化.ipynb – 可视化我们的样本数据集
- 4_model_training.ipynb – 在我们的样本数据集上训练模型以检测故障
- 5_结果_分析.ipynb – 分析我们训练的模型的结果
先决条件
亚马逊SageMaker Studio 是 SageMaker 中的集成开发环境 (IDE),它在单一管理平台中为我们提供了所需的所有 ML 功能。 在运行 SageMaker JumpStart 之前,我们需要设置 SageMaker Studio。 如果您已经运行了自己的 SageMaker Studio 版本,则可以跳过此步骤。
在使用任何 AWS 服务之前,我们需要做的第一件事是确保我们已经注册并创建了一个 AWS 账户。 然后我们创建一个管理用户和一个组。 有关这两个步骤的说明,请参阅 设置 Amazon SageMaker 先决条件.
下一步是创建 SageMaker 域。 域设置所有存储并允许您添加用户以访问 SageMaker。 有关详细信息,请参阅 加入 Amazon SageMaker 域。 该演示是在 AWS 区域 us-east-1 中创建的。
最后,启动 SageMaker Studio。 对于本文,我们建议启动用户配置文件应用程序。 有关说明,请参阅 启动 Amazon SageMaker Studio.
要运行此 SageMaker JumpStart 解决方案并将基础设施部署到您的 AWS 账户,您需要创建一个活动的 SageMaker Studio 实例(请参阅 内置到Amazon SageMaker Studio)。 当您的实例准备就绪时,请使用中的说明 SageMaker 快速启动 启动解决方案。 解决方案工件包含在此 GitHub存储库 以供参考。
启动 SageMaker Jumpstart 解决方案
要开始使用该解决方案,请完成以下步骤:
- 在 SageMaker Studio 控制台上,选择 快速启动.
- 点击 解决方案 标签,选择 车队的预测性维护.
- 实行.
部署该解决方案需要几分钟时间。 - 部署解决方案后,选择“打开笔记本”。
如果系统提示您选择内核,请为此解决方案中的所有笔记本选择 PyTorch 1.8 Python 3.6。
解决方案预览
我们首先致力于 0_demo.ipynb
笔记本。 在此笔记本中,您可以快速预览完成此解决方案的完整笔记本后的结果。
运行 和 运行所有单元格 运行 SageMaker Studio 中的所有单元(或 手机 和 全部运行 在 SageMaker 笔记本实例中)。 您可以逐个运行每个笔记本中的所有单元。 确保所有单元格在移动到下一个笔记本之前完成处理。
该解决方案依赖配置文件来运行预配置的 AWS 资源。 我们生成文件如下:
我们有一些样本时间序列输入数据,其中包括随时间变化的车辆电池电压和电池电流。 接下来,我们加载并可视化示例数据。 如下图所示,Y 轴为电压和电流值,X 轴为读数(记录的 19 个读数)。
我们之前已经根据该电压和电流数据训练了一个模型,用于预测车辆故障的概率,并将该模型部署为 SageMaker 中的端点。 我们将使用一些示例数据来调用此端点,以确定下一个时间段内发生故障的概率。
给定样本输入数据,预测的故障概率为 45.73%。
要进入下一阶段,请选择 点击这里继续.
简介和解决方案概述
1_introduction.ipynb
Notebook 提供了解决方案和阶段的概述,并查看了配置文件,其中包含内容定义、数据采样周期、训练和测试样本计数、参数、位置以及生成内容的列名称。
查看此笔记本后,您可以进入下一阶段。
准备样本数据集
我们在以下位置准备了一个示例数据集 2_data_preparation.ipynb
笔记本电脑。
我们首先为此解决方案生成配置文件:
配置属性如下:
您可以定义自己的数据集或使用我们的脚本生成示例数据集:
您可以将传感器数据和车队车辆数据合并在一起:
我们现在可以转向数据可视化。
可视化我们的样本数据集
我们将样本数据集可视化为 3_data_vizualization.ipynb
。 该解决方案依赖配置文件来运行预配置的 AWS 资源。 让我们生成类似于之前笔记本的文件。
以下屏幕截图显示了我们的数据集。
接下来,让我们构建数据集:
现在数据集已准备就绪,让我们可视化数据统计信息。 以下屏幕截图显示了基于车辆品牌、发动机类型、车辆类别和型号的数据分布。
比较日志数据,让我们看一下 Make E 和 C(随机)不同年份的平均电压示例。
Y 轴为电压和电流的平均值,X 轴为读数数量。
- log_target 的可能值:['make', 'model', 'year', 'vehicle_class', 'engine_type']
- 随机分配的值
log_target: make
- 随机分配的值
- log_target_value1 的可能值:['Make A', 'Make B', 'Make E', 'Make C', 'Make D']
- 随机分配的值
log_target_value1: Make B
- 随机分配的值
- log_target_value2 的可能值:['Make A', 'Make B', 'Make E', 'Make C', 'Make D']
- 随机分配的值
log_target_value2: Make D
- 随机分配的值
基于上述,我们假设 log_target: make
, log_target_value1: Make B
和 log_target_value2: Make D
下图详细列出了日志数据的平均值。
下图直观地显示了不同传感器日志值与电压和电流的关系示例。
在我们的示例数据集上训练模型以检测故障
在 4_model_training.ipynb
笔记本上,我们在样本数据集上训练模型来检测故障。
我们来生成和之前notebook类似的配置文件,然后进行训练配置:
分析我们训练的模型的结果
在 5_results_analysis.ipynb
笔记本中,我们从超参数调整作业中获取数据,可视化所有作业的指标以确定最佳作业,并为最佳训练作业构建端点。
让我们生成类似于之前笔记本的配置文件,并可视化所有作业的指标。 下图直观地显示了测试准确性与历元的关系。
以下屏幕截图显示了我们运行的超参数调整作业。
现在,您可以根据测试准确性(红色)可视化最佳训练作业(四个训练作业中)的数据。
正如我们在下面的屏幕截图中看到的那样,测试损失随着 epoch 的增加而下降,AUC 和准确率随之增加。
基于可视化,我们现在可以构建最佳训练作业的端点:
构建端点后,我们可以通过传递示例传感器日志来测试预测器:
给定样本输入数据,预测的故障概率为 34.60%.
清理
当您完成此解决方案后,请确保删除所有不需要的 AWS 资源。 上 车队的预测性维护 页面,在 删除解决方案,选择 删除所有资源 删除与解决方案关联的所有资源。
您需要手动删除在此笔记本中创建的任何额外资源。 一些示例包括额外的 S3 存储桶(到解决方案的默认存储桶)和额外的 SageMaker 端点(使用自定义名称)。
定制解决方案
我们的解决方案易于定制。 要修改输入数据可视化,请参阅 sagemaker/3_data_visualization.ipynb。 要定制机器学习,请参阅 sagemaker/来源/train.py 和 sagemaker/source/dl_utils/network.py。 要自定义数据集处理,请参阅 sagemaker/1_introduction.ipynb 关于如何定义配置文件。
此外,您可以更改配置文件中的配置。 默认配置如下:
配置文件具有以下参数:
fleet_info_fn
,fleet_sensor_logs_fn
,fleet_dataset_fn
,train_dataset_fn
及test_dataset_fn
定义数据集文件的位置vehicle_id_column
,timestamp_column
,target_column
及period_column
定义列的标题dataset_size
,chunksize
,processing_chunksize
,period_ms
及window_length
定义数据集的属性
结论
在这篇文章中,我们向您展示了如何使用 SageMaker JumpStart 训练和部署模型来预测车队故障概率。 该解决方案基于机器学习和深度学习模型,允许输入各种数据,包括任何时变的传感器数据。 由于每辆车都有不同的遥测数据,因此您可以根据您拥有的数据的频率和类型对提供的模型进行微调。
要了解有关 SageMaker JumpStart 功能的更多信息,请参阅以下内容:
资源
作者简介
拉贾库马尔·桑帕斯库马尔 是 AWS 的首席技术客户经理,为客户提供业务技术协调方面的指导,并支持其云运营模型和流程的重塑。 他对云计算和机器学习充满热情。 Raj 还是一名机器学习专家,与 AWS 客户合作设计、部署和管理他们的 AWS 工作负载和架构。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- PlatoData.Network 垂直生成人工智能。 赋予自己力量。 访问这里。
- 柏拉图爱流。 Web3 智能。 知识放大。 访问这里。
- 柏拉图ESG。 汽车/电动汽车, 碳, 清洁科技, 能源, 环境, 太阳能, 废物管理。 访问这里。
- 块偏移量。 现代化环境抵消所有权。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/predict-vehicle-fleet-failure-probability-using-amazon-sagemaker-jumpstart/
- :具有
- :是
- ][p
- $UP
- 1
- 10
- 100
- 11
- 12
- 13
- 15%
- 16
- 19
- 20
- 50
- 67
- 7
- 8
- a
- 关于
- 以上
- ACCESS
- 根据
- 账号管理
- 横过
- 要积极。
- 活动
- 加
- 行政
- 后
- 驳
- 对准
- 所有类型
- 允许
- 已经
- 还
- Amazon
- 亚马逊SageMaker
- 亚马逊SageMaker JumpStart
- 亚马逊网络服务
- an
- 分析
- 和
- 任何
- 应用
- 使用
- 保健
- 地区
- AS
- 分配
- 相关
- 承担
- At
- 汽车
- 可使用
- 避免
- AWS
- 轴
- 背部
- 基于
- 电池
- 因为
- before
- 最佳
- 阻止
- 身体
- 促进
- 都
- 午休
- 建立
- 建筑物
- by
- 呼叫
- CAN
- 可以得到
- 案件
- 例
- 细胞
- 更改
- 程
- 客户
- 云端技术
- 柱
- 相当常见
- 完成
- 组件
- 概念
- 配置
- 已联繫
- 组成
- 由
- 安慰
- 包含
- 内容
- 成本
- 可以
- 外壳
- 创建信息图
- 创建
- 危急
- 电流
- 习俗
- 合作伙伴
- 定制
- XNUMX月XNUMX日
- data
- 资料准备
- 数据可视化
- 下降
- 深
- 深入学习
- 默认
- 定义
- 演示
- 演示
- 部署
- 部署
- 设计
- 确定
- 研发支持
- 不同
- 显示
- 破坏
- 分配
- do
- 域
- 向下
- 停机
- 驾驶
- e
- 每
- 其他
- 端至端
- 端点
- 发动机
- 确保
- 环境
- 时代
- 时代
- 所有的
- 例子
- 例子
- 探索
- 额外
- 提取
- 失败
- false
- 特征
- 少数
- 文件
- 完
- (名字)
- 舰队
- 以下
- 如下
- 针对
- 四
- 频率
- 止
- ,
- 功能
- 生成
- 产生
- 发电机
- 得到
- 特定
- 玻璃
- GPU
- 图表
- 团队
- 指导
- 有
- he
- 头
- 帮助
- 相关信息
- 历史的
- 创新中心
- How To
- HTML
- HTTP
- HTTPS
- 中心
- 超参数优化
- 超参数调整
- i
- 鉴定
- if
- 进口
- 改善
- in
- 包括
- 包括
- 包括
- 包含
- 增加
- 行业
- 信息
- 基础设施
- 初始
- 开始
- 输入
- 例
- 说明
- 集成
- 接口
- 成
- 介绍
- 物联网
- IT
- 工作
- 工作机会
- JPG
- JSON
- 键
- 着陆
- 发射
- 发射
- 学习用品
- 学习
- 各级
- 喜欢
- 加载
- 本地
- 圖書分館的位置
- 日志
- 看
- 看起来像
- 离
- 机
- 机器学习
- 保养
- 使
- 管理
- 颠覆性技术
- 经理
- 手动
- 许多
- 生产力
- 可能..
- 意味着
- 机械
- 合并
- 指标
- 分钟
- ML
- 模型
- 模型
- 修改
- 更多
- 移动
- 移动
- 姓名
- 名称
- 需求
- 下页
- 笔记本
- 通知
- 通知
- 现在
- 数
- of
- 最多线路
- on
- 一
- 仅由
- 打开
- 操作
- 运营
- 优化
- 优化
- or
- OS
- 其他名称
- 我们的
- 输出
- 成果
- 概述
- 超过
- 简介
- 己
- 页
- 面包
- 参数
- 部分
- 通过
- 多情
- 径
- 期间
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 请
- 帖子
- 预测
- 都曾预测
- 预测
- 预测
- 预报器
- 预测
- 准备
- Prepare
- 预览
- 以前
- 先前
- 校长
- 市场问题
- 过程
- 过程
- 处理
- 生产率
- 本人简介
- 证明
- 概念验证
- 提供
- 提供
- 优
- 公然
- 蟒蛇
- pytorch
- 快速
- 随机
- 范围
- 准备
- 建议
- 记录
- 记录
- 红色
- 减少
- 地区
- 修复
- 资源
- 响应
- 成果
- 回报
- 检讨
- 角色
- 运行
- 运行
- 实现安全
- sagemaker
- 样本数据集
- 调度
- 截图
- 脚本
- 部分
- 看到
- 发送
- 发送
- 系列
- 服务
- 特色服务
- 会议
- 集
- 套数
- 几个
- 短
- 显示
- 显示
- 如图
- 作品
- 签
- 类似
- 简易
- 单
- SIX
- 方案,
- 解决方案
- 一些
- 来源
- 专家
- 具体的
- 阶段
- 实习
- 开始
- 统计
- 步
- 步骤
- 存储
- 商店
- 工作室
- 随后
- 支持
- 肯定
- 合成的
- 系统
- 需要
- 文案
- 技术
- 模板
- 模板
- test
- 这
- 其
- 然后
- 事
- Free Introduction
- 次
- 时间序列
- 时间戳
- 至
- 一起
- 培训
- 熟练
- 产品培训
- 尝试
- 类型
- 类型
- 下
- 无用
- us
- 使用
- 用例
- 用过的
- 用户
- 用户
- 运用
- 折扣值
- 价值观
- 各种
- 汽车
- 版本
- 通过
- 可视化
- 伏
- 电压
- vs
- W
- we
- 卷筒纸
- Web服务
- 什么是
- ,尤其是
- 这
- 宽
- 大范围
- 将
- 中
- 工作
- 工作流程
- 合作
- X
- 雅姆
- 年
- 完全
- 您一站式解决方案
- 和风网