使用 Amazon SageMaker Jumpstart 预测车队故障概率

由柏拉图重新发布

关注： 0

预测性维护在汽车行业至关重要，因为它可以避免意外的机械故障和影响运营的反应性维护活动。通过预测车辆故障并安排维护和维修，您将减少停机时间、提高安全性并提高生产力水平。

如果我们可以将深度学习技术应用于导致车辆故障、意外停机和维修成本的常见领域，会怎样？

在这篇文章中，我们向您展示如何训练和部署模型来预测车队故障概率亚马逊SageMaker JumpStart。 SageMaker Jumpstart 是机器学习 (ML) 中心亚马逊SageMaker，为各种问题类型提供预先训练的公开可用模型，以帮助您开始使用 ML。帖子中概述的解决方案可在 GitHub上.

SageMaker JumpStart 解决方案模板

SageMaker JumpStart 为许多常见的 ML 使用案例提供一键式端到端解决方案。探索以下用例，了解有关可用解决方案模板的更多信息：

SageMaker JumpStart 解决方案模板涵盖了各种用例，每个用例下都提供了几个不同的解决方案模板（本文中的解决方案，车队的预测性维护，在里面 解决方案 部分）。从 SageMaker JumpStart 登录页面选择最适合您的使用案例的解决方案模板。有关每个用例下的特定解决方案以及如何启动 SageMaker JumpStart 解决方案的更多信息，请参阅解决方案模板.

解决方案概述

针对汽车车队的 AWS 预测性维护解决方案将深度学习技术应用于导致车辆故障、意外停机和维修成本的常见领域。它可以作为您在短时间内获得概念验证的初始构建块。该解决方案包含 SageMaker 中的数据准备和可视化功能，允许您为数据集训练和优化深度学习模型的超参数。您可以使用自己的数据或尝试使用合成数据集作为此解决方案的一部分的解决方案。该版本随着时间的推移处理车辆传感器数据。后续版本将处理维护记录数据。

下图演示了如何将此解决方案与 SageMaker 组件结合使用。作为解决方案的一部分，使用以下服务：

Amazon S3 - 我们用亚马逊简单存储服务 (Amazon S3) 存储数据集
SageMaker 笔记本 – 我们使用笔记本来预处理和可视化数据，并训练深度学习模型
SageMaker端点 – 我们使用端点来部署经过训练的模型

解决方案概述

工作流程包括以下步骤：

从包含车辆数据和传感器日志的车队管理系统中创建历史数据摘录。
训练 ML 模型后，将部署 SageMaker 模型工件。
联网车辆将传感器日志发送至 AWS IoT核心（或者，通过 HTTP 接口）。
传感器日志通过以下方式保存亚马逊 Kinesis 数据流水线.
传感器日志发送至 AWS Lambda 用于查询模型以做出预测。
Lambda 将传感器日志发送到 Sagemaker 模型推理以进行预测。
预测仍然存在亚马逊极光.
汇总结果显示在亚马逊QuickSight 仪表板。
有关预测故障概率的实时通知将发送至亚马逊简单通知服务（亚马逊 SNS）。
Amazon SNS 将通知发送回联网车辆。

该解决方案由六个笔记本组成：

0_demo.ipynb – 我们的解决方案的快速预览
1_简介.ipynb – 简介和解决方案概述
2_data_preparation.ipynb – 准备样本数据集
3_数据_可视化.ipynb – 可视化我们的样本数据集
4_model_training.ipynb – 在我们的样本数据集上训练模型以检测故障
5_结果_分析.ipynb – 分析我们训练的模型的结果

先决条件

亚马逊SageMaker Studio 是 SageMaker 中的集成开发环境 (IDE)，它在单一管理平台中为我们提供了所需的所有 ML 功能。在运行 SageMaker JumpStart 之前，我们需要设置 SageMaker Studio。如果您已经运行了自己的 SageMaker Studio 版本，则可以跳过此步骤。

在使用任何 AWS 服务之前，我们需要做的第一件事是确保我们已经注册并创建了一个 AWS 账户。然后我们创建一个管理用户和一个组。有关这两个步骤的说明，请参阅设置 Amazon SageMaker 先决条件.

下一步是创建 SageMaker 域。域设置所有存储并允许您添加用户以访问 SageMaker。有关详细信息，请参阅加入 Amazon SageMaker 域。该演示是在 AWS 区域 us-east-1 中创建的。

最后，启动 SageMaker Studio。对于本文，我们建议启动用户配置文件应用程序。有关说明，请参阅启动 Amazon SageMaker Studio.

要运行此 SageMaker JumpStart 解决方案并将基础设施部署到您的 AWS 账户，您需要创建一个活动的 SageMaker Studio 实例（请参阅内置到Amazon SageMaker Studio）。当您的实例准备就绪时，请使用中的说明 SageMaker 快速启动启动解决方案。解决方案工件包含在此 GitHub存储库以供参考。

启动 SageMaker Jumpstart 解决方案

要开始使用该解决方案，请完成以下步骤：

在 SageMaker Studio 控制台上，选择 快速启动.
点击 解决方案 标签，选择 车队的预测性维护.
实行.

部署该解决方案需要几分钟时间。
部署解决方案后，选择“打开笔记本”。

如果系统提示您选择内核，请为此解决方案中的所有笔记本选择 PyTorch 1.8 Python 3.6。

解决方案预览

我们首先致力于 0_demo.ipynb 笔记本。在此笔记本中，您可以快速预览完成此解决方案的完整笔记本后的结果。

运行和 运行所有单元格 运行 SageMaker Studio 中的所有单元（或手机和 全部运行 在 SageMaker 笔记本实例中）。您可以逐个运行每个笔记本中的所有单元。确保所有单元格在移动到下一个笔记本之前完成处理。

运行所有单元格

该解决方案依赖配置文件来运行预配置的 AWS 资源。我们生成文件如下：

import boto3
import os
import json client = boto3.client('servicecatalog')
cwd = os.getcwd().split('/')
i= cwd.index('S3Downloads')
pp_name = cwd[i + 1]
pp = client.describe_provisioned_product(Name=pp_name)
record_id = pp['ProvisionedProductDetail']['LastSuccessfulProvisioningRecordId']
record = client.describe_record(Id=record_id) keys = [ x['OutputKey'] for x in record['RecordOutputs'] if 'OutputKey' and 'OutputValue' in x]
values = [ x['OutputValue'] for x in record['RecordOutputs'] if 'OutputKey' and 'OutputValue' in x]
stack_output = dict(zip(keys, values)) with open(f'/root/S3Downloads/{pp_name}/stack_outputs.json', 'w') as f:
json.dump(stack_output, f)

我们有一些样本时间序列输入数据，其中包括随时间变化的车辆电池电压和电池电流。接下来，我们加载并可视化示例数据。如下图所示，Y 轴为电压和电流值，X 轴为读数（记录的 19 个读数）。

电压和电流

我们之前已经根据该电压和电流数据训练了一个模型，用于预测车辆故障的概率，并将该模型部署为 SageMaker 中的端点。我们将使用一些示例数据来调用此端点，以确定下一个时间段内发生故障的概率。

给定样本输入数据，预测的故障概率为 45.73％。

要进入下一阶段，请选择 点击这里继续.

下个阶段

简介和解决方案概述

1_introduction.ipynb Notebook 提供了解决方案和阶段的概述，并查看了配置文件，其中包含内容定义、数据采样周期、训练和测试样本计数、参数、位置以及生成内容的列名称。

查看此笔记本后，您可以进入下一阶段。

准备样本数据集

我们在以下位置准备了一个示例数据集 2_data_preparation.ipynb 笔记本电脑。

我们首先为此解决方案生成配置文件：

import boto3
import os
import json client = boto3.client('servicecatalog')
cwd = os.getcwd().split('/')
i= cwd.index('S3Downloads')
pp_name = cwd[i + 1]
pp = client.describe_provisioned_product(Name=pp_name)
record_id = pp['ProvisionedProductDetail']['LastSuccessfulProvisioningRecordId']
record = client.describe_record(Id=record_id) keys = [ x['OutputKey'] for x in record['RecordOutputs'] if 'OutputKey' and 'OutputValue' in x]
values = [ x['OutputValue'] for x in record['RecordOutputs'] if 'OutputKey' and 'OutputValue' in x]
stack_output = dict(zip(keys, values)) with open(f'/root/S3Downloads/{pp_name}/stack_outputs.json', 'w') as f:
json.dump(stack_output, f)
import os from source.config import Config
from source.preprocessing import pivot_data, sample_dataset
from source.dataset import DatasetGenerator
config = Config(filename="config/config.yaml", fetch_sensor_headers=False)
config

配置属性如下：

fleet_info_fn=data/example_fleet_info.csv
fleet_sensor_logs_fn=data/example_fleet_sensor_logs.csv
vehicle_id_column=vehicle_id
timestamp_column=timestamp
target_column=target
period_ms=30000
dataset_size=25000
window_length=20
chunksize=10000
processing_chunksize=2500
fleet_dataset_fn=data/processed/fleet_dataset.csv
train_dataset_fn=data/processed/train_dataset.csv
test_dataset_fn=data/processed/test_dataset.csv
period_column=period_ms

您可以定义自己的数据集或使用我们的脚本生成示例数据集：

if should_generate_data: fleet_statistics_fn = "data/generation/fleet_statistics.csv" generator = DatasetGenerator(fleet_statistics_fn=fleet_statistics_fn, fleet_info_fn=config.fleet_info_fn, fleet_sensor_logs_fn=config.fleet_sensor_logs_fn, period_ms=config.period_ms, ) generator.generate_dataset() assert os.path.exists(config.fleet_info_fn), "Please copy your data to {}".format(config.fleet_info_fn)
assert os.path.exists(config.fleet_sensor_logs_fn), "Please copy your data to {}".format(config.fleet_sensor_logs_fn)

您可以将传感器数据和车队车辆数据合并在一起：

pivot_data(config)
sample_dataset(config)

我们现在可以转向数据可视化。

可视化我们的样本数据集

我们将样本数据集可视化为 3_data_vizualization.ipynb。该解决方案依赖配置文件来运行预配置的 AWS 资源。让我们生成类似于之前笔记本的文件。

以下屏幕截图显示了我们的数据集。

数据集

接下来，让我们构建数据集：

train_ds = PMDataset_torch( config.train_dataset_fn, sensor_headers=config.sensor_headers, target_column=config.target_column, standardize=True) properties = train_ds.vehicle_properties_headers.copy()
properties.remove('vehicle_id')
properties.remove('timestamp')
properties.remove('period_ms')

现在数据集已准备就绪，让我们可视化数据统计信息。以下屏幕截图显示了基于车辆品牌、发动机类型、车辆类别和型号的数据分布。

比较日志数据，让我们看一下 Make E 和 C（随机）不同年份的平均电压示例。

Y 轴为电压和电流的平均值，X 轴为读数数量。

log_target 的可能值：['make', 'model', 'year', 'vehicle_class', 'engine_type']
- 随机分配的值 log_target: make
log_target_value1 的可能值：['Make A', 'Make B', 'Make E', 'Make C', 'Make D']
- 随机分配的值 log_target_value1: Make B
log_target_value2 的可能值：['Make A', 'Make B', 'Make E', 'Make C', 'Make D']
- 随机分配的值 log_target_value2: Make D

基于上述，我们假设 log_target: make, log_target_value1: Make B 和 log_target_value2: Make D

使b和d

下图详细列出了日志数据的平均值。

发动机汽油机

下图直观地显示了不同传感器日志值与电压和电流的关系示例。

伏特电流2

在我们的示例数据集上训练模型以检测故障

在 4_model_training.ipynb 笔记本上，我们在样本数据集上训练模型来检测故障。

我们来生成和之前notebook类似的配置文件，然后进行训练配置：

sage_session = sagemaker.session.Session()
s3_bucket = sagemaker_configs["S3Bucket"] s3_output_path = 's3://{}/'.format(s3_bucket)
print("S3 bucket path: {}".format(s3_output_path)) # run in local_mode on this machine, or as a SageMaker TrainingJob
local_mode = False if local_mode: instance_type = 'local'
else: instance_type = sagemaker_configs["SageMakerTrainingInstanceType"] role = sagemaker.get_execution_role()
print("Using IAM role arn: {}".format(role))
# only run from SageMaker notebook instance
if local_mode: !/bin/bash ./setup.sh
cpu_or_gpu = 'gpu' if instance_type.startswith('ml.p') else 'cpu'

我们现在可以定义数据并启动超参数优化：

%%time estimator = PyTorch(entry_point="train.py", source_dir='source', role=role, dependencies=["source/dl_utils"], instance_type=instance_type, instance_count=1, output_path=s3_output_path, framework_version="1.5.0", py_version='py3', base_job_name=job_name_prefix, metric_definitions=metric_definitions, hyperparameters= { 'epoch': 100, # tune it according to your need 'target_column': config.target_column, 'sensor_headers': json.dumps(config.sensor_headers), 'train_input_filename': os.path.basename(config.train_dataset_fn), 'test_input_filename': os.path.basename(config.test_dataset_fn), } ) if local_mode: estimator.fit({'train': training_data, 'test': testing_data})
%%time tuner = HyperparameterTuner(estimator, objective_metric_name='test_auc', objective_type='Maximize', hyperparameter_ranges=hyperparameter_ranges, metric_definitions=metric_definitions, max_jobs=max_jobs, max_parallel_jobs=max_parallel_jobs, base_tuning_job_name=job_name_prefix)
tuner.fit({'train': training_data, 'test': testing_data})

分析我们训练的模型的结果

在 5_results_analysis.ipynb 笔记本中，我们从超参数调整作业中获取数据，可视化所有作业的指标以确定最佳作业，并为最佳训练作业构建端点。

让我们生成类似于之前笔记本的配置文件，并可视化所有作业的指标。下图直观地显示了测试准确性与历元的关系。

测试准确度

以下屏幕截图显示了我们运行的超参数调整作业。

超参数调整作业

现在，您可以根据测试准确性（红色）可视化最佳训练作业（四个训练作业中）的数据。

正如我们在下面的屏幕截图中看到的那样，测试损失随着 epoch 的增加而下降，AUC 和准确率随之增加。

AUC 和准确度

AUC 和准确度 2

基于可视化，我们现在可以构建最佳训练作业的端点：

%%time role = sagemaker.get_execution_role() model = PyTorchModel(model_data=model_artifact, role=role, entry_point="inference.py", source_dir="source/dl_utils", framework_version='1.5.0', py_version = 'py3', name=sagemaker_configs["SageMakerModelName"], code_location="s3://{}/endpoint".format(s3_bucket) ) endpoint_instance_type = sagemaker_configs["SageMakerInferenceInstanceType"] predictor = model.deploy(initial_instance_count=1, instance_type=endpoint_instance_type, endpoint_name=sagemaker_configs["SageMakerEndpointName"]) def custom_np_serializer(data): return json.dumps(data.tolist()) def custom_np_deserializer(np_bytes, content_type='application/x-npy'): out = np.array(json.loads(np_bytes.read())) return out predictor.serializer = custom_np_serializer
predictor.deserializer = custom_np_deserializer

构建端点后，我们可以通过传递示例传感器日志来测试预测器：

import botocore config = botocore.config.Config(read_timeout=200)
runtime = boto3.client('runtime.sagemaker', config=config) data = np.ones(shape=(1, 20, 2)).tolist()
payload = json.dumps(data) response = runtime.invoke_endpoint(EndpointName=sagemaker_configs["SageMakerEndpointName"],
ContentType='application/json',
Body=payload)
out = json.loads(response['Body'].read().decode())[0] print("Given the sample input data, the predicted probability of failure is {:0.2f}%".format(100*(1.0-out[0])))

给定样本输入数据，预测的故障概率为 34.60%.

清理

当您完成此解决方案后，请确保删除所有不需要的 AWS 资源。上 车队的预测性维护 页面，在 删除解决方案，选择 删除所有资源 删除与解决方案关联的所有资源。

您需要手动删除在此笔记本中创建的任何额外资源。一些示例包括额外的 S3 存储桶（到解决方案的默认存储桶）和额外的 SageMaker 端点（使用自定义名称）。

定制解决方案

我们的解决方案易于定制。要修改输入数据可视化，请参阅 sagemaker/3_data_visualization.ipynb。要定制机器学习，请参阅 sagemaker/来源/train.py 和 sagemaker/source/dl_utils/network.py。要自定义数据集处理，请参阅 sagemaker/1_introduction.ipynb 关于如何定义配置文件。

此外，您可以更改配置文件中的配置。默认配置如下：

fleet_info_fn=data/example_fleet_info.csv
fleet_sensor_logs_fn=data/example_fleet_sensor_logs.csv
vehicle_id_column=vehicle_id
timestamp_column=timestamp
target_column=target
period_ms=30000
dataset_size=10000
window_length=20
chunksize=10000
processing_chunksize=1000
fleet_dataset_fn=data/processed/fleet_dataset.csv
train_dataset_fn=data/processed/train_dataset.csv
test_dataset_fn=data/processed/test_dataset.csv
period_column=period_ms

配置文件具有以下参数：

fleet_info_fn, fleet_sensor_logs_fn, fleet_dataset_fn, train_dataset_fn及 test_dataset_fn 定义数据集文件的位置
vehicle_id_column, timestamp_column, target_column及 period_column 定义列的标题
dataset_size, chunksize, processing_chunksize, period_ms及 window_length 定义数据集的属性

结论

在这篇文章中，我们向您展示了如何使用 SageMaker JumpStart 训练和部署模型来预测车队故障概率。该解决方案基于机器学习和深度学习模型，允许输入各种数据，包括任何时变的传感器数据。由于每辆车都有不同的遥测数据，因此您可以根据您拥有的数据的频率和类型对提供的模型进行微调。

要了解有关 SageMaker JumpStart 功能的更多信息，请参阅以下内容：

资源

作者简介

拉贾库马尔·桑帕斯库马尔 是 AWS 的首席技术客户经理，为客户提供业务技术协调方面的指导，并支持其云运营模型和流程的重塑。他对云计算和机器学习充满热情。 Raj 还是一名机器学习专家，与 AWS 客户合作设计、部署和管理他们的 AWS 工作负载和架构。

SEO 支持的内容和 PR 分发。今天得到放大。
PlatoData.Network 垂直生成人工智能。赋予自己力量。访问这里。
柏拉图爱流。 Web3 智能。知识放大。访问这里。
柏拉图ESG。汽车/电动汽车，碳，清洁科技, 能源，环境，太阳能，废物管理。访问这里。
块偏移量。现代化环境抵消所有权。访问这里。
Sumber: https://aws.amazon.com/blogs/machine-learning/predict-vehicle-fleet-failure-probability-using-amazon-sagemaker-jumpstart/

时间戳记： 2023 年 7 月 5 日

时间戳记： 2023 年 8 月 21 日

由柏拉图重新发布

减少将模型部署到 Amazon SageMaker 进行测试所需的时间

改进 Amazon Rekognition 自定义标签模型的提示

使用 Amazon SageMaker Data Wrangler 从 Amazon EMR 准备数据用于机器学习

使用 Amazon SageMaker 服务端点的实时推理模型的 MLOps 部署最佳实践

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理

SageMaker JumpStart 解决方案模板

解决方案概述

先决条件

启动 SageMaker Jumpstart 解决方案

解决方案预览

简介和解决方案概述

准备样本数据集

可视化我们的样本数据集

在我们的示例数据集上训练模型以检测故障

分析我们训练的模型的结果

清理

定制解决方案

结论

资源

作者简介

更多来自 AWS机器学习

关于我们

垂直搜索和Ai

应用平台

保持联系

账号管理