製造業では、一般的な機械の故障タイプを予測することが重要です。 特定のタイプの障害に関連付けられている製品の一連の特性が与えられると、それらの属性を機械学習(ML)モデルにフィードするときに、障害タイプを予測できるモデルを開発できます。 MLは洞察に役立ちますが、これまでは、MLの専門家がマシンの故障タイプを予測するモデルを構築する必要がありました。モデルがないと、企業が効率や改善のために必要とする是正措置が遅れる可能性があります。
この投稿では、ビジネスアナリストが次のような機械故障タイプ予測MLモデルを構築する方法を紹介します。 Amazon SageMaker キャンバス。 Canvasは、視覚的なポイントアンドクリックインターフェイスを提供します。これにより、MLの経験を必要とせず、コードをXNUMX行も記述せずに、モデルを構築して正確なML予測を自分で生成できます。
ソリューションの概要
あなたが大規模な製造組織の保守チームに割り当てられたビジネスアナリストであると仮定しましょう。 保守チームから、一般的な障害の予測を支援するように依頼されました。 彼らは、特定のタイプの障害に関連する特性を含む履歴データセットを提供し、将来どの障害が発生するかを予測することを望んでいます。 障害の種類には、障害なし、過負荷、および電源障害が含まれます。 データスキーマを次の表に示します。
列名 | データ型 | 説明 |
UID | INT | 1〜10,000の範囲の一意の識別子 |
製品番号 | STRING | 製品品質のバリアントおよびバリアント固有のシリアル番号としての文字(低、中、または高の場合はL、M、またはH)で構成されます |
type | STRING | L、M、またはHのみで構成されるproductIDに関連付けられた頭文字 |
気温[K] | 10進数 | ケルビンで指定された気温 |
プロセス温度[K] | 10進数 | ケルビンで指定された特定のタイプの製品の品質を保証するために正確に制御された温度 |
回転速度[rpm] | 10進数 | 軸を中心に回転するオブジェクトの回転速度は、オブジェクトの回転数を時間で割ったもので、XNUMX分あたりの回転数として指定されます。 |
トルク[Nm] | 10進数 | ニュートンメートルで表される、半径を通る機械の旋削力 |
工具摩耗[分] | INT | 分単位で表される工具摩耗 |
障害タイプ(ターゲット) | STRING | 障害なし、電源障害、または過負荷障害 |
障害の種類が特定された後、企業はあらゆる是正措置を講じることができます。 これを行うには、CSVファイルにあるデータを使用します。このデータには、表に概説されている製品の特定の特性が含まれています。 Canvasを使用して、次の手順を実行します。
- メンテナンスデータセットをインポートします。
- 予測マシンメンテナンスモデルをトレーニングして構築します。
- モデルの結果を分析します。
- モデルに対して予測をテストします。
前提条件
のクラウド管理者 AWSアカウント 次の前提条件を完了するには、適切な権限が必要です。
- を展開する アマゾンセージメーカー ドメイン手順については、を参照してください AmazonSageMakerドメインにオンボード.
- Canvasを起動します。 手順については、を参照してください。 Amazon SageMaker Canvasのセットアップと管理(IT管理者向け).
- Canvasのクロスオリジンリソースシェアリング(CORS)ポリシーを構成します。 手順については、を参照してください。 ユーザーがローカルファイルをアップロードできるようにする.
データセットをインポートする
まず、ダウンロードします メンテナンスデータセット ファイルを確認して、すべてのデータがそこにあることを確認します。
Canvasは、開始に役立ついくつかのサンプルデータセットをアプリケーションに提供します。 実験できるSageMakerが提供するサンプルデータセットの詳細については、を参照してください。 サンプルデータセットを使用する。 サンプルデータセットを使用する場合(canvas-sample-maintenance.csv
)Canvas内で利用可能であるため、メンテナンスデータセットをインポートする必要はありません。
さまざまなデータソースからCanvasにデータをインポートできます。 独自のデータセットを使用する場合は、次の手順に従ってください AmazonSageMakerCanvasにデータをインポートする.
この投稿では、ダウンロードした完全なメンテナンスデータセットを使用します。
- にサインインする AWSマネジメントコンソール、Canvasにアクセスするための適切な権限を持つアカウントを使用します。
- Canvasコンソールにログインします。
- 選択する インポート.
- 選択する アップロード 選択
maintenance_dataset.csv
ファイルにソフトウェアを指定する必要があります。 - 選択する インポート日 Canvasにアップロードします。
インポートプロセスには約10秒かかります(これはデータセットのサイズによって異なります)。 完了すると、データセットがにあることがわかります Ready
状態。
インポートされたデータセットが ready
、モデルを作成できます。
モデルを構築してトレーニングする
モデルを作成してトレーニングするには、次の手順を実行します。
- 選択する 新型、モデルの名前を指定します。
- 選択する 創造する.
- 現在地に最も近い
maintenance_dataset.csv
データセットと選択 データセットを選択.
モデルビューには、モデルを作成して予測を生成するためのXNUMXつのステップに対応するXNUMXつのタブが表示されます。 選択, 完成に向けてあなたの背中を押してくれる、執筆のための持続可能で本物のモーメンタムを作り出す。, 解析, 予測する. - ソフトウェア設定ページで、下図のように 選択 タブを選択
maintenance_dataset.csv
以前にアップロードして選択したデータセット データセットを選択.
このデータセットには、9列と10,000行が含まれています。 Canvasは自動的にビルドフェーズに移行します。 - このタブで、ターゲット列を選択します。この場合は 障害タイプ。メンテナンスチームから、この列は、既存のマシンの履歴データに基づいて通常見られる障害の種類を示していることが通知されました。 これは、予測するためにモデルをトレーニングしたいものです。 Canvasは、これが 3カテゴリー 問題(別名 マルチクラス分類)。 間違ったモデルタイプが検出された場合は、 タイプを変更する オプションを選択します。
このデータセットは、No Failureクラスに対して非常に不均衡であることに注意してください。これは、 障害タイプ。 Canvasとその基盤となるAutoML機能は、データセットの不均衡を部分的に処理できますが、これにより、パフォーマンスが歪む可能性があります。 追加の次のステップとして、を参照してください。 Amazon SageMakerDataWranglerを使用して機械学習用のデータのバランスをとる。 共有リンクの手順に従って、 Amazon SageMakerスタジオ SageMakerコンソールからアプリを作成し、このデータセットを AmazonSageMakerデータラングラー バランスデータ変換を使用してから、バランスデータセットをCanvasに戻し、次の手順を続行します。 この投稿では、不均衡なデータセットを処理して、Canvasが不均衡なデータセットも処理できることを示しています。
ページの下半分では、欠落している値と不一致の値、一意の値、平均値と中央値など、データセットの統計の一部を確認できます。 列の選択を解除するだけで、それらを予測に使用したくない場合は、いくつかの列を削除することもできます。
このセクションを調べたら、モデルをトレーニングします。 完全なモデルを作成する前に、クイックモデルをトレーニングして、モデルのパフォーマンスに関する一般的な考え方を理解しておくことをお勧めします。 クイックモデルは、精度よりも速度を優先するために、モデルとハイパーパラメーターの組み合わせを少なくトレーニングします。特に、ユースケースでMLモデルをトレーニングすることの価値を証明したい場合に役立ちます。 クイックビルドオプションは、50,000行を超えるモデルでは使用できないことに注意してください。 - 選択する クイックビルド.
これで、2〜15分待ちます。 完了すると、Canvasは自動的にに移動します 解析 クイックトレーニングの結果を表示するタブ。 クイックビルドを使用して実行された分析では、モデルが99.2%の確率で適切な障害タイプ(結果)を予測できると推定されます。 わずかに異なる値が発生する場合があります。 これは予想されます。
最初のタブに焦点を当てましょう、 概要。 これはあなたに表示するタブです カラムへの影響、またはターゲット列を予測する際の各列の推定重要度。 この例では、トルク[Nm]列と回転速度[rpm]列が、発生する障害のタイプを予測する上で最も重要な影響を及ぼします。
モデルのパフォーマンスを評価する
あなたがに移動するとき 得点 分析の一部では、実際の値に対する予測値の分布を表すプロットを見ることができます。 ほとんどの障害は「障害なし」カテゴリに含まれることに注意してください。 CanvasがSHAPベースラインを使用してMLに説明性をもたらす方法の詳細については、以下を参照してください。 AmazonSageMakerCanvasでのモデルのパフォーマンスの評価、 と同様 説明性のためのSHAPベースライン.
Canvasは、トレーニングの前に元のデータセットをトレーニングセットと検証セットに分割します。 スコアリングは、Canvasがモデルに対して検証セットを実行した結果です。 これは、障害の種類を選択できるインタラクティブなインターフェイスです。 選択した場合 過ひずみ破壊 図では、モデルがこれらの84%の時間を識別していることがわかります。 これは、アクションを実行するのに十分です。おそらく、オペレーターまたはエンジニアにさらにチェックしてもらいます。 選んでいいですよ 停電 グラフィックで、さらなる解釈とアクションのためのそれぞれのスコアを確認してください。
障害の種類と、モデルが一連の入力に基づいて障害の種類をどの程度適切に予測するかに関心があるかもしれません。 結果を詳しく見るには、次を選択します。 高度な指標。 これにより、結果をより詳細に調べることができるマトリックスが表示されます。 MLでは、これは 混同行列.
このマトリックスは、デフォルトでドミナントクラスのNoFailureになります。 に CLASS メニューでは、他のXNUMXつの障害タイプの過ひずみ障害と電源障害の高度なメトリックを表示するように選択できます。
MLでは、モデルの精度は、正しい予測の数を予測の総数で割ったものとして定義されます。 青いボックスは、既知の結果があったテストデータのサブセットに対してモデルが行った正しい予測を表しています。 ここでは、モデルが特定の機械の故障タイプを予測した時間の割合に関心があります( 失敗なし)実際にその障害タイプ(失敗なし)。 MLでは、これを測定するために使用される比率はTP /(TP + FN)です。 これは、 リコール。 デフォルトのケースである「失敗なし」では、1,923件の全体的なレコードのうち1,926件の正しい予測があり、99%の結果になりました。 リコール。 あるいは、過ひずみ破壊のクラスでは、32のうち38があり、84%になります。 リコール。 最後に、停電のクラスでは、16のうち19があり、84%になります。 リコール.
現在、XNUMXつのオプションがあります。
- このモデルを使用して、を選択することでいくつかの予測を実行できます 予測する.
- このモデルの新しいバージョンを作成して、 標準ビルド オプション。 これにははるかに長い時間がかかります(約1〜2時間)が、データ、アルゴリズム、およびチューニングの反復の完全なAutoMLレビューを実行するため、より堅牢なモデルを提供します。
障害を予測しようとしており、モデルは84%の確率で障害を正しく予測しているため、モデルを自信を持って使用して、発生する可能性のある障害を特定できます。 したがって、オプション1に進むことができます。自信がない場合は、データサイエンティストに、Canvasが行ったモデリングをレビューしてもらい、オプション2を介して潜在的な改善を提供することができます。
予測を生成する
モデルがトレーニングされたので、予測の生成を開始できます。
- 選択する 予測する の底に 解析 ページ、またはを選択します 予測する タブには何も表示されないことに注意してください。
- 選択する データセットを選択、および
maintenance_dataset.csv
ファイルにソフトウェアを指定する必要があります。 - 選択する 予測を生成する.
Canvasはこのデータセットを使用して、予測を生成します。 一般に、トレーニングとテストの両方に同じデータセットを使用しないことをお勧めしますが、この場合は簡単にするために同じデータセットを使用できます。 または、トレーニングに使用する元のデータセットからいくつかのレコードを削除し、それらのレコードをCSVファイルで使用して、ここでバッチ予測にフィードすることで、トレーニング後のテストに同じデータセットを使用しないようにすることもできます。
数秒後、予測が完了します。 Canvasは、データの各行の予測と、予測が正しい確率を返します。 選んでいいですよ プレビュー 予測を表示するには、またはを選択します ダウンロード 完全な出力を含むCSVファイルをダウンロードします。
を選択して、値をXNUMXつずつ予測することもできます。 単一の予測 バッチ予測。 Canvasは、各機能の値を手動で提供し、予測を生成できるビューを表示します。 これは、what-ifシナリオのような状況に理想的です。たとえば、次のような状況です。ツールの摩耗は故障の種類にどのように影響しますか? プロセス温度が上昇または下降した場合はどうなりますか? 回転速度が変化した場合はどうなりますか?
標準ビルド
標準ビルド オプションは、速度よりも精度を選択します。 モデルの成果物をデータサイエンティストやMLエンジニアと共有したい場合は、次に標準ビルドを作成できます。
- 選択する バージョンを追加
- 新しいバージョンを選択し、 標準ビルド.
- 標準ビルドを作成したら、モデルをデータサイエンティストやMLエンジニアと共有して、さらに評価と反復を行うことができます。
クリーンアップ
将来の発生を避けるため セッション料金、Canvasからログアウトします。
まとめ
この投稿では、ビジネスアナリストがメンテナンスデータを使用してCanvasで機械故障タイプの予測モデルを作成する方法を示しました。 Canvasを使用すると、信頼性エンジニアなどのビジネスアナリストは、コードなし、視覚的なポイントアンドクリックインターフェイスを使用して、正確なMLモデルを作成し、予測を生成できます。 アナリストは、データサイエンティストの同僚とモデルを共有することで、これを次のレベルに引き上げることができます。 データサイエンティストは、StudioでCanvasモデルを表示できます。ここでは、Canvasが行った選択を調べたり、モデルの結果を検証したり、数回クリックするだけでモデルを本番環境に移行したりできます。 これにより、MLベースの価値創造が加速され、改善された結果をより迅速にスケーリングできます。
Canvasの使用の詳細については、を参照してください。 構築、共有、デプロイ:ビジネスアナリストとデータサイエンティストがノーコードMLとAmazonSageMakerCanvasを使用して市場投入までの時間を短縮する方法。 コードなしのソリューションを使用したMLモデルの作成の詳細については、を参照してください。 Amazon SageMaker Canvasの発表–ビジネスアナリスト向けの視覚的でノーコードの機械学習機能.
著者について
ラジャクマールサンパスクマール AWSのプリンシパルテクニカルアカウントマネージャーであり、ビジネステクノロジーの調整に関するガイダンスをお客様に提供し、クラウド運用モデルとプロセスの再発明をサポートしています。 彼はクラウドと機械学習に情熱を注いでいます。 Rajは機械学習のスペシャリストでもあり、AWSのお客様と協力して、AWSのワークロードとアーキテクチャを設計、デプロイ、管理しています。
トヴァン・アトキンス アマゾンウェブサービスのシニアソリューションアーキテクトです。 彼は、農業、小売、製造の顧客と協力してビジネス上の問題を特定し、後方に向かって実行可能でスケーラブルな技術ソリューションを特定する責任があります。 Twannは、顧客と将来のビルダーのための分析、人工知能、機械学習の民主化に最近焦点を当てて、顧客が重要なワークロードを計画および移行するのを10年以上支援してきました。
オムカー・ムカダム アマゾンウェブサービスのエッジスペシャリストソリューションアーキテクチャです。 彼は現在、商用顧客がAWS SnowFamilyを含むがこれに限定されないAWSEdgeサービスを効果的に設計、構築、拡張できるようにするソリューションに焦点を当てています。
- "
- 000
- 10
- 100
- 9
- a
- 能力
- 私たちについて
- 加速する
- アクセス
- 正確な
- 達成する
- Action
- 行動
- NEW
- 管理人
- 管理者
- 高度な
- に対して
- 農業
- アルゴリズム
- すべて
- ことができます
- しかし
- Amazon
- Amazon Webサービス
- 分析する
- 分析
- アナリスト
- 分析論
- どこにでも
- アプリ
- 申し込み
- 適切な
- 約
- 建築
- 周りに
- 人工の
- 人工知能
- 人工知能と機械学習
- 割り当てられた
- 関連する
- 属性
- 自動的に
- 利用できます
- AWS
- 軸
- なぜなら
- さ
- より大きい
- 国境
- 持って来る
- ビルド
- 建物
- ビジネス
- ビジネス
- キャンバス
- 機能
- 場合
- 例
- カテゴリー
- 一定
- 変化する
- 選択肢
- 選択する
- class
- クローザー
- クラウド
- コード
- 同僚
- コラム
- 組み合わせ
- コマーシャル
- コマンドと
- コンプリート
- 確信して
- 領事
- 含まれています
- 続ける
- 可能性
- 作ります
- 作成
- 創造
- 重大な
- 現在
- Customers
- データ
- データサイエンティスト
- 遅らせる
- によっては
- 展開します
- 設計
- 検出された
- 開発する
- DID
- 異なります
- ディスプレイ
- ディストリビューション
- ドメイン
- ダウンロード
- Drop
- 各
- エッジ(Edge)
- 効果的に
- 可能
- エンジニア
- エンジニア
- 特に
- 推定
- 見積もり
- 評価する
- 評価
- 例
- 既存の
- 予想される
- 体験
- 実験
- 専門家
- 探る
- 表現
- 不良解析
- 家族
- 速いです
- 特徴
- 名
- フォーカス
- 焦点を当てて
- フォロー中
- から
- フル
- さらに
- 未来
- 一般に
- 生成する
- 生成
- 良い
- ハンドル
- 持って
- 助けます
- 助け
- こちら
- 非常に
- 歴史的
- 認定条件
- HTTPS
- アイデア
- 理想
- 識別する
- 影響
- 重要性
- 改善されました
- 改善
- include
- 含ま
- 含めて
- 産業
- 情報
- 情報に基づく
- 洞察
- インテリジェンス
- 相互作用的
- 興味がある
- インタフェース
- 解釈
- IT
- 既知の
- 大
- 起動する
- LEARN
- 学習
- レベル
- 限定的
- LINE
- LINK
- リストされた
- ローカル
- 見て
- 機械
- 機械学習
- マシン
- 製
- メンテナンス
- make
- 管理します
- 管理
- マネージャー
- 管理する
- 手動で
- 製造業
- マトリックス
- だけど
- ミディアム
- メトリック
- ML
- モデル
- 他には?
- 最も
- 次の
- 注意
- 数
- 提供
- オファリング
- 操作
- オペレータ
- オプション
- オプション
- 注文
- 組織
- オリジナル
- その他
- 全体
- 自分の
- 特定の
- 情熱的な
- 割合
- パフォーマンス
- 公演
- 相
- ポリシー
- 可能
- 潜在的な
- 電力
- 練習
- 予測する
- 予測
- 予測
- 校長
- 問題
- 問題
- プロセス
- ラボレーション
- プロダクト
- 製品品質
- 生産
- 提供します
- 提供
- は、大阪で
- 提供
- 品質
- クイック
- 測距
- 最近
- 記録
- 表す
- 表します
- の提出が必要です
- リソースを追加する。
- 責任
- 結果
- 小売
- 収益
- レビュー
- ラン
- ランニング
- 同じ
- ド電源のデ
- 規模
- 科学者
- 科学者たち
- 得点
- 秒
- シリアル
- シリーズ
- サービス
- サービス
- セッションに
- いくつかの
- シェアする
- shared
- シェアリング
- 表示する
- 重要
- サイズ
- 雪
- So
- 固体
- 溶液
- ソリューション
- 一部
- 専門家
- スピード
- 分割
- 標準
- start
- 開始
- 統計
- Status:
- 研究
- 支援する
- ターゲット
- チーム
- 技術的
- test
- テスト
- 介して
- タイド
- 時間
- 明日
- ツール
- に向かって
- トレーニング
- 列車
- 変換
- 一般的に
- ユニーク
- つかいます
- users
- 値
- バージョン
- 詳しく見る
- wait
- ウェブ
- Webサービス
- この試験は
- 以内
- ワーキング
- 作品
- でしょう
- 年
- あなたの