AmazonSageMakerCanvasを使用したノーコード機械学習によるマシン障害のタイプの予測

プラトン再発行

フォロワー： 0

製造業では、一般的な機械の故障タイプを予測することが重要です。特定のタイプの障害に関連付けられている製品の一連の特性が与えられると、それらの属性を機械学習（ML）モデルにフィードするときに、障害タイプを予測できるモデルを開発できます。 MLは洞察に役立ちますが、これまでは、MLの専門家がマシンの故障タイプを予測するモデルを構築する必要がありました。モデルがないと、企業が効率や改善のために必要とする是正措置が遅れる可能性があります。

この投稿では、ビジネスアナリストが次のような機械故障タイプ予測MLモデルを構築する方法を紹介します。 Amazon SageMaker キャンバス。 Canvasは、視覚的なポイントアンドクリックインターフェイスを提供します。これにより、MLの経験を必要とせず、コードをXNUMX行も記述せずに、モデルを構築して正確なML予測を自分で生成できます。

ソリューションの概要

あなたが大規模な製造組織の保守チームに割り当てられたビジネスアナリストであると仮定しましょう。保守チームから、一般的な障害の予測を支援するように依頼されました。彼らは、特定のタイプの障害に関連する特性を含む履歴データセットを提供し、将来どの障害が発生するかを予測することを望んでいます。障害の種類には、障害なし、過負荷、および電源障害が含まれます。データスキーマを次の表に示します。

列名	データ型	説明
UID	INT	1〜10,000の範囲の一意の識別子
製品番号	STRING	製品品質のバリアントおよびバリアント固有のシリアル番号としての文字（低、中、または高の場合はL、M、またはH）で構成されます
type	STRING	L、M、またはHのみで構成されるproductIDに関連付けられた頭文字
気温[K]	10進数	ケルビンで指定された気温
プロセス温度[K]	10進数	ケルビンで指定された特定のタイプの製品の品質を保証するために正確に制御された温度
回転速度[rpm]	10進数	軸を中心に回転するオブジェクトの回転速度は、オブジェクトの回転数を時間で割ったもので、XNUMX分あたりの回転数として指定されます。
トルク[Nm]	10進数	ニュートンメートルで表される、半径を通る機械の旋削力
工具摩耗[分]	INT	分単位で表される工具摩耗
障害タイプ（ターゲット）	STRING	障害なし、電源障害、または過負荷障害

障害の種類が特定された後、企業はあらゆる是正措置を講じることができます。これを行うには、CSVファイルにあるデータを使用します。このデータには、表に概説されている製品の特定の特性が含まれています。 Canvasを使用して、次の手順を実行します。

メンテナンスデータセットをインポートします。
予測マシンメンテナンスモデルをトレーニングして構築します。
モデルの結果を分析します。
モデルに対して予測をテストします。

前提条件

のクラウド管理者 AWSアカウント次の前提条件を完了するには、適切な権限が必要です。

を展開するアマゾンセージメーカードメイン手順については、を参照してください AmazonSageMakerドメインにオンボード.
Canvasを起動します。手順については、を参照してください。 Amazon SageMaker Canvasのセットアップと管理（IT管理者向け）.
Canvasのクロスオリジンリソースシェアリング（CORS）ポリシーを構成します。手順については、を参照してください。ユーザーがローカルファイルをアップロードできるようにする.

データセットをインポートする

まず、ダウンロードしますメンテナンスデータセットファイルを確認して、すべてのデータがそこにあることを確認します。

Canvasは、開始に役立ついくつかのサンプルデータセットをアプリケーションに提供します。実験できるSageMakerが提供するサンプルデータセットの詳細については、を参照してください。サンプルデータセットを使用する。サンプルデータセットを使用する場合（canvas-sample-maintenance.csv）Canvas内で利用可能であるため、メンテナンスデータセットをインポートする必要はありません。

Amazon SageMaker Canvas PlatoBlockchain Data Intelligenceを使用して、コードなしの機械学習でマシン障害のタイプを予測します。垂直検索。愛。
さまざまなデータソースからCanvasにデータをインポートできます。独自のデータセットを使用する場合は、次の手順に従ってください AmazonSageMakerCanvasにデータをインポートする.

この投稿では、ダウンロードした完全なメンテナンスデータセットを使用します。

にサインインする AWSマネジメントコンソール、Canvasにアクセスするための適切な権限を持つアカウントを使用します。
Canvasコンソールにログインします。
選択する インポート.
選択する アップロード 選択 maintenance_dataset.csv ファイルにソフトウェアを指定する必要があります。
選択する インポート日 Canvasにアップロードします。

データセットをインポートする

インポートプロセスには約10秒かかります（これはデータセットのサイズによって異なります）。完了すると、データセットがにあることがわかります Ready 状態。

インポートされたデータセットが ready、モデルを作成できます。

モデルを構築してトレーニングする

モデルを作成してトレーニングするには、次の手順を実行します。

選択する新型、モデルの名前を指定します。
選択する 創造する.
現在地に最も近い maintenance_dataset.csv データセットと選択 データセットを選択.
モデルビューには、モデルを作成して予測を生成するためのXNUMXつのステップに対応するXNUMXつのタブが表示されます。選択, 完成に向けてあなたの背中を押してくれる、執筆のための持続可能で本物のモーメンタムを作り出す。, 解析, 予測する.
ソフトウェア設定ページで、下図のように選択タブを選択 maintenance_dataset.csv 以前にアップロードして選択したデータセット データセットを選択.
このデータセットには、9列と10,000行が含まれています。 Canvasは自動的にビルドフェーズに移行します。
このタブで、ターゲット列を選択します。この場合は 障害タイプ。メンテナンスチームから、この列は、既存のマシンの履歴データに基づいて通常見られる障害の種類を示していることが通知されました。これは、予測するためにモデルをトレーニングしたいものです。 Canvasは、これが 3カテゴリー 問題（別名 マルチクラス分類）。間違ったモデルタイプが検出された場合は、 タイプを変更する オプションを選択します。
このデータセットは、No Failureクラスに対して非常に不均衡であることに注意してください。これは、 障害タイプ。 Canvasとその基盤となるAutoML機能は、データセットの不均衡を部分的に処理できますが、これにより、パフォーマンスが歪む可能性があります。追加の次のステップとして、を参照してください。 Amazon SageMakerDataWranglerを使用して機械学習用のデータのバランスをとる。共有リンクの手順に従って、 Amazon SageMakerスタジオ SageMakerコンソールからアプリを作成し、このデータセットを AmazonSageMakerデータラングラーバランスデータ変換を使用してから、バランスデータセットをCanvasに戻し、次の手順を続行します。この投稿では、不均衡なデータセットを処理して、Canvasが不均衡なデータセットも処理できることを示しています。
ページの下半分では、欠落している値と不一致の値、一意の値、平均値と中央値など、データセットの統計の一部を確認できます。列の選択を解除するだけで、それらを予測に使用したくない場合は、いくつかの列を削除することもできます。
このセクションを調べたら、モデルをトレーニングします。完全なモデルを作成する前に、クイックモデルをトレーニングして、モデルのパフォーマンスに関する一般的な考え方を理解しておくことをお勧めします。クイックモデルは、精度よりも速度を優先するために、モデルとハイパーパラメーターの組み合わせを少なくトレーニングします。特に、ユースケースでMLモデルをトレーニングすることの価値を証明したい場合に役立ちます。クイックビルドオプションは、50,000行を超えるモデルでは使用できないことに注意してください。
選択する クイックビルド.

進行中のモデル構築

これで、2〜15分待ちます。完了すると、Canvasは自動的にに移動します解析クイックトレーニングの結果を表示するタブ。クイックビルドを使用して実行された分析では、モデルが99.2％の確率で適切な障害タイプ（結果）を予測できると推定されます。わずかに異なる値が発生する場合があります。これは予想されます。

最初のタブに焦点を当てましょう、概要。これはあなたに表示するタブです カラムへの影響、またはターゲット列を予測する際の各列の推定重要度。この例では、トルク[Nm]列と回転速度[rpm]列が、発生する障害のタイプを予測する上で最も重要な影響を及ぼします。

分析-概要

モデルのパフォーマンスを評価する

あなたがに移動するとき得点分析の一部では、実際の値に対する予測値の分布を表すプロットを見ることができます。ほとんどの障害は「障害なし」カテゴリに含まれることに注意してください。 CanvasがSHAPベースラインを使用してMLに説明性をもたらす方法の詳細については、以下を参照してください。 AmazonSageMakerCanvasでのモデルのパフォーマンスの評価、と同様説明性のためのSHAPベースライン.
モデルメトリックを評価する

Canvasは、トレーニングの前に元のデータセットをトレーニングセットと検証セットに分割します。スコアリングは、Canvasがモデルに対して検証セットを実行した結果です。これは、障害の種類を選択できるインタラクティブなインターフェイスです。選択した場合 過ひずみ破壊 図では、モデルがこれらの84％の時間を識別していることがわかります。これは、アクションを実行するのに十分です。おそらく、オペレーターまたはエンジニアにさらにチェックしてもらいます。選んでいいですよ停電グラフィックで、さらなる解釈とアクションのためのそれぞれのスコアを確認してください。

障害の種類と、モデルが一連の入力に基づいて障害の種類をどの程度適切に予測するかに関心があるかもしれません。結果を詳しく見るには、次を選択します。 高度な指標。これにより、結果をより詳細に調べることができるマトリックスが表示されます。 MLでは、これは 混同行列.

高度なメトリック

このマトリックスは、デフォルトでドミナントクラスのNoFailureになります。に CLASS メニューでは、他のXNUMXつの障害タイプの過ひずみ障害と電源障害の高度なメトリックを表示するように選択できます。

MLでは、モデルの精度は、正しい予測の数を予測の総数で割ったものとして定義されます。青いボックスは、既知の結果があったテストデータのサブセットに対してモデルが行った正しい予測を表しています。ここでは、モデルが特定の機械の故障タイプを予測した時間の割合に関心があります（ 失敗なし）実際にその障害タイプ（失敗なし）。 MLでは、これを測定するために使用される比率はTP /（TP + FN）です。これは、 リコール。デフォルトのケースである「失敗なし」では、1,923件の全体的なレコードのうち1,926件の正しい予測があり、99％の結果になりました。 リコール。あるいは、過ひずみ破壊のクラスでは、32のうち38があり、84％になります。 リコール。最後に、停電のクラスでは、16のうち19があり、84％になります。 リコール.

現在、XNUMXつのオプションがあります。

このモデルを使用して、を選択することでいくつかの予測を実行できます 予測する.
このモデルの新しいバージョンを作成して、 標準ビルド オプション。これにははるかに長い時間がかかります（約1〜2時間）が、データ、アルゴリズム、およびチューニングの反復の完全なAutoMLレビューを実行するため、より堅牢なモデルを提供します。

障害を予測しようとしており、モデルは84％の確率で障害を正しく予測しているため、モデルを自信を持って使用して、発生する可能性のある障害を特定できます。したがって、オプション1に進むことができます。自信がない場合は、データサイエンティストに、Canvasが行ったモデリングをレビューしてもらい、オプション2を介して潜在的な改善を提供することができます。

予測を生成する

モデルがトレーニングされたので、予測の生成を開始できます。

選択する 予測する の底に解析ページ、またはを選択します 予測する タブには何も表示されないことに注意してください。
選択する データセットを選択、および maintenance_dataset.csv ファイルにソフトウェアを指定する必要があります。
選択する 予測を生成する.

Canvasはこのデータセットを使用して、予測を生成します。一般に、トレーニングとテストの両方に同じデータセットを使用しないことをお勧めしますが、この場合は簡単にするために同じデータセットを使用できます。または、トレーニングに使用する元のデータセットからいくつかのレコードを削除し、それらのレコードをCSVファイルで使用して、ここでバッチ予測にフィードすることで、トレーニング後のテストに同じデータセットを使用しないようにすることもできます。

バッチ予測
数秒後、予測が完了します。 Canvasは、データの各行の予測と、予測が正しい確率を返します。選んでいいですよ プレビュー 予測を表示するには、またはを選択します ダウンロード 完全な出力を含むCSVファイルをダウンロードします。

ダウンロード予測
を選択して、値をXNUMXつずつ予測することもできます。 単一の予測 バッチ予測。 Canvasは、各機能の値を手動で提供し、予測を生成できるビューを表示します。これは、what-ifシナリオのような状況に理想的です。たとえば、次のような状況です。ツールの摩耗は故障の種類にどのように影響しますか？プロセス温度が上昇または下降した場合はどうなりますか？回転速度が変化した場合はどうなりますか？

単一の予測

標準ビルド

　 標準ビルド オプションは、速度よりも精度を選択します。モデルの成果物をデータサイエンティストやMLエンジニアと共有したい場合は、次に標準ビルドを作成できます。

選択する バージョンを追加
新しいバージョンを選択し、 標準ビルド.
標準ビルドを作成したら、モデルをデータサイエンティストやMLエンジニアと共有して、さらに評価と反復を行うことができます。

共有モデル

クリーンアップ

将来の発生を避けるためセッション料金、Canvasからログアウトします。
キャンバスのログアウト

まとめ

この投稿では、ビジネスアナリストがメンテナンスデータを使用してCanvasで機械故障タイプの予測モデルを作成する方法を示しました。 Canvasを使用すると、信頼性エンジニアなどのビジネスアナリストは、コードなし、視覚的なポイントアンドクリックインターフェイスを使用して、正確なMLモデルを作成し、予測を生成できます。アナリストは、データサイエンティストの同僚とモデルを共有することで、これを次のレベルに引き上げることができます。データサイエンティストは、StudioでCanvasモデルを表示できます。ここでは、Canvasが行った選択を調べたり、モデルの結果を検証したり、数回クリックするだけでモデルを本番環境に移行したりできます。これにより、MLベースの価値創造が加速され、改善された結果をより迅速にスケーリングできます。

Canvasの使用の詳細については、を参照してください。構築、共有、デプロイ：ビジネスアナリストとデータサイエンティストがノーコードMLとAmazonSageMakerCanvasを使用して市場投入までの時間を短縮する方法。コードなしのソリューションを使用したMLモデルの作成の詳細については、を参照してください。 Amazon SageMaker Canvasの発表–ビジネスアナリスト向けの視覚的でノーコードの機械学習機能.

著者について

ラジャクマールサンパスクマール AWSのプリンシパルテクニカルアカウントマネージャーであり、ビジネステクノロジーの調整に関するガイダンスをお客様に提供し、クラウド運用モデルとプロセスの再発明をサポートしています。彼はクラウドと機械学習に情熱を注いでいます。 Rajは機械学習のスペシャリストでもあり、AWSのお客様と協力して、AWSのワークロードとアーキテクチャを設計、デプロイ、管理しています。

トヴァン・アトキンス アマゾンウェブサービスのシニアソリューションアーキテクトです。彼は、農業、小売、製造の顧客と協力してビジネス上の問題を特定し、後方に向かって実行可能でスケーラブルな技術ソリューションを特定する責任があります。 Twannは、顧客と将来のビルダーのための分析、人工知能、機械学習の民主化に最近焦点を当てて、顧客が重要なワークロードを計画および移行するのを10年以上支援してきました。

オムカー・ムカダム アマゾンウェブサービスのエッジスペシャリストソリューションアーキテクチャです。彼は現在、商用顧客がAWS SnowFamilyを含むがこれに限定されないAWSEdgeサービスを効果的に設計、構築、拡張できるようにするソリューションに焦点を当てています。

タイムスタンプ： 2022 年 6 月 23 日

タイムスタンプ： 2023 年 3 月 3 日

プラトン再発行

AWS Inferentia と AWS Trainium は、Amazon SageMaker JumpStart | で Llama 3 モデルをデプロイするための最低コストを提供します。アマゾンウェブサービス

AmazonSearchがAWS上のNVIDIATritonを使用して低レイテンシで高スループットのT5推論を実現する方法

AWS を使用した生成 AI への安全なアプローチ |アマゾンウェブサービス

Alida は、Amazon Bedrock | を使用して顧客のフィードバックをより深く理解しました。アマゾンウェブサービス

AmazonLexとUneeqのデジタルヒューマンプラットフォームを統合する

AWS Lambda でモデルエンドポイントをホストする MLOps ソリューションをデプロイする

Amazon Kendra の Exchange コネクタを使用して Microsoft Exchange コンテンツにインデックスを付ける

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー