Prédire les types de pannes de machines grâce à l'apprentissage automatique sans code à l'aide d'Amazon SageMaker Canvas

Republié par Platon

Suiveurs: 0

La prévision des types de pannes courantes des machines est essentielle dans les industries manufacturières. Étant donné un ensemble de caractéristiques d'un produit lié à un type de défaillance donné, vous pouvez développer un modèle capable de prédire le type de défaillance lorsque vous alimentez ces attributs avec un modèle d'apprentissage automatique (ML). Le ML peut aider à obtenir des informations, mais jusqu'à présent, vous aviez besoin d'experts en ML pour créer des modèles permettant de prédire les types de défaillance des machines, dont l'absence pourrait retarder toute action corrective dont les entreprises ont besoin pour gagner en efficacité ou s'améliorer.

Dans cet article, nous vous montrons comment les analystes métier peuvent créer un modèle ML de prédiction de type de panne de machine avec Toile Amazon SageMaker. Canvas vous offre une interface visuelle pointer-cliquer qui vous permet de créer des modèles et de générer vous-même des prédictions ML précises, sans nécessiter d'expérience en ML ni avoir à écrire une seule ligne de code.

Vue d'ensemble de la solution

Supposons que vous êtes un analyste commercial affecté à une équipe de maintenance d'une grande organisation de fabrication. Votre équipe de maintenance vous a demandé de l'aider à prévoir les pannes courantes. Ils vous ont fourni un ensemble de données historiques contenant des caractéristiques liées à un type de défaillance donné et aimeraient que vous prédisiez quelle défaillance se produira à l'avenir. Les types de panne incluent Pas de panne, Surcharge et Panne de courant. Le schéma de données est répertorié dans le tableau suivant.

Nom de colonne	Type de données	Description
UID	INT	Identifiant unique allant de 1 à 10,000 XNUMX
ID de produit	STRING	Composé d'une lettre (L, M ou H pour faible, moyenne ou élevée) en tant que variantes de qualité du produit et d'un numéro de série spécifique à la variante
type	STRING	Lettre initiale associée à l'ID de produit composée uniquement de L, M ou H
température de l'air [K]	DÉCIMAL	Température de l'air spécifiée en kelvin
température de processus [K]	DÉCIMAL	Températures contrôlées avec précision pour garantir la qualité d'un type de produit donné spécifié en kelvin
vitesse de rotation [tr/min]	DÉCIMAL	La vitesse de rotation d'un objet tournant autour d'un axe est le nombre de tours de l'objet divisé par le temps, spécifié en tours par minute
couple [Nm]	DÉCIMAL	Force de rotation de la machine à travers un rayon, exprimée en newton mètres
usure de l'outil [min]	INT	Usure de l'outil exprimée en minutes
type de panne (cible)	STRING	Aucune panne, panne de courant ou panne de surcharge

Une fois le type de défaillance identifié, les entreprises peuvent prendre des mesures correctives. Pour ce faire, vous utilisez les données que vous avez dans un fichier CSV, qui contient certaines caractéristiques d'un produit comme indiqué dans le tableau. Vous utilisez Canvas pour effectuer les étapes suivantes :

Importez le jeu de données de maintenance.
Entraînez et construisez le modèle de maintenance prédictive des machines.
Analysez les résultats du modèle.
Testez les prédictions par rapport au modèle.

Pré-requis

Un administrateur cloud avec un Compte AWS avec les autorisations appropriées est nécessaire pour remplir les conditions préalables suivantes :

Déployer un Amazon Sage Maker domaine Pour obtenir des instructions, voir Intégration au domaine Amazon SageMaker.
Lancer le canevas. Pour obtenir des instructions, consultez Configuration et gestion d'Amazon SageMaker Canvas (pour les administrateurs informatiques).
Configurez les stratégies de partage des ressources cross-origin (CORS) pour Canvas. Pour obtenir des instructions, consultez Donnez à vos utilisateurs la possibilité de télécharger des fichiers locaux.

Importer le jeu de données

D'abord, téléchargez le jeu de données de maintenance et examinez le fichier pour vous assurer que toutes les données s'y trouvent.

Canvas fournit plusieurs exemples d'ensembles de données dans votre application pour vous aider à démarrer. Pour en savoir plus sur les exemples d'ensembles de données fournis par SageMaker que vous pouvez expérimenter, consultez Utiliser des exemples d'ensembles de données. Si vous utilisez l'exemple de jeu de données (canvas-sample-maintenance.csv) disponible dans Canvas, vous n'avez pas besoin d'importer le jeu de données de maintenance.

Prévoyez les types de pannes machine grâce au machine learning sans code à l'aide d'Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Recherche verticale. Aï.
Vous pouvez importer des données de différentes sources de données dans Canvas. Si vous prévoyez d'utiliser votre propre ensemble de données, suivez les étapes de Importation de données dans Amazon SageMaker Canvas.

Pour cet article, nous utilisons le jeu de données de maintenance complet que nous avons téléchargé.

Connectez-vous à la Console de gestion AWS, en utilisant un compte disposant des autorisations appropriées pour accéder à Canvas.
Connectez-vous à la console Canvas.
Selectionnez L’.
Selectionnez Téléchargement et sélectionnez le maintenance_dataset.csv fichier.
Selectionnez Importer des dates pour le télécharger sur Canvas.

Importer le jeu de données

Le processus d'importation prend environ 10 secondes (cela peut varier en fonction de la taille de l'ensemble de données). Une fois terminé, vous pouvez voir que l'ensemble de données est dans Ready état.

Après avoir confirmé que l'ensemble de données importé est ready, vous pouvez créer votre modèle.

Construire et entraîner le modèle

Pour créer et entraîner votre modèle, procédez comme suit :

Selectionnez Nouveau modèle, et indiquez un nom pour votre modèle.
Selectionnez Création.
Sélectionnez le maintenance_dataset.csv jeu de données et choisissez Sélectionnez un jeu de données.
Dans la vue du modèle, vous pouvez voir quatre onglets, qui correspondent aux quatre étapes pour créer un modèle et l'utiliser pour générer des prédictions : Sélectionnez, Développer, Analysezet Prédire.
Sur le Sélectionnez onglet, sélectionnez la maintenance_dataset.csv ensemble de données que vous avez téléchargé précédemment et choisissez Sélectionnez un jeu de données.
Cet ensemble de données comprend 9 colonnes et 10,000 XNUMX lignes. Canvas passe automatiquement à la phase de construction.
Sur cet onglet, choisissez la colonne cible, dans notre cas Type d'échec.L'équipe de maintenance vous a informé que cette colonne indique le type de pannes généralement observées sur la base des données historiques de leurs machines existantes. C'est ce que vous voulez entraîner votre modèle à prédire. Canvas détecte automatiquement qu'il s'agit d'un Catégorie 3 problème (également appelé classification multi-classes). Si le mauvais type de modèle est détecté, vous pouvez le modifier manuellement avec le Changer le type option.
Il convient de noter que cet ensemble de données est très déséquilibré vers la classe No Failure, ce qui peut être vu en visualisant la colonne nommée Type d'échec. Bien que Canvas et les fonctionnalités AutoML sous-jacentes puissent en partie gérer le déséquilibre des ensembles de données, cela peut entraîner des performances faussées. Comme étape suivante supplémentaire, reportez-vous à Équilibrez vos données pour l'apprentissage automatique avec Amazon SageMaker Data Wrangler. En suivant les étapes du lien partagé, vous pouvez lancer un Amazon SageMakerStudio app depuis la console SageMaker et importez cet ensemble de données dans Gestionnaire de données Amazon SageMaker et utilisez la transformation de données Balance, puis ramenez l'ensemble de données équilibré sur Canvas et continuez les étapes suivantes. Nous poursuivons avec l'ensemble de données déséquilibré dans cet article pour montrer que Canvas peut également gérer des ensembles de données déséquilibrés.
Dans la moitié inférieure de la page, vous pouvez consulter certaines des statistiques de l'ensemble de données, y compris les valeurs manquantes et non concordantes, les valeurs uniques et les valeurs moyennes et médianes. Vous pouvez également supprimer certaines colonnes si vous ne souhaitez pas les utiliser pour la prédiction en les désélectionnant simplement.
Après avoir exploré cette section, il est temps de former le modèle ! Avant de créer un modèle complet, il est recommandé d'avoir une idée générale des performances du modèle en formant un modèle rapide. Un modèle rapide forme moins de combinaisons de modèles et d'hyperparamètres afin de privilégier la vitesse à la précision, en particulier dans les cas où vous souhaitez prouver la valeur de la formation d'un modèle ML pour votre cas d'utilisation. Notez que l'option de création rapide n'est pas disponible pour les modèles de plus de 50,000 XNUMX lignes.
Selectionnez Construction rapide.

modélisme en cours

Maintenant, vous attendez entre 2 et 15 minutes. Une fois cela fait, Canvas se déplace automatiquement vers le Analysez onglet pour vous montrer les résultats de la formation rapide. L'analyse effectuée à l'aide de la construction rapide estime que votre modèle est capable de prédire le bon type de défaillance (résultat) 99.2 % du temps. Vous pouvez rencontrer des valeurs légèrement différentes. C'est prévu.

Concentrons-nous sur le premier onglet, Vue d’ensemble. C'est l'onglet qui vous montre le Impact de la colonne, ou l'importance estimée de chaque colonne dans la prédiction de la colonne cible. Dans cet exemple, les colonnes Couple [Nm] et Vitesse de rotation [tr/min] ont l'impact le plus important pour prédire le type de défaillance qui se produira.

Analyser - Aperçu

Évaluer les performances du modèle

Lorsque vous déménagez dans le Scoring partie de votre analyse, vous pouvez voir un graphique représentant la distribution de nos valeurs prédites par rapport aux valeurs réelles. Notez que la plupart des échecs seront dans la catégorie Aucun échec. Pour en savoir plus sur la façon dont Canvas utilise les lignes de base SHAP pour apporter une explicabilité au ML, reportez-vous à Évaluation des performances de votre modèle dans Amazon SageMaker Canvas, aussi bien que Bases SHAP pour l'explicabilité.
évaluer les métriques du modèle

Canvas divise l'ensemble de données d'origine en ensembles d'apprentissage et de validation avant l'apprentissage. La notation est le résultat de l'exécution par Canvas de l'ensemble de validation sur le modèle. Il s'agit d'une interface interactive où vous pouvez sélectionner le type de panne. Si tu choisis Échec de surmenage dans le graphique, vous pouvez voir que le modèle identifie ces 84 % du temps. C'est assez bon pour prendre des mesures - peut-être demander à un opérateur ou à un ingénieur de vérifier plus avant. Tu peux choisir Panne électrique dans le graphique pour voir la notation respective pour une interprétation et des actions ultérieures.

Vous pouvez être intéressé par les types de défaillance et la capacité du modèle à prédire les types de défaillance en fonction d'une série d'entrées. Pour regarder de plus près les résultats, choisissez Métriques avancées. Cela affiche une matrice qui vous permet d'examiner de plus près les résultats. En ML, cela s'appelle un matrice de confusion.

métriques avancées

Cette matrice utilise par défaut la classe dominante, No Failure. Sur le Classe menu, vous pouvez choisir d'afficher les métriques avancées des deux autres types de panne de panne de surcharge et de panne de courant.

En ML, la précision du modèle est définie comme le nombre de prédictions correctes divisé par le nombre total de prédictions. Les cases bleues représentent les prédictions correctes que le modèle a faites par rapport à un sous-ensemble de données de test où il y avait un résultat connu. Ici, nous nous intéressons au pourcentage de temps pendant lequel le modèle a prédit un type particulier de panne de machine (disons Pas d'échec) alors qu'il s'agit en fait de ce type d'échec (Pas d'échec). En ML, un ratio utilisé pour mesurer cela est TP / (TP + FN). Ceci est appelé rappeler. Dans le cas par défaut, Pas d'échec, il y avait 1,923 1,926 prédictions correctes sur 99 XNUMX enregistrements globaux, ce qui a donné XNUMX % rappeler. Alternativement, dans la classe d'échec de surmenage, il y avait 32 sur 38, ce qui donne 84 % rappeler. Enfin, dans la classe de panne de courant, il y en avait 16 sur 19, soit 84 % rappeler.

Maintenant, vous avez deux options :

Vous pouvez utiliser ce modèle pour exécuter certaines prédictions en choisissant Prédire.
Vous pouvez créer une nouvelle version de ce modèle pour vous entraîner avec le Construction standard option. Cela prendra beaucoup plus de temps (environ 1 à 2 heures), mais fournit un modèle plus robuste car il passe par un examen AutoML complet des données, des algorithmes et des itérations de réglage.

Étant donné que vous essayez de prévoir les pannes et que le modèle prédit correctement les pannes 84 % du temps, vous pouvez utiliser le modèle en toute confiance pour identifier les pannes possibles. Vous pouvez donc passer à l'option 1. Si vous n'étiez pas sûr de vous, vous pouvez demander à un spécialiste des données d'examiner la modélisation faite par Canvas et de proposer des améliorations potentielles via l'option 2.

Générer des prédictions

Maintenant que le modèle est formé, vous pouvez commencer à générer des prédictions.

Selectionnez Prédire au bas de la Analysez page, ou choisissez la Prédire languette.
Selectionnez Sélectionnez un jeu de données, et choisissez le maintenance_dataset.csv fichier.
Selectionnez Générer des prédictions.

Canvas utilise cet ensemble de données pour générer nos prédictions. Bien que ce soit généralement une bonne idée de ne pas utiliser le même ensemble de données pour la formation et les tests, vous pouvez utiliser le même ensemble de données pour des raisons de simplicité dans ce cas. Alternativement, vous pouvez supprimer certains enregistrements de votre jeu de données d'origine que vous utilisez pour la formation et utiliser ces enregistrements dans un fichier CSV et l'alimenter dans la prédiction par lot ici afin de ne pas utiliser le même jeu de données pour tester après la formation.

prédiction par lots
Après quelques secondes, la prédiction est terminée. Canvas renvoie une prédiction pour chaque ligne de données et la probabilité que la prédiction soit correcte. Tu peux choisir Aperçu pour afficher les prédictions, ou choisissez Télécharger pour télécharger un fichier CSV contenant la sortie complète.

télécharger la prédiction
Vous pouvez également choisir de prédire une par une les valeurs en choisissant Prédiction unique au lieu de Prédiction par lots. Canvas vous montre une vue dans laquelle vous pouvez fournir manuellement les valeurs de chaque fonctionnalité et générer une prédiction. Ceci est idéal pour des situations telles que des scénarios hypothétiques, par exemple : Quel est l'impact de l'usure de l'outil sur le type de défaillance ? Que se passe-t-il si la température du procédé augmente ou diminue ? Et si la vitesse de rotation change ?

prédiction unique

Construction standard

Les Construction standard l'option choisit la précision plutôt que la vitesse. Si vous souhaitez partager les artefacts du modèle avec votre data scientist et vos ingénieurs ML, vous pouvez ensuite créer une version standard.

Selectionnez Ajouter une version
Choisissez une nouvelle version et choisissez Construction standard.
Après avoir créé une version standard, vous pouvez partager le modèle avec des scientifiques des données et des ingénieurs ML pour une évaluation et une itération plus poussées.

Partager le modèle

Nettoyer

Pour éviter d'encourir à l'avenir frais de séance, déconnectez-vous de Canvas.
Déconnexion de Canvas

Conclusion

Dans cet article, nous avons montré comment un analyste métier peut créer un modèle de prédiction de type de panne de machine avec Canvas en utilisant des données de maintenance. Canvas permet aux analystes commerciaux tels que les ingénieurs de fiabilité de créer des modèles ML précis et de générer des prédictions à l'aide d'une interface visuelle sans code, pointer-cliquer. Les analystes peuvent passer au niveau supérieur en partageant leurs modèles avec des collègues data scientists. Les scientifiques des données peuvent afficher le modèle Canvas dans Studio, où ils peuvent explorer les choix effectués par Canvas, valider les résultats du modèle et même mettre le modèle en production en quelques clics. Cela peut accélérer la création de valeur basée sur le ML et contribuer à améliorer les résultats plus rapidement.

Pour en savoir plus sur l'utilisation de Canvas, consultez Construire, partager, déployer : comment les analystes commerciaux et les spécialistes des données accélèrent la mise sur le marché à l'aide de ML sans code et d'Amazon SageMaker Canvas. Pour plus d'informations sur la création de modèles de ML avec une solution sans code, consultez Présentation d'Amazon SageMaker Canvas, une capacité d'apprentissage automatique visuelle et sans code pour les analystes commerciaux.

À propos des auteurs

Rajakumar Sampathkumar est responsable de compte technique principal chez AWS, fournissant des conseils aux clients sur l'alignement des technologies commerciales et soutenant la réinvention de leurs modèles et processus d'exploitation du cloud. Il est passionné par le cloud et l'apprentissage automatique. Raj est également un spécialiste de l'apprentissage automatique et travaille avec les clients AWS pour concevoir, déployer et gérer leurs charges de travail et architectures AWS.

Thomas Atkins est un architecte de solutions senior pour Amazon Web Services. Il est chargé de travailler avec les clients de l'agriculture, de la vente au détail et de la fabrication pour identifier les problèmes commerciaux et de travailler en arrière pour identifier des solutions techniques viables et évolutives. Twann aide ses clients à planifier et à migrer des charges de travail critiques depuis plus de 10 ans, en se concentrant récemment sur la démocratisation de l'analyse, de l'intelligence artificielle et de l'apprentissage automatique pour les clients et les constructeurs de demain.

Omkar Moukadam est un spécialiste de l'architecture de solutions Edge chez Amazon Web Services. Il se concentre actuellement sur les solutions qui permettent aux clients commerciaux de concevoir, construire et mettre à l'échelle efficacement avec les offres de services AWS Edge qui incluent, mais sans s'y limiter, AWS Snow Family.

Horodatage: Le 23 juin 2022

Horodatage: 3 Mar 2023

Republié par Platon

AWS Inferentia et AWS Trainium offrent le coût le plus bas pour déployer les modèles Llama 3 dans Amazon SageMaker JumpStart | Services Web Amazon

Comment Amazon Search parvient à une inférence T5 à faible latence et haut débit avec NVIDIA Triton sur AWS

Une approche sécurisée de l'IA générative avec AWS | Services Web Amazon

Alida acquiert une compréhension plus approfondie des commentaires des clients grâce à Amazon Bedrock | Services Web Amazon

Intégrez Amazon Lex et la plateforme humaine numérique d'Uneeq

Déployez une solution MLOps qui héberge vos points de terminaison de modèle dans AWS Lambda

Indexez votre contenu Microsoft Exchange à l'aide du connecteur Exchange pour Amazon Kendra

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte