Voorspel soorten machinestoringen met machine learning zonder code met behulp van Amazon SageMaker Canvas

Heruitgegeven door Plato

volgers: 0

Het voorspellen van veelvoorkomende typen machinestoringen is van cruciaal belang in productie-industrieën. Gegeven een reeks kenmerken van een product die is gekoppeld aan een bepaald type storing, kunt u een model ontwikkelen dat het type storing kan voorspellen wanneer u die kenmerken doorgeeft aan een machine learning (ML) -model. ML kan helpen met inzichten, maar tot nu toe had je ML-experts nodig om modellen te bouwen om typen machinestoringen te voorspellen. Het ontbreken hiervan zou eventuele corrigerende acties die bedrijven nodig hebben voor efficiëntie of verbetering, kunnen vertragen.

In dit bericht laten we u zien hoe bedrijfsanalisten een ML-model voor het voorspellen van machinefouten kunnen bouwen met: Amazon SageMaker-canvas. Canvas biedt je een visuele aanwijzen-en-klik-interface waarmee je zelf modellen kunt bouwen en nauwkeurige ML-voorspellingen kunt genereren, zonder dat je enige ervaring met ML nodig hebt of een enkele regel code hoeft te schrijven.

Overzicht oplossingen

Laten we aannemen dat u een bedrijfsanalist bent die is toegewezen aan een onderhoudsteam van een grote productieorganisatie. Uw onderhoudsteam heeft u gevraagd om te helpen bij het voorspellen van veelvoorkomende storingen. Zij hebben u een historische dataset gegeven met kenmerken die aan een bepaald type storing zijn gekoppeld en willen graag dat u voorspelt welke storing in de toekomst zal optreden. De storingstypen zijn onder meer Geen storing, Overbelasting en Stroomstoringen. Het gegevensschema wordt weergegeven in de volgende tabel.

Kolomnaam	Data type	Omschrijving
UID	INT	Unieke identificatiecode variërend van 1-10,000
Product-ID	STRING	Bestaande uit een letter - L, M of H voor laag, gemiddeld of hoog - als productkwaliteitsvarianten en een variantspecifiek serienummer
type dan:	STRING	Beginletter geassocieerd met product-ID bestaande uit alleen L, M of H
luchttemperatuur [K]	DECIMALE	Luchttemperatuur gespecificeerd in kelvin
procestemperatuur [K]	DECIMALE	Nauwkeurig gecontroleerde temperaturen om de kwaliteit van een bepaald type product te garanderen, gespecificeerd in kelvin
rotatiesnelheid [rpm]	DECIMALE	Rotatiesnelheid van een object dat rond een as roteert is het aantal omwentelingen van het object gedeeld door de tijd, gespecificeerd als omwentelingen per minuut
koppel [Nm]	DECIMALE	Draaikracht van de machine over een straal, uitgedrukt in newtonmeter
gereedschapsslijtage [min]	INT	Gereedschapsslijtage uitgedrukt in minuten
storingstype (doel)	STRING	Geen storing, stroomstoring of overbelastingsstoring

Nadat het type storing is vastgesteld, kunnen bedrijven corrigerende maatregelen nemen. Hiervoor gebruik je de gegevens die je hebt in een CSV-bestand, dat bepaalde kenmerken van een product bevat zoals weergegeven in de tabel. Je gebruikt Canvas om de volgende stappen uit te voeren:

Importeer de onderhoudsdataset.
Train en bouw het voorspellende machine-onderhoudsmodel.
Analyseer de modelresultaten.
Test voorspellingen tegen het model.

Voorwaarden

Een cloudbeheerder met een AWS-account met de juiste machtigingen is vereist om aan de volgende vereisten te voldoen:

Implementeer een Amazon Sage Maker domein Voor instructies, zie Aan boord van Amazon SageMaker Domain.
Lanceer Canvas. Voor instructies, zie Amazon SageMaker Canvas instellen en beheren (voor IT-beheerders).
Configureer CORS-beleid (cross-origin resource sharing) voor Canvas. Voor instructies, zie Geef uw gebruikers de mogelijkheid om lokale bestanden te uploaden.

Importeer de dataset

Download eerst de onderhoudsgegevensset en bekijk het bestand om er zeker van te zijn dat alle gegevens aanwezig zijn.

Canvas biedt verschillende voorbeeldgegevenssets in uw toepassing om u op weg te helpen. Zie voor meer informatie over de door SageMaker geleverde voorbeeldgegevenssets waarmee u kunt experimenteren: Gebruik voorbeelddatasets. Als u de voorbeelddataset gebruikt (canvas-sample-maintenance.csv) beschikbaar is binnen Canvas, hoef je de onderhoudsdataset niet te importeren.

Voorspel soorten machinestoringen met machine learning zonder code met behulp van Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.
Je kunt gegevens uit verschillende gegevensbronnen in Canvas importeren. Als u van plan bent uw eigen dataset te gebruiken, volgt u de stappen in Gegevens importeren in Amazon SageMaker Canvas.

Voor dit bericht gebruiken we de volledige onderhoudsdataset die we hebben gedownload.

Log in op AWS-beheerconsole, met een account met de juiste machtigingen om toegang te krijgen tot Canvas.
Log in op de Canvas-console.
Kies import.
Kies Uploaden in en selecteer het maintenance_dataset.csv bestand.
Kies Datums importeren om het naar Canvas te uploaden.

Importeer de dataset

Het importproces duurt ongeveer 10 seconden (dit kan variëren afhankelijk van de grootte van de dataset). Als het klaar is, kun je zien dat de dataset binnen is Ready statuut.

Nadat u hebt bevestigd dat de geïmporteerde dataset is ready, kunt u uw model maken.

Bouw en train het model

Voer de volgende stappen uit om uw model te maken en te trainen:

Kies Nieuw modelen geef een naam op voor uw model.
Kies creëren.
Selecteer het maintenance_dataset.csv gegevensset en kies Selecteer dataset.
In de modelweergave ziet u vier tabbladen, die overeenkomen met de vier stappen om een model te maken en hiermee voorspellingen te genereren: kies, Bouw, Analyseren en Voorspellen.
Op de kies tab, selecteer de maintenance_dataset.csv dataset die je eerder hebt geüpload en kies Selecteer dataset.
Deze dataset bevat 9 kolommen en 10,000 rijen. Canvas gaat automatisch naar de bouwfase.
Kies op dit tabblad de doelkolom, in ons geval Fouttype:.Het onderhoudsteam heeft u laten weten dat deze kolom het type storing aangeeft dat doorgaans wordt gezien op basis van historische gegevens van hun bestaande machines. Dit is wat u uw model wilt trainen om te voorspellen. Canvas detecteert automatisch dat dit een 3 Categorie probleem (ook bekend als classificatie met meerdere klassen). Als het verkeerde modeltype wordt gedetecteerd, kunt u dit handmatig wijzigen met de Van type veranderen optie.
Opgemerkt moet worden dat deze dataset zeer onevenwichtig is ten opzichte van de No Failure-klasse, wat kan worden gezien door de kolom met de naam te bekijken Fouttype:. Hoewel Canvas en de onderliggende AutoML-mogelijkheden de onbalans in de dataset gedeeltelijk aankunnen, kan dit leiden tot een aantal scheve prestaties. Raadpleeg voor een extra volgende stap: Breng uw gegevens in evenwicht voor machine learning met Amazon SageMaker Data Wrangler. Door de stappen in de gedeelde link te volgen, kunt u een Amazon SageMaker Studio app uit de SageMaker-console en importeer deze dataset in Amazon SageMaker-gegevens Wrangler en gebruik de Balance-gegevenstransformatie, breng vervolgens de balanced dataset terug naar Canvas en ga verder met de volgende stappen. We gaan verder met de onevenwichtige dataset in dit bericht om te laten zien dat Canvas ook onevenwichtige datasets aankan.
In de onderste helft van de pagina kunt u enkele statistieken van de dataset bekijken, inclusief ontbrekende en niet-overeenkomende waarden, unieke waarden en gemiddelde en mediane waarden. U kunt ook enkele kolommen laten vallen als u ze niet voor de voorspelling wilt gebruiken door ze eenvoudigweg te deselecteren.
Nadat je dit gedeelte hebt verkend, is het tijd om het model te trainen! Voordat u een compleet model bouwt, is het een goede gewoonte om een algemeen idee te hebben van de modelprestaties door een snel model te trainen. Een snel model traint minder combinaties van modellen en hyperparameters om snelheid boven nauwkeurigheid te stellen, vooral in gevallen waarin u de waarde wilt bewijzen van het trainen van een ML-model voor uw gebruik. Houd er rekening mee dat de optie voor snel bouwen niet beschikbaar is voor modellen die groter zijn dan 50,000 rijen.
Kies Snel gebouwd.

modelbouw in volle gang

Nu wacht je ergens tussen de 2 en 15 minuten. Als je klaar bent, gaat Canvas automatisch naar de Analyseren tabblad om u de resultaten van een snelle training te tonen. De analyse uitgevoerd met behulp van quick build schattingen dat uw model 99.2% van de tijd het juiste type storing (uitkomst) kan voorspellen. Het kan zijn dat u iets andere waarden ervaart. Dit wordt verwacht.

Laten we ons concentreren op het eerste tabblad, Overzicht. Dit is het tabblad dat u de Kolomimpact, of het geschatte belang van elke kolom bij het voorspellen van de doelkolom. In dit voorbeeld hebben de kolommen Koppel [Nm] en Rotatiesnelheid [rpm] de grootste invloed bij het voorspellen van welk type storing zal optreden.

Analyseren - Overzicht

Modelprestaties evalueren

Wanneer u verhuist naar de Scoren deel van uw analyse, kunt u een grafiek zien die de verdeling van onze voorspelde waarden ten opzichte van de werkelijke waarden weergeeft. Merk op dat de meeste storingen binnen de categorie Geen storing vallen. Voor meer informatie over hoe Canvas SHAP-baselines gebruikt om ML uitlegbaar te maken, zie: De prestaties van uw model evalueren in Amazon SageMaker Canvasevenals SHAP-basislijnen voor uitlegbaarheid.
de modelstatistieken evalueren

Canvas splitst de originele dataset vóór de training op in trein- en validatiesets. De score is het resultaat van Canvas die de validatieset toepast op het model. Dit is een interactieve interface waar u het type storing kunt selecteren. Als jij kiest Overbelastingsfout in de afbeelding kunt u zien dat het model deze 84% van de tijd identificeert. Dit is voldoende om actie op te ondernemen - laat een operator of monteur misschien verder controleren. Je kan kiezen Stroomstoring in de afbeelding om de respectieve scores te zien voor verdere interpretatie en acties.

Mogelijk bent u geïnteresseerd in storingstypen en hoe goed het model storingstypen voorspelt op basis van een reeks invoer. Om de resultaten nader te bekijken, kiest u Geavanceerde statistieken. Hierdoor wordt een matrix weergegeven waarmee u de resultaten nauwkeuriger kunt bekijken. In ML wordt dit a . genoemd verwarring matrix.

geavanceerde statistieken

Deze matrix is standaard ingesteld op de dominante klasse, No Failure. Op de Klasse menu, kunt u ervoor kiezen om geavanceerde statistieken van de andere twee storingstypen van Overstrain Failure en Power Failure te bekijken.

In ML wordt de nauwkeurigheid van het model gedefinieerd als het aantal juiste voorspellingen verdeeld over het totale aantal voorspellingen. De blauwe vakken vertegenwoordigen de juiste voorspellingen die het model deed op basis van een subset van testgegevens waarvan de uitkomst bekend was. Hier zijn we geïnteresseerd in welk percentage van de tijd het model een bepaald type machinestoring voorspelde (laten we zeggen: Geen fouten) terwijl het eigenlijk dat fouttype is (Geen fouten). In ML is een verhouding die wordt gebruikt om dit te meten TP / (TP + FN). Dit wordt aangeduid als herinneren. In het standaardgeval, No Failure, waren er 1,923 correcte voorspellingen van 1,926 algemene records, wat resulteerde in 99% herinneren. Als alternatief waren er in de klasse van Overstrain Failure 32 van de 38, wat resulteert in 84% herinneren. Ten slotte waren er in de klasse Stroomuitval 16 van de 19, wat resulteert in 84% herinneren.

Nu heb je twee opties:

U kunt dit model gebruiken om enkele voorspellingen uit te voeren door te kiezen voor Voorspellen.
U kunt een nieuwe versie van dit model maken om te trainen met de Standaard gebouwd keuze. Dit duurt veel langer, ongeveer 1 tot 2 uur, maar biedt een robuuster model omdat het een volledige AutoML-beoordeling van gegevens, algoritmen en tuning-iteraties doorloopt.

Omdat u fouten probeert te voorspellen en het model fouten 84% van de tijd correct voorspelt, kunt u het model vol vertrouwen gebruiken om mogelijke fouten te identificeren. U kunt dus doorgaan naar optie 1. Als u niet zeker was, zou u een datawetenschapper het modelleren van Canvas kunnen laten beoordelen en mogelijke verbeteringen aanbieden via optie 2.

Voorspellingen genereren

Nu het model is getraind, kunt u beginnen met het genereren van voorspellingen.

Kies Voorspellen onderaan de Analyseren pagina, of kies de Voorspellen Tab.
Kies Selecteer dataseten kies het maintenance_dataset.csv bestand.
Kies Voorspellingen genereren.

Canvas gebruikt deze dataset om onze voorspellingen te genereren. Hoewel het over het algemeen een goed idee is om niet dezelfde dataset te gebruiken voor zowel training als testen, kun je in dit geval voor de eenvoud dezelfde dataset gebruiken. U kunt ook enkele records uit uw oorspronkelijke dataset die u voor training gebruikt verwijderen en die records in een CSV-bestand gebruiken en deze hier aan de batchvoorspelling toevoegen, zodat u niet dezelfde dataset gebruikt voor testen na de training.

batchvoorspelling
Na een paar seconden is de voorspelling voltooid. Canvas retourneert een voorspelling voor elke rij met gegevens en de kans dat de voorspelling correct is. Je kan kiezen Voorbeschouwing om de voorspellingen te bekijken, of kies Downloaden om een CSV-bestand met de volledige uitvoer te downloaden.

download voorspelling
U kunt er ook voor kiezen om één voor één waarden te voorspellen door te kiezen voor Enkele voorspelling in plaats van Batchvoorspelling. Canvas toont u een weergave waarin u de waarden voor elke functie handmatig kunt opgeven en een voorspelling kunt genereren. Dit is ideaal voor situaties zoals wat-als-scenario's, bijvoorbeeld: Hoe beïnvloedt de slijtage van het gereedschap het type storing? Wat als de procestemperatuur stijgt of daalt? Wat als de rotatiesnelheid verandert?

enkele voorspelling

Standaard gebouwd

De Standaard gebouwd optie kiest nauwkeurigheid boven snelheid. Als u de artefacten van het model wilt delen met uw datawetenschapper en ML-engineers, kunt u vervolgens een standaardbuild maken.

Kies Versie toevoegen
Kies een nieuwe versie en kies Standaard gebouwd.
Nadat u een standaardversie hebt gemaakt, kunt u het model delen met datawetenschappers en ML-engineers voor verdere evaluatie en iteratie.

Model delen

Opruimen

Om te voorkomen dat u in de toekomst loopt sessiekosten, log uit bij Canvas.
Uitloggen van Canvas

Conclusie

In dit bericht hebben we laten zien hoe een bedrijfsanalist een voorspellingsmodel voor het type machinestoring kan maken met Canvas met behulp van onderhoudsgegevens. Met Canvas kunnen bedrijfsanalisten, zoals betrouwbaarheidsingenieurs, nauwkeurige ML-modellen maken en voorspellingen genereren met behulp van een visuele, aanwijzen-en-klik-interface zonder code. Analisten kunnen dit naar een hoger niveau tillen door hun modellen te delen met collega's van datawetenschappers. Gegevenswetenschappers kunnen het Canvas-model in Studio bekijken, waar ze de gemaakte keuzes kunnen verkennen, modelresultaten kunnen valideren en zelfs het model met een paar klikken in productie kunnen nemen. Dit kan het creëren van waarde op basis van ML versnellen en helpen om verbeterde resultaten sneller te schalen.

Voor meer informatie over het gebruik van Canvas, zie Build, Share, Deploy: hoe bedrijfsanalisten en datawetenschappers een snellere time-to-market bereiken met behulp van no-code ML en Amazon SageMaker Canvas. Voor meer informatie over het maken van ML-modellen met een oplossing zonder code, zie Aankondiging van Amazon SageMaker Canvas - een visuele, no-code machine learning-mogelijkheid voor bedrijfsanalisten.

Over de auteurs

Rajakumar Sampathkumar is een Principal Technical Account Manager bij AWS en biedt klanten begeleiding bij de afstemming van bedrijfstechnologie en ondersteunt de heruitvinding van hun cloud-operatiemodellen en -processen. Hij is gepassioneerd door cloud en machine learning. Raj is ook een machine learning-specialist en werkt samen met AWS-klanten om hun AWS-workloads en architecturen te ontwerpen, implementeren en beheren.

Twan Atkins is Senior Solutions Architect voor Amazon Web Services. Hij is verantwoordelijk voor het werken met klanten in de landbouw, detailhandel en productie om zakelijke problemen te identificeren en achteruit te werken om haalbare en schaalbare technische oplossingen te identificeren. Twann helpt klanten al meer dan 10 jaar bij het plannen en migreren van kritieke workloads met een recente focus op het democratiseren van analytics, kunstmatige intelligentie en machine learning voor klanten en bouwers van morgen.

Omkar Mukadam is een Edge Specialist Solution Architecture bij Amazon Web Services. Hij richt zich momenteel op oplossingen waarmee commerciële klanten effectief kunnen ontwerpen, bouwen en schalen met AWS Edge-serviceaanbiedingen, waaronder maar niet beperkt tot AWS Snow Family.

Tijdstempel: 23 June 2022

Tijdstempel: 30 november 2023

Heruitgegeven door Plato

Introductie van Amazon Textract Bulk Document Uploader voor verbeterde evaluatie en analyse | Amazon-webservices

Hoe BigBasket het afrekenen met AI in hun fysieke winkels verbeterde met Amazon SageMaker | Amazon-webservices

Schaaltraining en inferentie van duizenden ML-modellen met Amazon SageMaker | Amazon-webservices

Maak een HCLS-documentsamenvattingstoepassing met Falcon met behulp van Amazon SageMaker JumpStart | Amazon-webservices

Bereik een vier keer hogere ML-inferentiedoorvoer tegen drie keer lagere kosten per inferentie met Amazon EC2 G5-instanties voor NLP- en CV PyTorch-modellen

ByteDance bespaart tot 60% op inferentiekosten terwijl de latentie wordt verminderd en de doorvoer wordt verhoogd met behulp van AWS Inferentia

Aan de slag met Amazon Titan Text Embeddings V2: een nieuw, geavanceerd insluitingsmodel op Amazon Bedrock | Amazon-webservices

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account