Forudsigelse af almindelige maskinfejlstyper er afgørende i fremstillingsindustrien. Givet et sæt karakteristika for et produkt, der er knyttet til en given type fejl, kan du udvikle en model, der kan forudsige fejltypen, når du leverer disse egenskaber til en maskinlæringsmodel (ML). ML kan hjælpe med indsigt, men indtil nu havde du brug for ML-eksperter til at bygge modeller til at forudsige typer af maskinfejl, hvis mangel kunne forsinke eventuelle korrigerende handlinger, som virksomheder har brug for for at effektivisere eller forbedre.
I dette indlæg viser vi dig, hvordan forretningsanalytikere kan bygge en maskinfejlstype forudsigelse ML-model med Amazon SageMaker lærred. Canvas giver dig en visuel peg-og-klik-grænseflade, der giver dig mulighed for at bygge modeller og generere nøjagtige ML-forudsigelser på egen hånd – uden at kræve nogen ML-erfaring eller at skulle skrive en enkelt linje kode.
Løsningsoversigt
Lad os antage, at du er en forretningsanalytiker, der er tilknyttet et vedligeholdelsesteam i en stor produktionsorganisation. Dit vedligeholdelsesteam har bedt dig om at hjælpe med at forudsige almindelige fejl. De har givet dig et historisk datasæt, der indeholder karakteristika knyttet til en given type fejl og vil gerne have dig til at forudsige, hvilken fejl der vil opstå i fremtiden. Fejltyperne omfatter Ingen fejl, Overbelastning og Strømsvigt. Dataskemaet er angivet i følgende tabel.
Kolonnenavn | Datatype | Beskrivelse |
UID | INT | Unik identifikator fra 1-10,000 |
produkt-id | STRING | Bestående af et bogstav – L, M eller H for lav, medium eller høj – som produktkvalitetsvarianter og et variantspecifikt serienummer |
typen | STRING | Startbogstav knyttet til produkt-ID, der kun består af L, M eller H |
lufttemperatur [K] | DECIMAL | Lufttemperatur angivet i kelvin |
procestemperatur [K] | DECIMAL | Præcis kontrollerede temperaturer for at sikre kvaliteten af en given type produkt specificeret i kelvin |
rotationshastighed [rpm] | DECIMAL | Rotationshastigheden for et objekt, der roterer omkring en akse, er antallet af omdrejninger af objektet divideret med tiden, angivet som omdrejninger pr. |
drejningsmoment [Nm] | DECIMAL | Maskinens drejekraft gennem en radius, udtrykt i newtonmeter |
værktøjsslid [min] | INT | Værktøjsslid udtrykt i minutter |
fejltype (mål) | STRING | Ingen fejl, strømsvigt eller overbelastningsfejl |
Når fejltypen er identificeret, kan virksomhederne foretage eventuelle korrigerende handlinger. For at gøre dette, bruger du de data, du har i en CSV-fil, som indeholder visse egenskaber ved et produkt som skitseret i tabellen. Du bruger Canvas til at udføre følgende trin:
- Importer vedligeholdelsesdatasættet.
- Træn og byg den forudsigende maskinvedligeholdelsesmodel.
- Analyser modellens resultater.
- Test forudsigelser mod modellen.
Forudsætninger
En cloud-administrator med en AWS-konto med passende tilladelser er påkrævet for at opfylde følgende forudsætninger:
- Indsæt en Amazon SageMaker domæne For instruktioner, se Ombord på Amazon SageMaker Domain.
- Start Canvas. For instruktioner, se Opsætning og administration af Amazon SageMaker Canvas (til it-administratorer).
- Konfigurer CORS-politikker (cross-origin ressource sharing) for Canvas. For instruktioner, se Giv dine brugere mulighed for at uploade lokale filer.
Importer datasættet
Først skal du downloade vedligeholdelsesdatasæt og gennemgå filen for at sikre dig, at alle data er der.
Canvas tilbyder flere eksempeldatasæt i din applikation for at hjælpe dig i gang. For at lære mere om de SageMaker-leverede eksempeldatasæt, du kan eksperimentere med, se Brug eksempeldatasæt. Hvis du bruger eksempeldatasættet (canvas-sample-maintenance.csv
) tilgængelig i Canvas, behøver du ikke importere vedligeholdelsesdatasættet.
Du kan importere data fra forskellige datakilder til Canvas. Hvis du planlægger at bruge dit eget datasæt, skal du følge trinene i Import af data i Amazon SageMaker Canvas.
Til dette indlæg bruger vi det fulde vedligeholdelsesdatasæt, som vi downloadede.
- Log ind på AWS Management Console, ved at bruge en konto med de relevante tilladelser til at få adgang til Canvas.
- Log ind på Canvas-konsollen.
- Vælg Importere.
- Vælg Upload og vælg
maintenance_dataset.csv
fil. - Vælg Import datoer for at uploade det til Canvas.
Importprocessen tager cirka 10 sekunder (dette kan variere afhængigt af datasættets størrelse). Når det er færdigt, kan du se, at datasættet er inde Ready
status.
Når du har bekræftet, at det importerede datasæt er ready
, kan du oprette din model.
Byg og træne modellen
For at oprette og træne din model skal du udføre følgende trin:
- Vælg Ny model, og angiv et navn til din model.
- Vælg Opret.
- Vælg
maintenance_dataset.csv
datasæt og vælg Vælg datasæt.
I modelvisningen kan du se fire faner, som svarer til de fire trin til at oprette en model og bruge den til at generere forudsigelser: Type, Byg, Analyserog Forudsige. - På Type Fanebladet, vælg
maintenance_dataset.csv
datasæt, du har uploadet tidligere, og vælg Vælg datasæt.
Dette datasæt indeholder 9 kolonner og 10,000 rækker. Lærred flytter automatisk til byggefasen. - På denne fane skal du vælge målkolonnen, i vores tilfælde Fejltype.Vedligeholdelsesteamet har informeret dig om, at denne kolonne angiver typen af fejl, der typisk ses baseret på historiske data fra deres eksisterende maskiner. Det er det, du vil træne din model til at forudsige. Canvas registrerer automatisk, at dette er en 3 Kategori problem (også kendt som multi-klasse klassifikation). Hvis den forkerte modeltype opdages, kan du ændre den manuelt med Skift type valgmulighed.
Det skal bemærkes, at dette datasæt er meget ubalanceret i forhold til No Failure-klassen, hvilket kan ses ved at se kolonnen med navnet Fejltype. Selvom Canvas og de underliggende AutoML-kapaciteter delvist kan håndtere datasætubalance, kan dette resultere i nogle skæve ydeevner. Som et yderligere næste trin henvises til Balancer dine data til maskinlæring med Amazon SageMaker Data Wrangler. Ved at følge trinene i det delte link kan du starte en Amazon SageMaker Studio app fra SageMaker-konsollen og importer dette datasæt indenfor Amazon SageMaker Data Wrangler og brug Balance-datatransformationen, tag derefter det balancerede datasæt tilbage til Canvas og fortsæt med følgende trin. Vi fortsætter med det ubalancerede datasæt i dette indlæg for at vise, at Canvas også kan håndtere ubalancerede datasæt.
I den nederste halvdel af siden kan du se nogle af datasættets statistik, herunder manglende og uoverensstemmende værdier, unikke værdier og middelværdier og medianværdier. Du kan også droppe nogle af kolonnerne, hvis du ikke vil bruge dem til forudsigelsen ved blot at fravælge dem.
Når du har udforsket dette afsnit, er det tid til at træne modellen! Før du bygger en komplet model, er det en god praksis at have en generel idé om modellens ydeevne ved at træne en hurtig model. En hurtig model træner færre kombinationer af modeller og hyperparametre for at prioritere hastighed frem for nøjagtighed, især i tilfælde, hvor du ønsker at bevise værdien af at træne en ML-model til din use case. Bemærk, at muligheden for hurtig opbygning ikke er tilgængelig for modeller, der er større end 50,000 rækker. - Vælg Hurtig opbygning.
Nu venter du alt fra 2-15 minutter. Når det er gjort, flytter Canvas automatisk til Analyser fanen for at vise dig resultaterne af hurtig træning. Analysen udført ved hjælp af quick build estimerer, at din model er i stand til at forudsige den rigtige fejltype (udfald) 99.2 % af tiden. Du kan opleve lidt forskellige værdier. Dette forventes.
Lad os fokusere på den første fane, Oversigt. Dette er fanen, der viser dig Kolonnepåvirkning, eller den anslåede betydning af hver kolonne i forudsigelse af målkolonnen. I dette eksempel har kolonnerne drejningsmoment [Nm] og rotationshastighed [rpm] den mest signifikante indflydelse på at forudsige, hvilken type fejl der vil opstå.
Evaluer modellens ydeevne
Når du flytter til Scoring del af din analyse, kan du se et plot, der repræsenterer fordelingen af vores forudsagte værdier i forhold til de faktiske værdier. Bemærk, at de fleste fejl vil være inden for kategorien Ingen fejl. For at lære mere om, hvordan Canvas bruger SHAP-baselines til at bringe forklaring til ML, se Evaluering af din models ydeevne i Amazon SageMaker Canvas, såvel som SHAP-grundlag for forklaring.
Canvas opdeler det originale datasæt i tog- og valideringssæt før træningen. Scoringen er et resultat af, at Canvas kører valideringssættet mod modellen. Dette er en interaktiv grænseflade, hvor du kan vælge fejltype. Hvis du vælger Overbelastningsfejl i grafikken kan du se, at modellen identificerer disse 84 % af tiden. Dette er godt nok til at handle på – måske få en operatør eller ingeniør til at tjekke nærmere. Du kan vælge Strømsvigt i grafikken for at se den respektive scoring for yderligere fortolkning og handlinger.
Du kan være interesseret i fejltyper og hvor godt modellen forudsiger fejltyper baseret på en række input. For at se nærmere på resultaterne, vælg Avancerede målinger. Dette viser en matrix, der giver dig mulighed for at undersøge resultaterne nærmere. I ML omtales dette som en forvirringsmatrix.
Denne matrix er som standard den dominerende klasse, No Failure. På den Klasse menuen, kan du vælge at se avancerede målinger for de to andre fejltyper af Overbelastningsfejl og Strømsvigt.
I ML er modellens nøjagtighed defineret som antallet af korrekte forudsigelser fordelt på det samlede antal forudsigelser. De blå felter repræsenterer korrekte forudsigelser, som modellen lavede mod en delmængde af testdata, hvor der var et kendt resultat. Her er vi interesseret i, hvor stor en procentdel af tiden modellen forudsagde en bestemt type maskinfejl (lad os sige Ingen fiasko) når det faktisk er den fejltype (Ingen fiasko). I ML er et forhold, der bruges til at måle dette, TP / (TP + FN). Dette omtales som tilbagekaldelse. I standardtilfældet, No Failure, var der 1,923 korrekte forudsigelser ud af 1,926 samlede rekorder, hvilket resulterede i 99 % tilbagekaldelse. Alternativt var der i klassen overbelastningsfejl 32 ud af 38, hvilket resulterer i 84 % tilbagekaldelse. Til sidst, i klassen Strømsvigt, var der 16 ud af 19, hvilket resulterer i 84 % tilbagekaldelse.
Nu har du to muligheder:
- Du kan bruge denne model til at køre nogle forudsigelser ved at vælge Forudsige.
- Du kan oprette en ny version af denne model for at træne med Standard opbygning mulighed. Dette vil tage meget længere tid - omkring 1-2 timer - men giver en mere robust model, fordi den gennemgår en fuld AutoML-gennemgang af data, algoritmer og tuning iterationer.
Fordi du forsøger at forudsige fejl, og modellen forudsiger fejl korrekt 84 % af tiden, kan du trygt bruge modellen til at identificere mulige fejl. Så du kan gå videre til mulighed 1. Hvis du ikke var sikker, kunne du få en dataforsker til at gennemgå den modellering, Canvas gjorde, og tilbyde potentielle forbedringer via mulighed 2.
Generer forudsigelser
Nu hvor modellen er trænet, kan du begynde at generere forudsigelser.
- Vælg Forudsige i bunden af Analyser side, eller vælg Forudsige fane.
- Vælg Vælg datasæt, og vælg
maintenance_dataset.csv
fil. - Vælg Generer forudsigelser.
Canvas bruger dette datasæt til at generere vores forudsigelser. Selvom det generelt er en god idé ikke at bruge det samme datasæt til både træning og test, kan du bruge det samme datasæt for nemheds skyld i dette tilfælde. Alternativt kan du fjerne nogle poster fra dit originale datasæt, som du bruger til træning, og bruge disse poster i en CSV-fil og føre det til batchforudsigelsen her, så du ikke bruger det samme datasæt til at teste eftertræning.
Efter et par sekunder er forudsigelsen fuldført. Canvas returnerer en forudsigelse for hver række data og sandsynligheden for, at forudsigelsen er korrekt. Du kan vælge Eksempel for at se forudsigelserne, eller vælg Hent for at downloade en CSV-fil, der indeholder det fulde output.
Du kan også vælge at forudsige én efter én værdier ved at vælge Enkelt forudsigelse i stedet for Batch forudsigelse. Canvas viser dig en visning, hvor du kan angive værdierne for hver funktion manuelt og generere en forudsigelse. Dette er ideelt til situationer som hvad-hvis-scenarier, for eksempel: Hvordan påvirker værktøjsslitagen fejltypen? Hvad hvis procestemperaturen stiger eller falder? Hvad hvis omdrejningshastigheden ændres?
Standard opbygning
Standard opbygning option vælger nøjagtighed frem for hastighed. Hvis du vil dele modellens artefakter med din datavidenskabsmand og ML-ingeniører, kan du oprette en standardopbygning næste gang.
- Vælg Tilføj version
- Vælg en ny version og vælg Standard opbygning.
- Når du har oprettet en standardbuild, kan du dele modellen med datavidenskabsmænd og ML-ingeniører til yderligere evaluering og iteration.
Ryd op
For at undgå at pådrage sig fremtid sessionsafgifter, log ud af Canvas.
Konklusion
I dette indlæg viste vi, hvordan en forretningsanalytiker kan skabe en forudsigelsesmodel for maskinfejl med Canvas ved hjælp af vedligeholdelsesdata. Canvas giver forretningsanalytikere såsom pålidelighedsingeniører mulighed for at skabe nøjagtige ML-modeller og generere forudsigelser ved hjælp af en kodefri, visuel, peg-og-klik-grænseflade. Analytikere kan tage dette til næste niveau ved at dele deres modeller med kollegaer fra dataforskere. Dataforskere kan se Canvas-modellen i Studio, hvor de kan udforske de valg, Canvas har foretaget, validere modelresultater og endda tage modellen til produktion med et par klik. Dette kan fremskynde ML-baseret værdiskabelse og hjælpe med at skalere forbedrede resultater hurtigere.
For at lære mere om brug af Canvas, se Byg, del, implementer: hvordan forretningsanalytikere og dataforskere opnår hurtigere time-to-market ved hjælp af no-code ML og Amazon SageMaker Canvas. For mere information om oprettelse af ML-modeller med en kodefri løsning, se Annoncering af Amazon SageMaker Canvas – en visuel, ingen kode maskinindlæringskapacitet for forretningsanalytikere.
Om forfatterne
Rajakumar Sampathkumar er en Principal Technical Account Manager hos AWS, der giver kunderne vejledning om forretningsteknologisk tilpasning og understøtter genopfindelsen af deres cloud-driftsmodeller og -processer. Han brænder for cloud og machine learning. Raj er også maskinlæringsspecialist og arbejder med AWS-kunder for at designe, implementere og administrere deres AWS-arbejdsbelastninger og -arkitekturer.
Twann Atkins er Senior Solutions Architect for Amazon Web Services. Han er ansvarlig for at arbejde med kunder inden for landbrug, detailhandel og fremstilling for at identificere forretningsproblemer og arbejde baglæns for at identificere levedygtige og skalerbare tekniske løsninger. Twann har hjulpet kunder med at planlægge og migrere kritiske arbejdsbelastninger i mere end 10 år med et nyligt fokus på demokratisering af analyser, kunstig intelligens og maskinlæring for fremtidens kunder og bygherrer.
Omkar Mukadam er en Edge Specialist Solution Architecture hos Amazon Web Services. Han fokuserer i øjeblikket på løsninger, der sætter kommercielle kunder i stand til effektivt at designe, bygge og skalere med AWS Edge-servicetilbud, som omfatter, men ikke begrænset til, AWS Snow Family.
- Coinsmart. Europas bedste Bitcoin og Crypto Exchange.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. FRI ADGANG.
- CryptoHawk. Altcoin radar. Gratis prøveversion.
- Kilde: https://aws.amazon.com/blogs/machine-learning/predict-types-of-machine-failures-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 9
- a
- evne
- Om
- fremskynde
- adgang
- Konto
- præcis
- opnå
- Handling
- aktioner
- Yderligere
- admin
- administratorer
- fremskreden
- mod
- Landbrug
- algoritmer
- Alle
- tillader
- Skønt
- Amazon
- Amazon Web Services
- analysere
- analyse
- analytiker
- analytics
- overalt
- app
- Anvendelse
- passende
- cirka
- arkitektur
- omkring
- kunstig
- kunstig intelligens
- Kunstig intelligens og maskinlæring
- tildelt
- forbundet
- attributter
- automatisk
- til rådighed
- AWS
- Axis
- fordi
- før
- være
- større
- grænse
- bringe
- bygge
- Bygning
- virksomhed
- virksomheder
- canvas
- kapaciteter
- tilfælde
- tilfælde
- Boligtype
- vis
- lave om
- valg
- Vælg
- klasse
- tættere
- Cloud
- kode
- kolleger
- Kolonne
- kombinationer
- kommerciel
- Fælles
- fuldføre
- sikker
- Konsol
- indeholder
- fortsæt
- kunne
- skabe
- Oprettelse af
- skabelse
- kritisk
- For øjeblikket
- Kunder
- data
- dataforsker
- forsinkelse
- Afhængigt
- indsætte
- Design
- opdaget
- udvikle
- DID
- forskellige
- displays
- fordeling
- domæne
- downloade
- Drop
- hver
- Edge
- effektivt
- muliggør
- ingeniør
- Ingeniører
- især
- anslået
- skøn
- evaluere
- evaluering
- eksempel
- eksisterende
- forventet
- erfaring
- eksperiment
- eksperter
- udforske
- udtrykt
- Manglende
- familie
- hurtigere
- Feature
- Fornavn
- Fokus
- fokuserer
- følger
- efter
- fra
- fuld
- yderligere
- fremtiden
- Generelt
- generelt
- generere
- generere
- godt
- håndtere
- have
- hjælpe
- hjælpe
- link.
- stærkt
- historisk
- Hvordan
- HTTPS
- idé
- ideal
- identificere
- KIMOs Succeshistorier
- betydning
- forbedret
- omfatter
- omfatter
- Herunder
- industrier
- oplysninger
- informeret
- indsigt
- Intelligens
- interaktiv
- interesseret
- grænseflade
- fortolkning
- IT
- kendt
- stor
- lancere
- LÆR
- læring
- Niveau
- Limited
- Line (linje)
- LINK
- Børsnoterede
- lokale
- Se
- maskine
- machine learning
- Maskiner
- lavet
- vedligeholdelse
- lave
- administrere
- ledelse
- leder
- styring
- manuelt
- Produktion
- Matrix
- måle
- medium
- Metrics
- ML
- model
- modeller
- mere
- mest
- bevæge sig
- næste
- bemærkede
- nummer
- tilbyde
- tilbud
- drift
- operatør
- Option
- Indstillinger
- ordrer
- organisation
- original
- Andet
- samlet
- egen
- særlig
- lidenskabelige
- procentdel
- ydeevne
- forestillinger
- fase
- politikker
- mulig
- potentiale
- magt
- praksis
- forudsige
- forudsigelse
- Forudsigelser
- Main
- Problem
- problemer
- behandle
- Processer
- Produkt
- Produktkvalitet
- produktion
- give
- forudsat
- giver
- leverer
- kvalitet
- Hurtig
- spænder
- nylige
- optegnelser
- repræsentere
- repræsenterer
- påkrævet
- ressource
- ansvarlige
- Resultater
- detail
- afkast
- gennemgå
- Kør
- kører
- samme
- skalerbar
- Scale
- Videnskabsmand
- forskere
- scoring
- sekunder
- seriel
- Series
- tjeneste
- Tjenester
- sæt
- flere
- Del
- delt
- deling
- Vis
- signifikant
- enkelt
- Størrelse
- sne
- So
- solid
- løsninger
- Løsninger
- nogle
- specialist
- hastighed
- splits
- standard
- starte
- påbegyndt
- statistik
- Status
- Studio
- Støtte
- mål
- hold
- Teknisk
- prøve
- Test
- Gennem
- Tied
- tid
- i morgen
- værktøj
- mod
- Kurser
- tog
- Transformation
- typer
- typisk
- enestående
- brug
- brugere
- validering
- værdi
- udgave
- Specifikation
- vente
- web
- webservices
- Hvad
- inden for
- arbejder
- virker
- ville
- år
- Din