Forutsi typer maskinfeil med maskinlæring uten kode ved å bruke Amazon SageMaker Canvas

Publisert av Platon

Følgere: 0

Å forutsi vanlige maskinfeiltyper er avgjørende i produksjonsindustrien. Gitt et sett med egenskaper til et produkt som er knyttet til en gitt type feil, kan du utvikle en modell som kan forutsi feiltypen når du mater disse attributtene til en maskinlæringsmodell (ML). ML kan hjelpe med innsikt, men frem til nå trengte du ML-eksperter til å bygge modeller for å forutsi maskinfeiltyper, hvis mangel kan forsinke eventuelle korrigerende handlinger som bedrifter trenger for å effektivisere eller forbedre.

I dette innlegget viser vi deg hvordan forretningsanalytikere kan bygge en maskinfeiltype prediksjon ML-modell med Amazon SageMaker Canvas. Canvas gir deg et visuelt pek-og-klikk-grensesnitt som lar deg bygge modeller og generere nøyaktige ML-spådommer på egen hånd – uten å kreve noen ML-erfaring eller å måtte skrive en enkelt linje med kode.

Løsningsoversikt

La oss anta at du er en forretningsanalytiker som er tildelt et vedlikeholdsteam i en stor produksjonsorganisasjon. Vedlikeholdsteamet ditt har bedt deg om å hjelpe til med å forutsi vanlige feil. De har gitt deg et historisk datasett som inneholder egenskaper knyttet til en gitt type feil, og vil gjerne at du skal forutsi hvilken feil som vil oppstå i fremtiden. Feiltypene inkluderer ingen feil, overbelastning og strømfeil. Dataskjemaet er oppført i tabellen nedenfor.

Kolonnenavn	Data-type	Beskrivelse
UID	INT	Unik identifikator fra 1–10,000 XNUMX
Produkt ID	STRING	Består av en bokstav – L, M eller H for lav, middels eller høy – som produktkvalitetsvarianter og et variantspesifikt serienummer
typen	STRING	Startbokstav knyttet til produkt-ID som kun består av L, M eller H
lufttemperatur [K]	DESIMAL	Lufttemperatur spesifisert i kelvin
prosesstemperatur [K]	DESIMAL	Nøyaktig kontrollerte temperaturer for å sikre kvaliteten på en gitt type produkt spesifisert i kelvin
rotasjonshastighet [rpm]	DESIMAL	Rotasjonshastigheten til et objekt som roterer rundt en akse er antall omdreininger til objektet delt på tid, spesifisert som omdreininger per minutt
dreiemoment [Nm]	DESIMAL	Maskinens dreiekraft gjennom en radius, uttrykt i newtonmeter
verktøyslitasje [min]	INT	Verktøyslitasje uttrykt i minutter
feiltype (mål)	STRING	Ingen feil, strømbrudd eller overbelastningsfeil

Etter at feiltypen er identifisert, kan bedrifter iverksette korrigerende tiltak. For å gjøre dette bruker du dataene du har i en CSV-fil, som inneholder visse egenskaper ved et produkt som skissert i tabellen. Du bruker Canvas til å utføre følgende trinn:

Importer vedlikeholdsdatasettet.
Tren og bygg den prediktive maskinvedlikeholdsmodellen.
Analyser modellresultatene.
Test spådommer mot modellen.

Forutsetninger

En skyadministrator med en AWS-konto med passende tillatelser kreves for å fullføre følgende forutsetninger:

Distribuere en Amazon SageMaker domene For instruksjoner, se Ombord på Amazon SageMaker Domain.
Start Canvas. For instruksjoner, se Sette opp og administrere Amazon SageMaker Canvas (for IT-administratorer).
Konfigurer policyer for cross-origin resource sharing (CORS) for Canvas. For instruksjoner, se Gi brukerne dine muligheten til å laste opp lokale filer.

Importer datasettet

Last først ned vedlikeholdsdatasett og se gjennom filen for å sikre at alle dataene er der.

Canvas tilbyr flere eksempeldatasett i applikasjonen din for å hjelpe deg i gang. For å lære mer om de SageMaker-leverte eksempeldatasettene du kan eksperimentere med, se Bruk eksempeldatasett. Hvis du bruker eksempeldatasettet (canvas-sample-maintenance.csv) tilgjengelig i Canvas, trenger du ikke å importere vedlikeholdsdatasettet.

Forutsi typer maskinfeil med maskinlæring uten kode ved å bruke Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.
Du kan importere data fra forskjellige datakilder til Canvas. Hvis du planlegger å bruke ditt eget datasett, følg trinnene i Importere data i Amazon SageMaker Canvas.

For dette innlegget bruker vi hele vedlikeholdsdatasettet som vi lastet ned.

Logg deg på AWS-administrasjonskonsoll, ved å bruke en konto med de riktige tillatelsene for å få tilgang til Canvas.
Logg på Canvas-konsollen.
Velg Import.
Velg Last opp og velg maintenance_dataset.csv filen.
Velg Import datoer for å laste den opp til Canvas.

Importer datasettet

Importprosessen tar omtrent 10 sekunder (dette kan variere avhengig av datasettstørrelsen). Når den er fullført, kan du se at datasettet er inne Ready status.

Etter at du har bekreftet at det importerte datasettet er ready, kan du lage din modell.

Bygg og tren modellen

For å lage og trene modellen din, fullfør følgende trinn:

Velg Ny modell, og oppgi et navn for modellen din.
Velg Opprett.
Velg maintenance_dataset.csv datasett og velg Velg datasett.
I modellvisningen kan du se fire faner, som tilsvarer de fire trinnene for å lage en modell og bruke den til å generere spådommer: Plukke ut, Bygge, Analyserog forutsi.
På Plukke ut Kategorien, velg maintenance_dataset.csv datasett du lastet opp tidligere og velg Velg datasett.
Dette datasettet inkluderer 9 kolonner og 10,000 XNUMX rader. Canvas flyttes automatisk til byggefasen.
På denne fanen velger du målkolonnen, i vårt tilfelle Feiltype.Vedlikeholdsteamet har informert deg om at denne kolonnen angir typen feil som vanligvis sees basert på historiske data fra deres eksisterende maskiner. Det er dette du vil trene modellen din til å forutsi. Canvas oppdager automatisk at dette er en 3 Kategori problem (også kjent som flerklasseklassifisering). Hvis feil modelltype oppdages, kan du endre den manuelt med Endre type alternativet.
Det skal bemerkes at dette datasettet er svært ubalansert i forhold til No Failure-klassen, som kan sees ved å se kolonnen med navn Feiltype. Selv om Canvas og de underliggende AutoML-funksjonene delvis kan håndtere datasett ubalanse, kan dette resultere i noen skjeve ytelser. Som et ekstra neste trinn, se Balanser dataene dine for maskinlæring med Amazon SageMaker Data Wrangler. Ved å følge trinnene i den delte lenken kan du starte en Amazon SageMaker Studio app fra SageMaker-konsollen og importer dette datasettet innenfor Amazon SageMaker Data Wrangler og bruk balansedatatransformasjonen, ta deretter det balanserte datasettet tilbake til Canvas og fortsett følgende trinn. Vi fortsetter med det ubalanserte datasettet i dette innlegget for å vise at Canvas også kan håndtere ubalanserte datasett.
I den nedre halvdelen av siden kan du se på noe av statistikken til datasettet, inkludert manglende og feilaktige verdier, unike verdier og gjennomsnitts- og medianverdier. Du kan også droppe noen av kolonnene hvis du ikke vil bruke dem til prediksjonen ved å fjerne merket for dem.
Etter at du har utforsket denne delen, er det på tide å trene modellen! Før du bygger en komplett modell, er det en god praksis å ha en generell idé om modellens ytelse ved å trene en hurtigmodell. En rask modell trener færre kombinasjoner av modeller og hyperparametere for å prioritere hastighet fremfor nøyaktighet, spesielt i tilfeller der du ønsker å bevise verdien av å trene en ML-modell for ditt bruksområde. Merk at hurtigbyggingsalternativet ikke er tilgjengelig for modeller større enn 50,000 XNUMX rader.
Velg Rask bygging.

modellbygging pågår

Nå venter du alt fra 2–15 minutter. Når det er gjort, flytter Canvas automatisk til Analyser fanen for å vise deg resultatene av rask trening. Analysen utført ved hjelp av hurtigbygging anslår at modellen din er i stand til å forutsi riktig feiltype (utfall) 99.2 % av tiden. Du kan oppleve litt forskjellige verdier. Dette er forventet.

La oss fokusere på den første fanen, Oversikt. Dette er fanen som viser deg Kolonnepåvirkning, eller den estimerte betydningen av hver kolonne for å forutsi målkolonnen. I dette eksemplet har kolonnene Moment [Nm] og Rotasjonshastighet [rpm] den største innvirkningen når det gjelder å forutsi hvilken type feil som vil oppstå.

Analyser - Oversikt

Evaluer modellens ytelse

Når du flytter til Scoring del av analysen din, kan du se et plott som representerer fordelingen av våre anslåtte verdier i forhold til de faktiske verdiene. Legg merke til at de fleste feil vil være innenfor kategorien Ingen feil. For å lære mer om hvordan Canvas bruker SHAP-grunnlinjer for å gi ML forklaring, se Evaluering av modellens ytelse i Amazon SageMaker Canvas, i tillegg til SHAP-grunnlinjer for forklarbarhet.
evaluere modellberegningene

Canvas deler opp det originale datasettet i tog- og valideringssett før opplæringen. Poengsettingen er et resultat av at Canvas kjører valideringssettet mot modellen. Dette er et interaktivt grensesnitt der du kan velge feiltype. Hvis du velger Overbelastningssvikt i grafikken kan du se at modellen identifiserer disse 84 % av tidene. Dette er godt nok til å iverksette tiltak – kanskje få en operatør eller ingeniør til å sjekke nærmere. Du kan velge Strømbrudd i grafikken for å se den respektive poengsummen for videre tolkning og handlinger.

Du kan være interessert i feiltyper og hvor godt modellen forutsier feiltyper basert på en rekke inndata. For å se nærmere på resultatene, velg Avanserte beregninger. Dette viser en matrise som lar deg undersøke resultatene nærmere. I ML omtales dette som en forvirringsmatrise.

avanserte beregninger

Denne matrisen er standard til den dominerende klassen, No Failure. På Klasse menyen kan du velge å vise avanserte beregninger for de to andre feiltypene Overbelastningsfeil og Strømsvikt.

I ML er nøyaktigheten til modellen definert som antall korrekte prediksjoner fordelt på det totale antallet prediksjoner. De blå boksene representerer korrekte spådommer som modellen gjorde mot et undersett av testdata der det var et kjent utfall. Her er vi interessert i hvor mange prosent av tiden modellen spådde en bestemt maskinfeiltype (la oss si Ingen feil) når det faktisk er den feiltypen (Ingen feil). I ML er et forhold som brukes til å måle dette TP / (TP + FN). Dette omtales som husker. I standardtilfellet, No Failure, var det 1,923 1,926 korrekte spådommer av 99 XNUMX samlede poster, noe som resulterte i XNUMX % husker. Alternativt, i klassen overbelastningssvikt, var det 32 av 38, noe som resulterer i 84 % husker. Til slutt, i klassen Strømsvikt, var det 16 av 19, noe som resulterer i 84 % husker.

Nå har du to alternativer:

Du kan bruke denne modellen til å kjøre noen spådommer ved å velge forutsi.
Du kan lage en ny versjon av denne modellen for å trene med Standard konstruksjon alternativ. Dette vil ta mye lengre tid – omtrent 1–2 timer – men gir en mer robust modell fordi den går gjennom en full AutoML-gjennomgang av data, algoritmer og tuningiterasjoner.

Fordi du prøver å forutsi feil, og modellen forutsier feil riktig 84 % av tiden, kan du trygt bruke modellen til å identifisere mulige feil. Så du kan gå videre til alternativ 1. Hvis du ikke var sikker, kan du få en dataforsker til å se gjennom modelleringen Canvas gjorde og tilby potensielle forbedringer via alternativ 2.

Generer spådommer

Nå som modellen er opplært, kan du begynne å generere spådommer.

Velg forutsi på bunnen av Analyser side, eller velg forutsi fanen.
Velg Velg datasett, og velg maintenance_dataset.csv filen.
Velg Generer spådommer.

Canvas bruker dette datasettet til å generere våre spådommer. Selv om det generelt er en god idé å ikke bruke samme datasett til både trening og testing, kan du bruke samme datasett for enkelhets skyld i dette tilfellet. Alternativt kan du fjerne noen poster fra det opprinnelige datasettet som du bruker til trening og bruke disse postene i en CSV-fil og mate den til batchprediksjonen her, slik at du ikke bruker det samme datasettet for testing etter trening.

batch prediksjon
Etter noen sekunder er spådommen fullført. Canvas returnerer en prediksjon for hver rad med data og sannsynligheten for at prediksjonen er korrekt. Du kan velge Forhåndsvisning for å se spådommene, eller velg Last ned for å laste ned en CSV-fil som inneholder hele utdataene.

nedlastingsprediksjon
Du kan også velge å forutsi en etter en verdi ved å velge Enkel prediksjon istedenfor Batch prediksjon. Canvas viser deg en visning der du kan angi verdiene for hver funksjon manuelt og generere en prediksjon. Dette er ideelt for situasjoner som hva-hvis-scenarier, for eksempel: Hvordan påvirker verktøyslitasjen feiltypen? Hva om prosesstemperaturen øker eller synker? Hva om rotasjonshastigheten endres?

enkelt prediksjon

Standard konstruksjon

De Standard konstruksjon alternativet velger nøyaktighet fremfor hastighet. Hvis du vil dele artefaktene til modellen med dataforskeren og ML-ingeniørene dine, kan du lage en standardkonstruksjon neste gang.

Velg Legg til versjon
Velg en ny versjon og velg Standard konstruksjon.
Etter at du har opprettet en standardkonstruksjon, kan du dele modellen med dataforskere og ML-ingeniører for videre evaluering og iterasjon.

Del modell

Rydd opp

For å unngå å pådra seg fremtid øktavgifter, logg ut av Canvas.

konklusjonen

I dette innlegget viste vi hvordan en forretningsanalytiker kan lage en prediksjonsmodell for maskinfeiltype med Canvas ved å bruke vedlikeholdsdata. Canvas lar forretningsanalytikere som pålitelighetsingeniører lage nøyaktige ML-modeller og generere spådommer ved å bruke et visuelt, pek-og-klikk-grensesnitt uten kode. Analytikere kan ta dette til neste nivå ved å dele modellene sine med kollegaer fra dataforskere. Dataforskere kan se Canvas-modellen i Studio, der de kan utforske valgene Canvas har gjort, validere modellresultater og til og med ta modellen til produksjon med noen få klikk. Dette kan akselerere ML-basert verdiskaping og bidra til å skalere forbedrede resultater raskere.

For å lære mer om bruk av Canvas, se Bygg, del, distribuer: hvordan forretningsanalytikere og dataforskere oppnår raskere time-to-market ved å bruke no-code ML og Amazon SageMaker Canvas. For mer informasjon om å lage ML-modeller med en kodefri løsning, se Kunngjøring av Amazon SageMaker Canvas – en visuell maskinlæringsevne uten kode for forretningsanalytikere.

Om forfatterne

Rajakumar Sampathkumar er en Principal Technical Account Manager hos AWS, og gir kundene veiledning om justering av forretningsteknologi og støtter gjenoppfinnelsen av deres skyoperasjonsmodeller og -prosesser. Han er lidenskapelig opptatt av sky og maskinlæring. Raj er også en maskinlæringsspesialist og jobber med AWS-kunder for å designe, distribuere og administrere AWS-arbeidsmengdene og -arkitekturene deres.

Twann Atkins er en senior løsningsarkitekt for Amazon Web Services. Han er ansvarlig for å jobbe med kunder innen landbruk, detaljhandel og produksjon for å identifisere forretningsproblemer og jobbe bakover for å identifisere levedyktige og skalerbare tekniske løsninger. Twann har hjulpet kunder med å planlegge og migrere kritiske arbeidsbelastninger i mer enn 10 år med et nylig fokus på demokratisering av analyser, kunstig intelligens og maskinlæring for fremtidens kunder og byggere.

Omkar Mukadam er en Edge Specialist Solution Architecture hos Amazon Web Services. Han fokuserer for tiden på løsninger som gjør kommersielle kunder i stand til effektivt å designe, bygge og skalere med AWS Edge-tjenestetilbud som inkluderer, men ikke begrenset til, AWS Snow Family.