Preziceți tipurile de defecțiuni ale mașinii cu învățarea automată fără cod folosind Amazon SageMaker Canvas

Republicat de Platon

Urmaritori: 0

Prezicerea tipurilor comune de defecțiuni ale mașinii este esențială în industriile de producție. Având în vedere un set de caracteristici ale unui produs care este legat de un anumit tip de defecțiune, puteți dezvolta un model care poate prezice tipul de defecțiune atunci când alimentați acele atribute unui model de învățare automată (ML). ML poate ajuta cu informații, dar până acum aveai nevoie de experți ML pentru a construi modele pentru a prezice tipurile de defecțiuni ale mașinii, a căror lipsă ar putea întârzia orice acțiuni corective de care companiile au nevoie pentru eficiență sau îmbunătățire.

În această postare, vă arătăm cum analiștii de afaceri pot construi un model ML de predicție a tipului de eșec al mașinii Amazon SageMaker Canvas. Canvas vă oferă o interfață vizuală point-and-click care vă permite să construiți modele și să generați singur predicții ML precise, fără a necesita experiență ML sau a fi nevoie să scrieți o singură linie de cod.

Prezentare generală a soluțiilor

Să presupunem că sunteți un analist de afaceri alocat unei echipe de întreținere a unei mari organizații de producție. Echipa dvs. de întreținere v-a cerut să ajutați la prezicerea defecțiunilor comune. Ei v-au oferit un set de date istorice care conține caracteristici legate de un anumit tip de defecțiune și ar dori să preziceți ce defecțiune va avea loc în viitor. Tipurile de defecțiuni includ Fără defecțiune, suprasolicitare și întreruperi de alimentare. Schema de date este listată în tabelul următor.

Nume coloană	Tipul de date	Descriere
UID	INT	Identificator unic cuprins între 1 și 10,000
productID	STRING	Constând dintr-o literă – L, M sau H pentru low, mediu sau înalt – ca variante de calitate a produsului și un număr de serie specific variantei
tip	STRING	Litera inițială asociată cu productID constând numai din L, M sau H
temperatura aerului [K]	ZECIMAL	Temperatura aerului specificată în kelvin
temperatura procesului [K]	ZECIMAL	Temperaturi controlate cu precizie pentru a asigura calitatea unui anumit tip de produs specificat în kelvin
viteza de rotatie [rpm]	ZECIMAL	Viteza de rotație a unui obiect care se rotește în jurul unei axe este numărul de rotații ale obiectului împărțit la timp, specificat ca rotații pe minut
cuplu [Nm]	ZECIMAL	Forța de rotire a mașinii printr-o rază, exprimată în newtoni metri
uzura sculei [min]	INT	Uzura sculei exprimată în minute
tip de eșec (țintă)	STRING	Fără defecțiune, întrerupere de alimentare sau întrerupere prin suprasolicitare

După ce tipul de eșec este identificat, companiile pot lua orice acțiuni corective. Pentru a face acest lucru, utilizați datele pe care le aveți într-un fișier CSV, care conține anumite caracteristici ale unui produs, așa cum sunt prezentate în tabel. Utilizați Canvas pentru a efectua următorii pași:

Importați setul de date de întreținere.
Antrenează și construiește modelul de întreținere predictivă a mașinii.
Analizați rezultatele modelului.
Testați predicțiile față de model.

Cerințe preliminare

Un administrator cloud cu un Cont AWS cu permisiunile corespunzătoare este necesar pentru a îndeplini următoarele cerințe preliminare:

Implementați un Amazon SageMaker domeniu Pentru instrucțiuni, consultați Integrat la domeniul Amazon SageMaker.
Lansați Canvas. Pentru instrucțiuni, vezi Configurarea și gestionarea Amazon SageMaker Canvas (pentru administratorii IT).
Configurați politicile de partajare a resurselor între origini (CORS) pentru Canvas. Pentru instrucțiuni, vezi Oferiți utilizatorilor posibilitatea de a încărca fișiere locale.

Importați setul de date

Mai întâi, descărcați fișierul set de date de întreținere și examinați fișierul pentru a vă asigura că toate datele sunt acolo.

Canvas oferă câteva exemple de seturi de date în aplicația dvs. pentru a vă ajuta să începeți. Pentru a afla mai multe despre seturile de date eșantion furnizate de SageMaker pe care le puteți experimenta, consultați Utilizați mostre de seturi de date. Dacă utilizați setul de date eșantion (canvas-sample-maintenance.csv) disponibil în Canvas, nu trebuie să importați setul de date de întreținere.

Preziceți tipurile de defecțiuni ale mașinii cu învățarea automată fără cod folosind Amazon SageMaker Canvas PlatoBlockchain Data Intelligence. Căutare verticală. Ai.
Puteți importa date din diferite surse de date în Canvas. Dacă intenționați să utilizați propriul set de date, urmați pașii din Importarea datelor în Amazon SageMaker Canvas.

Pentru această postare, folosim setul complet de date de întreținere pe care l-am descărcat.

Conectați-vă la Consola de administrare AWS, folosind un cont cu permisiunile corespunzătoare pentru a accesa Canvas.
Conectați-vă la consola Canvas.
Alege Import.
Alege Încărcați Și selectați maintenance_dataset.csv fișier.
Alege Date de import pentru a-l încărca pe Canvas.

Importați setul de date

Procesul de import durează aproximativ 10 secunde (aceasta poate varia în funcție de dimensiunea setului de date). Când este complet, puteți vedea setul de date Ready stare.

După ce confirmați că setul de date importat este ready, vă puteți crea modelul.

Construiește și antrenează modelul

Pentru a crea și antrena modelul dvs., parcurgeți următorii pași:

Alege Noul modelși furnizați un nume pentru modelul dvs.
Alege Crea.
selectaţi maintenance_dataset.csv set de date și alegeți Selectați setul de date.
În vizualizarea modelului, puteți vedea patru file, care corespund celor patru pași pentru a crea un model și a-l utiliza pentru a genera predicții: Selectați, Construi, Analiza, și prezice.
Pe Selectați filă, selectați maintenance_dataset.csv setul de date pe care l-ați încărcat anterior și alegeți Selectați setul de date.
Acest set de date include 9 coloane și 10,000 de rânduri. Canvasul trece automat la faza de Construire.
Pe această filă, alegeți coloana țintă, în cazul nostru Tip de eroare.Echipa de întreținere v-a informat că această coloană indică tipul de defecțiuni observate de obicei pe baza datelor istorice de la mașinile lor existente. Acesta este ceea ce doriți să vă antrenați modelul să prezică. Canvas detectează automat că acesta este un 3 Categorie problemă (cunoscută și ca clasificare cu mai multe clase). Dacă este detectat tipul de model greșit, îl puteți schimba manual cu ajutorul Schimbați tipul opțiune.
Trebuie remarcat faptul că acest set de date este foarte dezechilibrat față de clasa No Failure, care poate fi văzută vizualizând coloana numită Tip de eroare. Deși Canvas și capabilitățile AutoML subiacente pot gestiona parțial dezechilibrul setului de date, acest lucru poate duce la unele performanțe distorsionate. Ca un pas suplimentar următor, consultați Echilibrați-vă datele pentru învățarea automată cu Amazon SageMaker Data Wrangler. Urmând pașii din linkul partajat, puteți lansa un Amazon SageMaker Studio aplicația din consola SageMaker și importați acest set de date în interior Amazon SageMaker Data Wrangler și utilizați transformarea Balance data, apoi duceți setul de date echilibrat înapoi în Canvas și continuați pașii următori. Continuăm cu setul de date dezechilibrat din această postare pentru a arăta că Canvas poate gestiona și seturi de date dezechilibrate.
În jumătatea de jos a paginii, puteți vedea unele dintre statisticile setului de date, inclusiv valorile lipsă și nepotrivite, valorile unice și valorile medii și mediane. De asemenea, puteți renunța la unele dintre coloane dacă nu doriți să le utilizați pentru predicție, pur și simplu deselectându-le.
După ce ați explorat această secțiune, este timpul să antrenați modelul! Înainte de a construi un model complet, este o practică bună să aveți o idee generală despre performanța modelului prin antrenarea unui Model rapid. Un model rapid antrenează mai puține combinații de modele și hiperparametri pentru a acorda prioritate vitezei față de acuratețe, mai ales în cazurile în care doriți să demonstrați valoarea antrenării unui model ML pentru cazul dvs. de utilizare. Rețineți că opțiunea de construcție rapidă nu este disponibilă pentru modelele mai mari de 50,000 de rânduri.
Alege Construire rapidă.

construcție de modele în curs

Acum așteptați oriunde între 2 și 15 minute. Odată terminat, Canvas se mută automat la Analiza pentru a vă afișa rezultatele antrenamentului rapid. Analiza efectuată folosind estimări de construcție rapidă estimează că modelul dumneavoastră este capabil să prezică tipul de defecțiune corect (rezultatul) în 99.2% din timp. Este posibil să experimentați valori ușor diferite. Acest lucru este de așteptat.

Să ne concentrăm pe prima filă, Descriere. Aceasta este fila care vă arată Impactul coloanei, sau importanța estimată a fiecărei coloane în estimarea coloanei țintă. În acest exemplu, coloanele Cuplu [Nm] și Viteza de rotație [rpm] au cel mai semnificativ impact în prezicerea tipului de defecțiune.

Analizați - Prezentare generală

Evaluați performanța modelului

Când te muți la Punctajul parte a analizei dvs., puteți vedea un grafic care reprezintă distribuția valorilor noastre prezise în raport cu valorile reale. Observați că majoritatea eșecurilor vor fi în categoria Fără eșec. Pentru a afla mai multe despre modul în care Canvas utilizează liniile de bază SHAP pentru a oferi explicabilitate în ML, consultați Evaluarea performanței modelului dvs. în Amazon SageMaker Canvas, precum și Linii de bază SHAP pentru explicabilitate.
evaluează valorile modelului

Canvas împarte setul de date original în seturi de tren și de validare înainte de antrenament. Scorul este rezultatul rulării Canvas a setului de validare pe model. Aceasta este o interfață interactivă în care puteți selecta tipul de defecțiune. Dacă alegi Eșecul suprasolicitarii în grafic, puteți vedea că modelul identifică aceste 84% din timp. Acest lucru este suficient de bun pentru a lua măsuri - poate solicitați un operator sau un inginer să verifice în continuare. Tu poti alege Pana de curent în grafic pentru a vedea punctajul respectiv pentru interpretare și acțiuni ulterioare.

Ați putea fi interesat de tipurile de defecțiuni și de cât de bine modelul prezice tipurile de defecțiuni pe baza unei serii de intrări. Pentru a arunca o privire mai atentă asupra rezultatelor, alegeți Valori avansate. Aceasta afișează o matrice care vă permite să examinați mai îndeaproape rezultatele. În ML, aceasta este denumită a matrice de confuzie.

metrici avansate

Această matrice este implicită la clasa dominate, No Failure. Pe Clasă din meniu, puteți alege să vizualizați valorile avansate ale celorlalte două tipuri de defecțiuni: Defecțiune prin suprasolicitare și Întreruperea alimentării.

În ML, acuratețea modelului este definită ca numărul de predicții corecte împărțit la numărul total de predicții. Casetele albastre reprezintă predicții corecte pe care modelul le-a făcut față de un subset de date de testare în care a existat un rezultat cunoscut. Aici ne interesează cât de procent din timp modelul a prezis un anumit tip de defecțiune a mașinii (să spunem Fără eșec) când este de fapt acel tip de defecțiune (Fără eșec). În ML, un raport utilizat pentru a măsura acest lucru este TP / (TP + FN). Aceasta este denumită rechemare. În cazul implicit, Fără eșec, au existat 1,923 de predicții corecte din 1,926 de înregistrări generale, ceea ce a dus la 99% rechemare. Alternativ, în clasa de eșec de suprasolicitare, au fost 32 din 38, ceea ce duce la 84% rechemare. În cele din urmă, în clasa de întrerupere de curent, au fost 16 din 19, ceea ce rezultă în 84% rechemare.

Acum, aveți două opțiuni:

Puteți folosi acest model pentru a rula unele predicții prin alegere prezice.
Puteți crea o nouă versiune a acestui model pentru a vă antrena cu Construcție standard opțiune. Acest lucru va dura mult mai mult - aproximativ 1-2 ore - dar oferă un model mai robust, deoarece trece printr-o revizuire completă AutoML a datelor, algoritmilor și iterațiilor de reglare.

Deoarece încercați să preziceți eșecurile, iar modelul prezice eșecurile corect în 84% din timp, puteți utiliza cu încredere modelul pentru a identifica posibilele eșecuri. Deci, puteți trece la opțiunea 1. Dacă nu ați fost încrezător, atunci ați putea solicita unui cercetător de date să examineze modelarea realizată de Canvas și să ofere potențiale îmbunătățiri prin opțiunea 2.

Generați predicții

Acum că modelul este antrenat, puteți începe să generați predicții.

Alege prezice în partea de jos a Analiza pagina sau alegeți prezice tab.
Alege Selectați setul de date, și alegeți maintenance_dataset.csv fișier.
Alege Generați predicții.

Canvas folosește acest set de date pentru a genera predicțiile noastre. Deși, în general, este o idee bună să nu folosiți același set de date atât pentru antrenament, cât și pentru testare, puteți utiliza același set de date din motive de simplitate în acest caz. Alternativ, puteți elimina unele înregistrări din setul de date inițial pe care îl utilizați pentru antrenament și să utilizați acele înregistrări într-un fișier CSV și să le trimiteți aici predicției lot, astfel încât să nu utilizați același set de date pentru testarea după antrenament.

predicție de lot
După câteva secunde, predicția este completă. Canvas returnează o predicție pentru fiecare rând de date și probabilitatea ca predicția să fie corectă. Tu poti alege Anunţ pentru a vizualiza previziunile sau alegeți Descarcă pentru a descărca un fișier CSV care conține rezultatul complet.

Descărcați predicția
De asemenea, puteți alege să preziceți valorile una câte una alegând Pronostic unic în loc de Predicția lotului. Canvas vă arată o vizualizare în care puteți furniza manual valorile pentru fiecare caracteristică și puteți genera o predicție. Acest lucru este ideal pentru situații precum scenarii de tip ce ar fi, de exemplu: Cum afectează uzura unealta tipul de defecțiune? Ce se întâmplă dacă temperatura procesului crește sau scade? Ce se întâmplă dacă viteza de rotație se modifică?

predicție unică

Construcție standard

Construcție standard opțiunea alege precizia în detrimentul vitezei. Dacă doriți să împărtășiți artefactele modelului cu cercetătorii dvs. de date și inginerii ML, puteți crea în continuare o versiune standard.

Alege Adăugați versiunea
Alegeți o versiune nouă și alegeți Construcție standard.
După ce creați o versiune standard, puteți partaja modelul cu oamenii de știință de date și inginerii ML pentru evaluare și iterare ulterioară.

Distribuie modelul

A curăța

Pentru a evita riscul viitor taxe de sesiune, deconectați-vă de la Canvas.
Deconectare din Canvas

Concluzie

În această postare, am arătat cum un analist de afaceri poate crea un model de predicție a tipului de defecțiune a mașinii cu Canvas folosind date de întreținere. Canvas le permite analiștilor de afaceri, cum ar fi inginerii de fiabilitate, să creeze modele ML precise și să genereze predicții folosind o interfață vizuală, fără cod, punct-and-click. Analiștii pot duce acest lucru la nivelul următor prin împărtășirea modelelor lor cu colegii cercetători ai datelor. Oamenii de știință de date pot vizualiza modelul Canvas în Studio, unde pot explora alegerile făcute de Canvas, pot valida rezultatele modelului și chiar pot duce modelul la producție cu câteva clicuri. Acest lucru poate accelera crearea de valoare bazată pe ML și poate ajuta la scalarea mai rapidă a rezultatelor îmbunătățite.

Pentru a afla mai multe despre utilizarea Canvas, consultați Construiți, partajați, implementați: cum analiștii de afaceri și oamenii de știință de date obțin un time-to-market mai rapid folosind ML fără cod și Amazon SageMaker Canvas. Pentru mai multe informații despre crearea modelelor ML cu o soluție fără cod, consultați Anunțăm Amazon SageMaker Canvas – o capacitate de învățare automată vizuală, fără cod pentru analiștii de afaceri.

Despre Autori

Rajakumar Sampathkumar este manager principal de cont tehnic la AWS, oferind clienților îndrumări cu privire la alinierea tehnologiei de afaceri și sprijinind reinventarea modelelor și proceselor lor de operare în cloud. Este pasionat de cloud și machine learning. Raj este, de asemenea, un specialist în învățarea automată și lucrează cu clienții AWS pentru a proiecta, implementa și gestiona sarcinile de lucru și arhitecturile lor AWS.

Twann Atkins este arhitect senior de soluții pentru Amazon Web Services. El este responsabil pentru lucrul cu clienții din agricultură, retail și producție pentru a identifica problemele de afaceri și de a lucra invers pentru a identifica soluții tehnice viabile și scalabile. Twann îi ajută pe clienți să planifice și să migreze sarcinile de lucru critice de mai bine de 10 ani, concentrându-se recent pe democratizarea analizei, inteligenței artificiale și învățării automate pentru clienții și constructorii de mâine.

Omkar Mukadam este un Edge Specialist Solution Architecture la Amazon Web Services. În prezent, se concentrează pe soluții care le permit clienților comerciali să proiecteze, să construiască și să extindă eficient cu ofertele de servicii AWS Edge, care includ, dar fără a se limita la, familia AWS Snow.