Învățarea automată (ML) ajută organizațiile să genereze venituri, să reducă costurile, să reducă riscurile, să creeze eficiență și să îmbunătățească calitatea prin optimizarea funcțiilor de bază ale afacerii în mai multe unități de afaceri, cum ar fi marketing, producție, operațiuni, vânzări, finanțe și servicii pentru clienți. Cu AWS ML, organizațiile pot accelera crearea de valoare de la luni la zile. Amazon SageMaker Canvas este un serviciu vizual, punct-and-click, care permite analistilor de afaceri sa genereze predictii ML precise fara a scrie o singura linie de cod sau a necesita expertiza ML. Puteți utiliza modele pentru a face predicții în mod interactiv și pentru scorul în lot pe seturi de date în bloc.
În această postare, prezentăm modele arhitecturale despre modul în care echipele de afaceri pot folosi modele ML create oriunde prin generarea de predicții în Canvas și să obțină rezultate de afaceri eficiente.
Această integrare a dezvoltării și partajării modelelor creează o colaborare mai strânsă între echipele de afaceri și știința datelor și reduce timpul de valorificare. Echipele de afaceri pot folosi modelele existente construite de oamenii de știință de date sau de alte departamente pentru a rezolva o problemă de afaceri în loc să reconstruiască modele noi în medii externe.
În cele din urmă, analiștii de afaceri pot importa modele partajate în Canvas și pot genera predicții înainte de a fi implementate în producție cu doar câteva clicuri.
Prezentare generală a soluțiilor
Următoarea figură descrie trei modele de arhitectură diferite pentru a demonstra modul în care oamenii de știință de date pot partaja modele cu analiștii de afaceri, care pot genera apoi direct predicții din acele modele în interfața vizuală a Canvas:
Cerințe preliminare
Pentru a vă antrena și a construi modelul folosind SageMaker și pentru a vă aduce modelul în Canvas, completați următoarele cerințe preliminare:
- Dacă nu aveți deja un domeniu SageMaker și un utilizator Studio, configurați și integrați un utilizator Studio într-un domeniu SageMaker.
- Activați și configurați Canvas permisiunile de bază pentru utilizatorii dvs. și acordați utilizatorilor permisiunea de a colabora cu Studio.
- Trebuie să aveți un model instruit din Autopilot, JumpStart sau din registrul de modele. Pentru orice model pe care l-ați creat în afara SageMaker, trebuie să vă înregistrați modelul în registrul de modele înainte de a-l importa în Canvas.
Acum să ne asumăm rolul unui om de știință de date care caută să antreneze, să construiască, să implementeze și să partajeze modele ML cu un analist de afaceri pentru fiecare dintre aceste trei modele arhitecturale.
Utilizați Autopilot și Canvas
Autopilot automatizează sarcinile cheie ale unui proces automat ML (AutoML), cum ar fi explorarea datelor, selectarea algoritmului relevant pentru tipul de problemă și apoi antrenamentul și reglarea acestuia. Toate acestea pot fi realizate, permițându-vă în același timp să mențineți controlul și vizibilitatea deplină asupra setului de date. Autopilot explorează automat diferite soluții pentru a găsi cel mai bun model, iar utilizatorii pot fie să repete modelul ML, fie să implementeze direct modelul în producție cu un singur clic.
În acest exemplu, folosim un material sintetic de pierdere a clienților date CCD din domeniul telecom și au sarcina de a identifica clienții care sunt potențial expuși riscului de schimbare. Parcurgeți următorii pași pentru a utiliza Autopilot AutoML pentru a construi, antrena, implementa și partaja un model ML cu un analist de afaceri:
- Descărcați date CCD, încărcați-l pe un Amazon S3 (Serviciul Amazon de stocare simplă) și notează URI-ul S3.
- Pe consola Studio, alegeți AutoML în panoul de navigare.
- Alege Creați experimentul AutoML.
- Specificați numele experimentului (pentru această postare,
Telecom-Customer-Churn-AutoPilot
), intrarea datelor S3 și locația de ieșire. - Setați coloana țintă ca abandon.
- În setările de implementare, puteți activa opțiunea de implementare automată pentru a crea un punct final care să implementeze cel mai bun model al dvs. și să execute inferențe pe punctul final.
Pentru mai multe informații, consultați Creați un experiment Amazon SageMaker Autopilot.
- Alegeți experimentul, apoi selectați cel mai bun model și alegeți Distribuie modelul.
- Adăugați un utilizator Canvas și alegeți Distribuie pentru a împărtăși modelul.
(notițe: nu puteți partaja modelul cu același utilizator Canvas ca utilizat pentru autentificarea Studio. De exemplu, utilizatorul Studio A nu poate partaja modelul cu utilizatorul Canvas A. Dar utilizatorul-A poate partaja modelul cu utilizatorul-B, prin urmare alege diferite utilizări pentru partajarea modelului)
Pentru mai multe informații, consultați Utilizatori Studio: Partajați un model la SageMaker Canvas.
Utilizați JumpStart și Canvas
JumpStart este un hub ML care oferă modele open-source pregătite în prealabil pentru o gamă largă de cazuri de utilizare ML, cum ar fi detectarea fraudei, predicția riscului de credit și detectarea defectelor produsului. Puteți implementa peste 300 de modele pre-antrenate pentru date tabulare, vizuale, text și audio.
Pentru această postare, folosim un model pre-antrenat de regresie LightGBM de la JumpStart. Antrenăm modelul pe un set de date personalizat și partajăm modelul unui utilizator Canvas (analist de afaceri). Modelul pre-antrenat poate fi implementat la un punct final pentru inferență. JumpStart oferă un exemplu de blocnotes pentru a accesa modelul după ce acesta este implementat.
În acest exemplu, folosim set de date abalone. Setul de date conține exemple de opt măsurători fizice, cum ar fi lungimea, diametrul și înălțimea, pentru a prezice vârsta abalone (o problemă de regresie).
- Descărcați set de date abalone de la Kaggle.
- Creați o găleată S3 și încărcați seturile de date pentru tren, validare și antet personalizate.
- Pe consola Studio, sub SageMaker JumpStart în panoul de navigare, alegeți Modele, caiete, solutii.
- În Modele tabulare, alege Regresia LightGBM.
- În Model de tren, specificați URI-urile S3 pentru seturile de date de instruire, validare și antet de coloană.
- Alege Tren.
- În panoul de navigare, alegeți S-au lansat elementele JumpStart.
- Pe Locuri de muncă de formare fila, alege-ți jobul de formare.
- Pe Distribuie meniu, alegeți Distribuiți pe Canvas.
- Alegeți utilizatorii Canvas cărora le puteți partaja, specificați detaliile modelului și alegeți Distribuie.
Pentru mai multe informații, consultați Utilizatori Studio: Partajați un model la SageMaker Canvas.
Utilizați registrul de modele SageMaker și Canvas
Cu registrul de modele SageMaker, puteți cataloga modele pentru producție, puteți gestiona versiunile de model, puteți asocia metadate, gestiona starea de aprobare a unui model, puteți implementa modele în producție și automatiza implementarea modelului cu CI/CD.
Să ne asumăm rolul unui cercetător de date. Pentru acest exemplu, construiți un proiect ML end-to-end care include pregătirea datelor, instruirea modelului, găzduirea modelelor, registrul de modele și partajarea modelelor cu un analist de afaceri. Opțional, pentru pregătirea datelor și pașii de preprocesare sau postprocesare, puteți utiliza Amazon SageMaker Data Wrangler si un Job de procesare Amazon SageMaker. În acest exemplu, folosim setul de date abalone descărcat de pe LIBSVM. Variabila țintă este vârsta abalone.
- În Studio, clonează GitHub repo.
- Parcurgeți pașii enumerați în fișierul README.
- Pe consola Studio, sub modele în panoul de navigare, alegeți Registrul modelului.
- Alegeți modelul
sklearn-reg-ablone
. - Partajați versiunea 1 a modelului din registrul modelului în Canvas.
- Alegeți utilizatorii Canvas cărora le puteți partaja, specificați detaliile modelului și alegeți Distribuie.
Pentru instrucțiuni, consultați Registrul modelului secțiune în Utilizatori Studio: Partajați un model la SageMaker Canvas.
Gestionați modelele partajate
După ce partajați modelul utilizând oricare dintre metodele precedente, puteți accesa modele secțiunea din Studio și examinați toate modelele partajate. În următoarea captură de ecran, vedem 3 modele diferite partajate de un utilizator Studio (scientist de date) cu diferiți utilizatori Canvas (echipe de afaceri).
Importați un model partajat și faceți predicții cu Canvas
Să ne asumăm rolul de analist de afaceri și să ne conectăm la Canvas cu utilizatorul dvs. Canvas.
Când un cercetător de date sau un utilizator Studio partajează un model cu un utilizator Canvas, primiți o notificare în cadrul aplicației Canvas că un utilizator Studio v-a partajat un model. În aplicația Canvas, notificarea este similară cu următoarea captură de ecran.
Tu poti alege Vedeți actualizarea pentru a vedea modelul partajat sau puteți accesa modele pagina din aplicația Canvas pentru a descoperi toate modelele care ți-au fost distribuite. Importul modelului din Studio poate dura până la 20 de minute.
După importarea modelului, puteți vedea valorile acestuia și puteți genera previziuni în timp real cu analiză ce se întâmplă sau predicții pe lot.
Considerații
Rețineți următoarele când partajați modele cu Canvas:
- Stocați seturi de date de instruire și validare în Amazon S3, iar URI-urile S3 sunt transmise la Canvas cu Gestionarea identității și accesului AWS permisiuni (IAM).
- Furnizați coloana țintă către Canvas sau utilizați prima coloană ca prestabilit.
- Pentru ca un container Canvas să analizeze date de inferență, punctul final Canvas acceptă fie text (CSV), fie aplicație (JSON).
- Canvas nu acceptă mai multe containere sau conducte de inferență.
- O schemă de date este furnizată către Canvas dacă nu sunt furnizate antete în seturile de date de instruire și validare. În mod implicit, platforma JumpStart nu oferă antete în seturile de date de instruire și validare.
- Cu Jumpstart, munca de formare trebuie să fie finalizată înainte de a o putea partaja cu Canvas.
A se referi la Limitări și depanare pentru a vă ajuta să remediați problemele pe care le întâmpinați la partajarea modelelor.
A curăța
Pentru a evita costurile viitoare, ștergeți sau închideți resursele pe care le-ați creat în timp ce urmăriți această postare. A se referi la Deconectarea de la Amazon SageMaker Canvas pentru mai multe detalii. Închideți resursele individuale, inclusiv notebook-uri, terminale, nuclee, aplicații și instanțe. Pentru mai multe informații, consultați Închideți resursele. Ștergeți fișierul versiunea modelului, Punct final și resurse SageMaker, Resurse pentru experimentul pilot automat, și Găleată S3.
Concluzie
Studio permite oamenilor de știință de date să partajeze modele ML cu analiștii de afaceri în câțiva pași simpli. Analiștii de afaceri pot beneficia de modelele ML deja construite de oamenii de știință de date pentru a rezolva problemele de afaceri în loc să creeze un nou model în Canvas. Cu toate acestea, ar putea fi dificil să utilizați aceste modele în afara mediilor în care sunt construite din cauza cerințelor tehnice și a proceselor manuale de importare a modelelor. Acest lucru îi obligă adesea pe utilizatori să reconstruiască modele ML, ceea ce duce la duplicarea efortului și timp și resurse suplimentare. Canvas elimină aceste limitări, astfel încât să puteți genera predicții în Canvas cu modele pe care le-ați antrenat oriunde. Folosind cele trei modele ilustrate în această postare, puteți înregistra modele ML în registrul de modele SageMaker, care este un depozit de metadate pentru modele ML, și le puteți importa în Canvas. Analiștii de afaceri pot analiza și genera predicții din orice model din Canvas.
Pentru a afla mai multe despre utilizarea serviciilor SageMaker, consultați următoarele resurse:
Dacă aveți întrebări sau sugestii, lăsați un comentariu.
Despre autori
Aman Sharma este arhitect senior de soluții cu AWS. Lucrează cu start-up-uri, întreprinderi mici și mijlocii și clienți din întreaga regiune APJ, cu peste 19 ani de experiență în consultanță, arhitectură și soluții. Este pasionat de democratizarea AI și ML și de a ajuta clienții să-și conceapă datele și strategiile ML. În afara muncii, îi place să exploreze natura și fauna sălbatică.
Zichen Nie este inginer software senior la AWS SageMaker, care conduce anul trecut proiectul Bring Your Own Model to SageMaker Canvas. Lucrează în Amazon de mai bine de 7 ani și are experiență atât în Amazon Supply Chain Optimization, cât și în serviciile AWS AI. Îi plac antrenamentele Barre și muzica după muncă.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoAiStream. Web3 Data Intelligence. Cunoștințe amplificate. Accesați Aici.
- Mintând viitorul cu Adryenn Ashley. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- :are
- :este
- $UP
- 1
- 100
- 20
- 7
- a
- Despre Noi
- accelera
- acceptă
- acces
- precis
- Obține
- realizat
- peste
- Suplimentar
- După
- AI
- Servicii AI
- Algoritmul
- TOATE
- Permiterea
- permite
- deja
- Amazon
- Amazon SageMaker
- Pilot automat cu Amazon SageMaker
- Amazon SageMaker Canvas
- an
- analiză
- analist
- analiști
- analiza
- și
- Orice
- oriunde
- aplicație
- aprobare
- Apps
- arhitectural
- arhitectură
- SUNT
- AS
- Avocat Colaborator
- At
- audio
- Auto
- automatizarea
- automate
- Automat
- în mod automat
- AutoML
- evita
- AWS
- de bază
- BE
- fost
- înainte
- beneficia
- CEL MAI BUN
- între
- atât
- aduce
- construi
- Clădire
- construit
- afaceri
- funcții de afaceri
- întreprinderi
- dar
- by
- CAN
- pânză
- cazuri
- catalog
- lanţ
- taxe
- verifica
- Alege
- clic
- cod
- colabora
- colaborare
- Coloană
- comentariu
- Completă
- Consoleze
- consultant
- Recipient
- conține
- Control
- Nucleu
- Cheltuieli
- crea
- a creat
- creează
- Crearea
- creaţie
- credit
- personalizat
- client
- Serviciu clienți
- clienţii care
- de date
- Pregătirea datelor
- știința datelor
- om de știință de date
- seturi de date
- Zi
- Mod implicit
- democratizarea
- demonstra
- departamente
- implementa
- dislocate
- Implementarea
- desfășurarea
- implementează
- proiect
- detalii
- Detectare
- Dezvoltare
- diferit
- dificil
- direct
- descoperi
- Nu
- domeniu
- Dont
- jos
- conduce
- două
- fiecare
- Eficace
- eficiență
- efort
- oricare
- permite
- un capăt la altul
- Punct final
- inginer
- Afacere
- medii
- exemplu
- exemple
- existent
- experienţă
- experiment
- expertiză
- explora
- Explorează
- Explorarea
- puțini
- Figura
- Fișier
- finanţa
- Găsi
- First
- următor
- Pentru
- Forțele
- fraudă
- detectarea fraudei
- din
- Complet
- funcții
- viitor
- genera
- generator
- Go
- Avea
- he
- anteturile
- înălțime
- ajutor
- ajutor
- ajută
- prin urmare
- găzduire
- Cum
- Totuși
- HTML
- http
- HTTPS
- Butuc
- identificarea
- Identitate
- if
- import
- importatoare
- îmbunătăţi
- in
- include
- Inclusiv
- individ
- informații
- intrare
- in schimb
- instrucțiuni
- integrare
- interfaţă
- în
- probleme de
- IT
- ESTE
- Loc de munca
- jpg
- JSON
- doar
- Cheie
- Nume
- Anul trecut
- conducere
- AFLAȚI
- învăţare
- Părăsi
- Lungime
- ca
- îi place
- limitări
- Linie
- listat
- locaţie
- log
- Logare
- cautati
- menține
- face
- administra
- manual
- de fabricaţie
- Marketing
- măsurători
- mediu
- Metadata
- Metode
- Metrici
- ar putea
- minte
- minute
- diminua
- ML
- model
- Modele
- luni
- mai mult
- multiplu
- Muzică
- trebuie sa
- nume
- Natură
- Navigare
- nevoilor
- Nou
- Nu.
- caiet
- notificare
- of
- de multe ori
- on
- bord
- ONE
- open-source
- Operațiuni
- optimizare
- optimizarea
- Opțiune
- or
- organizații
- Altele
- afară
- rezultate
- producție
- exterior
- propriu
- pagină
- pâine
- Trecut
- pasionat
- modele
- permisiuni
- fizic
- platformă
- Plato
- Informații despre date Platon
- PlatoData
- Post
- potenţial
- prezice
- prezicere
- Predictii
- premise
- Problemă
- probleme
- proces
- procese
- prelucrare
- Produs
- producere
- proiect
- furniza
- prevăzut
- furnizează
- calitate
- Întrebări
- gamă
- a primi
- reduce
- regiune
- Inregistreaza-te
- registru
- Cerinţe
- Resurse
- rezultând
- venituri
- revizuiască
- Risc
- Rol
- sagemaker
- de vânzări
- acelaşi
- Ştiinţă
- Om de stiinta
- oamenii de stiinta
- notare
- Secțiune
- vedea
- selectarea
- senior
- serviciu
- Servicii
- set
- setări
- Distribuie
- comun
- Acțiuni
- partajarea
- ea
- prezenta
- Închide
- asemănător
- simplu
- singur
- mic
- So
- Software
- Inginer Software
- soluţii
- REZOLVAREA
- start-up-uri
- Stare
- paşi
- depozitare
- stoca
- strategii
- studio
- astfel de
- livra
- lanțului de aprovizionare
- Optimizarea lanțului de aprovizionare
- a sustine
- sintetic
- Lua
- Ţintă
- sarcini
- echipe
- Tehnic
- telecom
- Terminal
- decât
- acea
- lor
- Lor
- apoi
- Acestea
- ei
- acest
- aceste
- trei
- mai stricte
- timp
- la
- Tren
- dresat
- Pregătire
- tip
- în
- de unităţi
- utilizare
- utilizat
- Utilizator
- utilizatorii
- folosind
- validare
- valoare
- crearea de valoare
- versiune
- Vizualizare
- vizibilitate
- viziune
- we
- cand
- care
- în timp ce
- OMS
- larg
- Gamă largă
- cu
- în
- fără
- Apartamente
- de lucru
- fabrică
- scris
- an
- ani
- Tu
- Ta
- zephyrnet