Maskinlæring (ML) hjelper organisasjoner med å generere inntekter, redusere kostnader, redusere risiko, øke effektiviteten og forbedre kvaliteten ved å optimalisere kjernevirksomhetsfunksjoner på tvers av flere forretningsenheter som markedsføring, produksjon, drift, salg, økonomi og kundeservice. Med AWS ML kan organisasjoner akselerere verdiskapingen fra måneder til dager. Amazon SageMaker Canvas er en visuell pek-og-klikk-tjeneste som lar forretningsanalytikere generere nøyaktige ML-spådommer uten å skrive en eneste kodelinje eller kreve ML-ekspertise. Du kan bruke modeller til å lage spådommer interaktivt og for batch-scoring på massedatasett.
I dette innlegget viser vi frem arkitektoniske mønstre for hvordan forretningsteam kan bruke ML-modeller bygget hvor som helst ved å generere spådommer i Canvas og oppnå effektive forretningsresultater.
Denne integreringen av modellutvikling og deling skaper et tettere samarbeid mellom forretnings- og datavitenskapsteam og reduserer tiden til verdi. Forretningsteam kan bruke eksisterende modeller bygget av dataforskerne eller andre avdelinger for å løse et forretningsproblem i stedet for å gjenoppbygge nye modeller i eksterne miljøer.
Endelig kan forretningsanalytikere importere delte modeller til Canvas og generere spådommer før de distribueres til produksjon med bare noen få klikk.
Løsningsoversikt
Følgende figur beskriver tre forskjellige arkitekturmønstre for å demonstrere hvordan dataforskere kan dele modeller med forretningsanalytikere, som deretter direkte kan generere spådommer fra disse modellene i det visuelle grensesnittet til Canvas:
Forutsetninger
For å trene og bygge modellen din ved hjelp av SageMaker og bringe modellen inn i Canvas, fullfør følgende forutsetninger:
- Hvis du ikke allerede har et SageMaker-domene og Studio-bruker, konfigurere og ta med en Studio-bruker til et SageMaker-domene.
- Aktiver og konfigurer Canvas grunnleggende tillatelser for brukerne dine og gi brukere tillatelse til å samarbeide med Studio.
- Du må ha en opplært modell fra Autopilot, JumpStart eller modellregisteret. For alle modeller du har bygget utenfor SageMaker, må du registrere modellen i modellregisteret før du importerer den til Canvas.
La oss nå påta oss rollen som en dataforsker som ønsker å trene, bygge, distribuere og dele ML-modeller med en forretningsanalytiker for hver av disse tre arkitektoniske mønstrene.
Bruk Autopilot og Canvas
Autopilot automatiserer nøkkeloppgaver i en automatisk ML-prosess (AutoML) som å utforske data, velge den relevante algoritmen for problemtypen og deretter trene og justere den. Alt dette kan oppnås samtidig som du kan opprettholde full kontroll og synlighet på datasettet. Autopilot utforsker automatisk ulike løsninger for å finne den beste modellen, og brukere kan enten iterere på ML-modellen eller distribuere modellen direkte til produksjon med ett klikk.
I dette eksemplet bruker vi en syntetisk kundeavgang datasett fra telekom-domenet og har i oppgave å identifisere kunder som potensielt står i fare for å churning. Fullfør følgende trinn for å bruke Autopilot AutoML til å bygge, trene, distribuere og dele en ML-modell med en forretningsanalytiker:
- Last ned datasett, last den opp til en Amazon S3 (Amazon enkel lagringstjeneste) bøtte, og noter S3 URI.
- På Studio-konsollen velger du AutoML i navigasjonsruten.
- Velg Opprett AutoML-eksperiment.
- Spesifiser eksperimentnavnet (for dette innlegget,
Telecom-Customer-Churn-AutoPilot
), S3-datainndata og utdataplassering. - Angi målkolonnen som churn.
- I distribusjonsinnstillingene kan du aktivere alternativet for automatisk distribusjon for å lage et endepunkt som distribuerer din beste modell og kjører slutninger om endepunktet.
For mer informasjon, se Lag et Amazon SageMaker Autopilot-eksperiment.
- Velg eksperimentet ditt, velg deretter den beste modellen og velg Del modell.
- Legg til en Canvas-bruker og velg Del å dele modellen.
(Merknader: Du kan ikke dele modellen med den samme Canvas-brukeren som ble brukt for Studio-pålogging. For eksempel kan Studio-bruker-A ikke dele modell med Canvas User-A. Men bruker-A kan dele modell med bruker-B, og velg derfor forskjellige bruksområder for modelldeling)
For mer informasjon, se Studiobrukere: Del en modell med SageMaker Canvas.
Bruk JumpStart og Canvas
JumpStart er en ML-hub som tilbyr forhåndsopplærte, åpen kildekode-modeller for et bredt spekter av ML-brukstilfeller som svindeloppdagelse, kredittrisikoprediksjon og gjenkjenning av produktfeil. Du kan distribuere mer enn 300 ferdigtrente modeller for tabell-, syn-, tekst- og lyddata.
For dette innlegget bruker vi en LightGBM-regresjonstrenet modell fra JumpStart. Vi trener modellen på et tilpasset datasett og deler modellen med en Canvas-bruker (forretningsanalytiker). Den forhåndstrente modellen kan distribueres til et endepunkt for slutning. JumpStart gir et eksempel på en notatbok for å få tilgang til modellen etter at den er distribuert.
I dette eksemplet bruker vi abalone datasett. Datasettet inneholder eksempler på åtte fysiske mål som lengde, diameter og høyde for å forutsi alderen til abalone (et regresjonsproblem).
- Last ned abalone datasett fra Kaggle.
- Opprett en S3-bøtte og last opp datasettene for tog, validering og egendefinerte topptekster.
- På Studio-konsollen, under SageMaker JumpStart Velg navigasjonsruten Modeller, notatbøker, løsninger.
- Under Tabellmodeller, velg LightGBM-regresjon.
- Under Togmodell, spesifiser S3-URI-ene for opplærings-, validerings- og kolonneoverskriftsdatasettene.
- Velg Tog.
- Velg i navigasjonsruten Lanserte JumpStart-ressurser.
- På Treningsjobber fanen, velg treningsjobben din.
- På Del meny, velg Del på Canvas.
- Velg Canvas-brukerne å dele med, spesifiser modelldetaljene og velg Del.
For mer informasjon, se Studiobrukere: Del en modell med SageMaker Canvas.
Bruk SageMaker modellregister og Canvas
Med SageMaker modellregister kan du katalogisere modeller for produksjon, administrere modellversjoner, tilknytte metadata, administrere godkjenningsstatusen til en modell, distribuere modeller til produksjon og automatisere modelldistribusjon med CI/CD.
La oss påta oss rollen som en dataforsker. For dette eksempelet bygger du et ende-til-ende ML-prosjekt som inkluderer dataforberedelse, modellopplæring, modellvert, modellregister og modelldeling med en forretningsanalytiker. Eventuelt, for dataforberedelse og forbehandling eller etterbehandlingstrinn, kan du bruke Amazon SageMaker Data Wrangler og en Amazon SageMaker Behandlingsjobb. I dette eksemplet bruker vi abalone-datasettet lastet ned fra LIBSVM. Målvariabelen er alderen på abalone.
- I Studio kloner du GitHub repo.
- Fullfør trinnene som er oppført i README-filen.
- På Studio-konsollen, under Modeller Velg navigasjonsruten Modellregister.
- Velg modell
sklearn-reg-ablone
. - Del modellversjon 1 fra modellregisteret til Canvas.
- Velg Canvas-brukerne å dele med, spesifiser modelldetaljene og velg Del.
For instruksjoner, se Modellregister delen i Studiobrukere: Del en modell med SageMaker Canvas.
Administrer delte modeller
Etter at du har delt modellen ved å bruke en av de foregående metodene, kan du gå til Modeller delen i Studio og se gjennom alle delte modeller. I det følgende skjermbildet ser vi 3 forskjellige modeller som deles av en Studio-bruker (dataforsker) med forskjellige Canvas-brukere (bedriftsteam).
Importer en delt modell og lag spådommer med Canvas
La oss påta oss rollen som forretningsanalytiker og logge inn på Canvas med Canvas-brukeren din.
Når en dataforsker eller Studio-bruker deler en modell med en Canvas-bruker, mottar du et varsel i Canvas-applikasjonen om at en Studio-bruker har delt en modell med deg. I Canvas-applikasjonen ligner varselet på følgende skjermbilde.
Du kan velge Se oppdatering for å se den delte modellen, eller du kan gå til Modeller siden i Canvas-applikasjonen for å oppdage alle modellene som har blitt delt med deg. Modellimporten fra Studio kan ta opptil 20 minutter.
Etter å ha importert modellen, kan du se dens beregninger og generere sanntidsprediksjoner med hva-hvis-analyse eller batch-prediksjoner.
betraktninger
Husk følgende når du deler modeller med Canvas:
- Du lagrer opplærings- og valideringsdatasett i Amazon S3, og S3-URI-ene sendes til Canvas med AWS identitets- og tilgangsadministrasjon (IAM) tillatelser.
- Oppgi målkolonnen til Canvas eller bruk den første kolonnen som standard.
- For at en Canvas-beholder skal analysere slutningsdata, godtar Canvas-endepunktet enten tekst (CSV) eller applikasjon (JSON).
- Canvas støtter ikke flere container- eller inferensrørledninger.
- Et dataskjema leveres til Canvas hvis ingen overskrifter er gitt i opplærings- og valideringsdatasettene. Som standard gir ikke JumpStart-plattformen overskrifter i opplærings- og valideringsdatasettene.
- Med Jumpstart må treningsjobben være fullført før du kan dele den med Canvas.
Referere til Begrensninger og feilsøking for å hjelpe deg med å feilsøke eventuelle problemer du støter på når du deler modeller.
Rydd opp
For å unngå fremtidige kostnader, slett eller slå av ressursene du opprettet mens du fulgte dette innlegget. Referere til Logger ut av Amazon SageMaker Canvas for flere detaljer. Slå av de individuelle ressursene, inkludert bærbare datamaskiner, terminaler, kjerner, apper og forekomster. For mer informasjon, se Slå av ressurser. Slett modellversjon, SageMaker endepunkt og ressurser, Ressurser for autopiloteksperimentog S3 bøtte.
konklusjonen
Studio lar dataforskere dele ML-modeller med forretningsanalytikere i noen få enkle trinn. Forretningsanalytikere kan dra nytte av ML-modeller som allerede er bygget av dataforskere for å løse forretningsproblemer i stedet for å lage en ny modell i Canvas. Det kan imidlertid være vanskelig å bruke disse modellene utenfor miljøene de er bygget i på grunn av tekniske krav og manuelle prosesser for å importere modeller. Dette tvinger ofte brukere til å gjenoppbygge ML-modeller, noe som resulterer i duplisering av innsats og ekstra tid og ressurser. Canvas fjerner disse begrensningene slik at du kan generere spådommer i Canvas med modeller du har trent hvor som helst. Ved å bruke de tre mønstrene som er illustrert i dette innlegget, kan du registrere ML-modeller i SageMaker-modellregisteret, som er et metadatalager for ML-modeller, og importere dem til Canvas. Forretningsanalytikere kan deretter analysere og generere spådommer fra hvilken som helst modell i Canvas.
For å lære mer om bruk av SageMaker-tjenester, sjekk ut følgende ressurser:
Hvis du har spørsmål eller forslag, legg igjen en kommentar.
Om forfatterne
Aman Sharma er en senior løsningsarkitekt med AWS. Han jobber med oppstartsbedrifter, små og mellomstore bedrifter og bedriftskunder over hele APJ-regionen, og har mer enn 19 års erfaring innen rådgivning, arkitektur og løsninger. Han brenner for å demokratisere AI og ML og hjelpe kunder med å utforme data- og ML-strategiene deres. Utenfor jobben liker han å utforske naturen og dyrelivet.
Zichen Nie er Senior Software Engineer hos AWS SageMaker som leder prosjektet Bring Your Own Model to SageMaker Canvas i fjor. Hun har jobbet i Amazon i mer enn 7 år og har erfaring med både Amazon Supply Chain Optimization og AWS AI-tjenester. Hun liker Barre-trening og musikk etter jobb.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoAiStream. Web3 Data Intelligence. Kunnskap forsterket. Tilgang her.
- Minting the Future med Adryenn Ashley. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- : har
- :er
- $OPP
- 1
- 100
- 20
- 7
- a
- Om oss
- akselerere
- godtar
- adgang
- nøyaktig
- Oppnå
- oppnådd
- tvers
- Ytterligere
- Etter
- AI
- AI-tjenester
- algoritme
- Alle
- tillate
- tillater
- allerede
- Amazon
- Amazon SageMaker
- Amazon SageMaker Autopilot
- Amazon SageMaker Canvas
- an
- analyse
- analytiker
- analytikere
- analysere
- og
- noen
- hvor som helst
- Søknad
- godkjenning
- apps
- arkitektonisk
- arkitektur
- ER
- AS
- Førsteamanuensis
- At
- lyd
- auto
- automatisere
- automatiserer
- Automatisk
- automatisk
- AutoML
- unngå
- AWS
- basen
- BE
- vært
- før du
- nytte
- BEST
- mellom
- både
- bringe
- bygge
- Bygning
- bygget
- virksomhet
- forretningsfunksjoner
- bedrifter
- men
- by
- CAN
- lerret
- saker
- katalog
- kjede
- avgifter
- sjekk
- Velg
- klikk
- kode
- samarbeide
- samarbeid
- Kolonne
- kommentere
- fullføre
- Konsoll
- konsulent
- Container
- inneholder
- kontroll
- Kjerne
- Kostnader
- skape
- opprettet
- skaper
- Opprette
- skaperverket
- kreditt
- skikk
- kunde
- Kundeservice
- Kunder
- dato
- Dataklargjøring
- datavitenskap
- dataforsker
- datasett
- Dager
- Misligholde
- Demokratisering
- demonstrere
- avdelinger
- utplassere
- utplassert
- utplasserings
- distribusjon
- Distribueres
- utforme
- detaljer
- Gjenkjenning
- Utvikling
- forskjellig
- vanskelig
- direkte
- oppdage
- ikke
- domene
- ikke
- ned
- stasjonen
- to
- hver enkelt
- Effektiv
- effektivitet
- innsats
- enten
- muliggjøre
- ende til ende
- Endpoint
- ingeniør
- Enterprise
- miljøer
- eksempel
- eksempler
- eksisterende
- erfaring
- eksperiment
- ekspertise
- utforske
- utforsker
- Utforske
- Noen få
- Figur
- filet
- finansiere
- Finn
- Først
- etter
- Til
- Krefter
- svindel
- svindeloppdagelse
- fra
- fullt
- funksjoner
- framtid
- generere
- genererer
- Go
- Ha
- he
- overskrifter
- høyde
- hjelpe
- hjelpe
- hjelper
- derav
- Hosting
- Hvordan
- Men
- HTML
- http
- HTTPS
- Hub
- identifisering
- Identitet
- if
- importere
- importere
- forbedre
- in
- inkluderer
- Inkludert
- individuelt
- informasjon
- inngang
- i stedet
- instruksjoner
- integrering
- Interface
- inn
- saker
- IT
- DET ER
- Jobb
- jpg
- JSON
- bare
- nøkkel
- Siste
- I fjor
- ledende
- LÆRE
- læring
- Permisjon
- Lengde
- i likhet med
- liker
- begrensninger
- linje
- oppført
- plassering
- logg
- Logg inn
- ser
- vedlikeholde
- gjøre
- administrer
- håndbok
- produksjon
- Marketing
- målinger
- medium
- metadata
- metoder
- Metrics
- kunne
- tankene
- minutter
- Minske
- ML
- modell
- modeller
- måneder
- mer
- flere
- musikk
- må
- navn
- Natur
- Navigasjon
- behov
- Ny
- Nei.
- bærbare
- varsling
- of
- ofte
- on
- Ombord
- ONE
- åpen kildekode
- Drift
- optimalisering
- optimalisere
- Alternativ
- or
- organisasjoner
- Annen
- ut
- utfall
- produksjon
- utenfor
- egen
- side
- brød
- bestått
- lidenskapelig
- mønstre
- tillatelser
- fysisk
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- Post
- potensielt
- forutsi
- prediksjon
- Spådommer
- forutsetninger
- Problem
- problemer
- prosess
- Prosesser
- prosessering
- Produkt
- Produksjon
- prosjekt
- gi
- forutsatt
- gir
- kvalitet
- spørsmål
- område
- motta
- redusere
- region
- registrere
- registret
- relevant
- Krav
- Ressurser
- resulterende
- inntekter
- anmeldelse
- Risiko
- Rolle
- sagemaker
- salg
- samme
- Vitenskap
- Forsker
- forskere
- scoring
- Seksjon
- se
- velge
- senior
- tjeneste
- Tjenester
- sett
- innstillinger
- Del
- delt
- Aksjer
- deling
- hun
- presentere
- Slå
- lignende
- Enkelt
- enkelt
- liten
- So
- Software
- Software Engineer
- Solutions
- LØSE
- start-ups
- status
- Steps
- lagring
- oppbevare
- strategier
- studio
- slik
- levere
- forsyningskjeden
- Optimalisering av forsyningskjede
- støtte
- syntetisk
- Ta
- Target
- oppgaver
- lag
- Teknisk
- telekom
- terminal
- enn
- Det
- De
- deres
- Dem
- deretter
- Disse
- de
- denne
- De
- tre
- strammere
- tid
- til
- Tog
- trent
- Kurs
- typen
- etter
- lomper
- bruke
- brukt
- Bruker
- Brukere
- ved hjelp av
- validering
- verdi
- verdiskapning
- versjon
- Se
- synlighet
- syn
- we
- når
- hvilken
- mens
- HVEM
- bred
- Bred rekkevidde
- med
- innenfor
- uten
- Arbeid
- arbeid
- virker
- skriving
- år
- år
- Du
- Din
- zephyrnet