Machine learning (ML) hjælper organisationer med at generere indtægter, reducere omkostninger, mindske risici, øge effektiviteten og forbedre kvaliteten ved at optimere kerneforretningsfunktioner på tværs af flere forretningsenheder såsom marketing, produktion, drift, salg, økonomi og kundeservice. Med AWS ML kan organisationer accelerere værdiskabelsen fra måneder til dage. Amazon SageMaker lærred er en visuel peg-og-klik-tjeneste, der giver forretningsanalytikere mulighed for at generere nøjagtige ML-forudsigelser uden at skrive en enkelt kodelinje eller kræve ML-ekspertise. Du kan bruge modeller til at lave forudsigelser interaktivt og til batch-scoring på massedatasæt.
I dette indlæg viser vi arkitektoniske mønstre for, hvordan virksomhedsteams kan bruge ML-modeller bygget hvor som helst ved at generere forudsigelser i Canvas og opnå effektive forretningsresultater.
Denne integration af modeludvikling og deling skaber et tættere samarbejde mellem forretnings- og datavidenskabsteams og sænker time to value. Business teams kan bruge eksisterende modeller bygget af deres data scientists eller andre afdelinger til at løse et forretningsproblem i stedet for at genopbygge nye modeller i eksterne miljøer.
Endelig kan forretningsanalytikere importere delte modeller til Canvas og generere forudsigelser, før de implementeres til produktion med blot et par klik.
Løsningsoversigt
Følgende figur beskriver tre forskellige arkitekturmønstre for at demonstrere, hvordan dataforskere kan dele modeller med forretningsanalytikere, som derefter direkte kan generere forudsigelser fra disse modeller i Canvas visuelle grænseflade:
Forudsætninger
For at træne og bygge din model ved hjælp af SageMaker og bringe din model ind i Canvas, skal du udfylde følgende forudsætninger:
- Hvis du ikke allerede har et SageMaker-domæne og Studio-bruger, opsætte og integrere en Studio-bruger til et SageMaker-domæne.
- Aktiver og opsæt Canvas grundlæggende tilladelser for dine brugere og give brugere tilladelse til at samarbejde med Studio.
- Du skal have en trænet model fra Autopilot, JumpStart eller modelregistret. For enhver model, som du har bygget uden for SageMaker, skal du registrere din model i modelregistret, før du importerer den til Canvas.
Lad os nu påtage os rollen som en dataforsker, der søger at træne, bygge, implementere og dele ML-modeller med en forretningsanalytiker for hver af disse tre arkitektoniske mønstre.
Brug Autopilot og Canvas
Autopilot automatiserer nøgleopgaver i en automatisk ML-proces (AutoML) som at udforske data, vælge den relevante algoritme for problemtypen og derefter træne og tune den. Alt dette kan opnås, samtidig med at du kan bevare fuld kontrol og synlighed på datasættet. Autopilot udforsker automatisk forskellige løsninger for at finde den bedste model, og brugere kan enten gentage ML-modellen eller implementere modellen direkte til produktion med et enkelt klik.
I dette eksempel bruger vi en syntetisk kundeafgang datasæt fra telecom-domænet og har til opgave at identificere kunder, der potentielt er i risiko for at churning. Udfør følgende trin for at bruge Autopilot AutoML til at bygge, træne, implementere og dele en ML-model med en forretningsanalytiker:
- Download datasæt, upload det til en Amazon S3 (Amazon Simple Storage Service) spand, og noter S3 URI'en.
- På Studio-konsollen skal du vælge AutoML i navigationsruden.
- Vælg Opret AutoML-eksperiment.
- Angiv eksperimentnavnet (for dette indlæg,
Telecom-Customer-Churn-AutoPilot
), S3-datainput og outputplacering. - Indstil målkolonnen som churn.
- I implementeringsindstillingerne kan du aktivere muligheden for automatisk implementering for at oprette et slutpunkt, der implementerer din bedste model og kører slutninger om slutpunktet.
For mere information henvises til Opret et Amazon SageMaker Autopilot-eksperiment.
- Vælg dit eksperiment, vælg derefter din bedste model og vælg Del model.
- Tilføj en Canvas-bruger og vælg Del at dele modellen.
(Bemærk: Du kan ikke dele model med den samme Canvas-bruger som brugt til Studio-login. For eksempel kan Studio bruger-A ikke dele model med Canvas User-A. Men bruger-A kan dele model med bruger-B, og vælg derfor forskellige anvendelser til modeldeling)
For mere information henvises til Studiebrugere: Del en model med SageMaker Canvas.
Brug JumpStart og Canvas
JumpStart er en ML-hub, der leverer forudtrænede open source-modeller til en bred vifte af ML-brugssager, såsom opdagelse af svindel, forudsigelse af kreditrisiko og detektering af produktfejl. Du kan implementere mere end 300 præ-trænede modeller til tabel-, vision-, tekst- og lyddata.
Til dette indlæg bruger vi en LightGBM-regression fortrænet model fra JumpStart. Vi træner modellen på et tilpasset datasæt og deler modellen med en Canvas-bruger (forretningsanalytiker). Den præ-trænede model kan implementeres til et slutpunkt til slutning. JumpStart giver et eksempel på en notesbog for at få adgang til modellen, efter at den er implementeret.
I dette eksempel bruger vi abalone datasæt. Datasættet indeholder eksempler på otte fysiske mål såsom længde, diameter og højde til at forudsige alderen på abalone (et regressionsproblem).
- Download abalone datasæt fra Kaggle.
- Opret en S3-bucket, og upload tog-, validerings- og brugerdefinerede header-datasæt.
- På Studio-konsollen under SageMaker JumpStart i navigationsruden skal du vælge Modeller, notesbøger, løsninger.
- Under Tabelmodeller, vælg LightGBM-regression.
- Under Togmodel, specificer S3 URI'erne for trænings-, validerings- og kolonneoverskriftsdatasæt.
- Vælg Tog.
- Vælg i navigationsruden Lancerede JumpStart-aktiver.
- På Træningsjob fanen, skal du vælge dit træningsjob.
- På Del menu, vælg Del på Canvas.
- Vælg de Canvas-brugere, du vil dele med, angiv modeldetaljerne, og vælg Del.
For mere information henvises til Studiebrugere: Del en model med SageMaker Canvas.
Brug SageMaker model registry og Canvas
Med SageMaker modelregistrering kan du katalogisere modeller til produktion, administrere modelversioner, tilknytte metadata, administrere godkendelsesstatus for en model, implementere modeller til produktion og automatisere modelimplementering med CI/CD.
Lad os påtage os rollen som en dataforsker. I dette eksempel bygger du et end-to-end ML-projekt, der inkluderer dataforberedelse, modeltræning, modelhosting, modelregistrering og modeldeling med en forretningsanalytiker. Du kan eventuelt bruge til dataforberedelse og forbehandling eller efterbehandlingstrin Amazon SageMaker Data Wrangler og en Amazon SageMaker Processing job. I dette eksempel bruger vi abalone-datasættet downloadet fra LIBSVM. Målvariablen er abalonens alder.
- I Studio skal du klone GitHub repo.
- Fuldfør trinene i README-filen.
- På Studio-konsollen under Modeller i navigationsruden skal du vælge Modelregistrering.
- Vælg model
sklearn-reg-ablone
. - Del modelversion 1 fra modelregistret til Canvas.
- Vælg de Canvas-brugere, du vil dele med, angiv modeldetaljerne, og vælg Del.
For instruktioner henvises til Modelregister afsnit i Studiebrugere: Del en model med SageMaker Canvas.
Administrer delte modeller
Når du har delt modellen ved hjælp af en af de foregående metoder, kan du gå til Modeller afsnittet i Studio og gennemgå alle delte modeller. I det følgende skærmbillede ser vi 3 forskellige modeller, der deles af en Studio-bruger (data scientist) med forskellige Canvas-brugere (business-teams).
Importer en delt model, og lav forudsigelser med Canvas
Lad os påtage os rollen som forretningsanalytiker og logge ind på Canvas med din Canvas-bruger.
Når en dataforsker eller Studio-bruger deler en model med en Canvas-bruger, modtager du en meddelelse i Canvas-applikationen om, at en Studio-bruger har delt en model med dig. I Canvas-applikationen ligner meddelelsen det følgende skærmbillede.
Du kan vælge Se opdatering for at se den delte model, eller du kan gå til Modeller side i Canvas-applikationen for at finde alle de modeller, der er blevet delt med dig. Modelimporten fra Studio kan tage op til 20 minutter.
Efter import af modellen kan du se dens metrics og generere forudsigelser i realtid med hvad hvis-analyse eller batch-forudsigelser.
Overvejelser
Husk følgende, når du deler modeller med Canvas:
- Du gemmer trænings- og valideringsdatasæt i Amazon S3, og S3 URI'erne videregives til Canvas med AWS identitets- og adgangsstyring (IAM) tilladelser.
- Angiv målkolonnen til Canvas, eller brug den første kolonne som standard.
- For at en Canvas-container kan parse inferensdata, accepterer Canvas-slutpunktet enten tekst (CSV) eller applikation (JSON).
- Canvas understøtter ikke flere container- eller inferenspipelines.
- Et dataskema leveres til Canvas, hvis der ikke er angivet overskrifter i trænings- og valideringsdatasættene. Som standard leverer JumpStart-platformen ikke overskrifter i trænings- og valideringsdatasættene.
- Med Jumpstart skal træningsopgaven være fuldført, før du kan dele den med Canvas.
Der henvises til Begrænsninger og fejlfinding for at hjælpe dig med at fejlfinde eventuelle problemer, du støder på, når du deler modeller.
Ryd op
For at undgå fremtidige gebyrer skal du slette eller lukke de ressourcer, du oprettede, mens du fulgte dette indlæg. Henvise til Logger ud af Amazon SageMaker Canvas for flere detaljer. Luk de individuelle ressourcer ned, herunder notebooks, terminal, kerner, apps og instanser. For mere information, se Luk ressourcer ned. Slet model version, SageMaker slutpunkt og ressourcer, Autopiloteksperimentressourcerog S3 spand.
Konklusion
Studio giver datavidenskabsfolk mulighed for at dele ML-modeller med forretningsanalytikere i nogle få enkle trin. Forretningsanalytikere kan drage fordel af ML-modeller, der allerede er bygget af dataforskere til at løse forretningsproblemer i stedet for at skabe en ny model i Canvas. Det kan dog være svært at bruge disse modeller uden for de miljøer, de er bygget i på grund af tekniske krav og manuelle processer til at importere modeller. Dette tvinger ofte brugere til at genopbygge ML-modeller, hvilket resulterer i dobbeltarbejde og ekstra tid og ressourcer. Canvas fjerner disse begrænsninger, så du kan generere forudsigelser i Canvas med modeller, som du har trænet hvor som helst. Ved at bruge de tre mønstre, der er illustreret i dette indlæg, kan du registrere ML-modeller i SageMaker-modelregistret, som er et metadatalager for ML-modeller, og importere dem til Canvas. Forretningsanalytikere kan derefter analysere og generere forudsigelser fra enhver model i Canvas.
For at lære mere om brug af SageMaker-tjenester, tjek følgende ressourcer:
Hvis du har spørgsmål eller forslag, så læg en kommentar.
Om forfatterne
Aman Sharma er Senior Solutions Architect hos AWS. Han arbejder med nystartede virksomheder, små og mellemstore virksomheder og virksomhedskunder på tværs af APJ-regionen, mere end 19 års erfaring med rådgivning, arkitektur og løsninger. Han brænder for at demokratisere AI og ML og hjælpe kunder med at designe deres data- og ML-strategier. Uden for arbejdet kan han godt lide at udforske naturen og dyrelivet.
Zichen Nie er Senior Software Engineer hos AWS SageMaker, der leder projektet Bring Your Own Model til SageMaker Canvas sidste år. Hun har arbejdet i Amazon i mere end 7 år og har erfaring med både Amazon Supply Chain Optimization og AWS AI-tjenester. Hun nyder Barre-træning og musik efter arbejde.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
- Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- :har
- :er
- $OP
- 1
- 100
- 20
- 7
- a
- Om
- fremskynde
- accepterer
- adgang
- præcis
- opnå
- opnået
- tværs
- Yderligere
- Efter
- AI
- AI-tjenester
- algoritme
- Alle
- tillade
- tillader
- allerede
- Amazon
- Amazon SageMaker
- Amazon SageMaker Autopilot
- Amazon SageMaker lærred
- an
- analyse
- analytiker
- Analytikere
- analysere
- ,
- enhver
- overalt
- Anvendelse
- godkendelse
- apps
- arkitektonisk
- arkitektur
- ER
- AS
- Associate
- At
- lyd
- auto
- automatisere
- automater
- Automatisk Ur
- automatisk
- AutoML
- undgå
- AWS
- bund
- BE
- været
- før
- gavner det dig
- BEDSTE
- mellem
- både
- bringe
- bygge
- Bygning
- bygget
- virksomhed
- forretningsfunktioner
- virksomheder
- men
- by
- CAN
- canvas
- tilfælde
- katalog
- kæde
- afgifter
- kontrollere
- Vælg
- klik
- kode
- samarbejde
- samarbejde
- Kolonne
- KOMMENTAR
- fuldføre
- Konsol
- rådgivning
- Container
- indeholder
- kontrol
- Core
- Omkostninger
- skabe
- oprettet
- skaber
- Oprettelse af
- skabelse
- kredit
- skik
- kunde
- Kundeservice
- Kunder
- data
- Dataforberedelse
- datalogi
- dataforsker
- datasæt
- Dage
- Standard
- demokratisering
- demonstrere
- afdelinger
- indsætte
- indsat
- implementering
- implementering
- udruller
- designe
- detaljer
- Detektion
- Udvikling
- forskellige
- svært
- direkte
- opdage
- Er ikke
- domæne
- Dont
- ned
- køre
- grund
- hver
- Effektiv
- effektivitet
- indsats
- enten
- muliggøre
- ende til ende
- Endpoint
- ingeniør
- Enterprise
- miljøer
- eksempel
- eksempler
- eksisterende
- erfaring
- eksperiment
- ekspertise
- udforske
- udforsker
- Udforskning
- få
- Figur
- File (Felt)
- finansiere
- Finde
- Fornavn
- efter
- Til
- Forces
- bedrageri
- bedrageri afsløring
- fra
- fuld
- funktioner
- fremtiden
- generere
- generere
- Go
- Have
- he
- headers
- højde
- hjælpe
- hjælpe
- hjælper
- dermed
- Hosting
- Hvordan
- Men
- HTML
- http
- HTTPS
- Hub
- identificere
- Identity
- if
- importere
- importere
- Forbedre
- in
- omfatter
- Herunder
- individuel
- oplysninger
- indgang
- i stedet
- anvisninger
- integration
- grænseflade
- ind
- spørgsmål
- IT
- ITS
- Job
- jpg
- json
- lige
- Nøgle
- Efternavn
- Sidste år
- førende
- LÆR
- læring
- Forlade
- Længde
- ligesom
- synes godt om
- begrænsninger
- Line (linje)
- Børsnoterede
- placering
- log
- Logge på
- leder
- vedligeholde
- lave
- administrere
- manuel
- Produktion
- Marketing
- målinger
- medium
- Metadata
- metoder
- Metrics
- måske
- tankerne
- minutter
- afbøde
- ML
- model
- modeller
- måned
- mere
- flere
- Musik
- skal
- navn
- Natur
- Navigation
- behov
- Ny
- ingen
- notesbog
- underretning
- of
- tit
- on
- Ombord
- ONE
- open source
- Produktion
- optimering
- optimering
- Option
- or
- organisationer
- Andet
- ud
- udfald
- output
- uden for
- egen
- side
- brød
- Bestået
- lidenskabelige
- mønstre
- Tilladelser
- fysisk
- perron
- plato
- Platon Data Intelligence
- PlatoData
- Indlæg
- potentielt
- forudsige
- forudsigelse
- Forudsigelser
- forudsætninger
- Problem
- problemer
- behandle
- Processer
- forarbejdning
- Produkt
- produktion
- projekt
- give
- forudsat
- giver
- kvalitet
- Spørgsmål
- rækkevidde
- modtage
- reducere
- region
- register
- register
- relevant
- Krav
- Ressourcer
- resulterer
- indtægter
- gennemgå
- Risiko
- roller
- sagemaker
- salg
- samme
- Videnskab
- Videnskabsmand
- forskere
- scoring
- Sektion
- se
- udvælgelse
- senior
- tjeneste
- Tjenester
- sæt
- indstillinger
- Del
- delt
- Aktier
- deling
- hun
- udstillingsvindue
- Luk ned
- lignende
- Simpelt
- enkelt
- lille
- So
- Software
- Software Engineer
- Løsninger
- SOLVE
- nystartede virksomheder
- Status
- Steps
- opbevaring
- butik
- strategier
- Studio
- sådan
- forsyne
- forsyningskæde
- Supply Chain Optimering
- support
- syntetisk
- Tag
- mål
- opgaver
- hold
- Teknisk
- telecom
- terminal
- end
- at
- deres
- Them
- derefter
- Disse
- de
- denne
- dem
- tre
- strammere
- tid
- til
- Tog
- uddannet
- Kurser
- typen
- under
- enheder
- brug
- anvendte
- Bruger
- brugere
- ved brug af
- validering
- værdi
- Værdiskabelse
- udgave
- Specifikation
- synlighed
- vision
- we
- hvornår
- som
- mens
- WHO
- bred
- Bred rækkevidde
- med
- inden for
- uden
- Arbejde
- arbejder
- virker
- skrivning
- år
- år
- Du
- Din
- zephyrnet