Maskininlärning (ML) hjälper organisationer att generera intäkter, minska kostnader, minska risker, öka effektiviteten och förbättra kvaliteten genom att optimera kärnverksamhetens funktioner över flera affärsenheter som marknadsföring, tillverkning, drift, försäljning, ekonomi och kundservice. Med AWS ML kan organisationer påskynda värdeskapandet från månader till dagar. Amazon SageMaker Canvas är en visuell, peka-och-klicka-tjänst som tillåter affärsanalytiker att generera korrekta ML-förutsägelser utan att skriva en enda kodrad eller kräva ML-expertis. Du kan använda modeller för att göra förutsägelser interaktivt och för batchpoäng på bulkdatauppsättningar.
I det här inlägget visar vi upp arkitektoniska mönster om hur affärsteam kan använda ML-modeller byggda var som helst genom att generera förutsägelser i Canvas och uppnå effektiva affärsresultat.
Denna integration av modellutveckling och delning skapar ett tätare samarbete mellan affärs- och datavetenskapsteam och sänker tiden till värde. Affärsteam kan använda befintliga modeller byggda av sina datavetare eller andra avdelningar för att lösa ett affärsproblem istället för att bygga om nya modeller i externa miljöer.
Slutligen kan affärsanalytiker importera delade modeller till Canvas och generera förutsägelser innan de distribueras till produktion med bara några klick.
Lösningsöversikt
Följande figur beskriver tre olika arkitekturmönster för att visa hur datavetare kan dela modeller med affärsanalytiker, som sedan direkt kan generera förutsägelser från dessa modeller i Canvas visuella gränssnitt:
Förutsättningar
För att träna och bygga din modell med SageMaker och ta med din modell i Canvas, fyll i följande förutsättningar:
- Om du inte redan har en SageMaker-domän och Studio-användare, konfigurera och integrera en Studio-användare till en SageMaker-domän.
- Aktivera och konfigurera Canvas basbehörigheter för dina användare och ge användarna behörighet att samarbeta med Studio.
- Du måste ha en utbildad modell från Autopilot, JumpStart eller modellregistret. För alla modeller som du har byggt utanför SageMaker måste du registrera din modell i modellregistret innan du importerar den till Canvas.
Låt oss nu anta rollen som en datavetare som vill träna, bygga, distribuera och dela ML-modeller med en affärsanalytiker för vart och ett av dessa tre arkitektoniska mönster.
Använd Autopilot och Canvas
Autopilot automatiserar nyckeluppgifter i en automatisk ML-process (AutoML) som att utforska data, välja relevant algoritm för problemtypen och sedan träna och ställa in den. Allt detta kan uppnås samtidigt som du kan behålla full kontroll och synlighet på datamängden. Autopiloten utforskar automatiskt olika lösningar för att hitta den bästa modellen, och användare kan antingen iterera på ML-modellen eller direkt distribuera modellen till produktion med ett klick.
I det här exemplet använder vi en syntetisk kundavgång dataset från telekomdomänen och har i uppdrag att identifiera kunder som potentiellt riskerar att churna. Utför följande steg för att använda Autopilot AutoML för att bygga, träna, distribuera och dela en ML-modell med en affärsanalytiker:
- ladda ner dataset, ladda upp den till en Amazon S3 (Amazon enkel lagringstjänst) hink och anteckna S3 URI.
- Välj på Studio-konsolen AutoML i navigeringsfönstret.
- Välja Skapa AutoML-experiment.
- Ange experimentnamnet (för det här inlägget,
Telecom-Customer-Churn-AutoPilot
), S3-datainmatning och utgångsplats. - Ställ in målkolumnen som churn.
- I distributionsinställningarna kan du aktivera alternativet för automatisk distribution för att skapa en slutpunkt som distribuerar din bästa modell och kör slutsatser om slutpunkten.
Mer information finns i Skapa ett Amazon SageMaker Autopilot-experiment.
- Välj ditt experiment, välj sedan din bästa modell och välj Dela modell.
- Lägg till en Canvas-användare och välj Dela att dela modellen.
(Anmärkningar: Du kan inte dela modell med samma Canvas-användare som användes för Studio-inloggning. Till exempel kan Studio användare-A inte dela modell med Canvas User-A. Men användare-A kan dela modell med användare-B, välj därför olika användningsområden för modelldelning)
Mer information finns i Studioanvändare: Dela en modell till SageMaker Canvas.
Använd JumpStart och Canvas
JumpStart är ett ML-nav som tillhandahåller förutbildade modeller med öppen källkod för ett brett spektrum av ML-användningsfall som bedrägeriupptäckt, kreditriskförutsägelse och upptäckt av produktfel. Du kan distribuera mer än 300 förutbildade modeller för tabell-, vision-, text- och ljuddata.
För det här inlägget använder vi en LightGBM-regression förtränad modell från JumpStart. Vi tränar modellen på ett anpassat dataset och delar modellen med en Canvas-användare (affärsanalytiker). Den förtränade modellen kan distribueras till en slutpunkt för slutledning. JumpStart tillhandahåller ett exempel på en anteckningsbok för att komma åt modellen efter att den har distribuerats.
I det här exemplet använder vi abalone dataset. Datauppsättningen innehåller exempel på åtta fysiska mått som längd, diameter och höjd för att förutsäga åldern på abalone (ett regressionsproblem).
- ladda ner abalone dataset från Kaggle.
- Skapa en S3-bucket och ladda upp datauppsättningarna för tåg, validering och anpassade rubriker.
- På studiokonsolen, under SageMaker JumpStart välj i navigeringsfönstret Modeller, anteckningsböcker, lösningar.
- Enligt Tabellmodellerväljer LightGBM-regression.
- Enligt Tågmodell, specificera S3 URI:erna för datauppsättningarna för utbildning, validering och kolumnrubrik.
- Välja Tåg.
- Välj i navigeringsfönstret Lanserade JumpStart-tillgångar.
- På Träningsjobb fliken, välj ditt träningsjobb.
- På Dela meny, välj Dela till Canvas.
- Välj Canvas-användare att dela med, ange modelldetaljerna och välj Dela.
Mer information finns i Studioanvändare: Dela en modell till SageMaker Canvas.
Använd SageMaker modellregister och Canvas
Med SageMaker modellregister kan du katalogisera modeller för produktion, hantera modellversioner, associera metadata, hantera godkännandestatus för en modell, distribuera modeller till produktion och automatisera modelldistribution med CI/CD.
Låt oss anta rollen som en dataforskare. För det här exemplet bygger du ett heltäckande ML-projekt som inkluderar dataförberedelse, modellutbildning, modellvärd, modellregister och modelldelning med en affärsanalytiker. Alternativt, för databeredning och förbearbetnings- eller efterbearbetningssteg, kan du använda Amazon SageMaker Data Wrangler och en Amazon SageMaker-bearbetningsjobb. I det här exemplet använder vi abalone-dataset som laddats ner från LIBSVM. Målvariabeln är abalonens ålder.
- I Studio, klona GitHub repo.
- Slutför stegen i README-filen.
- På studiokonsolen, under Modeller välj i navigeringsfönstret Modellregister.
- Välj modell
sklearn-reg-ablone
. - Dela modellversion 1 från modellregistret till Canvas.
- Välj Canvas-användare att dela med, ange modelldetaljerna och välj Dela.
För instruktioner, se Modellregister avsnitt i Studioanvändare: Dela en modell till SageMaker Canvas.
Hantera delade modeller
När du har delat modellen med någon av de föregående metoderna kan du gå till Modeller avsnittet i Studio och granska alla delade modeller. I följande skärmdump ser vi 3 olika modeller som delas av en Studio-användare (datavetare) med olika Canvas-användare (affärsteam).
Importera en delad modell och gör förutsägelser med Canvas
Låt oss anta rollen som affärsanalytiker och logga in på Canvas med din Canvas-användare.
När en datavetare eller Studio-användare delar en modell med en Canvas-användare får du ett meddelande i Canvas-applikationen att en Studio-användare har delat en modell med dig. I Canvas-applikationen liknar meddelandet följande skärmdump.
Du kan välja Visa uppdatering för att se den delade modellen, eller så kan du gå till Modeller sida i Canvas-applikationen för att upptäcka alla modeller som har delats med dig. Modellimporten från Studio kan ta upp till 20 minuter.
Efter att ha importerat modellen kan du se dess mätvärden och generera realtidsförutsägelser med vad-om-analys eller batchförutsägelser.
Överväganden
Tänk på följande när du delar modeller med Canvas:
- Du lagrar tränings- och valideringsdatauppsättningar i Amazon S3, och S3 URI:erna skickas till Canvas med AWS identitets- och åtkomsthantering (IAM) behörigheter.
- Ange målkolumnen till Canvas eller använd den första kolumnen som standard.
- För att en Canvas-behållare ska kunna analysera slutledningsdata accepterar Canvas-slutpunkten antingen text (CSV) eller applikation (JSON).
- Canvas stöder inte flera container- eller slutledningspipelines.
- Ett dataschema tillhandahålls till Canvas om inga rubriker tillhandahålls i utbildnings- och valideringsdatauppsättningarna. Som standard tillhandahåller JumpStart-plattformen inte rubriker i utbildnings- och valideringsdatauppsättningarna.
- Med Jumpstart måste träningsjobbet vara klart innan du kan dela det med Canvas.
Hänvisa till Begränsningar och felsökning för att hjälpa dig att felsöka eventuella problem du stöter på när du delar modeller.
Städa upp
För att undvika framtida avgifter, ta bort eller stäng av resurserna du skapade när du följde det här inlägget. Hänvisa till Logga ut från Amazon SageMaker Canvas för mer detaljer. Stäng av de individuella resurserna, inklusive bärbara datorer, terminal, kärnor, appar och instanser. För mer information, se Stäng av resurser. Ta bort modellversion, SageMaker slutpunkt och resurser, Autopilotexperimentresurseroch S3 hink.
Slutsats
Studio låter datavetare dela ML-modeller med affärsanalytiker i några enkla steg. Affärsanalytiker kan dra nytta av ML-modeller som redan byggts av datavetare för att lösa affärsproblem istället för att skapa en ny modell i Canvas. Det kan dock vara svårt att använda dessa modeller utanför de miljöer de är byggda i på grund av tekniska krav och manuella processer för att importera modeller. Detta tvingar ofta användare att bygga om ML-modeller, vilket resulterar i dubbelarbete och extra tid och resurser. Canvas tar bort dessa begränsningar så att du kan generera förutsägelser i Canvas med modeller som du har tränat var som helst. Genom att använda de tre mönstren som illustreras i det här inlägget kan du registrera ML-modeller i SageMaker-modellregistret, som är ett metadatalager för ML-modeller, och importera dem till Canvas. Affärsanalytiker kan sedan analysera och generera förutsägelser från vilken modell som helst i Canvas.
För att lära dig mer om hur du använder SageMaker-tjänster, kolla in följande resurser:
Om du har frågor eller förslag, lämna en kommentar.
Om författarna
Aman Sharma är Senior Solutions Architect med AWS. Han arbetar med nystartade företag, små och medelstora företag och företagskunder över hela APJ-regionen, med mer än 19 års erfarenhet av rådgivning, arkitektur och lösningar. Han brinner för att demokratisera AI och ML och hjälpa kunder att designa deras data- och ML-strategier. Utanför jobbet gillar han att utforska naturen och djurlivet.
Zichen Nie är Senior Software Engineer på AWS SageMaker som leder projektet Bring Your Own Model to SageMaker Canvas förra året. Hon har arbetat i Amazon i mer än 7 år och har erfarenhet av både Amazon Supply Chain Optimization och AWS AI-tjänster. Hon tycker om Barre-pass och musik efter jobbet.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoAiStream. Web3 Data Intelligence. Kunskap förstärkt. Tillgång här.
- Minting the Future med Adryenn Ashley. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- : har
- :är
- $UPP
- 1
- 100
- 20
- 7
- a
- Om Oss
- accelerera
- accepterar
- tillgång
- exakt
- Uppnå
- uppnås
- tvärs
- Annat
- Efter
- AI
- AI-tjänster
- algoritm
- Alla
- tillåta
- tillåter
- redan
- amason
- Amazon SageMaker
- Amazon SageMaker autopilot
- Amazon SageMaker Canvas
- an
- analys
- analytiker
- analytiker
- analysera
- och
- vilken som helst
- var som helst
- Ansökan
- godkännande
- appar
- arkitektoniska
- arkitektur
- ÄR
- AS
- Associate
- At
- audio
- bil
- automatisera
- automatiserar
- Automat
- automatiskt
- AutoML
- undvika
- AWS
- bas
- BE
- varit
- innan
- fördel
- BÄST
- mellan
- båda
- föra
- SLUTRESULTAT
- Byggnad
- byggt
- företag
- affärsfunktioner
- företag
- men
- by
- KAN
- canvas
- fall
- katalog
- kedja
- avgifter
- ta
- Välja
- klick
- koda
- samarbeta
- samverkan
- Kolumn
- kommentar
- fullborda
- Konsol
- rådgivning
- Behållare
- innehåller
- kontroll
- Kärna
- Kostar
- skapa
- skapas
- skapar
- Skapa
- skapande
- kredit
- beställnings
- kund
- Kundservice
- Kunder
- datum
- Förberedelse av data
- datavetenskap
- datavetare
- datauppsättningar
- Dagar
- Standard
- demokrati
- demonstrera
- avdelningar
- distribuera
- utplacerade
- utplacera
- utplacering
- vecklas ut
- design
- detaljer
- Detektering
- Utveckling
- olika
- svårt
- direkt
- Upptäck
- inte
- domän
- inte
- ner
- driv
- grund
- varje
- Effektiv
- effektiviteter
- ansträngning
- antingen
- möjliggöra
- början till slut
- Slutpunkt
- ingenjör
- Företag
- miljöer
- exempel
- exempel
- befintliga
- erfarenhet
- experimentera
- expertis
- utforska
- utforskar
- Utforska
- få
- Figur
- Fil
- finansiering
- hitta
- Förnamn
- efter
- För
- Krafter
- bedrägeri
- spårning av bedrägerier
- från
- full
- funktioner
- framtida
- generera
- generera
- Go
- Har
- he
- headers
- höjd
- hjälpa
- hjälpa
- hjälper
- därav
- värd
- Hur ser din drömresa ut
- Men
- html
- http
- HTTPS
- Nav
- identifiera
- Identitet
- if
- importera
- importera
- förbättra
- in
- innefattar
- Inklusive
- individuellt
- informationen
- ingång
- istället
- instruktioner
- integrering
- Gränssnitt
- in
- problem
- IT
- DESS
- Jobb
- jpg
- json
- bara
- Nyckel
- Efternamn
- Förra året
- ledande
- LÄRA SIG
- inlärning
- Lämna
- Längd
- tycka om
- gillar
- begränsningar
- linje
- Noterade
- läge
- log
- logga in
- du letar
- bibehålla
- göra
- hantera
- manuell
- Produktion
- Marknadsföring
- mätningar
- Medium
- metadata
- metoder
- Metrics
- kanske
- emot
- minuter
- Mildra
- ML
- modell
- modeller
- månader
- mer
- multipel
- Musik
- måste
- namn
- Natur
- Navigering
- behov
- Nya
- Nej
- anteckningsbok
- anmälan
- of
- Ofta
- on
- Ombord
- ONE
- öppen källkod
- Verksamhet
- optimering
- optimera
- Alternativet
- or
- organisationer
- Övriga
- ut
- utfall
- produktion
- utanför
- egen
- sida
- panelen
- Godkänd
- brinner
- mönster
- behörigheter
- fysisk
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- Inlägg
- potentiellt
- förutse
- förutsägelse
- Förutsägelser
- förutsättningar
- Problem
- problem
- process
- processer
- bearbetning
- Produkt
- Produktion
- projektet
- ge
- förutsatt
- ger
- kvalitet
- frågor
- område
- motta
- minska
- region
- registrera
- register
- relevanta
- Krav
- Resurser
- resulterande
- intäkter
- översyn
- Risk
- Roll
- sagemaker
- försäljning
- Samma
- Vetenskap
- Forskare
- vetenskapsmän
- poäng
- §
- se
- väljer
- senior
- service
- Tjänster
- in
- inställningar
- Dela
- delas
- aktier
- delning
- hon
- visa
- stänga
- liknande
- Enkelt
- enda
- Small
- So
- Mjukvara
- Programvara ingenjör
- Lösningar
- LÖSA
- nystartade företag
- status
- Steg
- förvaring
- lagra
- strategier
- studio
- sådana
- leverera
- leveranskedjan
- Supply Chain Optimering
- stödja
- syntetisk
- Ta
- Målet
- uppgifter
- lag
- Teknisk
- telecom
- terminal
- än
- den där
- Smakämnen
- deras
- Dem
- sedan
- Dessa
- de
- detta
- de
- tre
- tätare
- tid
- till
- Tåg
- tränad
- Utbildning
- Typ
- under
- enheter
- användning
- Begagnade
- Användare
- användare
- med hjälp av
- godkännande
- värde
- värdeskapande
- version
- utsikt
- synlighet
- syn
- we
- när
- som
- medan
- VEM
- bred
- Brett utbud
- med
- inom
- utan
- Arbete
- arbetssätt
- fungerar
- skrivning
- år
- år
- Om er
- Din
- zephyrnet