Det här är ett gästblogginlägg som skrivits tillsammans med Vik Pant och Kyle Bassett från PwC.
Med organisationer som alltmer investerar i maskininlärning (ML), har ML-antagande blivit en integrerad del av affärstransformationsstrategier. En ny VD för PwC undersökning avslöjade att 84% av kanadensiska VD:ar håller med om att artificiell intelligens (AI) kommer att förändra deras verksamhet avsevärt inom de kommande 5 åren, vilket gör denna teknik mer kritisk än någonsin. Men att implementera ML i produktion kommer med olika överväganden, särskilt att kunna navigera i AI-världen säkert, strategiskt och ansvarsfullt. Ett av de första stegen och särskilt en stor utmaning för att bli AI-driven är att effektivt utveckla ML-pipelines som kan skalas hållbart i molnet. Att tänka på ML i termer av pipelines som genererar och underhåller modeller snarare än modeller i sig själva hjälper till att bygga mångsidiga och motståndskraftiga prediktionssystem som bättre kan motstå meningsfulla förändringar i relevant data över tid.
Många organisationer börjar sin resa in i ML-världen med en modellcentrerad synvinkel. I de tidiga stadierna av att bygga en ML-praxis ligger fokus på att träna övervakade ML-modeller, som är matematiska representationer av relationer mellan input (oberoende variabler) och output (beroende variabler) som lärs från data (typiskt historiska). Modeller är matematiska artefakter som tar indata, utför beräkningar och beräkningar på dem och genererar förutsägelser eller slutsatser.
Även om detta tillvägagångssätt är en rimlig och relativt enkel utgångspunkt, är det inte i sig skalbart eller i sig hållbart på grund av den manuella och ad hoc-karaktären av modellträning, inställning, testning och testaktiviteter. Organisationer med större mognad inom ML-domänen antar ett ML-operationsparadigm (MLOps) som inkluderar kontinuerlig integration, kontinuerlig leverans, kontinuerlig driftsättning och kontinuerlig utbildning. Centralt i detta paradigm är en pipeline-centrerad synvinkel för att utveckla och driva industriella ML-system.
I det här inlägget börjar vi med en översikt över MLOps och dess fördelar, beskriver en lösning för att förenkla dess implementeringar och ger detaljer om arkitekturen. Vi avslutar med en fallstudie som belyser fördelarna med en stor AWS- och PwC-kund som implementerade denna lösning.
Bakgrund
En MLOps-pipeline är en uppsättning sammanhängande sekvenser av steg som används för att bygga, distribuera, driva och hantera en eller flera ML-modeller i produktion. En sådan pipeline omfattar stegen som är involverade i att bygga, testa, trimma och distribuera ML-modeller, inklusive men inte begränsat till dataförberedelse, funktionsutveckling, modellträning, utvärdering, implementering och övervakning. Som sådan är en ML-modell produkten av en MLOps-pipeline, och en pipeline är ett arbetsflöde för att skapa en eller flera ML-modeller. Sådana pipelines stödjer strukturerade och systematiska processer för att bygga, kalibrera, utvärdera och implementera ML-modeller, och modellerna genererar själva förutsägelser och slutsatser. Genom att automatisera utvecklingen och operationaliseringen av steg i pipelines kan organisationer minska tiden till leverans av modeller, öka stabiliteten hos modellerna i produktionen och förbättra samarbetet mellan team av datavetare, mjukvaruingenjörer och IT-administratörer.
Lösningsöversikt
AWS erbjuder en omfattande portfölj av molnbaserade tjänster för att utveckla och driva MLOps-pipelines på ett skalbart och hållbart sätt. Amazon SageMaker omfattar en omfattande portfölj av funktioner som en fullt hanterad MLOps-tjänst för att göra det möjligt för utvecklare att skapa, träna, distribuera, driva och hantera ML-modeller i molnet. SageMaker täcker hela MLOps arbetsflöde, från insamling till att förbereda och träna data med inbyggda högpresterande algoritmer och sofistikerade automatiserade ML (AutoML) experiment så att företag kan välja specifika modeller som passar deras affärsprioriteringar och preferenser. SageMaker gör det möjligt för organisationer att i samarbete automatisera större delen av deras MLOps-livscykel så att de kan fokusera på affärsresultat utan att riskera projektförseningar eller eskalerande kostnader. På detta sätt tillåter SageMaker företag att fokusera på resultat utan att oroa sig för infrastruktur, utveckling och underhåll i samband med att driva förutsägelsetjänster för industriell styrka.
SageMaker inkluderar Amazon SageMaker JumpStart, som erbjuder out-of-the-box lösningsmönster för organisationer som vill påskynda sin MLOps-resa. Organisationer kan börja med förutbildade och öppen källkodsmodeller som kan finjusteras för att möta deras specifika behov genom omskolning och överföring av lärande. Dessutom tillhandahåller JumpStart lösningsmallar utformade för att hantera vanliga användningsfall, såväl som exempel på Jupyter-anteckningsböcker med förskriven startkod. Dessa resurser kan nås genom att helt enkelt besöka JumpStart-målsidan inom Amazon SageMaker Studio.
PwC har byggt en färdigförpackad MLOps-accelerator som ytterligare snabbar upp tiden till värde och ökar avkastningen på investeringen för organisationer som använder SageMaker. Denna MLOps-accelerator förbättrar JumpStarts inbyggda kapacitet genom att integrera kompletterande AWS-tjänster. Med en omfattande uppsättning tekniska artefakter, inklusive infrastruktur som kodskript (IaC), arbetsflöden för databearbetning, kod för tjänstintegrering och pipelinekonfigurationsmallar, förenklar PwC:s MLOps-accelerator processen att utveckla och driva förutsägelsessystem i produktionsklass.
Arkitekturöversikt
Inkluderingen av molnbaserade serverlösa tjänster från AWS prioriteras i arkitekturen för PwC MLOps-acceleratorn. Ingångspunkten till denna accelerator är alla samarbetsverktyg, som Slack, som en datavetare eller dataingenjör kan använda för att begära en AWS-miljö för MLOps. En sådan begäran tolkas och godkänns sedan helt eller halvautomatiskt med hjälp av arbetsflödesfunktioner i det samarbetsverktyget. Efter att en begäran har godkänts används dess uppgifter för att parametrera IaC-mallar. Källkoden för dessa IaC-mallar hanteras i AWS CodeCommit. Dessa parameteriserade IaC-mallar skickas till AWS molnformation för modellering, provisionering och hantering av högar av AWS och tredjepartsresurser.
Följande diagram illustrerar arbetsflödet.
Efter att AWS CloudFormation tillhandahåller en miljö för MLOps på AWS, är miljön redo att användas av datavetare, dataingenjörer och deras samarbetspartners. PWC-acceleratorn inkluderar fördefinierade roller på AWS identitets- och åtkomsthantering (IAM) som är relaterade till MLOps aktiviteter och uppgifter. Dessa roller specificerar tjänsterna och resurserna i MLOps-miljön som kan nås av olika användare baserat på deras jobbprofiler. Efter att ha kommit åt MLOps-miljön kan användare komma åt alla modaliteter på SageMaker för att utföra sina uppgifter. Dessa inkluderar SageMaker notebook-instanser, Amazon SageMaker autopilot experiment och Studio. Du kan dra nytta av alla SageMakers funktioner och funktioner, inklusive modellträning, inställning, utvärdering, driftsättning och övervakning.
I acceleratorn ingår även kopplingar med Amazon DataZone för att dela, söka och upptäcka data i stor skala över organisationsgränser för att generera och berika modeller. På samma sätt kan data för utbildning, testning, validering och detektering av modellavvikelser hämta en mängd olika tjänster, inklusive Amazon RedShift, Amazon Relational Databas Service (Amazon RDS), Amazon Elastic File System (Amazon EFS), och Amazon enkel lagringstjänst (Amazon S3). Förutsägelsesystem kan distribueras på många sätt, inklusive som SageMaker-slutpunkter direkt, SageMaker-slutpunkter insvepta i AWS Lambda funktioner och SageMaker-slutpunkter som anropas genom anpassad kod på Amazon Elastic Kubernetes-tjänst (Amazon EKS) eller Amazon Elastic Compute Cloud (Amazon EC2). amazoncloudwatch används för att övervaka miljön för MLOps på AWS på ett heltäckande sätt för att observera larm, loggar och händelsedata från hela stacken (applikationer, infrastruktur, nätverk och tjänster).
Följande diagram illustrerar denna arkitektur.
Fallstudie
I det här avsnittet delar vi en illustrativ fallstudie från ett stort försäkringsbolag i Kanada. Den fokuserar på den transformativa effekten av implementeringen av PwC Kanadas MLOps-accelerator och JumpStart-mallar.
Den här klienten samarbetade med PwC Canada och AWS för att ta itu med utmaningar med ineffektiv modellutveckling och ineffektiva distributionsprocesser, bristande konsekvens och samarbete och svårigheter att skala ML-modeller. Implementeringen av denna MLOps Accelerator tillsammans med JumpStart-mallar uppnådde följande:
- End-to-end-automatisering – Automatisering nästan halverade tiden för dataförbearbetning, modellträning, justering av hyperparameter och modellinstallation och övervakning
- Samarbete och standardisering – Standardiserade verktyg och ramverk för att främja konsekvens i hela organisationen nästan fördubblade graden av modellinnovation
- Modellstyrning och efterlevnad – De implementerade en modellstyrningsram för att säkerställa att alla ML-modeller uppfyllde regulatoriska krav och följde företagets etiska riktlinjer, vilket minskade riskhanteringskostnaderna med 40 %
- Skalbar molninfrastruktur – De investerade i skalbar infrastruktur för att effektivt hantera enorma datavolymer och distribuera flera ML-modeller samtidigt, vilket minskade infrastruktur- och plattformskostnaderna med 50 %
- Snabb implementering – Den färdigförpackade lösningen minskade tiden till produktion med 70 %
Genom att leverera MLOps bästa praxis genom snabba implementeringspaket, kunde vår klient minska risken för sin MLOps-implementering och låsa upp MLs fulla potential för en rad affärsfunktioner, såsom riskförutsägelse och tillgångsprissättning. Sammantaget gjorde synergin mellan PwC MLOps-acceleratorn och JumpStart det möjligt för vår klient att effektivisera, skala, säkra och upprätthålla sina datavetenskapliga och datatekniska aktiviteter.
Det bör noteras att PwC- och AWS-lösningarna inte är branschspecifika och är relevanta över branscher och sektorer.
Slutsats
SageMaker och dess acceleratorer tillåter organisationer att förbättra produktiviteten i sitt ML-program. Det finns många fördelar, inklusive men inte begränsat till följande:
- Skapa IaC-, MLOps- och AutoML-användningsfall tillsammans för att inse affärsfördelar med standardisering
- Möjliggöra effektiv experimentell prototypframställning, med och utan kod, för att ladda AI från utveckling till implementering med IaC, MLOps och AutoML
- Automatisera tråkiga, tidskrävande uppgifter som funktionsteknik och hyperparameterjustering med AutoML
- Använd ett paradigm för kontinuerlig modellövervakning för att anpassa risken för ML-modellanvändning med företagets riskaptit
Vänligen kontakta författarna till detta inlägg, AWS Advisory Kanada, eller PwC Kanada för att lära dig mer om Jumpstart och PwC:s MLOps-accelerator.
Om författarna
Vik är partner i moln- och dataverksamheten på PwC Canada. Han tog en doktorsexamen i informationsvetenskap från University of Toronto. Han är övertygad om att det finns ett telepatiskt samband mellan hans biologiska neurala nätverk och de artificiella neurala nätverk som han tränar på SageMaker. Ta kontakt med honom LinkedIn.
kyle är en partner i Cloud & Data-praktiken på PwC Canada, tillsammans med sitt crack-team av tekniska alkemister, väver de förtrollande MLOPs-lösningar som trollbinder kunder med accelererat affärsvärde. Beväpnad med kraften av artificiell intelligens och ett stänk av trolldom, förvandlar Kyle komplexa utmaningar till digitala sagor, vilket gör det omöjliga möjligt. Ta kontakt med honom LinkedIn.
Francois är en huvudrådgivningskonsult hos AWS Professional Services Canada och den kanadensiska praktikledaren för Data and Innovation Advisory. Han vägleder kunder att etablera och implementera deras övergripande molnresa och deras dataprogram, med fokus på vision, strategi, affärsdrivkrafter, styrning, måloperativa modeller och färdplaner. Ta kontakt med honom LinkedIn.
- SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
- PlatoAiStream. Web3 Data Intelligence. Kunskap förstärkt. Tillgång här.
- Minting the Future med Adryenn Ashley. Tillgång här.
- Köp och sälj aktier i PRE-IPO-företag med PREIPO®. Tillgång här.
- Källa: https://aws.amazon.com/blogs/machine-learning/accelerate-machine-learning-time-to-value-with-amazon-sagemaker-jumpstart-and-pwcs-mlops-accelerator/
- : har
- :är
- :inte
- $UPP
- 100
- 7
- a
- Able
- Om oss
- accelerera
- accelererad
- accelerator
- acceleratorer
- tillgång
- Accessed
- åtkomst
- uppnås
- tvärs
- aktiviteter
- Ad
- Dessutom
- adress
- administratörer
- anta
- Antagande
- rådgivande
- Efter
- AI
- algoritmer
- rikta
- Alla
- tillåter
- tillåter
- längs
- också
- amason
- Amazon EC2
- Amazon RDS
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- mängd
- an
- och
- vilken som helst
- tillämpningar
- tillvägagångssätt
- godkänd
- arkitektur
- ÄR
- beväpnad
- konstgjord
- artificiell intelligens
- Konstgjord intelligens (AI)
- AS
- bedöma
- tillgång
- associerad
- At
- Författarna
- automatisera
- Automatiserad
- automatisera
- Automation
- AutoML
- AWS
- AWS molnformation
- AWS professionella tjänster
- baserat
- BE
- blir
- passande
- Där vi får lov att vara utan att konstant prestera,
- fördel
- Fördelarna
- BÄST
- bästa praxis
- Bättre
- mellan
- Blogg
- gränser
- SLUTRESULTAT
- Byggnad
- byggt
- inbyggd
- företag
- affärsfunktioner
- Affärstransformation
- företag
- men
- by
- beräkningar
- KAN
- Kanada
- Canadian
- kapacitet
- Vid
- fallstudie
- fall
- centrala
- VD
- vD: ar
- utmanar
- utmaningar
- byta
- Förändringar
- Välja
- klient
- klienter
- cloud
- molninfrastruktur
- koda
- samverkan
- Samla
- COM
- kommer
- Gemensam
- Företag
- företag
- Företagets
- komplementär
- fullborda
- komplex
- omfattande
- innefattar
- beräkningar
- Compute
- konsert
- konfiguration
- Kontakta
- anslutning
- Anslutningar
- överväganden
- konsult
- kontakta
- kontinuerlig
- Kostar
- Täcker
- spricka
- skapa
- Skapa
- kritisk
- beställnings
- kund
- Kunder
- datum
- Förberedelse av data
- databehandling
- datavetenskap
- datavetare
- Databas
- fördröjningar
- leverera
- leverans
- beroende
- distribuera
- utplacerade
- utplacera
- utplacering
- beskriva
- utformade
- detaljer
- utvecklare
- utveckla
- Utveckling
- Svårighet
- digital
- direkt
- upptäcka
- domän
- fördubblats
- chaufförer
- grund
- Tidig
- intjänade
- effektivt
- effektiv
- möjliggöra
- aktiverad
- möjliggör
- omfattar
- ingenjör
- Teknik
- Ingenjörer
- förbättra
- Förbättrar
- berika
- säkerställa
- Företag
- Hela
- inträde
- Miljö
- etablera
- etisk
- utvärdering
- händelser
- NÅGONSIN
- exempel
- experiment
- Leverans
- Funktioner
- Fil
- slut
- Förnamn
- första stegen
- passa
- Fokus
- fokuserar
- fokusering
- efter
- För
- Ramverk
- ramar
- från
- full
- fullständigt
- funktioner
- ytterligare
- generera
- styrning
- stor
- större
- Gäst
- riktlinjer
- Guider
- halveras
- he
- hjälper
- högpresterande
- belysa
- honom
- hans
- historisk
- Men
- html
- http
- HTTPS
- Inställning av hyperparameter
- Identitet
- illustrerar
- Inverkan
- genomföra
- genomförande
- genomföras
- genomföra
- omöjligt
- förbättra
- in
- innefattar
- innefattar
- Inklusive
- integration
- Öka
- Ökar
- alltmer
- oberoende
- industrier
- industrin
- ineffektiv
- info
- informationen
- Infrastruktur
- Innovation
- ingång
- ingångar
- försäkring
- integrerad
- Integrera
- integrering
- Intelligens
- in
- i sig själv
- investerat
- investera
- investering
- åberopas
- involverade
- IT
- DESS
- Jobb
- resa
- jpg
- Brist
- landning
- Large
- leda
- LÄRA SIG
- lärt
- inlärning
- livscykel
- Begränsad
- Maskinen
- maskininlärning
- bibehålla
- underhåll
- Majoritet
- Framställning
- hantera
- förvaltade
- ledning
- hantera
- sätt
- manuell
- många
- massiv
- matematisk
- förfall
- meningsfull
- Möt
- ML
- MLOps
- modell
- modeller
- Övervaka
- övervakning
- mer
- multipel
- nativ
- Natur
- Navigera
- nästan
- behov
- nät
- nätverk
- neurala nätverk
- neurala nätverk
- Nästa
- i synnerhet
- anteckningsbok
- noterade
- observera
- of
- Erbjudanden
- on
- ONE
- öppen källkod
- driva
- drift
- Verksamhet
- or
- organisation
- organisatoriska
- organisationer
- vår
- över
- övergripande
- Översikt
- paket
- sida
- paradigmet
- del
- partnern
- samarbetar
- mönster
- Utföra
- rörledning
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- Punkt
- portfölj
- möjlig
- Inlägg
- potentiell
- kraft
- drivs
- Strömförsörjning
- praktiken
- praxis
- förutsägelse
- Förutsägelser
- preferenser
- förbereda
- prissättning
- Principal
- prioriteras
- process
- processer
- bearbetning
- Produkt
- Produktion
- produktivitet
- professionell
- Profiler
- Program
- Program
- projektet
- främja
- prototyping
- ge
- ger
- PWC
- område
- snabb
- Betygsätta
- snarare
- redo
- inser
- rimlig
- senaste
- minska
- Minskad
- reducerande
- regulatorer
- relaterad
- Förhållanden
- relativt
- relevanta
- begära
- Krav
- elastisk
- Resurser
- Resultat
- avkastning
- Risk
- riskhanterings
- riskera
- färdplaner
- roller
- rinnande
- på ett säkert sätt
- sagemaker
- skalbar
- Skala
- skalning
- Vetenskap
- Forskare
- vetenskapsmän
- skript
- söka
- §
- Sektorer
- säkra
- söker
- Server
- service
- Tjänster
- in
- Dela
- delning
- skall
- signifikant
- Liknande
- Enkelt
- förenkla
- helt enkelt
- samtidigt
- slak
- So
- Mjukvara
- lösning
- Lösningar
- sofistikerade
- Källa
- källkod
- specifik
- hastigheter
- Stabilitet
- stapel
- Stacks
- stadier
- starta
- Starta
- Steg
- förvaring
- Strategiskt
- strategier
- Strategi
- effektivisera
- strukturerade
- studio
- Läsa på
- lämnats
- sådana
- svit
- stödja
- hållbart
- synergi
- System
- tackla
- Ta
- Målet
- uppgifter
- grupp
- lag
- tech
- Teknisk
- Teknologi
- mallar
- villkor
- Testning
- än
- den där
- Smakämnen
- källan
- världen
- deras
- Dem
- sig själva
- sedan
- Där.
- Dessa
- de
- Tänkande
- tredje part
- detta
- Genom
- tid
- tidskrävande
- till
- verktyg
- verktyg
- toronto
- Tåg
- Utbildning
- tåg
- överföring
- Transformation
- transformativ
- vänder
- typiskt
- universitet
- låsa
- avtäckt
- Användning
- användning
- Begagnade
- användare
- med hjälp av
- värde
- mängd
- olika
- mångsidig
- syn
- volymer
- var
- Sätt..
- sätt
- we
- Weave
- webb
- webbservice
- VÄL
- som
- VEM
- kommer
- med
- inom
- utan
- arbetsflöden
- världen
- Wrapped
- år
- Om er
- zephyrnet