Dette er et gæsteblogindlæg skrevet sammen med Vik Pant og Kyle Bassett fra PwC.
Med organisationer, der i stigende grad investerer i maskinlæring (ML), er implementering af ML blevet en integreret del af forretningstransformationsstrategier. En nylig administrerende direktør i PwC undersøgelse afsløret, at 84% af canadiske administrerende direktører er enige om, at kunstig intelligens (AI) vil ændre deres forretning markant inden for de næste 5 år, hvilket gør denne teknologi mere kritisk end nogensinde. Men implementering af ML i produktionen kommer med forskellige overvejelser, især at kunne navigere i AI-verdenen sikkert, strategisk og ansvarligt. Et af de første skridt og især en stor udfordring for at blive AI-drevet er effektivt at udvikle ML-pipelines, der kan skaleres bæredygtigt i skyen. At tænke på ML i form af pipelines, der genererer og vedligeholder modeller frem for modeller i sig selv, hjælper med at opbygge alsidige og modstandsdygtige forudsigelsessystemer, der bedre er i stand til at modstå meningsfulde ændringer i relevante data over tid.
Mange organisationer starter deres rejse ind i ML-verdenen med et model-centreret synspunkt. I de tidlige stadier af opbygningen af en ML-praksis er fokus på træning af superviserede ML-modeller, som er matematiske repræsentationer af sammenhænge mellem input (uafhængige variable) og output (afhængige variabler), der læres fra data (typisk historiske). Modeller er matematiske artefakter, der tager inputdata, udfører beregninger og beregninger på dem og genererer forudsigelser eller slutninger.
Selvom denne tilgang er et rimeligt og relativt simpelt udgangspunkt, er den ikke i sig selv skalerbar eller iboende bæredygtig på grund af den manuelle og ad hoc karakter af modeltrænings-, tuning-, test- og prøveaktiviteter. Organisationer med større modenhed i ML-domænet vedtager et ML-operations-paradigme (MLOps), der inkorporerer kontinuerlig integration, kontinuerlig levering, kontinuerlig implementering og kontinuerlig træning. Centralt i dette paradigme er et pipeline-centreret synspunkt til udvikling og drift af ML-systemer med industriel styrke.
I dette indlæg starter vi med et overblik over MLOps og dets fordele, beskriver en løsning til at forenkle implementeringerne og giver detaljer om arkitekturen. Vi afslutter med et casestudie, der fremhæver fordelene ved en stor AWS- og PwC-kunde, der implementerede denne løsning.
Baggrund
En MLOps-pipeline er et sæt af indbyrdes forbundne sekvenser af trin, der bruges til at bygge, implementere, drive og administrere en eller flere ML-modeller i produktion. En sådan pipeline omfatter de trin, der er involveret i opbygning, test, tuning og implementering af ML-modeller, herunder, men ikke begrænset til, dataforberedelse, feature engineering, modeltræning, evaluering, implementering og overvågning. Som sådan er en ML-model produktet af en MLOps-pipeline, og en pipeline er en arbejdsgang til at skabe en eller flere ML-modeller. Sådanne pipelines understøtter strukturerede og systematiske processer til opbygning, kalibrering, vurdering og implementering af ML-modeller, og modellerne genererer selv forudsigelser og slutninger. Ved at automatisere udviklingen og operationaliseringen af faser af pipelines kan organisationer reducere tiden til levering af modeller, øge stabiliteten af modellerne i produktionen og forbedre samarbejdet mellem teams af datavidenskabsfolk, softwareingeniører og it-administratorer.
Løsningsoversigt
AWS tilbyder en omfattende portefølje af cloud-native tjenester til udvikling og drift af MLOps-pipelines på en skalerbar og bæredygtig måde. Amazon SageMaker omfatter en omfattende portefølje af funktioner som en fuldt administreret MLOps-tjeneste, der gør det muligt for udviklere at skabe, træne, implementere, drive og administrere ML-modeller i skyen. SageMaker dækker hele MLOps workflow, fra indsamling til forberedelse og træning af data med indbyggede højtydende algoritmer og sofistikerede automatiserede ML (AutoML) eksperimenter, så virksomheder kan vælge specifikke modeller, der passer til deres forretningsprioriteter og præferencer. SageMaker gør det muligt for organisationer i samarbejde at automatisere størstedelen af deres MLOps-livscyklus, så de kan fokusere på forretningsresultater uden at risikere projektforsinkelser eller eskalerende omkostninger. På denne måde giver SageMaker virksomheder mulighed for at fokusere på resultater uden at bekymre sig om infrastruktur, udvikling og vedligeholdelse forbundet med at drive forudsigelsestjenester med industriel styrke.
SageMaker inkluderer Amazon SageMaker JumpStart, som tilbyder out-of-the-box løsningsmønstre til organisationer, der søger at accelerere deres MLOps-rejse. Organisationer kan starte med forudtrænede og open source-modeller, der kan finjusteres til at opfylde deres specifikke behov gennem omskoling og overførselslæring. Derudover leverer JumpStart løsningsskabeloner, der er designet til at tackle almindelige brugstilfælde, såvel som eksempler på Jupyter-notebooks med forudskrevet startkode. Disse ressourcer kan tilgås ved blot at besøge JumpStart-destinationssiden indenfor Amazon SageMaker Studio.
PwC har bygget en færdigpakket MLOps-accelerator, der yderligere fremskynder tid til værdi og øger investeringsafkastet for organisationer, der bruger SageMaker. Denne MLOps-accelerator forbedrer JumpStarts oprindelige egenskaber ved at integrere komplementære AWS-tjenester. Med en omfattende pakke af tekniske artefakter, inklusive infrastruktur som kode (IaC) scripts, databehandlingsarbejdsgange, serviceintegrationskode og pipeline konfigurationsskabeloner, forenkler PwC's MLOps accelerator processen med at udvikle og drive forudsigelsessystemer i produktionsklassen.
Arkitektur oversigt
Inkluderingen af cloud-native serverløse tjenester fra AWS er prioriteret i arkitekturen af PwC MLOps-acceleratoren. Indgangspunktet til denne accelerator er ethvert samarbejdsværktøj, såsom Slack, som en dataforsker eller dataingeniør kan bruge til at anmode om et AWS-miljø til MLOps. En sådan anmodning parses og godkendes derefter helt eller semi-automatisk ved hjælp af workflow-funktioner i det pågældende samarbejdsværktøj. Efter at en anmodning er godkendt, bruges dens detaljer til at parametrere IaC-skabeloner. Kildekoden til disse IaC-skabeloner administreres i AWS CodeCommit. Disse parameteriserede IaC-skabeloner sendes til AWS CloudFormation til modellering, klargøring og styring af stakke af AWS og tredjepartsressourcer.
Følgende diagram illustrerer arbejdsgangen.
Efter at AWS CloudFormation har leveret et miljø til MLOps på AWS, er miljøet klar til brug af dataforskere, dataingeniører og deres samarbejdspartnere. PWC-acceleratoren inkluderer foruddefinerede roller på AWS identitets- og adgangsstyring (IAM), der er relateret til MLOps aktiviteter og opgaver. Disse roller specificerer de tjenester og ressourcer i MLOps-miljøet, der kan tilgås af forskellige brugere baseret på deres jobprofiler. Efter at have fået adgang til MLOps-miljøet, kan brugere få adgang til enhver af modaliteterne på SageMaker for at udføre deres opgaver. Disse omfatter SageMaker notebook-forekomster, Amazon SageMaker Autopilot eksperimenter og Studio. Du kan drage fordel af alle SageMaker funktioner og funktioner, herunder modeltræning, tuning, evaluering, implementering og overvågning.
Acceleratoren indeholder også forbindelser med Amazon DataZone til deling, søgning og opdagelse af data i stor skala på tværs af organisationsgrænser for at generere og berige modeller. Tilsvarende kan data til træning, afprøvning, validering og detektering af modeldrift hente en række tjenester, bl.a. Amazon rødforskydning, Amazon Relationel Database Service (Amazon RDS), Amazon Elastic File System (Amazon EFS), og Amazon Simple Storage Service (Amazon S3). Forudsigelsessystemer kan implementeres på mange måder, herunder som SageMaker-endepunkter direkte, SageMaker-slutpunkter pakket ind i AWS Lambda funktioner, og SageMaker-endepunkter påkaldt via brugerdefineret kode på Amazon Elastic Kubernetes Service (Amazon EKS) eller Amazon Elastic Compute Cloud (Amazon EC2). amazoncloudwatch bruges til at overvåge miljøet for MLOps på AWS på en omfattende måde for at observere alarmer, logfiler og hændelsesdata fra hele stakken (applikationer, infrastruktur, netværk og tjenester).
Følgende diagram illustrerer denne arkitektur.
Case study
I dette afsnit deler vi et illustrativt casestudie fra et stort forsikringsselskab i Canada. Den fokuserer på den transformative virkning af implementeringen af PwC Canadas MLOps-accelerator og JumpStart-skabeloner.
Denne klient samarbejdede med PwC Canada og AWS for at løse udfordringer med ineffektiv modeludvikling og ineffektive implementeringsprocesser, mangel på konsekvens og samarbejde og vanskeligheder med at skalere ML-modeller. Implementeringen af denne MLOps Accelerator i samspil med JumpStart-skabeloner opnåede følgende:
- End-to-end automatisering – Automatisering næsten halverede mængden af tid til dataforbehandling, modeltræning, hyperparameterjustering og modelimplementering og -overvågning
- Samarbejde og standardisering – Standardiserede værktøjer og rammer for at fremme sammenhæng på tværs af organisationen næsten fordoblede antallet af modelinnovationer
- Modelstyring og overholdelse – De implementerede en modelstyringsramme for at sikre, at alle ML-modeller opfyldte regulatoriske krav og overholdt virksomhedens etiske retningslinjer, hvilket reducerede risikostyringsomkostningerne med 40 %
- Skalerbar cloud-infrastruktur – De investerede i skalerbar infrastruktur for effektivt at administrere massive datamængder og implementere flere ML-modeller samtidigt, hvilket reducerede infrastruktur- og platformomkostningerne med 50 %
- Hurtig implementering – Den færdigpakkede opløsning reducerede tiden til produktion med 70 %
Ved at levere MLOps bedste praksis gennem hurtige implementeringspakker, var vores klient i stand til at mindske risikoen for deres MLOps-implementering og frigøre det fulde potentiale af ML til en række forretningsfunktioner, såsom risikoforudsigelse og aktivprissætning. Samlet set satte synergien mellem PwC MLOps-acceleratoren og JumpStart vores klient i stand til at strømline, skalere, sikre og opretholde deres datavidenskab og dataingeniøraktiviteter.
Det skal bemærkes, at PwC- og AWS-løsningen ikke er branchespecifik og er relevant på tværs af brancher og sektorer.
Konklusion
SageMaker og dets acceleratorer giver organisationer mulighed for at øge produktiviteten af deres ML-program. Der er mange fordele, herunder men ikke begrænset til følgende:
- Opret sammen IaC, MLOps og AutoML use cases for at realisere forretningsfordele ved standardisering
- Aktiver effektiv eksperimentel prototyping, med og uden kode, for at turbolade AI fra udvikling til implementering med IaC, MLOps og AutoML
- Automatiser kedelige, tidskrævende opgaver såsom feature engineering og hyperparameter tuning med AutoML
- Anvend et kontinuerligt modelovervågningsparadigme for at tilpasse risikoen ved ML-modelbrug med virksomhedens risikoappetit
Kontakt venligst forfatterne af dette indlæg, AWS Advisory Canada eller PwC Canada for at lære mere om Jumpstart og PwC's MLOps accelerator.
Om forfatterne
Vik er partner i Cloud & Data-praksis hos PwC Canada. Han fik en PhD i informationsvidenskab fra University of Toronto. Han er overbevist om, at der er en telepatisk forbindelse mellem hans biologiske neurale netværk og de kunstige neurale netværk, som han træner på SageMaker. Forbind med ham LinkedIn.
Kyle er partner i Cloud & Data-praksis hos PwC Canada, sammen med sit crack-team af tekniske alkymister væver de fortryllende MLOPs-løsninger, der fascinerer kunder med accelereret forretningsværdi. Bevæbnet med kraften fra kunstig intelligens og et drys af trolddom gør Kyle komplekse udfordringer til digitale eventyr, der gør det umulige muligt. Forbind med ham LinkedIn.
Francois er Principal Advisory Consultant hos AWS Professional Services Canada og den canadiske praksisleder for Data and Innovation Advisory. Han guider kunder til at etablere og implementere deres overordnede cloud-rejse og deres dataprogrammer, med fokus på vision, strategi, forretningsdrivere, governance, måldriftsmodeller og køreplaner. Forbind med ham LinkedIn.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
- Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
- Køb og sælg aktier i PRE-IPO-virksomheder med PREIPO®. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/accelerate-machine-learning-time-to-value-with-amazon-sagemaker-jumpstart-and-pwcs-mlops-accelerator/
- :har
- :er
- :ikke
- $OP
- 100
- 7
- a
- I stand
- Om
- fremskynde
- accelereret
- accelerator
- acceleratorer
- adgang
- af udleverede
- Adgang
- opnået
- tværs
- aktiviteter
- Ad
- Derudover
- adresse
- administratorer
- vedtage
- Vedtagelse
- rådgivende
- Efter
- AI
- algoritmer
- tilpasse
- Alle
- tillade
- tillader
- sammen
- også
- Amazon
- Amazon EC2
- Amazon RDS
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- beløb
- an
- ,
- enhver
- applikationer
- tilgang
- godkendt
- arkitektur
- ER
- væbnet
- kunstig
- kunstig intelligens
- Kunstig intelligens (AI)
- AS
- Vurdering
- aktiv
- forbundet
- At
- forfattere
- automatisere
- Automatiseret
- Automatisering
- Automation
- AutoML
- AWS
- AWS CloudFormation
- AWS Professional Services
- baseret
- BE
- bliver
- blive
- være
- gavner det dig
- fordele
- BEDSTE
- bedste praksis
- Bedre
- mellem
- Blog
- grænser
- bygge
- Bygning
- bygget
- indbygget
- virksomhed
- forretningsfunktioner
- Forretningstransformation
- virksomheder
- men
- by
- beregninger
- CAN
- Canada
- Canadian
- kapaciteter
- tilfælde
- casestudie
- tilfælde
- central
- Direktør
- direktører
- udfordre
- udfordringer
- lave om
- Ændringer
- Vælg
- kunde
- kunder
- Cloud
- sky infrastruktur
- kode
- samarbejde
- Indsamling
- KOM
- kommer
- Fælles
- Virksomheder
- selskab
- Selskabs
- komplementære
- fuldføre
- komplekse
- omfattende
- omfatter
- beregninger
- Compute
- koncert
- Konfiguration
- Tilslut
- tilslutning
- Tilslutninger
- overvejelser
- konsulent
- kontakt
- kontinuerlig
- Omkostninger
- Dækker
- sprække
- skabe
- Oprettelse af
- kritisk
- skik
- kunde
- Kunder
- data
- Dataforberedelse
- databehandling
- datalogi
- dataforsker
- Database
- forsinkelser
- leverer
- levering
- afhængig
- indsætte
- indsat
- implementering
- implementering
- beskrive
- konstrueret
- detaljer
- udviklere
- udvikling
- Udvikling
- Vanskelighed
- digital
- direkte
- opdage
- domæne
- fordoblet
- drivere
- grund
- Tidligt
- optjent
- effektivt
- effektiv
- muliggøre
- aktiveret
- muliggør
- vedrører generelt
- ingeniør
- Engineering
- Ingeniører
- forbedre
- Forbedrer
- berige
- sikre
- Enterprise
- Hele
- indrejse
- Miljø
- etablere
- etisk
- evaluering
- begivenheder
- NOGENSINDE
- eksempel
- eksperimenter
- Feature
- Funktionalitet
- File (Felt)
- slut
- Fornavn
- første skridt
- passer
- Fokus
- fokuserer
- fokusering
- efter
- Til
- Framework
- rammer
- fra
- fuld
- fuldt ud
- funktioner
- yderligere
- generere
- regeringsførelse
- stor
- større
- Gæst
- retningslinjer
- Guides
- halveret
- he
- hjælper
- Høj ydeevne
- fremhæve
- ham
- hans
- historisk
- Men
- HTML
- http
- HTTPS
- Tuning af hyperparameter
- Identity
- illustrerer
- KIMOs Succeshistorier
- gennemføre
- implementering
- implementeret
- gennemføre
- umuligt
- Forbedre
- in
- omfatter
- omfatter
- Herunder
- inklusion
- Forøg
- Stigninger
- stigende
- uafhængig
- industrier
- industrien
- ineffektiv
- info
- oplysninger
- Infrastruktur
- Innovation
- indgang
- indgange
- forsikring
- integral
- Integration
- integration
- Intelligens
- ind
- uløseligt
- investeret
- investere
- investering
- påberåbes
- involverede
- IT
- ITS
- Job
- rejse
- jpg
- Mangel
- landing
- stor
- føre
- LÆR
- lærte
- læring
- livscyklus
- Limited
- maskine
- machine learning
- vedligeholde
- vedligeholdelse
- Flertal
- Making
- administrere
- lykkedes
- ledelse
- styring
- måde
- manuel
- mange
- massive
- matematiske
- modenhed
- meningsfuld
- Mød
- ML
- MLOps
- model
- modeller
- Overvåg
- overvågning
- mere
- flere
- indfødte
- Natur
- Naviger
- næsten
- behov
- netværk
- net
- neurale netværk
- neurale netværk
- næste
- især
- notesbog
- bemærkede
- observere
- of
- Tilbud
- on
- ONE
- open source
- betjene
- drift
- Produktion
- or
- organisation
- organisatorisk
- organisationer
- vores
- i løbet af
- samlet
- oversigt
- pakker
- side
- paradigme
- del
- partner
- partnerskab
- mønstre
- Udfør
- pipeline
- perron
- plato
- Platon Data Intelligence
- PlatoData
- Punkt
- portefølje
- mulig
- Indlæg
- potentiale
- magt
- strøm
- strømforsyning
- praksis
- praksis
- forudsigelse
- Forudsigelser
- præferencer
- forberede
- prissætning
- Main
- prioriteret
- behandle
- Processer
- forarbejdning
- Produkt
- produktion
- produktivitet
- professionel
- Profiler
- Program
- Programmer
- projekt
- fremme
- prototyping
- give
- giver
- PWC
- rækkevidde
- hurtige
- Sats
- hellere
- klar
- indse
- rimelige
- nylige
- reducere
- Reduceret
- reducere
- lovgivningsmæssige
- relaterede
- Relationer
- relativt
- relevant
- anmode
- Krav
- elastisk
- Ressourcer
- Resultater
- afkast
- Risiko
- risikostyring
- risikere
- køreplaner
- roller
- kører
- sikkert
- sagemaker
- skalerbar
- Scale
- skalering
- Videnskab
- Videnskabsmand
- forskere
- scripts
- søgning
- Sektion
- Sektorer
- sikker
- søger
- Serverless
- tjeneste
- Tjenester
- sæt
- Del
- deling
- bør
- betydeligt
- Tilsvarende
- Simpelt
- forenkle
- ganske enkelt
- samtidigt
- slæk
- So
- Software
- løsninger
- Løsninger
- sofistikeret
- Kilde
- kildekode
- specifikke
- hastigheder
- Stabilitet
- stable
- Stakke
- etaper
- starte
- Starter
- Steps
- opbevaring
- Strategisk
- strategier
- Strategi
- strømline
- struktureret
- Studio
- Studere
- indsendt
- sådan
- suite
- support
- bæredygtig
- synergi
- Systemer
- tackle
- Tag
- mål
- opgaver
- hold
- hold
- tech
- Teknisk
- Teknologier
- skabeloner
- vilkår
- Test
- end
- at
- The Source
- verdenen
- deres
- Them
- selv
- derefter
- Der.
- Disse
- de
- Tænker
- tredjepart
- denne
- Gennem
- tid
- tidskrævende
- til
- værktøj
- værktøjer
- toronto
- Tog
- Kurser
- tog
- overførsel
- Transformation
- transformative
- vender
- typisk
- universitet
- låse
- afsløret
- Brug
- brug
- anvendte
- brugere
- ved brug af
- værdi
- række
- forskellige
- alsidige
- vision
- mængder
- var
- Vej..
- måder
- we
- Weave
- web
- webservices
- GODT
- som
- WHO
- vilje
- med
- inden for
- uden
- arbejdsgange
- world
- Indpakket
- år
- Du
- zephyrnet