Igas suuruses ja igas tööstusharus olevad kliendid teevad AWS-is uuendusi, lisades oma toodetesse ja teenustesse masinõppe (ML). Hiljutised arengud generatiivsete AI mudelite vallas on veelgi suurendanud vajadust ML kasutuselevõtuks kõigis tööstusharudes. Siiski on turvalisuse, andmete privaatsuse ja halduse kontrollide rakendamine endiselt peamised väljakutsed, millega kliendid silmitsi seisavad ML töökoormuse mastaapsel rakendamisel. Nende väljakutsetega tegelemine loob raamistiku ja aluse riskide maandamiseks ja ML-põhiste toodete vastutustundlikuks kasutamiseks. Kuigi generatiivne tehisintellekt võib vajada täiendavaid kontrolle, nagu toksilisuse eemaldamine ning vanglamurdmise ja hallutsinatsioonide ärahoidmine, jagab see turvalisuse ja juhtimise jaoks samu põhikomponente kui traditsioonilisel ML-il.
Oleme klientidelt kuulnud, et nad vajavad eriteadmisi ja kuni 12-kuulist investeeringut oma kohandatud väljatöötamiseks Amazon SageMaker ML-platvormi juurutamine, et tagada skaleeritav, töökindel, turvaline ja juhitud ML-keskkond nende ärivaldkondade (LOB) või ML-meeskondade jaoks. Kui teil puudub raamistik ML elutsükli mastaabis juhtimiseks, võib teil tekkida probleeme, nagu meeskonnatasemel ressursside eraldamine, eksperimenteerimisressursside skaleerimine, ML-i töövoogude elluviimine, mudeli juhtimise skaleerimine ning ML-i töökoormuste turvalisuse ja vastavuse haldamine.
ML-i elutsükli mastaapne reguleerimine on raamistik, mis aitab teil luua ML-platvormi koos manustatud turbe- ja juhtimiskontrollidega, mis põhinevad valdkonna parimatel tavadel ja ettevõtte standarditel. See raamistik käsitleb probleeme, pakkudes ettekirjutavaid juhiseid modulaarse raamistiku lähenemisviisi kaudu, mis laiendab AWS juhttorn mitme kontoga AWS-i keskkond ja postituses käsitletud lähenemine Turvaliste ja hästi juhitud masinõppekeskkondade seadistamine AWS-is.
See annab ettekirjutavaid juhiseid järgmiste ML-platvormi funktsioonide jaoks:
- Mitme konto, turvalisuse ja võrgu loomise alused – See funktsioon kasutab AWS-i juhttorni ja hästi üles ehitatud põhimõtted mitme kontoga keskkonna-, turva- ja võrguteenuste seadistamiseks ja kasutamiseks.
- Andmed ja valitsemise alused – See funktsioon kasutab a andmevõrgu arhitektuur andmejärve, keskse funktsioonide salvestamise ja andmehalduse sihtasutuste seadistamiseks ja kasutamiseks, et võimaldada täpset juurdepääsu andmetele.
- ML-platvormi jagatud ja haldusteenused – See funktsioon võimaldab seadistada ja kasutada tavalisi teenuseid, nagu CI/CD, AWS-i teenuste kataloog pakkumiskeskkondade jaoks ning keskne mudeliregister mudelite edendamiseks ja põlvnemiseks.
- ML meeskonna keskkonnad – See funktsioon võimaldab ML-meeskondade jaoks seadistada ja töökeskkondi mudelite arendamiseks, testimiseks ja nende kasutusjuhtude juurutamiseks turbe- ja halduskontrollide manustamiseks.
- ML platvormi jälgitavus – See funktsioon aitab logide tsentraliseerimise ja logianalüüsi visualiseerimise tööriistade abil tõrkeotsingul ja probleemide algpõhjuste tuvastamisel ML-mudelites. Samuti annab see juhiseid ML kasutusjuhtude kulu- ja kasutusaruannete koostamiseks.
Kuigi see raamistik võib pakkuda eeliseid kõikidele klientidele, on see kõige kasulikum suurtele, küpsetele, reguleeritud või globaalsetele ettevõtetele, kes soovivad oma ML-strateegiaid kogu organisatsioonis kontrollitud, nõuetele vastava ja koordineeritud lähenemisviisiga skaleerida. See aitab võimaldada ML kasutuselevõttu, vähendades samal ajal riske. See raamistik on kasulik järgmistele klientidele:
- Suurettevõtete kliendid, kellel on palju LOB-sid või osakondi, kes on huvitatud ML-i kasutamisest. See raamistik võimaldab erinevatel meeskondadel iseseisvalt luua ja juurutada ML-mudeleid, pakkudes samal ajal keskset juhtimist.
- Mõõduka kuni kõrge tähtajaga ettevõttekliendid (ML). Nad on juba kasutusele võtnud mõned esialgsed ML-mudelid ja soovivad oma ML-i jõupingutusi laiendada. See raamistik võib aidata kiirendada ML kasutuselevõttu kogu organisatsioonis. Need ettevõtted tunnistavad ka vajadust juhtimise järele, et hallata selliseid asju nagu juurdepääsu kontroll, andmekasutus, mudeli jõudlus ja ebaõiglane eelarvamus.
- Ettevõtted reguleeritud tööstusharudes, nagu finantsteenused, tervishoid, keemia ja erasektor. Need ettevõtted vajavad oma äriprotsessides kasutatavate ML-mudelite jaoks tugevat juhtimist ja kuuldavust. Selle raamistiku vastuvõtmine võib hõlbustada vastavust, võimaldades samas kohaliku mudeli väljatöötamist.
- Globaalsed organisatsioonid, mis peavad tasakaalustama tsentraliseeritud ja kohalikku kontrolli. Selle raamistiku ühendatud lähenemisviis võimaldab keskplatvormi inseneride meeskonnal kehtestada kõrgetasemelised poliitikad ja standardid, kuid annab ka LOB-meeskondadele paindlikkuse kohalike vajaduste alusel kohanemiseks.
Selle seeria esimeses osas käime läbi ML-platvormi seadistamise võrdlusarhitektuuri. Hilisemas postituses anname ettekirjutavad juhised selle kohta, kuidas rakendada teie organisatsioonis viitearhitektuuri erinevaid mooduleid.
ML-platvormi võimalused on rühmitatud nelja kategooriasse, nagu on näidatud järgmisel joonisel. Need võimalused moodustavad selles postituses hiljem käsitletava võrdlusarhitektuuri aluse:
- Ehitage ML vundamendid
- Skaala ML-i toiminguid
- Vaadeldav ML
- Turvaline ML
Lahenduse ülevaade
ML elutsükli mastaabis reguleerimise raamistik võimaldab organisatsioonidel integreerida turbe- ja juhtimiskontrollid kogu ML elutsükli jooksul, mis omakorda aitab organisatsioonidel vähendada riske ja kiirendada ML lisamist oma toodetesse ja teenustesse. Raamistik aitab optimeerida turvaliste, skaleeritavate ja usaldusväärsete ML-keskkondade seadistamist ja juhtimist, mida saab skaleerida, et toetada üha suuremat hulka mudeleid ja projekte. Raamistik võimaldab järgmisi funktsioone:
- Konto ja taristu varustamine organisatsiooni poliitikaga ühilduvate infrastruktuuriressurssidega
- Andmeteaduslike keskkondade iseteeninduslik juurutamine ja ots-otsa ML-operatsioonide (MLOps) mallid ML kasutusjuhtudel
- LOB-taseme või meeskonnataseme ressursside eraldamine turvalisuse ja privaatsuse järgimiseks
- Juurdepääs tootmistaseme andmetele katsetamiseks ja tootmisvalmis töövoogude jaoks
- Koodihoidlate, koodikonveierite, juurutatud mudelite ja andmefunktsioonide haldamine ja juhtimine
- Mudelregistri ja funktsioonide salvestus (kohalikud ja kesksed komponendid) juhtimise parandamiseks
- Turva- ja juhtimiskontrollid täieliku mudeli arendamise ja juurutamise protsessi jaoks
Selles jaotises anname ülevaate ettekirjutavatest juhistest, mis aitavad teil seda ML-platvormi AWS-is koos manustatud turbe- ja haldusjuhtimiselementidega luua.
ML-platvormiga seotud funktsionaalne arhitektuur on näidatud järgmisel diagrammil. Arhitektuur kaardistab ML-platvormi erinevad võimalused AWS-i kontodele.
Erinevate võimalustega funktsionaalset arhitektuuri rakendatakse mitmete AWS-teenuste, sh AWS-i organisatsioonid, SageMaker, AWS DevOpsi teenused ja andmejärv. Erinevate AWS-teenustega ML-platvormi võrdlusarhitektuur on näidatud järgmisel diagrammil.
See raamistik arvestab ML elutsükli ulatuslikuks reguleerimiseks mitut isikut ja teenust. Soovitame oma meeskondade ja teenuste korraldamiseks järgmisi samme.
- AWS-i juhttorni ja automatiseerimistööriistade abil seadistab teie pilveadministraator mitme kontoga alused, nagu organisatsioonid ja AWS IAM identiteedikeskus (AWS Single Sign-On järglane) ning turva- ja haldusteenused, nagu AWS-i võtmehaldusteenus (AWS KMS) ja teenusekataloog. Lisaks seadistab administraator mitmesuguseid organisatsiooniüksusi (OU-sid) ja algkontosid, et toetada teie ML-i ja analüütika töövooge.
- Data Lake'i administraatorid seadistavad teie andmejärve ja andmekataloogi ning keskse funktsioonide poe koos ML-i platvormi administraatoriga.
- ML-i platvormi administraator pakub ML-i jagatud teenuseid, näiteks AWS CodeCommit, AWS CodePipeline, Amazoni elastsete konteinerite register (Amazon ECR), keskne mudeliregister, SageMakeri mudelikaardid, SageMakeri mudeli armatuurlaudja teenusekataloogi tooted ML-meeskondadele.
- ML-i meeskond juhib liitumist IAM-i identiteedikeskuse kaudu, kasutab teenusekataloogi tooteid ja varustab ML-i meeskonna arenduskeskkonna ressursse.
- Erinevate äriüksuste ML-meeskondade andmeteadlased ühinevad oma meeskonna arenduskeskkonda, et luua mudelkonveier.
- Andmeteadlased otsivad ja tõmbavad funktsioone kesksest funktsioonipoe kataloogist, loovad katsete abil mudeleid ja valivad reklaamimiseks parima mudeli.
- Andmeteadlased loovad ja jagavad taaskasutamiseks uusi funktsioone keskses funktsioonipoe kataloogis.
- ML-i insener juurutab mudelikonveieri ML-i meeskonna testikeskkonda, kasutades jagatud teenuste CI/CD protsessi.
- Pärast sidusrühmade valideerimist juurutatakse ML-mudel meeskonna tootmiskeskkonda.
- Turvalisuse ja halduse juhtelemendid on manustatud selle arhitektuuri igasse kihti, kasutades selliseid teenuseid nagu AWS-i turvakeskus, Amazoni valveteenistus, Amazon MacieJa palju muud.
- Turvajuhtelemente hallatakse tsentraalselt turbetööriistade kontolt, kasutades turvakeskust.
- ML-platvormi haldusvõimalusi, nagu SageMakeri mudelikaardid ja SageMakeri mudeli armatuurlaud, hallatakse keskselt haldusteenuste kontolt.
- Amazon CloudWatch ja AWS CloudTrail iga liikmekonto logid tehakse tsentraalselt juurdepääsetavaks jälgitavuskontolt, kasutades AWS-i kohalikke teenuseid.
Järgmisena sukeldume sügavale selle raamistiku võrdlusarhitektuuri moodulitesse.
Arhitektuuri viitemoodulid
Võrdlusarhitektuur koosneb kaheksast moodulist, millest igaüks on mõeldud teatud probleemide lahendamiseks. Need moodulid käsitlevad ühiselt juhtimist erinevates mõõtmetes, nagu infrastruktuur, andmed, mudel ja kulud. Iga moodul pakub eraldiseisvat funktsioonide komplekti ja toimib koos teiste moodulitega, et pakkuda integreeritud täielikku ML-platvormi koos manustatud turbe- ja haldusjuhtimiselementidega. Selles jaotises esitame lühikese kokkuvõtte iga mooduli võimalustest.
Mitme kontoga sihtasutused
See moodul aitab pilveadministraatoritel luua AWS juhttorni maandumistsoon kui alusraamistik. See hõlmab mitme konto struktuuri loomist, autentimist ja autoriseerimist IAM-i identiteedikeskuse kaudu, võrgu jaoturi ja kodaraga kujundust, tsentraliseeritud logimisteenuseid ja uusi AWS-i liikmekontosid, millel on standardiseeritud turbe- ja juhtimispõhimõtted.
Lisaks annab see moodul parimate tavade juhiseid OU ja kontostruktuuride kohta, mis sobivad teie ML-i ja analüüsi töövoogude toetamiseks. Pilveadministraatorid mõistavad vajalike kontode ja OU-de eesmärki, nende juurutamist ning peamisi turbe- ja vastavusteenuseid, mida nad peaksid kasutama oma ML-i ja analüütika töökoormuse tsentraalseks juhtimiseks.
Samuti on hõlmatud uute kontode müügi raamistik, mis kasutab uute kontode loomisel automatiseerimist. Konto automaatse varustamise protsessi seadistamisega saavad pilveadministraatorid pakkuda ML-i ja analüütikameeskondadele kontosid, mida nad vajavad oma töö kiiremaks tegemiseks, ohverdamata seejuures tugevast juhtimisalusest.
Data järve vundamendid
See moodul aitab Data Lake'i administraatoritel seadistada andmejärve andmete sissevõtmiseks, andmekogude kureerimiseks ja AWS järve kihistu juhtimismudel, mis võimaldab hallata täpset juurdepääsu andmetele kontode ja kasutajate vahel, kasutades tsentraliseeritud andmekataloogi, andmetele juurdepääsu poliitikaid ja sildipõhiseid juurdepääsu juhtelemente. Võite alustada väikesest, kasutades oma andmeplatvormi aluseid ühe kontoga, mis võimaldab kontseptsiooni tõestamist või mõne väikese töökoormuse. Keskmise kuni suuremahulise tootmiskoormuse rakendamiseks soovitame võtta kasutusele mitme konto strateegia. Sellises seades võivad LOB-id võtta andmetootjate ja andmetarbijate rolli, kasutades erinevaid AWS-i kontosid, ning andmejärve haldamist juhitakse keskselt jagatud AWS-kontolt. Andmetootja kogub, töötleb ja salvestab andmeid oma andmevaldkonnast, lisaks jälgib ja tagab oma andmevarade kvaliteedi. Andmetarbijad tarbivad andmetootja andmeid pärast seda, kui tsentraliseeritud kataloog jagab neid Lake Formationi abil. Tsentraliseeritud kataloog salvestab ja haldab andmetootja kontode jagatud andmekataloogi.
ML platvormi teenused
See moodul aitab ML-i platvormi insenerimeeskonnal seadistada jagatud teenuseid, mida andmeteaduse meeskonnad kasutavad oma meeskonnakontodel. Teenused hõlmavad teenusekataloogi portfelli toodetega SageMakeri domeen kasutuselevõtt, SageMakeri domeeni kasutajaprofiil juurutamine, andmeteaduse mudelimallid mudelite loomiseks ja juurutamiseks. Sellel moodulil on funktsioonid tsentraliseeritud mudeliregistri, mudelikaartide, mudelite armatuurlaua ja CI/CD torujuhtmete jaoks, mida kasutatakse mudeliarenduse ja juurutamise töövoogude juhtimiseks ja automatiseerimiseks.
Lisaks kirjeldatakse selles moodulis üksikasjalikult, kuidas rakendada isikupõhiste iseteenindusvõimaluste võimaldamiseks vajalikke juhtelemente ja juhtimist, võimaldades andmeteaduse meeskondadel iseseisvalt juurutada vajalikku pilveinfrastruktuuri ja ML-malle.
ML kasutusjuhtude arendus
See moodul aitab LOBidel ja andmeteadlastel arenduskeskkonnas juurde pääseda oma meeskonna SageMakeri domeenile ja luua mudelite koostamise malli oma mudelite arendamiseks. Selles moodulis töötavad andmeteadlased malli arendajakonto eksemplari kallal, et suhelda tsentraliseeritud andmejärves saadaolevate andmetega, taaskasutada ja jagada funktsioone kesksest funktsioonide poest, luua ja käitada ML-eksperimente, luua ja testida oma ML-i töövooge, ja registreerima oma mudelid arenduskeskkondade arendajakonto mudeliregistrisse.
Mallides on rakendatud ka selliseid võimalusi nagu katsete jälgimine, mudelite seletatavuse aruanded, andmete ja mudelite eelarvamuste jälgimine ning mudeliregister, mis võimaldab lahendusi kiiresti kohandada andmeteadlaste väljatöötatud mudelitega.
ML operatsioonid
See moodul aitab LOB-idel ja ML-i inseneridel töötada oma mudeli juurutusmalli arendusjuhtumitega. Pärast kandidaatmudeli registreerimist ja heakskiitmist seadistavad nad CI/CD torujuhtmed ja käitavad meeskonna testkeskkonnas ML-i töövooge, mis registreerib mudeli kesksesse mudeliregistrisse, mis töötab platvormi jagatud teenuste kontol. Kui mudel on keskses mudeliregistris heaks kiidetud, käivitab see CI/CD konveieri mudeli juurutamiseks meeskonna tootmiskeskkonda.
Tsentraliseeritud funktsioonide pood
Pärast seda, kui esimesed mudelid on tootmisse juurutatud ja mitu kasutusjuhtumit hakkavad samade andmete põhjal loodud funktsioone jagama, muutub funktsioonide salvestus hädavajalikuks, et tagada kasutusjuhtumitevaheline koostöö ja vähendada dubleerivat tööd. See moodul aitab ML-i platvormi insenerimeeskonnal luua tsentraliseeritud funktsioonide poe, et pakkuda ML-i kasutusjuhtudel loodud ML-funktsioonide salvestusruumi ja juhtimist, võimaldades funktsioonide taaskasutamist projektides.
Logimine ja jälgitavus
See moodul aitab LOB-idel ja ML-i praktikutel näha ML-i töökoormuste olekut ML-keskkondades, tsentraliseerides logitoimingud, nagu CloudTrail, CloudWatch, VPC voologid ja ML-töökoormuse logid. Meeskonnad saavad analüüsimiseks logisid filtreerida, päringuid teha ja visualiseerida, mis võib samuti parandada turvalisust.
Kulud ja aruandlus
See moodul aitab erinevatel sidusrühmadel (pilveadministraator, platvormi administraator, pilveettevõtte kontor) luua aruandeid ja armatuurlaudu, et jaotada kulusid ML-kasutaja, ML-meeskonna ja ML-i tootetasemel ning jälgida kasutust, näiteks kasutajate arvu, eksemplaritüüpe ja lõpp-punktid.
Kliendid on palunud meil anda juhiseid selle kohta, kui palju kontosid luua ja kuidas neid kontosid struktureerida. Järgmises jaotises anname juhised selle konto struktuuri kohta, mida saate oma vajaduste järgi vastavalt ettevõtte juhtimisnõuetele muuta.
Selles jaotises käsitleme oma konto struktuuri korraldamise soovitust. Jagame baastaseme võrdluskonto struktuuri; Siiski soovitame ML-i ja andmeadministraatoritel teha tihedat koostööd oma pilveadministraatoriga, et kohandada seda kontostruktuuri vastavalt oma organisatsiooni juhtelementidele.
Turvalisuse, infrastruktuuri, töökoormuse ja juurutuste jaoks soovitame korraldada kontod OU järgi. Lisaks korraldage igas organisatsiooniüksuses mittetootmis- ja tootmisüksused, kuna nende all kasutatavatel kontodel ja töökoormustel on erinevad juhtelemendid. Järgmisena käsitleme lühidalt neid OU-sid.
Turvalisus OÜ
Selle OU kontosid haldab organisatsiooni pilveadministraator või turvameeskond, et jälgida, tuvastada, kaitsta, tuvastada ja reageerida turvasündmustele.
Infrastruktuuri OU
Selle OU kontosid haldab organisatsiooni pilveadministraator või võrgumeeskond, kes haldab ettevõtte tasemel infrastruktuuri jagatud ressursse ja võrke.
Soovitame omada infrastruktuuri OU all järgmisi kontosid:
- võrk – Looge tsentraliseeritud võrguinfrastruktuur, näiteks AWS Transit Gateway
- Jagatud teenused – Seadistage tsentraliseeritud AD teenused ja VPC lõpp-punktid
Töökoormused OU
Selle OU kontosid haldavad organisatsiooni platvormimeeskonna administraatorid. Kui teil on vaja iga platvormimeeskonna jaoks rakendada erinevaid juhtelemente, saate selleks otstarbeks pesastada teisi OU tasemeid, näiteks ML töökoormuse OU, andmetöökoormuse OU jne.
Soovitame töökoormuste OU all kasutada järgmisi kontosid:
- Meeskonnatasemel ML-i arendaja-, test- ja tootekontod – Seadistage see oma töökoormuse isolatsiooninõuete alusel
- Data Lake'i kontod – Kontod sektsioonideks teie andmedomeeni järgi
- Keskne andmehalduskonto – Tsentraliseerige oma andmetele juurdepääsu eeskirjad
- Keskse funktsioonide poe konto - Tsentraliseerige funktsioonid meeskondade vahel jagamiseks
Deployments OU
Selle OU kontosid haldavad töökoormuse ja jälgitavuse juurutamiseks organisatsiooni platvormimeeskonna administraatorid.
Soovitame juurutamise OU all kasutada järgmisi kontosid, kuna ML platvormi meeskond saab juurutuste haldamiseks ja haldamiseks seadistada sellel OU tasemel erinevaid juhtelementide komplekte.
- ML-i jagatud teenuste kontod testimiseks ja tootmiseks – Hostib platvormi jagatud teenuseid CI/CD ja mudeliregistrit
- ML-i jälgitavus arvestab testi ja prod - Hoidab vajaduse korral CloudWatchi logisid, CloudTraili logisid ja muid logisid
Järgmisena käsitleme lühidalt organisatsiooni juhtelemente, mida tuleb infrastruktuuriressursside jälgimiseks liikmekontodele manustada.
AWS-i keskkonna juhtelemendid
Juhtelement on kõrgetasemeline reegel, mis tagab teie üldise AWS-i keskkonna pideva juhtimise. Seda väljendatakse lihtsas keeles. Selles raamistikus kasutame AWS-i juhtimistorni, et rakendada järgmisi juhtelemente, mis aitavad teil hallata oma ressursse ja jälgida vastavust AWS-i kontode rühmades.
- Ennetavad kontrollid – Ennetav kontroll tagab, et teie kontod säilitavad vastavuse, kuna see ei luba toiminguid, mis viivad eeskirjade rikkumiseni ja mida rakendatakse teenusekontrolli poliitika (SCP) abil. Näiteks saate määrata ennetava juhtelemendi, mis tagab, et CloudTraili ei kustutata ega peatata AWS-i kontodel või piirkondades.
- Detektiivkontrollid – Detektiivkontroll tuvastab teie kontode ressursside mittevastavuse (nt eeskirjade rikkumised), annab juhtpaneeli kaudu hoiatusi ja rakendatakse AWS-i konfiguratsioon reeglid. Näiteks saate luua detektiivijuhtelemendi, mis tuvastab, kas avalik lugemisjuurdepääs on lubatud Amazoni lihtne salvestusteenus (Amazon S3) ämbrid logiarhiivi jagatud kontol.
- Ennetavad kontrollid – Proaktiivne juhtseade kontrollib teie ressursse enne nende loomist ja veendub, et ressursid vastavad selle juhtelemendiga ja neid rakendatakse kasutades AWS CloudFormation konksud. Nõuetele mittevastavaid ressursse ei varuta. Näiteks saate määrata ennetava juhtelemendi, mis kontrollib, kas SageMakeri sülearvuti eksemplari jaoks pole otsene Interneti-juurdepääs lubatud.
Interaktsioonid ML platvormi teenuste, ML kasutusjuhtude ja ML operatsioonide vahel
Erinevad isikud, nagu andmeteaduse juht (juhtandmeteadlane), andmeteadlane ja ML-insener, juhivad mooduleid 2–6, nagu on näidatud järgmisel diagrammil ML-platvormi teenuste erinevate etappide, ML-i kasutusjuhtumite arendamise ja ML-toimingute jaoks. koos andmejärve vundamentidega ja keskse funktsioonipoega.
Järgmises tabelis on kokkuvõte erinevate isikute operatsioonivoo tegevused ja seadistusvoo sammud. Kui isik käivitab operatsioonivoo osana ML-tegevuse, käitatakse teenused nii, nagu on mainitud seadistusvoo etappides.
Inimene | Ops Flow tegevus – number | Ops Flow tegevus – kirjeldus | Seadistusvoo samm – number | Seadistusvoo samm – kirjeldus |
Andmeteaduse või ML-i meeskonna juht |
1 |
Kasutab ML-platvormi teenuste kontol teenusekataloogi ja juurutab järgmise:
|
1- |
|
1-B |
|
|||
Andmete teadlane |
2 |
Viib läbi ja jälgib ML-katseid SageMakeri sülearvutites |
2- |
|
3 |
Automatiseerib edukad ML-katsed SageMakeri projektide ja torujuhtmetega |
3- |
|
|
3-B |
Pärast SageMakeri torujuhtmete käitamist salvestab mudeli kohalikku (dev) mudeliregistrisse | |||
Juhtiv andmeteadlane või ML-i meeskonna juht |
4 |
Kinnitab mudeli kohalikus (dev) mudeliregistris |
4- |
Mudeli metaandmed ja mudelipakett kirjutab kohalikust (dev) mudeliregistrist kesksesse mudeliregistrisse |
5 |
Kinnitab mudeli keskses mudeliregistris |
5- |
Käivitab juurutamise CI/CD protsessi, et luua testkeskkonnas SageMakeri lõpp-punkte | |
5-B |
Kirjutab mudeliteabe ja metaandmed ML-i haldusmoodulisse (mudelikaart, mudeli armatuurlaud) ML-platvormi teenuste kontol kohalikult (arendaja) kontolt | |||
ML insener |
6 |
Testib ja jälgib SageMakeri lõpp-punkti testkeskkonnas pärast CI/CD-d | . | |
7 |
Kinnitab SageMakeri lõpp-punktide juurutamise tootmiskeskkonnas |
7- |
Käivitab juurutamise CI/CD protsessi, et luua tootmiskeskkonnas SageMakeri lõpp-punkte | |
8 |
Testib ja jälgib SageMakeri lõpp-punkti testkeskkonnas pärast CI/CD-d | . |
Isikud ja interaktsioonid ML platvormi erinevate moodulitega
Iga moodul on mõeldud konkreetsetele sihtrühmadele, kes kasutavad moodulit kõige sagedamini, andes neile esmase juurdepääsu. Seejärel lubatakse sekundaarne juurdepääs teistele osakondadele, mis nõuavad moodulite aeg-ajalt kasutamist. Moodulid on funktsionaalsuse optimeerimiseks kohandatud konkreetsete töörollide või isikute vajadustega.
Arutame järgmisi meeskondi:
- Keskne pilvetehnoloogia – See meeskond töötab ettevõtte pilvetasandil kõigis töökoormustes tavaliste pilvetaristu teenuste seadistamiseks, nagu ettevõtte tasemel võrgunduse, identiteedi, lubade ja kontohalduse seadistamine.
- Andmeplatvormi projekteerimine – See meeskond haldab ettevõtte andmejärvi, andmete kogumist, andmete kureerimist ja andmete haldamist
- ML platvormi projekteerimine - See meeskond tegutseb ML-i platvormi tasemel kõigis LOB-ides, et pakkuda jagatud ML-i infrastruktuuri teenuseid, nagu ML-i infrastruktuuri pakkumine, katsete jälgimine, mudeli haldamine, juurutamine ja jälgitavus
Järgmises tabelis kirjeldatakse, millistel osakondadel on iga mooduli jaoks esmane ja sekundaarne juurdepääs vastavalt mooduli sihtisikutele.
Mooduli number | Moodulid | Esmane juurdepääs | Teisene juurdepääs | Sihtisikud | Kontode arv |
1 |
Mitme kontoga sihtasutused | Keskne pilvetehnoloogia | Üksikud LOB-id |
|
Vähe |
2 |
Data järve vundamendid | Keskpilve või andmeplatvormi projekteerimine | Üksikud LOB-id |
|
mitmekordne |
3 |
ML platvormi teenused | Keskpilve või ML-platvormi projekteerimine | Üksikud LOB-id |
|
Üks |
4 |
ML kasutusjuhtude arendus | Üksikud LOB-id | Keskpilve või ML-platvormi projekteerimine |
|
mitmekordne |
5 |
ML operatsioonid | Keskpilv või ML-insener | Üksikud LOB-id |
|
mitmekordne |
6 |
Tsentraliseeritud funktsioonide pood | Keskpilv või andmetehnoloogia | Üksikud LOB-id |
|
Üks |
7 |
Logimine ja jälgitavus | Keskne pilvetehnoloogia | Üksikud LOB-id |
|
Üks |
8 |
Kulud ja aruandlus | Üksikud LOB-id | Keskplatvormi projekteerimine |
|
Üks |
Järeldus
Selles postituses tutvustasime ML-i elutsükli mastaabis juhtimise raamistikku, mis aitab teil rakendada hästi läbimõeldud ML-töökoormust, mis hõlmab turvalisuse ja halduse juhtelemente. Arutasime, kuidas see raamistik kasutab ML-platvormi loomiseks terviklikku lähenemisviisi, võttes arvesse andmete juhtimist, mudeli juhtimist ja ettevõtte taseme kontrolle. Soovitame teil katsetada selles postituses tutvustatud raamistikku ja kontseptsioone ning jagada oma tagasisidet.
Autoritest
Ram Vital on AWS-i peamine ML-lahenduste arhitekt. Tal on üle 3 aastakümne pikkune kogemus hajutatud, hübriid- ja pilverakenduste kujundamisel ja ehitamisel. Ta on kirglik turvaliste, skaleeritavate, usaldusväärsete tehisintellekti/ML-i ja suurandmete lahenduste loomise vastu, et aidata ettevõtte klientidel pilveteenuste kasutuselevõtul ja optimeerimisel oma äritulemusi parandada. Vabal ajal sõidab ta mootorrattaga ja kõnnib oma kolmeaastase lamba-doodle'iga!
Sovik Kumar Nath on AWS-iga AI/ML lahenduste arhitekt. Tal on laialdased kogemused täielike masinõppe- ja ärianalüütikalahenduste kavandamisel rahanduse, operatsioonide, turunduse, tervishoiu, tarneahela juhtimise ja asjade Interneti vallas. Sovik on avaldanud artikleid ja omab patenti ML-mudelite monitooringus. Tal on topeltmagistri kraad Lõuna-Florida ülikoolist, Fribourgi ülikoolist Šveitsis ja bakalaureusekraad India Tehnoloogiainstituudist Kharagpuris. Väljaspool tööd naudib Sovik reisimist, praamisõitu ja filmide vaatamist.
Maira Ladeira Tanke on AWSi vanemandmete spetsialist. Tehnilise juhina aitab ta klientidel kiirendada oma äriväärtuse saavutamist areneva tehnoloogia ja uuenduslike lahenduste kaudu. Maira on AWS-is töötanud alates 2020. aasta jaanuarist. Enne seda töötas ta andmeteadlasena mitmes tööstusharus, keskendudes andmetest ärilise väärtuse saavutamisele. Vabal ajal meeldib Mairale reisida ja perega soojas kohas aega veeta.
Ryan Lempka on Amazon Web Servicesi vanemlahenduste arhitekt, kus ta aitab oma klientidel töötada ärieesmärkidest tagasi, et arendada AWS-is lahendusi. Tal on sügav kogemus äristrateegia, IT-süsteemide haldamise ja andmeteaduse vallas. Ryan on pühendunud elukestvale õppijale ja talle meeldib iga päev väljakutseid esitada, et õppida midagi uut.
Sriharsh Adari on Amazon Web Servicesi (AWS) vanemlahenduste arhitekt, kus ta aitab klientidel töötada äritulemustest tagasi, et arendada AWS-is uuenduslikke lahendusi. Aastate jooksul on ta aidanud mitmeid kliente andmeplatvormide ümberkujundamisel tööstuse vertikaalsetes valdkondades. Tema põhiteadmiste hulka kuuluvad tehnoloogiastrateegia, andmeanalüüs ja andmeteadus. Vabal ajal tegeleb ta spordiga, vaatab suure hooga telesaateid ja mängib Tablat.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/governing-the-ml-lifecycle-at-scale-part-1-a-framework-for-architecting-ml-workloads-using-amazon-sagemaker/
- :on
- :on
- :mitte
- : kus
- $ UP
- 1
- 10
- 100
- 12
- 12 kuud
- 2020
- 28
- 7
- 8
- 971
- a
- MEIST
- kiirendama
- juurdepääs
- juurdepääsetav
- Vastavalt
- konto
- Kontod
- saavutus
- saavutamisel
- üle
- meetmete
- tegevus
- Ad
- kohandama
- kohandamine
- lisamine
- Täiendavad lisad
- aadress
- aadressid
- adresseerimine
- admin
- administraatorid
- Vastuvõtmine
- Vastuvõtmine
- pärast
- AI
- AI mudelid
- AI / ML
- Märguanded
- Materjal: BPA ja flataatide vaba plastik
- lubatud
- Lubades
- võimaldab
- mööda
- juba
- Ka
- Kuigi
- Amazon
- Amazon SageMaker
- Amazon Web Services
- Amazon Web Services (AWS)
- an
- analüüs
- analytics
- ja
- infrastruktuuri
- mistahes
- rakendused
- lähenemine
- asjakohane
- heaks
- arhitektuur
- Arhiiv
- OLEME
- PIIRKOND
- kaubad
- AS
- vara
- seotud
- eeldab
- At
- Autentimine
- luba
- automatiseerima
- Automatiseeritud
- Automaatika
- saadaval
- AWS
- Saldo
- põhineb
- Baseline
- BE
- sest
- muutub
- olnud
- enne
- on
- kasulik
- Kasu
- BEST
- parimaid tavasid
- vahel
- erapoolikus
- Suur
- Big andmed
- Murdma
- lühidalt
- ehitama
- Ehitus
- Ehitab
- äri
- Äri strateegia
- kuid
- by
- CAN
- kandidaat
- võimeid
- kaart
- Kaardid
- juhul
- juhtudel
- kataloog
- kategooriad
- näeb ette
- Põhjus
- keskus
- kesk-
- Tsentraliseerimine
- tsentraliseeritud
- kett
- väljakutseid
- raske
- Kontroll
- keemia
- lähedalt
- Cloud
- pilve adopteerimine
- pilve infrastruktuur
- kood
- koostöö
- kogumine
- kollektiivselt
- ühine
- Ettevõtted
- Vastavus
- Nõuetele vastav
- komponendid
- koosneb
- mõiste
- mõisted
- kaaluda
- arvestades
- arvab
- tarbima
- Tarbijad
- Konteiner
- kontrollida
- Juhtimistorn
- kontrollitud
- kontrolli
- koordineeritud
- tuum
- Maksma
- kulud
- kaetud
- looma
- loodud
- karjäär
- Kliendid
- kohandada
- kohandatud
- armatuurlaud
- armatuurlauad
- andmed
- juurdepääs andmetele
- Andmete analüüs
- andmejärv
- Andmeplatvorm
- andmekaitse
- andmeteadus
- andmeteadlane
- andmekogumid
- päev
- aastakümnete
- pühendunud
- sügav
- Kraad
- osakonnad
- juurutada
- lähetatud
- juurutamine
- kasutuselevõtu
- kasutuselevõtt
- juurutab
- Disain
- kavandatud
- projekteerimine
- detailid
- dev
- arendama
- arenenud
- & Tarkvaraarendus
- arenguid
- erinev
- mõõdud
- otsene
- arutama
- arutatud
- eristatav
- jagatud
- sukelduma
- domeen
- kahekordistada
- alla
- iga
- jõupingutusi
- Embed
- varjatud
- kinnistamine
- smirgel
- Arenev tehnoloogia
- võimaldama
- lubatud
- võimaldab
- võimaldades
- julgustama
- Lõpuks-lõpuni
- Lõpp-punkt
- insener
- Inseneriteadus
- Inseneride
- suurendama
- tagama
- tagab
- tagades
- ettevõte
- ettevõtte tasandil
- ettevõtete
- keskkond
- keskkondades
- oluline
- hindama
- sündmused
- Iga
- iga päev
- näide
- kogemus
- eksperiment
- katseid
- teadmised
- väljendatud
- laiendades
- ulatuslik
- Laialdased kogemused
- silmitsi seisnud
- hõlbustada
- pere
- tunnusjoon
- FUNKTSIOONID
- tagasiside
- vähe
- Joonis
- filtreerida
- rahastama
- finants-
- finantsteenused
- esimene
- Paindlikkus
- Florida
- voog
- keskendumine
- Järel
- eest
- vorm
- moodustamine
- Sihtasutus
- Sihtasutused
- neli
- Raamistik
- tasuta
- Alates
- funktsioon
- funktsionaalne
- funktsionaalsused
- funktsionaalsus
- funktsioonid
- edasi
- Pealegi
- kasu
- tekitama
- teeniva
- generatiivne
- Generatiivne AI
- annab
- Globaalne
- valitsemistava
- juhtimismudel
- juhtimismoodul
- juhitakse
- valitsev
- andmine
- Grupi omad
- juhised
- Olema
- võttes
- he
- juhataja
- tervishoid
- kuulama
- aitama
- aitas
- aitab
- siin
- Suur
- kõrgetasemeline
- tema
- omab
- terviklikku
- Konksud
- hosts
- Kuidas
- Kuidas
- aga
- HTML
- http
- HTTPS
- Keskus
- hübriid
- identifitseerimiseks
- Identity
- if
- rakendada
- täitmine
- rakendatud
- rakendamisel
- parandama
- Paranemist
- in
- sisaldama
- hõlmab
- Kaasa arvatud
- kasvav
- iseseisvalt
- india
- tööstusharudes
- tööstus
- info
- Infrastruktuur
- esialgne
- Algatab
- uuenduslik
- uuenduslik
- Näiteks
- Instituut
- integreeritud
- suhelda
- interaktsioonid
- huvitatud
- Internet
- internetiühendus
- sisse
- sisse
- investeering
- asjade Interneti
- isolatsioon
- IT
- Jaanuar
- töö
- teekond
- jpg
- Võti
- teadmised
- kumar
- puudus
- järv
- järved
- maandumine
- keel
- suur
- pärast
- kiht
- viima
- Õppida
- õppimine
- Tase
- taset
- eluring
- nagu
- sugupuu
- liinid
- kohalik
- logi
- metsaraie
- otsin
- masin
- masinõpe
- tehtud
- säilitada
- TEEB
- juhtima
- juhitud
- juhtimine
- haldab
- juhtiv
- palju
- kaardid
- Turundus
- küps
- tähtaeg
- mai..
- liige
- mainitud
- silma
- Metaandmed
- leevendav
- riskide maandamine
- ML
- MLOps
- mudel
- mudelid
- muutma
- modulaarne
- moodulid
- Moodulid
- Jälgida
- järelevalve
- monitorid
- kuu
- rohkem
- kõige
- mootorratas
- Filmid
- mitmekordne
- emakeelena
- Vajadus
- vajadustele
- Pesa
- võrk
- võrgustike loomine
- võrgustikud
- Uus
- Uued funktsioonid
- järgmine
- märkmik
- number
- eesmärgid
- juhuslik
- of
- Pakkumised
- Office
- sageli
- Vana
- on
- kunagi
- ONE
- jätkuv
- töötama
- tegutses
- tegutseb
- tegutsevad
- Operations
- optimeerimine
- optimeerima
- or
- organisatsioon
- organisatsioonid
- korraldamine
- Muu
- meie
- välja
- tulemusi
- väljaspool
- üle
- üldine
- ülevaade
- pakend
- osa
- eriline
- kirglik
- patent
- täitma
- jõudlus
- Õigused
- torujuhe
- Koht
- tavaline
- inimesele
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängimine
- Poliitika
- poliitika
- portfell
- post
- tava
- tavad
- esitada
- ennetada
- esmane
- Peamine
- Eelnev
- privaatsus
- era-
- erasektor
- Proaktiivne
- probleeme
- protsess
- Protsessid
- tootja
- Tootjad
- Toode
- Produktsioon
- Toodet
- projektid
- edendamine
- tõend
- tõendi mõiste
- kaitsta
- anda
- annab
- pakkudes
- avalik
- avaldatud
- eesmärk
- kvaliteet
- kiiresti
- kiire
- Lugenud
- hiljuti
- tunnistama
- soovitama
- Soovitus
- vähendama
- viide
- piirkondades
- registreerima
- registreeritud
- registrite
- registri
- reguleeritud
- reguleeritud tööstusharud
- usaldusväärne
- eemaldades
- Aruanded
- nõudma
- nõutav
- Nõuded
- ressurss
- Vahendid
- vastates
- vastutav
- taaskasutada
- seljas
- Oht
- riskide
- Roll
- rollid
- juur
- Eeskiri
- eeskirjade
- jooks
- jooksmine
- Ryan
- ohverdama
- salveitegija
- SageMakeri torujuhtmed
- sama
- skaalautuvia
- Skaala
- ketendamine
- teadus
- teadlane
- teadlased
- Otsing
- kesk-
- Osa
- sektor
- kindlustama
- turvalisus
- Turvalisus sündmused
- Iseteenindus
- vanem
- Seeria
- teenus
- Teenused
- komplekt
- Komplektid
- kehtestamine
- seade
- Jaga
- jagatud
- Aktsiad
- jagamine
- ta
- Lühike
- peaks
- näidatud
- Näitused
- lihtne
- alates
- ühekordne
- SUURUS
- väike
- So
- lahendus
- Lahendused
- LAHENDAGE
- mõned
- midagi
- Lõuna
- Lõuna-Florida
- spetsialist
- spetsialiseeritud
- konkreetse
- Kulutused
- sport
- etappidel
- huvirühmad
- huvirühmad
- standardite
- algus
- riik
- Samm
- Sammud
- Veel
- peatatud
- ladustamine
- salvestada
- kauplustes
- strateegiad
- Strateegia
- tugev
- struktuur
- struktuuride
- stuudio
- edukas
- selline
- Kostüüm
- KOKKUVÕTE
- varustama
- tarneahelas
- tarneahela juhtimine
- toetama
- Toetamine
- kindel
- Šveits
- süsteemid
- tabel
- kohandatud
- võtab
- võtmine
- sihtmärk
- meeskond
- meeskonnad
- Tehniline
- Tehnoloogia
- Tehnoloogiastrateegia
- šabloon
- malle
- test
- Testimine
- et
- .
- Riik
- oma
- Neile
- SIIS
- Need
- nad
- asjad
- see
- need
- Läbi
- läbi kogu
- aeg
- et
- töövahendid
- suunas
- Torn
- jälgida
- Jälgimine
- traditsiooniline
- Rong
- muundumised
- transiit
- Reisimine
- Pöörake
- tv
- liigid
- all
- mõistma
- ebaõiglane
- üksused
- Ülikool
- us
- Kasutus
- kasutama
- kasutage juhtumit
- Kasutatud
- Kasutaja
- Kasutajad
- kasutusalad
- kasutamine
- ära kasutama
- kinnitamine
- väärtus
- sort
- eri
- vertikaalid
- kaudu
- Rikkumised
- nähtavus
- visualiseerimine
- visualiseeri
- kõndima
- tahan
- soe
- vaadates
- we
- web
- veebiteenused
- Hästi
- millal
- kas
- mis
- kuigi
- will
- koos
- jooksul
- ilma
- Töö
- töötas
- Töövoogud
- töö
- aastat
- sa
- Sinu
- sephyrnet