Governing The ML Lifecycle At Scale, Part 1: A Framework For Architecting ML Workloads Using Amazon SageMaker

Újra kiadta Platón

Követő: 0

Bármely méretű és iparágú vásárló újít meg az AWS-ben a gépi tanulás (ML) beépítésével termékeikbe és szolgáltatásaikba. A generatív mesterséges intelligencia modellek legújabb fejlesztései tovább növelték az ML alkalmazásának szükségességét az iparágakban. A biztonsági, adatvédelmi és irányítási ellenőrzések megvalósítása azonban továbbra is kulcsfontosságú kihívás, amellyel az ügyfeleknek szembe kell nézniük az ML-munkaterhelések nagyarányú megvalósítása során. E kihívások kezelése megteremti a keretet és az alapokat a kockázatcsökkentéshez és az ML-vezérelt termékek felelős használatához. Bár a generatív mesterséges intelligencia további ellenőrzéseket igényelhet, mint például a toxicitás eltávolítása, valamint a jailbreak és a hallucinációk megelőzése, a biztonság és az irányítás szempontjából ugyanazok az alapvető összetevők, mint a hagyományos ML.

Ügyfeleinktől azt halljuk, hogy speciális tudást és akár 12 hónapos befektetést igényelnek a személyre szabott termékeik kiépítéséhez Amazon SageMaker ML platform megvalósítása méretezhető, megbízható, biztonságos és szabályozott ML-környezetek biztosítására az üzletágaik (LOB) vagy ML csapataik számára. Ha hiányzik a keretrendszer az ML életciklus nagyarányú szabályozásához, akkor olyan kihívásokba ütközhet, mint a csapatszintű erőforrások elkülönítése, a kísérleti erőforrások méretezése, az ML-munkafolyamatok operacionalizálása, a modellirányítás skálázása, valamint az ML-munkaterhelések biztonságának és megfelelőségének kezelése.

Az ML életciklusának irányítása skálán egy olyan keretrendszer, amely segít egy ML platform felépítésében beágyazott biztonsági és irányítási vezérlőkkel, amelyek az iparág legjobb gyakorlatain és vállalati szabványokon alapulnak. Ez a keretrendszer úgy kezeli a kihívásokat, hogy előíró útmutatást ad egy moduláris keretrendszeren keresztül, amely kiterjeszti a AWS Control Tower többfiókos AWS környezet és a bejegyzésben tárgyalt megközelítés Biztonságos, jól szabályozott gépi tanulási környezetek beállítása az AWS-en.

Előírásos útmutatást ad a következő ML platform funkciókhoz:

Többfiókos, biztonsági és hálózati alapok – Ez a funkció az AWS Control Tower és jól felépített elvek többfiókos környezeti, biztonsági és hálózati szolgáltatások létrehozásához és működtetéséhez.
Adat- és irányítási alapok – Ez a funkció a adatháló architektúra az adattó, a központi szolgáltatástároló és az adatkezelési alapok létrehozásához és működtetéséhez, hogy lehetővé tegye a finomszemcsés adathozzáférést.
ML platform megosztott és irányítási szolgáltatások – Ez a funkció lehetővé teszi olyan általános szolgáltatások beállítását és működtetését, mint a CI/CD, AWS szolgáltatáskatalógus a kiépítési környezetekhez, valamint egy központi modellnyilvántartás a modell promóciójához és a származáshoz.
ML csapatkörnyezetek – Ez a funkció lehetővé teszi az ML csapatok számára a modellfejlesztéshez, teszteléshez és a biztonsági és irányítási ellenőrzések beágyazásához szükséges használati eseteik telepítéséhez szükséges környezetek beállítását és működését.
ML platform megfigyelhetőség – Ez a funkció segít a hibaelhárításban és az ML-modellek problémáinak kiváltó okainak azonosításában a naplók központosítása és a naplóelemzés vizualizálásához szükséges eszközök biztosítása révén. Útmutatást ad továbbá az ML használati esetekre vonatkozó költség- és használati jelentések készítéséhez.

Bár ez a keretrendszer minden ügyfél számára előnyökkel jár, a legelőnyösebb a nagy, érett, szabályozott vagy globális vállalati ügyfelek számára, akik ellenőrzött, megfelelő és koordinált megközelítésben szeretnék skálázni ML stratégiájukat a szervezeten belül. Segít az ML elfogadásában, miközben csökkenti a kockázatokat. Ez a keretrendszer a következő ügyfelek számára hasznos:

Nagyvállalati ügyfelek, akiknek sok LOB-juk vagy részlegük van az ML használatában. Ez a keretrendszer lehetővé teszi a különböző csapatok számára, hogy önállóan építsenek és telepítsenek ML modelleket, miközben központi irányítást biztosítanak.
Vállalati ügyfelek közepes vagy magas lejárattal ML-ben. Már telepítettek néhány kezdeti ML-modellt, és igyekeznek skálázni az ML erőfeszítéseiket. Ez a keretrendszer segíthet felgyorsítani az ML bevezetését a szervezetben. Ezek a vállalatok azt is felismerik, hogy az irányításra van szükség az olyan dolgok kezeléséhez, mint a hozzáférés-szabályozás, az adathasználat, a modell teljesítménye és a tisztességtelen elfogultság.
A szabályozott iparágakban működő vállalatok, például a pénzügyi szolgáltatások, az egészségügy, a kémia és a magánszektor. Ezeknek a vállalatoknak erős irányításra és hallhatóságra van szükségük az üzleti folyamataikban használt ML modellekhez. Ennek a keretrendszernek az elfogadása elősegítheti a megfelelést, ugyanakkor lehetővé teszi a helyi modellfejlesztést.
Globális szervezetek, amelyeknek egyensúlyba kell hozniuk a központosított és a helyi ellenőrzést. Ennek a keretrendszernek az egyesített megközelítése lehetővé teszi a központi platform mérnöki csapata számára, hogy magas szintű irányelveket és szabványokat állítson fel, ugyanakkor rugalmasságot biztosít a LOB-csapatok számára a helyi igények alapján történő alkalmazkodáshoz.

A sorozat első részében az ML platform beállításának referenciaarchitektúráját járjuk végig. Egy későbbi bejegyzésben előírásszerű útmutatást adunk a referenciaarchitektúra különböző moduljainak a szervezetében történő megvalósításához.

Az ML platform képességei négy kategóriába vannak csoportosítva, amint az a következő ábrán látható. Ezek a képességek képezik a referencia-architektúra alapját, amelyet a bejegyzés későbbi részében tárgyalunk:

Építsen ML alapokat
ML műveletek léptékezése
Megfigyelhető ML
Biztonságos ML

Megoldás áttekintése

Az ML életciklusát szabályozó keretrendszer lehetővé teszi a szervezetek számára, hogy a biztonsági és irányítási ellenőrzéseket az ML életciklusa során beépítsék, ami viszont segít a szervezeteknek csökkenteni a kockázatokat, és felgyorsítani az ML termékeikbe és szolgáltatásaikba való beillesztését. A keretrendszer segít optimalizálni a biztonságos, méretezhető és megbízható ML-környezetek beállítását és irányítását, amelyek méretezhetőek egyre több modell és projekt támogatására. A keretrendszer a következő funkciókat teszi lehetővé:

Fiók- és infrastruktúra-kiépítés a szervezeti szabályzatnak megfelelő infrastrukturális erőforrásokkal
Adattudományi környezetek és végpontok közötti ML műveletek (MLOps) sablonok önkiszolgáló telepítése ML használati esetekhez
Az erőforrások LOB-szintű vagy csapatszintű elkülönítése a biztonság és az adatvédelmi megfelelés érdekében
Szabályozott hozzáférés a termelési szintű adatokhoz a kísérletezéshez és a gyártásra kész munkafolyamatokhoz
Kódtárolók, kódfolyamatok, telepített modellek és adatszolgáltatások kezelése és irányítása
Rendszerleíró- és szolgáltatástároló modell (helyi és központi összetevők) az irányítás javításához
Biztonsági és irányítási ellenőrzések a teljes modellfejlesztési és -telepítési folyamathoz

Ebben a részben áttekintést adunk azokról az előíró útmutatásokról, amelyek segítenek az ML platform AWS-re való felépítésében, beágyazott biztonsági és irányítási vezérlőkkel.

Az ML platformhoz tartozó funkcionális architektúra a következő ábrán látható. Az architektúra leképezi az ML platform különböző képességeit AWS-fiókokhoz.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A különböző képességekkel rendelkező funkcionális architektúra számos AWS-szolgáltatás segítségével valósul meg, beleértve a AWS szervezetek, SageMaker, AWS DevOps szolgáltatások és egy adattó. A különböző AWS-szolgáltatásokkal rendelkező ML platform referencia-architektúrája a következő ábrán látható.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Ez a keretrendszer több személyt és szolgáltatást vesz figyelembe az ML életciklusának szabályozásához. A következő lépéseket javasoljuk csapatai és szolgáltatásai szervezéséhez:

Az AWS Control Tower és az automatizálási eszközök segítségével a felhő rendszergazdája beállítja a többfiókos alapokat, például a szervezeteket és a AWS IAM Identity Center (az AWS Single Sign-On utódja) és a biztonsági és irányítási szolgáltatások, mint pl AWS kulcskezelési szolgáltatás (AWS KMS) és szolgáltatáskatalógus. Ezenkívül az adminisztrátor számos szervezeti egységet (OU) és kezdeti fiókot állít be az ML és az elemzési munkafolyamatok támogatására.
A Data Lake adminisztrátorai beállítják az adattót és az adatkatalógust, és beállítják a központi szolgáltatástárolót az ML platform adminisztrátorával együttműködve.
Az ML platform adminisztrátora ML megosztott szolgáltatásokat biztosít, mint pl AWS CodeCommit, AWS CodePipeline, Amazon Elastic Container Registry (Amazon ECR), egy központi modellnyilvántartás, SageMaker modellkártyák, SageMaker Model Dashboardés szolgáltatáskatalógus termékek ML csapatok számára.
Az ML csapat vezetője az IAM Identity Centeren keresztül szövetkezik, szolgáltatáskatalógus termékeket használ, és erőforrásokat biztosít az ML csapat fejlesztői környezetében.
A különböző üzleti egységek ML-csapatainak adattudósai egyesülnek csapatuk fejlesztői környezetében, hogy megépítsék a modellfolyamatot.
Az adatkutatók a központi szolgáltatásbolt-katalógusban keresnek és vonnak be funkciókat, kísérletekkel modelleket készítenek, és kiválasztják a legjobb modellt a promócióhoz.
Az adattudósok új funkciókat hoznak létre és osztanak meg a központi szolgáltatástároló katalógusban újrafelhasználás céljából.
Egy ML-mérnök telepíti a modellfolyamatot az ML-csoport tesztkörnyezetébe egy megosztott szolgáltatások CI/CD-folyamatával.
Az érdekelt felek érvényesítése után az ML-modellt a rendszer a csapat éles környezetébe telepíti.
A biztonsági és irányítási vezérlők ennek az architektúrának minden rétegébe be vannak ágyazva olyan szolgáltatások használatával, mint pl AWS biztonsági központ, Amazon Guard Duty, Amazon Macie, És így tovább.
A biztonsági vezérlők központilag kezelhetők a biztonsági eszközfiókból a Security Hub segítségével.
Az ML platform irányítási képességei, például a SageMaker Model Cards és a SageMaker Model Dashboard központilag kezelhetők az irányítási szolgáltatások fiókjából.
amazonfelhőóra és a AWS CloudTrail az egyes tagi fiókokból származó naplók központilag elérhetővé válnak egy megfigyelési fiókból, az AWS natív szolgáltatásait használva.

Ezután mélyen beleássuk a keretrendszer referenciaarchitektúrájának moduljait.

Referencia architektúra modulok

A referenciaarchitektúra nyolc modulból áll, amelyek mindegyike egy adott problémakör megoldására szolgál. Ezek a modulok együttesen a különböző dimenziók, például az infrastruktúra, az adatok, a modell és a költségek irányítását célozzák. Mindegyik modul különálló funkciókészletet kínál, és együttműködik más modulokkal, hogy integrált végpontok közötti ML platformot biztosítson beágyazott biztonsági és irányítási vezérlőkkel. Ebben a részben bemutatjuk az egyes modulok képességeinek rövid összefoglalását.

Többszámlás alapítványok

Ez a modul segít a felhőrendszergazdáknak egy AWS Control Tower leszállózóna alapozó keretként. Ez magában foglalja a többfiókos struktúra felépítését, az IAM Identity Centeren keresztüli hitelesítést és engedélyezést, a hálózati hub-and-spoke tervezést, a központosított naplózási szolgáltatásokat és az új AWS-tagfiókokat szabványosított biztonsági és irányítási alapokkal.

Ezen túlmenően, ez a modul útmutatást ad a bevált gyakorlatokhoz a szervezeti egységekhez és a fiókstruktúrákhoz, amelyek alkalmasak az ML és az elemzési munkafolyamatok támogatására. A felhőadminisztrátorok megértik a szükséges fiókok és szervezeti egységek célját, azok üzembe helyezésének módját, valamint a legfontosabb biztonsági és megfelelőségi szolgáltatásokat, amelyeket az ML és analitikai munkaterhelésük központi irányításához kell használniuk.

Az új számlák értékesítésének keretrendszere szintén lefedett, amely automatizálást használ az új számlák alaphelyzetbe állításához, amikor azok kiépítésre kerülnek. Az automatizált fiók-kiépítési folyamat beállításával a felhőrendszergazdák biztosíthatják az ML és az elemzőcsapatok számára a munkájuk gyorsabb elvégzéséhez szükséges fiókokat anélkül, hogy feláldoznák az irányítás erős alapot.

Data tó alapjai

Ez a modul segít a Data Lake adminisztrátorainak beállítani egy Data Lake-et az adatok feldolgozásához, az adatkészletek gondozásához és a AWS-tó formáció irányítási modell a fiókok és felhasználók közötti részletes adatokhoz való hozzáférés kezeléséhez egy központi adatkatalógus, adathozzáférési szabályzatok és címkealapú hozzáférés-szabályozás segítségével. Kezdheti kicsiben egy fiókkal az adatplatform alapjait a koncepció bizonyításához vagy néhány kisebb munkaterheléshez. Közepes és nagy léptékű termelési munkaterhelés megvalósításához több fiókra vonatkozó stratégia elfogadását javasoljuk. Ilyen környezetben a LOB-ok különböző AWS-fiókokat használó adatelőállítók és adatfogyasztók szerepét tölthetik be, és a Data Lake irányítása egy központi megosztott AWS-fiókból működik. Az adatelőállító gyűjti, dolgozza fel és tárolja a saját adattartományából származó adatokat, ezen túlmenően adatvagyonának ellenőrzését és minőségének biztosítását. Az adatfogyasztók az adatelőállítótól származó adatokat fogyasztják el, miután a központosított katalógus megosztja azokat a Lake Formation segítségével. A központosított katalógus tárolja és kezeli az adattermelői fiókok megosztott adatkatalógusát.

ML platform szolgáltatások

Ez a modul segít az ML platform mérnöki csapatának olyan megosztott szolgáltatásokat beállítani, amelyeket az adattudományi csapatok használnak csapatfiókjaikon. A szolgáltatások tartalmazzák a szolgáltatás katalógus portfólió termékeit SageMaker domain bevetés, SageMaker domain felhasználói profil telepítés, adattudományi modellsablonok a modellépítéshez és -telepítéshez. Ez a modul rendelkezik a központosított modellnyilvántartással, a modellkártyákkal, a modell-irányítópulttal, valamint a modellfejlesztési és üzembe helyezési munkafolyamatok irányításához és automatizálásához használt CI/CD-folyamatokkal.

Ezenkívül ez a modul részletezi a személyalapú önkiszolgáló képességek lehetővé tételéhez szükséges vezérlők és irányítás megvalósítását, amely lehetővé teszi az adattudományi csapatok számára a szükséges felhőinfrastruktúra és ML-sablonok önálló üzembe helyezését.

ML használati esetek fejlesztése

Ez a modul segít a LOB-oknak és az adattudósoknak hozzáférni csapatuk SageMaker tartományához egy fejlesztői környezetben, és modellépítési sablont készítenek modelljeik fejlesztéséhez. Ebben a modulban az adattudósok a sablon fejlesztői fiókpéldányán dolgoznak, hogy interakcióba lépjenek a központosított Data Lake-en elérhető adatokkal, újrafelhasználhassák és megosszák egy központi szolgáltatástároló szolgáltatásait, ML-kísérleteket hozzanak létre és futtassák, ML-munkafolyamataikat összeállítsák és teszteljék, és regisztrálja modelljeit egy fejlesztői fiókmodell-nyilvántartásba a fejlesztői környezetükben.

Olyan képességek, mint a kísérletkövetés, a modellmagyarázhatósági jelentések, az adatok és a modellek torzításának figyelése, valamint a modellnyilvántartás is megvalósulnak a sablonokban, lehetővé téve a megoldások gyors adaptálását az adatkutatók által kidolgozott modellekhez.

ML műveletek

Ez a modul segít a LOB-oknak és az ML-mérnököknek a modell-telepítési sablon fejlesztői példányaiban dolgozni. A jelölt modell regisztrálása és jóváhagyása után CI/CD-folyamatokat állítanak be, és ML-munkafolyamatokat futtatnak a csapat tesztkörnyezetében, amely regisztrálja a modellt a platformon megosztott szolgáltatások fiókjában futó központi modellnyilvántartásba. Amikor egy modellt jóváhagynak a központi modellnyilvántartásban, ez elindít egy CI/CD folyamatot, amely a modellt a csoport éles környezetébe telepíti.

Központi szolgáltatástároló

Miután az első modelleket üzembe helyezték az éles környezetben, és több felhasználási eset elkezdi megosztani az azonos adatokból létrehozott funkciókat, a funkciótároló elengedhetetlenné válik a használati esetek közötti együttműködés biztosításához és a párhuzamos munka csökkentéséhez. Ez a modul segít az ML platform mérnöki csapatának egy központi szolgáltatástároló létrehozásában, amely az ML használati esetek által létrehozott ML-szolgáltatások tárolását és felügyeletét biztosítja, lehetővé téve a funkciók projektek közötti újrafelhasználását.

Naplózás és megfigyelhetőség

Ez a modul segít a LOB-oknak és az ML-gyakorlóknak abban, hogy a naplózási tevékenységek, például a CloudTrail, a CloudWatch, a VPC-folyamatnaplók és az ML-munkanaplók központosításával áttekinthessék az ML-munkaterhelések állapotát ML-környezetekben. A csapatok szűrhetik, lekérdezhetik és vizualizálhatják a naplókat elemzés céljából, ami szintén segíthet a biztonsági helyzet javításában.

Költség és jelentés

Ez a modul segít a különböző érdekelt feleknek (felhőadminisztrátor, platformadminisztrátor, felhőalapú üzleti iroda) jelentéseket és irányítópultokat készíteni, amelyek segítségével lebontják a költségeket ML-felhasználói, ML-csapat- és ML-termékszinten, valamint nyomon követhetik a felhasználást, például a felhasználók számát, példánytípusokat és végpontok.

Ügyfeleink arra kértek minket, hogy adjunk útmutatást arról, hány fiókot kell létrehozni, és hogyan kell felépíteni ezeket a fiókokat. A következő részben útmutatást adunk a fiókszerkezethez referenciaként, amelyet az igényeinek megfelelően módosíthat a vállalatirányítási követelményeknek megfelelően.

Ebben a részben a fiókszerkezet megszervezésére vonatkozó javaslatainkat tárgyaljuk. Megosztunk egy alapszintű referencia számlastruktúrát; azonban azt javasoljuk, hogy az ML- és adatadminisztrátorok szorosan működjenek együtt felhőrendszergazdájukkal, hogy testreszabják ezt a fiókstruktúrát a szervezeti vezérlőik alapján.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Javasoljuk, hogy a fiókokat szervezeti egység szerint szervezze a biztonság, az infrastruktúra, a munkaterhelés és a telepítések érdekében. Ezenkívül az egyes szervezeti egységeken belül nem termelési és éles szervezeti egységekre kell rendezni, mivel az ezek alatt telepített fiókok és munkaterhelések eltérő vezérlőkkel rendelkeznek. Ezután röviden tárgyaljuk ezeket a szervezeti egységeket.

Security OU

Az ebben a szervezeti egységben lévő fiókokat a szervezet felhőalapú rendszergazdája vagy biztonsági csapata kezeli a biztonsági események figyelése, azonosítása, védelme, észlelése és reagálása céljából.

Infrastruktúra OU

Az ebben a szervezeti egységben lévő fiókokat a szervezet felhőalapú rendszergazdája vagy hálózati csapata kezeli a vállalati szintű infrastruktúra megosztott erőforrásainak és hálózatainak kezeléséhez.

Azt javasoljuk, hogy az infrastruktúra szervezeti egysége alatt legyen a következő fiókok:

Hálózat – Központosított hálózati infrastruktúra létrehozása, mint pl AWS Transit Gateway
Közös szolgáltatások – Központosított AD-szolgáltatások és VPC-végpontok beállítása

Munkaterhelések OU

Az ebben a szervezeti egységben lévő fiókokat a szervezet platformcsapatának adminisztrátorai kezelik. Ha az egyes platformcsapatokhoz különböző vezérlőelemekre van szüksége, e célból más szervezeti egység szinteket is beágyazhat, például ML-munkaterhelések szervezeti egységeit, adatmunkaterhelési szervezeti egységeit és így tovább.

A következő fiókokat javasoljuk a munkaterhelések szervezeti egységei alatt:

Csapatszintű ML fejlesztői, teszt- és termékfiókok – Állítsa be ezt a munkaterhelés elkülönítési követelményei alapján
Data Lake fiókok – A fiókokat az adattartomány szerint particionálja
Központi adatkezelési számla – Központosítsa adathozzáférési szabályzatait
Központi szolgáltatástároló fiók – Központosítsa a funkciókat a csapatok közötti megosztáshoz

Telepítések OU

Az ebben a szervezeti egységben lévő fiókokat a szervezet platformcsapatának rendszergazdái kezelik a munkaterhelések telepítése és a megfigyelhetőség érdekében.

A következő fiókokat javasoljuk a telepítési szervezeti egység alatt, mert az ML platform csapata különböző vezérlőkészleteket állíthat be ezen az OU-szinten a telepítések kezeléséhez és irányításához:

Az ML megosztott szolgáltatások fiókjai a teszt és a prod – A platformon megosztott szolgáltatások CI/CD-t és modellnyilvántartást tárolnak
Az ML megfigyelhetőség a tesztet és a prod – Szükség szerint CloudWatch naplókat, CloudTrail naplókat és egyéb naplókat tárol

Ezután röviden megvitatjuk azokat a szervezeti vezérléseket, amelyeket figyelembe kell venni a tagfiókokba való beágyazáshoz az infrastruktúra-erőforrások figyeléséhez.

AWS környezetvezérlők

A vezérlő egy magas szintű szabály, amely folyamatos irányítást biztosít az általános AWS-környezet számára. Egyszerű nyelven van kifejezve. Ebben a keretben az AWS Control Tower segítségével hajtjuk végre a következő vezérlőket, amelyek segítenek irányítani az erőforrásokat, és nyomon követni a megfelelőséget az AWS-fiókok csoportjai között:

Megelőző ellenőrzések – A megelőző ellenőrzés biztosítja, hogy fiókjai fenntartsák a megfelelőséget, mivel nem engedélyezi az irányelvek megsértéséhez vezető műveleteket, és a szolgáltatás-felügyeleti házirend (SCP) segítségével valósul meg. Beállíthat például egy megelőző vezérlőt, amely biztosítja, hogy a CloudTrail ne kerüljön törlésre vagy leállításra az AWS-fiókokban vagy régiókban.
Detektív vezérlők – A felderítő ellenőrzés észleli a fiókokban lévő erőforrások nem megfelelőségét, például az irányelvek megsértését, figyelmeztetéseket küld az irányítópulton keresztül, és a AWS konfig szabályokat. Létrehozhat például egy detektív vezérlőt, amely észleli, hogy a nyilvános olvasási hozzáférés engedélyezve van-e Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödrök a naplóarchívum megosztott fiókjában.
Proaktív vezérlések – A proaktív vezérlő ellenőrzi az erőforrásokat, mielőtt azok kiépítésre kerülnének, és megbizonyosodik arról, hogy az erőforrások megfelelnek a vezérlőnek, és AWS felhőképződés horgok. A nem megfelelő erőforrások nem lesznek kiépítve. Például beállíthat egy proaktív vezérlőt, amely ellenőrzi, hogy a közvetlen internet-hozzáférés nem engedélyezett-e egy SageMaker notebook példányhoz.

Interakciók az ML platformszolgáltatások, az ML használati esetek és az ML műveletek között

Különböző személyek, mint például az adattudomány vezetője (vezető adattudós), adattudós és ML mérnök, a 2–6. modulokat az ML platformszolgáltatások, az ML használati esetek fejlesztése és az ML műveletek különböző szakaszaira vonatkozóan a következő diagram szerint kezelik. az adattó alapjaival és a központi funkciótárral együtt.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A következő táblázat összefoglalja a műveleti folyamat tevékenységét és a beállítási folyamat lépéseit a különböző személyek számára. Miután egy személy ML-tevékenységet kezdeményez a műveleti folyamat részeként, a szolgáltatások a beállítási folyamat lépéseiben leírtak szerint futnak.

Személy	Ops Flow tevékenység – Szám	Ops Flow tevékenység – Leírás	Beállítási folyamat lépése – Szám	Beállítási folyamat lépése – Leírás
Vezessen Data Science vagy ML csapatvezetőt	1	Használja a szolgáltatáskatalógust az ML platform szolgáltatásfiókjában, és a következőket telepíti: ML infrastruktúra SageMaker projektek SageMaker modellnyilvántartás	1-A	Beállítja a fejlesztői, tesztelési és termékkörnyezetet a LOB-okhoz A SageMaker Studio beállítása az ML platform szolgáltatásfiókjában
Vezessen Data Science vagy ML csapatvezetőt	1		1-B	Beállítja a SageMaker Studio programot a szükséges konfigurációval
Adat tudós	2	ML kísérleteket végez és követ a SageMaker notebookokban	2-A	A Lake Formation adatait használja Funkciókat ment a központi szolgáltatástárolóba
	3	Automatizálja a sikeres ML-kísérleteket SageMaker projektekkel és folyamatokkal	3-A	Elindítja a SageMaker folyamatokat (előfeldolgozás, betanítás, kiértékelés) a fejlesztői fiókban Elindítja a CI/CD összeállítási folyamatot a CodePipeline segítségével a fejlesztői fiókban
	3		3-B	A SageMaker folyamatok lefutása után elmenti a modellt a helyi (fejlesztői) modellnyilvántartásba
Vezető adattudós vagy ML-csapatvezető	4	Jóváhagyja a modellt a helyi (fejlesztői) modellnyilvántartásban	4-A	A modell metaadatok és a modellcsomag a helyi (dev) modellnyilvántartásból ír a központi modellnyilvántartásba
	5	Jóváhagyja a modellt a központi modellnyilvántartásban	5-A	Elindítja a telepítési CI/CD folyamatot SageMaker végpontok létrehozásához a tesztkörnyezetben
	5	Jóváhagyja a modellt a központi modellnyilvántartásban	5-B	Írja a modellinformációkat és a metaadatokat az ML irányítási modulba (modellkártya, modell irányítópult) az ML platformszolgáltatások fiókjában a helyi (fejlesztői) fiókból
ML mérnök	6	Teszteli és figyeli a SageMaker végpontot a tesztkörnyezetben a CI/CD után	.
	7	Jóváhagyja a SageMaker-végpontok üzembe helyezését a termékkörnyezetben	7-A	Elindítja a telepítési CI/CD folyamatot a SageMaker végpontok létrehozásához a termékkörnyezetben
	8	Teszteli és figyeli a SageMaker végpontot a tesztkörnyezetben a CI/CD után	.

Személyek és interakciók az ML platform különböző moduljaival

Mindegyik modul a modult leggyakrabban használó meghatározott részlegeken belüli meghatározott célszemélyeket szolgál ki, így számukra elsődleges hozzáférést biztosít. A másodlagos hozzáférés ezután engedélyezett más részlegek számára, amelyek megkövetelik a modulok alkalmi használatát. A modulok az egyes munkakörök vagy személyek igényeihez vannak szabva a funkcionalitás optimalizálása érdekében.

A következő csapatokról beszélünk:

Központi felhő tervezés – Ez a csapat vállalati felhő szinten működik az összes munkaterhelésen a közös felhő-infrastruktúra-szolgáltatások beállításához, például a vállalati szintű hálózatok, identitás, engedélyek és fiókkezelés beállításához.
Adatplatform tervezés – Ez a csapat kezeli a vállalati adatforrásokat, az adatgyűjtést, az adatkezelést és az adatkezelést
ML platform tervezés – Ez a csapat az ML platform szintjén működik a LOB-ok között, hogy megosztott ML infrastruktúra-szolgáltatásokat biztosítson, mint például az ML infrastruktúra kiépítése, kísérletkövetés, modellirányítás, telepítés és megfigyelhetőség.

A következő táblázat részletezi, hogy mely részlegek rendelkeznek elsődleges és másodlagos hozzáféréssel az egyes modulokhoz, a modul célszemélyei szerint.

Modul száma	Modulok	Elsődleges hozzáférés	Másodlagos hozzáférés	Célszemélyek	Számlák száma
1	Többszámlás alapítványok	Központi felhő tervezés	Egyéni LOB-ok	Cloud adminisztrátor Felhőmérnökök	Kevés
2	Data tó alapjai	Központi felhő vagy adatplatform tervezés	Egyéni LOB-ok	Data Lake admin Adatmérnökök	Többszörös
3	ML platform szolgáltatások	Központi felhő vagy ML platform tervezés	Egyéni LOB-ok	ML platform Admin ML csapatvezető ML mérnökök ML kormányzási vezető	egy
4	ML használati esetek fejlesztése	Egyéni LOB-ok	Központi felhő vagy ML platform tervezés	Adattudósok Adatmérnökök ML csapatvezető ML mérnökök	Többszörös
5	ML műveletek	Központi felhő vagy ML tervezés	Egyéni LOB-ok	ML mérnökök ML csapat vezet Adattudósok	Többszörös
6	Központi szolgáltatástároló	Központi felhő vagy adatkezelés	Egyéni LOB-ok	Adatmérnök Adattudósok	egy
7	Naplózás és megfigyelhetőség	Központi felhő tervezés	Egyéni LOB-ok	Cloud adminisztrátor Informatikai auditorok	egy
8	Költség és jelentés	Egyéni LOB-ok	Központi platform tervezés	A LOB vezetői ML menedzserek	egy

Következtetés

Ebben a bejegyzésben egy keretrendszert mutattunk be az ML-életciklus nagyarányú szabályozására, amely segít a jól megtervezett ML-munkaterhelések megvalósításában, amelyek biztonsági és irányítási ellenőrzéseket tartalmaznak. Megvitattuk, hogy ez a keretrendszer holisztikus megközelítést alkalmaz egy ML platform felépítéséhez, figyelembe véve az adatirányítást, a modellirányítást és a vállalati szintű vezérléseket. Javasoljuk, hogy kísérletezzen az ebben a bejegyzésben bemutatott keretrendszerrel és koncepciókkal, és ossza meg visszajelzését.

A szerzőkről

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Ram Vittal az AWS vezető ML megoldások építésze. Több mint 3 évtizedes tapasztalattal rendelkezik elosztott, hibrid és felhőalkalmazások tervezésében és építésében. Szenvedélyesen törekszik a biztonságos, méretezhető, megbízható AI/ML és big data megoldások kiépítésére, hogy segítse a vállalati ügyfeleket felhőalapú bevezetésükben és optimalizálási útjukban, hogy javítsák üzleti eredményeiket. Szabadidejében motorozik és sétál a hároméves birkafirkájával!

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Szovik Kumar Nath egy AI/ML megoldástervező az AWS-szel. Nagy tapasztalattal rendelkezik teljes körű gépi tanulási és üzleti elemzési megoldások tervezésében a pénzügy, az üzemeltetés, a marketing, az egészségügy, az ellátási lánc menedzsment és az IoT területén. A Sovik cikkeket publikált, és szabadalommal rendelkezik az ML-modellfigyelés területén. Kettős mesterfokozatot szerzett a Dél-Floridai Egyetemen, a Fribourg Egyetemen, Svájcban, valamint a Bachelor fokozatot a Kharagpur-i Indian Institute of Technology-n. A munkán kívül Sovik szívesen utazik, komppal utazik és filmeket néz.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Maira Ladeira Tanke az AWS vezető adatszakértője. Műszaki vezetőként segít az ügyfeleknek felgyorsítani az üzleti érték elérését a feltörekvő technológia és innovatív megoldások révén. Maira 2020 januárja óta dolgozik az AWS-nél. Ezt megelőzően több iparágban is adattudósként dolgozott, azzal a céllal, hogy az adatokból üzleti értéket érjen el. Szabadidejében Maira szívesen utazik, és a családjával tölti az idejét valami meleg helyen.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Ryan Lempka Senior Solutions Architect az Amazon Web Servicesnél, ahol segít ügyfeleinek abban, hogy az üzleti céloktól visszafelé dolgozzanak az AWS-re vonatkozó megoldások fejlesztésén. Nagy tapasztalattal rendelkezik az üzleti stratégia, az informatikai rendszermenedzsment és az adattudomány területén. Ryan elkötelezett amellett, hogy élethosszig tartó tanulást végezzen, és minden nap kihívást jelent, hogy tanuljon valami újat.

Governing the ML lifecycle at scale, Part 1: A framework for architecting ML workloads using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Sriharsh Adari az Amazon Web Services (AWS) vezető megoldástervezője, ahol segít az ügyfeleknek abban, hogy az üzleti eredményektől visszamenőleg dolgozzanak innovatív megoldásokat az AWS-en. Az évek során több ügyfelének segített az adatplatformok átalakításában az iparági vertikumokban. Fő szakterülete a technológiai stratégia, az adatelemzés és az adattudomány. Szabadidejében szeret sportolni, mámorosan tévéműsorokat nézni és Tablát játszani.

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://aws.amazon.com/blogs/machine-learning/governing-the-ml-lifecycle-at-scale-part-1-a-framework-for-architecting-ml-workloads-using-amazon-sagemaker/

Időbélyeg: Október 20, 2023

Időbélyeg: 15. április 2022.

Újra kiadta Platón

AI/ML-vezérelt, használható betekintések és témák az AWS-t használó Amazon harmadik fél eladói számára

Beépített PaddleOCR az Amazon SageMaker projektekkel MLOp-okhoz, amelyek optikai karakterfelismerést hajtanak végre a személyazonosító okmányokon

Valós idejű csalásészlelés AWS szerver nélküli és gépi tanulási szolgáltatásokkal

Hozzon létre egy Metával integrált időpont-ütemező felületet az Amazon Lex és az Amazon Connect segítségével

Kárértékelés az Amazon SageMaker térinformatikai képességei és az egyéni SageMaker modellek segítségével

Szövegbesorolás az online beszélgetésekhez az AWS gépi tanulással

AWS Cloud technológia a szív-rendellenességek közel valós idejű észleléséhez hordható eszközökről származó adatok felhasználásával

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók