A szervezetek gépi tanulást (ML) és mesterséges intelligencia szolgáltatásokat használnak, hogy javítsák az ügyfélélményt, csökkentsék a működési költségeket, és új lehetőségeket tárjanak fel az üzleti eredmények javítására. Az adatok alátámasztják az ML és az AI használati eseteit, és stratégiai eszközt jelentenek a szervezet számára. Mivel az adatok exponenciális ütemben növekszenek, a szervezetek integrált, költséghatékony és hatékony adatplatform felállítására törekednek az adatok előfeldolgozása, a funkciók tervezése, valamint az ML-modellek nagyarányú felépítése, betanítása és működése érdekében. Ennek elérése érdekében az AWS egy egységes, modern adatplatformot kínál, amelyet a Amazon egyszerű tárolási szolgáltatás (Amazon S3), mint az adattó, amely erre a célra épített eszközöket és feldolgozó motorokat tartalmaz az analitika és az ML munkaterhelések támogatására. Az egységes ML élmény érdekében használhatja Amazon SageMaker Studio, amely kínál natív integráció az AWS Glue interaktív munkamenetekkel a funkciótervezés nagyarányú végrehajtása érzékeny adatvédelemmel. Ebben a bejegyzésben bemutatjuk, hogyan kell megvalósítani ezt a megoldást.
Amazon SageMaker egy teljesen felügyelt ML szolgáltatás, amely lehetővé teszi modellek felépítését, betanítását és üzembe helyezését a felhasználási esetek széles körében. A modellképzéshez bármelyiket használhatja beépített algoritmusok a SageMakerben, hogy gyorsan elkezdhesse az ML modellek betanítását és bevezetését.
A modellépítési és -fejlesztési folyamat kulcsfontosságú eleme a jellemzők tervezése. AWS ragasztó az egyik ajánlott lehetőség a funkciótervezés nagyarányú megvalósítására. Az AWS Glue lehetővé teszi az adatintegráció és -átalakítás elosztott módon történő futtatását egy kiszolgáló nélküli Apache Spark infrastruktúrán, és megkönnyíti a népszerű Spark ML könyvtár használatát a funkciók tervezésére és a modellfejlesztésre. Ezenkívül használhatja az AWS ragasztót a növekményes adatfeldolgozáshoz munkakönyvjelzők, több mint 100 forrásból származó adatok feldolgozása segítségével csatlakozók, és tüskés vagy kiszámíthatatlan munkaterheléseket futtathat a használatával automatikus méretezés.
Az ML-alapú alkalmazások másik fontos követelménye az adatbiztonság és a hozzáférés-szabályozás. Általános igény, hogy szigorúbban ellenőrizzék, ki férhet hozzá a legérzékenyebb adatokhoz a funkciótervezési és modellépítési folyamat részeként, követve a legkisebb jogosultságú hozzáférés elvét. Ennek eléréséhez használhatja az AWS Glue integrációt AWS-tó formáció az adattó eszközeinek fokozottabb irányításához és kezeléséhez. A Lake Formation segítségével részletes adathozzáférés-vezérlést és biztonsági házirendeket konfigurálhat az Amazon S3 Data Lake tetején. A házirendek egy központi helyen vannak meghatározva, lehetővé téve több elemzési és ML szolgáltatást, mint például az AWS Glue, Amazon Athéné, és a SageMaker, hogy kölcsönhatásba léphessenek az Amazon S3-ban tárolt adatokkal.
Az AWS ragasztó tartalmaz a személyazonosításra alkalmas információk (PII) észlelése transzformáció, amely lehetővé teszi az entitások észlelését, elfedését vagy szükség szerinti eltávolítását a fokozott megfelelőség és irányítás érdekében. A személyazonossági adatok transzformációjával észlelheti a személyazonosításra alkalmas adatokat az adatkészletekben, és automatikusan alkalmazhat finomszemcsés hozzáférés-szabályozást a Lake Formation segítségével, hogy korlátozza az érzékeny adatokat a különböző felhasználói csoportok számára.
Használási eset
A hajlammodell használati esetére összpontosítunk, amely egy ügyfélmarketing adatkészletet tartalmaz, és két felhasználói személyt foglal magában: egy adatmérnököt és egy adattudóst. Az adatkészlet vevőnkénti információkat tartalmaz, beleértve a potenciális ügyfelek forrását, a kapcsolatfelvételi megjegyzéseket, a munkakört, néhány jelzőt, látogatásonkénti oldalmegtekintéseket stb. Az adatkészlet érzékeny információkat is tartalmaz, például személyes telefonszámokat.
Az adatmérnök felelős a végpontok közötti adatfeldolgozási folyamat felépítéséért, beleértve az adat-előkészítést, az előfeldolgozást és a hozzáférés-szabályozást. Az adattudós felelős a funkciók tervezéséért, valamint az ML-modell képzéséért és telepítéséért. Vegye figyelembe, hogy az adattudós nem férhet hozzá semmilyen személyes személyazonosításra alkalmas adathoz szolgáltatásfejlesztés vagy az ML-modell betanítása céljából.
Ennek a használati esetnek a részeként az adatmérnök létrehoz egy adatfolyamot az adathalmaz előfeldolgozásához, megvizsgálja az adatkészletet az esetleges személyazonosításra alkalmas információk után, és korlátozza a személyazonosításra alkalmas oszlop hozzáférését az adattudós felhasználóra. Ennek eredményeként, amikor egy adatkutató az adatkészletet funkciótervezés végrehajtására és ML-modellek készítésére használja, nem fér hozzá a személyazonosításra alkalmas adatok érzékeny oszlopához (ebben az esetben a telefonszámokhoz). A szolgáltatástervezési folyamat magában foglalja a karakterlánc típusú oszlopok átalakítását az ML modellekhez optimális formátumra. Speciális felhasználási esetként ezt a hozzáférési mintát kiterjesztheti sor- és cellaszintű biztonság megvalósítására a Lake Formation használatával.
Megoldás áttekintése
A megoldás a következő magas szintű lépéseket tartalmazza:
- Állítsa be az erőforrásokat a AWS felhőképződés.
- Az adatkészlet előfeldolgozása, beleértve a személyazonosításra alkalmas adatok észlelését és a finomszemcsés hozzáférés-vezérlést, egy AWS Glue interaktív munkamenetben.
- Funkciótervezés végrehajtása egy AWS Glue interaktív munkameneten.
- Tanítson és telepítsen egy ML-modellt a SageMaker beépített XGBoost algoritmusával.
- Értékelje az ML modellt.
A következő ábra a megoldás architektúráját mutatja be.
Előfeltételek
Az oktatóanyag befejezéséhez a következő előfeltételekkel kell rendelkeznie:
Állítsa be az erőforrásokat az AWS CloudFormation segítségével
Ez a bejegyzés egy CloudFormation sablont tartalmaz a gyors beállításhoz. Áttekintheti és testreszabhatja az igényeinek megfelelően. Ha inkább erőforrásokat szeretne beállítani a AWS felügyeleti konzol és az AWS CLI-t, nem pedig az AWS CloudFormationt, tekintse meg az utasításokat a bejegyzés végén található függelékben.
A CloudFormation sablon a következő erőforrásokat állítja elő:
- S3 vödrök mintaadatkészlettel
- An AWS Lambda funkciót az adatkészlet betöltéséhez
- AWS Identity and Access Management (IAM) csoport, felhasználók, szerepkörök és házirendek
- Lake Formation adatok tó beállításai és engedélyei
- SageMaker felhasználói profilok
Az erőforrások létrehozásához hajtsa végre a következő lépéseket:
- Jelentkezzen be a konzolba.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Indítsa el a Stack alkalmazást:
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
- A DataEngineerPwd és a DataScientistPwd, adja meg saját jelszavát az adatmérnök és adattudós felhasználók számára.
- A GlueDatabaseName, belép
demo
. - A RagasztótáblaName, belép
web_marketing
. - A S3BucketNameForInput, belép
blog-studio-pii-dataset-
. - A S3BucketNameForOutput, belép
blog-studio-output-
. - A SageMakerDomainId, adja meg SageMaker tartományazonosítóját, amelyet az előfeltétel lépései során készített el.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Következő.
- A következő oldalon válassza ki Következő.
- Tekintse át a részleteket az utolsó oldalon, és válassza ki Tudomásul veszem, hogy az AWS CloudFormation IAM-erőforrásokat hozhat létre.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Teremt.
A verem létrehozása akár 10 percig is eltarthat. A verem IAM szerepköröket és SageMaker felhasználói profilokat hoz létre két személy számára: adatmérnök és adattudós számára. Létrehoz egy adatbázis-demót és egy táblázatot is web_marketing
mintaadatkészlettel.
A verem létrehozásakor az adatmérnök személynek teljes hozzáférése van a táblához, de az adattudós személynek még nincs hozzáférése a táblához.
Az adatkészlet előfeldolgozása
Kezdjük el az adatok előfeldolgozását egy AWS Glue interaktív munkamenetben. Az adatmérnök személy ellenőrizni szeretné az adatokat, hogy lássa, vannak-e érzékeny adatok vagy sem, és minimális hozzáférési engedélyt kíván adni az adattudós személynek. A jegyzetfüzetet innen töltheti le ezt a helyet.
- Jelentkezzen be a konzolba a data-engineer felhasználóval.
- A SageMaker konzolon válassza a lehetőséget felhasználók.
- Válassza ki az adatmérnök felhasználót, és válassza ki OpenStudio.
- Hozzon létre egy új jegyzetfüzetet, és válassza ki SparkAnalytics 1.0 mert Kép és a Ragasztó PySpark mert mag.
- Indítson interaktív munkamenetet a következő varázslattal a Boto3 újabb verziójának telepítéséhez (ez szükséges a
create_data_cells_filter
módszer): - A munkamenet inicializálása:
- Hozzon létre egy AWS Glue DynamicFrame-et az újonnan létrehozott táblázatból, és választási típusok megoldása katalógusséma alapján, mert az adatok alapján automatikusan kikövetkeztetett séma helyett a katalógusban meghatározott sémát szeretnénk használni:
- Ellenőrizze a táblázatban, hogy vannak-e személyazonosításra alkalmas adatok az AWS Glue személyazonosításra alkalmas azonosításával:
- Ellenőrizze, hogy a személyazonosításra alkalmas adatokként besorolt oszlopok tartalmaznak-e bizalmas adatokat vagy sem (ha nem, frissítse a Class_map alkalmazást a nem érzékeny oszlopok elvetéséhez):
- Állítsa be a Lake Formation engedélyeket adatcella-szűrő használatával az automatikusan észlelt oszlopokhoz, és korlátozza az oszlopokat az adattudós személyre:
- Jelentkezzen be a Stúdióba adattudósként, és ellenőrizze, hogy a személyazonosításra alkalmas adatok oszlopai nem láthatók. A jegyzetfüzetet innen töltheti le ezt a helyet.
- Hozzon létre egy új jegyzetfüzetet, és válassza ki SparkAnalytics 1.0 mert Kép és a Ragasztó PySpark mert mag:
Hajtsa végre a funkciótervezést
Az Apache Spark ML könyvtárat használjuk a funkciók tervezésére adattudós felhasználóként, majd visszaírjuk a kimenetet az Amazon S3-ba.
- A következő cellában a jellemzőket a Apache Spark ML könyvtár:
StringIndexer
a címkékből álló karakterlánc oszlopot címkeindexek oszlopára képezi le.OneHotEncoder
egy címkeindexként ábrázolt kategorikus jellemzőt képez le egy bináris vektorra, legfeljebb egyetlen egyértékkel, amely egy adott kategorikus jellemző jelenlétét jelzi. Ezt a transzformációt olyan ML algoritmusokhoz használják, amelyek folyamatos funkciókat várnak el.VectorAssembler
egy olyan transzformátor, amely egy adott oszloplistát egyetlen vektoroszlopba egyesít, amelyet azután olyan algoritmusok ML modelljei betanításához használnak, mint a logisztikus regresszió és a döntési fák.
- A végleges átalakított DataFrame a Pipeline könyvtár segítségével hozható létre. A folyamat szakaszok sorozataként van megadva. Ezek a szakaszok sorrendben futnak, és a bemeneti DataFrame átalakul, ahogy áthalad az egyes szakaszokon.
- Ezután felosztjuk az adatkészletet betanításra, érvényesítjük és teszteljük a DataFrame-et, majd elmentjük az S3 tárolóba az ML modell betanításához (adja meg AWS-fiókazonosítóját a következő kódban):
Tanítson és telepítsen egy ML-modellt
Az előző részben befejeztük a funkciótervezést, amely magában foglalta az olyan karakterlánc-oszlopok konvertálását, mint pl region
, jobrole
és usedpromo
az ML modellekhez optimális formátumba. Olyan oszlopokat is beiktattunk, mint pl pageviewspervisit
és a totalwebvisits
, amely segít megjósolni a vásárló termékvásárlási hajlandóságát.
Most egy ML-modellt betanítunk a betanítás és az érvényesítési adatkészlet beolvasásával a SageMaker beépített XGBoost algoritmusával. Ezután telepítjük a modellt, és lefuttatjuk a pontosság ellenőrzését. A jegyzetfüzetet innen töltheti le ezt a helyet.
A következő cellában a második S3-csoport adatait olvassuk be, amely tartalmazza a szolgáltatásfejlesztési műveleteink kimenetét. Ezután a beépített XGBoost algoritmust használjuk a modell betanításához.
- Nyisson meg egy új jegyzetfüzetet. Választ Data Science mert Kép és a Python 3 mert mag (Adja meg AWS-fiókazonosítóját a következő kódban):
- A képzés befejeztével a modellt a SageMaker hosting szolgáltatások segítségével telepíthetjük:
Értékelje az ML modellt
A tesztadatkészlet segítségével értékeljük a modellt, és töröljük a következtetési végpontot, ha végeztünk, hogy elkerüljük a folyamatos költségeket.
- Értékelje a modellt a következő kóddal:
A mintafutás pontossága 84.6 % volt. Ez kissé eltérhet a futtatásnál az adatkészlet véletlenszerű felosztása miatt.
- A következõ végpontot a következõ kóddal törölhetjük:
Tisztítsuk meg
Most az utolsó lépéshez, az erőforrások tisztításához.
- Ürítse ki a CloudFormation-veremen keresztül létrehozott két vödröt.
- Törölje a felhasználóhoz társított alkalmazásokat
profiles data-scientist
és adata-engineer
a Stúdión belül. - Törölje a CloudFormation veremet.
Következtetés
Ebben a bejegyzésben egy olyan megoldást mutattunk be, amely lehetővé teszi az olyan személyek számára, mint például az adatmérnökök és az adattudósok, hogy nagy léptékű funkciótervezést hajtsanak végre. Az AWS Glue interaktív munkameneteivel könnyedén megvalósíthatja a funkciók tervezését a méretekben az automatikus személyazonosító adatok észlelésével és a finomszemcsés hozzáférés-vezérléssel anélkül, hogy bármilyen mögöttes infrastruktúrát kellene kezelnie. A Studio egyetlen belépési pontként való használatával egyszerűsített és integrált élményben lehet része egy végpontok közötti ML munkafolyamat felépítéséhez: az adatok előkészítésétől és biztonságossá tételétől az ML-modellek felépítéséig, betanításáig, hangolásáig és üzembe helyezéséig. Ha többet szeretne megtudni, látogasson el Az AWS Glue interaktív munkameneteinek első lépései és a Amazon SageMaker Studio.
Nagyon izgatottak vagyunk ezzel az új képességgel kapcsolatban, és kíváncsian várjuk, mit fogsz építeni vele!
Függelék: Állítsa be az erőforrásokat a konzolon és az AWS parancssori felületén keresztül
Hajtsa végre az ebben a szakaszban található utasításokat, ha a CloudFormation-sablon helyett a konzolt és az AWS parancssori felületet szeretné beállítani.
Előfeltételek
Az oktatóanyag befejezéséhez hozzáféréssel kell rendelkeznie az AWS CLI-hez (lásd Kezdő lépések az AWS CLI-vel), vagy használja a parancssori hozzáférést innen AWS CloudShell.
Konfigurálja az IAM-csoportot, a felhasználókat, a szerepköröket és a házirendeket
Ebben a részben két IAM-felhasználót hozunk létre: data-engineer és data-scientist, amelyek az IAM-csoport data-platform-group csoportjába tartoznak. Ezután egyetlen IAM-házirendet adunk az IAM-csoporthoz.
- Az IAM konzolon hozzon létre egy házirendet a JSON lapon nevű új IAM felügyelt házirend létrehozásához
DataPlatformGroupPolicy
. A házirend lehetővé teszi a csoport felhasználóinak, hogy hozzáférjenek a Studio-hoz, de csak olyan SageMaker felhasználói profil használatával, amely az IAM-felhasználónevüknek megfelelő címkével rendelkezik. Használja a következő JSON-házirend-dokumentumot az engedélyek megadásához: - Hozzon létre egy IAM-csoportot hívott
data-platform-group
. - Keresse meg és csatolja a csoporthoz a DataPlatformGroupPolicy nevű AWS felügyelt házirendet.
- IAM-felhasználók létrehozása adatmérnöknek és adattudósnak nevezik az IAM csoport data-platform-group alatt.
- Hozzon létre egy új felügyelt házirendet SageMakerExecutionPolicy néven (adja meg régióját és fiókazonosítóját a következő kódban):
- Hozzon létre egy új felügyelt házirendet nevezett
SageMakerAdminPolicy
: - Hozzon létre egy IAM-szerepet a SageMaker számára az adatmérnök (data-engineer) számára, amelyet a megfelelő felhasználói profil végrehajtási szerepeként használnak. A Engedélyezési szabályzat csatolása oldal, az AmazonSageMakerFullAccess (AWS felügyelt házirend) alapértelmezés szerint csatolva van. Ezt a házirendet később eltávolítja a minimális jogosultság megőrzése érdekében.
- A Szerepnév, használja a szakasz elején bemutatott elnevezési konvenciót a SageMakerStudioExecutionRole_data-engineer szerep elnevezéséhez.
- A Címkék, adja hozzá a kulcs userprofilename-et és a data-engineer értéket.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Szerep létrehozása.
- A fennmaradó házirendek hozzáadásához a szerepek oldalon válassza ki az imént létrehozott szerepnevet.
- Alatt Engedélyek, távolítsa el az AmazonSageMakerFullAccess házirendet.
- A Engedélyezési szabályzat csatolása oldalon válassza ki az AWS által felügyelt házirendet AwsGlueSessionUserRestrictedServiceRole és az ügyfelek által létrehozott SageMakerExecutionPolicy és SageMakerAdminPolicy házirendeket.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Szabályzatok csatolása.
- módosít a szereped bizalmi kapcsolata:
- Hozzon létre egy IAM-szerepet a SageMaker számára az adattudós (data-scientist) számára, amelyet a megfelelő felhasználói profil végrehajtási szerepeként használnak.
- A Szerepnév, nevezze el a szerepet SageMakerStudioExecutionRole_data-scientist.
- A Címkék, adja hozzá a kulcs felhasználói profilnevet és a value data-scientist értéket.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Szerep létrehozása.
- A fennmaradó házirendek hozzáadásához a szerepek oldalon válassza ki az imént létrehozott szerepnevet.
- Alatt Engedélyek, távolítsa el az AmazonSageMakerFullAccess házirendet.
- A Engedélyezési szabályzat csatolása oldalon válassza ki az AWS felügyelt házirendet AwsGlueSessionUserRestrictedServiceRole és az ügyfél által felügyelt SageMakerExecutionPolicy házirendet, amelyet létrehozott.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Szabályzatok csatolása.
- módosít a szereped bizalmi kapcsolata:
Konfigurálja a SageMaker felhasználói profilokat
A SageMaker felhasználói profilok létrehozásához a studiouserid
címkét, hajtsa végre a következő lépéseket:
- Az AWS parancssori felület vagy a CloudShell segítségével hozza létre a Studio felhasználói profilt az adatmérnök számára (adja meg fiókazonosítóját és Studio domain azonosítóját a következő kódban):
- Ismételje meg a lépést egy felhasználói profil létrehozásához az adattudós számára, lecserélve a fiókazonosítót és a Studio-tartományazonosítót:
Hozzon létre S3-csoportokat, és töltse fel a mintaadatkészletet
Ebben a szakaszban két S3 gyűjtőt hoz létre. Az első csoportban van egy webmarketinggel kapcsolatos mintaadatkészlet. A második tárolót az adattudós használja a szolgáltatástervezési feladatok kimenetének tárolására, és ezt a kimeneti adatkészletet az ML-modell betanításához használja.
Először hozza létre az S3 tárolót a bemeneti adatokhoz:
- Letöltés az adatkészletet.
- Az Amazon S3 konzolon válassza a lehetőséget Kanalak a navigációs ablaktáblában.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Vödör létrehozása.
- A Vidék, válassza ki a SageMaker tartományú régiót, amely tartalmazza az Ön által létrehozott felhasználói profilokat.
- A Vödör neve, belép
blog-studio-pii-dataset-
. - A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Vödör létrehozása.
- Válassza ki a létrehozott tárolót, és válassza ki Feltöltés.
- A Válassza ki a fájlokat szakaszban válassza Fájlok hozzáadása és töltse fel a letöltött adatkészletet.
Most létrehozza a tárolót a kimeneti adatokhoz: - A Kanalak oldalon válassza a lehetőséget Vödör létrehozása.
- A Vidék, válassza ki a SageMaker tartományú régiót, amely tartalmazza az Ön által létrehozott felhasználói profilokat.
- A Vödör neve, belép
blog-studio-output-
. - A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Vödör létrehozása.
Hozzon létre egy AWS Glue adatbázist és táblázatot
Ebben a szakaszban létrehoz egy AWS Glue adatbázist és táblázatot az adatkészlethez.
- A Lake Formation konzolon, alatt Adatkatalógus a navigációs ablakban válassza a lehetőséget Adatbázisok.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Adatbázis hozzáadása.
- A Név, lépjen be a demóba.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Adatbázis létrehozása.
- Alatt Adatkatalógus, választ Asztalok.
- A Név, belép
web_marketing
. - A adatbázisválassza
demo
. - A Tartalmazza az elérési utat, adja meg az S3 tároló elérési útját a bemeneti adatokhoz.
- A Osztályozás, választ CSV.
- Alatt Séma, választ Séma feltöltése.
- Írja be a következő JSON-tömböt a szövegmezőbe:
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Feltöltés.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Küld.
- Alatt Táblázat részletei, választ Táblázat szerkesztése.
- Alatt A táblázat tulajdonságai, választ hozzáad.
- A Kulcs, belép
skip.header.line.count
, Valamint a Érték, írja be a 1-et. - A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Megtakarítás.
Állítsa be a Lake Formation engedélyeit
Ebben a szakaszban a Lake Formation engedélyeket állítja be az IAM-szerep engedélyezéséhez SageMakerStudioExecutionRole_data-engineer
adatbázis létrehozásához és az S3 hely regisztrálásához a Lake Formationon belül.
Először is regisztrálja az adattó helyét a táblák kezeléséhez a Lake Formation engedélyeiben található hely alatt:
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Data tó helyei.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Regisztrálja a helyet.
- A Amazon S3 elérési út, belép
s3://blog-studio-pii-dataset-/
(az adatkészletet tartalmazó vödör). - A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Regisztrálja a helyet.
Most megadja a Lake Formation adatbázis- és táblajogosultságait az IAM-szerepköröknekSageMakerStudioExecutionRole_data-engineer
és aSageMakerStudioExecutionRole_data-scientist
.Először is adjon engedélyt az adatbázishozSageMakerStudioExecutionRole_data-engineer
: - Alatt Engedélyek, választ Data Lake engedélyek.
- Alatt Adatengedély, választ Grant.
- A Vezetőinek, választ IAM felhasználók és szerepkörök, és válassza ki a szerepet
SageMakerStudioExecutionRole_data-engineer
. - A Irányelvcímkék vagy katalógus-források, választ Elnevezett adatkatalógus-források.
- A Adatbázisok, válassza a demót.
- A Adatbázis engedélyek, válasszuk szuper.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Grant.
Ezután adjon engedélyt a következőhöz:SageMakerStudioExecutionRole_data-engineer
: - Alatt Adatengedély, választ Grant.
- A Vezetőinek, választ IAM felhasználók és szerepkörök, és válassza ki a szerepet
SageMakerStudioExecutionRole_data-engineer
. - A Irányelvcímkék vagy katalógus-források, választ Elnevezett adatkatalógus-források.
- A Adatbázisok, választ
demo
. - A Asztalok, választ
web_marketing
. - A Táblázat engedélyek, válasszuk szuper.
- A Megadható engedélyek, válasszuk szuper.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Grant.
Végül adjon adatbázis-engedélyt a számáraSageMakerStudioExecutionRole_data-scientist
: - Alatt Adatengedély, választ Grant.
- A Vezetőinek, választ IAM felhasználók és szerepkörök, és válassza ki a szerepet
SageMakerStudioExecutionRole_data-scientist
. - A Irányelvcímkék vagy katalógus-források, választ Elnevezett adatkatalógus-források.
- A Adatbázisok, választ
demo
. - A Adatbázis engedélyek, válasszuk Írja le.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Grant.
A szerzőkről
Praveen Kumar az AWS Analytics-megoldástervezője, aki a felhőalapú szolgáltatásokat használó modern adat- és elemzési platformok tervezésében, felépítésében és megvalósításában jártas szakértelemmel rendelkezik. Érdeklődési területe a szerver nélküli technológia, a modern felhő adattárházak, a streaming és az ML alkalmazások.
Noritaka Sekiyama az AWS Glue csapatának vezető Big Data építésze. Élvezi a különböző csapatokkal való együttműködést, hogy olyan eredményeket érjen el, mint ez a bejegyzés. Szabadidejében szívesen játszik a családjával videojátékokkal.
- Haladó (300)
- AI
- ai művészet
- ai art generátor
- van egy robotod
- Amazon SageMaker
- mesterséges intelligencia
- mesterséges intelligencia tanúsítás
- mesterséges intelligencia a bankszektorban
- mesterséges intelligencia robot
- mesterséges intelligencia robotok
- mesterséges intelligencia szoftver
- AWS Big Data
- AWS ragasztó
- AWS-tó formáció
- AWS gépi tanulás
- blockchain
- blokklánc konferencia ai
- coingenius
- társalgási mesterséges intelligencia
- kriptokonferencia ai
- dall's
- mély tanulás
- google azt
- gépi tanulás
- Plató
- plato ai
- Platón adatintelligencia
- Platón játék
- PlatoData
- platogaming
- skála ai
- szintaxis
- gondolkodás vezetés
- zephyrnet