Az Amazon S3 hozzáférési pont támogatásának bejelentése az Amazon SageMaker Data Wrangler | Amazon webszolgáltatások

Az Amazon S3 hozzáférési pont támogatásának bejelentése az Amazon SageMaker Data Wrangler | Amazon webszolgáltatások

Izgatottan jelentjük be Amazon SageMaker Data Wrangler támogatása Amazon S3 hozzáférési pontok. Vizuális pontjaival és kattintási felületével a SageMaker Data Wrangler leegyszerűsíti az adatok előkészítésének és a funkciók tervezésének folyamatát, beleértve az adatok kiválasztását, tisztítását, feltárását és megjelenítését, míg az S3 Access Points leegyszerűsíti az adatok elérését azáltal, hogy egyedi gazdagépneveket biztosít egyedi hozzáférési szabályzatokkal.

Mától a SageMaker Data Wrangler megkönnyíti a felhasználók számára az adatok előkészítését a megosztott adatkészletekből Amazon egyszerű tárolási szolgáltatás (Amazon S3), miközben lehetővé teszi a szervezetek számára, hogy biztonságosan szabályozzák az adatokhoz való hozzáférést szervezetükben. Az S3 hozzáférési pontokkal az adatadminisztrátorok mostantól alkalmazás- és csapatspecifikus hozzáférési pontokat hozhatnak létre az adatmegosztás megkönnyítése érdekében, ahelyett, hogy összetett, sok különböző engedélyszabályt tartalmazó csoportházirendet kezelnének.

Ebben a bejegyzésben végigvezetjük az adatok importálásán és exportálásán egy S3 hozzáférési ponton a SageMaker Data Wranglerben.

Megoldás áttekintése

Képzelje el, hogy rendszergazdaként több adattudományi csoport adatait kell kezelnie, amelyek saját adat-előkészítési munkafolyamatokat futtatnak a SageMaker Data Wranglerben. Az adminisztrátorok gyakran három kihívással néznek szembe:

  • Az adattudományi csapatoknak anélkül kell hozzáférniük adatkészleteikhez, hogy mások biztonságát veszélyeztetnék
  • Az adattudományi csapatoknak hozzáférésre van szükségük bizonyos érzékeny adatokat tartalmazó adatkészletekhez, ami tovább bonyolítja az engedélyek kezelését
  • A biztonsági szabályzat csak meghatározott végpontokon keresztül engedélyezi az adatokhoz való hozzáférést az illetéktelen hozzáférés megakadályozása és az adatok kitettségének csökkentése érdekében

Hagyományos csoportházirendek esetén nehézségekbe ütközne a részletes hozzáférés beállítása, mivel a gyűjtőkör-házirendek ugyanazokat az engedélyeket alkalmazzák a tárolóban lévő összes objektumra. A hagyományos csoportházirendek szintén nem támogatják a hozzáférés biztosítását a végpont szintjén.

Az S3 Access Points ezeket a problémákat azáltal oldja meg, hogy aprólékos hozzáférés-vezérlést biztosít, megkönnyítve a különböző csapatok engedélyeinek kezelését anélkül, hogy a csoport más részeit érintené. Ahelyett, hogy egyetlen csoportos házirendet módosítana, több hozzáférési pontot is létrehozhat egyedi házirendekkel, amelyek konkrét felhasználási esetekre vannak szabva, csökkentve a hibás konfiguráció vagy az érzékeny adatokhoz való nem szándékos hozzáférés kockázatát. Végül a végponti házirendeket kényszerítheti ki a hozzáférési pontokon, hogy meghatározza azokat a szabályokat, amelyek szabályozzák, hogy mely VPC-k vagy IP-címek érhetik el az adatokat egy adott hozzáférési ponton keresztül.

Bemutatjuk, hogyan kell használni az S3 hozzáférési pontokat a SageMaker Data Wranglerrel a következő lépésekkel:

  1. Töltse fel az adatokat egy S3 tárolóba.
  2. Hozzon létre egy S3 hozzáférési pontot.
  3. Állítsa be a AWS Identity and Access Management (IAM) szerepkörét a szükséges irányelvekkel.
  4. Hozzon létre egy SageMaker Data Wrangler folyamatot.
  5. Exportálja az adatokat a SageMaker Data Wranglerből a hozzáférési pontba.

Ehhez a bejegyzéshez a Bankmarketing adatkészlet mintaadatainkhoz. Azonban bármilyen más adatkészletet használhat.

Előfeltételek

Ehhez az áttekintéshez a következő előfeltételekkel kell rendelkeznie:

Töltse fel az adatokat egy S3 tárolóba

Töltse fel adatait egy S3 tárolóba. Az utasításokat lásd: Objektumok feltöltése. Ehhez a bejegyzéshez a Bankmarketing adatkészlet.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Hozzon létre egy S3 hozzáférési pontot

S3 hozzáférési pont létrehozásához hajtsa végre a következő lépéseket. További információkért lásd: Hozzáférési pontok létrehozása.

  1. Az Amazon S3 konzolon válassza a lehetőséget Hozzáférési pontok a navigációs ablaktáblában.
  2. A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Hozzon létre hozzáférési pontot.
  3. A Hozzáférési pont neve, adja meg a hozzáférési pont nevét.
  4. A Vödörválassza Válasszon egy csoportot ebben a fiókban.
  5. A Bucket name, írja be a létrehozott vödör nevét.
  6. Hagyja a többi beállítást alapértelmezettként, és válassza ki Hozzon létre hozzáférési pontot.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A hozzáférési pont részleteinek oldalán jegyezze fel az Amazon erőforrás nevét (ARN) és a hozzáférési pont álnevet. Ezeket később használhatja, amikor kapcsolatba lép a SageMaker Data Wrangler hozzáférési pontjával.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Konfigurálja az IAM-szerepet

Ha a SageMaker Studio tartománya készen áll, hajtsa végre a következő lépéseket a végrehajtási szerep szerkesztéséhez:

  1. A SageMaker konzolon válassza a lehetőséget Domains a navigációs ablaktáblában.
  2. Válassza ki a domainjét.
  3. A Domain beállítások lapot választani szerkesztése.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Alapértelmezés szerint a Data Wrangler eléréséhez használt IAM-szerep SageMakerExecutionRole. Az S3 hozzáférési pontok használatához a következő két házirendet kell hozzáadnunk:

  • Szabályzat 1 – Ez az IAM-házirend a SageMaker Data Wrangler számára hozzáférést biztosít a végrehajtáshoz PutObject, GetObjectés DeleteObject:
    { "Version": "2012-10-17", "Statement": [ { "Sid": "S3AccessPointAccess", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:DeleteObject" ], "Resource": "arn:aws:s3:us-east-1:<<accountID>>:accesspoint/<<s3-dw-accesspoint>>" } ]
    }

  • Szabályzat 2 – Ez az IAM-szabályzat hozzáférést biztosít a SageMaker Data Wrangler számára az S3 hozzáférési pont megszerzéséhez:
    { "Version": "2012-10-17", "Statement": [ { "Sid": "GetAccessPoint", "Effect": "Allow", "Action": "s3:GetAccessPoint", "Resource": "arn:aws:s3:us-east-1:<<accountID>>:accesspoint/<<s3-dw-accesspoint>>" } ]
    }

  1. Hozza létre ezt a két szabályzatot, és csatolja őket a szerepkörhöz.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

S3 hozzáférési pontok használata a SageMaker Data Wranglerben

Új SageMaker Data Wrangler folyamat létrehozásához hajtsa végre a következő lépéseket:

  1. Indítsa el a SageMaker Studio programot.
  2. A filé menüben válasszon Új és a Data Wrangler Flow.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Adatforrásként válassza az Amazon S3-at.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. S3 forrás esetén adja meg az S3 hozzáférési pontot a korábban jegyzett ARN vagy álnév használatával.

Ebben a bejegyzésben az ARN-t használjuk az adatok importálására az S3 hozzáférési pont használatával. Az ARN azonban csak az S3 hozzáférési pontokhoz és a SageMaker Studio tartományokhoz működik ugyanazon a régión belül.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Alternatív megoldásként használhatja az álnevet, amint az a következő képernyőképen látható. Az ARN-ekkel ellentétben az álnevekre régiók között lehet hivatkozni.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Exportáljon adatokat a SageMaker Data Wranglerből az S3 hozzáférési pontokba

A szükséges átalakítások elvégzése után az eredményeket exportálhatjuk az S3 hozzáférési pontra. A mi esetünkben egyszerűen elejtettünk egy oszlopot. Ha elvégezte a használati esethez szükséges átalakításokat, hajtsa végre a következő lépéseket:

  1. Az adatfolyamban válassza ki a pluszjelet.
  2. Válassza a Cél hozzáadása és az Amazon S3 lehetőséget.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

  1. Adja meg az adatkészlet nevét és az S3 helyét az ARN-re hivatkozva.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Mostantól az S3 hozzáférési pontokkal biztonságosan és hatékonyan importálhat és exportálhat adatokat anélkül, hogy bonyolult gyűjtőköri szabályzatokat kellene kezelnie és több mappastruktúrában navigálnia kellene.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Tisztítsuk meg

Ha új SageMaker-domaint hozott létre a követéshez, mindenképpen állítsa le a futó alkalmazásokat és törölje a domainjét hogy leállítsák a díjak felszámítását. Ezenkívül törölje bármelyiket S3 hozzáférési pontok és a törölje az összes S3 tárolót.

Következtetés

Ebben a bejegyzésben bemutattuk az S3 hozzáférési pontok elérhetőségét a SageMaker Data Wrangler számára, és megmutattuk, hogyan használhatja ezt a funkciót a SageMaker Studio adatkezelésének egyszerűsítésére. Az adatkészletet az AWS-fiókok S3 hozzáférési pontjának álnevéről fértünk hozzá, és az eredményül kapott átalakításokat egy SXNUMX hozzáférési pont álnévre mentettük. Reméljük, hogy kihasználja ezt a funkciót, hogy eltávolítsa a SageMaker Studio felhasználóinak adathozzáférésével kapcsolatos szűk keresztmetszeteket, és arra biztatjuk, hogy próbálja ki!


A szerzőkről

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Peter Chung az AWS vállalati ügyfeleit kiszolgáló Solutions Architect. Szereti az ügyfeleknek segíteni a technológia használatában üzleti problémák megoldásában különféle témákban, például a költségek csökkentésében és a mesterséges intelligencia kihasználásában. Könyvet írt az AWS FinOpsról, és szívesen olvas és épít megoldásokat.

Announcing Amazon S3 access point support for Amazon SageMaker Data Wrangler | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.Neelam Koshiya az AWS vállalati megoldások tervezője. Jelenleg arra törekszik, hogy segítse a vállalati ügyfeleket a felhőbe való áttérésük során a stratégiai üzleti eredmények érdekében. Szabadidejében szeret olvasni és a szabadban lenni.

Időbélyeg:

Még több AWS gépi tanulás