Izgatottan jelentjük be Amazon SageMaker Data Wrangler támogatása Amazon S3 hozzáférési pontok. Vizuális pontjaival és kattintási felületével a SageMaker Data Wrangler leegyszerűsíti az adatok előkészítésének és a funkciók tervezésének folyamatát, beleértve az adatok kiválasztását, tisztítását, feltárását és megjelenítését, míg az S3 Access Points leegyszerűsíti az adatok elérését azáltal, hogy egyedi gazdagépneveket biztosít egyedi hozzáférési szabályzatokkal.
Mától a SageMaker Data Wrangler megkönnyíti a felhasználók számára az adatok előkészítését a megosztott adatkészletekből Amazon egyszerű tárolási szolgáltatás (Amazon S3), miközben lehetővé teszi a szervezetek számára, hogy biztonságosan szabályozzák az adatokhoz való hozzáférést szervezetükben. Az S3 hozzáférési pontokkal az adatadminisztrátorok mostantól alkalmazás- és csapatspecifikus hozzáférési pontokat hozhatnak létre az adatmegosztás megkönnyítése érdekében, ahelyett, hogy összetett, sok különböző engedélyszabályt tartalmazó csoportházirendet kezelnének.
Ebben a bejegyzésben végigvezetjük az adatok importálásán és exportálásán egy S3 hozzáférési ponton a SageMaker Data Wranglerben.
Megoldás áttekintése
Képzelje el, hogy rendszergazdaként több adattudományi csoport adatait kell kezelnie, amelyek saját adat-előkészítési munkafolyamatokat futtatnak a SageMaker Data Wranglerben. Az adminisztrátorok gyakran három kihívással néznek szembe:
- Az adattudományi csapatoknak anélkül kell hozzáférniük adatkészleteikhez, hogy mások biztonságát veszélyeztetnék
- Az adattudományi csapatoknak hozzáférésre van szükségük bizonyos érzékeny adatokat tartalmazó adatkészletekhez, ami tovább bonyolítja az engedélyek kezelését
- A biztonsági szabályzat csak meghatározott végpontokon keresztül engedélyezi az adatokhoz való hozzáférést az illetéktelen hozzáférés megakadályozása és az adatok kitettségének csökkentése érdekében
Hagyományos csoportházirendek esetén nehézségekbe ütközne a részletes hozzáférés beállítása, mivel a gyűjtőkör-házirendek ugyanazokat az engedélyeket alkalmazzák a tárolóban lévő összes objektumra. A hagyományos csoportházirendek szintén nem támogatják a hozzáférés biztosítását a végpont szintjén.
Az S3 Access Points ezeket a problémákat azáltal oldja meg, hogy aprólékos hozzáférés-vezérlést biztosít, megkönnyítve a különböző csapatok engedélyeinek kezelését anélkül, hogy a csoport más részeit érintené. Ahelyett, hogy egyetlen csoportos házirendet módosítana, több hozzáférési pontot is létrehozhat egyedi házirendekkel, amelyek konkrét felhasználási esetekre vannak szabva, csökkentve a hibás konfiguráció vagy az érzékeny adatokhoz való nem szándékos hozzáférés kockázatát. Végül a végponti házirendeket kényszerítheti ki a hozzáférési pontokon, hogy meghatározza azokat a szabályokat, amelyek szabályozzák, hogy mely VPC-k vagy IP-címek érhetik el az adatokat egy adott hozzáférési ponton keresztül.
Bemutatjuk, hogyan kell használni az S3 hozzáférési pontokat a SageMaker Data Wranglerrel a következő lépésekkel:
- Töltse fel az adatokat egy S3 tárolóba.
- Hozzon létre egy S3 hozzáférési pontot.
- Állítsa be a AWS Identity and Access Management (IAM) szerepkörét a szükséges irányelvekkel.
- Hozzon létre egy SageMaker Data Wrangler folyamatot.
- Exportálja az adatokat a SageMaker Data Wranglerből a hozzáférési pontba.
Ehhez a bejegyzéshez a Bankmarketing adatkészlet mintaadatainkhoz. Azonban bármilyen más adatkészletet használhat.
Előfeltételek
Ehhez az áttekintéshez a következő előfeltételekkel kell rendelkeznie:
Töltse fel az adatokat egy S3 tárolóba
Töltse fel adatait egy S3 tárolóba. Az utasításokat lásd: Objektumok feltöltése. Ehhez a bejegyzéshez a Bankmarketing adatkészlet.
Hozzon létre egy S3 hozzáférési pontot
S3 hozzáférési pont létrehozásához hajtsa végre a következő lépéseket. További információkért lásd: Hozzáférési pontok létrehozása.
- Az Amazon S3 konzolon válassza a lehetőséget Hozzáférési pontok a navigációs ablaktáblában.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Hozzon létre hozzáférési pontot.
- A Hozzáférési pont neve, adja meg a hozzáférési pont nevét.
- A Vödörválassza Válasszon egy csoportot ebben a fiókban.
- A Bucket name, írja be a létrehozott vödör nevét.
- Hagyja a többi beállítást alapértelmezettként, és válassza ki Hozzon létre hozzáférési pontot.
A hozzáférési pont részleteinek oldalán jegyezze fel az Amazon erőforrás nevét (ARN) és a hozzáférési pont álnevet. Ezeket később használhatja, amikor kapcsolatba lép a SageMaker Data Wrangler hozzáférési pontjával.
Konfigurálja az IAM-szerepet
Ha a SageMaker Studio tartománya készen áll, hajtsa végre a következő lépéseket a végrehajtási szerep szerkesztéséhez:
- A SageMaker konzolon válassza a lehetőséget Domains a navigációs ablaktáblában.
- Válassza ki a domainjét.
- A Domain beállítások lapot választani szerkesztése.
Alapértelmezés szerint a Data Wrangler eléréséhez használt IAM-szerep SageMakerExecutionRole
. Az S3 hozzáférési pontok használatához a következő két házirendet kell hozzáadnunk:
- Szabályzat 1 – Ez az IAM-házirend a SageMaker Data Wrangler számára hozzáférést biztosít a végrehajtáshoz
PutObject
,GetObject
ésDeleteObject
:
- Szabályzat 2 – Ez az IAM-szabályzat hozzáférést biztosít a SageMaker Data Wrangler számára az S3 hozzáférési pont megszerzéséhez:
- Hozza létre ezt a két szabályzatot, és csatolja őket a szerepkörhöz.
S3 hozzáférési pontok használata a SageMaker Data Wranglerben
Új SageMaker Data Wrangler folyamat létrehozásához hajtsa végre a következő lépéseket:
- Indítsa el a SageMaker Studio programot.
- A filé menüben válasszon Új és a Data Wrangler Flow.
- Adatforrásként válassza az Amazon S3-at.
- S3 forrás esetén adja meg az S3 hozzáférési pontot a korábban jegyzett ARN vagy álnév használatával.
Ebben a bejegyzésben az ARN-t használjuk az adatok importálására az S3 hozzáférési pont használatával. Az ARN azonban csak az S3 hozzáférési pontokhoz és a SageMaker Studio tartományokhoz működik ugyanazon a régión belül.
Alternatív megoldásként használhatja az álnevet, amint az a következő képernyőképen látható. Az ARN-ekkel ellentétben az álnevekre régiók között lehet hivatkozni.
Exportáljon adatokat a SageMaker Data Wranglerből az S3 hozzáférési pontokba
A szükséges átalakítások elvégzése után az eredményeket exportálhatjuk az S3 hozzáférési pontra. A mi esetünkben egyszerűen elejtettünk egy oszlopot. Ha elvégezte a használati esethez szükséges átalakításokat, hajtsa végre a következő lépéseket:
- Az adatfolyamban válassza ki a pluszjelet.
- Válassza a Cél hozzáadása és az Amazon S3 lehetőséget.
- Adja meg az adatkészlet nevét és az S3 helyét az ARN-re hivatkozva.
Mostantól az S3 hozzáférési pontokkal biztonságosan és hatékonyan importálhat és exportálhat adatokat anélkül, hogy bonyolult gyűjtőköri szabályzatokat kellene kezelnie és több mappastruktúrában navigálnia kellene.
Tisztítsuk meg
Ha új SageMaker-domaint hozott létre a követéshez, mindenképpen állítsa le a futó alkalmazásokat és törölje a domainjét hogy leállítsák a díjak felszámítását. Ezenkívül törölje bármelyiket S3 hozzáférési pontok és a törölje az összes S3 tárolót.
Következtetés
Ebben a bejegyzésben bemutattuk az S3 hozzáférési pontok elérhetőségét a SageMaker Data Wrangler számára, és megmutattuk, hogyan használhatja ezt a funkciót a SageMaker Studio adatkezelésének egyszerűsítésére. Az adatkészletet az AWS-fiókok S3 hozzáférési pontjának álnevéről fértünk hozzá, és az eredményül kapott átalakításokat egy SXNUMX hozzáférési pont álnévre mentettük. Reméljük, hogy kihasználja ezt a funkciót, hogy eltávolítsa a SageMaker Studio felhasználóinak adathozzáférésével kapcsolatos szűk keresztmetszeteket, és arra biztatjuk, hogy próbálja ki!
A szerzőkről
Peter Chung az AWS vállalati ügyfeleit kiszolgáló Solutions Architect. Szereti az ügyfeleknek segíteni a technológia használatában üzleti problémák megoldásában különféle témákban, például a költségek csökkentésében és a mesterséges intelligencia kihasználásában. Könyvet írt az AWS FinOpsról, és szívesen olvas és épít megoldásokat.
Neelam Koshiya az AWS vállalati megoldások tervezője. Jelenleg arra törekszik, hogy segítse a vállalati ügyfeleket a felhőbe való áttérésük során a stratégiai üzleti eredmények érdekében. Szabadidejében szeret olvasni és a szabadban lenni.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Autóipar / elektromos járművek, Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- ChartPrime. Emelje fel kereskedési játékát a ChartPrime segítségével. Hozzáférés itt.
- BlockOffsets. A környezetvédelmi ellentételezési tulajdon korszerűsítése. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/announcing-amazon-s3-access-point-support-for-amazon-sagemaker-data-wrangler/
- :is
- $ UP
- 1
- 100
- 13
- 15%
- 7
- 804
- a
- hozzáférés
- igénybe vett
- Fiókok
- át
- Akció
- hozzá
- címek
- adminisztrátorok
- Örökbefogadás
- Előny
- Minden termék
- lehetővé
- mentén
- Is
- amazon
- Amazon SageMaker
- Amazon SageMaker Data Wrangler
- Az Amazon Web Services
- an
- és a
- bejelent
- Bemutatjuk
- bármilyen
- alkalmaz
- alkalmazások
- mesterséges
- mesterséges intelligencia
- AS
- At
- csatolja
- elérhetőség
- AWS
- BE
- mert
- hogy
- könyv
- Épület
- üzleti
- by
- TUD
- eset
- esetek
- kihívások
- díjak
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- felhő
- felhő elfogadása
- Oszlop
- teljes
- bonyolult
- veszélyeztetése
- Konzol
- ellenőrzés
- kiadások
- teremt
- készítette
- Jelenlegi
- Ügyfelek
- vágás
- dátum
- adat hozzáférés
- Adatok előkészítése
- adat-tudomány
- adatmegosztás
- adatkészletek
- alapértelmezett
- meghatározott
- bizonyítani
- rendeltetési hely
- részletek
- különböző
- domain
- domainek
- le-
- csökkent
- Korábban
- könnyebb
- hatás
- eredményesen
- lehetővé téve
- ösztönzése
- Endpoint
- érvényesíteni
- Mérnöki
- belép
- Vállalkozás
- izgatott
- végrehajtás
- kutatás
- export
- Exponálás
- Arc
- megkönnyítése
- Funkció
- áramlási
- Összpontosít
- következik
- következő
- A
- ból ből
- további
- kap
- Ad
- nyújtó
- támogatások
- Legyen
- tekintettel
- he
- segít
- neki
- remény
- Hogyan
- How To
- azonban
- HTML
- HTTPS
- Identitás
- ütköztető
- importál
- importáló
- in
- Beleértve
- egyéni
- információ
- helyette
- utasítás
- Intelligencia
- kölcsönhatásba
- Felület
- Bevezetett
- IP
- IP-címeket
- IT
- ITS
- utazás
- jpg
- a későbbiekben
- szint
- erőfölény
- mint
- elhelyezkedés
- szeret
- Gyártás
- kezelése
- kezelése
- sok
- Marketing
- Menü
- több
- többszörös
- név
- Keresse
- Navigáció
- elengedhetetlen
- Szükség
- Új
- neves
- Most
- objektumok
- of
- gyakran
- on
- csak
- or
- szervezet
- szervezetek
- Más
- mi
- eredmények
- szabadban
- saját
- oldal
- üvegtábla
- alkatrészek
- Teljesít
- engedély
- engedélyek
- Plató
- Platón adatintelligencia
- PlatoData
- plusz
- pont
- pont
- Politikák
- politika
- állás
- jobban szeret
- előkészítés
- Készít
- előfeltételek
- megakadályozása
- problémák
- folyamat
- amely
- Inkább
- Olvasás
- kész
- csökkenteni
- csökkentő
- referenciái
- vidék
- régiók
- megmaradó
- eltávolítása
- forrás
- kapott
- Eredmények
- Kockázat
- Szerep
- szabályok
- futás
- sagemaker
- azonos
- Tudomány
- biztosan
- biztosítása
- biztonság
- kiválasztás
- érzékeny
- Szolgáltatások
- szolgáló
- beállítás
- beállítások
- megosztott
- megosztás
- ő
- kellene
- kimutatta,
- mutatott
- <p></p>
- Egyszerű
- egyszerűsítése
- egyszerűen
- egyetlen
- megoldások
- Megoldások
- SOLVE
- Megoldja
- néhány
- forrás
- különleges
- nyilatkozat
- Lépései
- megáll
- tárolás
- memorizált
- Stratégiai
- stratégiai üzlet
- Küzdelem
- stúdió
- támogatás
- biztos
- szabott
- Vesz
- csapat
- Technológia
- mint
- hogy
- A
- azok
- Őket
- Ezek
- ezt
- három
- Keresztül
- idő
- nak nek
- Ma
- Témakörök
- hagyományos
- transzformációk
- kettő
- egyedi
- nem úgy mint
- használ
- használati eset
- használt
- Felhasználók
- segítségével
- különféle
- változat
- megjelenítés
- végigjátszás
- we
- háló
- webes szolgáltatások
- bármi
- amikor
- ami
- míg
- val vel
- belül
- nélkül
- munkafolyamatok
- művek
- lenne
- írt
- te
- A te
- zephyrnet