Amazon SageMaker többféle módot kínál az elosztott adatfeldolgozási feladatok futtatására az Apache Spark, a nagy adatfeldolgozás népszerű elosztott számítási keretrendszerével.
A Spark-alkalmazásokat interaktív módon futtathatja a webhelyről Amazon SageMaker Studio összekapcsolásával SageMaker Studio notebookok és AWS Glue Interactive Sessions Spark-feladatok futtatásához kiszolgáló nélküli fürttel. Az interaktív munkamenetekkel az Apache Spark vagy a Ray közül választhat a nagy adatkészletek egyszerű feldolgozásához, anélkül, hogy a fürtkezelés miatt kellene aggódnia.
Alternatív megoldásként, ha nagyobb szabályozásra van szüksége a környezet felett, használhat egy előre beépített SageMaker Spark tárolót a Spark-alkalmazások kötegelt feladatként történő futtatásához egy teljesen felügyelt elosztott fürtön. Amazon SageMaker feldolgozás. Ez a beállítás lehetővé teszi többféle példány kiválasztását (számításoptimalizált, memóriaoptimalizált stb.), a fürtben lévő csomópontok számát és a fürt konfigurációját, ezáltal nagyobb rugalmasságot tesz lehetővé az adatfeldolgozás és a modelltanítás terén.
Végül a Spark alkalmazásokat a Studio notebookok csatlakoztatásával futtathatja Amazon EMR klaszterek, vagy a Spark-fürt futtatásával Amazon rugalmas számítási felhő (Amazon EC2).
Mindezek a lehetőségek lehetővé teszik a Spark eseménynaplók létrehozását és tárolását, hogy elemezze azokat a webalapú felhasználói felületen keresztül, amelyet általában Spark UI, amely egy Spark History Servert futtat a Spark-alkalmazások előrehaladásának figyelésére, az erőforrás-használat nyomon követésére és a hibakeresési hibákra.
Ebben a bejegyzésben megosztjuk a megoldások a Spark History Server telepítéséhez és futtatásához a SageMaker Studio rendszeren, valamint a Spark felhasználói felület közvetlen eléréséhez a SageMaker Studio IDE-ből, a különböző AWS-szolgáltatások (AWS Glue Interactive Sessions, SageMaker Processing feladatok és Amazon EMR) által előállított és egy tárolóban tárolt Spark-naplók elemzéséhez. Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödör.
Megoldás áttekintése
A megoldás integrálja a Spark History Servert a SageMaker Studio Jupyter Server alkalmazásába. Ez lehetővé teszi a felhasználók számára, hogy közvetlenül a SageMaker Studio IDE-ből hozzáférjenek a Spark-naplókhoz. Az integrált Spark History Server a következőket támogatja:
- A SageMaker Processing Spark-feladatok által generált naplók elérése
- Az AWS Glue Spark alkalmazások által generált naplók elérése
- Az önállóan kezelt Spark-fürtök és az Amazon EMR által generált naplók elérése
Egy segédprogram parancssori felület (CLI) hívott sm-spark-cli
a Spark UI-val való interakcióhoz is rendelkezésre áll a SageMaker Studio rendszerterminálról. A sm-spark-cli
lehetővé teszi a Spark History Server kezelését a SageMaker Studio elhagyása nélkül.
A megoldás shell szkriptekből áll, amelyek a következő műveleteket hajtják végre:
- Telepítse a Sparkot a Jupyter szerveren a SageMaker Studio felhasználói profilokhoz vagy a SageMaker Studio megosztott területéhez
- Telepítse a
sm-spark-cli
felhasználói profilhoz vagy megosztott térhez
Telepítse manuálisan a Spark felhasználói felületet egy SageMaker Studio tartományban
A Spark UI SageMaker Studio szolgáltatásban való üzemeltetéséhez hajtsa végre a következő lépéseket:
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Rendszerterminál a SageMaker Studio indítójából.
- Futtassa a következő parancsokat a rendszerterminálon:
A parancsok végrehajtása néhány másodpercet vesz igénybe.
- Amikor a telepítés befejeződött, elindíthatja a Spark felhasználói felületet a mellékelt eszköz segítségével
sm-spark-cli
és elérheti egy webböngészőből a következő kód futtatásával:
sm-spark-cli start s3://DOC-EXAMPLE-BUCKET/<SPARK_EVENT_LOGS_LOCATION>
Az S3 hely, ahol a SageMaker Processing, az AWS Glue vagy az Amazon EMR által előállított eseménynaplókat tárolják, a Spark-alkalmazások futtatásakor konfigurálható.
SageMaker Studio notebookok és AWS Glue Interactive Sessions esetén a Spark eseménynapló helyét közvetlenül a notebookból állíthatja be a sparkmagic
kernel.
A sparkmagic
A kernel eszközöket tartalmaz a távoli Spark-fürtök notebookokon keresztüli interakciójához. varázslatot kínál (%spark
, %sql
) parancsokat a Spark kód futtatásához, SQL-lekérdezések végrehajtásához és a Spark-beállítások, például a végrehajtó memória és a magok konfigurálásához.
A SageMaker feldolgozási feladathoz közvetlenül a SageMaker Python SDK-ból konfigurálhatja a Spark eseménynapló helyét.
További információkért tekintse meg az AWS dokumentációját:
Kiválaszthatja a generált URL-t a Spark UI eléréséhez.
A következő képernyőképen a Spark UI példája látható.
A Spark History Server állapotát a segítségével ellenőrizheti sm-spark-cli status
parancsot a Studio System terminálon.
Szükség esetén leállíthatja a Spark History Servert is.
Automatizálja a Spark UI telepítését a SageMaker Studio tartomány felhasználói számára
Rendszergazdaként automatizálhatja a telepítést a SageMaker Studio felhasználói számára az a életciklus konfiguráció. Ez megtehető a SageMaker Studio domain alatti összes felhasználói profilnál vagy bizonyos profiloknál. Lát Az Amazon SageMaker Studio testreszabása az életciklus-konfigurációk segítségével fül alatt találsz.
Létrehozhat életciklus-konfigurációt a install-history-server.sh szkriptet, és csatolja egy meglévő SageMaker Studio tartományhoz. A telepítés a tartomány összes felhasználói profiljára fut.
A következővel konfigurált terminálról AWS parancssori interfész (AWS CLI) és a megfelelő engedélyekkel, futtassa a következő parancsokat:
A Jupyter Server újraindítása után a Spark UI és a sm-spark-cli
elérhető lesz a SageMaker Studio környezetben.
Tisztítsuk meg
Ebben a részben bemutatjuk, hogyan tisztíthatja meg a Spark felhasználói felületet egy SageMaker Studio tartományban, akár manuálisan, akár automatikusan.
Manuálisan távolítsa el a Spark felhasználói felületet
A Spark felhasználói felület manuális eltávolításához a SageMaker Studio alkalmazásban hajtsa végre a következő lépéseket:
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Rendszerterminál a SageMaker Studio indítójában.
- Futtassa a következő parancsokat a rendszerterminálon:
Távolítsa el automatikusan a Spark UI-t az összes SageMaker Studio felhasználói profilból
A Spark UI automatikus eltávolításához a SageMaker Studio összes felhasználói profiljához, hajtsa végre a következő lépéseket:
- A SageMaker konzolon válassza a lehetőséget Domains a navigációs ablakban, majd válassza ki a SageMaker Studio tartományt.
- A domain részleteinek oldalán navigáljon a Környezet Tab.
- Válassza ki a Spark UI életciklus-konfigurációját a SageMaker Studio alkalmazásban.
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a Leválasztás.
- Törölje és indítsa újra a Jupyter Server alkalmazásokat a SageMaker Studio felhasználói profilokhoz.
Következtetés
Ebben a bejegyzésben megosztottunk egy megoldást, amellyel gyorsan telepítheti a Spark UI-t a SageMaker Studio-ban. A SageMakeren tárolt Spark felhasználói felülettel a gépi tanulási (ML) és adatmérnöki csapatok méretezhető számítási felhő segítségével bárhonnan hozzáférhetnek és elemezhetik a Spark-naplókat, és felgyorsíthatják projektjeik megvalósítását. Az informatikai rendszergazdák szabványosíthatják és felgyorsíthatják a megoldás kiépítését a felhőben, és elkerülhetik az egyéni fejlesztői környezetek elterjedését az ML projektekhez.
A bejegyzés részeként megjelenő összes kód elérhető a GitHub tárház.
A szerzőkről
Giuseppe Angelo Porcelli az Amazon Web Services vezető gépi tanulási specialistája. Több éves szoftverfejlesztéssel és ML háttérrel dolgozik bármilyen méretű ügyféllel, hogy megértse üzleti és műszaki igényeiket, és olyan AI és ML megoldásokat tervezzen, amelyek a lehető legjobban használják ki az AWS Cloud és az Amazon Machine Learning veremét. Különböző területeken dolgozott projekteken, beleértve az MLOps-t, a számítógépes látást és az NLP-t, amelyek az AWS-szolgáltatások széles körét foglalják magukban. Szabadidejében Giuseppe szívesen focizik.
Bruno Pistone a milánói székhelyű AWS AI/ML Specialist Solutions Architect. Bármilyen méretű ügyfelekkel dolgozik, segít nekik megérteni műszaki igényeiket, és olyan AI és ML megoldásokat tervezni, amelyek a lehető legjobban használják ki az AWS Cloud és az Amazon Machine Learning veremét. Szakterülete magában foglalja a gépi tanulás végpontokig, a gépi tanulás végtrializációját és a generatív AI-t. Szívesen tölt időt barátaival és új helyeket fedez fel, valamint új úti célokra utazik.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Autóipar / elektromos járművek, Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- BlockOffsets. A környezetvédelmi ellentételezési tulajdon korszerűsítése. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/host-the-spark-ui-on-amazon-sagemaker-studio/
- :van
- :is
- :ahol
- $ UP
- 1
- 100
- 12
- 7
- 8
- 9
- a
- Rólunk
- hozzáférés
- Hozzáférés
- cselekvések
- További
- további információ
- admin
- AI
- AI / ML
- Minden termék
- lehetővé
- lehetővé teszi, hogy
- Is
- amazon
- Amazon EC2
- Amazon EMR
- Amazon gépi tanulás
- Amazon SageMaker
- Amazon SageMaker Studio
- Az Amazon Web Services
- an
- elemez
- elemzése
- és a
- bármilyen
- bárhol
- Apache
- app
- alkalmazások
- megfelelő
- alkalmazások
- VANNAK
- AS
- csatolja
- automatizált
- automatikusan
- elérhető
- elkerülése érdekében
- AWS
- AWS ragasztó
- háttér
- alapján
- BE
- BEST
- Nagy
- Big adatok
- széles
- böngésző
- üzleti
- by
- hívott
- TUD
- CD
- ellenőrizze
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- felhő
- Fürt
- kód
- általában
- teljes
- Kiszámít
- számítógép
- Számítógépes látás
- számítástechnika
- Configuration
- konfigurálva
- Csatlakozó
- áll
- Konzol
- Konténer
- tartalmaz
- ellenőrzés
- teremt
- szokás
- Ügyfelek
- dátum
- adatfeldolgozás
- adatkészletek
- kézbesítés
- Design
- úticél
- részletek
- Fejlesztés
- különböző
- közvetlenül
- megosztott
- elosztott számítástechnika
- dokumentáció
- domain
- domainek
- csinált
- könnyen
- bármelyik
- lehetővé teszi
- lehetővé téve
- végén
- Mérnöki
- Környezet
- környezetek
- hibák
- esemény
- példa
- létező
- gyors
- Feltárása
- kevés
- mező
- Rugalmasság
- következő
- Futball
- A
- Keretrendszer
- Ingyenes
- barátok
- ból ből
- teljesen
- generál
- generált
- nemző
- Generatív AI
- nagyobb
- he
- segít
- övé
- történelem
- vendéglátó
- házigazdája
- Hogyan
- How To
- HTML
- http
- HTTPS
- if
- in
- magában foglalja a
- Beleértve
- információ
- telepíteni
- telepítés
- telepítése
- integrált
- integrál
- kölcsönható
- interaktív
- Felület
- bele
- bevonásával
- IT
- Munka
- Állások
- jpg
- nagy
- tanulás
- kilépő
- életciklus
- mint
- vonal
- elhelyezkedés
- log
- gép
- gépi tanulás
- mágia
- csinál
- sikerült
- vezetés
- kezelése
- kézzel
- Memory design
- MILAN
- ML
- MLOps
- modell
- monitor
- több
- Nevezett
- Keresse
- Navigáció
- Szükség
- szükséges
- igények
- Új
- NLP
- csomópontok
- jegyzetfüzet
- szám
- of
- Ajánlatok
- on
- azok
- optimalizált
- opció
- Opciók
- or
- felett
- oldal
- üvegtábla
- rész
- Teljesít
- engedélyek
- Helyek
- Plató
- Platón adatintelligencia
- PlatoData
- játék
- Népszerű
- állás
- Fő
- folyamat
- feldolgozás
- Készült
- profil
- Profilok
- Haladás
- program
- projektek
- feltéve,
- Piton
- lekérdezések
- gyorsan
- RAY
- távoli
- forrás
- futás
- futás
- fut
- sagemaker
- skálázható
- szkriptek
- sdk
- másodperc
- Rész
- lát
- vagy szerver
- Szolgáltatások
- ülések
- készlet
- beállítások
- számos
- Megosztás
- megosztott
- Héj
- előadás
- mutatott
- Műsorok
- Egyszerű
- Méret
- szoftver
- szoftverfejlesztés
- megoldások
- Megoldások
- Szikra
- szakember
- különleges
- sebesség
- Költési
- verem
- kezdet
- Állapot
- Lépései
- megáll
- tárolás
- tárolni
- memorizált
- stúdió
- Támogatja
- rendszer
- Vesz
- csapat
- Műszaki
- terminál
- hogy
- A
- azok
- Őket
- akkor
- ezáltal
- Ezek
- ezt
- Keresztül
- idő
- nak nek
- szerszámok
- vágány
- Képzések
- Utazó
- típusok
- ui
- alatt
- megért
- URL
- Használat
- használ
- használó
- felhasználói felület
- Felhasználók
- segítségével
- hasznosság
- látomás
- módon
- we
- háló
- webböngésző
- webes szolgáltatások
- web-alapú
- JÓL
- amikor
- ami
- lesz
- val vel
- nélkül
- dolgozott
- művek
- év
- te
- A te
- zephyrnet