Beginnen Sie mit der Open-Source-Distribution von Amazon SageMaker

Neuauflage von Plato

Verfolger: 0

Datenwissenschaftler benötigen eine konsistente und reproduzierbare Umgebung für maschinelles Lernen (ML) und Data-Science-Workloads, die die Verwaltung von Abhängigkeiten ermöglicht und sicher ist. AWS Deep Learning Container Bietet bereits vorgefertigte Docker-Images zum Trainieren und Bereitstellen von Modellen in gängigen Frameworks wie TensorFlow, PyTorch und MXNet. Um dieses Erlebnis zu verbessern, haben wir auf der JupyterCon 2023 eine öffentliche Beta der Open-Source-Distribution SageMaker angekündigt. Dies bietet eine einheitliche End-to-End-ML-Erfahrung für ML-Entwickler mit unterschiedlichem Fachwissen. Entwickler müssen nicht mehr zwischen verschiedenen Framework-Containern wechseln, um zu experimentieren oder von lokalen JupyterLab-Umgebungen und SageMaker-Notebooks zu Produktionsjobs auf SageMaker zu wechseln. Die Open-Source-SageMaker-Distribution unterstützt die gängigsten Pakete und Bibliotheken für Datenwissenschaft, ML und Visualisierung, wie TensorFlow, PyTorch, Scikit-learn, Pandas und Matplotlib. Sie können den Container ab dem verwenden Öffentliche Amazon ECR-Galerie Heute starten.

In diesem Beitrag zeigen wir Ihnen, wie Sie die SageMaker-Open-Source-Distribution nutzen können, um schnell in Ihrer lokalen Umgebung zu experimentieren und sie ganz einfach zu Jobs bei SageMaker zu machen.

Lösungsüberblick

In unserem Beispiel zeigen wir das Training eines Bildklassifizierungsmodells mit PyTorch. Wir benutzen das KMNIST Datensatz öffentlich auf PyTorch verfügbar. Wir trainieren ein neuronales Netzwerkmodell, testen die Leistung des Modells und drucken schließlich den Trainings- und Testverlust aus. Das vollständige Notizbuch für dieses Beispiel ist im verfügbar SageMaker Studio Lab-Beispiel-Repository. Wir beginnen mit dem Experimentieren auf einem lokalen Laptop unter Verwendung der Open-Source-Distribution und verschieben es dorthin Amazon SageMaker-Studio um eine größere Instanz zu verwenden, und planen Sie das Notebook dann als Notebook-Job.

Voraussetzungen:

Sie benötigen folgende Voraussetzungen:

Richten Sie Ihre lokale Umgebung ein

Sie können die Open-Source-Distribution direkt auf Ihrem lokalen Laptop nutzen. Um JupyterLab zu starten, führen Sie die folgenden Befehle auf Ihrem Terminal aus:

export ECR_IMAGE_ID='public.ecr.aws/sagemaker/sagemaker-distribution:latest-cpu'
docker run -it -p 8888:8888 --user `id -u`:`id -g` -v `pwd`/sample-notebooks:/home/sagemaker-user/sample-notebooks $ECR_IMAGE_ID jupyter-lab --no-browser --ip=0.0.0.0

Sie können ersetzen ECR_IMAGE_ID mit einem der in der verfügbaren Bild-Tags Öffentliche Amazon ECR-Galerie, oder wählen Sie die latest-gpu Tag, wenn Sie einen Computer verwenden, der GPU unterstützt.

Dieser Befehl startet JupyterLab und stellt eine URL auf dem Terminal bereit, z http://127.0.0.1:8888/lab?token=<token>. Kopieren Sie den Link und geben Sie ihn in Ihren bevorzugten Browser ein, um JupyterLab zu starten.

Studio einrichten

Studio ist eine durchgängige integrierte Entwicklungsumgebung (IDE) für ML, mit der Entwickler und Datenwissenschaftler ML-Modelle im großen Maßstab erstellen, trainieren, bereitstellen und überwachen können. Studio bietet eine umfangreiche Liste von Erstanbieter-Images mit gängigen Frameworks und Paketen wie Data Science, TensorFlow, PyTorch und Spark. Diese Bilder erleichtern Datenwissenschaftlern den Einstieg in ML, indem sie einfach ein Framework und einen Instanztyp ihrer Wahl für die Berechnung auswählen.

Sie können jetzt die SageMaker-Open-Source-Distribution in Studio mit Studio verwenden Bringen Sie Ihr eigenes Bild mit Besonderheit. Um die Open-Source-Distribution zu Ihrer SageMaker-Domäne hinzuzufügen, führen Sie die folgenden Schritte aus:

Fügen Sie die Open-Source-Distribution Ihrem Konto hinzu Amazon Elastic Container-Registrierung (Amazon ECR)-Repository, indem Sie die folgenden Befehle auf Ihrem Terminal ausführen:

# Use the latest-cpu or latest-gpu tag based on your requirements
export ECR_GALLERY_IMAGE_ID='sagemaker-distribution:latest-cpu'
export SAGEMAKER_IMAGE_NAME='sagemaker-runtime'
export SAGEMAKER_STUDIO_DOMAIN_ID='d-xxxx'
export SAGEMAKER_STUDIO_IAM_ROLE_ARN='<studio-default-execution-role-arn>' docker pull public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID export ECR_PRIVATE_REPOSITORY_NAME='sm-distribution'
export ECR_IMAGE_TAG='sagemaker-runtime-cpu'
export AWS_ACCOUNT_ID='0123456789'
export AWS_ECR_REPOSITORY_REGION='us-east-1' # create repository
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr create-repository --repository-name $ECR_PRIVATE_REPOSITORY_NAME
aws --region ${AWS_ECR_REPOSITORY_REGION} ecr get-login-password | docker login --username AWS --password-stdin ${AWS_ACCOUNT_ID}.dkr.ecr.${AWS_ECR_REPOSITORY_REGION}.amazonaws.com
export ECR_IMAGE_URI=$AWS_ACCOUNT_ID.dkr.ecr.$AWS_ECR_REPOSITORY_REGION.amazonaws.com/$ECR_PRIVATE_REPOSITORY_NAME:$ECR_IMAGE_TAG # Tag
docker tag public.ecr.aws/sagemaker/$ECR_GALLERY_IMAGE_ID $ECR_IMAGE_URI
# Push the image to your private repository
docker push $ECR_IMAGE_URI

Erstellen Sie ein SageMaker-Image und hängen Sie das Image an die Studio-Domäne an:

# Create a SageMaker image
aws sagemaker create-image --image-name $SAGEMAKER_IMAGE_NAME --role-arn $SAGEMAKER_STUDIO_IAM_ROLE_ARN
# Create a SageMaker Image Version.
aws sagemaker create-image-version --image-name $SAGEMAKER_IMAGE_NAME --base-image $ECR_IMAGE_URI # Optionally, describe the image version to ensure it's succesfully created
aws sagemaker describe-image-version --image-name $SAGEMAKER_IMAGE_NAME --version-number 1 # Create the app image configuration file
cat > /tmp/app-config.json << EOF
{ "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "KernelGatewayImageConfig": { "FileSystemConfig": { "DefaultGid": 100, "DefaultUid": 1000, "MountPath": "/home/sagemaker-user" }, "KernelSpecs": [ { "DisplayName": "Python 3 (ipykernel)", "Name": "python3" } ] }
}
EOF # Create an Amazon SageMaker App Image Config.
aws sagemaker create-app-image-config --cli-input-json file:///tmp/app-config.json # Create a default user settings file
# Update the file with your existing settings if you have additional custom images
cat > /tmp/default-user-settings.json << EOF
{ "DefaultUserSettings": { "KernelGatewayAppSettings": { "CustomImages": [ { "ImageName": "$SAGEMAKER_IMAGE_NAME", "AppImageConfigName": "app-image-config-$SAGEMAKER_IMAGE_NAME", "ImageVersionNumber": 1 } ] } }
}
EOF # Update Amazon SageMaker Domain with the new default User Settings.
aws sagemaker update-domain --domain-id $SAGEMAKER_STUDIO_DOMAIN_ID --cli-input-json file:///tmp/default-user-settings.json

Starten Sie Studio auf der SageMaker-Konsole, indem Sie Ihre Domäne und das vorhandene Benutzerprofil auswählen.
Optional können Sie Studio neu starten, indem Sie die Schritte unter befolgen Fahren Sie SageMaker Studio herunter und aktualisieren Sie es.

Domain-Details

Laden Sie das Notizbuch herunter

Laden Sie das Beispielnotizbuch lokal von herunter GitHub Repo.

Öffnen Sie das Notebook in der IDE Ihrer Wahl und fügen Sie am Anfang des zu installierenden Notebooks eine Zelle hinzu torchsummarydem „Vermischten Geschmack“. Seine torchsummary Das Paket ist nicht Teil der Distribution. Durch die Installation auf dem Notebook wird sichergestellt, dass das Notebook durchgängig läuft. Wir empfehlen die Verwendung conda or micromamba um Umgebungen und Abhängigkeiten zu verwalten. Fügen Sie dem Notizbuch die folgende Zelle hinzu und speichern Sie das Notizbuch:

%pip install torchsummary

Experimentieren Sie mit dem lokalen Notebook

Laden Sie das Notebook auf die von Ihnen gestartete JupyterLab-Benutzeroberfläche hoch, indem Sie das Upload-Symbol auswählen, wie im folgenden Screenshot gezeigt.

Upload-Datei

Starten Sie nach dem Hochladen das cv-kmnist.ipynb Notizbuch. Sie können sofort mit der Ausführung der Zellen beginnen, ohne Abhängigkeiten wie Torch, Matplotlib oder Ipywidgets installieren zu müssen.

Wenn Sie die vorherigen Schritte befolgt haben, sehen Sie, dass Sie die Distribution lokal von Ihrem Laptop aus verwenden können. Im nächsten Schritt verwenden wir dieselbe Distribution in Studio, um die Funktionen von Studio zu nutzen.

Verschieben Sie das Experiment nach Studio (optional)

Optional können wir das Experiment in Studio hochstufen. Einer der Vorteile von Studio besteht darin, dass die zugrunde liegenden Rechenressourcen vollständig elastisch sind, sodass Sie die verfügbaren Ressourcen problemlos erhöhen oder verringern können und die Änderungen automatisch im Hintergrund erfolgen, ohne Ihre Arbeit zu unterbrechen. Wenn Sie dasselbe Notebook von früher auf einem größeren Datensatz und einer größeren Recheninstanz ausführen möchten, können Sie zu Studio migrieren.

Navigieren Sie zur Studio-Benutzeroberfläche, die Sie zuvor gestartet haben, und wählen Sie das Upload-Symbol aus, um das Notizbuch hochzuladen.

Upload-Datei-Studio

Nachdem Sie das Notebook gestartet haben, werden Sie aufgefordert, das Image und den Instanztyp auszuwählen. Wählen Sie im Kernel-Launcher sagemaker-runtime wie das Bild und ein ml.t3.medium Beispiel, dann wählen Auswählen.

Bildstudio auswählen

Sie können das Notebook jetzt End-to-End ausführen, ohne dass Änderungen am Notebook von Ihrer lokalen Entwicklungsumgebung zu Studio-Notebooks erforderlich sind!

Planen Sie das Notebook als Job ein

Wenn Sie mit dem Experimentieren fertig sind, bietet SageMaker mehrere Optionen zur Produktion Ihres Notebooks, z. B. Trainingsjobs und SageMaker-Pipelines. Eine solche Option besteht darin, das Notebook selbst direkt als nicht interaktiven, geplanten Notebook-Job auszuführen SageMaker-Notebook-Jobs. Beispielsweise möchten Sie möglicherweise Ihr Modell regelmäßig neu trainieren oder regelmäßig Rückschlüsse auf eingehende Daten ziehen und Berichte zur Nutzung durch Ihre Stakeholder erstellen.

Wählen Sie in Studio das Notebook-Job-Symbol aus, um den Notebook-Job zu starten. Wenn Sie die Notebook-Jobs-Erweiterung lokal auf Ihrem Laptop installiert haben, können Sie das Notebook auch direkt von Ihrem Laptop aus planen. Sehen Installationsanleitung um die Notebook-Jobs-Erweiterung lokal einzurichten.

Zeitplan-Notebook-Job-Symbol

Der Notebook-Job verwendet automatisch den ECR-Image-URI der Open-Source-Distribution, sodass Sie den Notebook-Job direkt planen können.

Bild-NB-Job auswählen

Auswählen Termingerecht ausführen, wählen Sie einen Zeitplan, zum Beispiel jede Woche am Samstag, und wählen Sie Erstellen. Sie können auch wählen Lauf jetzt wenn Sie die Ergebnisse sofort sehen möchten.

Submit-NB-Job

Wenn der erste Notebook-Auftrag abgeschlossen ist, können Sie die Notebook-Ausgaben direkt über die Studio-Benutzeroberfläche anzeigen, indem Sie auf „ Notizbuch für Ausgabedateien.

Job-Ausgabe anzeigen

Weitere Überlegungen

Neben der direkten Nutzung des öffentlich verfügbaren ECR-Images für ML-Workloads bietet die Open-Source-Distribution folgende Vorteile:

Die zum Erstellen des Images verwendete Docker-Datei steht Entwicklern öffentlich zur Verfügung, damit sie ihre eigenen Images erkunden und erstellen können. Sie können dieses Image auch als Basisimage übernehmen und Ihre benutzerdefinierten Bibliotheken installieren, um eine reproduzierbare Umgebung zu erhalten.
Wenn Sie nicht mit Docker vertraut sind und lieber Conda-Umgebungen in Ihrer JupyterLab-Umgebung verwenden möchten, bieten wir eine an env.out Datei für jede der veröffentlichten Versionen. Mithilfe der Anweisungen in der Datei können Sie Ihre eigene Conda-Umgebung erstellen, die dieselbe Umgebung nachahmt. Sehen Sie sich beispielsweise die CPU-Umgebungsdatei an cpu.env.out.
Sie können die GPU-Versionen des Bildes verwenden, um GPU-kompatible Arbeitslasten wie Deep Learning und Bildverarbeitung auszuführen.

Aufräumen

Führen Sie die folgenden Schritte aus, um Ihre Ressourcen zu bereinigen:

Wenn Sie die Ausführung Ihres Notebooks nach einem Zeitplan geplant haben, pausieren oder löschen Sie den Zeitplan auf Notebook-Auftragsdefinitionen Tab, um zu vermeiden, dass Sie für zukünftige Jobs bezahlen müssen.
Beenden Sie alle Studio-Apps, um nicht für ungenutzte Rechennutzung bezahlen zu müssen. Sehen Fahren Sie Studio Apps herunter und aktualisieren Sie sie für weitere Instruktionen.
Löschen Sie optional die Studio-Domäne, falls Sie eine erstellt haben.

Zusammenfassung

Die Aufrechterhaltung einer reproduzierbaren Umgebung über verschiedene Phasen des ML-Lebenszyklus hinweg ist eine der größten Herausforderungen für Datenwissenschaftler und Entwickler. Mit der Open-Source-Distribution SageMaker stellen wir ein Image mit untereinander kompatiblen Versionen der gängigsten ML-Frameworks und -Pakete bereit. Die Distribution ist außerdem Open Source, was Entwicklern Transparenz über die Pakete und Build-Prozesse bietet und es einfacher macht, ihre eigene Distribution anzupassen.

In diesem Beitrag haben wir Ihnen gezeigt, wie Sie die Distribution in Ihrer lokalen Umgebung, in Studio und als Container für Ihre Schulungsaufgaben verwenden. Diese Funktion befindet sich derzeit in der öffentlichen Betaphase. Wir empfehlen Ihnen, dies auszuprobieren und Ihr Feedback und Ihre Probleme dazu mitzuteilen öffentliches GitHub-Repository!

Über die Autoren

Durga Sury ist ein ML Solutions Architect im Amazon SageMaker Service SA-Team. Es liegt ihr am Herzen, maschinelles Lernen für jedermann zugänglich zu machen. In ihren vier Jahren bei AWS hat sie beim Aufbau von KI/ML-Plattformen für Unternehmenskunden geholfen. Wenn sie nicht arbeitet, liebt sie Motorradfahrten, Kriminalromane und lange Spaziergänge mit ihrem 4-jährigen Husky.

Ketan Vijayvargiya ist Senior Software Development Engineer bei Amazon Web Services (AWS). Seine Schwerpunkte sind maschinelles Lernen, verteilte Systeme und Open Source. Außerhalb der Arbeit verbringt er seine Zeit gerne damit, selbst Gastgeber zu sein und die Natur zu genießen.

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
EVM-Finanzen. Einheitliche Schnittstelle für dezentrale Finanzen. Hier zugreifen.
Quantum Media Group. IR/PR verstärkt. Hier zugreifen.
PlatoAiStream. Web3-Datenintelligenz. Wissen verstärkt. Hier zugreifen.
Quelle: https://aws.amazon.com/blogs/machine-learning/get-started-with-the-open-source-amazon-sagemaker-distribution/

Zeitstempel: 8. Juni 2023

Zeitstempel: 8. Juni 2023

Neuauflage von Plato

Erstellen Sie mithilfe der Amazon SageMaker-Modellregistrierung einen kontoübergreifenden MLOps-Workflow

Identifizieren Sie potenzielle Ursachen in geschäftskritischen Anomalien mit Amazon Lookout for Metrics

Einführung in Fortuna: Eine Bibliothek zur Quantifizierung von Unsicherheiten

Einführung der Beliebtheitsoptimierung für ähnliche Artikel in Amazon Personalize | Amazon Web Services

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto