Fördern Sie Pipelines in einem Multi-Umgebungs-Setup mit Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub und Jenkins CI/CD

Neuauflage von Plato

Verfolger: 0

Der Aufbau einer Machine Learning Operations (MLOps)-Plattform in der sich schnell entwickelnden Landschaft der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) für Unternehmen ist von entscheidender Bedeutung, um die Lücke zwischen datenwissenschaftlichen Experimenten und der Bereitstellung nahtlos zu schließen und gleichzeitig die Anforderungen an die Modellleistung zu erfüllen. Sicherheit und Compliance.

Um regulatorische und Compliance-Anforderungen zu erfüllen, sind die wichtigsten Anforderungen bei der Gestaltung einer solchen Plattform:

Adressdatendrift
Überwachen Sie die Modellleistung
Erleichtern Sie die automatische Neuschulung von Modellen
Stellen Sie einen Prozess zur Modellgenehmigung bereit
Bewahren Sie Modelle in einer sicheren Umgebung auf

In diesem Beitrag zeigen wir, wie Sie ein MLOps-Framework erstellen, um diese Anforderungen zu erfüllen und dabei eine Kombination aus AWS-Diensten und Toolsets von Drittanbietern zu verwenden. Die Lösung umfasst ein Multi-Umgebungs-Setup mit automatisierter Modellumschulung, Batch-Inferenz und Überwachung mit Amazon SageMaker-Modellmonitor, Modellversionierung mit SageMaker-Modellregistrierungund eine CI/CD-Pipeline, um die umgebungsübergreifende Förderung von ML-Code und Pipelines durch die Verwendung zu erleichtern Amazon Sage Maker, Amazon EventBridge, Amazon Simple Notification Service (Amazon S3), HashiCorp Terraform, GitHub und Jenkins CI/CD. Wir erstellen ein Modell, um den Schweregrad (gutartig oder bösartig) einer mit dem trainierten mammografischen Raumforderung vorherzusagen XGBoost-Algorithmus Nutzung der öffentlich zugänglichen UCI Mammographie-Messe Datensatz erstellen und mithilfe des MLOps-Frameworks bereitstellen. Die vollständigen Anweisungen mit Code finden Sie im GitHub-Repository.

Lösungsüberblick

Das folgende Architekturdiagramm zeigt einen Überblick über das MLOps-Framework mit den folgenden Schlüsselkomponenten:

Multi-Account-Strategie – Zwei verschiedene Umgebungen (dev und prod) werden in zwei verschiedenen AWS-Konten gemäß den Best Practices von AWS Well-Architected eingerichtet, und ein drittes Konto wird in der zentralen Modellregistrierung eingerichtet:
- Entwicklungsumgebung – Wo ein Amazon SageMaker Studio-Domäne ist so eingerichtet, dass Modellentwicklung, Modelltraining und Testen von ML-Pipelines (Training und Inferenz) möglich sind, bevor ein Modell für die Weiterleitung in höhere Umgebungen bereit ist.
- Produktionsumgebung – Wo die ML-Pipelines von dev als erster Schritt hochgestuft und im Laufe der Zeit geplant und überwacht werden.
- Zentrale Modellregistrierung - Amazon SageMaker-Modellregistrierung wird in einem separaten AWS-Konto eingerichtet, um die in den Entwicklungs- und Produktionsumgebungen generierten Modellversionen zu verfolgen.
CI/CD und Quellcodeverwaltung – Die umgebungsübergreifende Bereitstellung von ML-Pipelines erfolgt über die mit Jenkins eingerichtete CI/CD, zusammen mit der Versionskontrolle über GitHub. Codeänderungen, die mit dem Git-Zweig der entsprechenden Umgebung zusammengeführt werden, lösen einen CI/CD-Workflow aus, um entsprechende Änderungen an der angegebenen Zielumgebung vorzunehmen.
Chargenvorhersagen mit Modellüberwachung – Die Inferenzpipeline, die mit erstellt wurde Amazon SageMaker-Pipelines Läuft auf geplanter Basis, um Vorhersagen zu generieren, zusammen mit der Modellüberwachung mithilfe von SageMaker Model Monitor, um Datenabweichungen zu erkennen.
Automatisierter Umschulungsmechanismus – Die mit SageMaker Pipelines erstellte Trainingspipeline wird immer dann ausgelöst, wenn eine Datendrift in der Inferenzpipeline erkannt wird. Nach dem Training wird das Modell im zentralen Modellregister registriert, um von einem Modellgenehmiger genehmigt zu werden. Nach der Genehmigung wird die aktualisierte Modellversion verwendet, um Vorhersagen über die Inferenzpipeline zu generieren.
Infrastruktur als Code – Die Infrastruktur als Code (IaC), erstellt mit HashiCorp Terraform, unterstützt die Planung der Inferenzpipeline mit EventBridge und das Auslösen der Zugpipeline basierend auf einer EventBridge-Regel und Senden von Benachrichtigungen mit Amazon Simple Notification Service (Amazon SNS) Themen.

mlops-Architektur

Der MLOps-Workflow umfasst die folgenden Schritte:

Greifen Sie im Entwicklungskonto auf die SageMaker Studio-Domäne zu, klonen Sie das GitHub-Repository, durchlaufen Sie den Prozess der Modellentwicklung mithilfe des bereitgestellten Beispielmodells und generieren Sie die Zug- und Inferenzpipelines.
Führen Sie die Train-Pipeline im Entwicklungskonto aus, die die Modellartefakte für die trainierte Modellversion generiert und das Modell in der SageMaker-Modellregistrierung im zentralen Modellregistrierungskonto registriert.
Genehmigen Sie das Modell in der SageMaker-Modellregistrierung im zentralen Modellregistrierungskonto.
Schieben Sie den Code (Train- und Inferenzpipelines sowie den Terraform-IaC-Code zum Erstellen des EventBridge-Zeitplans, der EventBridge-Regel und des SNS-Themas) in einen Feature-Branch des GitHub-Repositorys. Erstellen Sie eine Pull-Anfrage, um den Code im Hauptzweig des GitHub-Repositorys zusammenzuführen.
Lösen Sie die Jenkins CI/CD-Pipeline aus, die mit dem GitHub-Repository eingerichtet wird. Die CI/CD-Pipeline stellt den Code im Produktkonto bereit, um die Zug- und Inferenzpipelines zusammen mit Terraform-Code zu erstellen, um den EventBridge-Zeitplan, die EventBridge-Regel und das SNS-Thema bereitzustellen.
Die Inferenzpipeline soll täglich ausgeführt werden, während die Zugpipeline so eingerichtet ist, dass sie immer dann ausgeführt wird, wenn eine Datendrift aus der Inferenzpipeline erkannt wird.
Benachrichtigungen werden über das SNS-Thema gesendet, wenn ein Fehler in der Zug- oder Inferenzpipeline auftritt.

Voraussetzungen:

Für diese Lösung sollten Sie die folgenden Voraussetzungen erfüllen:

Drei AWS-Konten (Dev-, Prod- und Central Model Registry-Konten)
Eine SageMaker Studio-Domäne, die in jedem der drei AWS-Konten eingerichtet ist (siehe Onboard zu Amazon SageMaker Studio oder schau dir das Video an Schnell an Bord von Amazon SageMaker Studio für Einrichtungsanweisungen)
Jenkins (wir verwenden Jenkins 2.401.1) mit Administratorrechten auf AWS installiert
Terraform Version 1.5.5 oder höher auf dem Jenkins-Server installiert

Für diesen Beitrag arbeiten wir in der us-east-1 Region, in der die Lösung bereitgestellt werden soll.

Stellen Sie KMS-Schlüssel in Entwicklungs- und Produktkonten bereit

Unser erster Schritt ist das Schaffen AWS-Schlüsselverwaltungsservice (AWS KMS)-Schlüssel in den Dev- und Prod-Konten.

Erstellen Sie einen KMS-Schlüssel im Entwicklerkonto und gewähren Sie Zugriff auf das Produktkonto

Führen Sie die folgenden Schritte aus, um einen KMS-Schlüssel im Entwicklerkonto zu erstellen:

Wählen Sie in der AWS KMS-Konsole aus Vom Kunden verwaltete Schlüssel im Navigationsbereich.
Auswählen Schlüssel erstellen.
Aussichten für SchlüsselartWählen Symmetrisch.
Aussichten für SchlüsselverwendungWählen Verschlüsseln und entschlüsseln.
Auswählen Weiter.
Geben Sie die Nummer des Produktionskontos ein, um dem Produktionskonto Zugriff auf den im Entwicklungskonto bereitgestellten KMS-Schlüssel zu gewähren. Dies ist ein erforderlicher Schritt, da die Modellartefakte beim ersten Training des Modells im Entwicklungskonto mit dem KMS-Schlüssel verschlüsselt werden, bevor sie in den S3-Bucket im zentralen Modellregistrierungskonto geschrieben werden. Das Produktionskonto benötigt Zugriff auf den KMS-Schlüssel, um die Modellartefakte zu entschlüsseln und die Inferenzpipeline auszuführen.
Auswählen Weiter und schließen Sie die Erstellung Ihres Schlüssels ab.

Nachdem der Schlüssel bereitgestellt wurde, sollte er auf der AWS KMS-Konsole sichtbar sein.

km-Taste auf der Konsole

Erstellen Sie einen KMS-Schlüssel im Produktkonto

Führen Sie die gleichen Schritte im vorherigen Abschnitt durch, um einen vom Kunden verwalteten KMS-Schlüssel im Produktkonto zu erstellen. Sie können den Schritt zum Teilen des KMS-Schlüssels mit einem anderen Konto überspringen.

Richten Sie einen S3-Bucket für Modellartefakte im zentralen Modellregistrierungskonto ein

Erstellen Sie mit der Zeichenfolge einen S3-Bucket Ihrer Wahl sagemaker in der Namenskonvention als Teil des Bucket-Namens im zentralen Modellregistrierungskonto und aktualisieren Sie die Bucket-Richtlinie für den S3-Bucket, um Berechtigungen sowohl vom Dev- als auch vom Prod-Konto zum Lesen und Schreiben von Modellartefakten in den S3-Bucket zu erteilen.

Der folgende Code ist die Bucket-Richtlinie, die im S3-Bucket aktualisiert werden soll:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPerm", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm1", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] }, { "Sid": "AddPerm2", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm3", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Richten Sie IAM-Rollen in Ihren AWS-Konten ein

Der nächste Schritt ist die Einrichtung AWS Identity and Access Management and (IAM)-Rollen in Ihren AWS-Konten mit Berechtigungen für AWS Lambda, SageMaker und Jenkins.

Lambda-Ausführungsrolle

Einrichten Lambda-Ausführungsrollen in den Dev- und Prod-Konten, die von der Lambda-Funktion verwendet werden, die als Teil des ausgeführt wird SageMaker Pipelines Lambda-Schritt. Dieser Schritt wird von der Inferenzpipeline ausgeführt, um das neueste genehmigte Modell abzurufen, anhand dessen Inferenzen generiert werden. Erstellen Sie IAM-Rollen in den Entwicklungs- und Produktionskonten mit der Namenskonvention arn:aws:iam::<account-id>:role/lambda-sagemaker-role und hängen Sie die folgenden IAM-Richtlinien an:

Richtlinie 1 – Erstellen Sie eine Inline-Richtlinie mit dem Namen cross-account-model-registry-access, das den Zugriff auf das Modellpaket ermöglicht, das in der Modellregistrierung im zentralen Konto eingerichtet ist:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:ListModelPackages", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package/mammo-severity-model-package/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": "sagemaker:DescribeModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Richtlinie 2 - Anfügen AmazonSageMakerFullAccess, das ist ein Von AWS verwaltete Richtlinie die vollen Zugriff auf SageMaker gewährt. Es bietet auch ausgewählten Zugriff auf verwandte Dienste, wie z Automatische Skalierung von AWS-Anwendungen, Amazon S3, Amazon Elastic Container-Registrierung (Amazon ECR) und Amazon CloudWatch-Protokolle.
Richtlinie 3 - Anfügen AWSLambda_FullAccessDabei handelt es sich um eine von AWS verwaltete Richtlinie, die vollständigen Zugriff auf Lambda, Lambda-Konsolenfunktionen und andere verwandte AWS-Dienste gewährt.

Richtlinie 4 – Verwenden Sie die folgende IAM-Vertrauensrichtlinie für die IAM-Rolle:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "lambda.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

SageMaker-Ausführungsrolle

Den in den Dev- und Prod-Konten eingerichteten SageMaker Studio-Domänen sollte jeweils eine Ausführungsrolle zugeordnet sein, die auf der zu finden ist Domain-Einstellungen Klicken Sie auf der Seite mit den Domänendetails auf die Registerkarte, wie im folgenden Screenshot gezeigt. Diese Rolle wird zum Ausführen von Trainingsjobs, Verarbeitungsjobs und mehr innerhalb der SageMaker Studio-Domäne verwendet.

Sagemaker Studio-Domäne

Fügen Sie der SageMaker-Ausführungsrolle in beiden Konten die folgenden Richtlinien hinzu:

Richtlinie 1 – Erstellen Sie eine Inline-Richtlinie mit dem Namen cross-account-model-artifacts-s3-bucket-access, der Zugriff auf den S3-Bucket im zentralen Modellregistrierungskonto gewährt, in dem die Modellartefakte gespeichert sind:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Richtlinie 2 – Erstellen Sie eine Inline-Richtlinie mit dem Namen cross-account-model-registry-access, das den Zugriff auf das Modellpaket in der Modellregistrierung im zentralen Modellregistrierungskonto ermöglicht:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:CreateModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Richtlinie 3 – Erstellen Sie eine Inline-Richtlinie mit dem Namen kms-key-access-policy, der Zugriff auf den im vorherigen Schritt erstellten KMS-Schlüssel ermöglicht. Geben Sie die Konto-ID an, in der die Richtlinie erstellt wird, und die KMS-Schlüssel-ID, die in diesem Konto erstellt wurde.
```
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInThisAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<account-id>:key/<kms-key-id>" } ]
}
```
Richtlinie 4 - Anfügen AmazonSageMakerFullAccess, das ist ein Von AWS verwaltete Richtlinie Dies gewährt vollständigen Zugriff auf SageMaker und ausgewählten Zugriff auf zugehörige Dienste.
Richtlinie 5 - Anfügen AWSLambda_FullAccessDabei handelt es sich um eine von AWS verwaltete Richtlinie, die vollständigen Zugriff auf Lambda, Lambda-Konsolenfunktionen und andere verwandte AWS-Dienste gewährt.
Richtlinie 6 - Anfügen CloudWatchEventsFullAccess, eine von AWS verwaltete Richtlinie, die vollen Zugriff auf CloudWatch Events gewährt.

Richtlinie 7 – Fügen Sie die folgende IAM-Vertrauensrichtlinie für die SageMaker-Ausführungs-IAM-Rolle hinzu:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "events.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

Richtlinie 8 (spezifisch für die SageMaker-Ausführungsrolle im Produktkonto) – Erstellen Sie eine Inline-Richtlinie mit dem Namen cross-account-kms-key-access-policy, der Zugriff auf den KMS-Schlüssel ermöglicht, der im Entwicklerkonto erstellt wurde. Dies ist erforderlich, damit die Inferenzpipeline Modellartefakte lesen kann, die im zentralen Modellregistrierungskonto gespeichert sind. Dort werden die Modellartefakte mithilfe des KMS-Schlüssels aus dem Entwicklungskonto verschlüsselt, wenn die erste Version des Modells über das Entwicklungskonto erstellt wird.
```
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInDevAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<dev-account-id>:key/<dev-kms-key-id>" } ]
}
```

Kontoübergreifende Jenkins-Rolle

Richten Sie eine IAM-Rolle mit dem Namen ein cross-account-jenkins-role im Produktkonto, von dem Jenkins annimmt, dass es ML-Pipelines und die entsprechende Infrastruktur im Produktkonto bereitstellt.

Fügen Sie der Rolle die folgenden verwalteten IAM-Richtlinien hinzu:

CloudWatchFullAccess
AmazonS3FullAccess
AmazonSNSFullAccess
AmazonSageMakerFullAccess
AmazonEventBridgeFullAccess
AWSLambda_FullAccess

Aktualisieren Sie die Vertrauensbeziehung für die Rolle, um Berechtigungen für das AWS-Konto zu erteilen, das den Jenkins-Server hostet:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com", "AWS": "arn:aws:iam::<jenkins-account-id>:root" }, "Action": "sts:AssumeRole", "Condition": {} } ]
}

Aktualisieren Sie die Berechtigungen für die IAM-Rolle, die dem Jenkins-Server zugeordnet ist

Unter der Annahme, dass Jenkins auf AWS eingerichtet wurde, aktualisieren Sie die mit Jenkins verknüpfte IAM-Rolle, um die folgenden Richtlinien hinzuzufügen, die Jenkins Zugriff zum Bereitstellen der Ressourcen im Produktkonto gewähren:

Richtlinie 1 – Erstellen Sie die folgende Inline-Richtlinie mit dem Namen assume-production-role-policy:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sts:AssumeRole", "Resource": "arn:aws:iam::<prod-account-id>:role/cross-account-jenkins-role" } ]
}

Richtlinie 2 - Hänge an CloudWatchFullAccess verwaltete IAM-Richtlinie.

Richten Sie die Modellpaketgruppe im zentralen Modellregistrierungskonto ein

Erstellen Sie in der SageMaker Studio-Domäne im zentralen Modellregistrierungskonto eine Modellpaketgruppe mit dem Namen mammo-severity-model-package Verwenden Sie den folgenden Codeausschnitt (den Sie mit einem Jupyter-Notebook ausführen können):

import boto3 model_package_group_name = "mammo-severity-model-package"
sm_client = boto3.Session().client("sagemaker") create_model_package_group_response = sm_client.create_model_package_group( ModelPackageGroupName=model_package_group_name, ModelPackageGroupDescription="Cross account model package group for mammo severity model", ) print('ModelPackageGroup Arn : {}'.format(create_model_package_group_response['ModelPackageGroupArn']))

Richten Sie den Zugriff auf das Modellpaket für IAM-Rollen in den Dev- und Prod-Konten ein

Gewähren Sie Zugriff auf die SageMaker-Ausführungsrollen, die in den Dev- und Prod-Konten erstellt wurden, damit Sie Modellversionen innerhalb des Modellpakets registrieren können mammo-severity-model-package im zentralen Modellregister aus beiden Konten. Führen Sie in der SageMaker Studio-Domäne im zentralen Modellregistrierungskonto den folgenden Code in einem Jupyter-Notebook aus:

import json import boto3 model_package_group_name = "mammo-severity-model-package"
# Convert the policy from JSON dict to string
model_package_group_policy = dict(
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPermModelPackageGroupCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackageGroup" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package-group/mammo-severity-model-package" }, { "Sid": "AddPermModelPackageVersionCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackage", "sagemaker:ListModelPackages", "sagemaker:UpdateModelPackage", "sagemaker:CreateModelPackage", "sagemaker:CreateModel" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package/mammo-severity-model-package/*" } ]
})
model_package_group_policy = json.dumps(model_package_group_policy)
# Add Policy to the model package group
sm_client = boto3.Session().client("sagemaker")
response = sm_client.put_model_package_group_policy( ModelPackageGroupName = model_package_group_name, ResourcePolicy = model_package_group_policy)

Richten Sie Jenkins ein

In diesem Abschnitt konfigurieren wir Jenkins, um die ML-Pipelines und die entsprechende Terraform-Infrastruktur im Produktkonto über die Jenkins CI/CD-Pipeline zu erstellen.

Erstellen Sie in der CloudWatch-Konsole eine Protokollgruppe mit dem Namen jenkins-log innerhalb des Produktkontos, an das Jenkins Protokolle aus der CI/CD-Pipeline pusht. Die Protokollgruppe sollte in derselben Region erstellt werden, in der der Jenkins-Server eingerichtet ist.
Installieren Sie die folgenden Plugins auf Ihrem Jenkins-Server:
1. Job DSL
2. Git
3. Pipeline
4. Pipeline: AWS-Schritte
5. Schritte des Pipeline-Dienstprogramms
Richten Sie AWS-Anmeldeinformationen in Jenkins mithilfe der kontoübergreifenden IAM-Rolle ein (cross-account-jenkins-role), die im Produktkonto bereitgestellt werden.
Aussichten für Systemkonfiguration, wählen AWS.
Geben Sie die Anmeldeinformationen und die CloudWatch-Protokollgruppe an, die Sie zuvor erstellt haben.
Richten Sie GitHub-Anmeldeinformationen in Jenkins ein.
Erstellen Sie ein neues Projekt in Jenkins.
Geben Sie einen Projektnamen ein und wählen Sie aus Pipeline.
Auf dem Allgemeines Registerkarte, wählen Sie GitHub-Projekt und betreten Sie die Gabelung GitHub-Repository URL.
Auswählen Dieses Projekt ist parametrisiert.
Auf dem Parameter hinzufügen Menü, wählen Sie String-Parameter.
Aussichten für Name und Vorname, eingeben prodAccount.
Aussichten für StandardwertGeben Sie die Produktkonto-ID ein.
Der Erweiterte ProjektoptionenZ. DefinitionWählen Pipeline-Skript von SCM.
Aussichten für SCM, wählen Git.
Aussichten für Repository-URL, geben Sie die Gabelung ein GitHub-Repository URL.
Aussichten für ReferenzenGeben Sie die in Jenkins gespeicherten GitHub-Anmeldeinformationen ein.
Enter main der Filialen zum Bauen Abschnitt, auf dessen Grundlage die CI/CD-Pipeline ausgelöst wird.
Aussichten für Skriptpfad, eingeben Jenkinsfile.
Auswählen Speichern.

Die Jenkins-Pipeline sollte erstellt und auf Ihrem Dashboard sichtbar sein.

Stellen Sie S3-Buckets bereit, sammeln und bereiten Sie Daten vor

Führen Sie die folgenden Schritte aus, um Ihre S3-Buckets und -Daten einzurichten:

Erstellen Sie mit der Zeichenfolge einen S3-Bucket Ihrer Wahl sagemaker in der Namenskonvention als Teil des Bucket-Namens in Entwicklungs- und Produktionskonten zum Speichern von Datensätzen und Modellartefakten.
Richten Sie einen S3-Bucket ein, um den Terraform-Status im Produktkonto beizubehalten.
Laden Sie die öffentlich verfügbare Datei herunter und speichern Sie sie UCI Mammographie-Messe Datensatz in den S3-Bucket, den Sie zuvor im Entwicklerkonto erstellt haben.
Verzweigen und klonen Sie die GitHub-Repository innerhalb der SageMaker Studio-Domäne im Entwicklerkonto. Das Repo hat die folgende Ordnerstruktur:
- /environments – Konfigurationsskript für die Produktionsumgebung
- /mlops-infra – Code für die Bereitstellung von AWS-Diensten mithilfe von Terraform-Code
- /Pipelines – Code für SageMaker-Pipeline-Komponenten
- Jenkins-Datei – Skript zur Bereitstellung über die Jenkins CI/CD-Pipeline
- setup.py – Wird benötigt, um die erforderlichen Python-Module zu installieren und den Befehl „run-pipeline“ zu erstellen
- mammography-severity-modeling.ipynb – Ermöglicht Ihnen das Erstellen und Ausführen des ML-Workflows
Erstellen Sie im geklonten GitHub-Repository-Ordner einen Ordner mit dem Namen „data“ und speichern Sie eine Kopie des öffentlich verfügbaren Ordners UCI Mammographie-Messe Datensatz.
Folgen Sie dem Jupyter-Notizbuch mammography-severity-modeling.ipynb.

Führen Sie den folgenden Code im Notebook aus, um den Datensatz vorzuverarbeiten und ihn in den S3-Bucket im Entwicklerkonto hochzuladen:

import boto3
import sagemaker
import numpy as np
import pandas as pd
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler, OneHotEncoder #Replace the values based on the resoures created
default_bucket = "<s3-bucket-in-dev-account>"
model_artifacts_bucket = "<s3-bucket-in-central-model-registry-account>"
region = "us-east-1"
model_name = "mammography-severity-model"
role = sagemaker.get_execution_role()
lambda_role = "arn:aws:iam::<dev-account-id>:role/lambda-sagemaker-role"
kms_key = "arn:aws:kms:us-east-1:<dev-account-id>:key/<kms-key-id-in-dev-account>"
model_package_group_name="arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" feature_columns_names = [ 'BIRADS', 'Age', 'Shape', 'Margin', 'Density',
]
feature_columns_dtype = { 'BIRADS': np.float64, 'Age': np.float64, 'Shape': np.float64, 'Margin': np.float64, 'Density': np.float64,
} # read raw dataset
mammographic_data = pd.read_csv("data/mammographic_masses.data",header=None) # split data into batch and raw datasets
batch_df =mammographic_data.sample(frac=0.05,random_state=200)
raw_df =mammographic_data.drop(batch_df.index) # Split the raw datasets to two parts, one of which will be used to train
#the model initially and then other dataset will be leveraged when #retraining the model
train_dataset_part2 =raw_df.sample(frac=0.1,random_state=200)
train_dataset_part1 =raw_df.drop(train_dataset_part2.index) # save the train datasets train_dataset_part1.to_csv("data/mammo-train-dataset-part1.csv",index=False)
train_dataset_part2.to_csv("data/mammo-train-dataset-part2.csv",index=False) # remove label column from the batch dataset which will be used to generate inferences
batch_df.drop(5,axis=1,inplace=True) # create a copy of the batch dataset batch_modified_df = batch_df def preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df): batch_df.replace("?", "NaN", inplace = True) batch_df.columns = feature_columns_names batch_df = batch_df.astype(feature_columns_dtype) numeric_transformer = Pipeline( steps=[("imputer", SimpleImputer(strategy="median"))] ) numeric_features = list(feature_columns_names) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features) ] ) batch_df = preprocess.fit_transform(batch_df) return batch_df # save the batch dataset file
batch_df = preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df)
pd.DataFrame(batch_df).to_csv("data/mammo-batch-dataset.csv", header=False, index=False) # modify batch dataset to introduce missing values
batch_modified_df.replace("?", "NaN", inplace = True)
batch_modified_df.columns = feature_columns_names
batch_modified_df = batch_modified_df.astype(feature_columns_dtype) # save the batch dataset with outliers file
batch_modified_df.to_csv("data/mammo-batch-dataset-outliers.csv",index=False)

Der Code generiert die folgenden Datensätze:

- data/mammo-train-dataset-part1.csv – Wird zum Trainieren der ersten Version des Modells verwendet.
- data/mammo-train-dataset-part2.csv – Wird verwendet, um die zweite Version des Modells zusammen mit dem Datensatz mammo-train-dataset-part1.csv zu trainieren.
- data/mammo-batch-dataset.csv – Wird zur Generierung von Schlussfolgerungen verwendet.
- data/mammo-batch-dataset-outliers.csv – Fügt Ausreißer in den Datensatz ein, die dazu führen, dass die Inferenzpipeline nicht funktioniert. Dadurch können wir das Muster testen, um eine automatische Neuschulung des Modells auszulösen.

Laden Sie den Datensatz hoch mammo-train-dataset-part1.csv unter dem Präfix mammography-severity-model/train-dataset, und laden Sie die Datensätze hoch mammo-batch-dataset.csv und mammo-batch-dataset-outliers.csv zum Präfix mammography-severity-model/batch-dataset des im Dev-Konto erstellten S3-Buckets:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("data/mammo-train-dataset-part1.csv","mammography-severity-model/data/train-dataset/mammo-train-dataset-part1.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset-outliers.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset-outliers.csv")

Laden Sie die Datensätze hoch mammo-train-dataset-part1.csv und mammo-train-dataset-part2.csv unter dem Präfix mammography-severity-model/train-dataset in den S3-Bucket, der im Produktkonto über die Amazon S3-Konsole erstellt wurde.
Laden Sie die Datensätze hoch mammo-batch-dataset.csv und mammo-batch-dataset-outliers.csv zum Präfix mammography-severity-model/batch-dataset des S3-Buckets im Produktkonto.

Führen Sie die Zugpipeline aus

Der <project-name>/pipelines/trainkönnen Sie die folgenden Python-Skripte sehen:

scripts/raw_preprocess.py – Integriert sich in SageMaker Processing für Feature-Engineering
scripts/evaluate_model.py – Ermöglicht in diesem Fall die Berechnung von Modellmetriken auc_score
train_pipeline.py – Enthält den Code für die Modelltrainingspipeline

Führen Sie die folgenden Schritte aus:

Laden Sie die Skripte in Amazon S3 hoch:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/raw_preprocess.py","mammography-severity-model/scripts/raw_preprocess.py")
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/evaluate_model.py","mammography-severity-model/scripts/evaluate_model.py")

Holen Sie sich die Train-Pipeline-Instanz:

from pipelines.train.train_pipeline import get_pipeline train_pipeline = get_pipeline( region=region, role=role, default_bucket=default_bucket, model_artifacts_bucket=model_artifacts_bucket, model_name = model_name, kms_key = kms_key, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-train-pipeline", base_job_prefix="mammo-severity", ) train_pipeline.definition()

Senden Sie die Zugpipeline und führen Sie sie aus:

train_pipeline.upsert(role_arn=role)
train_execution = train_pipeline.start()

Die folgende Abbildung zeigt einen erfolgreichen Lauf der Trainingspipeline. Im letzten Schritt der Pipeline wird das Modell im zentralen Modellregistrierungskonto registriert.

Genehmigen Sie das Modell im zentralen Modellregister

Melden Sie sich beim zentralen Modellregistrierungskonto an und greifen Sie auf die SageMaker-Modellregistrierung innerhalb der SageMaker Studio-Domäne zu. Ändern Sie den Modellversionsstatus in „Genehmigt“.

Nach der Genehmigung sollte der Status der Modellversion geändert werden.

Führen Sie die Inferenzpipeline aus (optional)

Dieser Schritt ist nicht erforderlich, aber Sie können die Inferenzpipeline trotzdem ausführen, um Vorhersagen im Entwicklerkonto zu generieren.

Der <project-name>/pipelines/inferencekönnen Sie die folgenden Python-Skripte sehen:

scripts/lambda_helper.py – Ruft mithilfe eines SageMaker Pipelines Lambda-Schritts die neueste genehmigte Modellversion aus dem zentralen Modellregistrierungskonto ab
inference_pipeline.py – Enthält den Code für die Modellinferenzpipeline

Führen Sie die folgenden Schritte aus:

Laden Sie das Skript in den S3-Bucket hoch:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/inference/scripts/lambda_helper.py","mammography-severity-model/scripts/lambda_helper.py")

Rufen Sie die Inferenzpipeline-Instanz mit dem normalen Batch-Dataset ab:

from pipelines.inference.inference_pipeline import get_pipeline inference_pipeline = get_pipeline( region=region, role=role, lambda_role = lambda_role, default_bucket=default_bucket, kms_key=kms_key, model_name = model_name, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-inference-pipeline", batch_dataset_filename = "mammo-batch-dataset" )

Senden Sie die Inferenzpipeline und führen Sie sie aus:

inference_pipeline.upsert(role_arn=role)
inference_execution = inference_pipeline.start()

Die folgende Abbildung zeigt eine erfolgreiche Ausführung der Inferenzpipeline. Der letzte Schritt in der Pipeline generiert die Vorhersagen und speichert sie im S3-Bucket. Wir gebrauchen MonitorBatchTransformStep um die Eingaben in den Batch-Transformationsauftrag zu überwachen. Wenn es Ausreißer gibt, geht die Inferenzpipeline in einen fehlerhaften Zustand über.

Führen Sie die Jenkins-Pipeline aus

Das environment/ Der Ordner im GitHub-Repository enthält das Konfigurationsskript für das Produktkonto. Führen Sie die folgenden Schritte aus, um die Jenkins-Pipeline auszulösen:

Aktualisieren Sie das Konfigurationsskript prod.tfvars.json basierend auf den in den vorherigen Schritten erstellten Ressourcen:

{ "env_group": "prod", "aws_region": "us-east-1", "event_bus_name": "default", "pipelines_alert_topic_name": "mammography-model-notification", "email":"admin@org.com", "lambda_role":"arn:aws:iam::<prod-account-id>:role/lambda-sagemaker-role", "default_bucket":"<s3-bucket-in-prod-account>", "model_artifacts_bucket": "<s3-bucket-in-central-model-registry-account>", "kms_key": "arn:aws:kms:us-east-1:<prod-account-id>:key/<kms-key-id-in-prod-account>", "model_name": "mammography-severity-model", "model_package_group_name":"arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package", "train_pipeline_name":"mammo-severity-train-pipeline", "inference_pipeline_name":"mammo-severity-inference-pipeline", "batch_dataset_filename":"mammo-batch-dataset", "terraform_state_bucket":"<s3-bucket-terraform-state-in-prod-account>", "train_pipeline": { "name": "mammo-severity-train-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-train-pipeline", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" }, "inference_pipeline": { "name": "mammo-severity-inference-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-inference-pipeline", "cron_schedule": "cron(0 23 * * ? *)", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" } }

Schieben Sie den Code nach der Aktualisierung in das gespaltene GitHub-Repository und führen Sie den Code im Hauptzweig zusammen.
Gehen Sie zur Jenkins-Benutzeroberfläche und wählen Sie Mit Parametern erstellenund lösen Sie die in den vorherigen Schritten erstellte CI/CD-Pipeline aus.

Wenn der Build abgeschlossen und erfolgreich ist, können Sie sich beim Produktkonto anmelden und die Trainings- und Inferenzpipelines innerhalb der SageMaker Studio-Domäne anzeigen.

Darüber hinaus werden auf der EventBridge-Konsole im Produktkonto drei EventBridge-Regeln angezeigt:

Planen Sie die Inferenzpipeline
Senden Sie eine Fehlerbenachrichtigung für die Zugleitung
Wenn die Inferenzpipeline die Train-Pipeline nicht auslöst, senden Sie eine Benachrichtigung

Schließlich sehen Sie auf der Amazon SNS-Konsole ein SNS-Benachrichtigungsthema, das Benachrichtigungen per E-Mail sendet. Sie erhalten eine E-Mail, in der Sie aufgefordert werden, die Annahme dieser Benachrichtigungs-E-Mails zu bestätigen.

Testen Sie die Inferenzpipeline mithilfe eines Batch-Datensatzes ohne Ausreißer

Um zu testen, ob die Inferenzpipeline im Produktkonto wie erwartet funktioniert, können wir uns beim Produktkonto anmelden und die Inferenzpipeline mithilfe des Batch-Datensatzes ohne Ausreißer auslösen.

Führen Sie die Pipeline über die SageMaker Pipelines-Konsole in der SageMaker Studio-Domäne des Produktkontos aus, wo die transform_input wird der S3-URI des Datensatzes ohne Ausreißer sein (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset.csv).

Die Inferenzpipeline ist erfolgreich und schreibt die Vorhersagen zurück in den S3-Bucket.

Testen Sie die Inferenzpipeline mithilfe eines Batch-Datensatzes mit Ausreißern

Sie können die Inferenzpipeline mithilfe des Batch-Datensatzes mit Ausreißern ausführen, um zu überprüfen, ob der automatisierte Neutrainingsmechanismus wie erwartet funktioniert.

Führen Sie die Pipeline über die SageMaker Pipelines-Konsole in der SageMaker Studio-Domäne des Produktkontos aus, wo die transform_input wird der S3-URI des Datensatzes mit Ausreißern sein (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset-outliers.csv).

Die Inferenzpipeline schlägt wie erwartet fehl, was die EventBridge-Regel auslöst, die wiederum die Train-Pipeline auslöst.

Nach einigen Augenblicken sollten Sie auf der SageMaker Pipelines-Konsole einen neuen Lauf der Zugpipeline sehen, der die beiden unterschiedlichen Zugdatensätze aufnimmt (mammo-train-dataset-part1.csv und mammo-train-dataset-part2.csv) in den S3-Bucket hochgeladen, um das Modell neu zu trainieren.

Sie sehen außerdem eine Benachrichtigung an die E-Mail-Adresse, an die Sie das SNS-Thema abonniert haben.

Um die aktualisierte Modellversion zu verwenden, melden Sie sich beim zentralen Modellregistrierungskonto an und genehmigen Sie die Modellversion, die bei der nächsten Ausführung der Inferenzpipeline übernommen wird, die durch die geplante EventBridge-Regel ausgelöst wird.

Obwohl die Zug- und Inferenzpipelines eine statische Datensatz-URL verwenden, können Sie die Datensatz-URL als dynamische Variablen an die Zug- und Inferenzpipelines übergeben lassen, um aktualisierte Datensätze zum erneuten Trainieren des Modells und zum Generieren von Vorhersagen in einem realen Szenario zu verwenden.

Aufräumen

Führen Sie die folgenden Schritte aus, um zukünftige Gebühren zu vermeiden:

Entfernen Sie die SageMaker Studio-Domäne aus allen AWS-Konten.
Löschen Sie alle außerhalb von SageMaker erstellten Ressourcen, einschließlich der S3-Buckets, IAM-Rollen, EventBridge-Regeln und SNS-Themen, die über Terraform im Produktkonto eingerichtet wurden.
Löschen Sie die kontenübergreifend erstellten SageMaker-Pipelines mit AWS-Befehlszeilenschnittstelle (AWS-CLI).

Zusammenfassung

Organisationen müssen sich häufig an unternehmensweiten Toolsets orientieren, um die Zusammenarbeit zwischen verschiedenen Funktionsbereichen und Teams zu ermöglichen. Diese Zusammenarbeit stellt sicher, dass sich Ihre MLOps-Plattform an sich ändernde Geschäftsanforderungen anpassen kann und beschleunigt die Einführung von ML in allen Teams. In diesem Beitrag wurde erklärt, wie man ein MLOps-Framework in einem Multi-Umgebungs-Setup erstellt, um automatisiertes Modell-Retraining, Batch-Inferenz und Überwachung mit Amazon SageMaker Model Monitor, Modellversionierung mit SageMaker Model Registry und Förderung von ML-Code und Pipelines über Umgebungen hinweg mit einem zu ermöglichen CI/CD-Pipeline. Wir haben diese Lösung mithilfe einer Kombination aus AWS-Diensten und Toolsets von Drittanbietern vorgestellt. Anweisungen zur Implementierung dieser Lösung finden Sie im GitHub-Repository. Sie können diese Lösung auch erweitern, indem Sie Ihre eigenen Datenquellen und Modellierungsframeworks einbinden.

Über die Autoren

Gayatri Ghanakota ist Senior Machine Learning Engineer bei AWS Professional Services. Ihre Leidenschaft gilt der Entwicklung, Bereitstellung und Erläuterung von KI/ML-Lösungen in verschiedenen Bereichen. Vor dieser Funktion leitete sie mehrere Initiativen als Datenwissenschaftlerin und ML-Ingenieurin bei weltweit führenden Unternehmen im Finanz- und Einzelhandelsbereich. Sie hat einen Master-Abschluss in Informatik mit Spezialisierung auf Data Science von der University of Colorado, Boulder.

Sunita Koppar ist Senior Data Lake Architect bei AWS Professional Services. Ihre Leidenschaft gilt der Lösung von Kundenproblemen bei der Verarbeitung großer Datenmengen und der Bereitstellung langfristig skalierbarer Lösungen. Vor dieser Rolle entwickelte sie Produkte in den Bereichen Internet, Telekommunikation und Automobil und war AWS-Kundin. Sie hat einen Master-Abschluss in Data Science von der University of California, Riverside.

Fördern Sie Pipelines in einem Multi-Umgebungs-Setup mit Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub und Jenkins CI/CD | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Saswata Dash ist DevOps-Berater bei AWS Professional Services. Sie hat mit Kunden aus den Bereichen Gesundheitswesen und Biowissenschaften, Luftfahrt und Fertigung zusammengearbeitet. Sie hat eine Leidenschaft für alles, was mit Automatisierung zu tun hat, und verfügt über umfassende Erfahrung im Entwerfen und Erstellen von Kundenlösungen im Unternehmensmaßstab in AWS. Außerhalb der Arbeit geht sie ihrer Leidenschaft für das Fotografieren und das Einfangen von Sonnenaufgängen nach.

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
Quelle: https://aws.amazon.com/blogs/machine-learning/promote-pipelines-in-a-multi-environment-setup-using-amazon-sagemaker-model-registry-hashicorp-terraform-github-and-jenkins-ci-cd/

Zeitstempel: 9. November 2023

Zeitstempel: 14. Nov 2023

Neuauflage von Plato

Konfigurieren Sie DTMF-Slots und angeforderte Wiederholungsaufforderungen mit Amazon Lex

Cloudbasierte Rekonstruktion medizinischer Bildgebung mit tiefen neuronalen Netzen

Beschleunigen Sie die Reaktion auf Katastrophen mit Computer Vision für Satellitenbilder mit Amazon SageMaker und Amazon Augmented AI

Amazon SageMaker mit TensorBoard: Ein Überblick über ein gehostetes TensorBoard-Erlebnis

Nutzung von künstlicher Intelligenz und maschinellem Lernen bei Parsons mit AWS DeepRacer

Erstellen Sie synthetische Daten für Computer-Vision-Pipelines auf AWS

Verhindern Sie die Kontoübernahme bei der Anmeldung mit dem neuen Account Takeover Insights-Modell in Amazon Fraud Detector

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto