Promuj rurociągi w konfiguracji wielośrodowiskowej, korzystając z rejestru modeli Amazon SageMaker, HashiCorp Terraform, GitHub i Jenkins CI/CD

Opublikowane ponownie przez Plato

Obserwuje: 0

Stworzenie platformy operacji uczenia maszynowego (MLops) w szybko rozwijającym się środowisku sztucznej inteligencji (AI) i uczenia maszynowego (ML) dla organizacji jest niezbędne do płynnego wypełnienia luki między eksperymentowaniem w zakresie analizy danych a wdrażaniem, przy jednoczesnym spełnieniu wymagań dotyczących wydajności modelu, bezpieczeństwo i zgodność.

Aby spełnić wymagania regulacyjne i zgodności, kluczowymi wymaganiami przy projektowaniu takiej platformy są:

Adresowanie dryfu danych
Monitoruj wydajność modelu
Ułatwienie automatycznego ponownego uczenia modelu
Zapewnij proces zatwierdzania modelu
Przechowuj modele w bezpiecznym środowisku

W tym poście pokazujemy, jak stworzyć framework MLOps, aby zaspokoić te potrzeby, korzystając z kombinacji usług AWS i zestawów narzędzi innych firm. Rozwiązanie obejmuje konfigurację wielośrodowiskową z automatycznym ponownym uczeniem modelu, wnioskowaniem wsadowym i monitorowaniem Monitor modelu Amazon SageMaker, wersjonowanie modelu za pomocą Rejestr modeli SageMakeroraz potok CI/CD ułatwiający promowanie kodu ML i potoków w różnych środowiskach za pomocą Amazon Sage Maker, Most zdarzeń Amazona, Usługa prostego powiadomienia Amazon (Amazonka S3), Terraforma HashiCorp, GitHub, Jenkins CI/CD. Budujemy model umożliwiający przewidywanie ciężkości (łagodnych lub złośliwych) zmian masowych mammograficznych wyszkolonych za pomocą narzędzia Algorytm XGBoost korzystając z publicznie dostępnych Msza Mammograficzna UCI zestawu danych i wdrożyć go przy użyciu platformy MLOps. Pełna instrukcja wraz z kodem dostępna jest w pliku Repozytorium GitHub.

Omówienie rozwiązania

Poniższy diagram architektury przedstawia przegląd struktury MLOps z następującymi kluczowymi komponentami:

Strategia wielu kont – Dwa różne środowiska (dev i prod) są konfigurowane na dwóch różnych kontach AWS zgodnie z najlepszymi praktykami AWS Well-Architected, a trzecie konto jest konfigurowane w centralnym rejestrze modeli:
- Środowisko deweloperskie – Gdzie np Domena Amazon SageMaker Studio jest skonfigurowany tak, aby umożliwić opracowywanie modeli, uczenie modeli i testowanie potoków uczenia maszynowego (trenowanie i wnioskowanie), zanim model będzie gotowy do awansu do wyższych środowisk.
- Środowisko produkcyjne – Miejsce, do którego w pierwszym kroku promowane są potoki uczenia maszynowego od dewelopera, a także planowane i monitorowane w czasie.
- Centralny rejestr modeli - Rejestr modelu Amazon SageMaker jest konfigurowany na oddzielnym koncie AWS w celu śledzenia wersji modeli generowanych w środowiskach deweloperskich i prod.
CI/CD i kontrola źródła – Wdrażanie potoków ML w różnych środowiskach odbywa się za pośrednictwem CI/CD skonfigurowanego w Jenkins, a kontrola wersji jest obsługiwana przez GitHub. Zmiany w kodzie połączone z odpowiednią gałęzią git środowiska uruchamiają przepływ pracy CI/CD w celu wprowadzenia odpowiednich zmian w danym środowisku docelowym.
Prognozy zbiorcze z monitorowaniem modelu – Potok wnioskowania zbudowany za pomocą Rurociągi Amazon SageMaker działa zgodnie z harmonogramem w celu generowania prognoz wraz z monitorowaniem modelu za pomocą SageMaker Model Monitor w celu wykrywania dryftu danych.
Zautomatyzowany mechanizm przekwalifikowania – Potok szkoleniowy zbudowany za pomocą SageMaker Pipelines jest uruchamiany za każdym razem, gdy w potoku wnioskowania zostanie wykryty dryf danych. Po przeszkoleniu model jest rejestrowany w centralnym rejestrze modeli w celu zatwierdzenia przez osobę zatwierdzającą model. Po zatwierdzeniu zaktualizowana wersja modelu jest używana do generowania prognoz za pośrednictwem potoku wnioskowania.
Infrastruktura jako kod – Infrastruktura jako kod (IaC), tworzona przy użyciu Terraforma HashiCorp, obsługuje planowanie potoku wnioskowania za pomocą EventBridge, wyzwalanie potoku pociągu na podstawie Reguła EventBridge i wysyłanie powiadomień za pomocą Usługa prostego powiadomienia Amazon (Amazonskie SNS) ilość tematów.

architektura mlopsa

Przepływ pracy MLOps obejmuje następujące kroki:

Uzyskaj dostęp do domeny SageMaker Studio na koncie programistycznym, sklonuj repozytorium GitHub, przejdź przez proces tworzenia modelu przy użyciu dostarczonego przykładowego modelu i wygeneruj potoki uczenia i wnioskowania.
Uruchom potok pociągów na koncie programistycznym, które generuje artefakty modelu dla przeszkolonej wersji modelu i rejestruje model w rejestrze modeli SageMaker na centralnym koncie rejestru modeli.
Zatwierdź model w rejestrze modeli SageMaker na koncie rejestru modeli centralnych.
Wciśnij kod (potoki uczenia i wnioskowania oraz kod Terraform IaC do tworzenia harmonogramu EventBridge, reguły EventBridge i tematu SNS) do gałęzi funkcji repozytorium GitHub. Utwórz żądanie ściągnięcia, aby scalić kod z główną gałęzią repozytorium GitHub.
Uruchom potok Jenkins CI/CD, który jest skonfigurowany w repozytorium GitHub. Potok CI/CD wdraża kod na koncie prod w celu utworzenia potoków uczenia i wnioskowania wraz z kodem Terraform w celu udostępnienia harmonogramu EventBridge, reguły EventBridge i tematu SNS.
Potok wnioskowania ma działać codziennie, natomiast potok pociągów jest skonfigurowany tak, aby działał za każdym razem, gdy zostanie wykryty dryf danych z potoku wnioskowania.
Powiadomienia są wysyłane za pośrednictwem tematu SNS w przypadku awarii pociągu lub potoku wnioskowania.

Wymagania wstępne

W przypadku tego rozwiązania należy spełnić następujące wymagania wstępne:

Trzy konta AWS (konta deweloperskie, prod i centralny rejestr modeli)
Domena SageMaker Studio skonfigurowana na każdym z trzech kont AWS (patrz Na pokładzie do Amazon SageMaker Studio lub obejrzyj wideo Szybko dołącz do Amazon SageMaker Studio instrukcje konfiguracji)
Jenkins (używamy Jenkins 2.401.1) z uprawnieniami administracyjnymi zainstalowanymi na AWS
Terraform w wersji 1.5.5 lub nowszej zainstalowany na serwerze Jenkins

W przypadku tego postu pracujemy w us-east-1 Region, w którym ma zostać wdrożone rozwiązanie.

Udostępnij klucze KMS na kontach deweloperskich i prod

Naszym pierwszym krokiem jest tworzenie Usługa zarządzania kluczami AWS (AWS KMS) na kontach deweloperskich i prod.

Utwórz klucz KMS na koncie deweloperskim i daj dostęp do konta prod

Wykonaj następujące kroki, aby utworzyć klucz KMS na koncie dewelopera:

W konsoli AWS KMS wybierz Klucze zarządzane przez klienta w okienku nawigacji.
Dodaj Utwórz klucz.
W razie zamówieenia projektu Typ klucza, Wybierz Symetryczny.
W razie zamówieenia projektu Zastosowanie klucza, Wybierz Szyfruj i deszyfruj.
Dodaj Następna.
Wprowadź numer konta produkcyjnego, aby zapewnić kontu produkcyjnemu dostęp do klucza KMS udostępnionego na koncie deweloperskim. Jest to wymagany krok, ponieważ przy pierwszym szkoleniu modelu na koncie deweloperskim artefakty modelu są szyfrowane kluczem KMS przed zapisaniem w zasobniku S3 na koncie rejestru modelu centralnego. Konto produkcyjne potrzebuje dostępu do klucza KMS, aby odszyfrować artefakty modelu i uruchomić potok wnioskowania.
Dodaj Następna i zakończ tworzenie klucza.

Po udostępnieniu klucza powinien być widoczny na konsoli AWS KMS.

kms na konsoli

Utwórz klucz KMS na koncie prod

Wykonaj te same kroki, co w poprzedniej sekcji, aby utworzyć klucz KMS zarządzany przez klienta na koncie prod. Możesz pominąć krok udostępniania klucza KMS innemu kontu.

Skonfiguruj zasobnik artefaktów modelu S3 na koncie rejestru modeli centralnych

Za pomocą sznurka utwórz wybrane wiadro S3 sagemaker w konwencji nazewnictwa jako część nazwy zasobnika na koncie rejestru modeli centralnych i zaktualizuj zasady zasobnika w zasobniku S3, aby nadać uprawnienia zarówno kontom deweloperskim, jak i prod. do odczytu i zapisu artefaktów modelu w zasobniku S3.

Poniższy kod to zasady zasobnika, które należy zaktualizować w zasobniku S3:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPerm", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm1", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] }, { "Sid": "AddPerm2", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm3", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Skonfiguruj role IAM na swoich kontach AWS

Następnym krokiem jest konfiguracja AWS Zarządzanie tożsamością i dostępem (IAM) na kontach AWS z uprawnieniami do AWS Lambda, SageMaker i Jenkins.

Rola wykonania lambda

Ustawiać Role wykonawcze Lambda na kontach dev i prod, które będą wykorzystywane przez funkcję Lambda uruchamianą w ramach pliku Krok Lambda rurociągów SageMaker. Ten krok zostanie uruchomiony z potoku wnioskowania w celu pobrania najnowszego zatwierdzonego modelu, na podstawie którego generowane są wnioski. Utwórz role IAM na kontach deweloperskich i prod, stosując konwencję nazewnictwa arn:aws:iam::<account-id>:role/lambda-sagemaker-role i dołącz następujące zasady uprawnień:

Polityka 1 – Utwórz politykę inline o nazwie cross-account-model-registry-access, który daje dostęp do pakietu modeli ustawionego w rejestrze modeli na koncie centralnym:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:ListModelPackages", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package/mammo-severity-model-package/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": "sagemaker:DescribeModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Polityka 2 - Przytwierdzać AmazonSageMakerPełny dostęp, który jest Polityka zarządzana przez AWS który zapewnia pełny dostęp do SageMaker. Zapewnia także wybrany dostęp do powiązanych usług, takich jak Automatyczne skalowanie aplikacji AWS, Amazonka S3, Rejestr elastycznego pojemnika Amazon (Amazon ECR) i Dzienniki Amazon CloudWatch.
Polityka 3 - Przytwierdzać AWSLambda_FullAccess, czyli polityka zarządzana przez AWS, która zapewnia pełny dostęp do funkcji Lambda, konsoli Lambda i innych powiązanych usług AWS.

Polityka 4 – Użyj następującej polityki zaufania IAM dla roli IAM:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "lambda.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

Rola wykonawcza SageMaker

Domeny SageMaker Studio skonfigurowane na kontach dev i prod powinny mieć przypisaną rolę wykonawczą, którą można znaleźć na stronie ustawienia domeny na stronie szczegółów domeny, jak pokazano na poniższym zrzucie ekranu. Ta rola służy do uruchamiania zadań szkoleniowych, zadań przetwarzania i innych w domenie SageMaker Studio.

domena studia sagemaker

Dodaj następujące zasady do roli wykonawczej SageMaker na obu kontach:

Polityka 1 – Utwórz politykę inline o nazwie cross-account-model-artifacts-s3-bucket-access, który daje dostęp do segmentu S3 na centralnym koncie rejestru modeli, w którym przechowywane są artefakty modelu:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Polityka 2 – Utwórz politykę inline o nazwie cross-account-model-registry-access, który daje dostęp do pakietu modeli w rejestrze modeli na koncie centralnego rejestru modeli:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:CreateModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Polityka 3 – Utwórz politykę inline o nazwie kms-key-access-policy, który daje dostęp do klucza KMS utworzonego w poprzednim kroku. Podaj identyfikator konta, na którym tworzona jest polityka, oraz identyfikator klucza KMS utworzonego na tym koncie.

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInThisAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<account-id>:key/<kms-key-id>" } ]
}

Polityka 4 - Przytwierdzać AmazonSageMakerPełny dostęp, który jest Polityka zarządzana przez AWS który zapewnia pełny dostęp do SageMaker i wybrany dostęp do powiązanych usług.
Polityka 5 - Przytwierdzać AWSLambda_FullAccess, czyli polityka zarządzana przez AWS, która zapewnia pełny dostęp do funkcji Lambda, konsoli Lambda i innych powiązanych usług AWS.
Polityka 6 - Przytwierdzać CloudWatchEventsPełny dostęp, czyli zasada zarządzana przez AWS, która zapewnia pełny dostęp do zdarzeń CloudWatch.

Polityka 7 – Dodaj następującą politykę zaufania IAM dla roli IAM wykonania SageMaker:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "events.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

Zasada 8 (specyficzna dla roli wykonawczej SageMaker na koncie prod) – Utwórz politykę inline o nazwie cross-account-kms-key-access-policy, który daje dostęp do klucza KMS utworzonego na koncie deweloperskim. Jest to wymagane, aby potok wnioskowania mógł odczytywać artefakty modelu przechowywane na koncie centralnego rejestru modeli, gdzie artefakty modelu są szyfrowane przy użyciu klucza KMS z konta dewelopera, gdy tworzona jest pierwsza wersja modelu z konta dewelopera.
```
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInDevAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<dev-account-id>:key/<dev-kms-key-id>" } ]
}
```

Rola Jenkinsa obejmująca wiele kont

Skonfiguruj rolę uprawnień o nazwie cross-account-jenkins-role na koncie prod, które Jenkins przyjmie na siebie w celu wdrożenia potoków ML i odpowiedniej infrastruktury na koncie prod.

Dodaj do roli następujące zarządzane zasady uprawnień:

CloudWatchFullAccess
AmazonS3FullAccess
AmazonSNSFullAccess
AmazonSageMakerFullAccess
AmazonEventBridgeFullAccess
AWSLambda_FullAccess

Zaktualizuj relację zaufania w roli, aby nadać uprawnienia kontu AWS hostującemu serwer Jenkins:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com", "AWS": "arn:aws:iam::<jenkins-account-id>:root" }, "Action": "sts:AssumeRole", "Condition": {} } ]
}

Zaktualizuj uprawnienia roli IAM powiązanej z serwerem Jenkins

Zakładając, że Jenkins został skonfigurowany na AWS, zaktualizuj rolę IAM powiązaną z Jenkinsem, aby dodać następujące zasady, które dadzą Jenkinsowi dostęp do wdrażania zasobów na koncie prod:

Polityka 1 – Utwórz następującą politykę inline o nazwie assume-production-role-policy:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sts:AssumeRole", "Resource": "arn:aws:iam::<prod-account-id>:role/cross-account-jenkins-role" } ]
}

Polityka 2 – Dołącz CloudWatchFullAccess zarządzane zasady uprawnień.

Skonfiguruj grupę pakietów modeli na koncie centralnego rejestru modeli

W domenie SageMaker Studio na koncie rejestru modeli centralnych utwórz grupę pakietów modeli o nazwie mammo-severity-model-package używając następującego fragmentu kodu (który można uruchomić za pomocą notatnika Jupyter):

import boto3 model_package_group_name = "mammo-severity-model-package"
sm_client = boto3.Session().client("sagemaker") create_model_package_group_response = sm_client.create_model_package_group( ModelPackageGroupName=model_package_group_name, ModelPackageGroupDescription="Cross account model package group for mammo severity model", ) print('ModelPackageGroup Arn : {}'.format(create_model_package_group_response['ModelPackageGroupArn']))

Skonfiguruj dostęp do pakietu modelu dla ról IAM na kontach deweloperskich i prod

Zapewnij dostęp do ról wykonawczych SageMaker utworzonych na kontach deweloperskich i prod, aby móc rejestrować wersje modelu w pakiecie modelu mammo-severity-model-package w centralnym rejestrze modeli z obu rachunków. W domenie SageMaker Studio na koncie rejestru modeli centralnych uruchom następujący kod w notatniku Jupyter:

import json import boto3 model_package_group_name = "mammo-severity-model-package"
# Convert the policy from JSON dict to string
model_package_group_policy = dict(
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPermModelPackageGroupCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackageGroup" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package-group/mammo-severity-model-package" }, { "Sid": "AddPermModelPackageVersionCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackage", "sagemaker:ListModelPackages", "sagemaker:UpdateModelPackage", "sagemaker:CreateModelPackage", "sagemaker:CreateModel" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package/mammo-severity-model-package/*" } ]
})
model_package_group_policy = json.dumps(model_package_group_policy)
# Add Policy to the model package group
sm_client = boto3.Session().client("sagemaker")
response = sm_client.put_model_package_group_policy( ModelPackageGroupName = model_package_group_name, ResourcePolicy = model_package_group_policy)

Skonfiguruj Jenkinsa

W tej sekcji konfigurujemy Jenkinsa do tworzenia potoków ML i odpowiedniej infrastruktury Terraform na koncie prod za pośrednictwem potoku Jenkins CI/CD.

W konsoli CloudWatch utwórz grupę dzienników o nazwie jenkins-log w ramach konta prod, na które Jenkins będzie przesyłać logi z potoku CI/CD. Grupę dzienników należy utworzyć w tym samym regionie, w którym skonfigurowano serwer Jenkins.
Zainstaluj następujące wtyczki na twoim serwerze Jenkins:
1. Praca DSL
2. git
3. Rurociąg
4. Potok: kroki AWS
5. Kroki narzędzia rurociągu
Skonfiguruj poświadczenia AWS w Jenkins przy użyciu roli IAM dla wielu kont (cross-account-jenkins-role) udostępnione na koncie prod.
W razie zamówieenia projektu Konfiguracja systemuwybierz AWS.
Podaj poświadczenia i utworzoną wcześniej grupę dzienników CloudWatch.
Skonfiguruj poświadczenia GitHub w Jenkins.
Utwórz nowy projekt w Jenkins.
Wprowadź nazwę projektu i wybierz Rurociąg.
Na Ogólne kartę, wybierz Projekt GitHub i wprowadź rozwidlenie Repozytorium GitHub URL.
Wybierz Projekt ten jest sparametryzowany.
Na Dodaj parametr menu, wybierz Parametr ciągu.
W razie zamówieenia projektu Imię, wchodzić prodAccount.
W razie zamówieenia projektu Domyślna wartość, wprowadź identyfikator konta prod.
Pod Zaawansowane opcje projektu, Dla Definicja, Wybierz Skrypt potoku z SCM.
W razie zamówieenia projektu SCMwybierz git.
W razie zamówieenia projektu URL repozytorium, wprowadź rozwidlenie Repozytorium GitHub URL.
W razie zamówieenia projektu Listy uwierzytelniającewprowadź poświadczenia GitHub zapisane w Jenkins.
Wchodzę main Gałęzie do zbudowania sekcję, na podstawie której zostanie uruchomiony potok CI/CD.
W razie zamówieenia projektu Ścieżka skryptu, wchodzić Jenkinsfile.
Dodaj Zapisz.

Potok Jenkins powinien zostać utworzony i widoczny na pulpicie nawigacyjnym.

Udostępnij zasobniki S3, zbierz i przygotuj dane

Wykonaj następujące kroki, aby skonfigurować zasobniki i dane S3:

Za pomocą sznurka utwórz wybrane wiadro S3 sagemaker w konwencji nazewnictwa jako część nazwy segmentu zarówno na kontach deweloperskich, jak i prod, do przechowywania zestawów danych i artefaktów modeli.
Skonfiguruj segment S3, aby zachować stan Terraform na koncie prod.
Pobierz i zapisz publicznie dostępne Msza Mammograficzna UCI dataset do zasobnika S3 utworzonego wcześniej na koncie dewelopera.
Rozwidlaj i klonuj Repozytorium GitHub w domenie SageMaker Studio na koncie deweloperskim. Repozytorium ma następującą strukturę folderów:
- /environments – Skrypt konfiguracyjny dla środowiska prod
- /mlops-infra – Kod do wdrażania usług AWS przy użyciu kodu Terraform
- /rurociągi – Kod komponentów potoku SageMaker
- Plik Jenkinsa – Skrypt do wdrożenia za pośrednictwem potoku Jenkins CI/CD
- konfiguracja.py – Wymagane zainstalowanie wymaganych modułów Pythona i utworzenie polecenia run-pipeline
- mammografia-severity-modeling.ipynb – Umożliwia tworzenie i uruchamianie przepływu pracy ML
Utwórz folder o nazwie data w sklonowanym folderze repozytorium GitHub i zapisz kopię pliku dostępnego publicznie Msza Mammograficzna UCI zestaw danych.
Podążaj za notatnikiem Jupytera mammography-severity-modeling.ipynb.

Uruchom następujący kod w notatniku, aby wstępnie przetworzyć zestaw danych i przesłać go do segmentu S3 na koncie dewelopera:

import boto3
import sagemaker
import numpy as np
import pandas as pd
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler, OneHotEncoder #Replace the values based on the resoures created
default_bucket = "<s3-bucket-in-dev-account>"
model_artifacts_bucket = "<s3-bucket-in-central-model-registry-account>"
region = "us-east-1"
model_name = "mammography-severity-model"
role = sagemaker.get_execution_role()
lambda_role = "arn:aws:iam::<dev-account-id>:role/lambda-sagemaker-role"
kms_key = "arn:aws:kms:us-east-1:<dev-account-id>:key/<kms-key-id-in-dev-account>"
model_package_group_name="arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" feature_columns_names = [ 'BIRADS', 'Age', 'Shape', 'Margin', 'Density',
]
feature_columns_dtype = { 'BIRADS': np.float64, 'Age': np.float64, 'Shape': np.float64, 'Margin': np.float64, 'Density': np.float64,
} # read raw dataset
mammographic_data = pd.read_csv("data/mammographic_masses.data",header=None) # split data into batch and raw datasets
batch_df =mammographic_data.sample(frac=0.05,random_state=200)
raw_df =mammographic_data.drop(batch_df.index) # Split the raw datasets to two parts, one of which will be used to train
#the model initially and then other dataset will be leveraged when #retraining the model
train_dataset_part2 =raw_df.sample(frac=0.1,random_state=200)
train_dataset_part1 =raw_df.drop(train_dataset_part2.index) # save the train datasets train_dataset_part1.to_csv("data/mammo-train-dataset-part1.csv",index=False)
train_dataset_part2.to_csv("data/mammo-train-dataset-part2.csv",index=False) # remove label column from the batch dataset which will be used to generate inferences
batch_df.drop(5,axis=1,inplace=True) # create a copy of the batch dataset batch_modified_df = batch_df def preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df): batch_df.replace("?", "NaN", inplace = True) batch_df.columns = feature_columns_names batch_df = batch_df.astype(feature_columns_dtype) numeric_transformer = Pipeline( steps=[("imputer", SimpleImputer(strategy="median"))] ) numeric_features = list(feature_columns_names) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features) ] ) batch_df = preprocess.fit_transform(batch_df) return batch_df # save the batch dataset file
batch_df = preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df)
pd.DataFrame(batch_df).to_csv("data/mammo-batch-dataset.csv", header=False, index=False) # modify batch dataset to introduce missing values
batch_modified_df.replace("?", "NaN", inplace = True)
batch_modified_df.columns = feature_columns_names
batch_modified_df = batch_modified_df.astype(feature_columns_dtype) # save the batch dataset with outliers file
batch_modified_df.to_csv("data/mammo-batch-dataset-outliers.csv",index=False)

Kod wygeneruje następujące zbiory danych:

- dane/ mammo-train-dataset-part1.csv – Będzie używany do uczenia pierwszej wersji modelu.
- dane/ mammo-train-dataset-part2.csv – Będzie używany do uczenia drugiej wersji modelu wraz ze zbiorem danych mammo-train-dataset-part1.csv.
- dane/mammo-batch-dataset.csv – Będzie używany do generowania wniosków.
- data/mammo-batch-dataset-outliers.csv – Wprowadzi wartości odstające do zbioru danych, aby zawieść potok wnioskowania. Umożliwi nam to przetestowanie wzorca w celu uruchomienia automatycznego ponownego uczenia modelu.

Prześlij zbiór danych mammo-train-dataset-part1.csv pod prefiksem mammography-severity-model/train-dataseti prześlij zbiory danych mammo-batch-dataset.csv i mammo-batch-dataset-outliers.csv do przedrostka mammography-severity-model/batch-dataset segmentu S3 utworzonego na koncie deweloperskim:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("data/mammo-train-dataset-part1.csv","mammography-severity-model/data/train-dataset/mammo-train-dataset-part1.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset-outliers.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset-outliers.csv")

Prześlij zbiory danych mammo-train-dataset-part1.csv i mammo-train-dataset-part2.csv pod prefiksem mammography-severity-model/train-dataset do segmentu S3 utworzonego na koncie prod za pośrednictwem konsoli Amazon S3.
Prześlij zbiory danych mammo-batch-dataset.csv i mammo-batch-dataset-outliers.csv do przedrostka mammography-severity-model/batch-dataset segmentu S3 na koncie prod.

Uruchom rurociąg kolejowy

Pod <project-name>/pipelines/train, możesz zobaczyć następujące skrypty Pythona:

scripts/raw_preprocess.py – Integruje się z SageMaker Processing w celu inżynierii funkcji
scripts/evaluate_model.py – W tym przypadku umożliwia obliczenie metryk modelu auc_score
train_pipeline.py – Zawiera kod potoku uczenia modelu

Wykonaj następujące kroki:

Prześlij skrypty do Amazon S3:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/raw_preprocess.py","mammography-severity-model/scripts/raw_preprocess.py")
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/evaluate_model.py","mammography-severity-model/scripts/evaluate_model.py")

Pobierz instancję rurociągu kolejowego:

from pipelines.train.train_pipeline import get_pipeline train_pipeline = get_pipeline( region=region, role=role, default_bucket=default_bucket, model_artifacts_bucket=model_artifacts_bucket, model_name = model_name, kms_key = kms_key, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-train-pipeline", base_job_prefix="mammo-severity", ) train_pipeline.definition()

Prześlij rurociąg pociągu i uruchom go:

train_pipeline.upsert(role_arn=role)
train_execution = train_pipeline.start()

Poniższy rysunek przedstawia pomyślne uruchomienie potoku szkoleniowego. Ostatnim krokiem w potoku jest rejestracja modelu na koncie centralnego rejestru modeli.

Zatwierdź model w centralnym rejestrze modeli

Zaloguj się na konto centralnego rejestru modeli i uzyskaj dostęp do rejestru modeli SageMaker w domenie SageMaker Studio. Zmień status wersji modelu na Zatwierdzony.

Po zatwierdzeniu należy zmienić status wersji modelu.

Uruchom potok wnioskowania (opcjonalnie)

Ten krok nie jest wymagany, ale nadal możesz uruchomić potok wnioskowania, aby wygenerować prognozy na koncie dewelopera.

Pod <project-name>/pipelines/inference, możesz zobaczyć następujące skrypty Pythona:

scripts/lambda_helper.py – Pobiera najnowszą zatwierdzoną wersję modelu z centralnego konta rejestru modeli przy użyciu kroku Lambda SageMaker Pipelines
inference_pipeline.py – Zawiera kod potoku wnioskowania modelu

Wykonaj następujące kroki:

Prześlij skrypt do segmentu S3:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/inference/scripts/lambda_helper.py","mammography-severity-model/scripts/lambda_helper.py")

Pobierz instancję potoku wnioskowania przy użyciu normalnego wsadowego zestawu danych:

from pipelines.inference.inference_pipeline import get_pipeline inference_pipeline = get_pipeline( region=region, role=role, lambda_role = lambda_role, default_bucket=default_bucket, kms_key=kms_key, model_name = model_name, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-inference-pipeline", batch_dataset_filename = "mammo-batch-dataset" )

Prześlij potok wnioskowania i uruchom go:

inference_pipeline.upsert(role_arn=role)
inference_execution = inference_pipeline.start()

Poniższy rysunek przedstawia pomyślne uruchomienie potoku wnioskowania. Ostatni krok w potoku generuje prognozy i przechowuje je w segmencie S3. Używamy Monitoruj krok transformacji wsadowej do monitorowania danych wejściowych zadania transformacji wsadowej. Jeśli istnieją jakieś wartości odstające, potok wnioskowania przechodzi w stan niepowodzenia.

Uruchom potok Jenkins

Połączenia environment/ folder w repozytorium GitHub zawiera skrypt konfiguracyjny dla konta prod. Wykonaj następujące kroki, aby uruchomić potok Jenkins:

Zaktualizuj skrypt konfiguracyjny prod.tfvars.json w oparciu o zasoby utworzone w poprzednich krokach:

{ "env_group": "prod", "aws_region": "us-east-1", "event_bus_name": "default", "pipelines_alert_topic_name": "mammography-model-notification", "email":"admin@org.com", "lambda_role":"arn:aws:iam::<prod-account-id>:role/lambda-sagemaker-role", "default_bucket":"<s3-bucket-in-prod-account>", "model_artifacts_bucket": "<s3-bucket-in-central-model-registry-account>", "kms_key": "arn:aws:kms:us-east-1:<prod-account-id>:key/<kms-key-id-in-prod-account>", "model_name": "mammography-severity-model", "model_package_group_name":"arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package", "train_pipeline_name":"mammo-severity-train-pipeline", "inference_pipeline_name":"mammo-severity-inference-pipeline", "batch_dataset_filename":"mammo-batch-dataset", "terraform_state_bucket":"<s3-bucket-terraform-state-in-prod-account>", "train_pipeline": { "name": "mammo-severity-train-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-train-pipeline", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" }, "inference_pipeline": { "name": "mammo-severity-inference-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-inference-pipeline", "cron_schedule": "cron(0 23 * * ? *)", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" } }

Po zaktualizowaniu wepchnij kod do rozwidlonego repozytorium GitHub i połącz kod z gałęzią główną.
Przejdź do interfejsu użytkownika Jenkins, wybierz Kompiluj z parametramii uruchom potok CI/CD utworzony w poprzednich krokach.

Gdy kompilacja zostanie ukończona i pomyślna, możesz zalogować się na konto prod i zobaczyć potoki uczenia i wnioskowania w domenie SageMaker Studio.

Dodatkowo zobaczysz trzy reguły EventBridge w konsoli EventBridge na koncie prod:

Zaplanuj potok wnioskowania
Wyślij powiadomienie o awarii na rurociągu kolejowym
Jeśli potok wnioskowania nie uruchomi potoku pociągu, wyślij powiadomienie

Na koniec zobaczysz temat powiadomień SNS na konsoli Amazon SNS, która wysyła powiadomienia e-mailem. Otrzymasz wiadomość e-mail z prośbą o potwierdzenie akceptacji tych wiadomości e-mail z powiadomieniami.

Przetestuj potok wnioskowania przy użyciu wsadowego zestawu danych bez wartości odstających

Aby sprawdzić, czy potok wnioskowania na koncie prod działa zgodnie z oczekiwaniami, możemy zalogować się na konto prod i uruchomić potok wnioskowania, korzystając z wsadowego zbioru danych bez wartości odstających.

Uruchom potok za pomocą konsoli SageMaker Pipelines w domenie SageMaker Studio konta prod, gdzie transform_input będzie identyfikatorem URI S3 zbioru danych bez wartości odstających (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset.csv).

Potok wnioskowania powiedzie się i zapisuje przewidywania z powrotem do segmentu S3.

Przetestuj potok wnioskowania przy użyciu wsadowego zestawu danych z wartościami odstającymi

Można uruchomić potok wnioskowania, korzystając z wsadowego zestawu danych z wartościami odstającymi, aby sprawdzić, czy mechanizm automatycznego ponownego uczenia działa zgodnie z oczekiwaniami.

Uruchom potok za pomocą konsoli SageMaker Pipelines w domenie SageMaker Studio konta prod, gdzie transform_input będzie identyfikatorem URI S3 zbioru danych z wartościami odstającymi (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset-outliers.csv).

Potok wnioskowania nie działa zgodnie z oczekiwaniami, co wyzwala regułę EventBridge, która z kolei wyzwala potok pociągu.

Po kilku chwilach powinieneś zobaczyć nowy przebieg rurociągu pociągu na konsoli SageMaker Pipelines, który pobiera dwa różne zestawy danych pociągu (mammo-train-dataset-part1.csv i mammo-train-dataset-part2.csv) przesłane do zasobnika S3 w celu ponownego nauczenia modelu.

Zobaczysz także powiadomienie wysłane na adres e-mail subskrybowany w temacie SNS.

Aby użyć zaktualizowanej wersji modelu, zaloguj się na konto centralnego rejestru modeli i zatwierdź wersję modelu, która zostanie pobrana podczas następnego uruchomienia potoku wnioskowania wyzwalanego przez zaplanowaną regułę EventBridge.

Chociaż potoki uczenia i wnioskowania używają statycznego adresu URL zestawu danych, adres URL zestawu danych można przekazać do potoków uczenia i wnioskowania jako zmienne dynamiczne, aby używać zaktualizowanych zestawów danych do ponownego uczenia modelu i generowania prognoz w scenariuszu ze świata rzeczywistego.

Sprzątać

Aby uniknąć przyszłych opłat, wykonaj następujące czynności:

Usuń domenę SageMaker Studio ze wszystkich kont AWS.
Usuń wszystkie zasoby utworzone poza SageMaker, w tym zasobniki S3, role IAM, reguły EventBridge i tematy SNS skonfigurowane za pomocą Terraform na koncie prod.
Usuń potoki SageMaker utworzone na różnych kontach za pomocą narzędzia Interfejs wiersza poleceń AWS (interfejs wiersza poleceń AWS).

Wnioski

Organizacje często muszą dostosować się do zestawów narzędzi obowiązujących w całym przedsiębiorstwie, aby umożliwić współpracę między różnymi obszarami funkcjonalnymi i zespołami. Ta współpraca gwarantuje, że Twoja platforma MLOps będzie mogła dostosować się do zmieniających się potrzeb biznesowych i przyspiesza wdrażanie uczenia maszynowego w zespołach. W tym poście wyjaśniono, jak utworzyć platformę MLOps w konfiguracji wielośrodowiskowej, aby umożliwić automatyczne ponowne uczenie modelu, wnioskowanie wsadowe i monitorowanie za pomocą Amazon SageMaker Model Monitor, wersjonowanie modelu za pomocą SageMaker Model Registry oraz promowanie kodu ML i potoków w różnych środowiskach z Rurociąg CI/CD. Zaprezentowaliśmy to rozwiązanie, wykorzystując połączenie usług AWS i zestawów narzędzi innych firm. Instrukcje dotyczące wdrażania tego rozwiązania można znaleźć w artykule Repozytorium GitHub. Możesz także rozszerzyć to rozwiązanie, wprowadzając własne źródła danych i struktury modelowania.

O autorach

Gajatri Ghanakota jest starszym inżynierem uczenia maszynowego w AWS Professional Services. Pasjonuje się tworzeniem, wdrażaniem i wyjaśnianiem rozwiązań AI/ML w różnych dziedzinach. Przed objęciem tej roli kierowała wieloma inicjatywami jako analityk danych i inżynier ML w czołowych globalnych firmach z branży finansowej i detalicznej. Posiada tytuł magistra informatyki ze specjalizacją Data Science uzyskany na Uniwersytecie Kolorado w Boulder.

Sunita Koppar jest starszym architektem Data Lake w AWS Professional Services. Jej pasją jest rozwiązywanie problemów klientów poprzez przetwarzanie dużych zbiorów danych i dostarczanie długoterminowych, skalowalnych rozwiązań. Przed objęciem tej roli opracowywała produkty w dziedzinach Internetu, telekomunikacji i motoryzacji i była klientem AWS. Uzyskała tytuł magistra w dziedzinie analityki danych na Uniwersytecie Kalifornijskim w Riverside.

Promuj potoki w konfiguracji wielośrodowiskowej przy użyciu Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub i Jenkins CI/CD | Amazon Web Services PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI. Saswata Dash jest konsultantem DevOps w AWS Professional Services. Współpracowała z klientami z branży opieki zdrowotnej i nauk przyrodniczych, lotnictwa i produkcji. Pasjonuje się automatyzacją i ma wszechstronne doświadczenie w projektowaniu i budowaniu rozwiązań dla klientów na skalę korporacyjną w AWS. Poza pracą realizuje swoją pasję związaną z fotografią i łapaniem wschodów słońca.

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://aws.amazon.com/blogs/machine-learning/promote-pipelines-in-a-multi-environment-setup-using-amazon-sagemaker-model-registry-hashicorp-terraform-github-and-jenkins-ci-cd/

Znak czasu: Listopad 9, 2023

Znak czasu: Sierpnia 8, 2023

Opublikowane ponownie przez Plato

Hosting modeli YOLOv8 PyTorch na punktach końcowych Amazon SageMaker

Zaplanuj swoje notebooki z dowolnego środowiska JupyterLab za pomocą rozszerzenia JupyterLab Amazon SageMaker | Usługi sieciowe Amazona

Zwiększ wydajność modelu ML i skróć czas szkolenia za pomocą wbudowanych algorytmów Amazon SageMaker ze wstępnie wytrenowanymi modelami

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto