Mempromosikan Pipeline Dalam Pengaturan Multi-lingkungan Menggunakan Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub, dan Jenkins CI/CD

Diterbitkan Ulang Oleh Plato

Followers: 0

Membangun platform operasi pembelajaran mesin (MLOps) dalam lanskap kecerdasan buatan (AI) dan pembelajaran mesin (ML) yang berkembang pesat bagi organisasi sangat penting untuk menjembatani kesenjangan antara eksperimen dan penerapan ilmu data sekaligus memenuhi persyaratan seputar kinerja model. keamanan, dan kepatuhan.

Untuk memenuhi persyaratan peraturan dan kepatuhan, persyaratan utama saat merancang platform tersebut adalah:

Mengatasi penyimpangan data
Pantau kinerja model
Memfasilitasi pelatihan ulang model otomatis
Menyediakan proses untuk persetujuan model
Simpan model di lingkungan yang aman

Dalam postingan ini, kami menunjukkan cara membuat kerangka kerja MLOps untuk memenuhi kebutuhan ini saat menggunakan kombinasi layanan AWS dan perangkat pihak ketiga. Solusi ini memerlukan pengaturan multi-lingkungan dengan pelatihan ulang model otomatis, inferensi batch, dan pemantauan Monitor Model Amazon SageMaker, membuat versi model dengan Registri Model SageMaker, dan pipeline CI/CD untuk memfasilitasi promosi kode ML dan pipeline di seluruh lingkungan dengan menggunakan Amazon SageMaker, Jembatan Acara Amazon, Layanan Pemberitahuan Sederhana Amazon (Amazon S3), Terraform HashiCorp, GitHub, dan Jenkins CI/CD. Kami membangun model untuk memprediksi tingkat keparahan (jinak atau ganas) dari lesi massa mamografi yang dilatih dengan Algoritma XGBoost menggunakan yang tersedia untuk umum Massa Mamografi UCI kumpulan data dan menyebarkannya menggunakan kerangka kerja MLOps. Instruksi lengkap dengan kode tersedia di Repositori GitHub.

Ikhtisar solusi

Diagram arsitektur berikut menunjukkan gambaran umum kerangka MLOps dengan komponen utama berikut:

Strategi multi akun – Dua lingkungan berbeda (dev dan prod) disiapkan di dua akun AWS berbeda dengan mengikuti praktik terbaik AWS Well-Architected, dan akun ketiga disiapkan di registri model pusat:
- lingkungan pengembang – Dimana sebuah Domain Amazon SageMaker Studio disiapkan untuk memungkinkan pengembangan model, pelatihan model, dan pengujian pipeline ML (pelatihan dan inferensi), sebelum model siap untuk dipromosikan ke lingkungan yang lebih tinggi.
- Lingkungan produksi – Dimana pipeline ML dari dev dipromosikan sebagai langkah pertama, dan dijadwalkan serta dipantau dari waktu ke waktu.
- Registri model pusat - Registri Model Amazon SageMaker diatur dalam akun AWS terpisah untuk melacak versi model yang dihasilkan di seluruh lingkungan pengembangan dan produksi.
CI/CD dan kontrol sumber – Penerapan pipeline ML di seluruh lingkungan ditangani melalui penyiapan CI/CD dengan Jenkins, bersama dengan kontrol versi yang ditangani melalui GitHub. Perubahan kode yang digabungkan ke lingkungan terkait cabang git memicu alur kerja CI/CD untuk membuat perubahan yang sesuai pada lingkungan target tertentu.
Prediksi batch dengan pemantauan model – Saluran inferensi dibuat dengan Pipa Amazon SageMaker berjalan secara terjadwal untuk menghasilkan prediksi beserta pemantauan model menggunakan SageMaker Model Monitor untuk mendeteksi penyimpangan data.
Mekanisme pelatihan ulang otomatis – Pipeline pelatihan yang dibangun dengan SageMaker Pipelines dipicu setiap kali penyimpangan data terdeteksi di pipeline inferensi. Setelah dilatih, model didaftarkan ke dalam registri model pusat untuk disetujui oleh pemberi persetujuan model. Jika disetujui, versi model yang diperbarui digunakan untuk menghasilkan prediksi melalui jalur inferensi.
Infrastruktur sebagai kode – Infrastruktur sebagai kode (IaC), dibuat menggunakan Terraform HashiCorp, mendukung penjadwalan alur inferensi dengan EventBridge, yang memicu alur kereta berdasarkan Aturan EventBridge dan mengirim notifikasi menggunakan Layanan Pemberitahuan Sederhana Amazon (Amazon SNS) topik.

arsitektur mlops

Alur kerja MLOps mencakup langkah-langkah berikut:

Akses domain SageMaker Studio di akun pengembangan, kloning repositori GitHub, lakukan proses pengembangan model menggunakan model sampel yang disediakan, dan buat alur pelatihan dan inferensi.
Jalankan alur kereta di akun pengembangan, yang menghasilkan artefak model untuk versi model terlatih dan mendaftarkan model ke SageMaker Model Registry di akun registri model pusat.
Setujui model di SageMaker Model Registry di akun registri model pusat.
Dorong kode (jalur pelatihan dan inferensi, serta kode IaC Terraform untuk membuat jadwal EventBridge, aturan EventBridge, dan topik SNS) ke dalam cabang fitur repositori GitHub. Buat permintaan tarik untuk menggabungkan kode ke dalam cabang utama repositori GitHub.
Memicu alur Jenkins CI/CD, yang disiapkan dengan repositori GitHub. Pipeline CI/CD menyebarkan kode ke akun prod untuk membuat pipeline train dan inferensi bersama dengan kode Terraform untuk menyediakan jadwal EventBridge, aturan EventBridge, dan topik SNS.
Pipeline inferensi dijadwalkan untuk dijalankan setiap hari, sedangkan pipeline train disiapkan untuk dijalankan setiap kali penyimpangan data terdeteksi dari pipeline inferensi.
Notifikasi dikirim melalui topik SNS setiap kali terjadi kegagalan pada train atau pipeline inferensi.

Prasyarat

Untuk solusi ini, Anda harus memiliki prasyarat berikut:

Tiga akun AWS (akun registri model dev, prod, dan pusat)
Domain SageMaker Studio disiapkan di masing-masing dari tiga akun AWS (lihat Masuk ke Amazon SageMaker Studio atau tonton videonya Onboard dengan Cepat ke Amazon SageMaker Studio untuk petunjuk pengaturan)
Jenkins (kami menggunakan Jenkins 2.401.1) dengan hak administratif yang diinstal di AWS
Terraform versi 1.5.5 atau lebih baru diinstal di server Jenkins

Untuk posting ini, kami bekerja di us-east-1 Wilayah untuk menyebarkan solusi.

Menyediakan kunci KMS di akun dev dan prod

Langkah pertama kami adalah menciptakan Layanan Manajemen Kunci AWS (AWS KMS) kunci di akun dev dan prod.

Buat kunci KMS di akun dev dan berikan akses ke akun prod

Selesaikan langkah-langkah berikut untuk membuat kunci KMS di akun dev:

Di konsol AWS KMS, pilih Kunci yang dikelola pelanggan di panel navigasi.
Pilih Buat kunci.
Untuk Jenis kunci, pilih Simetris.
Untuk Penggunaan kunci, pilih Enkripsi dan dekripsi.
Pilih Selanjutnya.
Masukkan nomor akun produksi untuk memberikan akses akun produksi ke kunci KMS yang disediakan di akun dev. Ini adalah langkah yang diperlukan karena pertama kali model dilatih di akun dev, artefak model dienkripsi dengan kunci KMS sebelum ditulis ke bucket S3 di akun registri model pusat. Akun produksi memerlukan akses ke kunci KMS untuk mendekripsi artefak model dan menjalankan pipa inferensi.
Pilih Selanjutnya dan selesaikan pembuatan kunci Anda.

Setelah kunci disediakan, kunci tersebut akan terlihat di konsol AWS KMS.

kunci kms di konsol

Buat kunci KMS di akun prod

Lakukan langkah yang sama di bagian sebelumnya untuk membuat kunci KMS yang dikelola pelanggan di akun prod. Anda dapat melewati langkah untuk membagikan kunci KMS ke akun lain.

Siapkan bucket S3 artefak model di akun registri model pusat

Buat bucket S3 pilihan Anda dengan string sagemaker dalam konvensi penamaan sebagai bagian dari nama bucket di akun registri model pusat, dan perbarui kebijakan bucket di bucket S3 untuk memberikan izin dari akun dev dan prod untuk membaca dan menulis artefak model ke dalam bucket S3.

Kode berikut adalah kebijakan bucket yang akan diperbarui pada bucket S3:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPerm", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm1", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<dev-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] }, { "Sid": "AddPerm2", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": [ "s3:PutObject", "s3:PutObjectAcl", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "AddPerm3", "Effect": "Allow", "Principal": { "AWS": "arn:aws:iam::<prod-account-id>:root" }, "Action": "s3:ListBucket", "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Siapkan IAM role di akun AWS Anda

Langkah selanjutnya adalah mengatur Identitas AWS dan Manajemen Akses (IAM) peran di akun AWS Anda dengan izin untuk AWS Lambda, SageMaker, dan Jenkins.

Peran eksekusi Lambda

Mendirikan Peran eksekusi Lambda di akun dev dan prod, yang akan digunakan oleh fungsi Lambda yang dijalankan sebagai bagian dari Langkah Lambda Jalur Pipa SageMaker. Langkah ini akan dijalankan dari pipeline inferensi untuk mengambil model terbaru yang disetujui, yang akan digunakan untuk menghasilkan inferensi. Buat peran IAM di akun dev dan prod dengan konvensi penamaan arn:aws:iam::<account-id>:role/lambda-sagemaker-role dan lampirkan kebijakan IAM berikut:

Kebijakan 1 – Buat kebijakan inline bernama cross-account-model-registry-access, yang memberikan akses ke paket model yang diatur dalam registri model di akun pusat:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:ListModelPackages", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package/mammo-severity-model-package/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": "sagemaker:DescribeModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Kebijakan 2 - Menempel AmazonSageMakerAkses Penuh, yang merupakan kebijakan yang dikelola AWS yang memberikan akses penuh ke SageMaker. Ini juga menyediakan akses tertentu ke layanan terkait, seperti Penskalaan Otomatis Aplikasi AWS, Amazon S3, Registry Kontainer Elastis Amazon (Amazon ECR), dan Log Amazon CloudWatch.
Kebijakan 3 - Menempel AWSLambda_Akses Penuh, yang merupakan kebijakan terkelola AWS yang memberikan akses penuh ke Lambda, fitur konsol Lambda, dan layanan AWS terkait lainnya.

Kebijakan 4 – Gunakan kebijakan kepercayaan IAM berikut untuk peran IAM:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "lambda.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

Peran eksekusi SageMaker

Domain SageMaker Studio yang disiapkan di akun dev dan prod masing-masing harus memiliki peran eksekusi yang terkait, yang dapat ditemukan di setting domain tab di halaman detail domain, seperti yang ditunjukkan pada tangkapan layar berikut. Peran ini digunakan untuk menjalankan tugas pelatihan, tugas pemrosesan, dan lainnya dalam domain SageMaker Studio.

domain studio pembuat sage

Tambahkan kebijakan berikut ke peran eksekusi SageMaker di kedua akun:

Kebijakan 1 – Buat kebijakan inline bernama cross-account-model-artifacts-s3-bucket-access, yang memberikan akses ke bucket S3 di akun registri model pusat, yang menyimpan artefak model:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": [ "s3:PutObject", "s3:GetObject", "s3:GetObjectVersion" ], "Resource": "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" }, { "Sid": "VisualEditor1", "Effect": "Allow", "Action": [ "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>", "arn:aws:s3:::<s3-bucket-in-central-model-registry-account>/*" ] } ]
}

Kebijakan 2 – Buat kebijakan inline bernama cross-account-model-registry-access, yang memberikan akses ke paket model di registri model di akun registri model pusat:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sagemaker:CreateModelPackageGroup", "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" } ]
}

Kebijakan 3 – Buat kebijakan inline bernama kms-key-access-policy, yang memberikan akses ke kunci KMS yang dibuat pada langkah sebelumnya. Berikan ID akun tempat kebijakan dibuat dan ID kunci KMS yang dibuat di akun tersebut.

{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInThisAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<account-id>:key/<kms-key-id>" } ]
}

Kebijakan 4 - Menempel AmazonSageMakerAkses Penuh, yang merupakan kebijakan yang dikelola AWS yang memberikan akses penuh ke SageMaker dan memilih akses ke layanan terkait.
Kebijakan 5 - Menempel AWSLambda_Akses Penuh, yang merupakan kebijakan terkelola AWS yang memberikan akses penuh ke Lambda, fitur konsol Lambda, dan layanan AWS terkait lainnya.
Kebijakan 6 - Menempel CloudWatchEventsAkses Penuh, yang merupakan kebijakan terkelola AWS yang memberikan akses penuh ke CloudWatch Events.

Kebijakan 7 – Tambahkan kebijakan kepercayaan IAM berikut untuk IAM role eksekusi SageMaker:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": [ "events.amazonaws.com", "sagemaker.amazonaws.com" ] }, "Action": "sts:AssumeRole" } ]
}

Kebijakan 8 (khusus untuk peran eksekusi SageMaker di akun prod) – Buat kebijakan inline bernama cross-account-kms-key-access-policy, yang memberikan akses ke kunci KMS yang dibuat di akun dev. Hal ini diperlukan agar alur inferensi membaca artefak model yang disimpan di akun registri model pusat tempat artefak model dienkripsi menggunakan kunci KMS dari akun dev ketika versi pertama model dibuat dari akun dev.
```
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowUseOfKeyInDevAccount", "Effect": "Allow", "Action": [ "kms:Encrypt", "kms:Decrypt", "kms:ReEncrypt*", "kms:GenerateDataKey*", "kms:DescribeKey" ], "Resource": "arn:aws:kms:us-east-1:<dev-account-id>:key/<dev-kms-key-id>" } ]
}
```

Peran Jenkins lintas akun

Siapkan peran IAM yang disebut cross-account-jenkins-role di akun prod, yang akan diasumsikan oleh Jenkins untuk menerapkan pipeline ML dan infrastruktur terkait ke dalam akun prod.

Tambahkan kebijakan IAM terkelola berikut ke peran tersebut:

CloudWatchFullAccess
AmazonS3FullAccess
AmazonSNSFullAccess
AmazonSageMakerFullAccess
AmazonEventBridgeFullAccess
AWSLambda_FullAccess

Perbarui hubungan kepercayaan pada peran untuk memberikan izin ke akun AWS yang menghosting server Jenkins:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com", "AWS": "arn:aws:iam::<jenkins-account-id>:root" }, "Action": "sts:AssumeRole", "Condition": {} } ]
}

Perbarui izin pada IAM role yang terkait dengan server Jenkins

Dengan asumsi bahwa Jenkins telah diatur di AWS, perbarui peran IAM yang terkait dengan Jenkins untuk menambahkan kebijakan berikut, yang akan memberi Jenkins akses untuk menerapkan sumber daya ke akun prod:

Kebijakan 1 – Buat kebijakan inline berikut bernama assume-production-role-policy:

{ "Version": "2012-10-17", "Statement": [ { "Sid": "VisualEditor0", "Effect": "Allow", "Action": "sts:AssumeRole", "Resource": "arn:aws:iam::<prod-account-id>:role/cross-account-jenkins-role" } ]
}

Kebijakan 2 – Lampirkan CloudWatchFullAccess kebijakan IAM yang dikelola.

Siapkan grup paket model di akun registri model pusat

Dari domain SageMaker Studio di akun registri model pusat, buat grup paket model yang disebut mammo-severity-model-package menggunakan cuplikan kode berikut (yang dapat Anda jalankan menggunakan notebook Jupyter):

import boto3 model_package_group_name = "mammo-severity-model-package"
sm_client = boto3.Session().client("sagemaker") create_model_package_group_response = sm_client.create_model_package_group( ModelPackageGroupName=model_package_group_name, ModelPackageGroupDescription="Cross account model package group for mammo severity model", ) print('ModelPackageGroup Arn : {}'.format(create_model_package_group_response['ModelPackageGroupArn']))

Siapkan akses ke paket model untuk peran IAM di akun dev dan prod

Menyediakan akses ke peran eksekusi SageMaker yang dibuat di akun dev dan prod sehingga Anda dapat mendaftarkan versi model dalam paket model mammo-severity-model-package di registri model pusat dari kedua akun. Dari domain SageMaker Studio di akun registri model pusat, jalankan kode berikut di notebook Jupyter:

import json import boto3 model_package_group_name = "mammo-severity-model-package"
# Convert the policy from JSON dict to string
model_package_group_policy = dict(
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AddPermModelPackageGroupCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackageGroup" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package-group/mammo-severity-model-package" }, { "Sid": "AddPermModelPackageVersionCrossAccount", "Effect": "Allow", "Principal": { "AWS": ["arn:aws:iam::<dev-account-id>:root", "arn:aws:iam::<prod-account-id>:root"] }, "Action": [ "sagemaker:DescribeModelPackage", "sagemaker:ListModelPackages", "sagemaker:UpdateModelPackage", "sagemaker:CreateModelPackage", "sagemaker:CreateModel" ], "Resource": "arn:aws:sagemaker:us-east-1:<central-model-registry-account>:model-package/mammo-severity-model-package/*" } ]
})
model_package_group_policy = json.dumps(model_package_group_policy)
# Add Policy to the model package group
sm_client = boto3.Session().client("sagemaker")
response = sm_client.put_model_package_group_policy( ModelPackageGroupName = model_package_group_name, ResourcePolicy = model_package_group_policy)

Siapkan Jenkins

Di bagian ini, kami mengonfigurasi Jenkins untuk membuat pipeline ML dan infrastruktur Terraform yang sesuai di akun prod melalui pipeline Jenkins CI/CD.

Di konsol CloudWatch, buat grup log bernama jenkins-log dalam akun prod tempat Jenkins akan mengirim log dari pipeline CI/CD. Grup log harus dibuat di Wilayah yang sama dengan tempat server Jenkins disiapkan.
Instal plugin berikut di server Jenkins Anda:
1. Pekerjaan DSL
2. pergi
3. Pipa saluran
4. Saluran Pipa: Langkah AWS
5. Langkah-Langkah Utilitas Saluran Pipa
Siapkan kredensial AWS di Jenkins menggunakan IAM role lintas akun (cross-account-jenkins-role) disediakan di akun prod.
Untuk system Configuration, pilih AWS.
Berikan kredensial dan grup log CloudWatch yang Anda buat sebelumnya.
Siapkan kredensial GitHub dalam Jenkins.
Buat proyek baru di Jenkins.
Masukkan nama proyek dan pilih Pipa saluran.
pada Umum tab, pilih Proyek GitHub dan masukkan bercabang Repositori GitHub URL.
Pilih Proyek ini diparameterisasi.
pada Tambahkan Parameter menu, pilih Parameter Tali.
Untuk Nama, Masuk prodAccount.
Untuk Nilai default, masukkan ID akun prod.
Bawah Opsi Proyek Tingkat Lanjut, Untuk Definisi, pilih Skrip saluran pipa dari SCM.
Untuk SCM, pilih pergi.
Untuk URL repositori, masukkan bercabang Repositori GitHub URL.
Untuk Surat kepercayaan, masukkan kredensial GitHub yang disimpan di Jenkins.
Enter main dalam Cabang untuk dibangun bagian, berdasarkan saluran CI/CD mana yang akan dipicu.
Untuk Jalur Skrip, Masuk Jenkinsfile.
Pilih Save.

Pipeline Jenkins harus dibuat dan terlihat di dasbor Anda.

Sediakan bucket S3, kumpulkan dan siapkan data

Selesaikan langkah-langkah berikut untuk menyiapkan bucket dan data S3 Anda:

Buat bucket S3 pilihan Anda dengan string sagemaker dalam konvensi penamaan sebagai bagian dari nama keranjang di akun dev dan prod untuk menyimpan kumpulan data dan artefak model.
Siapkan bucket S3 untuk mempertahankan status Terraform di akun prod.
Unduh dan simpan tersedia untuk umum Massa Mamografi UCI dataset ke bucket S3 yang Anda buat sebelumnya di akun dev.
Garpu dan kloning Repositori GitHub dalam domain SageMaker Studio di akun dev. Repo memiliki struktur folder berikut:
- /environments – Skrip konfigurasi untuk lingkungan prod
- /mlops-infra – Kode untuk menerapkan layanan AWS menggunakan kode Terraform
- /pipa – Kode untuk komponen saluran SageMaker
- Jenkinsfile – Skrip untuk diterapkan melalui pipeline Jenkins CI/CD
- setup.py – Diperlukan untuk menginstal modul Python yang diperlukan dan membuat perintah run-pipeline
- mammografi-keparahan-modeling.ipynb – Memungkinkan Anda membuat dan menjalankan alur kerja ML
Buat folder bernama data di dalam folder repositori GitHub yang dikloning dan simpan salinannya ke publik Massa Mamografi UCI Himpunan data.
Ikuti buku catatan Jupyter mammography-severity-modeling.ipynb.

Jalankan kode berikut di notebook untuk melakukan praproses himpunan data dan mengunggahnya ke bucket S3 di akun dev:

import boto3
import sagemaker
import numpy as np
import pandas as pd
from sklearn.compose import ColumnTransformer
from sklearn.impute import SimpleImputer
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler, OneHotEncoder #Replace the values based on the resoures created
default_bucket = "<s3-bucket-in-dev-account>"
model_artifacts_bucket = "<s3-bucket-in-central-model-registry-account>"
region = "us-east-1"
model_name = "mammography-severity-model"
role = sagemaker.get_execution_role()
lambda_role = "arn:aws:iam::<dev-account-id>:role/lambda-sagemaker-role"
kms_key = "arn:aws:kms:us-east-1:<dev-account-id>:key/<kms-key-id-in-dev-account>"
model_package_group_name="arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package" feature_columns_names = [ 'BIRADS', 'Age', 'Shape', 'Margin', 'Density',
]
feature_columns_dtype = { 'BIRADS': np.float64, 'Age': np.float64, 'Shape': np.float64, 'Margin': np.float64, 'Density': np.float64,
} # read raw dataset
mammographic_data = pd.read_csv("data/mammographic_masses.data",header=None) # split data into batch and raw datasets
batch_df =mammographic_data.sample(frac=0.05,random_state=200)
raw_df =mammographic_data.drop(batch_df.index) # Split the raw datasets to two parts, one of which will be used to train
#the model initially and then other dataset will be leveraged when #retraining the model
train_dataset_part2 =raw_df.sample(frac=0.1,random_state=200)
train_dataset_part1 =raw_df.drop(train_dataset_part2.index) # save the train datasets train_dataset_part1.to_csv("data/mammo-train-dataset-part1.csv",index=False)
train_dataset_part2.to_csv("data/mammo-train-dataset-part2.csv",index=False) # remove label column from the batch dataset which will be used to generate inferences
batch_df.drop(5,axis=1,inplace=True) # create a copy of the batch dataset batch_modified_df = batch_df def preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df): batch_df.replace("?", "NaN", inplace = True) batch_df.columns = feature_columns_names batch_df = batch_df.astype(feature_columns_dtype) numeric_transformer = Pipeline( steps=[("imputer", SimpleImputer(strategy="median"))] ) numeric_features = list(feature_columns_names) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features) ] ) batch_df = preprocess.fit_transform(batch_df) return batch_df # save the batch dataset file
batch_df = preprocess_batch_data(feature_columns_names,feature_columns_dtype,batch_df)
pd.DataFrame(batch_df).to_csv("data/mammo-batch-dataset.csv", header=False, index=False) # modify batch dataset to introduce missing values
batch_modified_df.replace("?", "NaN", inplace = True)
batch_modified_df.columns = feature_columns_names
batch_modified_df = batch_modified_df.astype(feature_columns_dtype) # save the batch dataset with outliers file
batch_modified_df.to_csv("data/mammo-batch-dataset-outliers.csv",index=False)

Kode ini akan menghasilkan kumpulan data berikut:

- data/ mammo-train-dataset-part1.csv – Akan digunakan untuk melatih model versi pertama.
- data/ mammo-train-dataset-part2.csv – Akan digunakan untuk melatih model versi kedua bersama dengan dataset mammo-train-dataset-part1.csv.
- data/mammo-batch-dataset.csv – Akan digunakan untuk menghasilkan kesimpulan.
- data/mammo-batch-dataset-outliers.csv – Akan memasukkan outlier ke dalam kumpulan data yang akan menggagalkan jalur inferensi. Ini akan memungkinkan kami menguji pola untuk memicu pelatihan ulang model secara otomatis.

Unggah kumpulan data mammo-train-dataset-part1.csv di bawah awalan mammography-severity-model/train-dataset, dan unggah kumpulan data mammo-batch-dataset.csv dan mammo-batch-dataset-outliers.csv ke awalan mammography-severity-model/batch-dataset dari bucket S3 yang dibuat di akun dev:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("data/mammo-train-dataset-part1.csv","mammography-severity-model/data/train-dataset/mammo-train-dataset-part1.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset.csv")
s3_client.Bucket(default_bucket).upload_file("data/mammo-batch-dataset-outliers.csv","mammography-severity-model/data/batch-dataset/mammo-batch-dataset-outliers.csv")

Unggah kumpulan data mammo-train-dataset-part1.csv dan mammo-train-dataset-part2.csv di bawah awalan mammography-severity-model/train-dataset ke dalam bucket S3 yang dibuat di akun prod melalui konsol Amazon S3.
Unggah kumpulan data mammo-batch-dataset.csv dan mammo-batch-dataset-outliers.csv ke awalan mammography-severity-model/batch-dataset dari bucket S3 di akun prod.

Jalankan jalur pipa kereta

Bawah <project-name>/pipelines/train, Anda dapat melihat skrip Python berikut:

skrip/raw_preprocess.py – Terintegrasi dengan Pemrosesan SageMaker untuk rekayasa fitur
skrip/evaluate_model.py – Memungkinkan penghitungan metrik model, dalam hal ini auc_score
train_pipeline.py – Berisi kode untuk alur pelatihan model

Selesaikan langkah-langkah berikut:

Unggah skrip ke Amazon S3:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/raw_preprocess.py","mammography-severity-model/scripts/raw_preprocess.py")
s3_client.Bucket(default_bucket).upload_file("pipelines/train/scripts/evaluate_model.py","mammography-severity-model/scripts/evaluate_model.py")

Dapatkan contoh jalur pipa kereta:

from pipelines.train.train_pipeline import get_pipeline train_pipeline = get_pipeline( region=region, role=role, default_bucket=default_bucket, model_artifacts_bucket=model_artifacts_bucket, model_name = model_name, kms_key = kms_key, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-train-pipeline", base_job_prefix="mammo-severity", ) train_pipeline.definition()

Kirimkan jalur kereta api dan jalankan:

train_pipeline.upsert(role_arn=role)
train_execution = train_pipeline.start()

Gambar berikut menunjukkan keberhasilan menjalankan alur pelatihan. Langkah terakhir dalam alur mendaftarkan model di akun registri model pusat.

Setujui model di registri model pusat

Masuk ke akun registri model pusat dan akses registri model SageMaker dalam domain SageMaker Studio. Ubah status versi model menjadi Disetujui.

Setelah disetujui, statusnya harus diubah pada versi model.

Jalankan pipa inferensi (Opsional)

Langkah ini tidak diperlukan tetapi Anda masih dapat menjalankan alur inferensi untuk menghasilkan prediksi di akun pengembang.

Bawah <project-name>/pipelines/inference, Anda dapat melihat skrip Python berikut:

skrip/lambda_helper.py – Menarik versi model terbaru yang disetujui dari akun registri model pusat menggunakan langkah SageMaker Pipelines Lambda
inference_pipeline.py – Berisi kode untuk pipa inferensi model

Selesaikan langkah-langkah berikut:

Unggah skrip ke bucket S3:

import boto3
s3_client = boto3.resource('s3')
s3_client.Bucket(default_bucket).upload_file("pipelines/inference/scripts/lambda_helper.py","mammography-severity-model/scripts/lambda_helper.py")

Dapatkan instance pipeline inferensi menggunakan kumpulan data batch normal:

from pipelines.inference.inference_pipeline import get_pipeline inference_pipeline = get_pipeline( region=region, role=role, lambda_role = lambda_role, default_bucket=default_bucket, kms_key=kms_key, model_name = model_name, model_package_group_name= model_package_group_name, pipeline_name="mammo-severity-inference-pipeline", batch_dataset_filename = "mammo-batch-dataset" )

Kirimkan pipa inferensi dan jalankan:

inference_pipeline.upsert(role_arn=role)
inference_execution = inference_pipeline.start()

Gambar berikut menunjukkan keberhasilan menjalankan pipa inferensi. Langkah terakhir dalam pipeline menghasilkan prediksi dan menyimpannya di bucket S3. Kita gunakan MonitorBatchTransformStep untuk memantau masukan ke dalam pekerjaan transformasi batch. Jika terdapat outlier, pipeline inferensi akan mengalami status gagal.

Jalankan alur Jenkins

Grafik environment/ folder dalam repositori GitHub berisi skrip konfigurasi untuk akun prod. Selesaikan langkah-langkah berikut untuk memicu alur Jenkins:

Perbarui skrip konfigurasi prod.tfvars.json berdasarkan sumber daya yang dibuat pada langkah sebelumnya:

{ "env_group": "prod", "aws_region": "us-east-1", "event_bus_name": "default", "pipelines_alert_topic_name": "mammography-model-notification", "email":"admin@org.com", "lambda_role":"arn:aws:iam::<prod-account-id>:role/lambda-sagemaker-role", "default_bucket":"<s3-bucket-in-prod-account>", "model_artifacts_bucket": "<s3-bucket-in-central-model-registry-account>", "kms_key": "arn:aws:kms:us-east-1:<prod-account-id>:key/<kms-key-id-in-prod-account>", "model_name": "mammography-severity-model", "model_package_group_name":"arn:aws:sagemaker:us-east-1:<central-model-registry-account-id>:model-package-group/mammo-severity-model-package", "train_pipeline_name":"mammo-severity-train-pipeline", "inference_pipeline_name":"mammo-severity-inference-pipeline", "batch_dataset_filename":"mammo-batch-dataset", "terraform_state_bucket":"<s3-bucket-terraform-state-in-prod-account>", "train_pipeline": { "name": "mammo-severity-train-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-train-pipeline", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" }, "inference_pipeline": { "name": "mammo-severity-inference-pipeline", "arn": "arn:aws:sagemaker:us-east-1:<prod-account-id>:pipeline/mammo-severity-inference-pipeline", "cron_schedule": "cron(0 23 * * ? *)", "role_arn": "arn:aws:iam::<prod-account-id>:role/service-role/<sagemaker-execution-role-in-prod-account>" } }

Setelah diperbarui, masukkan kode ke dalam repositori GitHub bercabang dan gabungkan kode ke dalam cabang utama.
Buka Jenkins UI, pilih Bangun dengan Parameter, dan memicu alur CI/CD yang dibuat pada langkah sebelumnya.

Ketika pembangunan selesai dan berhasil, Anda dapat masuk ke akun prod dan melihat alur pelatihan dan inferensi dalam domain SageMaker Studio.

Selain itu, Anda akan melihat tiga aturan EventBridge di konsol EventBridge di akun prod:

Jadwalkan alur inferensi
Kirim pemberitahuan kegagalan pada jalur kereta
Jika alur inferensi gagal memicu alur kereta, kirimkan pemberitahuan

Terakhir, Anda akan melihat topik notifikasi SNS di konsol Amazon SNS yang mengirimkan notifikasi melalui email. Anda akan mendapatkan email yang meminta Anda untuk mengonfirmasi penerimaan email pemberitahuan ini.

Uji alur inferensi menggunakan kumpulan data batch tanpa outlier

Untuk menguji apakah pipa inferensi berfungsi seperti yang diharapkan di akun prod, kita dapat masuk ke akun prod dan memicu pipa inferensi menggunakan kumpulan data batch tanpa outlier.

Jalankan alur melalui konsol SageMaker Pipelines di domain SageMaker Studio dari akun prod, di mana transform_input akan menjadi URI S3 dari kumpulan data tanpa outlier (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset.csv).

Alur inferensi berhasil dan menulis prediksi kembali ke bucket S3.

Uji alur inferensi menggunakan kumpulan data batch dengan outlier

Anda dapat menjalankan alur inferensi menggunakan kumpulan data batch dengan outlier untuk memeriksa apakah mekanisme pelatihan ulang otomatis berfungsi seperti yang diharapkan.

Jalankan alur melalui konsol SageMaker Pipelines di domain SageMaker Studio dari akun prod, di mana transform_input akan menjadi URI S3 dari kumpulan data dengan outlier (s3://<s3-bucket-in-prod-account>/mammography-severity-model/data/mammo-batch-dataset-outliers.csv).

Pipa inferensi gagal seperti yang diharapkan, yang memicu aturan EventBridge, yang pada gilirannya memicu pipa kereta.

Setelah beberapa saat, Anda akan melihat proses baru dari alur kereta di konsol SageMaker Pipelines, yang mengambil dua himpunan data kereta yang berbeda (mammo-train-dataset-part1.csv dan mammo-train-dataset-part2.csv) diunggah ke bucket S3 untuk melatih ulang model.

Anda juga akan melihat pemberitahuan dikirim ke email yang berlangganan topik SNS.

Untuk menggunakan versi model yang diperbarui, masuk ke akun registri model pusat dan setujui versi model, yang akan diambil selama pengoperasian pipa inferensi berikutnya yang dipicu melalui aturan EventBridge terjadwal.

Meskipun alur pelatihan dan inferensi menggunakan URL himpunan data statis, Anda dapat meneruskan URL himpunan data ke alur pelatihan dan inferensi sebagai variabel dinamis untuk menggunakan himpunan data yang diperbarui guna melatih ulang model dan menghasilkan prediksi dalam skenario dunia nyata.

Membersihkan

Untuk menghindari timbulnya biaya di masa mendatang, selesaikan langkah-langkah berikut:

Hapus domain SageMaker Studio di semua akun AWS.
Hapus semua sumber daya yang dibuat di luar SageMaker, termasuk bucket S3, peran IAM, aturan EventBridge, dan topik SNS yang disiapkan melalui Terraform di akun prod.
Hapus alur SageMaker yang dibuat di seluruh akun menggunakan Antarmuka Baris Perintah AWS (AWS CLI).

Kesimpulan

Organisasi sering kali perlu menyelaraskan perangkat di seluruh perusahaan untuk memungkinkan kolaborasi di berbagai area fungsional dan tim. Kolaborasi ini memastikan platform MLOps Anda dapat beradaptasi dengan kebutuhan bisnis yang terus berkembang dan mempercepat penerapan ML di seluruh tim. Posting ini menjelaskan cara membuat kerangka kerja MLOps dalam pengaturan multi-lingkungan untuk mengaktifkan pelatihan ulang model otomatis, inferensi batch, dan pemantauan dengan Amazon SageMaker Model Monitor, pembuatan versi model dengan SageMaker Model Registry, dan promosi kode dan pipeline ML di seluruh lingkungan dengan a Pipa CI/CD. Kami memamerkan solusi ini menggunakan kombinasi layanan AWS dan perangkat pihak ketiga. Untuk petunjuk penerapan solusi ini, lihat Repositori GitHub. Anda juga dapat memperluas solusi ini dengan menggunakan sumber data dan kerangka pemodelan Anda sendiri.

Tentang Penulis

Gayatri Ghanakota adalah Insinyur Pembelajaran Mesin Senior dengan Layanan Profesional AWS. Dia bersemangat mengembangkan, menerapkan, dan menjelaskan solusi AI/ML di berbagai domain. Sebelum peran ini, ia memimpin berbagai inisiatif sebagai ilmuwan data dan insinyur ML dengan perusahaan global terkemuka di bidang keuangan dan ritel. Dia meraih gelar master di bidang Ilmu Komputer dengan spesialisasi Ilmu Data dari University of Colorado, Boulder.

Sunita Koppar adalah Sr. Arsitek Data Lake dengan Layanan Profesional AWS. Dia bersemangat memecahkan masalah pelanggan dengan memproses data besar dan menyediakan solusi skalabel jangka panjang. Sebelum menjalankan peran ini, ia mengembangkan produk di domain internet, telekomunikasi, dan otomotif, dan telah menjadi pelanggan AWS. Dia meraih gelar master di bidang Ilmu Data dari University of California, Riverside.

Mempromosikan pipeline dalam pengaturan multi-lingkungan menggunakan Amazon SageMaker Model Registry, HashiCorp Terraform, GitHub, dan Jenkins CI/CD | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai. Saswata Dash adalah Konsultan DevOps dengan Layanan Profesional AWS. Dia telah bekerja dengan pelanggan di bidang perawatan kesehatan dan ilmu hayati, penerbangan, dan manufaktur. Dia sangat tertarik dengan segala hal mengenai otomatisasi dan memiliki pengalaman komprehensif dalam merancang dan membangun solusi pelanggan skala perusahaan di AWS. Di luar pekerjaan, ia menekuni minatnya pada fotografi dan menyaksikan matahari terbit.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/promote-pipelines-in-a-multi-environment-setup-using-amazon-sagemaker-model-registry-hashicorp-terraform-github-and-jenkins-ci-cd/

Stempel Waktu: November 9, 2023

Stempel Waktu: November 14, 2023

Diterbitkan Ulang Oleh Plato

Konfigurasikan slot DTMF dan pesan perintah coba lagi dengan Amazon Lex

Rekonstruksi pencitraan medis berbasis cloud menggunakan jaringan saraf dalam

Percepat tanggap bencana dengan visi komputer untuk citra satelit menggunakan Amazon SageMaker dan Amazon Augmented AI

Amazon SageMaker dengan TensorBoard: Gambaran umum pengalaman TensorBoard yang dihosting

Memanfaatkan kecerdasan buatan dan pembelajaran mesin di Parsons dengan AWS DeepRacer

Buat data sintetis untuk pipeline visi komputer di AWS

Cegah pengambilalihan akun saat masuk dengan model Wawasan Pengambilalihan Akun baru di Amazon Fraud Detector

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun