Brug Amazon SageMaker-modelkortdeling til at forbedre modelstyring

Genudgivet af Platon

Abonnenter: 0

Efterhånden som teknologier til kunstig intelligens (AI) og Machine Learning (ML) er blevet mainstream, har mange virksomheder haft succes med at bygge kritiske forretningsapplikationer drevet af ML-modeller i stor skala i produktionen. Men da disse ML-modeller træffer kritiske forretningsbeslutninger for virksomheden, er det vigtigt for virksomheder at tilføje ordentlige autoværn gennem deres ML-livscyklus. Guardrails sikrer, at sikkerheden, privatlivets fred og kvaliteten af koden, konfigurationen og data- og modelkonfigurationen, der bruges i modellens livscyklus, er versioneret og bevaret.

Implementering af disse autoværn bliver sværere for virksomheder, fordi ML-processerne og aktiviteterne i virksomhederne bliver mere komplekse på grund af inddragelsen af dybt involverede processer, der kræver bidrag fra flere interessenter og personer. Ud over dataingeniører og dataforskere har der været inklusion af operationelle processer for at automatisere og strømline ML-livscyklussen. Derudover kræver stigningen af forretningsinteressenter og i nogle tilfælde juridiske og overholdelsesgennemgange kapaciteter til at tilføje gennemsigtighed til styring af adgangskontrol, aktivitetssporing og rapportering på tværs af ML-livscyklussen.

Den ramme, der giver systematisk synlighed i udvikling, validering og brug af ML-modeller, kaldes ML-governance. Under AWS re:Invent 2022, AWS introducerede nye ML-styringsværktøjer forum Amazon SageMaker som forenkler adgangskontrol og øger gennemsigtigheden over dine ML-projekter. Et af de tilgængelige værktøjer som en del af ML-styringen er Amazon SageMaker-modelkort, som har evnen til at skabe en enkelt kilde til sandhed for modelinformation ved at centralisere og standardisere dokumentation gennem hele modellens livscyklus.

SageMaker modelkort giver dig mulighed for at standardisere, hvordan modeller dokumenteres, og derved opnå synlighed i en models livscyklus, lige fra design, bygning, træning og evaluering. Modelkort er beregnet til at være en enkelt kilde til sandhed for forretningsmæssige og tekniske metadata om modellen, som pålideligt kan bruges til revisions- og dokumentationsformål. De giver et faktaark over den model, der er vigtig for modelstyring.

Når du skalerer dine modeller, projekter og teams, anbefaler vi som bedste praksis, at du vedtager en multikontostrategi, der giver projekt- og teamisolering til udvikling og implementering af ML-modeller. For mere information om forbedring af styringen af dine ML-modeller, se Forbedre styringen af dine maskinlæringsmodeller med Amazon SageMaker.

Arkitektur oversigt

Arkitekturen er implementeret som følger:

Data Science Account - Data Scientists udfører deres eksperimenter i SageMaker Studio og opbygge en MLOps-opsætning til at implementere modeller til iscenesættelse/produktionsmiljøer ved hjælp af SageMaker projekter.
ML Shared Services-konto – MLO'erne, der er oprettet fra Data Science-kontoen, udløser kontinuerlig integration og kontinuerlig levering (CI/CD) pipelines ved hjælp af AWS CodeCommit , AWS CodePipeline.
Udviklerkonto – CI/CD-pipelines vil yderligere udløse ML-pipelines i denne konto, der dækker dataforbehandling, modeltræning og efterbehandling som modelevaluering og -registrering. Output af disse rørledninger vil implementere modellen i SageMaker-endepunkter at blive forbrugt til slutningsformål. Afhængigt af dine styringskrav kan Data Science & Dev-konti flettes til en enkelt AWS-konto.
Datakonto – ML-pipelines, der kører i Dev-kontoen, trækker dataene fra denne konto.
Test- og produktionskonti – CI/CD-pipelines fortsætter udrulningen efter Dev-kontoen for at konfigurere SageMaker-slutpunktskonfigurationen i disse konti.
Sikkerhed og styring – Tjenester som AWS Identity and Access Management (IAM), AWS IAM Identity Center, AWS CloudTrail, AWS Key Management Service (AWS KMS), Amazon CloudWatch og AWS Security Hub vil blive brugt på tværs af disse konti som en del af sikkerhed og styring.

Følgende diagram illustrerer denne arkitektur.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

For mere information om indstilling af skalerbar multi-konto ML-arkitektur, se MLOps-grundlag for virksomheder med Amazon SageMaker.

Vores kunder har brug for evnen til at dele modelkort på tværs af konti for at forbedre synlighed og styring af deres modeller gennem information, der deles på modelkortet. Nu, med deling af modelkort på tværs af konti, kan kunderne nyde fordelene ved multi-konto strategi, mens de har adgang til de tilgængelige modelkort i deres organisation, så de kan fremskynde samarbejdet og sikre styring.

I dette indlæg viser vi, hvordan du opsætter og får adgang til modelkort på tværs af Model Development Lifecycle (MDLC) konti ved hjælp af den nye funktion til deling på tværs af konti på modelkortet. Først vil vi beskrive et scenarie og en arkitektur for opsætning af funktionen til deling på tværs af konti på modelkortet, og derefter dykke dybt ned i hver komponent af, hvordan man opsætter og får adgang til delte modelkort på tværs af konti for at forbedre synlighed og modelstyring.

Løsningsoversigt

Når du bygger ML-modeller, anbefaler vi, at du opsætter en multi-konto-arkitektur for at give arbejdsbelastningsisolering, hvilket forbedrer sikkerheden, pålideligheden og skalerbarheden. For dette indlæg vil vi antage at bygge og implementere en model for Customer Churn use case. Arkitekturdiagrammet, der følger, viser en af de anbefalede tilgange – centraliseret modelkort – til styring af et modelkort i en multi-account Machine Learning Model-Development Lifecycle (MDLC) arkitektur. Du kan dog også bruge en anden tilgang, et nav-og-eger-modelkort. I dette indlæg vil vi kun fokusere på en centraliseret modelkorttilgang, men de samme principper kan udvides til en hub-and-spoke tilgang. Den største forskel er, at hver eger-konto vil opretholde deres egen version af modelkort, og den vil have processer til at samle og kopiere til en centraliseret konto.

Følgende diagram illustrerer denne arkitektur.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Arkitekturen er implementeret som følger:

Lead Data Scientist får besked om at løse Customer Churn-brugssagen ved hjælp af ML, og de starter ML-projektet ved at oprette et modelkort til Customer Churn V1-modellen i Draft-status i ML Shared Services-kontoen
Gennem automatisering deles det modelkort med ML Dev Account
Data Scientist bygger modellen og begynder at udfylde oplysninger via API'er i modelkortet baseret på deres eksperimenteringsresultater, og modelkortets status er indstillet til Afventer gennemgang
Gennem automatisering deles det modelkort med ML-testkontoen
ML Engineer (MLE) kører integrations- og valideringstest i ML testkonto og modellen i det centrale register er markeret Pending Approval
Modelgodkender gennemgår modelresultaterne med den understøttende dokumentation i det centrale modelkort og godkender modelkortet til produktionsimplementering.
Gennem automatisering deles det modelkort med ML Prod-kontoen i skrivebeskyttet tilstand.

Forudsætninger

Før du går i gang, skal du sørge for at have følgende forudsætninger:

to AWS konti.
I begge AWS-konti, en IAM-føderationsrolle med administratoradgang til at gøre følgende:
- Opret, rediger, se og slet modelkort i Amazon SageMaker.
- Opret, rediger, se og slet ressourceandel i AWS RAM.

For mere information henvises til Eksempel på IAM-politikker for AWS RAM.

Opsætning af modelkortdeling

Den konto, hvor modelkortene oprettes, er modelkortkontoen. Brugere på modelkortkontoen deler dem med de delte konti, hvor de kan opdateres. Brugere på modelkortkontoen kan dele deres modelkort igennem AWS Resource Access Manager (AWS RAM). AWS RAM hjælper dig med at dele ressourcer på tværs af AWS-konti.

I det følgende afsnit viser vi, hvordan man deler modelkort.

Først skal du oprette et modelkort til en Customer Churn-brugssag som tidligere beskrevet. På Amazon SageMaker-konsollen skal du udvide sektionen Governance og vælge Modelkort.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Vi laver modelkortet i Udkast til status med navnet Kunde-Churn-Model-Card. For mere information, se Lav et modelkort. I denne demonstration kan du lade resten af felterne stå tomme og oprette modelkortet.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Alternativt kan du bruge følgende AWS CLI-kommando til at oprette modelkortet:

aws sagemaker create-model-card --model-card-name Customer-Churn-Model-Card --content "{"model_overview": {"model_owner": "model-owner","problem_type": "Customer Churn Model"}}" --model-card-status Draft

Opret nu andelen på tværs af konti ved hjælp af AWS RAM. I AWS RAM-konsollen skal du vælge Opret en ressourceandel.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Indtast et navn for ressourceandelen, for eksempel "Kunde-Churn-Model-Card-Share". I ressourcerne – valgfri sektion, vælg ressourcetypen som SageMaker modelkort. Modelkortet, vi oprettede i det foregående trin, vises i listen.

Vælg den model, og den vises i afsnittet Valgte ressourcer. Vælg den ressource igen som vist i de følgende trin, og vælg Næste.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

På næste side kan du vælge de administrerede tilladelser. Du kan oprette tilpassede tilladelser eller bruge standardindstillingen "AWSRAMPermissionSageMakerModelCards”Og vælg Næste. For mere information, se Håndtering af tilladelser i AWS RAM.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

På næste side kan du vælge Rektorer. Vælg under Vælg hovedtype AWS konto og indtast ID'et på kontoen for den del af modelkortet. Vælg Tilføj og fortsæt til næste side.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

På den sidste side skal du gennemgå oplysningerne og vælge "Opret ressourcedeling". Alternativt kan du bruge følgende AWS CLI kommando for at oprette en ressourceandel:

aws ram create-resource-share --name <Name of the Model Card> aws ram associate-resource-share --resource-share-arn <ARN of resource share create from the previous command> --resource-arns <ARN of the Model Card>

På AWS RAM-konsollen ser du attributterne for ressourceandelen. Sørg for, at delte ressourcer, administrerede tilladelser og delte principper er i "Associated”Status.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Når du har brugt AWS RAM til at oprette en ressourceshare, kan de principper, der er angivet i ressourceandelen, få adgang til sharens ressourcer.

Hvis du slår AWS RAM-deling til med AWS-organisationer, og dine rektorer, som du deler med, er i samme organisation som delingskontoen, kan disse rektorer få adgang, så snart deres kontoadministrator giver dem tilladelser.
Hvis du ikke slår AWS RAM-deling til med organisationer, kan du stadig dele ressourcer med individuelle AWS-konti, der er i din organisation. Administratoren på den forbrugende konto modtager en invitation til at deltage i ressourceandelen, og de skal acceptere invitationen, før de principaler, der er angivet i ressourceandelen, kan få adgang til de delte ressourcer.
Du kan også dele med konti uden for din organisation, hvis ressourcetypen understøtter det. Administratoren på den forbrugende konto modtager en invitation til at deltage i ressourceandelen, og de skal acceptere invitationen, før de principaler, der er angivet i ressourceandelen, kan få adgang til de delte ressourcer.

For mere information om AWS RAM, se Vilkår og koncepter for AWS RAM.

Adgang til delte modelkort

Nu kan vi logge ind på den delte AWS-konto for at få adgang til modelkortet. Sørg for, at du får adgang til AWS-konsollen ved hjælp af IAM-tilladelser (IAM-rolle), som tillader adgang til AWS RAM.

Med AWS RAM kan du se de ressourceandele, du er blevet tilføjet til, de delte ressourcer, du har adgang til, og de AWS-konti, der har delt ressourcer med dig. Du kan også forlade en ressourcedeling, når du ikke længere har brug for adgang til dens delte ressourcer.

Sådan får du vist modelkortet i den delte AWS-konto:

Naviger til Delt med mig: Delte ressourcer side i AWS RAM-konsollen.
Sørg for, at du opererer i den samme AWS-region, hvor delingen blev oprettet.
Modellen, der deles fra modelkontoen, vil være tilgængelig på listen. Hvis der er en lang liste over ressourcer, kan du anvende et filter til at finde specifikke delte ressourcer. Du kan anvende flere filtre for at indsnævre din søgning.
Følgende oplysninger er tilgængelige:
1. Ressource ID – Ressourcens ID. Dette er navnet på modelkortet, som vi oprettede tidligere i modelkortkontoen.
2. Ressourcetype – Typen af ressource.
3. Sidste delingsdato – Den dato, hvor ressourcen blev delt med dig.
4. Ressourceandele – Antallet af ressourceandele, som ressourcen er inkluderet i. Vælg værdien for at se ressourceandele.
5. Ejer ID – ID'et på den rektor, der ejer ressourcen.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Du kan også få adgang til modelkortet ved at bruge AWS CLI-indstillingen. For AWS IAM-politikken, der er konfigureret med de korrekte legitimationsoplysninger, skal du sørge for, at du har tilladelser til at oprette, redigere og slette modelkort i Amazon SageMaker. For mere information, se Konfigurer AWS CLI.

Du kan bruge følgende AWS IAM-tilladelsespolitik som skabelon:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:DescribeModelCard", "sagemaker:UpdateModelCard", "sagemaker:CreateModelCardExportJob", "sagemaker:ListModelCardVersions", "sagemaker:DescribeModelCardExportJob" ], "Resource": [ "arn:aws:sagemaker:AWS-Region:AWS-model-card-account-id:model-card/example-model-card-name-0", "arn:aws:sagemaker:AWS-Region:AWS-model-card-account-id:model-card/example-model-card-name-1/*" ] }, { "Effect": "Allow", "Action": "s3:PutObject", "Resource": "arn:aws:s3:::Amazon-S3-bucket-storing-the-pdf-of-the-model-card/model-card-name/*" } ]
}

Du kan køre følgende AWS CLI-kommando for at få adgang til detaljerne på det delte modelkort.

aws sagemaker describe-model-card --model-card-name <ARN of the model card>

Nu kan du foretage ændringer på dette modelkort fra denne konto.

aws sagemaker update-model-card --model-card-name <ARN of the Model Card> --content "{"model_overview": {"model_owner": "model-owner","problem_type": "Customer Churn Model"}}"

Når du har foretaget ændringer, skal du gå tilbage til modelkortkontoen for at se de ændringer, vi har foretaget på denne delte konto.

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Problemtypen er blevet opdateret til "Customer Churn Model” som vi havde leveret som en del af AWS CLI-kommandoinputtet.

Ryd op

Du kan nu slette det modelkort, du har oprettet. Sørg for, at du sletter AWS RAM-ressourceandelen, som du oprettede for at dele modelkortet.

Konklusion

I dette indlæg gav vi et overblik over multi-konto arkitektur til at skalere og styre dine ML-arbejdsbelastninger sikkert og pålideligt. Vi diskuterede arkitekturmønstrene for opsætning af modelkortdeling og illustrerede, hvordan centraliserede modelkortdelingsmønstre fungerer. Endelig opsætter vi modelkortdeling på tværs af flere konti for at forbedre synlighed og styring i din modeludviklingslivscyklus. Vi opfordrer dig til at prøve den nye funktion til deling af modelkort og give os din feedback.

Om forfatterne

Use Amazon SageMaker Model Cards sharing to improve model governance | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Vishal Naik er Sr. Solutions Architect hos Amazon Web Services (AWS). Han er en bygherre, der nyder at hjælpe kunder med at opfylde deres forretningsbehov og løse komplekse udfordringer med AWS-løsninger og bedste praksis. Hans kernefokusområde omfatter Machine Learning, DevOps og Containers. I sin fritid elsker Vishal at lave kortfilm om tidsrejser og skiftende universtemaer.

Ram Vittal er Principal ML Solutions Architect hos AWS. Han har over 20 års erfaring med at arkitekte og bygge distribuerede, hybride og cloud-applikationer. Han brænder for at bygge sikker og skalerbar AI/ML og big data-løsninger for at hjælpe virksomhedskunder med deres cloud-adoption og optimeringsrejse for at forbedre deres forretningsresultater. I sin fritid kører han på motorcykel og går tur med sin 2-årige sheep-a-doodle!

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
PlatoESG. Automotive/elbiler, Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
ChartPrime. Løft dit handelsspil med ChartPrime. Adgang her.
BlockOffsets. Modernisering af miljømæssig offset-ejerskab. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/use-amazon-sagemaker-model-cards-sharing-to-improve-model-governance/

Tidsstempel: August 31, 2023

Tidsstempel: November 24, 2023

Genudgivet af Platon

Amazon SageMaker Automatic Model Tuning vælger nu automatisk tuning-konfigurationer for at forbedre brugervenligheden og omkostningseffektiviteten | Amazon Web Services

Start din succesrige rejse med tidsserieprognoser med Amazon Forecast

Brug en generativ AI-grundmodel til at opsummere og besvare spørgsmål ved hjælp af dine egne data | Amazon Web Services

Amazon Personalize lancerer nye opskrifter, der understøtter større varekataloger med lavere forsinkelse | Amazon Web Services

Finjuster effektivt ESM-2-proteinsprogmodellen med Amazon SageMaker | Amazon Web Services

Næste generation af Amazon SageMaker-eksperimenter – Organiser, spor og sammenlign dine maskinlæringstræninger i stor skala

Automatisering af produktbeskrivelsesgenerering med Amazon Bedrock | Amazon Web Services

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto