Schede modello Amazon SageMaker consentono di standardizzare il modo in cui i modelli vengono documentati, ottenendo così visibilità nel ciclo di vita di un modello, dalla progettazione, costruzione, formazione e valutazione. Le schede modello sono destinate a essere un'unica fonte di verità per i metadati aziendali e tecnici sul modello che possono essere utilizzati in modo affidabile per scopi di controllo e documentazione. Forniscono una scheda informativa del modello che è importante per la governance del modello.
Finora le schede modello erano logicamente associate a un modello nel file Registro dei modelli di Amazon SageMaker utilizzando la corrispondenza del nome del modello. Tuttavia, quando risolvono un problema aziendale attraverso un modello di machine learning (ML), mentre i clienti ripetono il problema, creano più versioni del modello e devono rendere operative e governare più versioni del modello. Pertanto, hanno bisogno della possibilità di associare una scheda modello a una particolare versione del modello.
In questo post, discutiamo di una nuova funzionalità che supporta l'integrazione delle schede modello con il registro del modello a livello di versione del modello distribuito. Discuteremo l'architettura della soluzione e le best practice per la gestione delle versioni della scheda modello e spiegheremo come configurare, rendere operativa e governare l'integrazione della scheda modello con la versione del modello nel registro del modello.
Panoramica della soluzione
Le schede dei modelli SageMaker ti aiutano a standardizzare la documentazione dei tuoi modelli dal punto di vista della governance, mentre il registro dei modelli SageMaker ti aiuta a distribuire e rendere operativi i modelli ML. Il registro dei modelli supporta una struttura gerarchica per l'organizzazione e l'archiviazione dei modelli ML con informazioni sui metadati del modello.
Quando un'organizzazione risolve un problema aziendale utilizzando ML, ad esempio una previsione dell'abbandono dei clienti, consigliamo i seguenti passaggi:
- Creare una scheda modello per il problema aziendale da risolvere.
- Creare un gruppo di pacchetti modello per il problema aziendale da risolvere.
- Crea, addestra, valuta e registra la prima versione della versione del pacchetto modello (ad esempio, Customer Churn V1).
- Aggiorna la scheda modello collegando la versione del pacchetto modello alla scheda modello.
- Man mano che esegui l'iterazione sulla nuova versione del pacchetto modello, clona la scheda modello dalla versione precedente e collegala alla nuova versione del pacchetto modello (ad esempio, Customer Churn V2).
La figura seguente illustra come una scheda modello SageMaker si integra con il registro del modello.
Come illustrato nel diagramma precedente, l'integrazione delle schede modello di SageMaker e del registro dei modelli consente di associare una scheda del modello a una versione del modello specifica nel registro dei modelli. Ciò consente di stabilire un'unica fonte di verità per le versioni del modello registrate, con una documentazione completa e standardizzata in tutte le fasi del percorso del modello su SageMaker, facilitando la rilevabilità e promuovendo la governance, la conformità e la responsabilità durante l'intero ciclo di vita del modello.
Best practice per la gestione delle schede modello
Operare nel machine learning con la governance è oggi un requisito fondamentale per molte organizzazioni aziendali, in particolare nei settori altamente regolamentati. Come parte di tali requisiti, AWS fornisce diversi servizi che consentono un funzionamento affidabile dell'ambiente ML.
Le schede modello SageMaker documentano i dettagli critici sui tuoi modelli ML in un'unica posizione per una governance e un reporting semplificati. Le schede modello consentono di acquisire dettagli come l'uso previsto e la valutazione del rischio di un modello, i dettagli e le metriche di training, i risultati e le osservazioni della valutazione e altri richiami come considerazioni, consigli e informazioni personalizzate.
Le schede modello devono essere gestite e aggiornate come parte del processo di sviluppo, durante tutto il Ciclo di vita del machine learning. Sono una parte importante della consegna continua e delle pipeline in ML. Allo stesso modo in cui un progetto ML ben architettato implementa l'integrazione continua e la consegna continua (CI/CD) sotto l'egida di MLOps, un processo di documentazione ML continuo è una capacità critica in molti settori regolamentati o per casi d'uso a rischio più elevato. Le schede modello fanno parte delle best practice per uno sviluppo ML responsabile e trasparente.
Il diagramma seguente mostra come le schede modello dovrebbero far parte di un ciclo di vita di sviluppo.
Considera le seguenti best practice:
- Ti consigliamo di creare schede modello all'inizio del ciclo di vita del progetto. Nella prima fase del progetto, quando ci stai lavorando identificare l'obiettivo aziendale ed inquadrare il problema ML, dovresti avviare la creazione della scheda modello. Man mano che si eseguono le diverse fasi dei requisiti aziendali e delle importanti metriche delle prestazioni, è possibile creare la scheda modello in uno stato di bozza e determinare i dettagli aziendali e gli usi previsti.
- Come parte del tuo fase del ciclo di vita dello sviluppo del modello, è necessario utilizzare il registro dei modelli per catalogare i modelli per la produzione, gestire le versioni dei modelli e associare i metadati a un modello. Il registro del modello consente il tracciamento del lignaggio.
- Dopo aver eseguito correttamente l'iterazione e essere pronti per distribuire il modello in produzione, è il momento di aggiornare la scheda del modello. Nel fase del ciclo di vita della distribuzione, è possibile aggiornare i dettagli del modello della scheda modello. Dovresti anche aggiornare i dettagli della formazione, i dettagli della valutazione, le considerazioni etiche, gli avvertimenti e le raccomandazioni.
Le schede modello hanno delle versioni ad esse associate. Una determinata versione del modello è immutabile per tutti gli attributi diversi dallo stato della scheda del modello. Se apporti altre modifiche alla scheda del modello, come metriche di valutazione, descrizione o usi previsti, SageMaker crea una nuova versione della scheda del modello per riflettere le informazioni aggiornate. Questo per garantire che una scheda modello, una volta creata, non possa essere manomessa. Inoltre, a ogni nome di modello univoco può essere associata una sola scheda modello e non può essere modificato dopo aver creato la scheda modello.
I modelli ML sono dinamici e i componenti di automazione del flusso di lavoro ti consentono di scalare facilmente la tua capacità di creare, addestrare, testare e distribuire centinaia di modelli in produzione, iterare più velocemente, ridurre gli errori dovuti all'orchestrazione manuale e creare meccanismi ripetibili.
Pertanto, il ciclo di vita delle tue schede modello avrà l'aspetto descritto nel diagramma seguente. Ogni volta che aggiorni la tua scheda modello durante il ciclo di vita del modello, crei automaticamente una nuova versione della scheda modello. Ogni volta che esegui un'iterazione su una nuova versione del modello, crei una nuova scheda modello che può ereditare alcune informazioni sulla scheda modello delle versioni precedenti del modello e seguire lo stesso ciclo di vita.
Pre-requisiti
Questo post presuppone che tu abbia già dei modelli nel tuo registro dei modelli. Se vuoi continuare, puoi utilizzare il seguente esempio di SageMaker su GitHub per popolare il registro del modello: Integrazione di SageMaker Pipelines con Model Monitor e Clarify.
Integrare una scheda modello con la versione del modello nel registro dei modelli
In questo esempio, abbiamo il model-monitor-clarify-group
pacchetto nel nostro registro dei modelli.
In questo pacchetto sono disponibili due versioni di modello.
Per questo esempio, colleghiamo la versione 1 del modello a una nuova scheda modello. Nel registro del modello, puoi vedere i dettagli per la versione 1.
Ora possiamo utilizzare la nuova funzionalità nell'SDK Python di SageMaker. Dal sagemaker.model_card ModelPackage
modulo, è possibile selezionare una versione del modello specifico dal registro del modello a cui si desidera collegare la scheda del modello.
È ora possibile creare una nuova scheda modello per la versione del modello e specificare il file model_package_details
parametro con il pacchetto del modello precedente recuperato. È necessario compilare la scheda del modello con tutti i dettagli aggiuntivi necessari. Per questo post, creiamo una semplice scheda modello come esempio.
Puoi quindi utilizzare tale definizione per creare una scheda modello utilizzando SageMaker Python SDK.
Quando si carica nuovamente la scheda del modello, è possibile vedere il modello associato sotto "__model_package_details"
.
Hai anche la possibilità di aggiornare una scheda modello esistente con il model_package
come mostrato nello snippet di codice di esempio qui sotto:
Infine, quando si crea o si aggiorna una nuova versione di pacchetto modello in un pacchetto modello esistente, se esiste già una scheda modello in quel gruppo di pacchetto modello, alcune informazioni come i dettagli aziendali e gli usi previsti possono essere trasferite alla nuova scheda modello.
ripulire
Gli utenti sono responsabili della pulizia delle risorse se create utilizzando il notebook menzionato nella sezione dei prerequisiti. Si prega di seguire le istruzioni nel taccuino per ripulire le risorse.
Conclusione
In questo post, abbiamo discusso su come integrare una scheda modello SageMaker con una versione del modello nel registro dei modelli. Abbiamo condiviso l'architettura della soluzione con le best practice per l'implementazione di una scheda modello e mostrato come impostare e rendere operativa una scheda modello per migliorare la posizione di governance del modello. Ti invitiamo a provare questa soluzione e a condividere il tuo feedback nella sezione dei commenti.
Informazioni sugli autori
Ram Vital è Principal ML Solutions Architect presso AWS. Ha oltre 20 anni di esperienza nell'architettura e nella creazione di applicazioni distribuite, ibride e cloud. È appassionato di creare soluzioni AI/ML e Big Data sicure e scalabili per aiutare i clienti aziendali nel loro percorso di adozione e ottimizzazione del cloud per migliorare i loro risultati aziendali. Nel tempo libero guida la sua moto e cammina con la sua pecora-a-doodle di 2 anni!
Forte Nataccia è Government Data Science Lead per il settore pubblico Australia e Nuova Zelanda, Principal SA presso AWS. Aiuta le organizzazioni a navigare nel loro percorso di apprendimento automatico, supportandole dall'inquadrare il problema dell'apprendimento automatico alla distribuzione in produzione, assicurandosi nel contempo che siano in atto le migliori pratiche di architettura per garantire il loro successo. Natacha si concentra con le organizzazioni su MLOps e IA responsabile.
- Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
- PlatoData.Network Generativo verticale Ai. Potenzia te stesso. Accedi qui.
- PlatoAiStream. Intelligenza Web3. Conoscenza amplificata. Accedi qui.
- PlatoneESG. Automobilistico/VE, Carbonio, Tecnologia pulita, Energia, Ambiente, Solare, Gestione dei rifiuti. Accedi qui.
- BlockOffset. Modernizzare la proprietà della compensazione ambientale. Accedi qui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/integrate-amazon-sagemaker-model-cards-with-the-model-registry/
- :ha
- :È
- $ SU
- 1
- 100
- 20
- 20 anni
- 7
- 8
- a
- capacità
- Chi siamo
- responsabilità
- il raggiungimento
- operanti in
- aggiuntivo
- Inoltre
- Adozione
- Dopo shavasana, sedersi in silenzio; saluti;
- ancora
- AI
- AI / ML
- Tutti
- consente
- lungo
- già
- anche
- Amazon
- Amazon Sage Maker
- Amazon Web Services
- an
- ed
- in qualsiasi
- applicazioni
- architettura
- SONO
- AS
- Associate
- associato
- assume
- At
- gli attributi
- revisione
- Australia
- automaticamente
- Automazione
- disponibile
- AWS
- BE
- sotto
- MIGLIORE
- best practice
- Big
- Big Data
- costruire
- Costruzione
- affari
- Materiale
- capacità
- catturare
- carta
- Carte
- svolta
- casi
- catalogo
- cambiato
- Modifiche
- Pulizia
- Cloud
- adozione del cloud
- codice
- Commenti
- conformità
- componenti
- globale
- Considerazioni
- continuo
- creare
- creato
- crea
- Creazione
- creazione
- critico
- costume
- cliente
- Clienti
- dati
- scienza dei dati
- definizione
- consegna
- schierare
- schierato
- distribuzione
- descritta
- descrizione
- progettazione
- dettagli
- Determinare
- Mercato
- diverso
- discutere
- discusso
- distribuito
- documento
- documentazione
- bozza
- dovuto
- dinamico
- ogni
- Presto
- facilmente
- enable
- Abilita
- incoraggiare
- garantire
- Impresa
- Ambiente
- errori
- stabilire
- etico
- valutare
- valutazione
- Ogni
- esempio
- esistente
- esiste
- esperienza
- facilitando
- più veloce
- caratteristica
- feedback
- figura
- Nome
- si concentra
- seguire
- i seguenti
- Nel
- da
- GitHub
- dato
- la governance
- Enti Pubblici
- Gruppo
- Avere
- he
- Aiuto
- aiuta
- superiore
- vivamente
- il suo
- Come
- Tutorial
- Tuttavia
- HTML
- HTTPS
- centinaia
- IBRIDO
- if
- illustra
- immutabile
- Implementazione
- attrezzi
- importante
- competenze
- in
- industrie
- informazioni
- avviare
- istruzioni
- integrare
- Integra
- Integrazione
- integrazione
- destinato
- ai miglioramenti
- IT
- viaggio
- jpg
- portare
- apprendimento
- Livello
- ciclo di vita
- piace
- lignaggio
- LINK
- collegamento
- Caricamento in corso
- Guarda
- lotto
- macchina
- machine learning
- make
- Fare
- gestire
- gestito
- gestione
- Manuale
- molti
- partita
- meccanismi di
- menzionato
- Metadati
- Metrica
- ML
- MLOp
- modello
- modelli
- Moduli
- Monitorare
- MOTO
- multiplo
- Nome
- Navigare
- necessaria
- Bisogno
- New
- Nuova Zelanda
- segnatamente
- taccuino
- adesso
- of
- on
- una volta
- ONE
- esclusivamente
- operazione
- ottimizzazione
- Opzione
- or
- orchestrazione
- organizzazione
- organizzazioni
- organizzazione
- Altro
- nostro
- su
- risultati
- ancora
- pacchetto
- parametro
- parte
- particolare
- appassionato
- performance
- prospettiva
- fase
- posto
- Platone
- Platone Data Intelligence
- PlatoneDati
- per favore
- Post
- pratiche
- predizione
- precedente
- Direttore
- Problema
- processi
- Produzione
- progetto
- promuovere
- fornire
- fornisce
- la percezione
- fini
- Python
- RAM
- valutazione
- pronto
- raccomandare
- raccomandazioni
- ridurre
- riflettere
- registro
- registrato
- registro
- regolamentati
- industrie regolamentate
- affidabile
- ripetibile
- Reportistica
- requisito
- Requisiti
- Risorse
- responsabile
- Risultati
- Rischio
- SA
- sagemaker
- stesso
- scalabile
- Scala
- Scienze
- sdk
- Sezione
- settore
- sicuro
- vedere
- Servizi
- set
- alcuni
- Condividi
- condiviso
- lei
- dovrebbero
- ha mostrato
- mostrato
- Spettacoli
- Un'espansione
- singolo
- frammento
- soluzione
- Soluzioni
- risolve
- Soluzione
- alcuni
- Fonte
- specifico
- tappe
- Stato dei servizi
- Passi
- memorizzare
- aerodinamico
- La struttura
- il successo
- Con successo
- tale
- Supporto
- supporti
- sicuro
- Consulenza
- test
- di
- che
- I
- loro
- Li
- poi
- in tal modo
- perciò
- di
- questo
- quelli
- Attraverso
- per tutto
- tempo
- a
- oggi
- Tracking
- Treni
- Training
- trasparente
- Verità
- prova
- seconda
- ombrello
- per
- unico
- Aggiornanento
- aggiornato
- aggiornamento
- uso
- utilizzato
- usa
- utilizzando
- v1
- versione
- versioni
- visibilità
- volere
- Modo..
- we
- sito web
- servizi web
- sono stati
- quando
- while
- volere
- con
- Lavora
- flusso di lavoro
- lavoro
- sarebbe
- anni
- Tu
- Trasferimento da aeroporto a Sharm
- Zelanda
- zefiro