Automate The Deployment Of An Amazon Forecast Time-series Forecasting Model

Ripubblicato da Platone

Seguaci: 0

La previsione delle serie temporali si riferisce al processo di previsione dei valori futuri dei dati delle serie temporali (dati raccolti a intervalli regolari nel tempo). I metodi semplici per la previsione delle serie temporali utilizzano i valori storici della stessa variabile di cui è necessario prevedere i valori futuri, mentre i metodi più complessi basati sull'apprendimento automatico (ML) utilizzano informazioni aggiuntive, come i dati delle serie temporali delle variabili correlate.

Previsioni Amazon è un servizio di previsione di serie temporali basato su ML che include algoritmi basati su oltre 20 anni di esperienza di previsione utilizzati da Amazon.com, portando la stessa tecnologia utilizzata in Amazon agli sviluppatori come servizio completamente gestito, eliminando la necessità di gestire le risorse. Forecast utilizza ML per apprendere non solo il miglior algoritmo per ogni articolo, ma anche il miglior insieme di algoritmi per ogni articolo, creando automaticamente il modello migliore per i tuoi dati.

Questo post descrive come distribuire carichi di lavoro di previsione ricorrenti (carichi di lavoro di previsione di serie temporali) senza utilizzare codice AWS CloudFormazione, Funzioni AWS Stepe Gestore di sistemi AWS. Il metodo qui presentato consente di creare una pipeline che consente di utilizzare lo stesso flusso di lavoro a partire dal primo giorno della sperimentazione della previsione delle serie temporali fino alla distribuzione del modello in produzione.

Previsione di serie temporali utilizzando Forecast

Il flusso di lavoro per Forecast prevede i seguenti concetti comuni:

Importazione di set di dati – In Previsione, a gruppo di set di dati è una raccolta di set di dati, schemi e risultati di previsione che vanno insieme. Ogni gruppo di set di dati può avere fino a tre set di dati, uno per ciascuno dataset tipo: serie temporali target (TTS), serie temporali correlate (RTS) e metadati dell'elemento. Un set di dati è una raccolta di file che contengono dati rilevanti per un'attività di previsione. Un set di dati deve essere conforme allo schema definito in Forecast. Per maggiori dettagli, fare riferimento a Importazione di set di dati.
Predittori di allenamento - A predittore è un modello addestrato alle previsioni utilizzato per effettuare previsioni basate su dati di serie temporali. Durante l'addestramento, Forecast calcola le metriche di accuratezza utilizzate per valutare il predittore e decidere se utilizzare il predittore per generare una previsione. Per ulteriori informazioni, fare riferimento a Predittori di formazione.
Generazione di previsioni – È quindi possibile utilizzare il modello addestrato per generare previsioni per un orizzonte temporale futuro, noto come orizzonte di previsione. Forecast fornisce previsioni a vari quantili specificati. Ad esempio, una previsione al quantile 0.90 stimerà un valore inferiore al valore osservato il 90% delle volte. Per impostazione predefinita, Forecast utilizza i seguenti valori per i tipi di previsione del predittore: 0.1 (P10), 0.5 (P50) e 0.9 (P90). Le previsioni a vari quantili vengono generalmente utilizzate per fornire un intervallo di previsione (un limite superiore e inferiore per le previsioni) per tenere conto dell'incertezza della previsione.

È possibile implementare questo flusso di lavoro in Forecast sia dal file Console di gestione AWS, le Interfaccia della riga di comando di AWS (AWS CLI), tramite Chiamate API utilizzando notebook Pythono tramite soluzioni di automazione. IL consolle ed CLI AWS i metodi sono più adatti per una rapida sperimentazione per verificare la fattibilità della previsione delle serie temporali utilizzando i dati. Il metodo del notebook Python è ottimo per i data scientist che hanno già familiarità con i notebook e la codifica di Jupyter e offre il massimo controllo e messa a punto. Tuttavia, il metodo basato su notebook è difficile da rendere operativo. Il nostro approccio all'automazione facilita la sperimentazione rapida, elimina le attività ripetitive e consente una transizione più semplice tra vari ambienti (sviluppo, staging, produzione).

In questo post, descriviamo un approccio di automazione all'utilizzo di Forecast che ti consente di utilizzare i tuoi dati e fornisce un singolo flusso di lavoro che puoi utilizzare senza problemi durante l'intero ciclo di vita dello sviluppo della tua soluzione di previsione, dai primi giorni di sperimentazione fino alla distribuzione della soluzione nell'ambiente di produzione.

Panoramica della soluzione

Nelle sezioni seguenti, descriviamo un flusso di lavoro end-to-end completo che funge da modello da seguire per la distribuzione automatizzata dei modelli di previsione delle serie temporali utilizzando Forecast. Questo flusso di lavoro crea punti dati previsti da un set di dati di input open source; tuttavia, puoi utilizzare lo stesso flusso di lavoro per i tuoi dati, purché tu possa formattare i tuoi dati secondo i passaggi descritti in questo post. Dopo aver caricato i dati, ti guidiamo attraverso i passaggi per creare gruppi di set di dati di previsione, importare dati, addestrare modelli ML e produrre punti dati previsti su futuri orizzonti temporali invisibili dai dati grezzi. Tutto questo è possibile senza dover scrivere o compilare codice.

Il diagramma seguente illustra il flusso di lavoro di previsione.

Flusso di lavoro di previsione ciclica

La soluzione viene distribuita utilizzando due modelli CloudFormation: il modello delle dipendenze e il modello del carico di lavoro. CloudFormation consente di eseguire distribuzioni dell'infrastruttura AWS in modo prevedibile e ripetuto utilizzando modelli che descrivono le risorse da distribuire. Un modello distribuito è indicato come a pila. Ci siamo occupati di definire l'infrastruttura nella soluzione per te nei due modelli forniti. Il modello delle dipendenze definisce le risorse prerequisite utilizzate dal modello del carico di lavoro, ad esempio un Servizio di archiviazione semplice Amazon (Amazon S3) bucket per l'archiviazione di oggetti e Gestione dell'identità e dell'accesso di AWS (IAM) per le operazioni API AWS. Le risorse definite nel modello delle dipendenze possono essere condivise da più modelli di carico di lavoro. Il modello del carico di lavoro definisce le risorse utilizzate per inserire i dati, addestrare un predittore e generare una previsione.

Flusso di lavoro di distribuzione

Distribuisci il modello CloudFormation delle dipendenze

Per prima cosa, distribuiamo il modello delle dipendenze per creare le nostre risorse prerequisite. Il modello delle dipendenze distribuisce un bucket S3 facoltativo, AWS Lambda funzioni e ruoli IAM. Amazon S3 è un servizio di storage di oggetti a basso costo, altamente disponibile e resiliente. Utilizziamo un bucket S3 in questa soluzione per archiviare i dati di origine e attivare il flusso di lavoro, generando una previsione. Lambda è un servizio di elaborazione basato su eventi senza server che consente di eseguire il codice senza eseguire il provisioning o la gestione dei server. Il modello delle dipendenze include funzioni per eseguire operazioni quali la creazione di un gruppo di set di dati in Forecast e l'eliminazione di oggetti all'interno di un bucket S3 prima di eliminare il bucket. I ruoli IAM definiscono le autorizzazioni all'interno di AWS per utenti e servizi. Il modello delle dipendenze distribuisce un ruolo che deve essere utilizzato da Lambda e un altro per Step Functions, un servizio di gestione del flusso di lavoro che coordinerà le attività di acquisizione ed elaborazione dei dati, nonché l'addestramento e l'inferenza dei predittori utilizzando Forecast.

Completare i seguenti passaggi per distribuire il modello delle dipendenze:

Sulla console, seleziona il file desiderato Regione supportata da Forecast per la distribuzione della soluzione.
Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
Scegli Crea stack e scegli Con nuove risorse (standard).
Nel Fonte del modello, selezionare URL Amazon S3.
Inserisci l'URL del modello: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-dependency.yaml.
Scegli Avanti.
Nel Nome dello stack, accedere forecast-mlops-dependency.
Sotto parametri, scegli di utilizzare un bucket S3 esistente o creane uno nuovo, quindi fornisci il nome del bucket.
Scegli Avanti.
Scegli Avanti per accettare le opzioni di stack predefinite.
Seleziona la casella di controllo per confermare che lo stack crea risorse IAM, quindi scegli Crea stack per distribuire il modello.

Dovresti vedere il modello distribuito come file forecast-mlops-dependency pila. Quando lo stato cambia in CREATE_COMPLETE, puoi passare al passaggio successivo.

Distribuisci il modello CloudFormation del carico di lavoro

Successivamente, distribuiamo il modello del carico di lavoro per creare le nostre risorse prerequisite. Il modello del carico di lavoro distribuisce macchine a stati Step Functions per la gestione del flusso di lavoro, Archivio parametri di AWS Systems Manager parameters per archiviare i valori dei parametri da AWS CloudFormation e informare il flusso di lavoro, an Servizio di notifica semplice Amazon (Amazon SNS) per le notifiche del flusso di lavoro e un ruolo IAM per le autorizzazioni del servizio del flusso di lavoro.

La soluzione crea cinque macchine a stati:

CreateDatasetGroupStateMachine – Crea un gruppo di set di dati di previsione per i dati da importare.
CreateImportDatasetStateMachine – Importa i dati di origine da Amazon S3 in un gruppo di set di dati per l'addestramento.
CreateForecastStateMachine – Gestisce le attività necessarie per addestrare un predittore e generare una previsione.
AthenaConnectorStateMachine – Consente di scrivere query SQL con l'estensione Amazzone Atena connettore per trasferire i dati in Amazon S3. Si tratta di un processo facoltativo per ottenere dati cronologici nel formato richiesto per Forecast utilizzando Athena invece di inserire i file manualmente in Amazon S3.
StepFunctionWorkflowStateMachine – Coordina le chiamate alle altre quattro macchine a stati e gestisce il flusso di lavoro complessivo.

Parameter Store, una funzionalità di Systems Manager, fornisce archiviazione sicura e gerarchica e recupero programmatico della gestione dei dati di configurazione e della gestione dei segreti. Parameter Store viene utilizzato per archiviare i parametri impostati nello stack del carico di lavoro e altri parametri utilizzati dal flusso di lavoro.

Completare i passaggi seguenti per distribuire il modello di carico di lavoro:

Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
Scegli Crea stack e scegli Con nuove risorse (standard).
Nel Fonte del modello, selezionare URL Amazon S3.
Inserisci l'URL del modello: https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-solution-guidance.yaml.
Scegli Avanti.
Nel Nome dello stack, inserisci un nome.
Accettare i valori predefiniti o modificare i parametri.

Assicurati di inserire il nome del bucket S3 dallo stack delle dipendenze per Secchio S3 e un indirizzo email valido per SNSEndpoint anche se si accettano i valori dei parametri predefiniti.

La tabella seguente descrive ciascun parametro.

Parametro	Descrizione	Maggiori informazioni
`DatasetGroupFrequencyRTS`	La frequenza della raccolta dei dati per il set di dati RTS.	.
`DatasetGroupFrequencyTTS`	La frequenza della raccolta dei dati per il set di dati TTS.	.
`DatasetGroupName`	Un nome breve per il gruppo di set di dati, un carico di lavoro autonomo.	Crea gruppo set di dati
`DatasetIncludeItem`	Specifica se desideri fornire i metadati dell'elemento per questo caso d'uso.	.
`DatasetIncludeRTS`	Specifica se desideri fornire una serie temporale correlata per questo caso d'uso.	.
`ForecastForecastTypes`	Quando viene eseguito un lavoro CreateForecast, questo dichiara per quali quantili produrre previsioni. Puoi scegliere fino a cinque valori in questo array. Modifica questo valore per includere i valori in base alle necessità.	CreaPrevisione
`PredictorAttributeConfigs`	Per la variabile di destinazione in TTS e ogni campo numerico nei dataset RTS, è necessario creare un record per ogni intervallo di tempo per ogni elemento. Questa configurazione aiuta a determinare come vengono compilati i record mancanti: con 0, NaN o altro. Consigliamo di archiviare le lacune nel TTS con NaN anziché 0. Con 0, il modello potrebbe imparare erroneamente a deviare le previsioni verso 0. NaN è il modo in cui viene fornita la guida. Consulta il tuo AWS Solutions Architect per qualsiasi domanda in merito.	Crea predittore automatico
`PredictorExplainPredictor`	I valori validi sono VERO o FALSO. Questi determinano se la spiegabilità è abilitata per il tuo predittore. Questo può aiutarti a capire in che modo i valori nell'RTS e nei metadati dell'elemento influenzano il modello.	Spiegabilità
`PredictorForecastDimensions`	Potresti voler prevedere una grana più fine rispetto all'elemento. Qui puoi specificare dimensioni come posizione, centro di costo o qualunque siano le tue esigenze. Questo deve concordare con le dimensioni nel tuo RTS e TTS. Si noti che se non si dispone di una dimensione, il parametro corretto è nullo, da solo e tutto in minuscolo. null è una parola riservata che consente al sistema di sapere che non esiste alcun parametro per la dimensione.	Crea predittore automatico
`PredictorForecastFrequency`	Definisce la scala temporale in cui verranno generati il modello e le previsioni, ad esempio giornaliera, settimanale o mensile. Il menu a discesa ti aiuta a scegliere i valori consentiti. Questo deve concordare con la tua scala temporale RTS se stai usando RTS.	Crea predittore automatico
`PredictorForecastHorizon`	Il numero di passaggi temporali previsti dal modello. L'orizzonte di previsione è anche chiamato lunghezza della previsione.	Crea predittore automatico
`PredictorForecastOptimizationMetric`	Definisce la metrica di accuratezza utilizzata per ottimizzare il predittore. Il menu a discesa ti aiuterà a selezionare i saldi di perdita quantile ponderati per la previsione in eccesso o in difetto. RMSE si occupa delle unità e WAPE/MAPE degli errori percentuali.	Crea predittore automatico
`PredictorForecastTypes`	Quando `CreateAutoPredictor` job run, questo dichiara quali quantili vengono utilizzati per addestrare i punti di previsione. Puoi scegliere fino a cinque valori in questo array, permettendoti di bilanciare le previsioni in eccesso e in difetto. Modifica questo valore per includere i valori in base alle necessità.	Crea predittore automatico
`S3Bucket`	Il nome del bucket S3 in cui vengono scritti i dati di input e di output per questo carico di lavoro.	.
`SNSEndpoint`	Un indirizzo e-mail valido per ricevere notifiche quando i processi di predittore e previsione sono stati completati.	.
`SchemaITEM`	Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati dei metadati dell'elemento. Questo è un file facoltativo fornito nell'esempio di soluzione.	Crea set di dati
`SchemaRTS`	Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati RTS. Le dimensioni devono concordare con il tuo TTS. La grana temporale di questo file governa la grana temporale in cui è possibile effettuare previsioni. Questo è un file facoltativo fornito nell'esempio di soluzione.	Crea set di dati
`SchemaTTS`	Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati TTS, l'unico set di dati richiesto. Il file deve contenere almeno un valore di destinazione, un timestamp e un elemento.	Crea set di dati
`TimestampFormatRTS`	Definisce il formato del timestamp fornito nel file RTS.	Crea lavoro di importazione set di dati
`TimestampFormatTTS`	Definisce il formato del timestamp fornito nel file TTS.	Crea lavoro di importazione set di dati

Scegli Avanti per accettare le opzioni di stack predefinite.
Seleziona la casella di controllo per confermare che lo stack crea risorse IAM, quindi scegli Crea stack per distribuire il modello.

Dovresti vedere la distribuzione del modello come il nome dello stack che hai scelto in precedenza. Quando lo stato cambia in CREATE_COMPLETE, puoi passare alla fase di caricamento dei dati.

Carica i dati

Nella sezione precedente, hai fornito un nome stack e un bucket S3. Questa sezione descrive come depositare il set di dati pubblicamente disponibile Domanda alimentare in questo secchio. Se stai utilizzando il tuo set di dati, fai riferimento a Dataset per preparare il set di dati in un formato previsto dalla distribuzione. Il set di dati deve contenere almeno le serie temporali di destinazione e, facoltativamente, le serie temporali correlate e i metadati dell'elemento:

TTS sono i dati della serie temporale che includono il campo per il quale si desidera generare una previsione; questo campo è chiamato campo obiettivo
RTS sono dati di serie temporali che non includono il campo obiettivo, ma includono un campo correlato
Il file di dati dell'elemento non è costituito da dati di serie temporali, ma include informazioni sui metadati sugli elementi nei set di dati TTS o RTS

Completa i seguenti passi:

Se utilizzi il set di dati di esempio fornito, scarica il set di dati Domanda alimentare sul tuo computer e decomprimi il file, che crea tre file all'interno di tre directory (rts, tts, item).
Sulla console Amazon S3, vai al bucket che hai creato in precedenza.
Scegli Crea cartella.
Utilizza la stessa stringa del nome dello stack del carico di lavoro per il nome della cartella.
Scegli Caricare.
Scegli le tre cartelle del set di dati, quindi scegli Caricare.

Quando il caricamento è completo, dovresti vedere qualcosa di simile allo screenshot seguente. Per questo esempio, la nostra cartella è aiml42. Struttura delle cartelle S3

Creare un gruppo di set di dati di previsione

Completa i passaggi in questa sezione per creare un gruppo di set di dati come evento una tantum per ogni carico di lavoro. Andando avanti, dovresti pianificare l'esecuzione dei dati di importazione, creare predittore e creare passaggi di previsione appropriati, come una serie, in base alla tua pianificazione, che potrebbe essere giornaliera, settimanale o altro.

Nella console Step Functions, individua la macchina a stati che contiene Create-Dataset-Group.
Nella pagina dei dettagli della macchina a stati, scegli Inizia l'esecuzione.
Scegli Inizia l'esecuzione di nuovo per confermare.

La macchina a stati impiega circa 1 minuto per funzionare. Quando è completo, il valore under Stato di esecuzione dovrebbe cambiare da corsa a Riuscito

Importa i dati in Previsione

Segui i passaggi in questa sezione per importare il set di dati che hai caricato nel tuo bucket S3 nel tuo gruppo di set di dati:

Nella console Step Functions, individua la macchina a stati che contiene Import-Dataset.
Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
Scegli Inizia l'esecuzione di nuovo per confermare.

Il tempo necessario per l'esecuzione della macchina a stati dipende dal set di dati in fase di elaborazione.

Ispettore grafico

Mentre è in esecuzione, nel browser apri un'altra scheda e vai alla console delle previsioni.
Nella console Previsioni, scegli Visualizza gruppi di set di dati e passare al gruppo di set di dati con il nome specificato per DataGroupName dallo stack del carico di lavoro.
Scegli Visualizza set di dati.

Dovresti vedere le importazioni di dati in corso.

Importazioni dati in corso

Quando la macchina a stati per Import-Dataset è completo, è possibile procedere al passaggio successivo per creare il modello di dati delle serie temporali.

Creare AutoPredictor (addestrare un modello di serie temporali)

Questa sezione descrive come addestrare un predittore iniziale con Forecast. Puoi scegliere di creare un nuovo predittore (il tuo primo predittore di base) o riaddestrare un predittore durante ogni ciclo di produzione, che potrebbe essere giornaliero, settimanale o altro. Puoi anche scegliere di non creare un predittore ogni ciclo e fare affidamento sul monitoraggio del predittore per guidarti quando crearne uno. La figura seguente visualizza il processo di creazione di un predittore di previsione pronto per la produzione.

Flusso di lavoro predittore pronto per la produzione

Per creare un nuovo predittore, completare i seguenti passaggi:

Nella console Step Functions, individua la macchina a stati che contiene Create-Predictor.
Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
Scegli Inizia l'esecuzione di nuovo per confermare.
La quantità di tempo di esecuzione può dipendere dal set di dati in fase di elaborazione. Questo potrebbe richiedere fino a un'ora o più per il completamento.
Mentre è in esecuzione, nel browser apri un'altra scheda e vai alla console delle previsioni.
Nella console Previsioni, scegli Visualizza gruppi di set di dati e passare al gruppo di set di dati con il nome specificato per DataGroupName dallo stack del carico di lavoro.
Scegli Visualizza i predittori.

Dovresti vedere l'addestramento del predittore in corso (lo stato dell'addestramento mostra "Crea in corso...").

Importazioni dati in corso

Quando la macchina a stati per Create-Predictor è completo, è possibile valutarne le prestazioni.

Come parte della macchina a stati, il sistema crea un predittore ed esegue anche un BacktestExport lavoro che scrive i parametri predittori a livello di serie temporali in Amazon S3. Questi sono file che si trovano in due cartelle S3 sotto il file backtest-export cartella:

valori-metriche-di-accuratezza – Fornisce calcoli della metrica di accuratezza a livello di elemento in modo da poter comprendere le prestazioni di una singola serie temporale. Ciò ti consente di indagare sullo spread piuttosto che concentrarti solo sulle metriche globali.
valori-previsioni – Fornisce previsioni a livello di fase per ogni serie temporale nella finestra del backtest. Ciò consente di confrontare il valore target effettivo da un set di test di controllo con i valori quantili previsti. La revisione di questo aiuta a formulare idee su come fornire funzionalità di dati aggiuntive in RTS o metadati degli elementi per aiutare a stimare meglio i valori futuri, riducendo ulteriormente la perdita. Puoi scaricare backtest-export file da Amazon S3 o interrogarli sul posto con Athena.

Contenuto del bucket S3

Con i tuoi dati, devi ispezionare da vicino i risultati del predittore e assicurarti che le metriche soddisfino i risultati attesi utilizzando i dati di esportazione del backtest. Quando sei soddisfatto, puoi iniziare a generare previsioni con data futura come descritto nella sezione successiva.

Generare una previsione (inferenza su orizzonti temporali futuri)

Questa sezione descrive come generare punti dati di previsione con Forecast. Andando avanti, dovresti raccogliere nuovi dati dal sistema di origine, importare i dati in Forecast e quindi generare punti dati di previsione. Facoltativamente, è anche possibile inserire una nuova creazione di predittore dopo l'importazione e prima della previsione. La figura seguente visualizza il processo di creazione di previsioni di serie temporali di produzione utilizzando Forecast.

Flusso di lavoro di previsione delle serie temporali di produzione

Completa i seguenti passi:

Nella console Step Functions, individua la macchina a stati che contiene Create-Forecast.
Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
Scegli Inizia l'esecuzione di nuovo per confermare.
Questa macchina a stati termina molto rapidamente perché il sistema non è configurato per generare una previsione. Non sa quale modello predittore hai approvato per l'inferenza.
Configuriamo il sistema per utilizzare il tuo predittore addestrato.
Nella console di previsione, individua l'ARN per il tuo predittore.
Copia l'ARN da utilizzare in un passaggio successivo.
Nel tuo browser, apri un'altra scheda e vai alla console Systems Manager.
Nella console di Systems Manager, scegli Archivio parametri nel pannello di navigazione.
Individua il parametro relativo al tuo stack (/forecast/<StackName>/Forecast/PredictorArn).
Inserisci l'ARN che hai copiato per il tuo predittore.
In questo modo si associa un predittore addestrato alla funzione di inferenza di Forecast.
Individua il parametro /forecast/<StackName>/Forecast/Generate e modificare il valore, sostituendo FALSE con TRUE.
Ora sei pronto per eseguire un processo di previsione per questo gruppo di set di dati.
Nella console Step Functions, esegui il file Create-Forecast macchina a stati.

Questa volta, il processo viene eseguito come previsto. Come parte della macchina a stati, il sistema crea una previsione e a ForecastExport job, che scrive previsioni di serie temporali su Amazon S3. Questi file si trovano in forecast cartella

Contenuto della cartella delle previsioni

All'interno del forecast cartella, troverai le previsioni per i tuoi articoli, che si trovano in molti file CSV o Parquet, a seconda della tua selezione. Le previsioni per ogni fase temporale e serie temporali selezionate esistono con tutti i valori quantili scelti per record. Puoi scaricare questi file da Amazon S3, interrogarli sul posto con Athena o scegliere un'altra strategia per utilizzare i dati.

Questo avvolge l'intero flusso di lavoro. Ora puoi visualizzare il tuo output utilizzando qualsiasi strumento di visualizzazione di tua scelta, ad esempio Amazon QuickSight. In alternativa, i data scientist possono utilizzare i panda per generare i propri grafici. Se scegli di utilizzare QuickSight, puoi farlo collegare i risultati delle previsioni a QuickSight per eseguire trasformazioni di dati, creare una o più analisi di dati e creare visualizzazioni.

Questo processo fornisce un modello da seguire. Dovrai adattare il campione al tuo schema, impostare l'orizzonte di previsione, la risoluzione temporale e così via in base al tuo caso d'uso. Sarà inoltre necessario impostare una pianificazione ricorrente in cui i dati vengono raccolti dal sistema di origine, importare i dati e produrre previsioni. Se lo si desidera, è possibile inserire un'attività predittore tra i passaggi di importazione e previsione.

Riaddestrare il predittore

Abbiamo seguito il processo di addestramento di un nuovo predittore, ma per quanto riguarda la riqualificazione di un predittore? Il riaddestramento di un predittore è un modo per ridurre i costi e il tempo necessari per addestrare un predittore sugli ultimi dati disponibili. Anziché creare un nuovo predittore e addestrarlo sull'intero set di dati, possiamo riaddestrare il predittore esistente fornendo solo i nuovi dati incrementali resi disponibili dall'ultimo addestramento del predittore. Esaminiamo come riaddestrare un predittore utilizzando la soluzione di automazione:

Nella console Previsioni, scegli Visualizza gruppi di set di dati.
Scegli il gruppo di set di dati associato al predittore che desideri riaddestrare.
Scegli Visualizza i predittori, quindi scegli il predittore che vuoi riaddestrare.
Sulla Impostazioni profilo scheda, copiare l'ARN predittore.
È necessario aggiornare un parametro utilizzato dal flusso di lavoro per identificare il predittore da riaddestrare.
Nella console di Systems Manager, scegli Archivio parametri nel pannello di navigazione.
Individua il parametro /forecast/<STACKNAME>/Forecast/Predictor/ReferenceArn.
Nella pagina dei dettagli del parametro, scegli Modifica.
Nel Valore, inserisci l'ARN del predittore.
Questo identifica il predittore corretto per il flusso di lavoro da riaddestrare. Successivamente, dobbiamo aggiornare un parametro utilizzato dal flusso di lavoro per modificare la strategia di formazione.
Individua il parametro /forecast/<STACKNAME>/Forecast/Predictor/Strategy.
Nella pagina dei dettagli del parametro scegliere Modifica.
Per Valore, inserisci RETRAIN.
Per impostazione predefinita, il flusso di lavoro esegue l'addestramento di un nuovo predittore; tuttavia, è possibile modificare tale comportamento per riaddestrare un predittore esistente o semplicemente riutilizzare un predittore esistente senza riaddestrare impostando questo valore su NONE. Potresti voler rinunciare all'addestramento se i tuoi dati sono relativamente stabili o li stai utilizzando monitoraggio automatico dei predittori decidere quando è necessaria la riqualificazione.
Carica i dati di addestramento incrementale nel bucket S3.
Nella console Step Functions, individua la macchina a stati <STACKNAME>-Create-Predictor.
Nella pagina dei dettagli della macchina a stati, scegli Inizia l'esecuzione per iniziare la riqualificazione.

Al termine della riqualificazione, il flusso di lavoro terminerà e riceverai una notifica e-mail SNS all'indirizzo e-mail fornito nei parametri del modello del carico di lavoro.

ripulire

Quando hai finito con questa soluzione, segui i passaggi in questa sezione per eliminare le risorse correlate.

Elimina il bucket S3

Sulla console Amazon S3, scegli Secchi nel pannello di navigazione.
Seleziona il bucket in cui sono stati caricati i dati e scegli Vuoto per eliminare tutti i dati associati alla soluzione, inclusi i dati di origine.
entrare permanently delete per eliminare definitivamente il contenuto del bucket.
Sulla Secchi page, seleziona il bucket e scegli Elimina.
Immettere il nome del bucket per confermare l'eliminazione e scegliere Elimina secchio.

Elimina le risorse di previsione

Nella console Previsioni, scegli Visualizza gruppi di set di dati.
Selezionare il nome del gruppo di set di dati associato alla soluzione, quindi scegliere Elimina.
entrare delete per eliminare il gruppo di set di dati e i predittori associati, i processi di esportazione di backtest dei predittori, le previsioni e i processi di esportazione delle previsioni.
Scegli Elimina per confermare.

Elimina gli stack CloudFormation

Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
Seleziona lo stack del carico di lavoro e scegli Elimina.
Scegli Elimina stack per confermare l'eliminazione dello stack e di tutte le risorse associate.
Al termine dell'eliminazione, seleziona lo stack delle dipendenze e scegli Elimina.
Scegli Elimina per confermare.

Conclusione

In questo post, abbiamo discusso alcuni modi diversi per iniziare a utilizzare Forecast. Abbiamo analizzato una soluzione di previsione automatizzata basata su AWS CloudFormation per un'implementazione rapida e ripetibile di una pipeline di previsioni dall'acquisizione dei dati all'inferenza, con poche conoscenze dell'infrastruttura richieste. Infine, abbiamo visto come utilizzare Lambda per automatizzare il riaddestramento del modello, riducendo i costi e i tempi di addestramento.

Non c'è momento migliore del presente per iniziare a fare previsioni con Forecast. Per iniziare a creare e distribuire un flusso di lavoro automatizzato, visita Risorse di Amazon Forecast. Buona previsione!

Informazioni sugli autori

Automate the deployment of an Amazon Forecast time-series forecasting model PlatoBlockchain Data Intelligence. Vertical Search. Ai. Aaron Fagan è Principal Specialist Solutions Architect presso AWS con sede a New York. È specializzato nell'aiutare i clienti a progettare soluzioni per l'apprendimento automatico e la sicurezza del cloud.

Automate the deployment of an Amazon Forecast time-series forecasting model PlatoBlockchain Data Intelligence. Vertical Search. Ai. Raju Patil è un Data Scientist in AWS Professional Services. Crea e distribuisce soluzioni AI/ML per aiutare i clienti AWS a superare le loro sfide aziendali. I suoi impegni con AWS hanno coperto un'ampia gamma di casi d'uso di AI/ML come visione artificiale, previsioni di serie temporali e analisi predittive, ecc., in numerosi settori, tra cui servizi finanziari, telecomunicazioni, assistenza sanitaria e altro ancora. Prima di questo, ha guidato i team di Data Science nella tecnologia pubblicitaria e ha dato un contributo significativo a numerose iniziative di ricerca e sviluppo nella visione artificiale e nella robotica. Al di fuori del lavoro, ama la fotografia, le escursioni, i viaggi e le esplorazioni culinarie.