La previsione delle serie temporali si riferisce al processo di previsione dei valori futuri dei dati delle serie temporali (dati raccolti a intervalli regolari nel tempo). I metodi semplici per la previsione delle serie temporali utilizzano i valori storici della stessa variabile di cui è necessario prevedere i valori futuri, mentre i metodi più complessi basati sull'apprendimento automatico (ML) utilizzano informazioni aggiuntive, come i dati delle serie temporali delle variabili correlate.
Previsioni Amazon è un servizio di previsione di serie temporali basato su ML che include algoritmi basati su oltre 20 anni di esperienza di previsione utilizzati da Amazon.com, portando la stessa tecnologia utilizzata in Amazon agli sviluppatori come servizio completamente gestito, eliminando la necessità di gestire le risorse. Forecast utilizza ML per apprendere non solo il miglior algoritmo per ogni articolo, ma anche il miglior insieme di algoritmi per ogni articolo, creando automaticamente il modello migliore per i tuoi dati.
Questo post descrive come distribuire carichi di lavoro di previsione ricorrenti (carichi di lavoro di previsione di serie temporali) senza utilizzare codice AWS CloudFormazione, Funzioni AWS Stepe Gestore di sistemi AWS. Il metodo qui presentato consente di creare una pipeline che consente di utilizzare lo stesso flusso di lavoro a partire dal primo giorno della sperimentazione della previsione delle serie temporali fino alla distribuzione del modello in produzione.
Previsione di serie temporali utilizzando Forecast
Il flusso di lavoro per Forecast prevede i seguenti concetti comuni:
- Importazione di set di dati – In Previsione, a gruppo di set di dati è una raccolta di set di dati, schemi e risultati di previsione che vanno insieme. Ogni gruppo di set di dati può avere fino a tre set di dati, uno per ciascuno dataset tipo: serie temporali target (TTS), serie temporali correlate (RTS) e metadati dell'elemento. Un set di dati è una raccolta di file che contengono dati rilevanti per un'attività di previsione. Un set di dati deve essere conforme allo schema definito in Forecast. Per maggiori dettagli, fare riferimento a Importazione di set di dati.
- Predittori di allenamento - A predittore è un modello addestrato alle previsioni utilizzato per effettuare previsioni basate su dati di serie temporali. Durante l'addestramento, Forecast calcola le metriche di accuratezza utilizzate per valutare il predittore e decidere se utilizzare il predittore per generare una previsione. Per ulteriori informazioni, fare riferimento a Predittori di formazione.
- Generazione di previsioni – È quindi possibile utilizzare il modello addestrato per generare previsioni per un orizzonte temporale futuro, noto come orizzonte di previsione. Forecast fornisce previsioni a vari quantili specificati. Ad esempio, una previsione al quantile 0.90 stimerà un valore inferiore al valore osservato il 90% delle volte. Per impostazione predefinita, Forecast utilizza i seguenti valori per i tipi di previsione del predittore: 0.1 (P10), 0.5 (P50) e 0.9 (P90). Le previsioni a vari quantili vengono generalmente utilizzate per fornire un intervallo di previsione (un limite superiore e inferiore per le previsioni) per tenere conto dell'incertezza della previsione.
È possibile implementare questo flusso di lavoro in Forecast sia dal file Console di gestione AWS, le Interfaccia della riga di comando di AWS (AWS CLI), tramite Chiamate API utilizzando notebook Pythono tramite soluzioni di automazione. IL consolle ed CLI AWS i metodi sono più adatti per una rapida sperimentazione per verificare la fattibilità della previsione delle serie temporali utilizzando i dati. Il metodo del notebook Python è ottimo per i data scientist che hanno già familiarità con i notebook e la codifica di Jupyter e offre il massimo controllo e messa a punto. Tuttavia, il metodo basato su notebook è difficile da rendere operativo. Il nostro approccio all'automazione facilita la sperimentazione rapida, elimina le attività ripetitive e consente una transizione più semplice tra vari ambienti (sviluppo, staging, produzione).
In questo post, descriviamo un approccio di automazione all'utilizzo di Forecast che ti consente di utilizzare i tuoi dati e fornisce un singolo flusso di lavoro che puoi utilizzare senza problemi durante l'intero ciclo di vita dello sviluppo della tua soluzione di previsione, dai primi giorni di sperimentazione fino alla distribuzione della soluzione nell'ambiente di produzione.
Panoramica della soluzione
Nelle sezioni seguenti, descriviamo un flusso di lavoro end-to-end completo che funge da modello da seguire per la distribuzione automatizzata dei modelli di previsione delle serie temporali utilizzando Forecast. Questo flusso di lavoro crea punti dati previsti da un set di dati di input open source; tuttavia, puoi utilizzare lo stesso flusso di lavoro per i tuoi dati, purché tu possa formattare i tuoi dati secondo i passaggi descritti in questo post. Dopo aver caricato i dati, ti guidiamo attraverso i passaggi per creare gruppi di set di dati di previsione, importare dati, addestrare modelli ML e produrre punti dati previsti su futuri orizzonti temporali invisibili dai dati grezzi. Tutto questo è possibile senza dover scrivere o compilare codice.
Il diagramma seguente illustra il flusso di lavoro di previsione.
La soluzione viene distribuita utilizzando due modelli CloudFormation: il modello delle dipendenze e il modello del carico di lavoro. CloudFormation consente di eseguire distribuzioni dell'infrastruttura AWS in modo prevedibile e ripetuto utilizzando modelli che descrivono le risorse da distribuire. Un modello distribuito è indicato come a pila. Ci siamo occupati di definire l'infrastruttura nella soluzione per te nei due modelli forniti. Il modello delle dipendenze definisce le risorse prerequisite utilizzate dal modello del carico di lavoro, ad esempio un Servizio di archiviazione semplice Amazon (Amazon S3) bucket per l'archiviazione di oggetti e Gestione dell'identità e dell'accesso di AWS (IAM) per le operazioni API AWS. Le risorse definite nel modello delle dipendenze possono essere condivise da più modelli di carico di lavoro. Il modello del carico di lavoro definisce le risorse utilizzate per inserire i dati, addestrare un predittore e generare una previsione.
Distribuisci il modello CloudFormation delle dipendenze
Per prima cosa, distribuiamo il modello delle dipendenze per creare le nostre risorse prerequisite. Il modello delle dipendenze distribuisce un bucket S3 facoltativo, AWS Lambda funzioni e ruoli IAM. Amazon S3 è un servizio di storage di oggetti a basso costo, altamente disponibile e resiliente. Utilizziamo un bucket S3 in questa soluzione per archiviare i dati di origine e attivare il flusso di lavoro, generando una previsione. Lambda è un servizio di elaborazione basato su eventi senza server che consente di eseguire il codice senza eseguire il provisioning o la gestione dei server. Il modello delle dipendenze include funzioni per eseguire operazioni quali la creazione di un gruppo di set di dati in Forecast e l'eliminazione di oggetti all'interno di un bucket S3 prima di eliminare il bucket. I ruoli IAM definiscono le autorizzazioni all'interno di AWS per utenti e servizi. Il modello delle dipendenze distribuisce un ruolo che deve essere utilizzato da Lambda e un altro per Step Functions, un servizio di gestione del flusso di lavoro che coordinerà le attività di acquisizione ed elaborazione dei dati, nonché l'addestramento e l'inferenza dei predittori utilizzando Forecast.
Completare i seguenti passaggi per distribuire il modello delle dipendenze:
- Sulla console, seleziona il file desiderato Regione supportata da Forecast per la distribuzione della soluzione.
- Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
- Scegli Crea stack e scegli Con nuove risorse (standard).
- Nel Fonte del modello, selezionare URL Amazon S3.
- Inserisci l'URL del modello:
https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-dependency.yaml
. - Scegli Avanti.
- Nel Nome dello stack, accedere
forecast-mlops-dependency
. - Sotto parametri, scegli di utilizzare un bucket S3 esistente o creane uno nuovo, quindi fornisci il nome del bucket.
- Scegli Avanti.
- Scegli Avanti per accettare le opzioni di stack predefinite.
- Seleziona la casella di controllo per confermare che lo stack crea risorse IAM, quindi scegli Crea stack per distribuire il modello.
Dovresti vedere il modello distribuito come file forecast-mlops-dependency
pila. Quando lo stato cambia in CREATE_COMPLETE
, puoi passare al passaggio successivo.
Distribuisci il modello CloudFormation del carico di lavoro
Successivamente, distribuiamo il modello del carico di lavoro per creare le nostre risorse prerequisite. Il modello del carico di lavoro distribuisce macchine a stati Step Functions per la gestione del flusso di lavoro, Archivio parametri di AWS Systems Manager parameters per archiviare i valori dei parametri da AWS CloudFormation e informare il flusso di lavoro, an Servizio di notifica semplice Amazon (Amazon SNS) per le notifiche del flusso di lavoro e un ruolo IAM per le autorizzazioni del servizio del flusso di lavoro.
La soluzione crea cinque macchine a stati:
- CreateDatasetGroupStateMachine – Crea un gruppo di set di dati di previsione per i dati da importare.
- CreateImportDatasetStateMachine – Importa i dati di origine da Amazon S3 in un gruppo di set di dati per l'addestramento.
- CreateForecastStateMachine – Gestisce le attività necessarie per addestrare un predittore e generare una previsione.
- AthenaConnectorStateMachine – Consente di scrivere query SQL con l'estensione Amazzone Atena connettore per trasferire i dati in Amazon S3. Si tratta di un processo facoltativo per ottenere dati cronologici nel formato richiesto per Forecast utilizzando Athena invece di inserire i file manualmente in Amazon S3.
- StepFunctionWorkflowStateMachine – Coordina le chiamate alle altre quattro macchine a stati e gestisce il flusso di lavoro complessivo.
Parameter Store, una funzionalità di Systems Manager, fornisce archiviazione sicura e gerarchica e recupero programmatico della gestione dei dati di configurazione e della gestione dei segreti. Parameter Store viene utilizzato per archiviare i parametri impostati nello stack del carico di lavoro e altri parametri utilizzati dal flusso di lavoro.
Completare i passaggi seguenti per distribuire il modello di carico di lavoro:
- Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
- Scegli Crea stack e scegli Con nuove risorse (standard).
- Nel Fonte del modello, selezionare URL Amazon S3.
- Inserisci l'URL del modello:
https://amazon-forecast-samples.s3.us-west-2.amazonaws.com/ml_ops/forecast-mlops-solution-guidance.yaml
. - Scegli Avanti.
- Nel Nome dello stack, inserisci un nome.
- Accettare i valori predefiniti o modificare i parametri.
Assicurati di inserire il nome del bucket S3 dallo stack delle dipendenze per Secchio S3 e un indirizzo email valido per SNSEndpoint anche se si accettano i valori dei parametri predefiniti.
La tabella seguente descrive ciascun parametro.
Parametro | Descrizione | Maggiori informazioni |
DatasetGroupFrequencyRTS |
La frequenza della raccolta dei dati per il set di dati RTS. | . |
DatasetGroupFrequencyTTS |
La frequenza della raccolta dei dati per il set di dati TTS. | . |
DatasetGroupName |
Un nome breve per il gruppo di set di dati, un carico di lavoro autonomo. | Crea gruppo set di dati |
DatasetIncludeItem |
Specifica se desideri fornire i metadati dell'elemento per questo caso d'uso. | . |
DatasetIncludeRTS |
Specifica se desideri fornire una serie temporale correlata per questo caso d'uso. | . |
ForecastForecastTypes |
Quando viene eseguito un lavoro CreateForecast, questo dichiara per quali quantili produrre previsioni. Puoi scegliere fino a cinque valori in questo array. Modifica questo valore per includere i valori in base alle necessità. | CreaPrevisione |
PredictorAttributeConfigs |
Per la variabile di destinazione in TTS e ogni campo numerico nei dataset RTS, è necessario creare un record per ogni intervallo di tempo per ogni elemento. Questa configurazione aiuta a determinare come vengono compilati i record mancanti: con 0, NaN o altro. Consigliamo di archiviare le lacune nel TTS con NaN anziché 0. Con 0, il modello potrebbe imparare erroneamente a deviare le previsioni verso 0. NaN è il modo in cui viene fornita la guida. Consulta il tuo AWS Solutions Architect per qualsiasi domanda in merito. | Crea predittore automatico |
PredictorExplainPredictor |
I valori validi sono VERO o FALSO. Questi determinano se la spiegabilità è abilitata per il tuo predittore. Questo può aiutarti a capire in che modo i valori nell'RTS e nei metadati dell'elemento influenzano il modello. | Spiegabilità |
PredictorForecastDimensions |
Potresti voler prevedere una grana più fine rispetto all'elemento. Qui puoi specificare dimensioni come posizione, centro di costo o qualunque siano le tue esigenze. Questo deve concordare con le dimensioni nel tuo RTS e TTS. Si noti che se non si dispone di una dimensione, il parametro corretto è nullo, da solo e tutto in minuscolo. null è una parola riservata che consente al sistema di sapere che non esiste alcun parametro per la dimensione. | Crea predittore automatico |
PredictorForecastFrequency |
Definisce la scala temporale in cui verranno generati il modello e le previsioni, ad esempio giornaliera, settimanale o mensile. Il menu a discesa ti aiuta a scegliere i valori consentiti. Questo deve concordare con la tua scala temporale RTS se stai usando RTS. | Crea predittore automatico |
PredictorForecastHorizon |
Il numero di passaggi temporali previsti dal modello. L'orizzonte di previsione è anche chiamato lunghezza della previsione. | Crea predittore automatico |
PredictorForecastOptimizationMetric |
Definisce la metrica di accuratezza utilizzata per ottimizzare il predittore. Il menu a discesa ti aiuterà a selezionare i saldi di perdita quantile ponderati per la previsione in eccesso o in difetto. RMSE si occupa delle unità e WAPE/MAPE degli errori percentuali. | Crea predittore automatico |
PredictorForecastTypes |
Quando CreateAutoPredictor job run, questo dichiara quali quantili vengono utilizzati per addestrare i punti di previsione. Puoi scegliere fino a cinque valori in questo array, permettendoti di bilanciare le previsioni in eccesso e in difetto. Modifica questo valore per includere i valori in base alle necessità. |
Crea predittore automatico |
S3Bucket |
Il nome del bucket S3 in cui vengono scritti i dati di input e di output per questo carico di lavoro. | . |
SNSEndpoint |
Un indirizzo e-mail valido per ricevere notifiche quando i processi di predittore e previsione sono stati completati. | . |
SchemaITEM |
Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati dei metadati dell'elemento. Questo è un file facoltativo fornito nell'esempio di soluzione. | Crea set di dati |
SchemaRTS |
Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati RTS. Le dimensioni devono concordare con il tuo TTS. La grana temporale di questo file governa la grana temporale in cui è possibile effettuare previsioni. Questo è un file facoltativo fornito nell'esempio di soluzione. | Crea set di dati |
SchemaTTS |
Questo definisce l'ordine fisico, i nomi delle colonne e i tipi di dati per il set di dati TTS, l'unico set di dati richiesto. Il file deve contenere almeno un valore di destinazione, un timestamp e un elemento. | Crea set di dati |
TimestampFormatRTS |
Definisce il formato del timestamp fornito nel file RTS. | Crea lavoro di importazione set di dati |
TimestampFormatTTS |
Definisce il formato del timestamp fornito nel file TTS. | Crea lavoro di importazione set di dati |
- Scegli Avanti per accettare le opzioni di stack predefinite.
- Seleziona la casella di controllo per confermare che lo stack crea risorse IAM, quindi scegli Crea stack per distribuire il modello.
Dovresti vedere la distribuzione del modello come il nome dello stack che hai scelto in precedenza. Quando lo stato cambia in CREATE_COMPLETE
, puoi passare alla fase di caricamento dei dati.
Carica i dati
Nella sezione precedente, hai fornito un nome stack e un bucket S3. Questa sezione descrive come depositare il set di dati pubblicamente disponibile Domanda alimentare in questo secchio. Se stai utilizzando il tuo set di dati, fai riferimento a Dataset per preparare il set di dati in un formato previsto dalla distribuzione. Il set di dati deve contenere almeno le serie temporali di destinazione e, facoltativamente, le serie temporali correlate e i metadati dell'elemento:
- TTS sono i dati della serie temporale che includono il campo per il quale si desidera generare una previsione; questo campo è chiamato campo obiettivo
- RTS sono dati di serie temporali che non includono il campo obiettivo, ma includono un campo correlato
- Il file di dati dell'elemento non è costituito da dati di serie temporali, ma include informazioni sui metadati sugli elementi nei set di dati TTS o RTS
Completa i seguenti passi:
- Se utilizzi il set di dati di esempio fornito, scarica il set di dati Domanda alimentare sul tuo computer e decomprimi il file, che crea tre file all'interno di tre directory (
rts
,tts
,item
). - Sulla console Amazon S3, vai al bucket che hai creato in precedenza.
- Scegli Crea cartella.
- Utilizza la stessa stringa del nome dello stack del carico di lavoro per il nome della cartella.
- Scegli Caricare.
- Scegli le tre cartelle del set di dati, quindi scegli Caricare.
Quando il caricamento è completo, dovresti vedere qualcosa di simile allo screenshot seguente. Per questo esempio, la nostra cartella è aiml42
.
Creare un gruppo di set di dati di previsione
Completa i passaggi in questa sezione per creare un gruppo di set di dati come evento una tantum per ogni carico di lavoro. Andando avanti, dovresti pianificare l'esecuzione dei dati di importazione, creare predittore e creare passaggi di previsione appropriati, come una serie, in base alla tua pianificazione, che potrebbe essere giornaliera, settimanale o altro.
- Nella console Step Functions, individua la macchina a stati che contiene
Create-Dataset-Group
. - Nella pagina dei dettagli della macchina a stati, scegli Inizia l'esecuzione.
- Scegli Inizia l'esecuzione di nuovo per confermare.
La macchina a stati impiega circa 1 minuto per funzionare. Quando è completo, il valore under Stato di esecuzione dovrebbe cambiare da corsa a Riuscito
Importa i dati in Previsione
Segui i passaggi in questa sezione per importare il set di dati che hai caricato nel tuo bucket S3 nel tuo gruppo di set di dati:
- Nella console Step Functions, individua la macchina a stati che contiene
Import-Dataset
. - Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
- Scegli Inizia l'esecuzione di nuovo per confermare.
Il tempo necessario per l'esecuzione della macchina a stati dipende dal set di dati in fase di elaborazione.
- Mentre è in esecuzione, nel browser apri un'altra scheda e vai alla console delle previsioni.
- Nella console Previsioni, scegli Visualizza gruppi di set di dati e passare al gruppo di set di dati con il nome specificato per
DataGroupName
dallo stack del carico di lavoro. - Scegli Visualizza set di dati.
Dovresti vedere le importazioni di dati in corso.
Quando la macchina a stati per Import-Dataset
è completo, è possibile procedere al passaggio successivo per creare il modello di dati delle serie temporali.
Creare AutoPredictor (addestrare un modello di serie temporali)
Questa sezione descrive come addestrare un predittore iniziale con Forecast. Puoi scegliere di creare un nuovo predittore (il tuo primo predittore di base) o riaddestrare un predittore durante ogni ciclo di produzione, che potrebbe essere giornaliero, settimanale o altro. Puoi anche scegliere di non creare un predittore ogni ciclo e fare affidamento sul monitoraggio del predittore per guidarti quando crearne uno. La figura seguente visualizza il processo di creazione di un predittore di previsione pronto per la produzione.
Per creare un nuovo predittore, completare i seguenti passaggi:
- Nella console Step Functions, individua la macchina a stati che contiene
Create-Predictor
. - Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
- Scegli Inizia l'esecuzione di nuovo per confermare.
La quantità di tempo di esecuzione può dipendere dal set di dati in fase di elaborazione. Questo potrebbe richiedere fino a un'ora o più per il completamento. - Mentre è in esecuzione, nel browser apri un'altra scheda e vai alla console delle previsioni.
- Nella console Previsioni, scegli Visualizza gruppi di set di dati e passare al gruppo di set di dati con il nome specificato per
DataGroupName
dallo stack del carico di lavoro. - Scegli Visualizza i predittori.
Dovresti vedere l'addestramento del predittore in corso (lo stato dell'addestramento mostra "Crea in corso...").
Quando la macchina a stati per Create-Predictor
è completo, è possibile valutarne le prestazioni.
Come parte della macchina a stati, il sistema crea un predittore ed esegue anche un BacktestExport
lavoro che scrive i parametri predittori a livello di serie temporali in Amazon S3. Questi sono file che si trovano in due cartelle S3 sotto il file backtest-export
cartella:
- valori-metriche-di-accuratezza – Fornisce calcoli della metrica di accuratezza a livello di elemento in modo da poter comprendere le prestazioni di una singola serie temporale. Ciò ti consente di indagare sullo spread piuttosto che concentrarti solo sulle metriche globali.
- valori-previsioni – Fornisce previsioni a livello di fase per ogni serie temporale nella finestra del backtest. Ciò consente di confrontare il valore target effettivo da un set di test di controllo con i valori quantili previsti. La revisione di questo aiuta a formulare idee su come fornire funzionalità di dati aggiuntive in RTS o metadati degli elementi per aiutare a stimare meglio i valori futuri, riducendo ulteriormente la perdita. Puoi scaricare
backtest-export
file da Amazon S3 o interrogarli sul posto con Athena.
Con i tuoi dati, devi ispezionare da vicino i risultati del predittore e assicurarti che le metriche soddisfino i risultati attesi utilizzando i dati di esportazione del backtest. Quando sei soddisfatto, puoi iniziare a generare previsioni con data futura come descritto nella sezione successiva.
Generare una previsione (inferenza su orizzonti temporali futuri)
Questa sezione descrive come generare punti dati di previsione con Forecast. Andando avanti, dovresti raccogliere nuovi dati dal sistema di origine, importare i dati in Forecast e quindi generare punti dati di previsione. Facoltativamente, è anche possibile inserire una nuova creazione di predittore dopo l'importazione e prima della previsione. La figura seguente visualizza il processo di creazione di previsioni di serie temporali di produzione utilizzando Forecast.
Completa i seguenti passi:
- Nella console Step Functions, individua la macchina a stati che contiene
Create-Forecast
. - Nella pagina dei dettagli della macchina a stati, scegli Avvia l'esecuzione.
- Scegli Inizia l'esecuzione di nuovo per confermare.
Questa macchina a stati termina molto rapidamente perché il sistema non è configurato per generare una previsione. Non sa quale modello predittore hai approvato per l'inferenza.
Configuriamo il sistema per utilizzare il tuo predittore addestrato. - Nella console di previsione, individua l'ARN per il tuo predittore.
- Copia l'ARN da utilizzare in un passaggio successivo.
- Nel tuo browser, apri un'altra scheda e vai alla console Systems Manager.
- Nella console di Systems Manager, scegli Archivio parametri nel pannello di navigazione.
- Individua il parametro relativo al tuo stack (
/forecast/<StackName>/Forecast/PredictorArn
). - Inserisci l'ARN che hai copiato per il tuo predittore.
In questo modo si associa un predittore addestrato alla funzione di inferenza di Forecast. - Individua il parametro
/forecast/<StackName>/Forecast/Generate
e modificare il valore, sostituendoFALSE
conTRUE
.
Ora sei pronto per eseguire un processo di previsione per questo gruppo di set di dati. - Nella console Step Functions, esegui il file
Create-Forecast
macchina a stati.
Questa volta, il processo viene eseguito come previsto. Come parte della macchina a stati, il sistema crea una previsione e a ForecastExport
job, che scrive previsioni di serie temporali su Amazon S3. Questi file si trovano in forecast
cartella
All'interno del forecast
cartella, troverai le previsioni per i tuoi articoli, che si trovano in molti file CSV o Parquet, a seconda della tua selezione. Le previsioni per ogni fase temporale e serie temporali selezionate esistono con tutti i valori quantili scelti per record. Puoi scaricare questi file da Amazon S3, interrogarli sul posto con Athena o scegliere un'altra strategia per utilizzare i dati.
Questo avvolge l'intero flusso di lavoro. Ora puoi visualizzare il tuo output utilizzando qualsiasi strumento di visualizzazione di tua scelta, ad esempio Amazon QuickSight. In alternativa, i data scientist possono utilizzare i panda per generare i propri grafici. Se scegli di utilizzare QuickSight, puoi farlo collegare i risultati delle previsioni a QuickSight per eseguire trasformazioni di dati, creare una o più analisi di dati e creare visualizzazioni.
Questo processo fornisce un modello da seguire. Dovrai adattare il campione al tuo schema, impostare l'orizzonte di previsione, la risoluzione temporale e così via in base al tuo caso d'uso. Sarà inoltre necessario impostare una pianificazione ricorrente in cui i dati vengono raccolti dal sistema di origine, importare i dati e produrre previsioni. Se lo si desidera, è possibile inserire un'attività predittore tra i passaggi di importazione e previsione.
Riaddestrare il predittore
Abbiamo seguito il processo di addestramento di un nuovo predittore, ma per quanto riguarda la riqualificazione di un predittore? Il riaddestramento di un predittore è un modo per ridurre i costi e il tempo necessari per addestrare un predittore sugli ultimi dati disponibili. Anziché creare un nuovo predittore e addestrarlo sull'intero set di dati, possiamo riaddestrare il predittore esistente fornendo solo i nuovi dati incrementali resi disponibili dall'ultimo addestramento del predittore. Esaminiamo come riaddestrare un predittore utilizzando la soluzione di automazione:
- Nella console Previsioni, scegli Visualizza gruppi di set di dati.
- Scegli il gruppo di set di dati associato al predittore che desideri riaddestrare.
- Scegli Visualizza i predittori, quindi scegli il predittore che vuoi riaddestrare.
- Sulla Impostazioni profilo scheda, copiare l'ARN predittore.
È necessario aggiornare un parametro utilizzato dal flusso di lavoro per identificare il predittore da riaddestrare. - Nella console di Systems Manager, scegli Archivio parametri nel pannello di navigazione.
- Individua il parametro
/forecast/<STACKNAME>/Forecast/Predictor/ReferenceArn
. - Nella pagina dei dettagli del parametro, scegli Modifica.
- Nel Valore, inserisci l'ARN del predittore.
Questo identifica il predittore corretto per il flusso di lavoro da riaddestrare. Successivamente, dobbiamo aggiornare un parametro utilizzato dal flusso di lavoro per modificare la strategia di formazione. - Individua il parametro
/forecast/<STACKNAME>/Forecast/Predictor/Strategy
. - Nella pagina dei dettagli del parametro scegliere Modifica.
- Per Valore, inserisci
RETRAIN
.
Per impostazione predefinita, il flusso di lavoro esegue l'addestramento di un nuovo predittore; tuttavia, è possibile modificare tale comportamento per riaddestrare un predittore esistente o semplicemente riutilizzare un predittore esistente senza riaddestrare impostando questo valore suNONE
. Potresti voler rinunciare all'addestramento se i tuoi dati sono relativamente stabili o li stai utilizzando monitoraggio automatico dei predittori decidere quando è necessaria la riqualificazione. - Carica i dati di addestramento incrementale nel bucket S3.
- Nella console Step Functions, individua la macchina a stati
<STACKNAME>-Create-Predictor
. - Nella pagina dei dettagli della macchina a stati, scegli Inizia l'esecuzione per iniziare la riqualificazione.
Al termine della riqualificazione, il flusso di lavoro terminerà e riceverai una notifica e-mail SNS all'indirizzo e-mail fornito nei parametri del modello del carico di lavoro.
ripulire
Quando hai finito con questa soluzione, segui i passaggi in questa sezione per eliminare le risorse correlate.
Elimina il bucket S3
- Sulla console Amazon S3, scegli Secchi nel pannello di navigazione.
- Seleziona il bucket in cui sono stati caricati i dati e scegli Vuoto per eliminare tutti i dati associati alla soluzione, inclusi i dati di origine.
- entrare
permanently delete
per eliminare definitivamente il contenuto del bucket. - Sulla Secchi page, seleziona il bucket e scegli Elimina.
- Immettere il nome del bucket per confermare l'eliminazione e scegliere Elimina secchio.
Elimina le risorse di previsione
- Nella console Previsioni, scegli Visualizza gruppi di set di dati.
- Selezionare il nome del gruppo di set di dati associato alla soluzione, quindi scegliere Elimina.
- entrare
delete
per eliminare il gruppo di set di dati e i predittori associati, i processi di esportazione di backtest dei predittori, le previsioni e i processi di esportazione delle previsioni. - Scegli Elimina per confermare.
Elimina gli stack CloudFormation
- Nella console AWS CloudFormation, scegli Stacks nel pannello di navigazione.
- Seleziona lo stack del carico di lavoro e scegli Elimina.
- Scegli Elimina stack per confermare l'eliminazione dello stack e di tutte le risorse associate.
- Al termine dell'eliminazione, seleziona lo stack delle dipendenze e scegli Elimina.
- Scegli Elimina per confermare.
Conclusione
In questo post, abbiamo discusso alcuni modi diversi per iniziare a utilizzare Forecast. Abbiamo analizzato una soluzione di previsione automatizzata basata su AWS CloudFormation per un'implementazione rapida e ripetibile di una pipeline di previsioni dall'acquisizione dei dati all'inferenza, con poche conoscenze dell'infrastruttura richieste. Infine, abbiamo visto come utilizzare Lambda per automatizzare il riaddestramento del modello, riducendo i costi e i tempi di addestramento.
Non c'è momento migliore del presente per iniziare a fare previsioni con Forecast. Per iniziare a creare e distribuire un flusso di lavoro automatizzato, visita Risorse di Amazon Forecast. Buona previsione!
Informazioni sugli autori
Aaron Fagan è Principal Specialist Solutions Architect presso AWS con sede a New York. È specializzato nell'aiutare i clienti a progettare soluzioni per l'apprendimento automatico e la sicurezza del cloud.
Raju Patil è un Data Scientist in AWS Professional Services. Crea e distribuisce soluzioni AI/ML per aiutare i clienti AWS a superare le loro sfide aziendali. I suoi impegni con AWS hanno coperto un'ampia gamma di casi d'uso di AI/ML come visione artificiale, previsioni di serie temporali e analisi predittive, ecc., in numerosi settori, tra cui servizi finanziari, telecomunicazioni, assistenza sanitaria e altro ancora. Prima di questo, ha guidato i team di Data Science nella tecnologia pubblicitaria e ha dato un contributo significativo a numerose iniziative di ricerca e sviluppo nella visione artificiale e nella robotica. Al di fuori del lavoro, ama la fotografia, le escursioni, i viaggi e le esplorazioni culinarie.
- Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
- PlatoAiStream. Intelligenza dei dati Web3. Conoscenza amplificata. Accedi qui.
- Coniare il futuro con Adryenn Ashley. Accedi qui.
- Acquista e vendi azioni in società PRE-IPO con PREIPO®. Accedi qui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/automate-the-deployment-of-an-amazon-forecast-time-series-forecasting-model/
- :ha
- :È
- :non
- :Dove
- $ SU
- 1
- 10
- 100
- 11
- 20
- 20 anni
- 2022
- 7
- 8
- 9
- a
- WRI
- Accetta
- accesso
- Secondo
- Il mio account
- precisione
- riconoscere
- operanti in
- azioni
- adattare
- aggiuntivo
- Informazioni aggiuntive
- indirizzo
- Pubblicità
- Dopo shavasana, sedersi in silenzio; saluti;
- ancora
- AI / ML
- algoritmo
- Algoritmi
- Tutti
- Consentire
- consente
- da solo
- già
- anche
- Amazon
- Previsioni Amazon
- quantità
- an
- Analisi
- analitica
- ed
- Un altro
- in qualsiasi
- api
- approccio
- opportuno
- approvato
- SONO
- Italia
- AS
- assistere
- Associate
- associato
- At
- automatizzare
- Automatizzata
- automaticamente
- Automazione
- disponibile
- AWS
- AWS CloudFormazione
- Servizi professionali AWS
- Backtest
- Equilibrio
- saldi
- basato
- Linea di base
- BE
- perché
- prima
- iniziare
- essendo
- MIGLIORE
- Meglio
- fra
- pregiudizio
- Bound
- Scatola
- Portare
- del browser
- costruire
- Costruzione
- costruisce
- affari
- ma
- by
- calcola
- detto
- Bandi
- Materiale
- che
- Custodie
- casi
- centro
- sfide
- il cambiamento
- Modifiche
- dai un'occhiata
- scegliere
- Scegli
- ha scelto
- scelto
- strettamente
- Cloud
- Cloud Security
- codice
- codifica
- collezione
- Colonna
- COM
- Uncommon
- confrontare
- completamento di una
- complesso
- calcoli
- Calcolare
- computer
- Visione computerizzata
- concetti
- interessato
- Configurazione
- Confermare
- consolle
- contenere
- testuali
- contributi
- di controllo
- coordinare
- correggere
- Costo
- potuto
- coperto
- creare
- creato
- crea
- Creazione
- creazione
- Clienti
- ciclo
- Ciclica
- alle lezioni
- dati
- gestione dei dati
- punti dati
- scienza dei dati
- scienziato di dati
- set di dati
- dataset
- giorno
- Giorni
- decide
- dichiara
- Predefinito
- defaults
- definito
- definisce
- definizione
- consegnato
- Dipendente
- dipende
- schierare
- schierato
- distribuzione
- deployment
- implementazioni
- Distribuisce
- deposito
- descrivere
- descritta
- desiderato
- dettaglio
- dettagli
- Determinare
- sviluppatori
- Mercato
- diverso
- difficile
- Dimensioni
- dimensioni
- directory
- discusso
- do
- non
- fatto
- scaricare
- durante
- ogni
- In precedenza
- più facile
- o
- elimina
- abilitato
- Abilita
- fine
- da un capo all'altro
- garantire
- entrare
- Intero
- Ambiente
- ambienti
- errori
- stima
- eccetera
- valutare
- Anche
- Evento
- esempio
- esecuzione
- esistere
- esistente
- previsto
- aspetta
- esperienza
- export
- facilita
- falso
- familiare
- Caratteristiche
- campo
- figura
- Compila il
- File
- Limatura
- pieno
- Infine
- finanziario
- servizi finanziari
- Trovate
- Nome
- messa a fuoco
- seguire
- i seguenti
- Nel
- Previsione
- le previsioni
- formato
- via
- Avanti
- quattro
- Frequenza
- da
- completamente
- function
- funzioni
- ulteriormente
- futuro
- generare
- generato
- la generazione di
- ottenere
- globali
- Go
- andando
- governa
- grafico
- grande
- Gruppo
- Gruppo
- guida
- guida
- contento
- raccolto
- Avere
- avendo
- he
- Salute e benessere
- Assistenza sanitaria
- Aiuto
- aiutare
- aiuta
- qui
- vivamente
- il suo
- storico
- orizzonte
- Orizzonte
- ora
- Come
- Tutorial
- Tuttavia
- HTML
- http
- HTTPS
- idee
- identifica
- identificare
- Identità
- if
- illustra
- realizzare
- importare
- importazioni
- in
- includere
- inclusi
- Compreso
- industrie
- influenza
- far sapere
- informazioni
- Infrastruttura
- inizialmente
- iniziative
- ingresso
- invece
- ai miglioramenti
- indagare
- coinvolto
- IT
- elementi
- SUO
- stessa
- Lavoro
- Offerte di lavoro
- jpg
- Sapere
- conoscenze
- conosciuto
- Paese
- Cognome
- dopo
- con i più recenti
- IMPARARE
- apprendimento
- meno
- Guidato
- Dati LED
- Consente di
- ciclo di vita
- piace
- linea
- piccolo
- collocato
- località
- Lunghi
- spento
- a basso costo
- inferiore
- macchina
- machine learning
- macchine
- fatto
- Fare
- gestire
- gestito
- gestione
- direttore
- gestisce
- gestione
- manualmente
- molti
- massimo
- Maggio..
- Soddisfare
- Menu
- Metadati
- metodo
- metodi
- metrico
- Metrica
- forza
- ordine
- minuto
- mancante
- ML
- modello
- modelli
- modificare
- monitoraggio
- mensile
- Scopri di più
- cambiano
- multiplo
- devono obbligatoriamente:
- Nome
- nomi
- Navigare
- Navigazione
- necessaria
- Bisogno
- esigenze
- New
- New York
- GENERAZIONE
- no
- taccuino
- notifica
- notifiche
- adesso
- numero
- numerose
- oggetto
- oggetti
- ottenere
- of
- on
- ONE
- esclusivamente
- aprire
- open source
- OTTIMIZZA
- Opzioni
- or
- minimo
- Altro
- altrimenti
- nostro
- su
- risultati
- delineato
- produzione
- al di fuori
- ancora
- complessivo
- proprio
- pagina
- panda
- vetro
- parametro
- parametri
- parte
- per cento
- Eseguire
- performance
- permanentemente
- permessi
- fotografia
- Fisico
- conduttura
- posto
- sistemazione
- piano
- Platone
- Platone Data Intelligence
- PlatoneDati
- punti
- possibile
- Post
- previsto
- previsione
- predizione
- Previsioni
- Predictive Analytics
- Predictor
- predice
- Preparare
- presenti
- presentata
- precedente
- Direttore
- Precedente
- processi
- Elaborato
- lavorazione
- produrre
- Produzione
- professionale
- programmatica
- Progressi
- fornire
- purché
- fornisce
- fornitura
- pubblicamente
- Python
- query
- Domande
- Presto
- rapidamente
- gamma
- veloce
- piuttosto
- Crudo
- pronto
- ricevere
- raccomandare
- record
- record
- ricorrenti
- ridurre
- riducendo
- di cui
- si riferisce
- Basic
- relazionato
- relativamente
- pertinente
- fare affidamento
- rimozione
- ripetibile
- RIPETUTAMENTE
- ripetitivo
- necessario
- riparazioni
- ricerca e sviluppo
- riservato
- elastico
- Risoluzione
- Risorse
- risultante
- Risultati
- riutilizzare
- revisione
- robotica
- Ruolo
- ruoli
- Correre
- running
- stesso
- Set di dati di esempio
- soddisfatte
- Scala
- programma
- Scienze
- Scienziato
- scienziati
- senza soluzione di continuità
- Sezione
- sezioni
- sicuro
- problemi di
- vedere
- selezionato
- prodotti
- Serie
- serverless
- Server
- serve
- servizio
- Servizi
- set
- regolazione
- condiviso
- Corti
- dovrebbero
- Spettacoli
- significativa
- Un'espansione
- semplicemente
- da
- singolo
- So
- soluzione
- Soluzioni
- alcuni
- qualcosa
- Fonte
- specialista
- specializzata
- specificato
- diffondere
- stabile
- pila
- messa in scena
- Standard
- inizia a
- iniziato
- Di partenza
- Regione / Stato
- Stato dei servizi
- step
- Passi
- conservazione
- Tornare al suo account
- Strategia
- Corda
- La struttura
- tale
- supportato
- sistema
- SISTEMI DI TRATTAMENTO
- tavolo
- Fai
- prende
- Target
- Task
- task
- le squadre
- Tecnologia
- telecom
- modello
- modelli
- test
- di
- che
- Il
- L’ORIGINE
- Lo Stato
- loro
- Li
- poi
- Là.
- Strumenti Bowman per analizzare le seguenti finiture:
- cose
- questo
- tre
- Attraverso
- per tutto
- tempo
- Serie storiche
- timestamp
- a
- insieme
- argomento
- verso
- Treni
- allenato
- Training
- trasformazioni
- transizione
- viaggiare
- innescare
- vero
- seconda
- Digitare
- Tipi di
- tipicamente
- Incertezza
- per
- capire
- unità
- Aggiornanento
- caricato
- URL
- uso
- caso d'uso
- utilizzato
- utenti
- utilizzando
- APPREZZIAMO
- Valori
- vario
- molto
- via
- visione
- Visita
- visualizzazione
- camminava
- volere
- Prima
- Modo..
- modi
- we
- settimanale
- WELL
- Che
- quando
- se
- quale
- largo
- Vasta gamma
- volere
- con
- entro
- senza
- Word
- Lavora
- scrivere
- scritto
- anni
- York
- Tu
- Trasferimento da aeroporto a Sharm
- zefiro
- Codice postale