Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali

Pilota automatico Amazon SageMaker crea, addestra e ottimizza automaticamente i migliori modelli di machine learning (ML) in base ai tuoi dati, consentendoti al contempo di mantenere il pieno controllo e visibilità. Abbiamo recentemente annunciato supporto per i dati delle serie temporali in Autopilot. È possibile utilizzare Autopilot per affrontare attività di regressione e classificazione su dati di serie temporali o dati di sequenza in generale. I dati di serie temporali sono un tipo speciale di dati di sequenza in cui i punti dati vengono raccolti a intervalli di tempo pari.

La preparazione manuale dei dati, la selezione del modello ML corretto e l'ottimizzazione dei suoi parametri è un compito complesso, anche per un professionista esperto. Sebbene esistano approcci automatizzati in grado di trovare i modelli migliori e i relativi parametri, questi in genere non sono in grado di gestire i dati che arrivano come sequenze, come il traffico di rete, il consumo di elettricità o le spese domestiche registrate nel tempo. Poiché questi dati assumono la forma di osservazioni acquisite in momenti diversi, le osservazioni consecutive non possono essere trattate come indipendenti l'una dall'altra e devono essere elaborate nel loro insieme. È possibile utilizzare Autopilot per un'ampia gamma di problemi relativi ai dati sequenziali. Ad esempio, puoi classificare il traffico di rete registrato nel tempo per identificare attività dannose o determinare se le persone si qualificano per un mutuo in base alla loro storia creditizia. Fornisci un set di dati contenente dati di serie temporali e Autopilot gestisce il resto, elaborando i dati sequenziali attraverso trasformazioni di funzionalità specializzate e trovando il modello migliore per tuo conto.

L'autopilota elimina il pesante lavoro di creazione di modelli ML e ti aiuta a creare, addestrare e ottimizzare automaticamente il miglior modello ML in base ai tuoi dati. Autopilot esegue diversi algoritmi sui tuoi dati e ottimizza i loro iperparametri su un'infrastruttura di calcolo completamente gestita. In questo post, dimostriamo come puoi usare Autopilota per risolvere problemi di classificazione e regressione su dati di serie temporali. Per istruzioni sulla creazione e l'addestramento di un modello di pilota automatico, vedere Previsione del tasso di abbandono dei clienti con Amazon SageMaker Autopilot.

Classificazione dei dati di serie temporali mediante il pilota automatico

Come esempio corrente, consideriamo un problema multi-classe sulle serie temporali dataset UWaveGestureLibraryX, contenente letture equidistanti dei sensori dell'accelerometro durante l'esecuzione di uno degli otto gesti della mano predefiniti. Per semplicità, consideriamo solo la dimensione X dell'accelerometro. Il compito è costruire un modello di classificazione per mappare i dati delle serie temporali dalle letture del sensore ai gesti predefiniti. La figura seguente mostra le prime righe del set di dati in formato CSV. L'intera tabella è composta da 896 righe e due colonne: la prima colonna è un'etichetta di gesti e la seconda colonna è una serie temporale di letture del sensore.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Converti i dati nel formato corretto con Amazon SageMaker Data Wrangler

Oltre ad accettare colonne di testo numeriche, categoriali e standard, Autopilot ora accetta anche una colonna di input di sequenza. Se i dati delle serie temporali non seguono questo formato, puoi facilmente convertirli Gestore di dati di Amazon SageMaker. Data Wrangler riduce il tempo necessario per aggregare e preparare i dati per ML da settimane a minuti. Con Data Wrangler, puoi semplificare il processo di preparazione dei dati e ingegneria delle funzionalità e completare ogni fase del flusso di lavoro di preparazione dei dati, inclusa la selezione, la pulizia, l'esplorazione e la visualizzazione dei dati da un'unica interfaccia visiva. Ad esempio, si consideri lo stesso set di dati ma in un formato di input diverso: ogni gesto (specificato da ID) è una sequenza di misurazioni equidistanti dell'accelerometro. Se memorizzata verticalmente, ogni riga contiene un timestamp e un valore. La figura seguente confronta questi dati nel formato originale e in un formato sequenza.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Per convertire questo set di dati nel formato descritto in precedenza utilizzando Data Wrangler, caricare il set di dati da Servizio di archiviazione semplice Amazon (Amazon S3). Quindi usa il serie storica Raggruppa per trasformata, come mostrato nello screenshot seguente, ed esportare nuovamente i dati in Amazon S3 in formato CSV.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Quando il set di dati è nel formato designato, puoi procedere con Autopilot. Per controllare altri trasformatori di serie temporali di Data Wrangler fare riferimento a Prepara i dati delle serie temporali con Amazon SageMaker Data Wrangler.

Avvia un processo AutoML

Come con altri tipi di input supportati da Autopilot, ogni riga del set di dati è un'osservazione diversa e ogni colonna è una funzionalità. In questo esempio, abbiamo una singola colonna contenente dati di serie temporali, ma puoi avere più colonne di serie temporali. Puoi anche avere più colonne con diversi tipi di input, come serie temporali, testo e numerici.

A creare un esperimento di pilota automatico, posiziona il set di dati in un bucket S3 e crea un nuovo esperimento all'interno Amazon Sage Maker Studio. Come mostrato nella schermata seguente, è necessario specificare il nome dell'esperimento, la posizione S3 del set di dati, la posizione S3 per gli artefatti di output e il nome della colonna da prevedere.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Autopilot analizza i dati, genera pipeline ML ed esegue 250 iterazioni predefinite di ottimizzazione degli iperparametri su questa attività di classificazione. Come mostrato nella seguente classifica del modello, Autopilot raggiunge una precisione di 0.821 e puoi distribuire il modello migliore in un solo clic.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Inoltre, Autopilot genera a rapporto di esplorazione dei dati, dove puoi visualizzare ed esplorare i tuoi dati.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

La trasparenza è fondamentale per Autopilot. È possibile esaminare e modificare le pipeline ML generate all'interno del notebook delle definizioni dei candidati. La schermata seguente mostra come Autopilot consiglia una gamma di pipeline, combinando il trasformatore di serie temporali TSFeatureExtractor con diversi algoritmi ML, come alberi decisionali con gradiente booster e modelli lineari. Il TSFeatureExtractor estrae per te centinaia di funzioni di serie temporali, che vengono quindi inviate agli algoritmi a valle per fare previsioni. Per l'elenco completo delle caratteristiche delle serie temporali, fare riferimento a Panoramica sulle funzionalità estratte.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Conclusione

In questo post, abbiamo dimostrato come utilizzare SageMaker Autopilot per risolvere i problemi di classificazione e regressione delle serie temporali in pochi clic.

Per ulteriori informazioni sul pilota automatico, vedere Pilota automatico Amazon SageMaker. Per esplorare le funzionalità correlate di SageMaker, vedere Gestore di dati di Amazon SageMaker.


Informazioni sugli autori

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Nikita Ivkin è uno scienziato applicato, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Anna Milberto è un ingegnere di sviluppo software che lavora su Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Valerio Perrone è un Applied Science Manager che lavora su Amazon SageMaker Automatic Model Tuning e Autopilot.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.Megana Satish è un ingegnere di sviluppo software che lavora su Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot ora supporta i dati delle serie temporali PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Alì Takbiri è un Solutions Architect specializzato in AI/ML e aiuta i clienti utilizzando Machine Learning per risolvere le loro sfide aziendali sul cloud AWS.

Timestamp:

Di più da Apprendimento automatico di AWS