O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal

Piloto automático do Amazon SageMaker cria, treina e ajusta automaticamente os melhores modelos de aprendizado de máquina (ML) com base em seus dados, permitindo que você mantenha total controle e visibilidade. Recentemente anunciamos suporte para dados de série temporal no piloto automático. Você pode usar o Autopilot para lidar com tarefas de regressão e classificação em dados de séries temporais ou dados de sequência em geral. Os dados de série temporal são um tipo especial de dados de sequência em que os pontos de dados são coletados em intervalos de tempo uniformes.

Preparar manualmente os dados, selecionar o modelo de ML correto e otimizar seus parâmetros é uma tarefa complexa, mesmo para um profissional especializado. Embora existam abordagens automatizadas que podem encontrar os melhores modelos e seus parâmetros, elas normalmente não podem lidar com dados que vêm como sequências, como tráfego de rede, consumo de eletricidade ou despesas domésticas registradas ao longo do tempo. Como esses dados assumem a forma de observações adquiridas em diferentes momentos, observações consecutivas não podem ser tratadas como independentes umas das outras e precisam ser processadas como um todo. Você pode usar o Autopilot para uma ampla gama de problemas que lidam com dados sequenciais. Por exemplo, você pode classificar o tráfego de rede registrado ao longo do tempo para identificar atividades maliciosas ou determinar se os indivíduos se qualificam para uma hipoteca com base em seu histórico de crédito. Você fornece um conjunto de dados contendo dados de séries temporais e o Autopilot cuida do resto, processando os dados sequenciais por meio de transformações de recursos especializados e encontrando o melhor modelo para você.

O Autopilot elimina o trabalho pesado de criar modelos de ML e ajuda você a criar, treinar e ajustar automaticamente o melhor modelo de ML com base em seus dados. O Autopilot executa vários algoritmos em seus dados e ajusta seus hiperparâmetros em uma infraestrutura de computação totalmente gerenciada. Neste post, demonstramos como você pode usar Piloto automático resolver problemas de classificação e regressão em dados de séries temporais. Para obter instruções sobre como criar e treinar um modelo de piloto automático, consulte Previsão de rotatividade de clientes com Amazon SageMaker Autopilot.

Classificação de dados de série temporal usando o piloto automático

Como exemplo de execução, consideramos um problema multiclasse na série temporal conjunto de dados UWaveGestureLibraryX, contendo leituras equidistantes dos sensores do acelerômetro durante a execução de um dos oito gestos de mão predefinidos. Por simplicidade, consideramos apenas a dimensão X do acelerômetro. A tarefa é construir um modelo de classificação para mapear os dados de séries temporais das leituras do sensor para os gestos predefinidos. A figura a seguir mostra as primeiras linhas do conjunto de dados no formato CSV. A tabela inteira consiste em 896 linhas e duas colunas: a primeira coluna é um rótulo de gesto e a segunda coluna é uma série temporal de leituras do sensor.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Converta dados para o formato correto com o Amazon SageMaker Data Wrangler

Além de aceitar colunas de texto numéricas, categóricas e padrão, o Autopilot agora também aceita uma coluna de entrada de sequência. Se seus dados de série temporal não seguirem esse formato, você poderá convertê-los facilmente por meio de Gerenciador de dados do Amazon SageMaker. O Data Wrangler reduz o tempo necessário para agregar e preparar dados para ML de semanas para minutos. Com o Data Wrangler, você pode simplificar o processo de preparação de dados e engenharia de recursos e concluir cada etapa do fluxo de trabalho de preparação de dados, incluindo seleção, limpeza, exploração e visualização de dados a partir de uma única interface visual. Por exemplo, considere o mesmo conjunto de dados, mas em um formato de entrada diferente: cada gesto (especificado por ID) é uma sequência de medidas equidistantes do acelerômetro. Quando armazenado verticalmente, cada linha contém um carimbo de data/hora e um valor. A figura a seguir compara esses dados em seu formato original e um formato de sequência.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Para converter esse conjunto de dados para o formato descrito anteriormente usando o Data Wrangler, carregue o conjunto de dados de Serviço de armazenamento simples da Amazon (Amazônia S3). Em seguida, use o série temporal Agrupar por transformação, conforme mostrado na captura de tela a seguir, e exporte os dados de volta para o Amazon S3 no formato CSV.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Quando o conjunto de dados estiver no formato designado, você poderá prosseguir com o Autopilot. Para verificar outros transformadores de série temporal do Data Wrangler, consulte Prepare dados de série temporal com o Amazon SageMaker Data Wrangler.

Iniciar um trabalho do AutoML

Tal como acontece com outros tipos de entrada suportados pelo Autopilot, cada linha do conjunto de dados é uma observação diferente e cada coluna é um recurso. Neste exemplo, temos uma única coluna contendo dados de séries temporais, mas você pode ter várias colunas de séries temporais. Você também pode ter várias colunas com diferentes tipos de entrada, como série temporal, texto e numérico.

Para criar um experimento de piloto automático, coloque o conjunto de dados em um bucket do S3 e crie um novo experimento dentro Estúdio Amazon SageMaker. Conforme mostrado na captura de tela a seguir, você deve especificar o nome do experimento, o local do S3 do conjunto de dados, o local do S3 para os artefatos de saída e o nome da coluna para prever.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

O Autopilot analisa os dados, gera pipelines de ML e executa um padrão de 250 iterações de otimização de hiperparâmetros nesta tarefa de classificação. Conforme mostrado na tabela de classificação de modelos a seguir, o Autopilot atinge 0.821 de precisão e você pode implantar o melhor modelo em apenas um clique.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Além disso, o Autopilot gera um relatório de exploração de dados, onde você pode visualizar e explorar seus dados.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

A transparência é fundamental para o piloto automático. Você pode inspecionar e modificar pipelines de ML gerados no notebook de definição de candidatos. A captura de tela a seguir demonstra como o Autopilot recomenda uma variedade de pipelines, combinando o transformador de série temporal TSFeatureExtractor com diferentes algoritmos de ML, como árvores de decisão impulsionadas por gradiente e modelos lineares. O TSFeatureExtractor extrai centenas de recursos de séries temporais para você, que são então alimentados aos algoritmos downstream para fazer previsões. Para obter a lista completa de recursos de séries temporais, consulte Visão geral dos recursos extraídos.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.

Conclusão

Neste post, demonstramos como usar o SageMaker Autopilot para resolver problemas de classificação e regressão de séries temporais em apenas alguns cliques.

Para obter mais informações sobre o piloto automático, consulte Piloto automático do Amazon SageMaker. Para explorar os recursos relacionados do SageMaker, consulte Gerenciador de dados do Amazon SageMaker.


Sobre os autores

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Nikita Ivkin é um cientista aplicado, Amazon SageMaker Data Wrangler.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Ana Milbert é um engenheiro de desenvolvimento de software que trabalha no Amazon SageMaker Automatic Model Tuning.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Valério Perrone é um gerente de ciência aplicada que trabalha no ajuste automático de modelos e no piloto automático do Amazon SageMaker.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai.Meghana Satish é um engenheiro de desenvolvimento de software que trabalha no Amazon SageMaker Automatic Model Tuning.

O Amazon SageMaker Autopilot agora oferece suporte a dados de série temporal PlatoBlockchain Data Intelligence. Pesquisa Vertical. Ai. Ali Takbiri é um arquiteto de soluções especialista em IA/ML e ajuda os clientes usando Machine Learning para resolver seus desafios de negócios na Nuvem AWS.

Carimbo de hora:

Mais de Aprendizado de máquina da AWS