Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Amazon SageMaker Autopilot ahora admite datos de series temporales

Piloto automático Amazon SageMaker crea, entrena y ajusta automáticamente los mejores modelos de aprendizaje automático (ML) en función de sus datos, al tiempo que le permite mantener el control y la visibilidad totales. Recientemente hemos anunciado compatibilidad con datos de series temporales en Autopilot. Puede usar Autopilot para abordar tareas de clasificación y regresión en datos de series temporales o datos de secuencia en general. Los datos de series temporales son un tipo especial de datos de secuencia donde los puntos de datos se recopilan en intervalos de tiempo uniformes.

Preparar manualmente los datos, seleccionar el modelo de ML correcto y optimizar sus parámetros es una tarea compleja, incluso para un profesional experto. Aunque existen enfoques automatizados que pueden encontrar los mejores modelos y sus parámetros, por lo general no pueden manejar datos que vienen como secuencias, como el tráfico de red, el consumo de electricidad o los gastos domésticos registrados a lo largo del tiempo. Debido a que estos datos toman la forma de observaciones adquiridas en diferentes momentos, las observaciones consecutivas no pueden tratarse como independientes entre sí y deben procesarse como un todo. Puede usar Autopilot para una amplia variedad de problemas relacionados con datos secuenciales. Por ejemplo, puede clasificar el tráfico de red registrado a lo largo del tiempo para identificar actividades maliciosas o determinar si las personas califican para una hipoteca en función de su historial crediticio. Usted proporciona un conjunto de datos que contiene datos de series temporales y Autopilot maneja el resto, procesando los datos secuenciales a través de transformaciones de características especializadas y encontrando el mejor modelo en su nombre.

El piloto automático elimina el trabajo pesado de crear modelos de ML y lo ayuda a crear, entrenar y ajustar automáticamente el mejor modelo de ML en función de sus datos. Autopilot ejecuta varios algoritmos en sus datos y ajusta sus hiperparámetros en una infraestructura informática completamente administrada. En esta publicación, demostramos cómo puede usar Piloto automático para resolver problemas de clasificación y regresión sobre datos de series temporales. Para obtener instrucciones sobre cómo crear y entrenar un modelo de piloto automático, consulte Predicción de abandono de clientes con Amazon SageMaker Autopilot.

Clasificación de datos de series temporales mediante Autopilot

Como ejemplo, consideramos un problema multiclase en la serie de tiempo datos UWaveGestureLibraryX, que contiene lecturas equidistantes de los sensores del acelerómetro mientras realiza uno de los ocho gestos manuales predefinidos. Para simplificar, consideramos solo la dimensión X del acelerómetro. La tarea es construir un modelo de clasificación para mapear los datos de la serie temporal desde las lecturas del sensor hasta los gestos predefinidos. La siguiente figura muestra las primeras filas del conjunto de datos en formato CSV. La tabla completa consta de 896 filas y dos columnas: la primera columna es una etiqueta de gesto y la segunda columna es una serie temporal de lecturas del sensor.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Convierta datos al formato correcto con Amazon SageMaker Data Wrangler

Además de aceptar columnas de texto estándar, categóricas y numéricas, Autopilot ahora también acepta una columna de entrada de secuencia. Si los datos de su serie temporal no siguen este formato, puede convertirlos fácilmente a través de Wrangler de datos de Amazon SageMaker. Data Wrangler reduce el tiempo que lleva agregar y preparar datos para ML de semanas a minutos. Con Data Wrangler, puede simplificar el proceso de preparación de datos y la ingeniería de características, y completar cada paso del flujo de trabajo de preparación de datos, incluida la selección, limpieza, exploración y visualización de datos desde una única interfaz visual. Por ejemplo, considere el mismo conjunto de datos pero en un formato de entrada diferente: cada gesto (especificado por ID) es una secuencia de mediciones equidistantes del acelerómetro. Cuando se almacena verticalmente, cada fila contiene una marca de tiempo y un valor. La siguiente figura compara estos datos en su formato original y un formato de secuencia.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Para convertir este conjunto de datos al formato descrito anteriormente con Data Wrangler, cargue el conjunto de datos desde Servicio de almacenamiento simple de Amazon (Amazon S3). Luego usa el Serie temporal Agrupar por transformada, como se muestra en la siguiente captura de pantalla, y vuelva a exportar los datos a Amazon S3 en formato CSV.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Cuando el conjunto de datos está en su formato designado, puede continuar con Autopilot. Para consultar otros transformadores de series temporales de Data Wrangler, consulte Prepare datos de series temporales con Amazon SageMaker Data Wrangler.

Iniciar un trabajo de AutoML

Al igual que con otros tipos de entrada admitidos por Autopilot, cada fila del conjunto de datos es una observación diferente y cada columna es una característica. En este ejemplo, tenemos una sola columna que contiene datos de series temporales, pero puede tener varias columnas de series temporales. También puede tener varias columnas con diferentes tipos de entrada, como series temporales, texto y números.

A crear un experimento de piloto automático, coloque el conjunto de datos en un depósito S3 y cree un nuevo experimento dentro Estudio Amazon SageMaker. Como se muestra en la siguiente captura de pantalla, debe especificar el nombre del experimento, la ubicación de S3 del conjunto de datos, la ubicación de S3 para los artefactos de salida y el nombre de la columna para predecir.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Autopilot analiza los datos, genera canalizaciones de ML y ejecuta 250 iteraciones predeterminadas de optimización de hiperparámetros en esta tarea de clasificación. Como se muestra en la siguiente tabla de clasificación de modelos, el piloto automático alcanza una precisión de 0.821 y puede implementar el mejor modelo con un solo clic.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Además, Autopilot genera un informe de exploración de datos, donde puede visualizar y explorar sus datos.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

La transparencia es fundamental para Autopilot. Puede inspeccionar y modificar las canalizaciones de ML generadas dentro del cuaderno de definiciones de candidatos. La siguiente captura de pantalla muestra cómo Autopilot recomienda una gama de tuberías, combinando el transformador de serie temporal TSFeatureExtractor con diferentes algoritmos de ML, como árboles de decisión potenciados por gradientes y modelos lineales. los TSFeatureExtractor extrae cientos de características de series temporales para usted, que luego se alimentan a los algoritmos posteriores para hacer predicciones. Para obtener la lista completa de funciones de series temporales, consulte Descripción general de las características extraídas.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Conclusión

En esta publicación, demostramos cómo usar SageMaker Autopilot para resolver problemas de clasificación y regresión de series temporales con solo unos pocos clics.

Para obtener más información sobre el piloto automático, consulte Piloto automático Amazon SageMaker. Para explorar funciones relacionadas de SageMaker, consulte Wrangler de datos de Amazon SageMaker.


Acerca de los autores

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.Nikita Ivkina es un científico aplicado, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.ana milbert es un ingeniero de desarrollo de software que trabaja en Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.Valerio Perrone es un administrador de ciencias aplicadas que trabaja en Amazon SageMaker Automatic Model Tuning y Autopilot.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.meghana es un ingeniero de desarrollo de software que trabaja en Amazon SageMaker Automatic Model Tuning.

Amazon SageMaker Autopilot ahora admite datos de series temporales PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai. Ali Takbiri es un arquitecto de soluciones especialista en AI/ML y ayuda a los clientes mediante el uso de Machine Learning para resolver sus desafíos comerciales en la nube de AWS.

Sello de tiempo:

Mas de Aprendizaje automático de AWS