Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів

Автопілот Amazon SageMaker автоматично створює, навчає та налаштовує найкращі моделі машинного навчання (ML) на основі ваших даних, дозволяючи вам зберігати повний контроль та видимість. Ми нещодавно оголосили підтримка даних часових рядів в автопілоті. Ви можете використовувати автопілот для вирішення завдань регресії та класифікації даних часових рядів або даних послідовності в цілому. Дані часових рядів — це особливий тип даних послідовності, де точки даних збираються через парні проміжки часу.

Підготовка даних вручну, вибір правильної моделі ML та оптимізація її параметрів є складним завданням навіть для фахівця-практика. Хоча існують автоматизовані підходи, які дозволяють знайти найкращі моделі та їх параметри, вони, як правило, не можуть обробляти дані, які надходять у вигляді послідовностей, як-от мережевий трафік, споживання електроенергії або витрати домогосподарства, записані з часом. Оскільки ці дані мають форму спостережень, отриманих у різні моменти часу, послідовні спостереження не можуть розглядатися як незалежні одне від одного і їх потрібно обробляти як єдине ціле. Ви можете використовувати автопілот для вирішення широкого кола проблем, пов’язаних із послідовними даними. Наприклад, ви можете класифікувати мережевий трафік, записаний протягом певного часу, щоб виявити шкідливі дії, або визначити, чи мають особи право на отримання іпотеки на основі їх кредитної історії. Ви надаєте набір даних, що містить дані часових рядів, а автопілот обробляє решту, обробляючи послідовні дані за допомогою спеціалізованих перетворень функцій і знаходячи найкращу модель від вашого імені.

Автопілот усуває важку роботу зі створення моделей машинного навчання та допомагає автоматично створювати, навчати та налаштовувати найкращу модель машинного навчання на основі ваших даних. Автопілот запускає кілька алгоритмів для ваших даних і налаштовує їх гіперпараметри на повністю керованій обчислювальній інфраструктурі. У цій публікації ми продемонструємо, як ви можете використовувати автопілот розв’язувати задачі класифікації та регресії за даними часових рядів. Інструкції щодо створення та навчання моделі автопілота див Прогноз відтоку клієнтів за допомогою автопілота Amazon SageMaker.

Класифікація даних часових рядів за допомогою автопілота

Як приклад, ми розглянемо багатокласову задачу для часового ряду набору даних UWaveGestureLibraryX, що містить рівновіддалені показання датчиків акселерометра під час виконання одного з восьми попередньо визначених жестів руками. Для простоти розглянемо лише X-вимір акселерометра. Завдання полягає в тому, щоб побудувати модель класифікації для відображення даних часового ряду від показань датчика до попередньо визначених жестів. На наступному малюнку показані перші рядки набору даних у форматі CSV. Вся таблиця складається з 896 рядків і двох стовпців: перший стовпець — це мітка жесту, а другий — часовий ряд показань датчика.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Перетворіть дані в потрібний формат за допомогою Amazon SageMaker Data Wrangler

Крім прийняття числових, категорійних і стандартних текстових стовпців, автопілот тепер також приймає стовпець введення послідовності. Якщо ваші дані часового ряду не відповідають цьому формату, ви можете легко конвертувати їх Amazon SageMaker Data Wrangler. Data Wrangler скорочує час, необхідний для узагальнення та підготовки даних для ML, з тижнів до хвилин. За допомогою Data Wrangler ви можете спростити процес підготовки даних і розробку функцій, а також завершити кожен крок процесу підготовки даних, включаючи вибір, очищення, дослідження та візуалізацію за допомогою одного візуального інтерфейсу. Наприклад, розглянемо той самий набір даних, але в іншому форматі введення: кожен жест (зазначений ідентифікатором) є послідовністю рівновіддалених вимірювань акселерометра. При вертикальному збереженні кожен рядок містить позначку часу та одне значення. На наступному малюнку ці дані порівнюються в оригінальному форматі та у форматі послідовності.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Щоб перетворити цей набір даних у формат, описаний раніше, за допомогою Data Wrangler, завантажте набір даних з Служба простого зберігання Amazon (Amazon S3). Потім використовуйте часовий ряд Групування за перетворенням, як показано на наступному знімку екрана, та експортуйте дані назад до Amazon S3 у форматі CSV.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Коли набір даних у призначеному форматі, ви можете продовжити роботу з автопілотом. Щоб перевірити інші трансформатори часових рядів Data Wrangler, див Підготуйте дані часових рядів за допомогою Amazon SageMaker Data Wrangler.

Запустіть завдання AutoML

Як і інші типи вводу, які підтримує Autopilot, кожен рядок набору даних є іншим спостереженням, а кожен стовпець є функцією. У цьому прикладі ми маємо один стовпець, що містить дані часових рядів, але ви можете мати кілька стовпців часових рядів. Ви також можете мати кілька стовпців з різними типами вводу, такими як часові ряди, текстові та числові.

До створити експеримент на автопілоті, помістіть набір даних у відро S3 та створіть новий експеримент Студія Amazon SageMaker. Як показано на наступному знімку екрана, ви повинні вказати ім’я експерименту, розташування S3 набору даних, розташування S3 для вихідних артефактів і назву стовпця для прогнозування.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Автопілот аналізує дані, генерує конвеєри ML і виконує стандартні 250 ітерацій оптимізації гіперпараметрів для цього завдання класифікації. Як показано в наступній таблиці лідерів моделі, автопілот досягає точності 0.821, і ви можете розгорнути найкращу модель лише одним клацанням миші.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Крім того, автопілот генерує a звіт про дослідження даних, де ви можете візуалізувати та досліджувати свої дані.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Прозорість є основою для автопілота. Ви можете перевіряти та змінювати згенеровані конвеєри ML у блокноті визначення кандидатів. На наступному знімку екрана показано, як Autopilot рекомендує ряд конвеєрів, поєднуючи трансформатор часового ряду TSFeatureExtractor з різними алгоритмами машинного навчання, такими як дерева рішень із посиленням градієнта та лінійні моделі. The TSFeatureExtractor витягує для вас сотні характеристик часових рядів, які потім передаються в подальші алгоритми для прогнозування. Повний список функцій часових рядів див Огляд вилучених функцій.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Висновок

У цій публікації ми продемонстрували, як використовувати автопілот SageMaker для вирішення проблем класифікації часових рядів і регресії всього за кілька кліків.

Додаткову інформацію про автопілот див Автопілот Amazon SageMaker. Щоб вивчити пов’язані функції SageMaker, див Amazon SageMaker Data Wrangler.


Про авторів

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Микита Івкін є прикладним науковцем, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Енн Мілберт є інженером з розробки програмного забезпечення, який працює над автоматичним налаштуванням моделі Amazon SageMaker.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Валеріо Перроне є менеджером прикладних наук, який працює над автоматичним налаштуванням моделі та автопілотом Amazon SageMaker.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.Мегана Сатіш є інженером з розробки програмного забезпечення, який працює над автоматичним налаштуванням моделі Amazon SageMaker.

Amazon SageMaker Autopilot тепер підтримує дані часових рядів PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai. Алі Такбірі є спеціалістом з AI/ML, архітектором рішень і допомагає клієнтам за допомогою машинного навчання вирішувати їхні бізнес-задачі в хмарі AWS.

Часова мітка:

Більше від AWS Машинне навчання