Автопілот Amazon SageMaker автоматично створює, навчає та налаштовує найкращі моделі машинного навчання (ML) на основі ваших даних, дозволяючи вам зберігати повний контроль та видимість. Ми нещодавно оголосили підтримка даних часових рядів в автопілоті. Ви можете використовувати автопілот для вирішення завдань регресії та класифікації даних часових рядів або даних послідовності в цілому. Дані часових рядів — це особливий тип даних послідовності, де точки даних збираються через парні проміжки часу.
Підготовка даних вручну, вибір правильної моделі ML та оптимізація її параметрів є складним завданням навіть для фахівця-практика. Хоча існують автоматизовані підходи, які дозволяють знайти найкращі моделі та їх параметри, вони, як правило, не можуть обробляти дані, які надходять у вигляді послідовностей, як-от мережевий трафік, споживання електроенергії або витрати домогосподарства, записані з часом. Оскільки ці дані мають форму спостережень, отриманих у різні моменти часу, послідовні спостереження не можуть розглядатися як незалежні одне від одного і їх потрібно обробляти як єдине ціле. Ви можете використовувати автопілот для вирішення широкого кола проблем, пов’язаних із послідовними даними. Наприклад, ви можете класифікувати мережевий трафік, записаний протягом певного часу, щоб виявити шкідливі дії, або визначити, чи мають особи право на отримання іпотеки на основі їх кредитної історії. Ви надаєте набір даних, що містить дані часових рядів, а автопілот обробляє решту, обробляючи послідовні дані за допомогою спеціалізованих перетворень функцій і знаходячи найкращу модель від вашого імені.
Автопілот усуває важку роботу зі створення моделей машинного навчання та допомагає автоматично створювати, навчати та налаштовувати найкращу модель машинного навчання на основі ваших даних. Автопілот запускає кілька алгоритмів для ваших даних і налаштовує їх гіперпараметри на повністю керованій обчислювальній інфраструктурі. У цій публікації ми продемонструємо, як ви можете використовувати автопілот розв’язувати задачі класифікації та регресії за даними часових рядів. Інструкції щодо створення та навчання моделі автопілота див Прогноз відтоку клієнтів за допомогою автопілота Amazon SageMaker.
Класифікація даних часових рядів за допомогою автопілота
Як приклад, ми розглянемо багатокласову задачу для часового ряду набору даних UWaveGestureLibraryX, що містить рівновіддалені показання датчиків акселерометра під час виконання одного з восьми попередньо визначених жестів руками. Для простоти розглянемо лише X-вимір акселерометра. Завдання полягає в тому, щоб побудувати модель класифікації для відображення даних часового ряду від показань датчика до попередньо визначених жестів. На наступному малюнку показані перші рядки набору даних у форматі CSV. Вся таблиця складається з 896 рядків і двох стовпців: перший стовпець — це мітка жесту, а другий — часовий ряд показань датчика.
Перетворіть дані в потрібний формат за допомогою Amazon SageMaker Data Wrangler
Крім прийняття числових, категорійних і стандартних текстових стовпців, автопілот тепер також приймає стовпець введення послідовності. Якщо ваші дані часового ряду не відповідають цьому формату, ви можете легко конвертувати їх Amazon SageMaker Data Wrangler. Data Wrangler скорочує час, необхідний для узагальнення та підготовки даних для ML, з тижнів до хвилин. За допомогою Data Wrangler ви можете спростити процес підготовки даних і розробку функцій, а також завершити кожен крок процесу підготовки даних, включаючи вибір, очищення, дослідження та візуалізацію за допомогою одного візуального інтерфейсу. Наприклад, розглянемо той самий набір даних, але в іншому форматі введення: кожен жест (зазначений ідентифікатором) є послідовністю рівновіддалених вимірювань акселерометра. При вертикальному збереженні кожен рядок містить позначку часу та одне значення. На наступному малюнку ці дані порівнюються в оригінальному форматі та у форматі послідовності.
Щоб перетворити цей набір даних у формат, описаний раніше, за допомогою Data Wrangler, завантажте набір даних з Служба простого зберігання Amazon (Amazon S3). Потім використовуйте часовий ряд Групування за перетворенням, як показано на наступному знімку екрана, та експортуйте дані назад до Amazon S3 у форматі CSV.
Коли набір даних у призначеному форматі, ви можете продовжити роботу з автопілотом. Щоб перевірити інші трансформатори часових рядів Data Wrangler, див Підготуйте дані часових рядів за допомогою Amazon SageMaker Data Wrangler.
Запустіть завдання AutoML
Як і інші типи вводу, які підтримує Autopilot, кожен рядок набору даних є іншим спостереженням, а кожен стовпець є функцією. У цьому прикладі ми маємо один стовпець, що містить дані часових рядів, але ви можете мати кілька стовпців часових рядів. Ви також можете мати кілька стовпців з різними типами вводу, такими як часові ряди, текстові та числові.
До створити експеримент на автопілоті, помістіть набір даних у відро S3 та створіть новий експеримент Студія Amazon SageMaker. Як показано на наступному знімку екрана, ви повинні вказати ім’я експерименту, розташування S3 набору даних, розташування S3 для вихідних артефактів і назву стовпця для прогнозування.
Автопілот аналізує дані, генерує конвеєри ML і виконує стандартні 250 ітерацій оптимізації гіперпараметрів для цього завдання класифікації. Як показано в наступній таблиці лідерів моделі, автопілот досягає точності 0.821, і ви можете розгорнути найкращу модель лише одним клацанням миші.
Крім того, автопілот генерує a звіт про дослідження даних, де ви можете візуалізувати та досліджувати свої дані.
Прозорість є основою для автопілота. Ви можете перевіряти та змінювати згенеровані конвеєри ML у блокноті визначення кандидатів. На наступному знімку екрана показано, як Autopilot рекомендує ряд конвеєрів, поєднуючи трансформатор часового ряду TSFeatureExtractor
з різними алгоритмами машинного навчання, такими як дерева рішень із посиленням градієнта та лінійні моделі. The TSFeatureExtractor
витягує для вас сотні характеристик часових рядів, які потім передаються в подальші алгоритми для прогнозування. Повний список функцій часових рядів див Огляд вилучених функцій.
Висновок
У цій публікації ми продемонстрували, як використовувати автопілот SageMaker для вирішення проблем класифікації часових рядів і регресії всього за кілька кліків.
Додаткову інформацію про автопілот див Автопілот Amazon SageMaker. Щоб вивчити пов’язані функції SageMaker, див Amazon SageMaker Data Wrangler.
Про авторів
Микита Івкін є прикладним науковцем, Amazon SageMaker Data Wrangler.
Енн Мілберт є інженером з розробки програмного забезпечення, який працює над автоматичним налаштуванням моделі Amazon SageMaker.
Валеріо Перроне є менеджером прикладних наук, який працює над автоматичним налаштуванням моделі та автопілотом Amazon SageMaker.
Мегана Сатіш є інженером з розробки програмного забезпечення, який працює над автоматичним налаштуванням моделі Amazon SageMaker.
Алі Такбірі є спеціалістом з AI/ML, архітектором рішень і допомагає клієнтам за допомогою машинного навчання вирішувати їхні бізнес-задачі в хмарі AWS.
- Coinsmart. Найкраща в Європі біржа біткойн та криптовалют.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. БЕЗКОШТОВНИЙ ДОСТУП.
- CryptoHawk. Альткойн Радар. Безкоштовне випробування.
- Джерело: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-autopilot-now-supports-time-series-data/
- "
- 100
- МЕНЮ
- придбаний
- діяльності
- алгоритми
- Дозволити
- хоча
- Amazon
- оголошений
- Автоматизований
- AWS
- КРАЩЕ
- Підвищений
- будувати
- Створюємо
- Будує
- бізнес
- проблеми
- класифікація
- хмара
- Колонка
- комплекс
- обчислення
- поспіль
- споживання
- містить
- контроль
- створення
- кредит
- Клієнти
- дані
- справу
- розгортання
- розробка
- різний
- Розмір
- Ні
- легко
- електрика
- інженер
- Машинобудування
- приклад
- витрати
- експеримент
- дослідження
- Виписки
- особливість
- риси
- Fed
- Рисунок
- Перший
- стежити
- після
- форма
- формат
- Повний
- Загальне
- Group
- допомагає
- історія
- домашнє господарство
- Як
- How To
- HTTPS
- Сотні
- ідентифікувати
- У тому числі
- інформація
- Інфраструктура
- інтерфейс
- IT
- вивчення
- список
- загрузка
- розташування
- машина
- навчання за допомогою машини
- менеджер
- карта
- ML
- модель
- Моделі
- мережу
- мережевий трафік
- ноутбук
- оптимізація
- Інше
- прогноз
- Прогнози
- Проблема
- проблеми
- процес
- забезпечувати
- діапазон
- рекомендує
- REST
- біг
- наука
- вчений
- Серія
- простий
- Софтвер
- розробка програмного забезпечення
- Рішення
- ВИРІШИТИ
- спеціалізований
- зберігання
- Підтриманий
- Опори
- завдання
- через
- час
- топ
- трафік
- Навчання
- поїзда
- використання
- значення
- видимість
- візуалізації
- в
- робочий
- X