Прогнозирование распространенных типов отказов машин имеет решающее значение в обрабатывающей промышленности. Имея набор характеристик продукта, который связан с данным типом сбоя, вы можете разработать модель, которая может предсказать тип сбоя, когда вы вводите эти атрибуты в модель машинного обучения (ML). Машинное обучение может помочь в получении информации, но до сих пор вам требовались эксперты по машинному обучению для создания моделей для прогнозирования типов отказов оборудования, отсутствие которых могло задержать любые корректирующие действия, необходимые бизнесу для повышения эффективности или улучшения.
В этом посте мы покажем вам, как бизнес-аналитики могут построить модель машинного обучения для прогнозирования типов отказов с помощью Холст Amazon SageMaker. Canvas предоставляет вам визуальный интерфейс «укажи и щелкни», который позволяет создавать модели и генерировать точные прогнозы машинного обучения самостоятельно — без необходимости какого-либо опыта машинного обучения или написания единой строки кода.
Обзор решения
Предположим, вы бизнес-аналитик, работающий в группе технического обслуживания крупной производственной организации. Ваша группа технического обслуживания попросила вас помочь в прогнозировании распространенных отказов. Они предоставили вам исторический набор данных, содержащий характеристики, связанные с данным типом сбоя, и хотели бы, чтобы вы предсказали, какой сбой произойдет в будущем. Типы сбоев включают в себя отсутствие сбоев, перенапряжение и сбои питания. Схема данных указана в следующей таблице.
Имя столбца | Тип данных | Описание |
UID | INT | Уникальный идентификатор в диапазоне от 1 до 10,000 XNUMX |
идантификационный номер продукта | STRING | Состоящий из буквы — L, M или H для низкого, среднего или высокого — в качестве вариантов качества продукта и серийного номера для конкретного варианта. |
напишите | STRING | Начальная буква, связанная с productID, состоящая только из L, M или H |
температура воздуха [К] | ДЕСЯТИЧНЫЙ | Температура воздуха указана в кельвинах |
температура процесса [К] | ДЕСЯТИЧНЫЙ | Точно контролируемые температуры для обеспечения качества данного типа продукта, указанного в кельвинах |
скорость вращения [об/мин] | ДЕСЯТИЧНЫЙ | Скорость вращения объекта, вращающегося вокруг оси, — это количество оборотов объекта, деленное на время, выраженное в оборотах в минуту. |
крутящий момент [Нм] | ДЕСЯТИЧНЫЙ | Сила вращения машины по радиусу, выраженная в ньютон-метрах |
износ инструмента [мин] | INT | Износ инструмента, выраженный в минутах |
тип отказа (цель) | STRING | Без сбоев, сбоев питания или сбоев из-за перенапряжения |
После определения типа сбоя предприятия могут предпринять любые корректирующие действия. Для этого вы используете имеющиеся у вас данные в файле CSV, который содержит определенные характеристики продукта, указанные в таблице. Вы используете Canvas для выполнения следующих шагов:
- Импортируйте набор данных обслуживания.
- Обучите и создайте прогнозную модель обслуживания машины.
- Проанализируйте результаты модели.
- Протестируйте прогнозы по модели.
Предпосылки
Облачный администратор с Аккаунт AWS с соответствующими разрешениями требуется для выполнения следующих предварительных условий:
- Развернуть Создатель мудреца Амазонки домен Инструкции см. Подключение к домену Amazon SageMaker.
- Запустите Холст. Инструкции см. Настройка и управление Amazon SageMaker Canvas (для ИТ-администраторов).
- Настройте политики общего доступа к ресурсам из разных источников (CORS) для Canvas. Инструкции см. Предоставьте своим пользователям возможность загружать локальные файлы.
Импорт набора данных
Сначала скачайте набор данных технического обслуживания и просмотрите файл, чтобы убедиться, что все данные есть.
Canvas предоставляет несколько примеров наборов данных в вашем приложении, которые помогут вам начать работу. Чтобы узнать больше о предоставленных SageMaker примерах наборов данных, с которыми вы можете поэкспериментировать, см. Используйте образцы наборов данных. Если вы используете образец набора данных (canvas-sample-maintenance.csv
), доступный в Canvas, вам не нужно импортировать набор данных обслуживания.
Вы можете импортировать данные из разных источников данных в Canvas. Если вы планируете использовать собственный набор данных, выполните действия, описанные в Импорт данных в Amazon SageMaker Canvas.
Для этого поста мы используем полный набор данных технического обслуживания, который мы скачали.
- Войдите в Консоль управления AWS, используя учетную запись с соответствующими разрешениями для доступа к Canvas.
- Войдите в консоль Canvas.
- Выберите Импортировать.
- Выберите Загрузите И выберите
maintenance_dataset.csv
. - Выберите Даты импорта чтобы загрузить его на Canvas.
Процесс импорта занимает примерно 10 секунд (это может варьироваться в зависимости от размера набора данных). Когда это будет завершено, вы увидите, что набор данных находится в Ready
Статус.
После подтверждения того, что импортированный набор данных ready
, вы можете создать свою модель.
Построить и обучить модель
Чтобы создать и обучить модель, выполните следующие шаги:
- Выберите Новая модельи укажите имя для вашей модели.
- Выберите Создавай.
- Выберите
maintenance_dataset.csv
набор данных и выбрать Выбрать набор данных.
В представлении модели вы можете увидеть четыре вкладки, соответствующие четырем шагам создания модели и ее использования для создания прогнозов: Выберите, строить, Анализироватьи прогнозировать. - На Выберите Вкладка, выберите
maintenance_dataset.csv
набор данных, который вы загрузили ранее, и выберите Выбрать набор данных.
Этот набор данных включает 9 столбцов и 10,000 XNUMX строк. Canvas автоматически переходит к этапу сборки. - На этой вкладке выберите целевой столбец, в нашем случае Тип отказа.Команда техобслуживания сообщила вам, что в этом столбце указаны типы сбоев, которые обычно наблюдаются на основе исторических данных с их существующих машин. Это то, что вы хотите научить свою модель прогнозировать. Canvas автоматически определяет, что это 3 категория проблема (также известная как многоклассовая классификация). Если обнаружен неправильный тип модели, вы можете изменить его вручную с помощью Изменить тип опцию.
Следует отметить, что этот набор данных сильно несбалансирован по отношению к классу No Failure, что можно увидеть, просмотрев столбец с именем Тип отказа. Хотя Canvas и лежащие в его основе возможности AutoML могут частично справляться с дисбалансом наборов данных, это может привести к некоторым перекосам в производительности. В качестве дополнительного следующего шага см. Сбалансируйте свои данные для машинного обучения с помощью Amazon SageMaker Data Wrangler. Следуя инструкциям по общей ссылке, вы можете запустить Студия Amazon SageMaker приложение из консоли SageMaker и импортировать этот набор данных в Обработчик данных Amazon SageMaker и используйте преобразование данных Balance, затем верните сбалансированный набор данных обратно в Canvas и продолжите следующие шаги. В этом посте мы продолжаем работу с несбалансированным набором данных, чтобы показать, что Canvas также может обрабатывать несбалансированные наборы данных.
В нижней половине страницы вы можете просмотреть некоторые статистические данные набора данных, включая отсутствующие и несоответствующие значения, уникальные значения, а также средние и медианные значения. Вы также можете удалить некоторые столбцы, если не хотите использовать их для прогноза, просто сняв с них выделение.
После того, как вы изучили этот раздел, пришло время обучить модель! Перед построением полной модели рекомендуется получить общее представление о производительности модели, обучив быструю модель. Быстрая модель обучает меньше комбинаций моделей и гиперпараметров, чтобы отдать предпочтение скорости, а не точности, особенно в тех случаях, когда вы хотите доказать ценность обучения модели машинного обучения для вашего варианта использования. Обратите внимание, что опция быстрой сборки недоступна для моделей размером более 50,000 XNUMX строк. - Выберите Быстрая сборка.
Теперь вы ждете от 2 до 15 минут. После этого Canvas автоматически перемещается в Анализировать вкладку, чтобы показать вам результаты быстрой тренировки. Анализ, проведенный с использованием быстрых оценок сборки, показал, что ваша модель способна предсказать правильный тип отказа (результат) в 99.2% случаев. Вы можете столкнуться с немного другими значениями. Это ожидаемо.
Давайте сосредоточимся на первой вкладке, Обзор. Это вкладка, которая показывает вам Воздействие столбцаили предполагаемая важность каждого столбца при прогнозировании целевого столбца. В этом примере столбцы Крутящий момент [Нм] и Скорость вращения [об/мин] оказывают наибольшее влияние на прогнозирование типа отказа.
Оцените производительность модели
Когда вы переезжаете в Счет часть вашего анализа, вы можете увидеть график, представляющий распределение наших прогнозируемых значений по отношению к фактическим значениям. Обратите внимание, что большинство сбоев относятся к категории «Нет сбоев». Чтобы узнать больше о том, как Canvas использует базовые линии SHAP для обеспечения объяснимости ML, см. Оценка производительности вашей модели в Amazon SageMaker Canvas, так же как Базовые принципы SHAP для объяснимости.
Canvas разбивает исходный набор данных на наборы для обучения и проверки перед обучением. Оценка является результатом того, что Canvas запускает проверочный набор для модели. Это интерактивный интерфейс, в котором вы можете выбрать тип отказа. Если вы выберете Отказ от перенапряжения на графике вы можете видеть, что модель идентифицирует эти 84% времени. Этого достаточно, чтобы принять меры — возможно, оператор или инженер проверит ситуацию. Ты можешь выбрать Сбой питания на графике, чтобы увидеть соответствующую оценку для дальнейшей интерпретации и действий.
Вас могут интересовать типы отказов и то, насколько хорошо модель предсказывает типы отказов на основе ряда входных данных. Чтобы подробнее ознакомиться с результатами, выберите Расширенные метрики. Это отображает матрицу, которая позволяет более внимательно изучить результаты. В ML это называется матрица путаницы.
Эта матрица по умолчанию относится к доминирующему классу, No Failure. На Класс меню, вы можете выбрать просмотр расширенных показателей двух других типов сбоев: сбоя из-за перенапряжения и сбоя питания.
В ML точность модели определяется как количество правильных прогнозов, деленное на общее количество прогнозов. Синие прямоугольники представляют правильные прогнозы, сделанные моделью на основе подмножества тестовых данных, где был известен результат. Здесь нас интересует, какой процент времени модель предсказывала определенный тип отказа машины (скажем, Без сбоев), когда на самом деле это тип отказа (Без сбоев). В ML для измерения используется коэффициент TP / (TP + FN). Это называется вспоминать. В случае по умолчанию, без сбоев, было 1,923 правильных прогноза из 1,926 общих записей, что дало 99% результатов. вспоминать. В качестве альтернативы, в классе отказа от перенапряжения было 32 из 38, что дает 84% вспоминать. Наконец, в классе «Сбой питания» было 16 из 19, что дает 84% вспоминать.
Теперь у вас есть два варианта:
- Вы можете использовать эту модель для запуска некоторых прогнозов, выбрав прогнозировать.
- Вы можете создать новую версию этой модели для обучения с Стандартная сборка вариант. Это займет гораздо больше времени — около 1–2 часов, — но обеспечит более надежную модель, поскольку она проходит через полный анализ AutoML данных, алгоритмов и итераций настройки.
Поскольку вы пытаетесь предсказать сбои, а модель правильно предсказывает сбои в 84 % случаев, вы можете уверенно использовать модель для выявления возможных сбоев. Итак, вы можете перейти к варианту 1. Если вы не уверены, вы можете попросить специалиста по обработке и анализу данных просмотреть результаты моделирования Canvas и предложить возможные улучшения с помощью варианта 2.
Генерация прогнозов
Теперь, когда модель обучена, вы можете начать генерировать прогнозы.
- Выберите прогнозировать в нижней части Анализировать страницу или выберите прогнозировать меню.
- Выберите Выбрать набор данных, и выберите
maintenance_dataset.csv
. - Выберите Генерация прогнозов.
Canvas использует этот набор данных для создания наших прогнозов. Хотя обычно рекомендуется не использовать один и тот же набор данных как для обучения, так и для тестирования, в этом случае вы можете использовать один и тот же набор данных для простоты. В качестве альтернативы вы можете удалить некоторые записи из исходного набора данных, который вы используете для обучения, и использовать эти записи в файле CSV, а затем передать его для пакетного прогнозирования, чтобы не использовать тот же набор данных для тестирования после обучения.
Через несколько секунд прогноз завершен. Canvas возвращает прогноз для каждой строки данных и вероятность того, что прогноз окажется правильным. Ты можешь выбрать предварительный просмотр для просмотра прогнозов или выберите Скачать чтобы загрузить файл CSV, содержащий полный вывод.
Вы также можете выбрать прогнозирование значений по одному, выбрав Один прогноз вместо Пакетный прогноз. Canvas показывает вам представление, в котором вы можете указать значения для каждой функции вручную и сгенерировать прогноз. Это идеально подходит для таких ситуаций, как сценарии «что, если», например: как износ инструмента влияет на тип отказа? Что делать, если температура процесса повышается или понижается? Что делать, если скорость вращения изменится?
Стандартная сборка
Ассоциация Стандартная сборка Опция выбирает точность выше скорости. Если вы хотите поделиться артефактами модели с вашим специалистом по данным и инженерами по машинному обучению, вы можете создать стандартную сборку дальше.
- Выберите Добавить версию
- Выберите новую версию и выберите Стандартная сборка.
- После того как вы создадите стандартную сборку, вы можете поделиться моделью с исследователями данных и инженерами по машинному обучению для дальнейшей оценки и итерации.
Убирать
Чтобы избежать будущих плата за сеанс, выйдите из Canvas.
Заключение
В этом посте мы показали, как бизнес-аналитик может создать модель прогнозирования типа отказа машины с помощью Canvas, используя данные обслуживания. Canvas позволяет бизнес-аналитикам, таким как инженеры по надежности, создавать точные модели машинного обучения и генерировать прогнозы с помощью визуального интерфейса без кода и щелчка. Аналитики могут вывести это на новый уровень, поделившись своими моделями с коллегами по обработке данных. Специалисты по обработке и анализу данных могут просматривать модель Canvas в Studio, где они могут изучать сделанный Canvas выбор, проверять результаты модели и даже запускать модель в производство несколькими щелчками мыши. Это может ускорить создание ценности на основе машинного обучения и помочь быстрее масштабировать улучшенные результаты.
Чтобы узнать больше об использовании Canvas, см. Создавайте, делитесь, развертывайте: как бизнес-аналитики и специалисты по обработке и анализу данных сокращают время выхода на рынок с помощью машинного обучения без кода и Amazon SageMaker Canvas. Дополнительные сведения о создании моделей машинного обучения с помощью решения без кода см. Представляем Amazon SageMaker Canvas — визуальную возможность машинного обучения без кода для бизнес-аналитиков.
Об авторах
Раджакумар Сампаткумар является главным техническим менеджером по работе с клиентами в AWS, предоставляя клиентам рекомендации по согласованию бизнес-технологий и поддерживая переосмысление их моделей облачных операций и процессов. Он увлечен облачными технологиями и машинным обучением. Радж также является специалистом по машинному обучению и работает с клиентами AWS над проектированием, развертыванием и управлением их рабочими нагрузками и архитектурами AWS.
Тванн Аткинс является старшим архитектором решений для Amazon Web Services. Он отвечает за работу с клиентами из сельского хозяйства, розничной торговли и производства для выявления бизнес-проблем и работает в обратном направлении, чтобы найти жизнеспособные и масштабируемые технические решения. Twann уже более 10 лет помогает клиентам планировать и переносить критически важные рабочие нагрузки, в последнее время уделяя особое внимание демократизации аналитики, искусственного интеллекта и машинного обучения для клиентов и строителей завтрашнего дня.
Омкар Мукадам — специалист по архитектуре решений Edge в Amazon Web Services. В настоящее время он занимается решениями, которые позволяют коммерческим клиентам эффективно проектировать, создавать и масштабировать предложения сервисов AWS Edge, которые включают, помимо прочего, семейство AWS Snow.
- Коинсмарт. Лучшая в Европе биржа биткойнов и криптовалют.
- Платоблокчейн. Интеллект метавселенной Web3. Расширение знаний. БЕСПЛАТНЫЙ ДОСТУП.
- КриптоХок. Альткоин Радар. Бесплатная пробная версия.
- Источник: https://aws.amazon.com/blogs/machine-learning/predict-types-of-machine-failures-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 9
- a
- способность
- О нас
- ускорять
- доступ
- Учетная запись
- точный
- Достигать
- Действие
- действия
- дополнительный
- Администратор
- администраторы
- продвинутый
- против
- сельское хозяйство
- алгоритмы
- Все
- позволяет
- Несмотря на то, что
- Amazon
- Amazon Web Services
- анализировать
- анализ
- аналитик
- аналитика
- откуда угодно
- приложение
- Применение
- соответствующий
- примерно
- архитектура
- около
- искусственный
- искусственный интеллект
- Искусственный интеллект и машинное обучение
- назначенный
- связанный
- Атрибуты
- автоматически
- доступен
- AWS
- Ось
- , так как:
- до
- не являетесь
- больший
- граница
- приносить
- строить
- Строительство
- бизнес
- бизнес
- холст
- возможности
- случаев
- случаев
- Категории
- определенный
- изменение
- выбор
- Выберите
- класс
- ближе
- облако
- код
- коллеги
- Column
- комбинации
- коммерческая
- Общий
- полный
- уверенный
- Консоли
- содержит
- продолжать
- может
- Создайте
- Создающий
- создание
- критической
- В настоящее время
- Клиенты
- данным
- ученый данных
- задерживать
- в зависимости
- развертывание
- Проект
- обнаруженный
- развивать
- DID
- различный
- дисплеев
- распределение
- домен
- скачать
- Падение
- каждый
- Edge
- фактически
- позволяет
- инженер
- Инженеры
- особенно
- По оценкам,
- Оценки
- оценивать
- оценка
- пример
- существующий
- ожидаемый
- опыт
- эксперимент
- эксперты
- Больше
- выраженный
- Ошибка
- семья
- быстрее
- Особенность
- First
- Фокус
- фокусируется
- следовать
- после
- от
- полный
- далее
- будущее
- Общие
- в общем
- порождать
- порождающий
- хорошо
- обрабатывать
- имеющий
- помощь
- помощь
- здесь
- очень
- исторический
- Как
- HTTPS
- идея
- идеальный
- определения
- Влияние
- значение
- улучшенный
- улучшение
- включают
- включает в себя
- В том числе
- промышленности
- информация
- сообщил
- размышления
- Интеллекта
- интерактивный
- заинтересованный
- Интерфейс
- интерпретация
- IT
- известный
- большой
- запуск
- УЧИТЬСЯ
- изучение
- уровень
- Ограниченный
- линия
- LINK
- Включенный в список
- локальным
- посмотреть
- машина
- обучение с помощью машины
- Продукция
- сделанный
- техническое обслуживание
- сделать
- управлять
- управление
- менеджер
- управления
- вручную
- производство
- матрица
- проводить измерение
- средний
- Метрика
- ML
- модель
- Модели
- БОЛЕЕ
- самых
- двигаться
- следующий
- отметил,
- номер
- предлагают
- Предложения
- операция
- оператор
- Опция
- Опции
- заказ
- организация
- оригинал
- Другое
- общий
- собственный
- особый
- страстный
- процент
- производительность
- выступления
- фаза
- сборах
- возможное
- потенциал
- мощностью
- практика
- предсказывать
- прогноз
- Predictions
- Основной
- Проблема
- проблемам
- процесс
- Процессы
- Продукт
- Качество продукции и цвета
- Производство
- обеспечивать
- при условии
- приводит
- обеспечение
- САЙТ
- ранжирование
- последний
- учет
- представлять
- представляющий
- обязательный
- ресурс
- ответственный
- Итоги
- розничный
- Возвращает
- обзоре
- Run
- Бег
- то же
- масштабируемые
- Шкала
- Ученый
- Ученые
- счет
- секунды
- последовательный
- Серии
- обслуживание
- Услуги
- набор
- несколько
- Поделиться
- общие
- разделение
- показывать
- значительный
- одинарной
- Размер
- снег
- So
- твердый
- Решение
- Решения
- некоторые
- специалист
- скорость
- расколы
- стандарт
- Начало
- и политические лидеры
- статистика
- Статус:
- студия
- поддержки
- цель
- команда
- Технический
- тестXNUMX
- Тестирование
- Ассоциация
- Через
- Связанный
- время
- завтра
- инструментом
- к
- Обучение
- поезда
- трансформация
- Типы
- типично
- созданного
- использование
- пользователей
- Проверка
- ценностное
- версия
- Вид
- ждать
- Web
- веб-сервисы
- Что
- в
- работает
- работает
- бы
- лет
- ВАШЕ