Машинное обучение (ML) помогает организациям получать прибыль, сокращать расходы, снижать риски, повышать эффективность и повышать качество за счет оптимизации основных бизнес-функций в нескольких бизнес-подразделениях, таких как маркетинг, производство, операции, продажи, финансы и обслуживание клиентов. С помощью AWS ML организации могут ускорить создание ценности с месяцев до дней. Холст Amazon SageMaker — это визуальный сервис «укажи и щелкни», который позволяет бизнес-аналитикам генерировать точные прогнозы машинного обучения, не написав ни одной строки кода и не требуя знаний в области машинного обучения. Вы можете использовать модели для интерактивных прогнозов и для пакетной оценки объемных наборов данных.
В этом посте мы демонстрируем архитектурные шаблоны того, как бизнес-команды могут использовать модели машинного обучения, созданные в любом месте, путем создания прогнозов в Canvas и достижения эффективных бизнес-результатов.
Такая интеграция разработки моделей и обмена ими обеспечивает более тесное сотрудничество между бизнес-командами и командами специалистов по обработке и анализу данных и сокращает время окупаемости. Бизнес-команды могут использовать существующие модели, созданные их специалистами по данным или другими отделами, для решения бизнес-проблем вместо перестройки новых моделей во внешних средах.
Наконец, бизнес-аналитики могут импортировать общие модели в Canvas и генерировать прогнозы перед развертыванием в рабочей среде всего несколькими щелчками мыши.
Обзор решения
На следующем рисунке показаны три различных архитектурных шаблона, чтобы продемонстрировать, как специалисты по данным могут обмениваться моделями с бизнес-аналитиками, которые затем могут напрямую генерировать прогнозы на основе этих моделей в визуальном интерфейсе Canvas:
Предпосылки
Чтобы обучить и построить модель с помощью SageMaker и перенести ее в Canvas, выполните следующие предварительные условия:
- Если у вас еще нет домена SageMaker и пользователя Studio, настроить и подключить пользователя Studio к домену SageMaker.
- Включить и настроить Canvas базовые разрешения для ваших пользователей и предоставить пользователям разрешения на совместную работу с Studio.
- У вас должна быть обученная модель из Autopilot, JumpStart или из реестра моделей. Для любой модели, которую вы создали вне SageMaker, вы должны зарегистрировать свою модель в реестре моделей, прежде чем импортировать ее в Canvas.
Теперь давайте возьмем на себя роль специалиста по данным, который хочет обучать, создавать, развертывать модели ML и делиться ими с бизнес-аналитиком для каждого из этих трех архитектурных шаблонов.
Используйте автопилот и холст
Автопилот автоматизирует ключевые задачи автоматического процесса машинного обучения (AutoML), такие как изучение данных, выбор соответствующего алгоритма для типа проблемы, а затем его обучение и настройка. Всего этого можно достичь, сохраняя при этом полный контроль и видимость набора данных. Автопилот автоматически исследует различные решения, чтобы найти лучшую модель, и пользователи могут либо повторять модель ML, либо напрямую развертывать модель в рабочей среде одним щелчком мыши.
В этом примере мы используем синтетический анализ оттока клиентов. Набор данных из телекоммуникационного домена, и им поручено выявлять клиентов, потенциально подверженных риску оттока. Выполните следующие шаги, чтобы использовать Autopilot AutoML для создания, обучения, развертывания и совместного использования модели машинного обучения с бизнес-аналитиком:
- Скачать Набор данных, загрузите его на Amazon S3 (Простой сервис хранения Amazon) ведро и запишите S3 URI.
- На консоли Studio выберите AutoML в навигационной панели.
- Выберите Создать эксперимент AutoML.
- Укажите название эксперимента (для этого поста
Telecom-Customer-Churn-AutoPilot
), ввод данных S3 и расположение вывода. - Установите целевой столбец как отток.
- В настройках развертывания вы можете включить параметр автоматического развертывания, чтобы создать конечную точку, которая развертывает вашу лучшую модель и выполняет вывод на конечной точке.
Для получения дополнительной информации обратитесь к Создание эксперимента Amazon SageMaker Autopilot.
- Выберите свой эксперимент, затем выберите лучшую модель и выберите Поделиться моделью.
- Добавьте пользователя Canvas и выберите Поделиться поделиться моделью.
(Внимание: вы не можете поделиться моделью с тем же пользователем Canvas, который используется для входа в Studio. Например, пользователь Studio-A не может совместно использовать модель с пользователем Canvas-A. Но пользователь-A может поделиться моделью с пользователем-B, поэтому выберите разные варианты использования для совместного использования модели)
Для получения дополнительной информации обратитесь к Пользователи Studio: публикация модели в SageMaker Canvas.
Используйте JumpStart и холст
JumpStart — это центр машинного обучения, который предоставляет предварительно обученные модели с открытым исходным кодом для широкого спектра вариантов использования машинного обучения, таких как обнаружение мошенничества, прогнозирование кредитных рисков и обнаружение дефектов продуктов. Вы можете развернуть более 300 предварительно обученных моделей для табличных, визуальных, текстовых и аудиоданных.
В этом посте мы используем предварительно обученную модель регрессии LightGBM от JumpStart. Мы обучаем модель на пользовательском наборе данных и делимся моделью с пользователем Canvas (бизнес-аналитиком). Предварительно обученную модель можно развернуть на конечной точке для вывода. JumpStart предоставляет пример блокнота для доступа к модели после ее развертывания.
В этом примере мы используем набор данных морского ушка. Набор данных содержит примеры восьми физических измерений, таких как длина, диаметр и высота, для прогнозирования возраста морского ушка (задача регрессии).
- Скачать набор данных морского ушка от Каггл.
- Создайте корзину S3 и загрузите наборы данных для обучения, проверки и пользовательских заголовков.
- На консоли Studio в разделе SageMaker JumpStart на панели навигации выберите Модели, ноутбуки, решения.
- Под Табличные модели, выберите Регрессия LightGBM.
- Под Модель поезда, укажите URI S3 для наборов данных для обучения, проверки и заголовков столбцов.
- Выберите Train.
- На панели навигации выберите Запущены активы JumpStart.
- На Работа по обучению выберите вкладку «Обучение».
- На Поделиться Меню, выберите Поделиться на холсте.
- Выберите пользователей Canvas, с которыми хотите поделиться, укажите сведения о модели и выберите Поделиться.
Для получения дополнительной информации обратитесь к Пользователи Studio: публикация модели в SageMaker Canvas.
Используйте реестр моделей SageMaker и Canvas
С помощью реестра моделей SageMaker вы можете каталогизировать модели для производства, управлять версиями моделей, связывать метаданные, управлять статусом утверждения модели, развертывать модели в рабочей среде и автоматизировать развертывание моделей с помощью CI/CD.
Давайте возьмем на себя роль специалиста по данным. В этом примере вы создаете сквозной проект машинного обучения, который включает в себя подготовку данных, обучение модели, размещение модели, реестр моделей и совместное использование модели с бизнес-аналитиком. При желании для подготовки данных и этапов предварительной или постобработки вы можете использовать Обработчик данных Amazon SageMaker и Работа Amazon SageMaker Processing. В этом примере мы используем набор данных морского ушка, загруженный из LIBSVM. Целевой переменной является возраст морского ушка.
- В Studio клонируйте Репо GitHub.
- Выполните шаги, указанные в файле README.
- На консоли Studio в разделе Модели на панели навигации выберите Реестр моделей.
- Выбери модель
sklearn-reg-ablone
. - Поделитесь версией модели 1 из реестра моделей в Canvas.
- Выберите пользователей Canvas, с которыми хотите поделиться, укажите сведения о модели и выберите Поделиться.
Инструкции см. Модельный реестр в разделе Пользователи Studio: публикация модели в SageMaker Canvas.
Управление общими моделями
После того как вы поделитесь моделью с помощью любого из предыдущих способов, вы можете перейти к Модели раздел в Studio и просмотрите все общие модели. На следующем снимке экрана мы видим 3 разные модели, используемые пользователем Studio (специалистом по данным) с разными пользователями Canvas (бизнес-командами).
Импортируйте общую модель и делайте прогнозы с помощью Canvas
Давайте возьмем на себя роль бизнес-аналитика и войдем в Canvas под своим пользователем Canvas.
Когда специалист по данным или пользователь Studio совместно использует модель с пользователем Canvas, вы получаете уведомление в приложении Canvas о том, что пользователь Studio предоставил вам доступ к модели. В приложении Canvas уведомление похоже на следующий снимок экрана.
Ты можешь выбрать Посмотреть обновление чтобы увидеть общую модель, или вы можете перейти к Модели страницу в приложении Canvas, чтобы найти все модели, которыми с вами поделились. Импорт модели из Studio может занять до 20 минут.
После импорта модели вы можете просмотреть ее показатели и сгенерировать прогнозы в реальном времени с анализом «что, если» или пакетными прогнозами.
Соображения
Имейте в виду следующее при совместном использовании моделей с помощью Canvas:
- Вы храните наборы данных для обучения и проверки в Amazon S3, а URI S3 передаются в Canvas с Управление идентификацией и доступом AWS (IAM) разрешения.
- Укажите целевой столбец в Canvas или используйте первый столбец по умолчанию.
- Чтобы контейнер Canvas анализировал данные вывода, конечная точка Canvas принимает либо текст (CSV), либо приложение (JSON).
- Canvas не поддерживает несколько контейнеров или конвейеров вывода.
- Схема данных предоставляется Canvas, если в наборах данных для обучения и проверки не указаны заголовки. По умолчанию платформа JumpStart не предоставляет заголовки в наборах данных для обучения и проверки.
- С Jumpstart задание по обучению должно быть завершено, прежде чем вы сможете поделиться им с Canvas.
Обратитесь к Ограничения и устранение неполадок чтобы помочь вам устранить любые проблемы, возникающие при совместном использовании моделей.
Убирать
Чтобы избежать будущих расходов, удалите или закройте ресурсы, созданные вами во время подписки на этот пост. Ссылаться на Выход из Amazon SageMaker Canvas Больше подробностей. Выключите отдельные ресурсы, включая ноутбуки, терминал, ядра, приложения и экземпляры. Для получения дополнительной информации см. Отключить ресурсы. Удалить версия модели, Конечная точка и ресурсы SageMaker, Ресурсы для экспериментов с автопилотоми Ковш S3.
Заключение
Studio позволяет специалистам по данным обмениваться моделями машинного обучения с бизнес-аналитиками за несколько простых шагов. Бизнес-аналитики могут извлечь выгоду из моделей машинного обучения, уже созданных специалистами по данным, для решения бизнес-задач вместо создания новой модели в Canvas. Однако использование этих моделей за пределами среды, в которой они созданы, может быть затруднено из-за технических требований и ручных процессов импорта моделей. Это часто вынуждает пользователей перестраивать модели машинного обучения, что приводит к дублированию усилий и дополнительному времени и ресурсам. Canvas устраняет эти ограничения, поэтому вы можете генерировать прогнозы в Canvas с моделями, которые вы обучали где угодно. Используя три шаблона, показанные в этом посте, вы можете зарегистрировать модели ML в реестре моделей SageMaker, который является хранилищем метаданных для моделей ML, и импортировать их в Canvas. Затем бизнес-аналитики могут анализировать и генерировать прогнозы на основе любой модели в Canvas.
Чтобы узнать больше об использовании служб SageMaker, ознакомьтесь со следующими ресурсами:
Если у вас есть вопросы или предложения, оставьте комментарий.
Об авторах
Аман Шарма является старшим архитектором решений в AWS. Он работает со стартапами, малым и средним бизнесом, а также корпоративными клиентами в регионе APJ, имеет более чем 19-летний опыт работы в области консалтинга, проектирования и разработки решений. Он увлечен демократизацией ИИ и машинного обучения и помогает клиентам в разработке их стратегий данных и машинного обучения. Вне работы он любит исследовать природу и дикую природу.
Цзычен Ни — старший инженер-программист в AWS SageMaker, который в прошлом году руководил проектом «Принесите свою собственную модель в SageMaker Canvas». Она работает в Amazon более 7 лет и имеет опыт как в оптимизации цепочки поставок Amazon, так и в сервисах AWS AI. Ей нравятся тренировки Barre и музыка после работы.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
- Чеканка будущего с Эдриенн Эшли. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- :имеет
- :является
- $UP
- 1
- 100
- 20
- 7
- a
- О нас
- ускорять
- Принимает
- доступ
- точный
- Достигать
- достигнутый
- через
- дополнительный
- После
- AI
- Услуги искусственного интеллекта
- алгоритм
- Все
- Позволяющий
- позволяет
- уже
- Amazon
- Создатель мудреца Амазонки
- Amazon SageMaker Автопилот
- Холст Amazon SageMaker
- an
- анализ
- аналитик
- Аналитики
- анализировать
- и
- любой
- откуда угодно
- Применение
- утверждение
- Программы
- архитектурный
- архитектура
- МЫ
- AS
- Юрист
- At
- аудио
- автоматический
- автоматизировать
- автоматы
- Автоматический
- автоматически
- AutoML
- избежать
- AWS
- Использование темпера с изогнутым основанием
- BE
- было
- до
- польза
- ЛУЧШЕЕ
- между
- изоферменты печени
- приносить
- строить
- Строительство
- построенный
- бизнес
- хозяйственная деятельность
- бизнес
- но
- by
- CAN
- холст
- случаев
- каталог
- цепь
- расходы
- проверка
- Выберите
- нажмите на
- код
- сотрудничать
- сотрудничество
- Column
- комментарий
- полный
- Консоли
- консалтинг
- Container
- содержит
- контроль
- Основные
- Расходы
- Создайте
- создали
- создает
- Создающий
- создание
- кредит
- изготовленный на заказ
- клиент
- Служба поддержки игроков
- Клиенты
- данным
- Подготовка данных
- наука о данных
- ученый данных
- Наборы данных
- Дней
- По умолчанию
- Демократизация
- демонстрировать
- ведомства
- развертывание
- развернуть
- развертывание
- развертывание
- развертывает
- проектирование
- подробнее
- обнаружение
- Развитие
- различный
- трудный
- непосредственно
- обнаружить
- не
- домен
- Dont
- вниз
- управлять
- два
- каждый
- Эффективный
- Эффективность
- усилие
- или
- включить
- впритык
- Конечная точка
- инженер
- Предприятие
- средах
- пример
- Примеры
- существующий
- опыт
- эксперимент
- опыта
- Больше
- исследует
- Исследование
- несколько
- фигура
- Файл
- финансы
- Найдите
- Во-первых,
- после
- Что касается
- Войска
- мошенничество
- обнаружение мошенничества
- от
- полный
- Функции
- будущее
- порождать
- порождающий
- Go
- Есть
- he
- Заголовки
- высота
- помощь
- помощь
- помогает
- следовательно
- хостинг
- Как
- Однако
- HTML
- HTTP
- HTTPS
- хаб
- идентифицирующий
- Личность
- if
- Импортировать
- импортирующий
- улучшать
- in
- включает в себя
- В том числе
- individual
- информация
- вход
- вместо
- инструкции
- интеграции.
- Интерфейс
- в
- вопросы
- IT
- ЕГО
- работа
- JPG
- JSON
- всего
- Основные
- Фамилия
- В прошлом году
- ведущий
- УЧИТЬСЯ
- изучение
- Оставлять
- Длина
- такое как
- нравится
- недостатки
- линия
- Включенный в список
- расположение
- журнал
- Войти
- искать
- поддерживать
- сделать
- управлять
- руководство
- производство
- Маркетинг
- размеры
- средний
- Метаданные
- методы
- Метрика
- может быть
- против
- Минут
- смягчать
- ML
- модель
- Модели
- месяцев
- БОЛЕЕ
- с разными
- Музыка
- должен
- имя
- природа
- Навигация
- потребности
- Новые
- нет
- ноутбук
- уведомление
- of
- .
- on
- Onboard
- ONE
- с открытым исходным кодом
- Операционный отдел
- оптимизация
- оптимизирующий
- Опция
- or
- организации
- Другое
- внешний
- Результаты
- выходной
- внешнюю
- собственный
- страница
- хлеб
- Прошло
- страстный
- паттеранами
- Разрешения
- физический
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- После
- потенциально
- предсказывать
- прогноз
- Predictions
- предпосылки
- Проблема
- проблемам
- процесс
- Процессы
- обработка
- Продукт
- Производство
- Проект
- обеспечивать
- при условии
- приводит
- Вопросы
- ассортимент
- Получать
- уменьшить
- область
- зарегистрироваться
- реестра
- соответствующие
- Требования
- Полезные ресурсы
- в результате
- доходы
- обзоре
- Снижение
- Роли
- sagemaker
- главная
- то же
- Наука
- Ученый
- Ученые
- счет
- Раздел
- посмотреть
- выбор
- старший
- обслуживание
- Услуги
- набор
- настройки
- Поделиться
- общие
- Акции
- разделение
- она
- демонстрации
- выключать
- аналогичный
- просто
- одинарной
- небольшой
- So
- Software
- Инженер-программист
- Решения
- РЕШАТЬ
- стартапов
- Статус:
- Шаги
- диск
- магазин
- стратегий
- студия
- такие
- поставка
- цепочками поставок
- Оптимизация цепочки поставок
- поддержка
- синтетический
- взять
- цель
- задачи
- команды
- Технический
- телеком
- Терминал
- чем
- который
- Ассоциация
- их
- Их
- тогда
- Эти
- они
- этой
- те
- три
- туже
- время
- в
- Train
- специалистов
- Обучение
- напишите
- под
- единиц
- использование
- используемый
- Информация о пользователе
- пользователей
- через
- Проверка
- ценностное
- создание стоимости
- версия
- Вид
- видимость
- видение
- we
- когда
- , которые
- в то время как
- КТО
- широкий
- Широкий диапазон
- в
- без
- Работа
- работает
- работает
- письмо
- год
- лет
- Ты
- ВАШЕ
- зефирнет