Ми раді оголосити про запуск Amazon DocumentDB (з сумісністю з MongoDB) інтеграція з Canvas Amazon SageMaker, що дозволяє клієнтам Amazon DocumentDB створювати та використовувати генеративні рішення ШІ та машинного навчання (ML) без написання коду. Amazon DocumentDB — це повністю керована власна база даних документів JSON, яка дозволяє легко та економічно ефективно працювати з критичними робочими навантаженнями документів практично в будь-якому масштабі без керування інфраструктурою. Amazon SageMaker Canvas — це робочий простір для машинного навчання без коду, який пропонує готові до використання моделі, включно з базовими моделями, а також можливість готувати дані, створювати та розгортати власні моделі.
У цій публікації ми обговорюємо, як перенести дані, що зберігаються в Amazon DocumentDB, у SageMaker Canvas і використати ці дані для створення моделей ML для прогнозної аналітики. Не створюючи та не обслуговуючи конвеєри даних, ви зможете використовувати моделі ML за допомогою своїх неструктурованих даних, що зберігаються в Amazon DocumentDB.
Огляд рішення
Давайте візьмемо на себе роль бізнес-аналітика компанії з доставки їжі. Ваш мобільний додаток зберігає інформацію про ресторани в Amazon DocumentDB завдяки його масштабованості та можливостям гнучкої схеми. Ви хочете зібрати статистику на основі цих даних і побудувати модель ML, щоб передбачити, як будуть оцінюватися нові ресторани, але вам важко виконувати аналітику неструктурованих даних. Ви стикаєтеся з вузькими місцями, тому що для досягнення цих цілей вам потрібно покладатися на команди з розробки даних і науки про дані.
Ця нова інтеграція вирішує ці проблеми, спрощуючи перенесення даних Amazon DocumentDB у SageMaker Canvas і негайного початку підготовки та аналізу даних для ML. Крім того, SageMaker Canvas усуває залежність від досвіду машинного навчання для створення високоякісних моделей і створення прогнозів.
Ми демонструємо, як використовувати дані Amazon DocumentDB для побудови моделей ML у SageMaker Canvas, виконавши такі кроки:
- Створіть конектор Amazon DocumentDB у SageMaker Canvas.
- Аналізуйте дані за допомогою генеративного ШІ.
- Підготуйте дані для машинного навчання.
- Побудуйте модель і створіть прогнози.
Передумови
Щоб реалізувати це рішення, виконайте такі передумови:
- Мати доступ адміністратора AWS Cloud за допомогою Управління ідентифікацією та доступом AWS (Я Є) користувач з дозволами, необхідними для завершення інтеграції.
- Завершіть налаштування середовища за допомогою AWS CloudFormation за допомогою одного з наступних варіантів:
- Розгорніть шаблон CloudFormation у новому VPC – Цей параметр створює нове середовище AWS, яке складається з VPC, приватних підмереж, груп безпеки, ролей виконання IAM, Amazon Cloud9, необхідні кінцеві точки VPC та Домен SageMaker. Потім він розгортає Amazon DocumentDB у новому VPC. Завантажити шаблон або швидко запустіть стек CloudFormation, вибравши Запустити стек:
- Розгорніть шаблон CloudFormation в існуючому VPC – Цей параметр створює необхідні кінцеві точки VPC, ролі виконання IAM і домен SageMaker в існуючому VPC з приватними підмережами. Завантажити шаблон або швидко запустіть стек CloudFormation, вибравши Запустити стек:
- Розгорніть шаблон CloudFormation у новому VPC – Цей параметр створює нове середовище AWS, яке складається з VPC, приватних підмереж, груп безпеки, ролей виконання IAM, Amazon Cloud9, необхідні кінцеві точки VPC та Домен SageMaker. Потім він розгортає Amazon DocumentDB у новому VPC. Завантажити шаблон або швидко запустіть стек CloudFormation, вибравши Запустити стек:
Зауважте, що якщо ви створюєте новий домен SageMaker, ви повинні налаштувати домен у приватному VPC без доступу до Інтернету, щоб мати можливість додати конектор до Amazon DocumentDB. Щоб дізнатися більше, зверніться до Налаштуйте Amazon SageMaker Canvas у VPC без доступу до Інтернету.
- Слідуйте підручник щоб завантажити зразки даних ресторану в Amazon DocumentDB.
- Додайте доступ до Amazon Bedrock і моделі Anthropic Claude у ньому. Для отримання додаткової інформації див Додайте доступ до моделі.
Створіть конектор Amazon DocumentDB у SageMaker Canvas
Після створення домену SageMaker виконайте такі кроки:
- На консолі Amazon DocumentDB виберіть Машинне навчання без коду у навігаційній панелі.
- під Виберіть домен і профіль¸ виберіть свій домен SageMaker і профіль користувача.
- Вибирати Запустіть Canvas щоб запустити SageMaker Canvas у новій вкладці.
Коли SageMaker Canvas завершить завантаження, ви потрапите на Дані потоків Вкладка.
- Вибирати Створювати щоб створити новий потік даних.
- Введіть назву потоку даних і виберіть Створювати.
- Додайте нове підключення Amazon DocumentDB, вибравши Дати імпорту, Потім виберіть Табличний та цінності Тип набору даних.
- на Дати імпорту сторінка, для Джерело данихвиберіть DocumentDB та Додати підключення.
- Введіть назву підключення, наприклад demo, і виберіть потрібний кластер Amazon DocumentDB.
Зауважте, що SageMaker Canvas попередньо заповнить спадне меню кластерами в тому самому VPC, що й ваш домен SageMaker.
- Введіть ім’я користувача, пароль та назву бази даних.
- Нарешті виберіть уподобання для читання.
Щоб захистити продуктивність основних екземплярів, SageMaker Canvas за замовчуванням Вторинний, що означає, що він читатиме лише вторинні екземпляри. При читанні перевага є Бажано вторинне, SageMaker Canvas читає з доступних вторинних екземплярів, але читатиме з основного екземпляра, якщо вторинний екземпляр недоступний. Щоб отримати додаткові відомості про те, як налаштувати з’єднання Amazon DocumentDB, див Підключіться до бази даних, що зберігається в AWS.
- Вибирати Додати підключення.
Якщо підключення буде успішним, ви побачите колекції у своїй базі даних Amazon DocumentDB у вигляді таблиць.
- Перетягніть вибрану таблицю на порожнє полотно. Для цієї публікації ми додаємо дані нашого ресторану.
Перші 100 рядків відображаються як попередній перегляд.
- Щоб розпочати аналіз і підготовку даних, виберіть Дати імпорту.
- Введіть назву набору даних і виберіть Дати імпорту.
Аналізуйте дані за допомогою генеративного ШІ
Далі ми хочемо отримати деяку інформацію про наші дані та шукати закономірності. SageMaker Canvas надає інтерфейс природною мовою для аналізу та підготовки даних. Коли дані завантажується вкладка, ви можете розпочати спілкування зі своїми даними, виконавши такі дії:
- Вибирати Чат для підготовки даних.
- Збирайте уявлення про свої дані, ставлячи запитання, подібні до зразків, показаних на наступних знімках екрана.
Щоб дізнатися більше про те, як використовувати природну мову для дослідження та підготовки даних, див Використовуйте природну мову для дослідження та підготовки даних за допомогою нових можливостей Amazon SageMaker Canvas.
Давайте глибше усвідомимо якість наших даних за допомогою звіту про якість даних SageMaker Canvas і Insights, який автоматично оцінює якість даних і виявляє відхилення.
- на Аналіз вкладку, виберіть Звіт про якість даних і статистику.
- Вибирати
rating
як цільовий стовпець і Регресія як тип проблеми, потім виберіть Створювати.
Це моделюватиме навчання моделі та дасть уявлення про те, як ми можемо покращити наші дані для машинного навчання. Повний звіт створюється за кілька хвилин.
Наш звіт показує, що 2.47% рядків у нашій цілі мають відсутні значення — ми вирішимо це на наступному кроці. Крім того, аналіз показує, що address line 2
, name
та type_of_food
функції мають найбільшу силу передбачення в наших даних. Це вказує на те, що основна інформація про ресторан, як-от розташування та кухня, може сильно впливати на рейтинги.
Підготуйте дані для машинного навчання
SageMaker Canvas пропонує понад 300 вбудованих трансформацій для підготовки ваших імпортованих даних. Додаткову інформацію про функції трансформації SageMaker Canvas див Підготуйте дані за допомогою розширених перетворень. Давайте додамо деякі перетворення, щоб підготувати наші дані для навчання моделі ML.
- Перейдіть назад до Потік даних сторінки, вибравши назву потоку даних у верхній частині сторінки.
- Виберіть знак плюс біля Типи даних І вибирай Додати трансформацію.
- Вибирати Додати крок.
- Давайте перейменуємо
address line 2
стовпець доcities
.- Вибирати Керувати стовпцями.
- Вибирати Перейменувати стовпець та цінності Перетворення.
- Вибирати
address line 2
та цінності Вхідний стовпець, введітьcities
та цінності Нове найменування, і вибрати додавати.
- Крім того, давайте видалимо деякі непотрібні стовпці.
- Додайте нове перетворення.
- для Перетвореннявиберіть Колонка скидання.
- для Стовпчики для опусканнявиберіть
URL
таrestaurant_id
. - Вибирати додавати.
[
- наш
rating
у стовпці ознак відсутні деякі значення, тому давайте заповнимо ці рядки середнім значенням цього стовпця.- Додайте нове перетворення.
- для Перетвореннявиберіть Врахувати.
- для Тип колонкивиберіть Числовий.
- для Вхідні стовпці, виберіть
rating
колонка. - для Стратегія імпутаціївиберіть Середня.
- для Вихідний стовпець, введіть
rating_avg_filled
. - Вибирати додавати.
- Ми можемо кинути
rating
оскільки у нас є новий стовпець із заповненими значеннями. - Тому що
type_of_food
є категоричним за своєю природою, ми хочемо закодувати його чисельно. Давайте закодуємо цю функцію за допомогою техніки одноразового кодування.- Додайте нове перетворення.
- для Перетвореннявиберіть Одне гаряче кодування.
- Для стовпців введення виберіть
type_of_food
. - для Неправильна стратегія обробки¸ вибрати тримати.
- для Стиль виведення¸ вибрати Колони.
- для Вихідний стовпець, введіть
encoded
. - Вибирати додавати.
Побудуйте модель і створіть прогнози
Тепер, коли ми трансформували наші дані, давайте навчимо числову модель ML для прогнозування рейтингів для ресторанів.
- Вибирати Створити модель.
- для Назва набору даних, введіть назву для експорту набору даних.
- Вибирати Експорт і зачекайте, поки перетворені дані будуть експортовані.
- Виберіть Створити модель посилання в нижньому лівому куті сторінки.
Ви також можете вибрати набір даних у функції Data Wrangler ліворуч на сторінці.
- Введіть назву моделі.
- Вибирати Прогностичний аналіз, Потім виберіть Створювати.
- Вибирати
rating_avg_filled
як цільовий стовпець.
SageMaker Canvas автоматично вибирає відповідний тип моделі.
- Вибирати Модель попереднього перегляду щоб гарантувати відсутність проблем із якістю даних.
- Вибирати Швидка збірка для побудови моделі.
Створення моделі займе приблизно 2–15 хвилин.
Ви можете переглянути статус моделі після того, як модель завершить навчання. Наша модель має RSME 0.422, що означає, що модель часто передбачає рейтинг ресторану в межах +/- 0.422 від фактичного значення, надійне наближення для рейтингової шкали від 1 до 6.
- Нарешті, ви можете створити зразки прогнозів, перейшовши до Прогнозуйте Вкладка.
Прибирати
Щоб уникнути майбутніх витрат, видаліть ресурси, які ви створили під час перегляду цієї публікації. SageMaker Canvas виставляє вам рахунок за тривалість сеансу, і ми рекомендуємо вийти з SageMaker Canvas, коли ви ним не користуєтеся. Відноситься до Вихід із Amazon SageMaker Canvas для більш докладної інформації.
Висновок
У цій публікації ми обговорили, як можна використовувати SageMaker Canvas для генеративного штучного інтелекту та машинного навчання з даними, що зберігаються в Amazon DocumentDB. У нашому прикладі ми показали, як аналітик може швидко побудувати високоякісну модель ML за допомогою зразка набору даних ресторану.
Ми показали етапи реалізації рішення: від імпорту даних із Amazon DocumentDB до створення моделі ML у SageMaker Canvas. Весь процес був завершений через візуальний інтерфейс без написання жодного рядка коду.
Щоб розпочати свою подорож ML з низьким кодом/без коду, зверніться до Canvas Amazon SageMaker.
Про авторів
Аделік Кокер є глобальним архітектором рішень у AWS. Він працює з клієнтами в усьому світі, щоб надати рекомендації та технічну допомогу в розгортанні виробничих робочих навантажень у масштабі AWS. У вільний час він захоплюється навчанням, читанням, іграми та переглядом спортивних подій.
Гурурадж С Баярі є старшим спеціалістом з розробки рішень DocumentDB в AWS. Йому подобається допомагати клієнтам адаптувати спеціально створені бази даних Amazon. Він допомагає клієнтам розробляти, оцінювати та оптимізувати їх масштабування в Інтернеті та високоефективні робочі навантаження на основі NoSQL та/або реляційних баз даних.
Тім Пусатері є старшим менеджером із продуктів в AWS, де він працює над Amazon SageMaker Canvas. Його мета — допомогти клієнтам швидко отримати користь від AI/ML. Поза роботою він любить бути на свіжому повітрі, грати на гітарі, слухати живу музику та проводити час із родиною та друзями.
Pratik Das є менеджером із продуктів в AWS. Йому подобається працювати з клієнтами, які прагнуть створювати стійкі робочі навантаження та міцні основи даних у хмарі. Він надає досвід роботи з підприємствами щодо ініціатив з модернізації, аналітики та перетворення даних.
Варма Готтумуккала є старшим архітектором рішень спеціаліста з баз даних у AWS, розташованому в Далласі, Форт-Ворт. Varma працює з клієнтами над їхньою стратегією баз даних і архітектурою їхніх робочих навантажень, використовуючи спеціально створені бази даних AWS. До того як приєднатися до AWS, протягом останніх 22 років він інтенсивно працював з реляційними базами даних, базами даних NOSQL і кількома мовами програмування.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/use-amazon-documentdb-to-build-no-code-machine-learning-solutions-in-amazon-sagemaker-canvas/
- : має
- :є
- : ні
- :де
- 10
- 100
- 11
- 12
- 13
- 150
- 22
- 27
- 300
- 385
- 500
- 58
- 7
- 8
- 9
- a
- здатність
- Здатний
- МЕНЮ
- доступ
- виконувати
- фактичний
- додавати
- Додатково
- адреса
- адмін
- прийняти
- просунутий
- після
- AI
- AI / ML
- Дозволити
- Також
- Amazon
- Amazon SageMaker
- Canvas Amazon SageMaker
- Amazon Web Services
- an
- аналіз
- аналітик
- Аналітичний
- аналітика
- аналізувати
- Аналізуючи
- та
- Оголосити
- Антропний
- будь-який
- додаток
- приблизно
- ЕСТЬ
- AS
- запитувач
- Допомога
- припустити
- At
- автоматично
- доступний
- середній
- уникнути
- AWS
- назад
- заснований
- основний
- BE
- оскільки
- перед тим
- Банкноти
- вузькі місця
- дно
- приносити
- Приносить
- будувати
- Створюємо
- Будує
- побудований
- вбудований
- бізнес
- але
- by
- CAN
- полотно
- можливості
- можливості
- складні
- вантажі
- в чаті
- вибір
- Вибирати
- Вибираючи
- хмара
- кластер
- код
- Колекції
- Колонка
- Колони
- компанія
- сумісність
- повний
- Зроблено
- зв'язку
- складається
- Консоль
- Кут
- рентабельним
- створювати
- створений
- створює
- створення
- створення
- критичний
- виготовлений на замовлення
- Клієнти
- Даллас
- дані
- наука про дані
- Database
- базами даних
- глибше
- за замовчуванням
- доставка
- демонстрація
- демонструвати
- Залежність
- розгортання
- розгортання
- розгортає
- дрейф
- дизайн
- бажаний
- деталі
- обговорювати
- обговорювалися
- displayed
- документ
- домен
- скачати
- Падіння
- тривалість
- або
- кодування
- Машинобудування
- забезпечувати
- Що натомість? Створіть віртуальну версію себе у
- підприємств
- Весь
- Навколишнє середовище
- оцінювати
- Події
- приклад
- збуджений
- виконання
- існуючий
- експертиза
- дослідити
- експорт
- широко
- сім'я
- особливість
- риси
- кілька
- заповнювати
- заповнений
- знайти
- Перший
- гнучкий
- потік
- після
- харчування
- доставка їжі
- для
- фонд
- Підвалини
- друзі
- від
- повністю
- майбутнє
- азартні ігри
- збирати
- породжувати
- генерується
- генеративний
- Генеративний ШІ
- отримати
- Глобальний
- Глобально
- мета
- Цілі
- Групи
- керівництво
- Обробка
- Мати
- he
- допомога
- допомогу
- допомагає
- Високий
- високоякісний
- його
- Як
- How To
- HTML
- HTTPS
- Особистість
- if
- негайно
- Impact
- здійснювати
- імпорт
- удосконалювати
- in
- У тому числі
- вказує
- інформація
- Інфраструктура
- ініціативи
- вхід
- розуміння
- екземпляр
- інтеграція
- інтерфейс
- інтернет
- Доступ в інтернет
- в
- питання
- IT
- ЙОГО
- приєднання
- подорож
- JPG
- json
- земля
- мова
- мови
- останній
- запуск
- УЧИТЬСЯ
- вивчення
- залишити
- дозволяє
- як
- Лінія
- LINK
- жити
- загрузка
- погрузка
- вантажі
- розташування
- каротаж
- подивитися
- шукати
- любить
- машина
- навчання за допомогою машини
- Підтримка
- РОБОТИ
- Робить
- вдалося
- менеджер
- управління
- Може..
- сенс
- засоби
- Меню
- хвилин
- відсутній
- ML
- Mobile
- Мобільний додаток
- модель
- Моделі
- MongoDB
- більше
- найбільш
- множинний
- музика
- повинен
- ім'я
- рідний
- Природний
- природа
- навігація
- навігація
- Необхідність
- Нові
- наступний
- немає
- of
- пропонує
- Пропозиції
- часто
- on
- тільки
- працювати
- Оптимізувати
- варіант
- Опції
- or
- наші
- з
- на відкритому повітрі
- поза
- над
- сторінка
- pane
- Пароль
- моделі
- Виконувати
- продуктивність
- Дозволи
- plato
- Інформація про дані Платона
- PlatoData
- Play
- плюс
- пошта
- влада
- Харчування
- передбачати
- прогноз
- Прогнози
- Прогностична аналітика
- Прогнози
- Готувати
- підготовка
- передумови
- попередній перегляд
- первинний
- приватний
- Проблема
- проблеми
- процес
- Product
- менеджер по продукції
- Production
- профіль
- Програмування
- мови програмування
- захист
- забезпечувати
- забезпечує
- мета
- якість
- питань
- Швидко
- швидко
- номінальний
- рейтинг
- рейтинги
- Читати
- читання
- готовий
- рекомендувати
- послатися
- покладатися
- видаляє
- звітом
- вимагається
- пружний
- ресурси
- ресторан
- ресторан
- Роль
- ролі
- s
- мудрець
- то ж
- масштабованість
- шкала
- наука
- скріншоти
- вторинний
- безпеку
- побачити
- вибрати
- старший
- сенс
- Послуги
- Сесія
- установка
- показав
- показаний
- Шоу
- підпис
- простий
- один
- So
- solid
- рішення
- Рішення
- Вирішує
- деякі
- спеціаліст
- витрачати
- Спорт
- стек
- старт
- Статус
- Крок
- заходи
- зберігати
- магазинів
- просто
- Стратегія
- сильний
- підмережі
- успішний
- такі
- підходящий
- таблиця
- Приймати
- Мета
- команди
- технічний
- техніка
- шаблон
- Що
- Команда
- їх
- потім
- Там.
- Ці
- це
- ті
- через
- час
- до
- топ
- поїзд
- Навчання
- Перетворення
- Перетворення
- перетворень
- перетворений
- тип
- непотрібний
- використання
- користувач
- використання
- значення
- Цінності
- вид
- фактично
- візуальний
- чекати
- хотіти
- було
- спостереження
- we
- Web
- веб-сервіси
- коли
- який
- в той час як
- волі
- з
- в
- без
- Work
- працював
- робочий
- працює
- вартість
- лист
- років
- Ти
- вашу
- зефірнет