Здатність швидко створювати та розгортати моделі машинного навчання (ML) стає все більш важливою в сучасному світі, що керується даними. Однак створення моделей ML вимагає значного часу, зусиль і спеціальних знань. Від збору даних і очищення до розробки функцій, побудови моделі, налаштування та розгортання, розробники часто займають місяці, щоб завершити проекти ML. А досвідчених спеціалістів із обробки даних може бути важко знайти.
Саме тут набір ML-сервісів AWS з низьким кодом і без нього стає важливим інструментом. Використовуючи лише кілька клацань Canvas Amazon SageMaker, ви можете скористатися потужністю ML без необхідності писати код.
Як стратегічний системний інтегратор із глибоким досвідом ML, Deloitte використовує інструменти ML без коду та з низьким кодом від AWS для ефективного створення та розгортання моделей ML для клієнтів Deloitte та внутрішніх активів. Ці інструменти дозволяють Deloitte розробляти рішення для машинного навчання без необхідності ручного кодування моделей і конвеєрів. Це може допомогти пришвидшити терміни реалізації проекту та дати Deloitte змогу взяти на себе більше роботи з клієнтами.
Нижче наведено деякі конкретні причини, чому Deloitte використовує ці інструменти:
- Доступність для не програмістів – Інструменти без коду відкривають можливість побудови моделі ML для непрограмістів. Члени команди, які володіють лише знаннями в галузі та дуже невеликими навичками програмування, можуть розробляти моделі ML.
- Швидке впровадження нових технологій – Доступність і постійне вдосконалення готових до використання моделей і AutoML допомагає гарантувати, що користувачі постійно використовують технології провідного класу.
- Економічний розвиток – Інструменти без коду допомагають скоротити вартість і час, необхідні для розробки моделі ML, роблячи її більш доступною для клієнтів, що може допомогти їм досягти вищої рентабельності інвестицій.
Крім того, ці інструменти пропонують комплексне рішення для пришвидшення робочих процесів, що дозволяє:
- Швидша підготовка даних – SageMaker Canvas має понад 300 вбудованих перетворень і здатність використовувати природну мову, яка може прискорити підготовку даних і створення моделей.
- Швидше створення моделі – SageMaker Canvas пропонує готові до використання моделі або Amazon AutoML технологія, яка дає змогу створювати власні моделі на корпоративних даних лише кількома клацаннями миші. Це допомагає пришвидшити процес порівняно з моделями кодування з нуля.
- Простіше розгортання – SageMaker Canvas пропонує можливість розгортати готові до виробництва моделі на Amazon Sagmaker кінцеву точку за кілька кліків, а також реєструючи її в Реєстр моделей Amazon SageMaker.
Вішвешвара Васа, Хмарний технічний директор Deloitte, каже:
«Завдяки безкодовим службам машинного навчання AWS, таким як SageMaker Canvas і SageMaker Data Wrangler, ми в Deloitte Consulting відкрили нові можливості для підвищення ефективності, підвищивши швидкість розробки та продуктивність розгортання на 30–40% у наших клієнтських і внутрішніх проектах».
У цій публікації ми демонструємо можливості побудови наскрізної моделі ML без коду за допомогою SageMaker Canvas, показуючи вам, як побудувати модель класифікації для прогнозування, якщо клієнт не виплатить кредит. Завдяки точнішому прогнозуванню неплатежів по кредитах модель може допомогти фінансовій компанії керувати ризиками, відповідним чином оцінювати кредити, покращувати роботу, надавати додаткові послуги та отримати конкурентну перевагу. Ми демонструємо, як SageMaker Canvas може допомогти вам швидко перейти від необроблених даних до розгорнутої моделі двійкової класифікації для прогнозування дефолту за кредитом.
SageMaker Canvas пропонує широкі можливості підготовки даних на базі Amazon SageMaker Data Wrangler у робочій області SageMaker Canvas. Це дає змогу пройти всі етапи стандартного робочого процесу ML, від підготовки даних до побудови та розгортання моделі, на одній платформі.
Підготовка даних зазвичай є найбільш трудомістким етапом робочого процесу машинного навчання. Щоб скоротити час, витрачений на підготовку даних, SageMaker Canvas дозволяє готувати дані за допомогою понад 300 вбудованих перетворень. Як альтернатива, ви можете писати підказки природною мовою, як-от «відкинути рядки для стовпця c, які є викидами», і отримати фрагмент коду, необхідний для цього етапу підготовки даних. Потім ви можете додати це до робочого процесу підготовки даних кількома клацаннями миші. У цій публікації ми також покажемо вам, як це використовувати.
Огляд рішення
На наступній діаграмі описано архітектуру моделі класифікації кредиту за замовчуванням за допомогою інструментів SageMaker з низьким кодом і без коду.
Починаючи з набору даних, у якому містяться відомості про дефолтні дані по кредиту Служба простого зберігання Amazon (Amazon S3), ми використовуємо SageMaker Canvas, щоб отримати уявлення про дані. Потім ми виконуємо розробку функцій, щоб застосувати такі перетворення, як кодування категоріальних функцій, видалення непотрібних функцій тощо. Потім ми зберігаємо очищені дані в Amazon S3. Ми використовуємо очищений набір даних для створення моделі класифікації для прогнозування неплатежів за кредитами. Тоді ми маємо готову модель для висновку.
Передумови
Переконайтеся, що наступне передумови завершені та що ви ввімкнули Полотно Готові до використання моделі під час налаштування домену SageMaker. Якщо ви вже налаштували свій домен, редагувати налаштування домену і йди до Налаштування Canvas щоб включити Увімкнути готові до використання моделі Canvas варіант. Додатково налаштуйте і створити програму SageMaker Canvas, потім запитайте та ввімкніть Антропний доступ до моделі Клода on Amazon Bedrock.
Набір даних
Ми використовуємо публічний набір даних від kaggle що містить інформацію про фінансові кредити. Кожен рядок у наборі даних представляє одну позику, а стовпці надають деталі про кожну транзакцію. Завантажте цей набір даних і збережіть його у відрі S3 за вашим вибором. У наведеній нижче таблиці перераховано поля в наборі даних.
Назва стовпця | Тип даних | Опис |
Person_age |
Ціле число | Вік особи, яка взяла кредит |
Person_income |
Ціле число | Дохід позичальника |
Person_home_ownership |
рядок | Статус володіння житлом (власне чи орендоване) |
Person_emp_length |
Десятковий | Кількість років, протягом яких вони працюють |
Loan_intent |
рядок | Причина позики (особисті, медичні, освітні та ін.) |
Loan_grade |
рядок | Клас позики (A–E) |
Loan_int_rate |
Десятковий | Процентна ставка |
Loan_amnt |
Ціле число | Загальна сума кредиту |
Loan_status |
Ціле число | Ціль (незалежно від того, чи виконано вони за замовчуванням чи ні) |
Loan_percent_income |
Десятковий | Сума кредиту в порівнянні з відсотком від доходу |
Cb_person_default_on_file |
Ціле число | Попередні параметри за замовчуванням (за наявності) |
Cb_person_credit_history_length |
рядок | Тривалість кредитної історії |
Спростіть підготовку даних за допомогою SageMaker Canvas
Підготовка даних може займати до 80% зусиль у проектах ML. Належна підготовка даних веде до кращої продуктивності моделі та точніших прогнозів. SageMaker Canvas дозволяє інтерактивне дослідження, трансформацію та підготовку даних без написання коду SQL або Python.
Щоб підготувати дані, виконайте такі кроки:
- На консолі SageMaker Canvas виберіть Підготовка даних у навігаційній панелі.
- на Створювати меню, виберіть Документ.
- для Назва набору даних, введіть назву для вашого набору даних.
- Вибирати Створювати.
- Виберіть Amazon S3 як джерело даних і підключіть його до набору даних.
- Після завантаження набору даних створіть потік даних, використовуючи цей набір даних.
- Перейдіть на вкладку аналізів і створіть a Звіт про якість даних і статистику.
Це рекомендований крок для аналізу якості вхідного набору даних. Вихідні дані цього звіту дають миттєву статистику на основі ML, наприклад перекіс даних, дублікати в даних, відсутні значення та багато іншого. На наступному знімку екрана показано зразок створеного звіту для набору даних позики.
Генеруючи цю інформацію від вашого імені, SageMaker Canvas надає вам набір проблем у даних, які потребують виправлення на етапі підготовки даних. Щоб вибрати дві головні проблеми, визначені SageMaker Canvas, вам потрібно закодувати категориальні функції та видалити повторювані рядки, щоб якість вашої моделі була високою. За допомогою SageMaker Canvas ви можете робити обидва та багато іншого у візуальному робочому процесі.
- По-перше, одноразове кодування
loan_intent
,loan_grade
таperson_home_ownership
- Ви можете скинути
cb_person_cred_history_length
оскільки цей стовпець має найменшу передбачувану силу, як показано у звіті про якість даних і аналітичні дані.
SageMaker Canvas нещодавно додав a Чат з даними варіант. Ця функція використовує потужність основних моделей для інтерпретації запитів на природній мові та створення коду на основі Python для застосування інженерних перетворень функцій. Цю функцію підтримує Amazon Bedrock і її можна налаштувати для роботи повністю у вашому VPC, щоб дані ніколи не залишали ваше середовище. - Щоб скористатися цією функцією для видалення повторюваних рядків, виберіть знак плюс поруч із Колонка скидання перетворення, а потім виберіть Чат з даними.
- Введіть свій запит природною мовою (наприклад, «Видалити повторювані рядки з набору даних»).
- Перегляньте згенероване перетворення та виберіть Додати до кроків щоб додати перетворення до потоку.
- Нарешті, експортуйте результати цих перетворень в Amazon S3 або за бажанням Магазин функцій Amazon SageMaker використовувати ці функції в кількох проектах.
Ви також можете додати ще один крок, щоб створити місце призначення Amazon S3 для набору даних, щоб масштабувати робочий процес для великого набору даних. На наступній діаграмі показано потік даних SageMaker Canvas після додавання візуальних трансформацій.
Ви виконали повну обробку даних і етап розробки функцій за допомогою візуальних робочих процесів у SageMaker Canvas. Це допомагає скоротити час, який розробник даних витрачає на очищення та підготовку даних до розробки моделі від тижнів до днів. Наступним кроком буде побудова моделі ML.
Побудуйте модель за допомогою SageMaker Canvas
Amazon SageMaker Canvas забезпечує наскрізний робочий процес без коду для створення, аналізу, тестування та розгортання цієї двійкової моделі класифікації. Виконайте наступні дії:
- Створіть набір даних у SageMaker Canvas.
- Укажіть або розташування S3, яке було використано для експорту даних, або розташування S3, яке знаходиться на місці призначення завдання SageMaker Canvas.
Тепер ви готові до створення моделі. - Вибирати моделі на панелі навігації та виберіть нова модель.
- Назвіть модель і виберіть Прогностичний аналіз як тип моделі.
- Виберіть набір даних, створений на попередньому кроці.
Наступним кроком є налаштування типу моделі. - Виберіть цільовий стовпець, і тип моделі буде автоматично встановлено як 2 категорія передбачення.
- Виберіть тип збірки, Стандартна збірка or Швидка збірка.
SageMaker Canvas відображає очікуваний час створення, щойно ви починаєте будувати модель. Стандартна збірка зазвичай займає від 2 до 4 годин; ви можете використовувати опцію швидкого створення для менших наборів даних, що займає лише 2–15 хвилин. Для цього конкретного набору даних побудова моделі має тривати близько 45 хвилин. SageMaker Canvas інформує вас про хід процесу створення. - Після того, як модель буде побудована, ви можете переглянути її продуктивність.
SageMaker Canvas надає різні показники, такі як точність, точність і оцінка F1 залежно від типу моделі. На наступному знімку екрана показано точність і кілька інших розширених показників цієї двійкової моделі класифікації. - Наступний крок — зробити тестові прогнози.
SageMaker Canvas дозволяє робити пакетні прогнози для кількох вхідних даних або один прогноз, щоб швидко перевірити якість моделі. На наступному знімку екрана показано зразок висновку. - Останнім кроком є розгортання навченої моделі.
SageMaker Canvas розгортає модель на кінцевих точках SageMaker, і тепер у вас є робоча модель, готова для висновків. На наступному знімку екрана показано розгорнуту кінцеву точку.
Після розгортання моделі ви можете викликати її через AWS SDK або Інтерфейс командного рядка AWS (AWS CLI) або зробіть виклики API до будь-якої програми на ваш вибір, щоб впевнено передбачити ризик потенційного позичальника. Додаткову інформацію про тестування моделі див Викликати кінцеві точки в реальному часі.
Прибирати
Щоб уникнути додаткових витрат, вийдіть із SageMaker Canvas or видалити домен SageMaker що було створено. Крім того, видалити кінцеву точку моделі SageMaker та видалити набір даних, який було завантажено в Amazon S3.
Висновок
Безкодовий ML прискорює розробку, спрощує розгортання, не вимагає навичок програмування, підвищує стандартизацію та знижує вартість. Ці переваги зробили безкодове ML привабливим для Deloitte, щоб покращити свої пропозиції послуг ML, і вони скоротили терміни створення моделі ML на 30–40%.
Deloitte є стратегічним глобальним системним інтегратором із понад 17,000 XNUMX сертифікованих практиків AWS по всьому світу. Він продовжує піднімати планку завдяки участі в Програмі компетенцій AWS 25 компетенцій, включаючи машинне навчання. Зв’яжіться з Deloitte щоб почати використовувати рішення AWS без коду та з низьким кодом на вашому підприємстві.
Про авторів
Чіда Садаяппан очолює практику Deloitte Cloud AI/Machine Learning. Він має великий досвід інтелектуального лідерства в заходах і процвітає в підтримці керівників, зацікавлених у досягненні цілей підвищення ефективності та модернізації в різних галузях за допомогою AI/ML. Чіда є серійним технологічним підприємцем і завзятим розбудовником спільноти в екосистемах стартапів і розробників.
Kuldeep Singh, головний глобальний лідер AI/ML в AWS із понад 20-річним стажем у сфері технологій, уміло поєднує свій досвід у сфері продажів і підприємництва з глибоким розумінням AI, ML та кібербезпеки. Він чудово налагоджує стратегічні глобальні партнерства, просуває трансформаційні рішення та стратегії в різних галузях, зосереджуючись на генеративному штучному інтелекті та GSI.
Касі Муту є старшим партнером-архітектором рішень, який зосереджується на даних та AI/ML в AWS із Х’юстона, Техас. Він захоплений тим, щоб допомогти партнерам і клієнтам пришвидшити їх подорож хмарними даними. Він є надійним порадником у цій галузі та має великий досвід проектування та створення масштабованих, стійких і продуктивних робочих навантажень у хмарі. Поза роботою любить проводити час із родиною.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/boosting-developer-productivity-how-deloitte-uses-amazon-sagemaker-canvas-for-no-code-low-code-machine-learning/
- : має
- :є
- : ні
- :де
- $UP
- 000
- 100
- 11
- 17
- 20
- 20 роки
- 385
- 521
- 7
- 9
- a
- здатність
- МЕНЮ
- прискорювати
- прискорюється
- доступною
- точність
- точний
- точно
- Achieve
- через
- додавати
- доданий
- додати
- Додатковий
- Додатково
- Прийняття
- просунутий
- Перевага
- радник
- після
- AI
- AI / ML
- ВСІ
- дозволяти
- дозволяє
- вже
- Також
- Amazon
- Amazon SageMaker
- Canvas Amazon SageMaker
- Amazon Web Services
- кількість
- an
- Аналіз
- аналізувати
- Аналізуючи
- та
- Інший
- будь-який
- API
- додаток
- Застосовувати
- відповідним чином
- архітектура
- ЕСТЬ
- навколо
- AS
- Активи
- At
- привабливий
- автоматично
- AutoML
- наявність
- уникнути
- AWS
- назад
- бар
- заснований
- BE
- оскільки
- стає
- становлення
- імені
- Переваги
- Краще
- між
- підвищення
- позичальника
- обидва
- Приносить
- будувати
- будівельник
- Створюємо
- побудований
- вбудований
- by
- call
- Виклики
- CAN
- полотно
- можливості
- Категорія
- Сертифікований
- вантажі
- вибір
- Вибирати
- класифікація
- Очищення
- клієнт
- клієнтів
- хмара
- код
- Кодування
- збір
- Колонка
- Колони
- комбінати
- Приходити
- співтовариство
- компанія
- порівняний
- конкурентоспроможний
- повний
- Зроблено
- всеосяжний
- впевнено
- налаштувати
- конфігурування
- З'єднуватися
- Консоль
- постійна
- постійно
- консалтинг
- містить
- триває
- Коштувати
- створювати
- створений
- кредит
- CTO
- виготовлений на замовлення
- клієнт
- Клієнти
- Кібербезпека
- дані
- Підготовка даних
- обробка даних
- керовані даними
- набори даних
- Днів
- глибокий
- дефолт
- за замовчуванням
- доставка
- deloitte
- демонструвати
- Залежно
- розгортання
- розгорнути
- розгортання
- розгортання
- розгортає
- призначення
- деталі
- розвивати
- Розробник
- розробників
- розробка
- дисплеїв
- do
- Ні
- домен
- скачати
- водіння
- Падіння
- Випадання
- дублікати
- кожен
- екосистеми
- освітній
- Ефективність
- продуктивно
- зусилля
- або
- включіть
- включений
- дозволяє
- дозволяє
- кодування
- кінець в кінець
- Кінцева точка
- зобов'язань
- інженер
- Машинобудування
- підвищення
- забезпечувати
- Що натомість? Створіть віртуальну версію себе у
- підприємство
- Весь
- повністю
- Підприємець
- підприємництво
- Навколишнє середовище
- істотний
- приклад
- виконавчий
- очікуваний
- досвід
- досвідчений
- експертиза
- дослідження
- експорт
- f1
- сім'я
- швидше
- особливість
- риси
- кілька
- поле
- Поля
- фінансовий
- фінансові позики
- фінансові послуги
- компанія фінансових послуг
- потік
- Сфокусувати
- фокусування
- після
- для
- Кування
- фонд
- від
- Отримувати
- породжувати
- генерується
- породжує
- генеративний
- Генеративний ШІ
- Глобальний
- земну кулю
- Go
- Цілі
- клас
- Земля
- Жорсткий
- Мати
- he
- допомога
- допомогу
- допомагає
- Високий
- вище
- його
- ГОДИННИК
- Х'юстон
- Як
- How To
- Однак
- HTML
- HTTP
- HTTPS
- ідентифікований
- if
- важливо
- удосконалювати
- поліпшення
- in
- У тому числі
- Збільшує
- все більше і більше
- промисловості
- інформація
- повідомив
- вхід
- витрати
- розуміння
- мить
- інтерактивний
- внутрішній
- інвестиції
- питання
- IT
- ЙОГО
- робота
- подорож
- JPG
- просто
- тримає
- мова
- великий
- останній
- лідер
- Керівництво
- Веде за собою
- вивчення
- найменш
- як
- Лінія
- списки
- трохи
- позику
- Кредити
- розташування
- подивитися
- машина
- навчання за допомогою машини
- made
- зробити
- Робить
- управляти
- медичний
- члени
- Метрика
- хвилин
- відсутній
- ML
- модель
- Моделі
- місяців
- більше
- найбільш
- багато
- множинний
- ім'я
- Природний
- навігація
- необхідно
- Необхідність
- необхідний
- нужденних
- ніколи
- Нові
- наступний
- немає
- зараз
- of
- Пропозиції
- Пропозиції
- часто
- on
- тільки
- відкрити
- операції
- варіант
- or
- Інше
- наші
- з
- вихід
- поза
- над
- власний
- власність
- pane
- участь
- приватність
- партнер
- партнери
- партнерства
- пристрасний
- відсоток
- Виконувати
- продуктивність
- людина
- персонал
- фаза
- вибирати
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- Plenty
- плюс
- пошта
- потенціал
- влада
- Харчування
- практика
- Точність
- передбачати
- прогнозування
- прогноз
- Прогнози
- підготовка
- Готувати
- передумови
- представлений
- попередній
- price
- Головний
- процес
- обробка
- випускає
- Production
- продуктивність
- програма
- Програмування
- прогрес
- проект
- проектів
- правильний
- забезпечувати
- забезпечує
- громадськість
- Python
- якість
- запити
- Швидко
- швидко
- підвищення
- швидко
- Сировина
- готовий
- реального часу
- Причини
- нещодавно
- рекомендований
- зменшити
- знижує
- послатися
- реєструючий
- видаляти
- оренда
- звітом
- представляє
- запросити
- вимагати
- вимагається
- Вимагається
- пружний
- повертати
- Risk
- ROW
- прогін
- мудрець
- продажів
- говорить
- масштабовані
- шкала
- Вчені
- рахунок
- Sdk
- вибрати
- старший
- послідовний
- обслуговування
- Послуги
- послуги компанії
- комплект
- установка
- укорочений
- Повинен
- Показувати
- показаний
- Шоу
- підпис
- значний
- простий
- спрощує
- один
- косий
- навички
- менше
- уривок
- So
- рішення
- Рішення
- деякі
- скоро
- Source
- спеціалізований
- конкретний
- швидкість
- Витрати
- відпрацьований
- зацікавлених сторін
- standard
- стандартизація
- старт
- введення в експлуатацію
- Статус
- Крок
- заходи
- зберігання
- зберігати
- Стратегічний
- стратегії
- сильний
- такі
- набір
- Підтримуючий
- Переконайтеся
- Systems
- таблиця
- Приймати
- приймає
- Мета
- команда
- Члени команди
- технології
- Технологія
- тест
- Тестування
- Що
- Команда
- їх
- Їх
- потім
- Ці
- вони
- це
- думка
- думка лідерства
- процвітає
- через
- час
- терміни
- до
- сьогоднішній
- прийняли
- інструмент
- інструменти
- топ
- навчений
- угода
- Перетворення
- Перетворення
- перетворень
- перетворювальний
- Довірений
- настройка
- два
- TX
- тип
- типово
- розуміння
- розблокована
- завантажено
- використання
- використовуваний
- користувачі
- використовує
- використання
- зазвичай
- використовує
- Цінності
- різний
- перевірити
- дуже
- візуальний
- було
- we
- Web
- веб-сервіси
- тижня
- ДОБРЕ
- коли
- Чи
- який
- в той час як
- ВООЗ
- чому
- волі
- з
- без
- Work
- робочий
- Робочі процеси
- світ
- запис
- лист
- років
- Ти
- вашу
- зефірнет