У грудні 2020, AWS оголосила про загальну доступність of Amazon SageMaker JumpStart, здатність Amazon SageMaker який допоможе вам швидко та легко розпочати роботу з машинним навчанням (ML). JumpStart забезпечує тонке налаштування одним кліком і розгортання широкого спектру попередньо навчених моделей для популярних завдань ML, а також вибір наскрізних рішень, які вирішують типові бізнес-проблеми. Ці функції знімають важку роботу з кожного кроку процесу ML, полегшуючи розробку високоякісних моделей і скорочуючи час до розгортання.
Раніше весь вміст JumpStart був доступний лише через Студія Amazon SageMaker, який передбачає a зручний графічний інтерфейс взаємодіяти з функцією. Сьогодні ми раді оголосити про запуск простого у використанні API JumpStart як розширення SageMaker Python SDK. Ці API дозволяють програмно розгортати та точно налаштовувати широкий вибір попередньо навчених моделей, які підтримуються JumpStart, у ваших власних наборах даних. Цей запуск розблокує використання можливостей JumpStart у ваших робочих процесах коду, конвеєрах MLOps і будь-де, де ви взаємодієте з SageMaker через SDK.
У цій публікації ми надаємо оновлення щодо поточного стану можливостей JumpStart і проведемо вас через процес використання JumpStart API з прикладом використання.
Огляд JumpStart
JumpStart — це багатогранний продукт, який включає різні можливості, які допоможуть вам швидко розпочати роботу з машинним навчанням на SageMaker. На момент написання статті JumpStart дозволяє робити наступне:
- Розгортайте попередньо навчені моделі для поширених завдань ML – JumpStart дозволяє вирішувати звичайні завдання ML без зусиль для розробки, забезпечуючи легке розгортання моделей, попередньо навчених на загальнодоступних великих наборах даних. Дослідницька спільнота ML доклала багато зусиль, щоб зробити більшість нещодавно розроблених моделей загальнодоступними для використання. JumpStart містить колекцію з понад 300 моделей, що охоплюють 15 найпопулярніших завдань ML, таких як виявлення об’єктів, класифікація тексту та генерація тексту, що полегшує їх використання для новачків. Ці моделі взяті з популярних центрів моделей, таких як TensorFlow, PyTorch, Hugging Face і MXNet Hub.
- Точна настройка попередньо навчених моделей – JumpStart дозволяє точно налаштувати попередньо навчені моделі без необхідності писати власний алгоритм навчання. У ML називається здатність передавати знання, отримані в одній області, в іншу трансферне навчання. Ви можете використовувати навчання з перенесенням для створення точних моделей на ваших менших наборах даних із набагато нижчими витратами на навчання, ніж ті, які пов’язані з навчанням оригінальної моделі з нуля. JumpStart також включає популярні алгоритми навчання, засновані на LightGBM, CatBoost, XGBoost і Scikit-learn, які можна навчити з нуля для регресії та класифікації табличних даних.
- Використовуйте готові рішення – JumpStart надає набір 17 готових рішень для поширених випадків використання ML, таких як прогнозування попиту та промислові та фінансові додатки, які можна розгорнути лише кількома кліками. Рішення — це наскрізні програми ML, які об’єднують різні служби AWS для вирішення конкретного випадку використання бізнесу. Вони використовують AWS CloudFormation шаблони та еталонні архітектури для швидкого розгортання, що означає, що їх можна повністю налаштувати.
- Використовуйте приклади блокнотів для алгоритмів SageMaker – SageMaker надає набір вбудовані алгоритми щоб допомогти науковцям з даних і практикам машинного навчання швидко розпочати навчання та розгортати моделі машинного навчання. JumpStart надає зразки блокнотів, які можна використовувати для швидкого використання цих алгоритмів.
- Скористайтеся перевагами навчальних відео та блогів – JumpStart також надає численні публікації в блозі та відео, які навчають вас, як використовувати різні функції в SageMaker.
JumpStart приймає користувацькі налаштування VPC та ключі шифрування KMS, щоб ви могли безпечно використовувати доступні моделі та рішення у вашому корпоративному середовищі. Ви можете передати свої налаштування безпеки в JumpStart у SageMaker Studio або через SageMaker Python SDK.
Завдання ML із підтримкою JumpStart та приклади зошитів із API
JumpStart зараз підтримує 15 найпопулярніших завдань ML; 13 з них — це завдання на основі бачення та НЛП, 8 з яких підтримують тонке налаштування без коду. Він також підтримує чотири популярні алгоритми для моделювання табличних даних. Завдання та посилання на їх зразки зошитів узагальнено в наступній таблиці.
Завдання | Висновок з попередньо підготовленими моделями | Навчання на спеціальному наборі даних | Підтримуються фреймворки | Приклад блокнотів |
Класифікація зображень | так | так | PyTorch, TensorFlow | Вступ до JumpStart – Класифікація зображень |
Виявлення об'єктів | так | так | PyTorch, TensorFlow, MXNet | Вступ до JumpStart – виявлення об’єктів |
Семантична сегментація | так | так | MX Net | Вступ до JumpStart – семантична сегментація |
Сегментація екземплярів | так | немає | MX Net | Вступ до JumpStart – Сегментація екземплярів |
Вбудовування зображення | так | немає | TensorFlow, MXNet | Вступ до JumpStart – Вбудовування зображень |
Класифікація тексту | так | так | TensorFlow | Вступ до JumpStart – Класифікація тексту |
Парна класифікація речень | так | так | TensorFlow, обіймає обличчя | Вступ до JumpStart – Класифікація пар речень |
Відповідь на запитання | так | так | PyTorch | Вступ до JumpStart – відповідь на запитання |
Визнання іменованої сутності | так | немає | Обіймати обличчя | Вступ до JumpStart – розпізнавання іменованих об’єктів |
Узагальнення тексту | так | немає | Обіймати обличчя | Вступ до JumpStart – узагальнення тексту |
Генерація тексту | так | немає | Обіймати обличчя | Вступ до JumpStart – генерування тексту |
Машинний переклад | так | немає | Обіймати обличчя | Вступ до JumpStart – машинний переклад |
Вбудовування тексту | так | немає | TensorFlow, MXNet | Вступ до JumpStart – вбудовування тексту |
Таблична класифікація | так | так | LightGBM, CatBoost, XGBoost, Linear Learner | Вступ до JumpStart – Таблична класифікація – LightGBM, CatBoost Вступ до JumpStart – Таблична класифікація – XGBoost, Linear Learner |
Таблична регресія | так | так | LightGBM, CatBoost, XGBoost, Linear Learner | Вступ до JumpStart – Таблична регресія – LightGBM, CatBoost Вступ до JumpStart – Таблична регресія – XGBoost, Linear Learner |
Залежно від завдання, зразки зошитів, на які наведено посилання в попередній таблиці, можуть допомогти вам у всіх або підмножині таких процесів:
- Виберіть попередньо навчену модель, яку підтримує JumpStart, для вашого конкретного завдання.
- Розмістіть попередньо навчену модель, отримуйте від неї прогнози в режимі реального часу та адекватно відображайте результати.
- Налаштуйте попередньо навчену модель за допомогою власного вибору гіперпараметрів і розгорніть її для висновку.
Точна настройка та розгортання моделі виявлення об’єктів за допомогою JumpStart API
У наступних розділах ми надаємо покрокове керівництво щодо використання нових API JumpStart для репрезентативного завдання виявлення об’єктів. Ми показуємо, як використовувати попередньо навчену модель виявлення об’єктів для ідентифікації об’єктів із попередньо визначеного набору класів на зображенні з обмежуючими рамками. Нарешті, ми показуємо, як точно налаштувати попередньо підготовлену модель на вашому власному наборі даних, щоб виявляти об’єкти на зображеннях, які відповідають потребам вашого бізнесу, просто вводячи власні дані. Ми надаємо супровідний блокнот для цього покрокового керівництва.
Ми проходимо такі кроки високого рівня:
- Зробіть висновок на попередньо навченій моделі.
- Отримайте артефакти JumpStart і розгорніть кінцеву точку.
- Запитуйте кінцеву точку, проаналізуйте відповідь та відобразіть передбачення моделі.
- Налаштуйте попередньо навчену модель на власному наборі даних.
- Отримати навчальні артефакти.
- Тренування з бігу.
Зробіть висновок на попередньо навченій моделі
У цьому розділі ми вибираємо відповідну попередньо навчену модель у JumpStart, розгортаємо цю модель на кінцевій точці SageMaker і показуємо, як виконати висновки на розгорнутій кінцевій точці. Усі кроки доступні в супровідний блокнот Jupyter.
Отримайте артефакти JumpStart і розгорніть кінцеву точку
SageMaker — це платформа на основі контейнерів Docker. JumpStart використовує доступну платформу Контейнери глибокого навчання SageMaker (DLC). Ми отримуємо будь-які додаткові пакети, а також скрипти для обробки навчання та висновків для вибраного завдання. Нарешті, попередньо навчені артефакти моделі витягуються окремо model_uris
, що забезпечує гнучкість платформи. Ви можете використовувати будь-яку кількість моделей, попередньо навчених для виконання одного завдання, за допомогою одного сценарію навчання або висновку. Дивіться наступний код:
Далі ми подаємо ресурси в a Модель SageMaker створити екземпляр і розгорнути кінцеву точку:
Розгортання кінцевої точки може зайняти кілька хвилин.
Запитуйте кінцеву точку, проаналізуйте відповідь та відобразіть передбачення
Щоб отримати висновки з розгорнутої моделі, вхідне зображення має бути надано у двійковому форматі разом із типом прийняття. У JumpStart ви можете визначити кількість повернених обмежувальних рамок. У наступному фрагменті коду ми передбачимо десять обмежуючих прямокутників на зображення шляхом додавання ;n_predictions=10
до Accept
. Щоб передбачити xx ящиків, ви можете змінити його на ;n_predictions=xx
, або отримати всі передбачені квадрати, пропустивши ;n_predictions=xx
повністю.
Наведений нижче фрагмент коду дає вам уявлення про те, як виглядає виявлення об’єктів. Візуалізується ймовірність, передбачена для кожного класу об’єктів, а також його обмежувальна рамка. Ми використовуємо parse_response
та display_predictions
допоміжні функції, які визначені в доп ноутбук.
На наступному знімку екрана показано вихідне зображення з мітками передбачення та обмежуючими рамками.
Тонко налаштуйте попередньо навчену модель на власному наборі даних
Існуючі моделі виявлення об’єктів у JumpStart попередньо навчаються на наборах даних COCO або VOC. Однак, якщо вам потрібно визначити класи об’єктів, які не існують у вихідному наборі даних попереднього навчання, вам доведеться точно налаштувати модель на новому наборі даних, який включає ці нові типи об’єктів. Наприклад, якщо вам потрібно визначити кухонне начиння та зробити висновок на розгорнутій попередньо навченій моделі SSD, модель не розпізнає жодних характеристик нових типів зображень, і тому виведення буде неправильним.
У цьому розділі ми демонструємо, як легко налаштувати попередньо навчену модель для виявлення нових класів об’єктів за допомогою JumpStart API. Повний приклад коду з більш детальною інформацією доступний у супровідний зошит.
Отримати навчальні артефакти
Артефакти навчання подібні до артефактів висновку, які розглядалися в попередньому розділі. Для навчання потрібен базовий контейнер Docker, а саме контейнер MXNet у наступному прикладі коду. Будь-які додаткові пакети, необхідні для навчання, включені до сценаріїв навчання train_sourcer_uri
. Попередньо навчена модель та її параметри пакуються окремо.
Тренування з бігу
Щоб запустити навчання, ми просто передаємо необхідні артефакти разом із деякими додатковими параметрами до a Оцінювач SageMaker і зателефонуйте на .fit
функція:
Поки алгоритм тренується, ви можете стежити за його прогресом або в блокноті SageMaker, де ви запускаєте сам код, або на Amazon CloudWatch. Після завершення навчання налаштовані артефакти моделі завантажуються в Служба простого зберігання Amazon Розташування виводу (Amazon S3), зазначене в навчальній конфігурації. Тепер ви можете розгорнути модель так само, як і попередньо навчену модель. Ви можете стежити за рештою процесу в супровідний зошит.
Висновок
У цій публікації ми описали значення нещодавно випущених API JumpStart і як їх використовувати. Ми надали посилання на 17 прикладів блокнотів для різних завдань ML, які підтримуються в JumpStart, і провели вас через блокнот виявлення об’єктів.
Ми з нетерпінням чекаємо від вас, коли ви експериментуєте з JumpStart.
Про авторів
Доктор Вівек Мадан є вченим-прикладником у команді Amazon SageMaker JumpStart. Він отримав ступінь доктора філософії в Університеті Іллінойсу в Урбана-Шампейн і був докторантом у технічному університеті Джорджії. Він є активним дослідником у галузі машинного навчання та розробки алгоритмів, а також опублікував статті на конференціях EMNLP, ICLR, COLT, FOCS та SODA.
Жоао Моура є архітектором-спеціалістом з рішень AI/ML у Amazon Web Services. Він переважно зосереджений на сценаріях використання НЛП і допомагає клієнтам оптимізувати навчання та розгортання моделі глибокого навчання.
Доктор Ашиш Хетан є старшим вченим-прикладником с Amazon SageMaker JumpStart та Вбудовані алгоритми Amazon SageMaker і допомагає розробляти алгоритми машинного навчання. Він є активним дослідником у галузі машинного навчання та статистичного висновку та опублікував багато робіт на конференціях NeurIPS, ICML, ICLR, JMLR та ACL.
- Coinsmart. Найкраща в Європі біржа біткойн та криптовалют.
- Платоблокчейн. Web3 Metaverse Intelligence. Розширені знання. БЕЗКОШТОВНИЙ ДОСТУП.
- CryptoHawk. Альткойн Радар. Безкоштовне випробування.
- Джерело: https://aws.amazon.com/blogs/machine-learning/amazon-sagemaker-jumpstart-models-and-algorithms-now-available-via-api/
- "
- 100
- 2020
- точний
- через
- активний
- Додатковий
- Перевага
- алгоритм
- алгоритми
- ВСІ
- Amazon
- Amazon Web Services
- кількість
- Оголосити
- оголошений
- Інший
- де-небудь
- API
- Інтерфейси
- застосування
- доступний
- AWS
- буття
- Блог
- Повідомлення в блозі
- Box
- вбудований
- бізнес
- call
- можливості
- випадків
- зміна
- класифікація
- код
- збір
- загальний
- співтовариство
- конференції
- конфігурація
- Контейнер
- Контейнери
- містить
- зміст
- витрати
- Поточний
- Поточний стан
- Клієнти
- дані
- обробка даних
- Попит
- розгортання
- розгортання
- розгортання
- дизайн
- Виявлення
- розвивати
- розвиненою
- розробка
- різний
- дисплей
- Docker
- Ні
- домен
- легко
- шифрування
- Кінцева точка
- підприємство
- Навколишнє середовище
- приклад
- експеримент
- Face
- особливість
- риси
- в кінці кінців
- фінансовий
- Гнучкість
- потік
- увагу
- стежити
- після
- формат
- Вперед
- Повний
- функція
- Загальне
- покоління
- Грузія
- керівництво
- Обробка
- допомога
- допомагає
- Як
- How To
- HTTPS
- ідентифікувати
- Іллінойс
- зображення
- включені
- У тому числі
- промислові
- залучений
- IT
- сам
- робота
- ключі
- знання
- етикетки
- великий
- запуск
- вчений
- вивчення
- зв'язку
- розташування
- машина
- навчання за допомогою машини
- Більшість
- Робить
- ML
- модель
- Моделі
- найбільш
- Найбільш популярний
- а саме
- ноутбук
- номер
- численний
- платформа
- популярний
- Пости
- прогноз
- Прогнози
- представити
- проблеми
- процес
- процеси
- виробляти
- Product
- забезпечувати
- забезпечує
- питання
- швидко
- реального часу
- визнавати
- зниження
- вимагається
- дослідження
- ресурси
- відповідь
- REST
- результати
- прогін
- біг
- вчений
- Вчені
- Sdk
- безпечно
- безпеку
- обраний
- Послуги
- комплект
- аналогічний
- простий
- So
- Рішення
- ВИРІШИТИ
- почалася
- стан
- статистичний
- зберігання
- студія
- підтримка
- Підтриманий
- Опори
- завдання
- команда
- технології
- через
- час
- сьогодні
- разом
- Навчання
- поїзда
- університет
- розблокує
- Оновити
- використання
- випадки використання
- значення
- Відео
- бачення
- Web
- веб-сервіси
- Що
- в
- лист