Сьогодні ми раді повідомити, що тепер ви можете виконувати пакетні перетворення за допомогою Amazon SageMaker JumpStart великі мовні моделі (LLM) для генерації Text2Text. Пакетні перетворення корисні в ситуаціях, коли відповіді не обов’язково мають бути в режимі реального часу, тому ви можете виконувати групові висновки для великих наборів даних. Для пакетного перетворення виконується пакетне завдання, яке приймає пакетний вхід як набір даних і попередньо навчену модель і виводить прогнози для кожної точки даних у наборі даних. Пакетне перетворення є економічно ефективним, оскільки на відміну від розміщених у реальному часі кінцевих точок із постійним апаратним забезпеченням, кластери пакетного перетворення розриваються після завершення завдання, тому апаратне забезпечення використовується лише протягом пакетного завдання.
У деяких випадках використання запити на висновок у реальному часі можна згрупувати в невеликі пакети для пакетної обробки для створення відповідей у реальному або майже реальному часі. Наприклад, якщо вам потрібно обробити безперервний потік даних із низькою затримкою та високою пропускною здатністю, виклик кінцевої точки реального часу для кожного запиту окремо потребуватиме більше ресурсів і може зайняти більше часу для обробки всіх запитів, оскільки обробка виконується послідовно . Кращим підходом було б згрупувати деякі запити та викликати кінцеву точку реального часу в режимі пакетного висновку, який обробляє ваші запити за один прохід моделі та повертає масову відповідь на запит у реальному або майже реальному часі. . Затримка відповіді залежатиме від кількості запитів, які ви групуєте разом, і розміру пам’яті екземпляра, тому ви можете налаштувати розмір пакета відповідно до вимог вашого бізнесу щодо затримки та пропускної здатності. Ми називаємо це пакетний висновок у реальному часі оскільки він поєднує в собі концепцію групування, водночас надаючи відповіді в реальному часі. За допомогою пакетного аналізу в режимі реального часу ви можете досягти балансу між низькою затримкою та високою пропускною здатністю, дозволяючи обробляти великі обсяги даних своєчасно та ефективно.
Пакетне перетворення Jumpstart для моделей Text2Text Generation дозволяє передавати пакетні гіперпараметри через змінні середовища, що додатково збільшує пропускну здатність і мінімізує затримку.
JumpStart надає попередньо підготовлені моделі з відкритим вихідним кодом для широкого спектру типів проблем, щоб допомогти вам почати роботу з машинним навчанням (ML). Ви можете поступово навчати та налаштовувати ці моделі перед розгортанням. JumpStart також надає шаблони рішень, які налаштовують інфраструктуру для поширених випадків використання, і виконувані приклади блокнотів для ML з Amazon SageMaker. Ви можете отримати доступ до попередньо підготовлених моделей, шаблонів рішень і прикладів на цільовій сторінці JumpStart у Студія Amazon SageMaker. Ви також можете отримати доступ до моделей JumpStart за допомогою SageMaker Python SDK.
У цій публікації ми демонструємо, як використовувати найсучасніші попередньо навчені text2text моделі FLAN T5 від Hugging Face для пакетного перетворення та пакетного висновку в реальному часі.
Огляд рішення
Блокнот із пакетним перетворенням попередньо підготовлених моделей Text2Text FLAN T5 із Обіймати обличчя доступні в наступному GitHub сховище. Цей блокнот використовує дані з Hugging Face cnn_dailymail набір даних для завдання підсумовування тексту за допомогою SDK SageMaker.
Нижче наведено ключові кроки для впровадження пакетного перетворення та пакетного висновку в реальному часі:
- Створіть передумови.
- Виберіть попередньо навчену модель.
- Отримати артефакти для моделі.
- Укажіть гіперпараметри завдання пакетного перетворення.
- Підготуйте дані для пакетного перетворення.
- Запустіть завдання пакетного перетворення.
- Оцініть узагальнення за допомогою a ЧЕРВОНИЙ (Орієнтоване на запам’ятовування дослідження для оцінки Гістінга).
- Виконуйте пакетний висновок у реальному часі.
Створіть передумови
Перш ніж запустити ноутбук, ви повинні виконати деякі початкові кроки налаштування. Давайте налаштуємо роль виконання SageMaker, щоб вона мала дозволи запускати служби AWS від вашого імені:
Виберіть попередньо навчену модель
Ми використовуємо модель huggingface-text2text-flan-t5-large як модель за замовчуванням. За бажанням ви можете отримати список доступних моделей Text2Text на JumpStart і вибрати бажану модель. Цей метод забезпечує простий спосіб вибору різних ідентифікаторів моделі за допомогою одного блокнота. Для демонстрації ми використовуємо модель huggingface-text2text-flan-t5-large:
Отримати артефакти для моделі
За допомогою SageMaker ми можемо робити висновок на попередньо навченій моделі, навіть без попереднього тонкого налаштування на новому наборі даних. Ми починаємо з отримання deploy_image_uri
, deploy_source_uri
та model_uri
для попередньо навченої моделі:
Укажіть гіперпараметри завдання пакетного перетворення
Ви можете передати будь-яку підмножину гіперпараметрів як змінні середовища в завдання пакетного перетворення. Ви також можете передати ці гіперпараметри в корисне навантаження JSON. Однак якщо ви встановлюєте змінні середовища для гіперпараметрів, як показано в наведеному нижче коді, розширені гіперпараметри з окремих прикладів у корисному навантаженні рядків JSON не використовуватимуться. Якщо ви хочете використовувати гіперпараметри з корисного навантаження, ви можете встановити hyper_params_dict
параметр як нульовий.
Підготувати дані для пакетного перетворення
Тепер ми готові завантажити cnn_dailymail набір даних із Hugging Face:
Ми переглядаємо кожне введення даних і створюємо вхідні дані в потрібному форматі. Ми створюємо articles.jsonl
файл як тестовий файл даних, що містить статті, які потрібно підсумувати як вхідне корисне навантаження. Коли ми створюємо цей файл, ми додаємо підказку "Briefly summarize this text:"
до кожного вхідного рядка тесту. Якщо ви хочете мати різні гіперпараметри для кожного входу тесту, ви можете додати ці гіперпараметри як частину створення набору даних.
Ми створюємо highlights.jsonl
як основний файл правди, що містить основні моменти кожної статті, збереженої в тестовому файлі articles.jsonl
. Ми зберігаємо обидва тестові файли в Служба простого зберігання Amazon (Amazon S3) відро. Перегляньте наступний код:
Запустіть завдання пакетного перетворення
Коли ви починаєте завдання пакетного перетворення, SageMaker запускає необхідні обчислювальні ресурси для обробки даних, включаючи екземпляри CPU або GPU залежно від вибраного типу екземпляра. Під час завдання пакетного перетворення SageMaker автоматично надає та керує обчислювальними ресурсами, необхідними для обробки даних, включаючи екземпляри, сховище та мережеві ресурси. Коли завдання пакетного перетворення завершено, SageMaker автоматично очищає обчислювальні ресурси. Це означає, що екземпляри та сховище, які використовуються під час завдання, зупиняються та видаляються, звільняючи ресурси та мінімізуючи витрати. Перегляньте наступний код:
Нижче наведено один приклад запису з articles.jsonl
тестовий файл. Зауважте, що запис у цьому файлі має ідентифікатор, який збігається з predict.jsonl
записів файлів, які показують узагальнений запис як результат моделі Hugging Face Text2Text. Подібним чином, базовий файл правди також має відповідний ідентифікатор для запису даних. Ідентифікатор відповідності в тестовому файлі, файлі реальних даних і вихідному файлі дозволяє пов’язувати вхідні записи з вихідними записами для легкої інтерпретації результатів.
Нижче наведено приклад вхідного запису, наданого для підсумовування:
Нижче наведено прогнозований результат із підсумковуванням:
Нижче наведено основний підсумок істини для цілей оцінки моделі:
Далі ми використовуємо базову істину та прогнозовані результати для оцінки моделі.
Оцініть модель за шкалою ROUGE¶
ЧЕРВОНИЙ, або Recall-Oriented Understudy for Gisting Evaluation, — це набір показників і програмний пакет, який використовується для оцінки автоматичного підсумовування та машинного перекладу в процесі обробки природної мови. Показники порівнюють автоматично створене резюме або переклад із довідковим (створеним людиною) резюме або перекладом або набором посилань.
У наведеному нижче коді ми об’єднуємо прогнозовані та вихідні підсумки, об’єднуючи їх за загальним ключем id
і використовуйте це для обчислення балу ROUGE:
Виконуйте пакетний висновок у реальному часі
Далі ми покажемо вам, як запустити пакетний аналіз у реальному часі на кінцевій точці, надавши вхідні дані у вигляді списку. Ми використовуємо той самий ідентифікатор моделі та набір даних, що й раніше, за винятком того, що ми беремо кілька записів із тестового набору даних і використовуємо їх для виклику кінцевої точки в реальному часі.
У наступному коді показано, як створити та розгорнути кінцеву точку реального часу для пакетного висновку в реальному часі:
Далі ми готуємо наше вхідне корисне навантаження. Для цього ми використовуємо дані, які підготували раніше, витягуємо перші 10 тестових вхідних даних і додаємо текстові вхідні дані з гіперпараметрами, які ми хочемо використовувати. Ми надаємо це корисне навантаження в режимі реального часу invoke_endpoint
. Потім корисне навантаження відповіді повертається як список відповідей. Перегляньте наступний код:
Прибирати
Після перевірки кінцевої точки переконайтеся, що ви видалили кінцеву точку висновку SageMaker і видаліть модель, щоб уникнути стягнення плати.
Висновок
У цьому блокноті ми виконали пакетне перетворення, щоб продемонструвати модель Hugging Face Text2Text Generator для завдань узагальнення. Пакетне перетворення є вигідним для отримання висновків із великих наборів даних без потреби в постійній кінцевій точці. Ми пов’язали вхідні записи з висновками, щоб допомогти в інтерпретації результатів. Ми використали оцінку ROUGE, щоб порівняти узагальнення тестових даних із узагальненням, створеним моделлю.
Крім того, ми продемонстрували пакетний аналіз у реальному часі, коли ви можете надсилати невеликий пакет даних до кінцевої точки в реальному часі, щоб досягти балансу між затримкою та пропускною здатністю для таких сценаріїв, як потокове передавання вхідних даних. Пакетний аналіз у реальному часі допомагає збільшити пропускну здатність для запитів у реальному часі.
Спробуйте пакетне перетворення за допомогою моделей Text2Text Generation у SageMaker сьогодні та повідомте нам свої відгуки!
Про авторів
Гемант Сінгх є інженером машинного навчання з досвідом роботи з Amazon SageMaker JumpStart і вбудованими алгоритмами Amazon SageMaker. Він отримав ступінь магістра в Інституті математичних наук ім. Куранта та ступінь бакалавра технічних наук в IIT Делі. Він має досвід роботи над різноманітними проблемами машинного навчання в області обробки природної мови, комп’ютерного зору та аналізу часових рядів.
Рачна Чадха є головним архітектором рішень AI/ML у Strategic Accounts в AWS. Рахна — оптиміст, який вірить, що етичне та відповідальне використання ШІ може покращити суспільство в майбутньому та принести економічне та соціальне процвітання. У вільний час Рачна любить проводити час з сім'єю, гуляти в походах і слухати музику.
Доктор Ашиш Хетан є старшим прикладним науковим співробітником із вбудованими алгоритмами Amazon SageMaker і допомагає розробляти алгоритми машинного навчання. Він отримав ступінь доктора філософії в Іллінойському університеті Урбана-Шампейн. Він активно досліджує машинне навчання та статистичні висновки та опублікував багато статей на конференціях NeurIPS, ICML, ICLR, JMLR, ACL та EMNLP.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoAiStream. Web3 Data Intelligence. Розширення знань. Доступ тут.
- Карбування майбутнього з Адріенн Ешлі. Доступ тут.
- Купуйте та продавайте акції компаній, які вийшли на IPO, за допомогою PREIPO®. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- : має
- :є
- : ні
- :де
- $UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- Здатний
- МЕНЮ
- вище
- прийняття
- прийнятий
- доступ
- За
- Рахунки
- Achieve
- Набуває
- через
- дії
- активний
- просунутий
- вигідний
- проти
- AI
- AI / ML
- Aid
- алгоритми
- ВСІ
- нібито
- дозволяє
- Також
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- аналіз
- та
- Оголосити
- будь-який
- API
- прикладної
- підхід
- ЕСТЬ
- навколо
- стаття
- статті
- AS
- At
- Спроби
- влада
- автоматичний
- автоматично
- доступний
- уникнути
- AWS
- Balance
- база
- заснований
- BE
- стали
- оскільки
- стає
- перед тим
- буття
- Вірити
- вважає,
- Веніамін
- Краще
- між
- тіло
- обидва
- Обидві сторони
- Межі
- коротко
- приносити
- Приносить
- вбудований
- бізнес
- але
- by
- call
- CAN
- не може
- випадків
- Викликати
- вантажі
- Вибирати
- клас
- клієнт
- ближче
- CNN
- код
- об'єднувати
- комбінати
- об'єднання
- Приходити
- зобов'язань
- вчинено
- загальний
- порівняти
- повний
- обчислення
- комп'ютер
- Комп'ютерне бачення
- концепція
- Проводити
- конференції
- Контейнер
- продовжувати
- безперервний
- внесок
- Коштувати
- рентабельним
- може
- адвокат
- контрпродуктивний
- країни
- Суд
- створювати
- створення
- Злочини
- Кримінальну
- дані
- введення даних
- набори даних
- мертвий
- рішення
- дефолт
- Делі
- демонструвати
- продемонстрований
- відділ
- Залежно
- розгортання
- розгортання
- описаний
- Визначати
- розвивати
- розробка
- відрізняються
- Відмінності
- різний
- прямий
- Різне
- do
- Docker
- домен
- зроблений
- Не знаю
- Двері
- вниз
- тривалість
- під час
- кожен
- Раніше
- Схід
- легко
- Економічний
- ефективний
- зусилля
- має право
- дозволяє
- кінець
- Кінцева точка
- інженер
- забезпечувати
- Входить
- запис
- Навколишнє середовище
- Епоха
- етичний
- оцінювати
- оцінки
- оцінка
- Навіть
- докази
- приклад
- Приклади
- Крім
- збуджений
- виконання
- досвід
- витяг
- Face
- віра
- сім'я
- кілька
- філе
- Файли
- Перший
- після
- для
- Примусово
- іноземні
- формальний
- Формально
- формат
- Вперед
- заснування
- від
- Повний
- далі
- майбутнє
- покоління
- generator
- отримати
- дає
- Go
- Цілі
- Уряду
- GPU
- великий
- Земля
- Group
- апаратні засоби
- Мати
- he
- допомога
- допомагає
- її
- тут
- Високий
- основний момент
- його
- відбувся
- Як
- How To
- Однак
- HTML
- HTTP
- HTTPS
- HuggingFace
- людина
- права людини
- Людство
- ID
- ідентифікатори
- if
- Іллінойс
- зображення
- негайно
- реалізації
- імпорт
- удосконалювати
- in
- включати
- У тому числі
- Augmenter
- незалежність
- індивідуальний
- Індивідуально
- інформація
- Інфраструктура
- початковий
- несправедливість
- вхід
- витрати
- запит
- екземпляр
- замість
- Інститут
- Міжнародне покриття
- інтерпретація
- в
- дослідити
- дослідження
- Дослідження
- Ізраїль
- IT
- ЙОГО
- січня
- робота
- приєднатися
- приєднання
- JPG
- json
- суддя
- червень
- юрисдикція
- просто
- юстиція
- ключ
- Знати
- посадка
- мова
- великий
- останній
- Затримка
- пізніше
- запуски
- вивчення
- залишити
- дозволяти
- злегка
- як
- Сподобалося
- Лінія
- ліній
- пов'язаний
- Зв'язуючий
- список
- Прослуховування
- загрузка
- Довго
- довше
- низький
- машина
- навчання за допомогою машини
- зробити
- Робить
- управляє
- манера
- багато
- позначено
- відповідає
- узгодження
- математичний
- Може..
- засоби
- член
- члени
- членство
- пам'ять
- метод
- Метрика
- мінімізація
- ML
- режим
- модель
- Моделі
- місяць
- більше
- рухатися
- музика
- повинен
- ім'я
- Природний
- Обробка природних мов
- необхідно
- Необхідність
- переговори
- ні
- Нідерланди
- мережа
- Нові
- новини
- повідомлення для друку
- ноутбук
- зараз
- об'єкт
- отримання
- of
- Office
- Офіційно
- on
- ONE
- тільки
- відкрити
- з відкритим вихідним кодом
- відкритий
- виступати проти
- протистояли
- or
- оригінал
- OS
- наші
- з
- вихід
- над
- пакет
- сторінка
- Палестина
- документи
- параметр
- параметри
- частина
- партія
- проходити
- шлях
- Мощення
- світ
- Люди
- Виконувати
- Дозволи
- plato
- Інформація про дані Платона
- PlatoData
- будь ласка
- точка
- це можливо
- пошта
- передбачати
- передвіщений
- прогноз
- Прогнози
- Прогноз
- переважним
- Готувати
- підготовлений
- передумови
- президент
- тиск
- Prime
- прем'єр-міністр
- Головний
- Проблема
- проблеми
- процес
- процеси
- обробка
- Вироблений
- процвітання
- забезпечувати
- за умови
- забезпечує
- забезпечення
- опублікований
- цілей
- Python
- діапазон
- готовий
- реальний
- реального часу
- запис
- облік
- посилання
- відноситься
- звільнити
- Вилучено
- ПОВТОРНО
- звітом
- запросити
- запитів
- вимагати
- вимагається
- Вимога
- дослідник
- ресурси
- відповідь
- відповіді
- обов'язки
- відповідальний
- результат
- результати
- повертати
- Умови повернення
- огляд
- праві
- Роль
- Рим
- ROW
- прогін
- s
- мудрець
- Висновок SageMaker
- Зазначений
- то ж
- приказка
- сценарії
- НАУКИ
- вчений
- рахунок
- Sdk
- побачити
- пошук
- обраний
- послати
- старший
- Серія
- Послуги
- комплект
- установка
- установка
- загальні
- вона
- Повинен
- Показувати
- демонстрації
- Шоу
- Сторони
- підписаний
- Аналогічно
- простий
- з
- ситуація
- ситуацій
- Розмір
- невеликий
- So
- соціальна
- суспільство
- Софтвер
- рішення
- Рішення
- деякі
- говорити
- розмова
- Витрати
- старт
- почалася
- стан
- Державний департамент
- впроваджений
- Заява
- Штати
- статистичний
- Крок
- заходи
- Як і раніше
- зупинений
- зберігання
- зберігати
- зберігати
- просто
- Стратегічний
- потік
- потоковий
- сильно
- тема
- підсумовувати
- РЕЗЮМЕ
- літо
- підтримка
- Приймати
- прийняті
- приймає
- Завдання
- завдання
- технології
- Шаблони
- території
- територія
- тест
- ніж
- Що
- Команда
- інформація
- Нідерланди
- Держава
- світ
- їх
- Їх
- потім
- отже
- Ці
- вони
- це
- ті
- через
- пропускна здатність
- час
- Часовий ряд
- до
- сьогодні
- разом
- розірваний
- до
- поїзд
- Перетворення
- трансформатор
- перетворення
- Переклад
- правда
- Правда
- тип
- Типи
- підривати
- United
- Сполучені Штати
- Universal
- університет
- на відміну від
- Завантаження
- на
- us
- використання
- використовуваний
- використання
- Віцепрезидент
- бачення
- Обсяги
- W
- хотіти
- війна
- було
- годинник
- шлях..
- we
- Web
- веб-сервіси
- середа
- ласкаво просимо
- вітав
- ДОБРЕ
- Що
- коли
- Чи
- який
- в той час як
- ВООЗ
- широкий
- Широкий діапазон
- волі
- з
- в
- без
- робочий
- світ
- б
- Ти
- вашу
- зефірнет