Сегодня мы рады сообщить, что теперь вы можете выполнять пакетные преобразования с помощью Amazon SageMaker JumpStart большие языковые модели (LLM) для Text2Text Generation. Пакетные преобразования полезны в ситуациях, когда ответы не должны быть в режиме реального времени, и поэтому вы можете делать логические выводы в пакетном режиме для больших наборов данных. Для пакетного преобразования запускается пакетное задание, которое принимает пакетный ввод в виде набора данных и предварительно обученной модели и выводит прогнозы для каждой точки данных в наборе данных. Пакетное преобразование рентабельно, поскольку в отличие от размещенных в реальном времени конечных точек, которые имеют постоянное оборудование, кластеры пакетного преобразования отключаются после завершения задания, и поэтому оборудование используется только на время выполнения пакетного задания.
В некоторых случаях запросы на логические выводы в реальном времени могут быть сгруппированы в небольшие пакеты для пакетной обработки для создания ответов в реальном или близком к реальному времени. Например, если вам нужно обрабатывать непрерывный поток данных с малой задержкой и высокой пропускной способностью, вызов конечной точки в реальном времени для каждого запроса отдельно потребует больше ресурсов и может занять больше времени для обработки всех запросов, поскольку обработка выполняется последовательно. . Лучшим подходом было бы сгруппировать некоторые запросы и вызвать конечную точку в режиме реального времени в режиме пакетного вывода, который обрабатывает ваши запросы за один прямой проход модели и возвращает массовый ответ на запрос в реальном времени или почти в реальном времени. . Задержка ответа будет зависеть от того, сколько запросов вы группируете вместе, и от размера памяти экземпляра, поэтому вы можете настроить размер пакета в соответствии с вашими бизнес-требованиями к задержке и пропускной способности. Мы называем это пакетный вывод в реальном времени потому что он сочетает в себе концепцию пакетной обработки, но при этом обеспечивает ответы в реальном времени. Благодаря пакетному выводу в реальном времени вы можете достичь баланса между малой задержкой и высокой пропускной способностью, что позволяет обрабатывать большие объемы данных своевременно и эффективно.
Пакетное преобразование Jumpstart для моделей Text2Text Generation позволяет передавать гиперпараметры пакета через переменные среды, что еще больше увеличивает пропускную способность и минимизирует задержку.
JumpStart предоставляет предварительно обученные модели с открытым исходным кодом для широкого спектра типов задач, которые помогут вам начать работу с машинным обучением (ML). Вы можете постепенно обучать и настраивать эти модели перед развертыванием. JumpStart также предоставляет шаблоны решений, которые настраивают инфраструктуру для распространенных случаев использования, и исполняемые примеры блокнотов для машинного обучения с Создатель мудреца Амазонки. Вы можете получить доступ к предварительно обученным моделям, шаблонам решений и примерам через целевую страницу JumpStart в Студия Amazon SageMaker. Вы также можете получить доступ к моделям JumpStart с помощью SageMaker Python SDK.
В этом посте мы покажем, как использовать современный предварительно обученный text2text Модели FLAN T5 от Hugging Face для пакетного преобразования и пакетного вывода в реальном времени.
Обзор решения
Блокнот, показывающий пакетное преобразование предварительно обученных моделей Text2Text FLAN T5 из Обнимая лицо в наличии в следующем Репозиторий GitHub. В этом блокноте используются данные Hugging Face. cnn_dailymail набор данных для задачи суммирования текста с помощью SageMaker SDK.
Ниже приведены ключевые шаги для реализации пакетного преобразования и пакетного вывода в реальном времени.
- Настройте предварительные условия.
- Выберите предварительно обученную модель.
- Получить артефакты для модели.
- Укажите гиперпараметры задания пакетного преобразования.
- Подготовьте данные для пакетного преобразования.
- Запустите задание пакетного преобразования.
- Оцените обобщение, используя RED (Ориентированный на припоминание дублер для оценки Gisting) оценка.
- Выполнение пакетного вывода в реальном времени.
Настроить предварительные условия
Прежде чем запускать блокнот, необходимо выполнить некоторые начальные шаги по настройке. Давайте настроим роль исполнения SageMaker, чтобы у нее были разрешения на запуск сервисов AWS от вашего имени:
Выберите предварительно обученную модель
Мы используем модель Huggingface-text2text-flan-t5-large в качестве модели по умолчанию. При желании вы можете получить список доступных моделей Text2Text на JumpStart и выбрать предпочтительную модель. Этот метод обеспечивает простой способ выбора разных идентификаторов моделей с использованием одного и того же блокнота. В демонстрационных целях мы используем модель Huggingface-text2text-flan-t5-large:
Получить артефакты для модели
С помощью SageMaker мы можем выполнять логические выводы на предварительно обученной модели, даже без ее предварительной точной настройки на новом наборе данных. Начнем с извлечения deploy_image_uri
, deploy_source_uri
и model_uri
для предварительно обученной модели:
Укажите гиперпараметры задания пакетного преобразования
Вы можете передать любое подмножество гиперпараметров в качестве переменных среды для задания пакетного преобразования. Вы также можете передать эти гиперпараметры в полезной нагрузке JSON. Однако если вы устанавливаете переменные среды для гиперпараметров, как показано в следующем коде, расширенные гиперпараметры из отдельных примеров в полезных данных строк JSON использоваться не будут. Если вы хотите использовать гиперпараметры из полезной нагрузки, вы можете установить hyper_params_dict
параметр как нулевой вместо этого.
Подготовьте данные для пакетного преобразования
Теперь мы готовы загрузить cnn_dailymail набор данных от Hugging Face:
Мы просматриваем каждую запись данных и формируем входные данные в нужном формате. Мы создаем articles.jsonl
файл в качестве тестового файла данных, содержащего статьи, которые необходимо обобщить как входную полезную нагрузку. Когда мы создаем этот файл, мы добавляем подсказку "Briefly summarize this text:"
для каждой тестовой входной строки. Если вы хотите иметь разные гиперпараметры для каждого тестового входа, вы можете добавить эти гиперпараметры как часть создания набора данных.
Мы создаем highlights.jsonl
в качестве основного файла, содержащего основные моменты каждой статьи, хранящейся в тестовом файле. articles.jsonl
. Мы храним оба тестовых файла в Простой сервис хранения Amazon (Amazon S3) ведро. См. следующий код:
Запустите задание пакетного преобразования
Когда вы запускаете задание пакетного преобразования, SageMaker запускает необходимые вычислительные ресурсы для обработки данных, включая экземпляры CPU или GPU в зависимости от выбранного типа экземпляра. Во время задания пакетного преобразования SageMaker автоматически выделяет и управляет вычислительными ресурсами, необходимыми для обработки данных, включая экземпляры, хранилище и сетевые ресурсы. Когда задание пакетного преобразования завершено, SageMaker автоматически очищает вычислительные ресурсы. Это означает, что экземпляры и хранилище, используемые во время задания, останавливаются и удаляются, высвобождая ресурсы и сводя к минимуму затраты. См. следующий код:
Ниже приведен пример записи из articles.jsonl
тестовый файл. Обратите внимание, что запись в этом файле имеет идентификатор, совпадающий с predict.jsonl
файловые записи, которые отображают итоговую запись в качестве выходных данных модели Hugging Face Text2Text. Точно так же файл наземных данных также имеет соответствующий идентификатор для записи данных. Совпадающий идентификатор в тестовом файле, наземном файле и выходном файле позволяет связать входные записи с выходными записями для упрощения интерпретации результатов.
Ниже приведен пример входной записи, предоставленной для обобщения:
Ниже приведен прогнозируемый результат с суммированием:
Ниже приводится обобщение истинности для целей оценки модели:
Затем мы используем наземную правду и прогнозируемые результаты для оценки модели.
Оцените модель, используя оценку ROUGE¶
RED, или Recall-Oriented Understudy for Gisting Evaluation, представляет собой набор показателей и программный пакет, используемый для оценки автоматического суммирования и машинного перевода при обработке естественного языка. Метрики сравнивают автоматически созданное резюме или перевод с эталонным (составленным человеком) резюме или переводом или набором ссылок.
В следующем коде мы объединяем прогнозируемое и исходное резюме, соединяя их по общему ключу. id
и используйте это для вычисления оценки ROUGE:
Выполнение пакетного вывода в реальном времени
Далее мы покажем вам, как выполнять пакетный вывод в реальном времени на конечной точке, предоставляя входные данные в виде списка. Мы используем тот же идентификатор модели и набор данных, что и ранее, за исключением того, что мы берем несколько записей из тестового набора данных и используем их для вызова конечной точки в реальном времени.
В следующем коде показано, как создать и развернуть конечную точку в реальном времени для пакетного вывода в реальном времени.
Далее мы подготавливаем нашу входную полезную нагрузку. Для этого мы используем данные, которые мы подготовили ранее, извлекаем первые 10 тестовых входных данных и добавляем текстовые входные данные с гиперпараметрами, которые мы хотим использовать. Мы предоставляем эту полезную нагрузку в режиме реального времени invoke_endpoint
. Затем полезная нагрузка ответа возвращается в виде списка ответов. См. следующий код:
Убирать
После того как вы протестировали конечную точку, убедитесь, что вы удалили конечную точку вывода SageMaker и удалили модель, чтобы избежать взимания платы.
Заключение
В этой записной книжке мы выполнили пакетное преобразование, чтобы продемонстрировать модель Hugging Face Text2Text Generator для задач суммирования. Пакетное преобразование полезно для получения выводов из больших наборов данных, не требуя постоянной конечной точки. Мы связали входные записи с выводами, чтобы облегчить интерпретацию результатов. Мы использовали оценку ROUGE для сравнения суммирования тестовых данных с суммированием, сгенерированным моделью.
Кроме того, мы продемонстрировали пакетный вывод в реальном времени, когда вы можете отправить небольшой пакет данных на конечную точку в реальном времени, чтобы достичь баланса между задержкой и пропускной способностью для таких сценариев, как потоковая передача входных данных. Пакетный вывод в реальном времени помогает увеличить пропускную способность для запросов в реальном времени.
Попробуйте пакетное преобразование с моделями Text2Text Generation в SageMaker сегодня и сообщите нам свои отзывы!
Об авторах
Хемант Сингх — инженер по машинному обучению с опытом работы со встроенными алгоритмами Amazon SageMaker JumpStart и Amazon SageMaker. Он получил степень магистра в Институте математических наук Куранта и степень бакалавра технических наук в ИИТ Дели. У него есть опыт работы над широким спектром задач машинного обучения в области обработки естественного языка, компьютерного зрения и анализа временных рядов.
Рахна Чадха является главным архитектором решений AI/ML в области стратегических счетов в AWS. Рахна — оптимистка, считающая, что этичное и ответственное использование ИИ может улучшить общество в будущем и принести экономическое и социальное процветание. В свободное время Рахна любит проводить время со своей семьей, ходить в походы и слушать музыку.
Доктор Ашиш Хетан — старший научный сотрудник, работающий со встроенными алгоритмами Amazon SageMaker и помогающий разрабатывать алгоритмы машинного обучения. Он получил докторскую степень в Университете Иллинойса в Урбана-Шампейн. Он является активным исследователем в области машинного обучения и статистических выводов и опубликовал множество статей на конференциях NeurIPS, ICML, ICLR, JMLR, ACL и EMNLP.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
- Чеканка будущего с Эдриенн Эшли. Доступ здесь.
- Покупайте и продавайте акции компаний PREIPO® с помощью PREIPO®. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/perform-batch-transforms-with-amazon-sagemaker-jumpstart-text2text-generation-large-language-models/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 1
- 10
- 100
- 11
- 13
- 14
- 20
- 2014
- 50
- 7
- 8
- 9
- a
- в состоянии
- О нас
- выше
- принятие
- принятый
- доступ
- По
- Учетные записи
- Достигать
- Приобретает
- через
- действия
- активный
- продвинутый
- выгодный
- против
- AI
- AI / ML
- помощь
- алгоритмы
- Все
- утверждаемый
- позволяет
- причислены
- Amazon
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- анализ
- и
- анонсировать
- любой
- API
- прикладной
- подхода
- МЫ
- около
- гайд
- статьи
- AS
- At
- попытки
- власть
- Автоматический
- автоматически
- доступен
- избежать
- AWS
- Баланс
- Использование темпера с изогнутым основанием
- основанный
- BE
- стали
- , так как:
- становится
- до
- не являетесь
- верить
- считает,
- Вениамин
- Лучшая
- между
- тело
- изоферменты печени
- Обе стороны
- Границы
- кратко
- приносить
- Приносит
- встроенный
- бизнес
- но
- by
- призывают
- CAN
- не могу
- случаев
- Вызывать
- расходы
- Выберите
- класс
- клиент
- ближе
- CNN
- код
- объединять
- комбинаты
- комбинируя
- как
- обязательств
- привержен
- Общий
- сравнить
- полный
- Вычисление
- компьютер
- Компьютерное зрение
- сама концепция
- Проводить
- конференции
- Container
- продолжать
- (CIJ)
- способствовало
- Цена
- рентабельным
- может
- адвокат
- контрпродуктивно
- страны
- корт
- Создайте
- Создающий
- преступления
- Криминальное
- данным
- ввод данных
- Наборы данных
- мертвый
- решение
- По умолчанию
- Дели
- демонстрировать
- убивают
- Кафедра
- в зависимости
- развертывание
- развертывание
- описано
- Определять
- развивать
- Развитие
- отличаться
- Различия
- различный
- направлять
- Разное
- do
- Docker
- домен
- сделанный
- Dont
- Двери
- вниз
- продолжительность
- в течение
- каждый
- Ранее
- восток
- легко
- Экономические
- эффективный
- усилия
- право
- позволяет
- конец
- Конечная точка
- инженер
- обеспечивать
- Вводит
- запись
- Окружающая среда
- Эпоха
- этический
- оценивать
- оценки
- оценка
- Даже
- , поскольку большинство сенаторов
- пример
- Примеры
- Кроме
- возбужденный
- выполнение
- опыт
- извлечение
- Face
- вера
- семья
- несколько
- Файл
- Файлы
- Во-первых,
- после
- Что касается
- Форс-мажор
- иностранный
- формальный
- Формально
- формат
- вперед
- учредительный
- от
- полный
- далее
- будущее
- поколение
- генератор
- получить
- дает
- Go
- Цели
- Правительства
- GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР
- большой
- земля
- группы
- Аппаратные средства
- Есть
- he
- помощь
- помогает
- ее
- здесь
- High
- основной момент
- его
- состоялся
- Как
- How To
- Однако
- HTML
- HTTP
- HTTPS
- ОбниматьЛицо
- человек
- права человека
- Человечество
- ID
- идентификаторы
- if
- Иллинойс
- изображение
- немедленно
- Осуществляющий
- Импортировать
- улучшать
- in
- включают
- В том числе
- Увеличение
- независимость
- individual
- в отдельности
- информация
- Инфраструктура
- начальный
- несправедливость
- вход
- затраты
- запрос
- пример
- вместо
- Институт
- Мультиязычность
- интерпретация
- в
- исследовать
- ходе расследования,
- Исследования
- Израиль
- IT
- ЕГО
- январь
- работа
- присоединиться
- присоединение
- JPG
- JSON
- судья
- июнь
- юрисдикция
- всего
- Юстиция
- Основные
- Знать
- посадка
- язык
- большой
- Фамилия
- Задержка
- новее
- запускает
- изучение
- оставил
- позволять
- слегка
- такое как
- нравится
- линия
- линий
- связанный
- связывающий
- Список
- Listening
- загрузка
- Длинное
- дольше
- Низкий
- машина
- обучение с помощью машины
- сделать
- Создание
- управляет
- способ
- многих
- с пометкой
- соответствует
- согласование
- математический
- Май..
- означает
- член
- Участники
- членство
- Память
- метод
- Метрика
- минимизация
- ML
- режим
- модель
- Модели
- Месяц
- БОЛЕЕ
- двигаться
- Музыка
- должен
- имя
- натуральный
- Обработка естественного языка
- необходимо
- Необходимость
- переговоры
- ни
- Нидерланды
- сетей
- Новые
- Новости
- выпуск новостей
- ноутбук
- сейчас
- объект
- получение
- of
- Офис
- Официально
- on
- ONE
- только
- открытый
- с открытым исходным кодом
- открытый
- оппонировать
- против
- or
- оригинал
- OS
- наши
- внешний
- выходной
- за
- пакет
- страница
- Палестина
- бумага
- параметр
- параметры
- часть
- вечеринка
- pass
- путь
- Мощение
- мир
- Люди
- Выполнять
- Разрешения
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- пожалуйста
- Точка
- возможное
- После
- предсказывать
- предсказанный
- прогноз
- Predictions
- Predictor
- привилегированный
- Подготовить
- подготовленный
- предпосылки
- президент
- давление
- Простое число
- Премьер-министр
- Основной
- Проблема
- проблемам
- процесс
- Процессы
- обработка
- Произведенный
- процветание
- обеспечивать
- при условии
- приводит
- обеспечение
- опубликованный
- целей
- Питон
- ассортимент
- готовый
- реальные
- реального времени
- запись
- учет
- Рекомендации
- понимается
- освободить
- удален
- НЕОДНОКРАТНО
- отчету
- запросить
- Запросы
- требовать
- обязательный
- Требования
- исследователь
- Полезные ресурсы
- ответ
- ответы
- ответственности
- ответственный
- результат
- Итоги
- возвращают
- Возвращает
- обзоре
- правые
- Роли
- Рим
- РЯД
- Run
- s
- sagemaker
- Вывод SageMaker
- Сказал
- то же
- поговорка
- Сценарии
- НАУКА
- Ученый
- Гол
- SDK
- посмотреть
- поиск
- выбранный
- Отправить
- старший
- Серии
- Услуги
- набор
- установка
- установка
- общие
- она
- должен
- показывать
- демонстрации
- Шоу
- Стороны
- подписанный
- Аналогичным образом
- просто
- с
- ситуация
- обстоятельства
- Размер
- небольшой
- So
- Соцсети
- Общество
- Software
- Решение
- Решения
- некоторые
- говорить
- Говоря
- Расходы
- Начало
- и политические лидеры
- Область
- Государственный департамент
- современное состояние
- заявление
- Области
- статистический
- Шаг
- Шаги
- По-прежнему
- остановившийся
- диск
- магазин
- хранить
- простой
- Стратегический
- поток
- потоковый
- сильно
- предмет
- суммировать
- РЕЗЮМЕ
- лето
- поддержка
- взять
- приняты
- принимает
- Сложность задачи
- задачи
- технологии
- шаблоны
- территорий
- территория
- тестXNUMX
- чем
- который
- Ассоциация
- информация
- Нидерланды
- Государство
- мир
- их
- Их
- тогда
- следовательно
- Эти
- они
- этой
- те
- Через
- пропускная способность
- время
- Временные ряды
- в
- сегодня
- вместе
- порванный
- к
- Train
- Transform
- трансформатор
- прообразы
- Переводы
- правда
- Правда
- напишите
- Типы
- подрывать
- Объединенный
- США
- Universal
- Университет
- В отличие от
- Загрузка
- на
- us
- использование
- используемый
- через
- вице-президент
- видение
- тома
- W
- хотеть
- войны
- законопроект
- Смотреть
- Путь..
- we
- Web
- веб-сервисы
- Wednesday
- добро пожаловать
- приветствовал
- ЧТО Ж
- Что
- когда
- будь то
- который
- в то время как
- КТО
- широкий
- Широкий диапазон
- будете
- в
- без
- работает
- Мир
- бы
- Ты
- ВАШЕ
- зефирнет