Сегодня мы рады сообщить, что модели фундамента Meta Llama 3 доступны через Amazon SageMaker JumpStart для развертывания и выполнения вывода. Модели Llama 3 представляют собой набор предварительно обученных и точно настроенных моделей генеративного текста.
В этом посте мы расскажем, как обнаружить и развернуть модели Llama 3 с помощью SageMaker JumpStart.
Что такое Мета Лама 3
Llama 3 поставляется с двумя размерами параметров — 8 байт и 70 байт с длиной контекста 8 КБ — которые могут поддерживать широкий спектр вариантов использования с улучшениями в рассуждениях, генерации кода и следовании инструкциям. Llama 3 использует архитектуру преобразователя только для декодера и новый токенизатор, который обеспечивает улучшенную производительность модели с размером 128 КБ. Кроме того, Meta улучшила процедуры после обучения, что существенно снизило процент ложных отказов, улучшило согласованность и увеличило разнообразие ответов модели. Теперь вы можете получить совокупные преимущества производительности Llama 3 и элементов управления MLOps с помощью таких функций Amazon SageMaker, как SageMaker Pipelines, SageMaker Debugger или журналы контейнеров. Кроме того, модель будет развернута в безопасной среде AWS под контролем вашего VPC, что поможет обеспечить безопасность данных.
Что такое SageMaker JumpStart
С помощью SageMaker JumpStart вы можете выбирать из широкого выбора общедоступных моделей фундаментов. Специалисты по машинному обучению могут развертывать базовые модели в выделенных экземплярах SageMaker из сетевой изолированной среды и настраивать модели с помощью SageMaker для обучения и развертывания моделей. Теперь вы можете обнаружить и развернуть модели Llama 3 несколькими щелчками мыши. Студия Amazon SageMaker или программно с помощью SageMaker Python SDK, что позволяет получить производительность модели и элементы управления MLOps с помощью функций SageMaker, таких как Конвейеры SageMaker, Отладчик SageMakerили журналы контейнера. Модель развертывается в безопасной среде AWS и под контролем вашего VPC, что помогает обеспечить безопасность данных. Модели Llama 3 уже доступны для развертывания и анализа в Amazon SageMaker Studio в us-east-1
(Северная Вирджиния), us-east-2
(Огайо), us-west-2
(Орегон), eu-west-1
(Ирландия) и ap-northeast-1
(Токио) Регионы AWS.
Откройте для себя модели
Вы можете получить доступ к базовым моделям через SageMaker JumpStart в пользовательском интерфейсе SageMaker Studio и SageMaker Python SDK. В этом разделе мы рассмотрим, как обнаруживать модели в SageMaker Studio.
SageMaker Studio — это интегрированная среда разработки (IDE), которая предоставляет единый визуальный веб-интерфейс, где вы можете получить доступ к специально созданным инструментам для выполнения всех этапов разработки машинного обучения, от подготовки данных до создания, обучения и развертывания моделей машинного обучения. Дополнительные сведения о том, как начать работу и настроить SageMaker Studio, см. Студия Amazon SageMaker.
В SageMaker Studio вы можете получить доступ к SageMaker JumpStart, который содержит предварительно обученные модели, блокноты и готовые решения, в разделе Готовые и автоматизированные решения.
На целевой странице SageMaker JumpStart вы можете легко найти различные модели, просматривая различные хабы, названные в честь поставщиков моделей. Вы можете найти модели Llama 3 в мета-хабе. Если вы не видите модели Llama 3, обновите версию SageMaker Studio, выключив и перезапустив ее. Для получения дополнительной информации см. Завершите работу и обновите приложения Studio Classic..
Вы можете найти модели Llama 3, выполнив поиск «Meta-llama-3» в поле поиска, расположенном вверху слева.
Вы можете найти все мета-модели, доступные в SageMaker JumpStart, нажав «Мета-хаб».
При нажатии на карточку модели открывается страница сведений о соответствующей модели, на которой можно легко развернуть модель.
Развернуть модель
Когда вы выбираете Развертывание и примите условия лицензионного соглашения, развертывание начнется.
Вы можете отслеживать ход развертывания на странице, которая появляется после нажатия кнопки «Развернуть».
В качестве альтернативы вы можете выбрать Открыть блокнот для развертывания с помощью примера записной книжки. В примере записной книжки представлены комплексные инструкции по развертыванию модели для вывода и очистки ресурсов.
Развертывание с использованием записной книжки начинается с выбора соответствующей модели, указанной в model_id
. Вы можете развернуть любую из выбранных моделей в SageMaker с помощью следующего кода.
По умолчанию accept_eula
на False
. Для успешного развертывания конечной точки вам необходимо вручную принять лицензионное соглашение. Поступая так, вы принимаете пользовательское лицензионное соглашение и политику допустимого использования. Вы также можете найти лицензионное соглашение Сайт ламы. При этом модель развертывается в SageMaker с конфигурациями по умолчанию, включая тип экземпляра по умолчанию и конфигурации VPC по умолчанию. Вы можете изменить эту конфигурацию, указав значения, отличные от значений по умолчанию, в JumpStartModel
. Чтобы узнать больше, пожалуйста, обратитесь к следующему документации.
В следующей таблице перечислены все модели Llama 3, доступные в SageMaker JumpStart, а также model_ids
, типы экземпляров по умолчанию и максимальное общее количество токенов (сумма количества входных токенов и количества сгенерированных токенов), поддерживаемых для каждой из этих моделей.
Название модели | Модель ID | Максимальное количество токенов | Тип экземпляра по умолчанию |
Мета-Лама-3-8Б | мета-текстгенерация-лама-3-8B | 8192 | мл.g5.12xбольшой |
Мета-Лама-3-8B-Инструктировать | мета-текстовая генерация-лама-3-8B-инструкция | 8192 | мл.g5.12xбольшой |
Мета-Лама-3-70Б | метатекстгенерация-лама-3-70b | 8192 | мл.p4d.24xlarge |
Мета-Лама-3-70B-Инструктировать | метатекстгенерация-лама-3-70b-инструкт | 8192 | мл.p4d.24xlarge |
Запустить вывод
После развертывания модели вы можете выполнить логический вывод для развернутой конечной точки с помощью предиктора SageMaker. Точно настроенные модели инструкций (Llama 3: 8B Instruct и 70B Instruct) принимают историю чатов между пользователем и чат-помощником и генерируют последующий чат. Предварительно обученные модели (Llama 3: 8B и 70B) требуют строкового запроса и выполняют заполнение текста в предоставленном запросе.
Параметры вывода управляют процессом генерации текста в конечной точке. Новые токены Max контролируют размер выходных данных, генерируемых моделью. Это не то же самое, что количество слов, поскольку словарный запас модели не совпадает со словарным запасом английского языка, и каждый токен не может быть словом английского языка. Параметр температуры управляет случайностью выходных данных. Более высокая температура приводит к более творческим и галлюцинирующим результатам. Все параметры вывода являются необязательными.
Примеры запросов для модели 70B
Вы можете использовать модели Llama 3 для завершения текста для любого фрагмента текста. С помощью генерации текста вы можете выполнять различные задачи, такие как ответы на вопросы, языковой перевод, анализ настроений и многое другое. Входные полезные данные для конечной точки выглядят следующим образом:
Ниже приведены некоторые примеры подсказок и текст, сгенерированный моделью. Все выходные данные генерируются с параметрами вывода {"max_new_tokens":64, "top_p":0.9, "temperature":0.6}
.
В следующем примере мы покажем, как использовать модели Llama 3 с небольшим количеством кадров контекстного обучения, где мы предоставляем обучающие выборки, доступные для модели. Мы выполняем вывод только на развернутой модели, и во время этого процесса веса модели не меняются.
Примеры запросов для модели 70B-Instruct
В моделях инструкций Llama 3, оптимизированных для сценариев использования диалога, входными данными для конечных точек модели инструкций является предыдущая история между чат-помощником и пользователем. Вы можете задавать вопросы, связанные с разговором, который произошел на данный момент. Вы также можете указать конфигурацию системы, например персонажей, которые определяют поведение чат-помощника. Хотя формат входных полезных данных такой же, как у базовой предварительно обученной модели, входной текст должен быть отформатирован следующим образом:
В этом шаблоне инструкций вы можете начать с system
роли и включать в пошаговую историю столько чередующихся ролей, сколько необходимо. Последняя роль всегда должна быть assistant
и закончиться двумя новыми переводами строк.
Далее рассмотрим несколько примеров подсказок и ответов модели. В следующем примере пользователь задает простой вопрос ассистенту.
В следующем примере пользователь беседует с ассистентом о туристических объектах Парижа. Затем пользователь спрашивает о первом варианте, рекомендованном чат-ассистентом.
В следующих примерах мы устанавливаем конфигурацию системы.
Убирать
После завершения работы с блокнотом обязательно удалите все ресурсы, созданные вами в процессе, чтобы прекратить выставление счетов. Используйте следующий код:
Заключение
В этом посте мы показали вам, как начать работу с моделями Llama 3 в SageMaker Studio. Теперь у вас есть доступ к четырем моделям фундаментов Llama 3, которые содержат миллиарды параметров. Поскольку базовые модели предварительно обучены, они также могут помочь снизить затраты на обучение и инфраструктуру, а также обеспечить настройку для вашего варианта использования. Проверить SageMaker JumpStart в SageMaker Studio прямо сейчас, чтобы начать работу.
Об авторах
Кайл Ульрих является прикладным ученым II в AWS.
Синь Хуан — старший научный сотрудник AWS
Цин Лан — старший инженер-разработчик программного обеспечения в AWS.
Хаотянь Ан — инженер-разработчик программного обеспечения II уровня в AWS.
Кристофер Уиттен — инженер-разработчик программного обеспечения II уровня в AWS.
Тайлер Остерберг — инженер-разработчик программного обеспечения I в AWS
Манан Шах — менеджер по разработке программного обеспечения в AWS
Джонатан Гинеган — старший инженер-разработчик программного обеспечения в AWS.
Адриана Симмонс — старший менеджер по маркетингу продуктов в AWS.
июнь выиграл — старший менеджер по продукту в AWS
Ашиш Хетан — старший научный сотрудник AWS
Рахна Чадха является главным архитектором решений по искусственному интеллекту и машинному обучению в AWS.
Дипак Рупакула является главным специалистом по GTM в AWS.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/meta-llama-3-models-are-now-available-in-amazon-sagemaker-jumpstart/
- :имеет
- :является
- :нет
- :куда
- $UP
- 1
- 10
- 11
- 120
- 19
- 360 степени
- 43
- 7
- 8
- 8k
- 9
- a
- О нас
- Принять
- приемлемый
- доступ
- доступной
- признавать
- Добавить
- добавленный
- дополнение
- Преимущества
- После
- снова
- против
- ДОГОВОР
- AI / ML
- выравнивание
- Все
- вдоль
- причислены
- всегда
- am
- Amazon
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Студия Amazon SageMaker
- Amazon Web Services
- обстановка
- an
- анализ
- и
- и инфраструктура
- анонсировать
- ответ
- ответ
- любой
- Apple
- прикладной
- соответствующий
- архитектура
- МЫ
- Искусство
- AS
- спросить
- спрашивающий
- помощник
- связанный
- At
- Атмосфера
- привлечение
- достопримечательности
- Автоматизированный
- доступен
- избежать
- AWS
- Использование темпера с изогнутым основанием
- BE
- медведь
- красивая
- , так как:
- было
- поведение
- Beijing
- верить
- между
- биллинг
- миллиарды
- Коробка
- брейки
- захватывающий
- широкий
- Сломанный
- просмотр
- Строительство
- построенный
- но
- кнопка
- by
- Объявления
- CAN
- столица
- карта
- случаев
- случаев
- изменение
- чат
- коты
- проверка
- Выберите
- Город
- классический
- чистым
- код
- лыжных шлемов
- сочетание
- сочетании
- выходит
- Связь
- завершение
- Конфигурация
- Рассматривать
- постоянная
- содержать
- Container
- содержит
- контекст
- контекстной
- непрерывно
- контроль
- контрольная
- Удобно
- Разговор
- соответствующий
- Расходы
- Создайте
- создали
- творческий
- решающее значение
- Культура
- чашка
- Клиенты
- настройка
- настроить
- данным
- безопасность данных
- de
- преданный
- По умолчанию
- определять
- развертывание
- развернуть
- развертывание
- развертывание
- развертывает
- выводить
- желанный
- направления
- подробность
- подробнее
- Застройщик
- Развитие
- Диалог
- разница
- различный
- обеды
- обнаружить
- Разнообразие
- do
- Безразлично
- дело
- Дон
- сделанный
- удвоенны
- вниз
- в течение
- Сумерки
- e
- каждый
- легко
- усилия
- включить
- позволяет
- конец
- впритык
- Конечная точка
- инженер
- Проект и
- Английский
- достаточно
- обеспечение
- Окружающая среда
- Даже
- Каждая
- все члены
- пример
- Примеры
- возбужденный
- опыт
- ярмарка
- ложный
- знаменитый
- далеко
- подвиг
- СПЕЦЦЕНА
- Особенности
- Футов
- несколько
- пленки
- окончательный
- Найдите
- First
- вкус
- Поплавок
- поток
- после
- Фут
- Что касается
- формат
- Год основания
- 4
- Франция
- Французский
- свежий
- от
- Общие
- Общая теория относительности
- порождать
- генерируется
- поколение
- генеративный
- слегка
- Немецкий
- получить
- стекло
- Go
- будет
- постепенно
- большой
- новаторским
- руководство
- управляемый
- происходить
- произошло
- Жесткий
- тяжелая работа
- Есть
- здоровый
- помощь
- помощь
- здесь
- высший
- исторический
- история
- держать
- Главная
- час
- жилье
- Как
- How To
- HTML
- HTTPS
- хаб
- концентраторы
- i
- знаковых
- if
- ii
- Импортировать
- впечатляющий
- улучшенный
- улучшение
- in
- включают
- В том числе
- Увеличение
- расширились
- повышение
- информация
- Инфраструктура
- вход
- пример
- немедленно
- интегрированный
- Интерфейс
- в
- Ирландия
- изолированный
- IT
- ЕГО
- JPG
- всего
- Сохранить
- Знать
- известный
- посадка
- ориентиры
- язык
- крупнейших
- запуск
- Законодательство
- УЧИТЬСЯ
- изучение
- оставил
- Длина
- Лицензия
- ЖИЗНЬЮ
- Отменено
- легкий
- более легкий
- такое как
- линия
- Списки
- литература
- мало
- жить
- Живет
- Лама
- расположенный
- ВЗГЛЯДЫ
- серия
- ниже
- сделанный
- сделать
- Создание
- менеджер
- способ
- вручную
- многих
- Маркетинг
- Макс
- максимальный
- Май..
- смысл
- сообщение
- Мета
- полночь
- Минут
- сочетание
- смесь
- ML
- млн операций в секунду
- модель
- Модели
- монитор
- БОЛЕЕ
- самых
- Самые популярные
- много
- музей
- Музеи
- Названный
- Необходимость
- необходимый
- сеть
- Новые
- следующий
- ночь
- нет
- ноутбук
- сейчас
- номер
- NY
- наблюдение
- наблюдателей
- происходить
- of
- предлагают
- предлагающий
- Предложения
- .
- Огайо
- Масло
- on
- ONE
- только
- Откроется
- оптимальный
- оптимизированный
- Опция
- or
- заказ
- Орегон
- Другое
- наши
- наш
- внешний
- выходной
- выходы
- за
- страница
- параметр
- параметры
- Париж
- часть
- Выполнять
- производительность
- Физика
- кусок
- Часть
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- играл
- пожалуйста
- политика
- Популярное
- После
- Predictor
- подготовка
- предыдущий
- Основной
- Процедуры
- процесс
- Продукт
- Менеджер по продукции
- Профили
- Прогресс
- наводящие
- Предложения
- обеспечивать
- при условии
- поставщики
- приводит
- что такое варган?
- общественном транспорте.
- публично
- цель
- положил
- Питон
- вопрос
- Вопросы
- хаотичность
- ассортимент
- Стоимость
- RE
- достиг
- причины
- рецепт
- Управление по борьбе с наркотиками (DEA)
- Цена снижена
- относиться
- отказ
- С уважением
- районы
- относительность
- требовать
- ресурс
- Полезные ресурсы
- ответы
- Итоги
- Rivers - Реки
- Роли
- роли
- романтика
- Комната
- Run
- Бег
- s
- sagemaker
- Конвейеры SageMaker
- соль
- то же
- образец
- сообщили
- Ученый
- SDK
- Поиск
- поиск
- Во-вторых
- Раздел
- безопасный
- безопасность
- посмотреть
- выбранный
- выбор
- выбор
- старший
- настроение
- Услуги
- выступающей
- набор
- несколько
- Форма
- выстрел
- должен
- показывать
- показал
- Шоу
- закрытие
- значительный
- просто
- просто
- одинарной
- Сайтов
- Размер
- Размеры
- медленной
- Медленно
- сгладить
- So
- уже
- Software
- разработка программного обеспечения
- Решение
- Решения
- некоторые
- Блеск
- особый
- специалист
- указанный
- указав
- скорость
- Спотовая торговля
- стоять
- положение
- Начало
- и политические лидеры
- Области
- устойчивый
- Шаги
- Stop
- остановившийся
- поток
- строка
- Структура
- студия
- Ошеломляющий
- последующее
- по существу
- Успешно
- такие
- поддержка
- Поддержанный
- Убедитесь
- символ
- система
- ТАБЛИЦЫ
- портной
- взять
- принимает
- с
- задачи
- вкус
- команда
- шаблон
- terms
- текст
- спасибо
- который
- Ассоциация
- Столица
- мир
- тогда
- теория
- Там.
- Эти
- они
- тонкий
- этой
- тысячи
- Через
- время
- в
- сегодня
- вместе
- знак
- Лексемы
- Токио
- слишком
- инструменты
- топ
- Всего
- Тур
- Башня
- Обучение
- трансформатор
- переведите
- Переводы
- трансфер
- два
- напишите
- Типы
- ui
- под
- созданного
- до
- Обновление ПО
- использование
- прецедент
- Информация о пользователе
- использования
- через
- ценный
- Наши ценности
- изменения
- разнообразие
- различный
- версия
- очень
- с помощью
- Просмотры
- Виргиния
- визуальный
- объем
- vs
- от
- стремятся
- войны
- законопроект
- Вода
- способы
- we
- Web
- веб-сервисы
- Web-Based
- свадьбы
- ЧТО Ж
- пошел
- Что
- когда
- который
- в то время как
- белый
- зачем
- будете
- окна
- ВИНО
- удивляться
- Word
- слова
- Работа
- Мир
- Ты
- ВАШЕ
- зефирнет