Сегодня мы рады сообщить, что Гемма модель теперь доступна для клиентов, использующих Amazon SageMaker JumpStart. Джемма — это семья языковые модели на основе моделей Google Gemini, обученных на 6 триллионах текстовых токенов. Семейство Gemma состоит из двух размеров: модель с 7 миллиардами параметров и модель с 2 миллиардами параметров. Теперь вы можете использовать предварительно обученные и настроенные с помощью инструкций модели Gemma 2B и Gemma 7B внутри SageMaker JumpStart. JumpStart — это центр машинного обучения (ML) SageMaker, который предоставляет доступ к базовым моделям в дополнение к встроенным алгоритмам и шаблонам комплексных решений, чтобы помочь вам быстро приступить к работе с ML.
В этом посте мы расскажем, как развернуть модель Gemma и точно настроить ее для ваших случаев использования в SageMaker JumpStart. Полная версия блокнота доступна на сайте GitHub.
модель Джеммы
Гемма это семейство легких, современных Модели построен на основе тех же исследований и технологий, которые использовались для создания Gemini модели. Gemma, разработанная Google DeepMind и другими командами Google, вдохновлена Близнецами. Джемма демонстрирует сильные универсальные способности в текстовых областях, а также современные навыки понимания и рассуждения в масштабе. Он обеспечивает более высокую производительность по сравнению с другими общедоступными моделями аналогичного или большего масштаба в различных областях, включая ответы на вопросы, рассуждения на основе здравого смысла, математику и естественные науки, а также кодирование. Gemma выпустила веса моделей для поддержки инноваций разработчиков, использующих модели Gemma. Джемма была запущена с новым Инструментарий ответственного генеративного искусственного интеллекта который предоставляет рекомендации и необходимые инструменты для создания более безопасных приложений искусственного интеллекта с помощью Gemma.
Базовые модели в SageMaker
JumpStart предоставляет доступ к ряду моделей из популярных центров моделей, включая Hugging Face, PyTorch Hub и TensorFlow Hub, которые вы можете использовать в процессе разработки машинного обучения в SageMaker. Недавние достижения в области машинного обучения привели к появлению нового класса моделей, известных как модели фундамента, которые обычно обучаются на миллиардах параметров и адаптируются к широкому кругу вариантов использования, таких как суммирование текста, создание цифрового искусства и языковой перевод. Поскольку обучение этих моделей обходится дорого, клиенты хотят использовать существующие предварительно обученные базовые модели и настраивать их по мере необходимости, а не обучать эти модели самостоятельно. SageMaker предоставляет список моделей, которые вы можете выбрать на консоли SageMaker.
Теперь вы можете найти модели фундамента от разных поставщиков моделей в JumpStart, что позволит вам быстро приступить к работе с моделями фундамента. Вы можете найти базовые модели, основанные на различных задачах или поставщиках моделей, а также просмотреть характеристики моделей и условия использования. Вы также можете опробовать эти модели, используя тестовый виджет пользовательского интерфейса. Если вы хотите использовать базовую модель в большом масштабе, вы можете сделать это, не выходя из SageMaker, используя готовые блокноты от поставщиков моделей. Поскольку модели размещаются и развертываются на AWS, ваши данные, независимо от того, используются ли они для оценки модели или для ее масштабного использования, никогда не передаются третьим лицам.
Давайте рассмотрим, как можно использовать модель «Лама-страж» в JumpStart.
Изучите модель Джеммы в Jumpstart
Доступ к моделям фундамента Gemma можно получить через SageMaker JumpStart в пользовательском интерфейсе SageMaker Studio и SageMaker Python SDK. В этом разделе мы рассмотрим, как находить модели в SageMaker Studio.
SageMaker Studio — это интегрированная среда разработки (IDE), которая предоставляет единый визуальный веб-интерфейс, с помощью которого вы можете получить доступ к специально созданным инструментам для выполнения всех этапов разработки ML, от подготовки данных до построения, обучения и развертывания моделей ML. Дополнительные сведения о том, как начать работу и настроить SageMaker Studio, см. Студия Amazon SageMaker.
В консоли управления AWS для SageMaker Studio перейдите к SageMaker JumpStart в разделе Готовые и автоматизированные решения. Jumpstart содержит предварительно обученные модели, блокноты и готовые решения.
На целевой странице SageMaker JumpStart вы можете найти модель Gemma, выполнив поиск по запросу Gemma.
Затем вы можете выбрать один из множества вариантов модели Gemma, включая Gemma 2B, Gemma 7B, Gemma 2B Instruct и Gemma 7B Instruct.
Выберите карточку модели, чтобы просмотреть сведения о модели, такие как лицензия, данные, используемые для обучения, и способы использования модели. Вы также найдете Развертывание Кнопка, которая приведет вас на целевую страницу, где вы сможете проверить вывод с помощью примера полезной нагрузки.
Развертывание Gemma с помощью SageMaker Python SDK
Вы можете найти код, показывающий развертывание Gemma, на JumpStart, а также пример использования развернутой модели в этот блокнот GitHub.
Начните с выбора идентификатора модели SageMaker Model Hub и версии модели, которые будут использоваться при развертывании Gemma.
Выберите идентификатор модели из следующей таблицы, в которой подробно описаны параметры конфигурации по умолчанию для развертывания JumpStart. Из-за большого размера словаря в 256 тысяч токенов Gemma 7B может поместиться только на одном графическом процессоре A10G при поддержке длины контекста в 1 тысячу. По этой причине JumpStart использует более крупный экземпляр по умолчанию для Gemma 7B.
Модель ID | Экземпляр вывода по умолчанию | Тензорная степень параллельности | Поддерживаемая длина контекста |
Huggingface-LLM-Gemma-2b | ml.g5.xlarge | 1 | 8k |
Huggingface-LLM-Gemma-2b-инструктировать | ml.g5.xlarge | 1 | 8k |
Huggingface-LLM-Gemma-7b | мл.g5.12xбольшой | 4 | 8k |
Huggingface-LLM-Gemma-7b-инструктировать | мл.g5.12xбольшой | 4 | 8k |
Теперь вы можете развернуть модель с помощью SageMaker JumpStart. Следующий код использует экземпляр по умолчанию ml.g5.12xlarge
для конечной точки вывода. Вы можете развернуть модель на других типах экземпляров, передав instance_type
в JumpStartModel
сорт. Развертывание может занять 5–10 минут.
Для успешного развертывания необходимо вручную изменить accept_eula
аргумент в методе развертывания модели для True
. Эта модель развертывается с использованием контейнера глубокого обучения генерации текста (TGI).
Вызов конечной точки
Вы можете программно получить примеры полезных данных из JumpStartModel
объект. Это поможет вам начать работу, наблюдая за предварительно отформатированными инструкциями, которые может принять Джемма.
Прежде чем мы рассмотрим конкретные подсказки, давайте рассмотрим шаблон чата для моделей Gemma Instruct.
Здесь вы помещаете свое приглашение в [USER_PROMPT]
расположение. Системные инструкции не поддерживаются; вместо этого вы можете добавить нужную инструкцию к приглашению пользователя. Кроме того, если у вас многоходовой разговор, подсказка модели может чередоваться между пользователем и помощником по мере необходимости.
Теперь рассмотрим несколько примеров инструкций. Здесь вы просите Джемму написать программу Hello World.
Ниже приводится ожидаемый результат:
Затем призовите Джемму к творческой задаче написания стихотворения.
Ниже приводится вывод:
Это выглядит довольно хорошо!
Теперь давайте посмотрим на задержку и производительность пропускной способности для модели, обслуживающей с конфигурацией развертывания JumpStart по умолчанию. Здесь мы покажем, как производительность модели может отличаться для вашей типичной рабочей нагрузки конечной точки. В следующих таблицах вы можете увидеть, что запросы небольшого размера (256 входных слов и 256 выходных токенов) достаточно производительны при большом количестве одновременных пользователей, достигая пропускной способности токенов порядка одной тысячи-двух тысяч токенов в секунду. Однако по мере того, как количество входных слов приближается к максимальной поддерживаемой длине контекста Gemma в восемь тысяч токенов, конечная точка насыщает свои возможности пакетной обработки — количество одновременных запросов, которые разрешено обрабатывать одновременно — из-за ограничений, связанных с памятью экземпляра.
Дополнительные сведения о том, как учитывать эту информацию и корректировать конфигурации развертывания для вашего конкретного случая использования, см. Тестирование и оптимизация развертывания конечных точек в Amazon SageMaker JumpStart.
. | Пропускная способность (токены/с) | ||||||||||
Параллельные пользователи | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 | |||
модель | Тип экземпляра | Введите слова | Выходные токены | . | . | . | . | . | . | . | . |
гемма-2b-инструктировать | ml.g5.xlarge | 256 | 256 | 73 | 137 | 262 | 486 | 829 | 1330 | 1849 | 1834 |
2048 | 256 | 69 | 126 | 227 | 373 | 537 | 704 | 764 | - | ||
7936 | 256 | 60 | 100 | 147 | 195 | 226 | 230 | - | - | ||
гемма-7b-инструктировать | мл.g5.12xбольшой | 256 | 256 | 62 | 119 | 227 | 413 | 601 | 811 | 937 | 962 |
2048 | 256 | 56 | 100 | 172 | 245 | 267 | 273 | - | - | ||
7936 | 256 | 44 | 67 | 77 | 77 | 78 | - | - | - |
. | Задержка P50 (мс/токен) | ||||||||||
Параллельные пользователи | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 | |||
модель | Тип экземпляра | Введите слова | Выходные токены | . | . | . | . | . | . | . | . |
гемма-2b-инструктировать | ml.g5.xlarge | 256 | 256 | 13 | 14 | 15 | 16 | 19 | 23 | 33 | 49 |
2048 | 256 | 14 | 15 | 17 | 20 | 28 | 43 | 79 | - | ||
7936 | 256 | 16 | 19 | 26 | 39 | 68 | 136 | - | - | ||
Джемма-7b-инструктировать | мл.g5.12xбольшой | 256 | 256 | 16 | 16 | 17 | 19 | 26 | 38 | 57 | 110 |
2048 | 256 | 17 | 19 | 23 | 32 | 52 | 119 | - | - | ||
7936 | 256 | 22 | 29 | 45 | 105 | 197 | - | - | - |
Точная настройка Gemma с помощью SageMaker Python SDK
Далее мы покажем вам, как точно настроить модель инструкций Gemma 7B для набора данных в диалоговом формате, используя QLoRA техника. Как упоминалось ранее, из-за большого размера словаря в 256 тысяч и длины контекста в 8 тысяч JumpStart предлагает следующие конфигурации по умолчанию для тонкой настройки QLoRA.
Модель ID | Учебный экземпляр по умолчанию | Максимальная длина входной последовательности | Размер пакета обучения для каждого устройства | Этапы накопления градиента |
Huggingface-LLM-Gemma-2b | мл.g5.2xбольшой | 1024 | 1 | 4 |
Huggingface-LLM-Gemma-2b-инструктировать | мл.g5.2xбольшой | 1024 | 1 | 4 |
Huggingface-LLM-Gemma-7b | мл.g5.12xбольшой | 2048 | 1 | 4 |
Huggingface-LLM-Gemma-7b-инструктировать | мл.g5.12xбольшой | 2048 | 1 | 4 |
Давайте загрузим и обработаем набор данных в диалоговом формате. Пример набора данных для этой демонстрации: ТОП-1 тем бесед OpenAssistant.
Данные обучения должны быть сформулированы в строках JSON (.jsonl
), где каждая строка представляет собой словарь, представляющий набор диалогов. Один из примеров файла строк JSON показан ниже. Подробную информацию о том, как обрабатывать набор данных, см. в блокноте в разделе GitHub.
В основе сценариев обучения JumpStart использует HuggingFace. SFTТренер QLoRA и FlashAttention. Flash Attention обеспечивает эффективность масштабирования, что приводит к ускорению обучения и вывода. Помимо тонкой настройки с помощью чата, JumpStart также поддерживает тонкую настройку инструкций и адаптации предметной области с помощью QLoRA. Подробности смотрите в блокноте GitHub.
После тонкой настройки вы можете развернуть настроенную модель на конечной точке SageMaker.
Вы можете выбрать развертывание точно настроенной модели на основе данных разговора в конечной точке SageMaker с помощью Функция API сообщений HuggingFace как альтернативный подход. Преимущество использования функции Message API заключается в том, что она позволяет пользователям передавать примеры запросов в необработанном формате, как показано в следующей таблице, а Chat_template в конечной точке преобразует примеры запросов в правильный формат перед отправкой их в модель. Подробности смотрите в разделе развертывания после тонкой настройки в ноутбук.
После развертывания точно настроенной модели в конечной точке вы можете сравнить выходные ответы предварительно обученных и точно настроенных моделей Gemma. Примеры собираются из тестовых данных, которые представляют собой набор данных обучения. Параметры вывода: max_tokens
как 512, top_p
как 0.9, temperature
как 0.4, и top_k
как 50.
Как видно по результатам тонкой настройки, ответы агентов более точны.
Для дальнейшей оценки ваших точно настроенных моделей вы можете изучить Оценка FM с помощью Amazon SageMaker Clarify чтобы увидеть, как ваша точно настроенная модель работает по сравнению с базовой моделью.
входные | Земная правда | Ответ от Использование темпера с изогнутым основанием модель | Ответ от точно настроенной модели | |
1 |
Пользователь: Я хочу поработать над своим словарным запасом. Можете ли вы дать мне несколько простых способов найти новые слова, которые можно использовать, чтобы увеличить разнообразие моих предложений? Ассистент: Конечно! Улучшение словарного запаса — это непрерывный процесс, но вот несколько простых способов найти новые слова и увеличить разнообразие ваших предложений: 1. Читайте больше. Чтение книг, статей и блогов разных жанров и тем знакомит вас с новыми словами и фразами. Записывайте все незнакомые слова, с которыми вы сталкиваетесь, и ищите их значения. 2. Используйте тезаурус. Всякий раз, когда вы пишете или читаете, используйте тезаурус, чтобы найти синонимы для часто используемых слов. Это не только поможет вам выучить новые слова, но и улучшит понимание их тонких различий в значении. 3. Календари или приложения «Слово в день». Подпишитесь на электронную рассылку «Слово в день» или загрузите приложение для пополнения словарного запаса. Эти инструменты каждый день знакомят вас с новым словом, а также с его значением, произношением и примерами использования. 4. Присоединитесь к книжному клубу или дискуссионной группе. Участие в беседах и дискуссиях о книгах, статьях или любой другой теме открывает вам новые точки зрения и новый словарный запас. Внимательно слушайте других и пробуйте использовать новые слова в контексте. 5. Играйте в словесные игры. Такие игры, как «Эрудит», «Боггл» и кроссворды, улучшают ваш словарный запас и помогают выучить новые слова в увлекательной игровой форме. 6. Смотрите фильмы, телешоу или документальные фильмы. В визуальных средствах массовой информации часто используются разнообразные языки, сленг и жаргон. Просмотр фильмов, телепередач и документальных фильмов с субтитрами поможет вам лучше понимать и запоминать новые слова. 7. Практикуйтесь в написании. Регулярное написание рассказов, эссе или дневниковых записей побуждает вас использовать новые слова и фразы. Экспериментируйте с разными стилями и жанрами письма, чтобы расширить свой словарный запас. 8. Изучите этимологию нового слова. Понимание происхождения и истории слова может облегчить его запоминание и правильное использование. Исследование этимологии также знакомит вас со связанными словами и понятиями. 9. Используйте карточки или программное обеспечение для интервального повторения: создавайте карточки с новыми словами, их значениями и примерами предложений. Регулярно просматривайте их или используйте программное обеспечение для интервального повторения, такое как Anki, чтобы оптимизировать свое обучение. 10. Ставьте личные цели. Ставьте достижимые цели, например, выучить пять новых слов в неделю. Следите за своим прогрессом и вознаграждайте себя за достижение своих целей. Постоянно внедряя эти стратегии в свою повседневную жизнь, вы постепенно создадите разнообразный и крепкий словарный запас. Пользователь: Хм, мне очень нравится идея чтения. Можете ли вы порекомендовать мне крутой научно-фантастический триллер, который я мог бы прочитать? |
Ассистент: Конечно! Вот несколько рекомендаций по научно-фантастическим триллерам, которые могут вам понравиться: 1. «Задача трех тел» Лю Цысиня. Этот отмеченный наградами роман исследует первый контакт между человечеством и инопланетной цивилизацией, а также его политические и личные последствия. Это захватывающее и заставляющее задуматься чтение, которое затрагивает глубокие вопросы о природе существования и Вселенной. 2. «Аннигиляция» Джеффа Вандермеера. В этом романе рассказывается о группе ученых, которые отправляются в загадочную область, известную как «Зона X», где они сталкиваются со странными и тревожными явлениями. По мере того, как они углубляются в эту местность, они начинают раскрывать мрачные тайны природы реальности и окружающего мира. 3. «Темная материя» Блейка Крауча. В этом романе рассказывается о блестящем физике по имени Джейсон Дессен, которого похищают и переносят в параллельную вселенную. Пытаясь найти путь обратно в свою реальность, он должен признать свой выбор и последствия своих действий. 4. «Штамм Андромеды» Майкла Крайтона. Этот классический роман рассказывает о команде ученых, пытающихся сдержать и изучить смертоносный внеземной микроб, приземлившийся на Землю. Поскольку они соревнуются со временем, чтобы найти способ нейтрализовать микроб, им также приходится бороться с политическими интригами и личными конфликтами. 5. «Первому игроку приготовиться» Эрнеста Клайна. Действие этого романа происходит в антиутопическом будущем, где большая часть населения проводит время в мире виртуальной реальности, известном как ОАЗИС. Когда создатель ОАЗИСа умирает и оставляет после себя задачу найти спрятанное пасхальное яйцо, молодой главный герой отправляется на захватывающий квест, который навсегда изменит его жизнь. Надеюсь, одна из этих рекомендаций вызовет у вас интерес! |
Ассистент: Текст не содержит информации о ваших читательских предпочтениях или интересах, поэтому я не могу дать рекомендацию по книге. |
Ассистент: Конечно, вот несколько рекомендаций по научно-фантастическим триллерам, которые могут вам понравиться: – «Дюна» Фрэнка Герберта: действие этого эпического научно-фантастического романа происходит на пустынной планете Арракис, где молодому принцу по имени Пол Атрейдес предстоит столкнуться с проблемами враждебной окружающей среды и коварного политического ландшафта. – «Марсианин» Энди Вейра: этот захватывающий научно-фантастический триллер рассказывает историю Марка Уотни, астронавта, оказавшегося на Марсе после пылевой бури, который использует свою изобретательность и находчивость, чтобы выжить и в конечном итоге вернуться на Землю. – «Машина времени» Герберта Уэллса: Этот классический научно-фантастический роман использует философский подход к концепции путешествия во времени, исследуя последствия изменения прошлого и будущего. – «Бегущий по лезвию» Филипа К. Дика: этот научно-фантастический роман в стиле неонуар, действие которого происходит в футуристическом Лос-Анджелесе, исследует пересечение человеческого и искусственного интеллекта, а также его влияние на общество и природу реальности. – «Андроиды» Айзека Азимова: этот научно-фантастический роман исследует концепцию искусственного интеллекта и его потенциальные последствия, особенно когда люди разрабатывают продвинутых андроидов, которые бросают вызов традиционным человеческим ценностям и убеждениям. Это всего лишь несколько советов, и в конечном итоге лучшая книга для вас будет зависеть от ваших личных предпочтений и того, какие впечатления вы ищете от научно-фантастического триллера. Но я надеюсь, что эти рекомендации послужат вам хорошей отправной точкой для изучения этого жанра. Пожалуйста, дайте мне знать, если у вас возникнут дополнительные вопросы или я могу вам чем-то помочь. |
2 |
Пользователь: Напишите программу Hello World на VB.NET. Ассистент: Вот, пожалуйста: «`vbnet Пользователь: заставить его принимать входные данные от $ и затем произносить «Привет, $» вместо «Привет, мир!» |
Ассистент: Публичный модуль HelloWorld Публичная подглавная страница() System.Console.WriteLine("Как вас зовут?") Тусклое имя As String = System.Console.ReadLine() System.Console.WriteLine(“Привет” & имя & “!”) End Sub Конечный модуль |
Ассистент: «`vbnet Публичный модуль HelloWorld Публичная подглавная страница() Тусклое имя As String = Console.ReadLine() Console.WriteLine(“Привет” и имя) End Sub Конечный модуль |
Ассистент: Конечно! Вот пример: «`vbnet |
3 |
Пользователь: Дайте мне список задач при запуске проекта по обучению большой языковой модели, способной понимать человеческие вопросы и отвечать на них. Ассистент: Следующие шаги представляют собой сокращенный список шагов, которые необходимо предпринять при запуске проекта по обучению большой языковой модели, способной понимать запросы человека и отвечать на них: 1. Определить масштаб и цели проекта, целевую аудиторию. Это должно дать вам общее представление о том, какие шаги необходимо предпринять. Стоит ли остановиться подробнее на одном из пунктов? Пользователь: Эти задачи необходимо разбить на более мелкие детали. Не могли бы вы предоставить обновленный список дел с более подробным описанием предстоящих задач? |
Ассистент: Вот более подробное описание каждого шага: 1. Определите масштаб и цели проекта. Важно четко определить цели проекта и целевую аудиторию. Это поможет вам принять решение о том, какой тип данных собирать и какая архитектура модели подходит. 2. Сбор и предварительная обработка данных. Это важный шаг, поскольку качество и разнообразие данных напрямую влияют на производительность модели. Предварительная обработка может включать очистку данных, токенизацию текста и преобразование слов в числовые представления. 3. Выберите архитектуру модели. На выбор предлагается множество различных типов моделей, включая рекуррентные нейронные сети (RNN), модели преобразователей и сверточные нейронные сети (CNN). Выбор будет зависеть от конкретных требований проекта и объема доступных данных. 4. Разделите набор данных и внедрите дополнение данных. Разделение данных на подмножества обучения, проверки и тестирования важно для мониторинга производительности модели во время обучения. Увеличение данных можно использовать для искусственного увеличения размера набора данных и повышения надежности модели. 5. Обучение модели и мониторинг прогресса. Этот шаг включает в себя обучение модели на обучающих данных с использованием набора проверки для отслеживания прогресса и корректировки гиперпараметров по мере необходимости. Возможно, придется повторить этот процесс несколько раз, пока модель не будет хорошо работать на проверочном наборе. 6. Оценка модели на тестовом наборе. После обучения модели важно оценить ее производительность на отдельном тестовом наборе, чтобы получить представление о ее способности к обобщению. Это можно сделать путем сравнения прогнозов модели с фактическими результатами и анализа ошибок. 7. Точная настройка для конкретных задач или областей. Этот шаг включает в себя дальнейшее обучение модели на данных для конкретной задачи, чтобы улучшить ее производительность для конкретной области. Это можно сделать посредством трансферного обучения, когда предварительно обученная модель настраивается на новых данных, или посредством тонкой настройки, когда модель обучается с нуля на новых данных. 8. Создайте интерфейс для ввода данных пользователем. Это включает в себя разработку интерфейса, который позволяет пользователям вводить вопросы или запросы и получать ответы от модели. 9. Тестирование в контролируемой среде. Прежде чем развертывать модель в реальных условиях, важно протестировать ее в контролируемой среде и собрать отзывы пользователей. Это поможет выявить любые ошибки или предвзятости в модели и предоставит возможности для ее улучшения. 10. Постоянно отслеживать и улучшать производительность. Наконец, важно постоянно отслеживать производительность модели и вносить обновления и улучшения по мере необходимости. Это может включать переобучение модели на новых данных, точную настройку гиперпараметров или обновление архитектуры. |
Ассистент: ## Список дел для обучения большой языковой модели для ответов на вопросы **1. Объем и цели проекта:** * Определить цели проекта и желаемые функции. **2. Сбор и предварительная обработка данных:** * Определите источники обучающих данных и соберите разнообразный набор текстовых данных. **3. Выбор и конфигурация модели:** * Выберите подходящую архитектуру модели в зависимости от сложности задачи и желаемой производительности. **4. Обучение и оценка:** * Разделите данные обучения на подмножества обучения, проверки и тестирования. **5. Тонкая настройка и разработка интерфейса:** * Точная настройка модели для конкретных задач или областей посредством трансферного обучения. **6. Тестирование и улучшение:** * Протестируйте модель в контролируемой среде с различными сценариями ввода. **Дополнительные соображения:** * Установите сроки и бюджет проекта. **Примечание.** Этот список не является исчерпывающим и, возможно, его придется адаптировать в соответствии с конкретными требованиями проекта. |
Ассистент: Конечно, вот более подробное описание задач, связанных с обучением большой языковой модели пониманию человеческих вопросов и реагированию на них: **1. Определите объем и цели проекта** **2. Сбор и предварительная обработка комплексного/разнообразного набора текстовых данных** **3. Выберите подходящую архитектуру модели, отрегулируйте гиперпараметры для точности/скорости** **4. Разделите набор данных на подмножества обучения, проверки и тестирования, внедрите увеличение данных** **5. Обучайте модель, отслеживайте ход выполнения проверочного набора, корректируйте по мере необходимости** **6. Оценка модели на тестовом наборе, сравнение с эталонными показателями, анализ ошибок и отклонений** **7. Точная настройка для конкретных задач или областей посредством трансферного обучения или тонкой настройки** **8. Создайте интерфейс для ввода данных пользователем и ответа модели** **9. Тестируйте в контролируемой среде, собирайте отзывы для улучшения** **10. Непрерывный мониторинг и повышение производительности посредством переобучения и тонкой настройки** Это шаги, необходимые для обучения большой языковой модели пониманию человеческих вопросов и реагированию на них. Пожалуйста, дайте мне знать, если у вас есть вопросы. |
Убирать
После тестирования конечных точек удалите конечные точки вывода SageMaker и модель, чтобы избежать дополнительных расходов.
Заключение
В этом посте мы показали вам, как начать работу с Gemma в SageMaker Studio и развернуть модель для вывода. Мы также показали вам, как можно точно настроить модели Gemma в SageMaker Jumpstart.
Поскольку базовые модели предварительно обучены, они могут помочь снизить затраты на обучение и инфраструктуру, а также обеспечить настройку для вашего варианта использования. Посетите SageMaker JumpStart в SageMaker Studio прямо сейчас, чтобы начать работу.
Это руководство предназначено только для информационных целей. Вы по-прежнему должны проводить свою собственную независимую оценку и принимать меры для обеспечения соблюдения ваших собственных конкретных методов и стандартов контроля качества, а также местных правил, законов, положений, лицензий и условий использования, которые применяются к вам, вашему контенту и сторонняя модель, упомянутая в этом руководстве. AWS не имеет контроля или полномочий в отношении сторонней модели, упомянутой в этом руководстве, и не делает никаких заявлений и не гарантирует, что сторонняя модель безопасна, не содержит вирусов, работоспособна или совместима с вашей производственной средой и стандартами. AWS не делает никаких заявлений и не гарантирует, что любая информация, содержащаяся в этом руководстве, приведет к определенному результату или результату.
Об авторах
Доктор Кайл Ульрих является ученым-прикладником с Встроенные алгоритмы Amazon SageMaker команда. Его исследовательские интересы включают масштабируемые алгоритмы машинного обучения, компьютерное зрение, временные ряды, байесовские непараметрические и гауссовские процессы. Его докторская степень получена в Университете Дьюка, и он опубликовал статьи в NeurIPS, Cell и Neuron.
Доктор Синь Хуан — старший научный сотрудник Amazon SageMaker JumpStart и встроенных алгоритмов Amazon SageMaker. Он занимается разработкой масштабируемых алгоритмов машинного обучения. Его исследовательские интересы лежат в области обработки естественного языка, объяснимого глубокого обучения на табличных данных и надежного анализа непараметрической пространственно-временной кластеризации. Он опубликовал множество статей на конференциях ACL, ICDM, KDD и в Королевском статистическом обществе: серия A.
Рахна Чадха — главный архитектор решений AI/ML в отделе стратегических счетов в AWS. Рахна — оптимистка, которая верит, что этичное и ответственное использование ИИ может улучшить общество в будущем и принести экономическое и социальное процветание. В свободное время Рахна любит проводить время с семьей, ходить в походы и слушать музыку.
Эван Кравиц — инженер-программист в Amazon Web Services, работающий над SageMaker JumpStart. Он любит готовить и бегать по Нью-Йорку.
Доктор Ашиш Хетан — старший научный сотрудник, работающий со встроенными алгоритмами Amazon SageMaker и помогающий разрабатывать алгоритмы машинного обучения. Он получил докторскую степень в Университете Иллинойса в Урбана-Шампейн. Он является активным исследователем в области машинного обучения и статистических выводов и опубликовал множество статей на конференциях NeurIPS, ICML, ICLR, JMLR, ACL и EMNLP.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/gemma-is-now-available-in-amazon-sagemaker-jumpstart/
- :имеет
- :является
- :нет
- :куда
- $UP
- 1
- 10
- 100
- 11
- 13
- 135
- 17
- 19
- 1900
- 250
- 28
- 29
- 31
- 39
- 41
- 50
- 7
- 8
- 9
- a
- способность
- О нас
- выше
- Принять
- доступ
- доступность
- Учетная запись
- Учетные записи
- накопление
- точность
- точный
- достижимый
- Достигает
- приобретение
- через
- действия
- активный
- фактического соединения
- адаптация
- дополнение
- Дополнительно
- регулировать
- продвинутый
- авансы
- После
- против
- Агент
- AI
- AI / ML
- самолет
- алгоритмы
- иностранец
- Все
- позволять
- разрешено
- позволяет
- вдоль
- причислены
- альтернатива
- Amazon
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Amazon Web Services
- количество
- an
- анализ
- анализировать
- анализы
- анализ
- и
- и инфраструктура
- Андромеда
- -Анджелесе
- анонсировать
- ответ
- ответ
- ответы
- любой
- все
- API
- приложение
- Приложения
- прикладной
- Применить
- подхода
- подходы
- соответствующий
- Программы
- архитектура
- МЫ
- ПЛОЩАДЬ
- области
- аргумент
- около
- Искусство
- статьи
- искусственный
- искусственный интеллект
- AS
- спросить
- оценки;
- помощник
- астронавт
- At
- аудитория
- власть
- Автоматизированный
- доступен
- избежать
- наградами
- AWS
- Консоль управления AWS
- назад
- balanced
- Использование темпера с изогнутым основанием
- основанный
- основной
- дозирующий
- байесовский
- BE
- , так как:
- до
- начинать
- за
- не являетесь
- убеждений
- считает,
- ниже
- бенчмаркинг
- тесты
- польза
- Кроме
- ЛУЧШЕЕ
- Лучшая
- между
- смещение
- предубеждения
- миллиард
- миллиарды
- BLADE
- Заблокировать
- Блог
- блоги
- Цвести
- тело
- книга
- Книги
- Breakdown
- блестящий
- приносить
- Приведение
- Приносит
- Сломанный
- бюджет
- строить
- Строительство
- построенный
- встроенный
- но
- кнопка
- by
- календари
- призывают
- под названием
- CAN
- не могу
- холст
- возможности
- способный
- карта
- случаев
- случаев
- Категории
- осторожность
- ячейка
- вызов
- проблемы
- изменение
- характеристика
- расходы
- чат
- Проверки
- выбор
- выбор
- Выберите
- Город
- Civilization
- класс
- классический
- чистым
- Уборка
- явно
- нажмите на
- клуб
- кластеризации
- код
- Кодирование
- сотрудничество
- выходит
- обычно
- сравнить
- сравненный
- сравнив
- сравнение
- совместим
- полный
- сложности
- сложность
- соблюдать
- компьютер
- Компьютерное зрение
- сама концепция
- понятия
- параллельный
- конференции
- Конфигурация
- конфликты
- Последствия
- Рассматривать
- соображения
- принимая во внимание
- последовательно
- состоит
- Консоли
- постоянная
- ограничения
- обращайтесь
- содержать
- Container
- содержит
- бороться
- содержание
- контекст
- непрерывно
- контроль
- контроль
- Разговор
- диалоговый
- Беседы
- конвертировать
- преобразование
- Холодные
- правильно
- Расходы
- может
- Создайте
- Создающий
- творческий
- создатель
- кроссворд
- Куратор
- любопытный
- Текущий
- Клиенты
- настройка
- ежедневно
- танец
- темно
- данным
- Наборы данных
- день
- решения
- глубоко
- глубокое обучение
- более глубокий
- DeepMind
- По умолчанию
- определять
- Определяет
- копаться
- копается
- демонстрация
- зависеть
- развертывание
- развернуть
- развертывание
- развертывание
- DESERT
- Проект
- проектирование
- желанный
- подробность
- подробный
- подробнее
- Определять
- развивать
- развитый
- Застройщик
- развивающийся
- Развитие
- устройство
- диагностирование
- Диалог
- отличаться
- Различия
- различный
- Интернет
- цифровое искусство
- непосредственно
- каталог
- обнаружить
- обсуждение
- обсуждение
- заболеваний
- погружение
- Разное
- Разнообразие
- делить
- do
- документ
- документальные фильмы
- приносит
- домен
- доменов
- сделанный
- вниз
- скачать
- два
- Герцог
- Университет Дюка
- в течение
- Пыли
- антиутопия
- каждый
- земля
- легче
- затрат
- 8
- империя
- включить
- позволяет
- позволяет
- столкновение
- призывает
- впритык
- Конечная точка
- привлечение
- инженер
- Усиливает
- пользоваться
- приятный
- обеспечивать
- Окружающая среда
- EPIC
- ошибки
- существенный
- установить
- этический
- оценивать
- оценки
- оценка
- со временем
- Каждая
- пример
- Примеры
- возбужденный
- комплексный
- Экспонаты
- существование
- существующий
- Расширьте
- ожидаемый
- дорогим
- опыт
- эксперимент
- эксперты
- Больше
- исследует
- Исследование
- Face
- справедливость
- ложный
- семья
- быстрее
- Особенность
- Обратная связь
- Футов
- несколько
- поле
- бороться
- Файл
- в заключение
- Найдите
- результаты
- конец
- First
- первый контакт
- соответствовать
- 5
- Flash
- полет
- фокусируется
- после
- следующим образом
- Что касается
- навсегда
- формат
- Год основания
- Рамки
- откровенный
- от
- функция
- функциональные возможности
- функциональность
- функционирование
- далее
- будущее
- футуристический
- Игры
- собирать
- Gemini
- порождающий
- генеративный
- Генеративный ИИ
- жанре
- Жанры
- получить
- GitHub
- Дайте
- данный
- Go
- Цели
- будет
- хорошо
- есть
- GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР
- Грейс
- постепенно
- большой
- большая сила
- группы
- гарантии
- Охрана
- руководство
- инструкция
- руководящий
- рука
- упряжь
- Есть
- he
- высота
- Здравствуйте
- помощь
- помогает
- ее
- здесь
- Скрытый
- его
- история
- надежды
- состоялся
- Как
- How To
- Однако
- HTML
- HTTPS
- хаб
- концентраторы
- ОбниматьЛицо
- человек
- Человечество
- Людей
- i
- ID
- идея
- определения
- if
- Иллинойс
- изображений
- Влияние
- осуществлять
- реализация
- Импортировать
- важную
- улучшать
- улучшение
- улучшение
- улучшение
- in
- включают
- В том числе
- включения
- Увеличение
- независимые
- промышленность
- отраслевые стандарты
- повлиять
- информация
- Информационный
- Инфраструктура
- изобретательность
- Инновации
- вход
- затраты
- Запросы
- размышления
- вдохновленный
- пример
- вместо
- интегрировать
- интегрированный
- Интеллекта
- намерение
- взаимодействие
- интересы
- Интерфейс
- пересечение
- в
- вводить
- интуитивный
- включать в себя
- вовлеченный
- включает в себя
- IT
- пункты
- ЕГО
- жаргон
- присоединиться
- журнал
- путешествие
- JPG
- JSON
- всего
- Сохранить
- Вид
- Знать
- знания
- известный
- залив
- посадка
- пейзаж
- язык
- большой
- больше
- Задержка
- запустили
- Законодательство
- ведущий
- УЧИТЬСЯ
- изучение
- узнает
- уход
- Длина
- позволять
- уровень
- Кредитное плечо
- Лицензия
- лицензии
- ЖИЗНЬЮ
- молния
- Скорость молнии
- легкий
- такое как
- нравится
- линия
- линий
- Список
- Слушать
- Listening
- слушает
- Лама
- загрузка
- локальным
- расположение
- посмотреть
- искать
- ВЗГЛЯДЫ
- лос
- Лос-Анджелес
- ниже
- машина
- обучение с помощью машины
- Большинство
- сделать
- злонамеренный
- управление
- вручную
- многих
- отметка
- марш
- математика
- максимальный
- Май..
- me
- смысл
- значения
- меры
- Медиа
- медицина
- заседания
- упомянутый
- сообщение
- Сообщения
- метод
- Майкл
- может быть
- против
- Минут
- ML
- модель
- Модели
- Модули
- монитор
- Мониторинг
- БОЛЕЕ
- самых
- Кино
- Музыка
- должен
- my
- таинственный
- имя
- Названный
- натуральный
- Обработка естественного языка
- природа
- необходимо
- Необходимость
- необходимый
- потребности
- сетей
- нервный
- нейронные сети
- никогда
- Новые
- New York
- Нью-Йорк
- ночь
- нет
- в своих размышлениях
- ноутбук
- роман
- сейчас
- номер
- Оазис
- объект
- целей
- наблюдать
- of
- Предложения
- .
- on
- консолидировать
- ONE
- постоянный
- только
- оперативный
- Возможности
- оптимизация
- Оптимизировать
- Опции
- or
- заказ
- происхождения
- OS
- Другое
- Другое
- внешний
- Результат
- Результаты
- выходной
- за
- собственный
- страница
- бумага
- Параллельные
- параметр
- параметры
- особый
- особенно
- Стороны
- pass
- Прохождение
- мимо
- путь
- паттеранами
- Пол
- Люди
- для
- Выполнять
- производительность
- выполнения
- выполняет
- личного
- перспективы
- кандидат наук
- фразы
- физик
- пилот
- Часть
- планета
- Планы
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Играть
- игрок
- пожалуйста
- Точка
- пунктов
- политический
- Популярное
- население
- После
- потенциал
- мощностью
- практика
- практиками
- Predictions
- Predictor
- предпочтения
- подготовка
- довольно
- предварительно
- принц
- Основной
- печать
- процесс
- Обработанный
- Процессы
- обработка
- Производство
- FitPartner™
- Прогресс
- Проект
- наводящие
- правильный
- процветание
- обеспечивать
- поставщики
- приводит
- что такое варган?
- публично
- опубликованный
- целей
- Пазлы
- Питон
- pytorch
- Запросы
- запрос
- поиск
- вопрос
- Вопросы
- быстро
- вполне
- Гонки
- последствия
- ассортимент
- скорее
- Сырье
- достигнув результата
- Читать
- Reading
- реальный мир
- Реальность
- на самом деле
- область
- причина
- Получать
- последний
- Рекомендация
- рекомендаций
- рекомендуя
- повторяющийся
- ссылка
- ссылка
- отражает
- регулярно
- правила
- Связанный
- выпустил
- соответствующие
- помнить
- повторять
- представляющий
- Запросы
- обязательный
- Требования
- исследованиям
- исследователь
- Реагируйте
- ответ
- ответ
- ответы
- ответственность
- ответственный
- результат
- Итоги
- обзоре
- Предложение
- Рост
- надежный
- прочность
- Роли
- рутина
- королевский
- условиями,
- Run
- работает
- s
- безопаснее
- sagemaker
- Вывод SageMaker
- то же
- Сохранить
- сообщили
- масштабируемые
- Шкала
- Весы
- масштабирование
- Сценарии
- научно-фантастический
- Наука
- Ученый
- Ученые
- сфера
- поцарапать
- скрипт
- скрипты
- SDK
- бесшовные
- поиск
- Во-вторых
- секреты
- Раздел
- безопасный
- посмотреть
- выберите
- выбранный
- выбор
- выбор
- отправка
- старший
- отдельный
- Последовательность
- Серии
- Серия A
- Услуги
- выступающей
- Сессия
- набор
- Наборы
- установка
- несколько
- общие
- должен
- показывать
- показал
- показ
- показанный
- Шоу
- сторона
- аналогичный
- просто
- одинарной
- Размер
- Размеры
- навыки
- So
- Соцсети
- Общество
- Software
- Инженер-программист
- Решение
- Решения
- некоторые
- Источники
- Искры
- конкретный
- скорость
- Расходы
- проводит
- стоять
- стандартов
- и политические лидеры
- Начало
- Область
- современное состояние
- заявление
- статистический
- Шаг
- Шаги
- По-прежнему
- Истории
- буря
- История
- странный
- Стратегический
- стратегий
- строка
- сильный
- студия
- Кабинет
- подписаться
- субтитры
- успешный
- такие
- подходящее
- поддержка
- Поддержанный
- поддержки
- Поддержка
- Убедитесь
- выживать
- система
- ТАБЛИЦЫ
- взять
- принимает
- рассказ
- цель
- направлена против
- Сложность задачи
- задачи
- команда
- команды
- техника
- снижения вреда
- Технологии
- шаблон
- шаблоны
- tensorflow
- terms
- тестXNUMX
- проверенный
- Тестирование
- текст
- чем
- который
- Ассоциация
- Местоположение
- Будущее
- мир
- их
- Их
- сами
- тогда
- Там.
- следовательно
- Эти
- они
- В третьих
- третье лицо
- сторонние
- этой
- те
- мысль
- наводящий на размышления
- тысяча
- волнующий
- Через
- пропускная способность
- время
- Временные ряды
- путешествие во времени
- Сроки
- раз
- в
- знак
- tokenizing
- Лексемы
- заявил
- инструментом
- инструменты
- тема
- Всего
- трек
- традиционный
- Train
- специалистов
- Обучение
- перевод
- Передающий
- трансформатор
- Переводы
- путешествовать
- Триллион
- правда
- стараться
- мелодия
- настроены
- настройка
- tv
- два
- напишите
- Типы
- типичный
- типично
- ui
- В конечном счете
- открывай
- под
- понимать
- понимание
- незнакомый
- Вселенная
- Университет
- бесподобный
- до
- обнародование
- обновление
- Updates
- обновление
- us
- юзабилити
- Применение
- использование
- прецедент
- используемый
- Информация о пользователе
- удобно
- пользователей
- использования
- через
- Проверка
- Наши ценности
- разнообразие
- различный
- предприятие
- версия
- Вид
- Виртуальный
- Виртуальная реальность
- видение
- Войти
- визуальный
- визуальные медиа
- объем
- от
- хотеть
- гарантии
- законопроект
- Смотреть
- наблюдение
- Путь..
- способы
- we
- Web
- веб-сервисы
- Web-Based
- неделя
- ЧТО Ж
- Скважины
- Что
- Что такое
- когда
- когда бы ни
- будь то
- который
- КТО
- широкий
- широко
- виджет
- будете
- мудрость
- в
- без
- Word
- слова
- Работа
- рабочий
- работает
- Мир
- записывать
- письмо
- X
- йорк
- Ты
- молодой
- ВАШЕ
- себя
- зефирнет