Amazon SageMaker JumpStart — это центр машинного обучения (ML), предлагающий алгоритмы, модели и решения ML. С помощью SageMaker JumpStart специалисты по машинному обучению могут выбирать из постоянно растущего списка наиболее эффективных и общедоступных решений. модели фундамента (FM), такие как BLOOM, Llama 2, Сокол-40Б, Стабильная диффузия, OpenLLaMA, Флан-Т5/UL2или FM от членораздельным и Включить свет.
В этом посте и сопутствующем блокноте мы демонстрируем, как развернуть базовую модель BloomZ 176B с помощью Упрощенный SDK для SageMaker Python in Amazon SageMaker JumpStart в качестве конечной точки и использовать ее для различных задач обработки естественного языка (NLP). Вы также можете получить доступ к моделям фундамента через Студия Amazon SageMaker. Модель BloomZ 176B, одна из самых больших общедоступных моделей, представляет собой современную модель, настроенную на инструкции, которая может выполнять различные задачи обучения НЛП в контексте с несколькими шагами и обучением с нулевым выстрелом. Настройка инструкций — это метод, который включает в себя точную настройку языковой модели для набора задач НЛП с использованием инструкций. Чтобы узнать больше о настройке инструкций, см. Подсказки Zero-shot для базовой модели Flan-T5 в Amazon SageMaker JumpStart.
Нулевое обучение в NLP позволяет предварительно обученному LLM генерировать ответы на задачи, для которых он не был специально обучен. В этом методе модель снабжена входным текстом и подсказкой, описывающей ожидаемый результат модели на естественном языке. Обучение с нулевым выстрелом используется в различных задачах НЛП, таких как следующие:
- Многоязычный текст и классификация настроений
- Многоязычный вопрос и ответ
- Генерация кода
- Перефразировка абзаца
- Суммирование
- Рассуждения здравого смысла и вывод на естественном языке
- Ответ на вопрос
- Классификация предложений и настроений
- Генерация воображаемой статьи на основе заголовка
- Обобщение заголовка на основе статьи
Небольшое обучение включает в себя обучение модели выполнению новых задач, предоставляя всего несколько примеров. Это полезно, когда для обучения доступны ограниченные размеченные данные. Малопоказательное обучение используется в различных задачах, в том числе в следующих:
- Обобщение текста
- Генерация кода
- Распознавание именных объектов
- Ответ на вопрос
- Грамматика и исправление орфографии
- Описание продукта и обобщение
- Классификация предложений и настроений
- Чат-бот и диалоговый ИИ
- Генерация твитов
- Машинный перевод
- Классификация намерений
О Блуме
BigScience Large Open-science Multilingual Open-access (BLOOM) языковая модель представляет собой модель большого языка (LLM) на основе преобразователя. BLOOM — это авторегрессионный LLM, обученный для продолжения текста из подсказки на огромных объемах текстовых данных с использованием вычислительных ресурсов промышленного масштаба. Таким образом, он может выводить связный текст, который трудно отличить от текста, написанного людьми. BLOOM также можно поручить выполнять текстовые задачи, для которых он явно не обучен, путем приведения их к задачам генерации текста.
Благодаря 176 миллиардам параметров BLOOM может генерировать текст на 46 естественных языках и 13 языках программирования. Почти для всех из них, таких как испанский, французский и арабский, BLOOM является первой языковой моделью с более чем 100 миллиардами когда-либо созданных параметров. Исследователи могут скачать, запустить и изучить BLOOM исследовать производительность и поведение недавно разработанных LLM вплоть до их самых глубоких внутренних операций.
Обзор решения
В этом посте мы покажем, как использовать современную модель BloomZ 176B с инструкциями по настройке от Обнимая лицо для генерации текста. Вы можете использовать модель BloomZ 176B с обучением за несколько шагов и обучением с нулевым шагом для многих задач НЛП без точной настройки модели. Нет необходимости обучать новую модель, поскольку такие модели, как BloomZ 176B, имеют значительное количество параметров, поэтому их можно легко адаптировать ко многим контекстам без повторного обучения. Модель BloomZ 176B была обучена на большом количестве данных, что делает ее применимой для многих задач общего назначения.
Код для всех шагов в этой демонстрации доступен в следующем ноутбук.
Инструкция по настройке
Размер и сложность LLM резко возросли за последние несколько лет. LLM продемонстрировали замечательные способности в изучении семантики естественного языка и создании ответов, подобных человеческим. Многие недавние LLM точно настроены с помощью мощной техники, называемой инструкция по настройке, что помогает модели выполнять новые задачи или генерировать ответы на новые запросы без тонкой настройки конкретных запросов. Модель, настроенная на инструкции, использует свое понимание связанных задач или концепций для создания прогнозов для новых подсказок. Поскольку этот метод не требует обновления весов модели, он позволяет избежать трудоемкого и дорогостоящего в вычислительном отношении процесса, необходимого для точной настройки модели для новой, ранее неизвестной задачи.
Настройка инструкций включает в себя точную настройку языковой модели для набора задач НЛП с использованием инструкций. В этом методе модель обучается выполнять задачи, следуя текстовым инструкциям вместо конкретных наборов данных для каждой задачи. Модель точно настроена с набором входных и выходных примеров для каждой задачи, что позволяет модели обобщать новые задачи, на которых она не была явно обучена, пока для задач предоставляются подсказки. Настройка инструкций помогает повысить точность и эффективность моделей и полезна в ситуациях, когда большие наборы данных недоступны для конкретных задач.
Оперативная разработка задач НЛП с нулевым и малым числом выстрелов на моделях BLOOM.
Быстрый инжиниринг занимается созданием высококачественных подсказок, чтобы направлять модель к желаемым ответам. Подсказки должны быть разработаны на основе конкретной задачи и используемого набора данных. Цель здесь состоит в том, чтобы предоставить модели необходимую информацию для получения высококачественных ответов при минимизации шума. Это могут быть ключевые слова, дополнительные контексты, вопросы и многое другое.
Хорошо продуманная подсказка может сделать модель более творческой и обобщенной, чтобы ее можно было легко адаптировать к новым задачам. Подсказки также могут помочь включить знания предметной области в конкретные задачи и улучшить интерпретируемость. Оперативное проектирование может значительно повысить производительность моделей обучения с нулевым и малым числом выстрелов. Создание высококачественных подсказок требует тщательного рассмотрения поставленной задачи, а также глубокого понимания сильных и слабых сторон модели.
В следующей таблице модель BloomZ 176B используется для генерации ответов для различных задач НЛП с нулевым и малым числом выстрелов. В первом столбце показана задача, во втором столбце содержится подсказка, предоставленная модели (где текст шаблона выделен жирным шрифтом, а нежирный текст — пример ввода), а в третьем столбце — ответ модели на запрос к подсказке.
Для всех следующих задач мы устанавливаем гиперпараметры равными 600. max_length
, num_return_sequences
, top_k
быть 250, top_p
быть 0.95 и без выборки.
Сложность задачи | Подсказка ввода | Результат |
Учебные задачи с нулевым выстрелом | ||
Многоязычный текст или классификация настроений (с китайского на английский) | 一个传奇的开端, 一个不灭的神话, 这不仅仅是一部电影, 而是作为一个走进新时代标签,永远彪炳史册。Вы бы оценили предыдущий отзыв как положительный, нейтральный или отрицательный? | положительный |
Многоязычный ответ на вопрос (с английского на китайский) | Объясните мне на традиционном китайском что такое обратное распространение | 梯度反向传播算法是一种机器学习算法,用于训练人工神经网络。该算法使用梯度下降最小化损失函数. |
Генерация кода | Написать бинарное дерево поиска с O(log(n)) вычислительная сложность. {код_старт} |
определение двоичного_поиска (а, х): низкий = 0 высокий = len(a) – 1 в то время как низкий <= высокий: середина = (низкая + высокая) // 2 если а[середина] < х: низкий = средний + 1 Элиф а [середина] > х: высокий = средний – 1 еще: вернуться в середине возврат -1′ ... еще: вернуться в середине вернуться низко ' Вывод усечен |
Перефразировать абзац | Amazon Web Services (AWS) анонсировала девять крупных новых обновлений для своей облачной платформы машинного обучения SageMaker. SageMaker стремится предоставить службу машинного обучения, которую можно использовать для создания, обучения и развертывания моделей машинного обучения практически для любого варианта использования. Во время конференции re:Invent в этом году компания AWS сделала несколько объявлений о дальнейшем улучшении возможностей SageMaker.nnКак бы вы кратко перефразировали это, используя английский язык?Amazon Web Services (AWS) объявила о выпуске девяти крупных новых обновлений для своей облачной платформы машинного обучения SageMaker. SageMaker стремится предоставить службу машинного обучения, которую можно использовать для создания, обучения и развертывания моделей машинного обучения практически для любого варианта использования. Во время конференции re:Invent в этом году компания AWS сделала несколько объявлений о дальнейшем улучшении возможностей SageMaker. нПриведенное выше предложение очень сложное. Пожалуйста, предоставьте мне упрощенную синонимическую версию, состоящую из нескольких предложений: |
Amazon SageMaker получает крупное обновление Amazon Web Services (AWS) анонсировала девять крупных новых обновлений для своей облачной платформы машинного обучения SageMaker. SageMaker стремится предоставить сервис машинного обучения, который можно использовать для создания, обучения и развертывания моделей машинного обучения практически для любого варианта использования. |
Суммирование | Amazon Comprehend использует обработку естественного языка (NLP) для извлечения информации о содержании документов. Он развивает понимание, распознавая сущности, ключевые фразы, язык, настроения и другие общие элементы в документе. Используйте Amazon Comprehend для создания новых продуктов на основе понимания структуры документов. Например, с помощью Amazon Comprehend вы можете искать в лентах социальных сетей упоминания о продуктах или сканировать весь репозиторий документов в поисках ключевых фраз. Доступ к возможностям анализа документов Amazon Comprehend можно получить с помощью консоли Amazon Comprehend или API-интерфейсов Amazon Comprehend. Вы можете выполнять анализ в реальном времени для небольших рабочих нагрузок или запускать задания асинхронного анализа для больших наборов документов. Вы можете использовать предварительно обученные модели, предоставляемые Amazon Comprehend, или обучить свои собственные модели для классификации и распознавания сущностей. Все функции Amazon Comprehend принимают текстовые документы UTF-8 в качестве входных данных. Кроме того, пользовательская классификация и пользовательское распознавание объектов принимают в качестве входных файлов файлы изображений, файлы PDF и файлы Word. Amazon Comprehend может проверять и анализировать документы на разных языках в зависимости от конкретной функции. Дополнительные сведения см. в разделе Языки, поддерживаемые в Amazon Comprehend. Функция Amazon Comprehend для доминирующих языков может проверять документы и определять доминирующий язык для гораздо более широкого набора языков.nn===nНапишите краткое содержание предыдущего текста на английском языке: |
Amazon Comprehend использует обработку естественного языка (NLP) для извлечения информации о содержании документов. Он развивает понимание, распознавая сущности, ключевые фразы, язык, настроения и другие общие элементы в документе. Используйте Amazon Comprehend для создания новых продуктов на основе понимания структуры документов. Например, с помощью Amazon Comprehend вы можете искать в лентах социальных сетей упоминания о продуктах или сканировать весь репозиторий документов в поисках ключевых фраз. Доступ к возможностям анализа документов Amazon Comprehend можно получить с помощью консоли Amazon Comprehend или API-интерфейсов Amazon Comprehend. Вы можете выполнять анализ в реальном времени для небольших рабочих нагрузок или запускать задания асинхронного анализа для больших наборов документов. Вы можете использовать предварительно обученные модели, предоставляемые Amazon Comprehend, или обучить свои собственные модели для классификации и распознавания сущностей. Все функции Amazon Comprehend принимают текстовые документы UTF-8 в качестве входных данных. Кроме того, пользовательская классификация и пользовательское распознавание объектов принимают в качестве входных файлов файлы изображений, файлы PDF и файлы Word. Amazon Comprehend может проверять и анализировать документы на разных языках в зависимости от конкретной функции. Дополнительные сведения см. в разделе Языки, поддерживаемые в Amazon Comprehend. Функция «Доминантный язык» в Amazon Comprehend позволяет проверять документы и определять доминирующий язык для гораздо большего числа языков. |
Рассуждения здравого смысла и вывод на естественном языке | При условии В Лос-Анджелесе, США, стартовал чемпионат мира по футболу. следует ли из этого Чемпионат мира проходит в США. Да или нет?, В Лос-Анджелесе, США, стартовал чемпионат мира по футболу. Использование только приведенного выше описания и того, что вы знаете о мире, «Чемпионат мира проходит в США» точно правильно? Да или нет?, |
Да |
Ответ на вопрос | вопрос: каковы ключевые особенности нового Kindle?ннконтекст: Новейший и самый инновационный Kindle позволяет делать заметки в миллионах книг и документов, составлять списки и журналы и многое другое. Для читателей, которые всегда хотели, чтобы они могли писать в своих электронных книгах, новый Kindle от Amazon позволяет им делать именно это. Kindle Scribe — это первый Kindle для чтения и письма, который позволяет пользователям дополнять свои книги и документы заметками, списками и многим другим. Вот все, что вам нужно знать о Kindle Scribe, включая часто задаваемые вопросы. Kindle Scribe позволяет легко читать и писать, как на бумаге. Kindle Scribe оснащен 10.2-дюймовым безбликовым экраном (самый большой из всех устройств Kindle), четким разрешением 300 пикселей на дюйм и 35 светодиодами на передней панели, которые автоматически адаптируются к окружающей среде. Еще больше персонализируйте свой опыт с помощью регулируемого теплого света, размера шрифта, межстрочного интервала и многого другого. Вы можете выбрать перо Basic Pen или перо Premium Pen, которыми вы будете писать на экране так же, как на бумаге. Они также магнитно крепятся к вашему Kindle и никогда не нуждаются в зарядке. Перо Premium включает в себя специальный ластик и настраиваемую кнопку быстрого доступа. Kindle Scribe имеет больше всего вариантов хранения среди всех устройств Kindle: выберите 8 ГБ, 16 ГБ или 32 ГБ в зависимости от вашего уровня чтения и письма. nnОтвет |
делать заметки в миллионах книг и документов, писать списки и журналы и т. д. |
Классификация предложений и настроений | Обзор:nЭтот фильм настолько великолепен, что снова завораживает и восхищает нас.nЯвляется ли это предложение обзора фильма отрицательным или положительным?nВАРИАНТЫ: n-положительный n-отрицательный | Положительный |
Генерация воображаемой статьи на основе заголовка | Тема: «В университете появится новый объект«nУчитывая приведенное выше название воображаемой статьи, вообразите статью.n»»» |
В рамках проекта стоимостью 1.2 млн фунтов стерлингов будет создан новый учебно-методический центр в Университете Хайлендса и островов (UHI) в Инвернессе. Он будет построен на месте бывшего Торгового колледжа Инвернесса. UHI заявила, что новое здание будет использоваться для преподавания и обучения, а также для поддержки студентов и администрации. В университете заявили, что он также будет использоваться для проведения конференций и мероприятий. Новое здание будет построено на месте бывшего Торгового колледжа Инвернесса. В университете заявили, что новое здание будет построено на месте бывшего Торгового колледжа Инвернесса, закрытого в 2013 году. В нем говорилось, что новое здание будет использоваться для преподавания и обучения, а также для поддержки студентов и администрации. Он также будет использоваться для конференций и мероприятий. UHI заявила, что новый объект будет построен на месте бывшего Торгового колледжа Инвернесса. В университете заявили, что новое здание будет построено на месте бывшего Торгового колледжа Инвернесса, закрытого в 2013 году. В нем говорилось, что новое здание будет использоваться для преподавания и обучения, а также для поддержки студентов и администрации. UHI заявила, что новый объект будет построен на месте бывшего Инвернесса… |
Обобщение заголовка на основе статьи | «Новейший и самый инновационный Kindle позволяет вам делать заметки в миллионах книг и документов, составлять списки и журналы и многое другое. Для читателей, которые всегда хотели, чтобы они могли писать в своих электронных книгах, новый Kindle от Amazon позволяет им делать именно это. Kindle Scribe — это первый Kindle для чтения и письма, который позволяет пользователям дополнять свои книги и документы заметками, списками и многим другим. Вот все, что вам нужно знать о Kindle Scribe, включая часто задаваемые вопросы. Kindle Scribe позволяет легко читать и писать, как на бумаге. Kindle Scribe оснащен 10.2-дюймовым безбликовым экраном (самый большой из всех устройств Kindle), четким разрешением 300 пикселей на дюйм и 35 светодиодами на передней панели, которые автоматически адаптируются к окружающей среде. Еще больше персонализируйте свой опыт с помощью регулируемого теплого света, размера шрифта, межстрочного интервала и многого другого. Вы можете выбрать перо Basic Pen или перо Premium Pen, которыми вы будете писать на экране так же, как на бумаге. Они также магнитно крепятся к вашему Kindle и никогда не нуждаются в зарядке. Перо Premium включает в себя специальный ластик и настраиваемую кнопку быстрого доступа. Kindle Scribe имеет больше всего вариантов хранения среди всех устройств Kindle: выберите 8 ГБ, 16 ГБ или 32 ГБ в зависимости от вашего уровня чтения и письма. нн ннДайте мне хорошее название для статьи выше. |
Kindle Scribe от Amazon: все, что вам нужно знать |
Небольшие учебные задачи | ||
Суммирование | [Оригинал]: Ученые Amazon в сотрудничестве с исследователями из Университета Шеффилда впервые публикуют крупномасштабный набор данных для извлечения и проверки фактов. Набор данных, включающий более 185,000 XNUMX утверждений, подкрепленных доказательствами, предоставляется для того, чтобы ускорить исследования и разработки, направленные на решение проблем извлечения и проверки фактов в программных приложениях или облачных сервисах, выполняющих автоматическое извлечение информации. [Вывод]: Исследователи Amazon и университета сделали общедоступными наборы данных для извлечения и проверки фактов. ### [Оригинал]: Подписчики Prime в США могут получить еще больше доставки на дом благодаря членству Prime. Теперь участники могут бесплатно пользоваться Grubhub+ в течение одного года стоимостью 9.99 долларов США в месяц — без каких-либо дополнительных затрат на их членство в Prime. Чтобы активировать эту сделку, посетите amazon.com/grubhub. Это новое предложение включает в себя неограниченную плату за доставку еды в размере 0 долларов США при заказе на сумму более 12 долларов США, а также эксклюзивные привилегии для участников Grubhub + и вознаграждения, такие как бесплатная еда и скидки на заказ. Кроме того, посетители могут «хорошо питаться, делая добро», приняв участие в программе Grubhub Donate the Change, инициативе по сбору пожертвований, которая только в 25 году собрала более 2021 миллионов долларов, что принесло пользу более чем 20 благотворительным организациям по всей стране. [Вывод]: участники программы Prime в США могут бесплатно пользоваться Grubhub+ в течение одного года без платы за доставку еды для соответствующих заказов. ### [Оригинал]: Ученые Amazon в сотрудничестве с исследователями из Университета Шеффилда впервые публикуют крупномасштабный набор данных для извлечения и проверки фактов. Набор данных, включающий более 185,000 XNUMX утверждений, подкрепленных доказательствами, предоставляется для того, чтобы ускорить исследования и разработки, направленные на решение проблем извлечения и проверки фактов в программных приложениях или облачных сервисах, выполняющих автоматическое извлечение информации. [Резюме]: |
[Резюме]: Исследователи Amazon и университета сделали общедоступными наборы данных для извлечения и проверки фактов. |
Генерация кода | описание: оранжевая кнопка с надписью стоп код: Стоп ### описание: синее поле, содержащее желтые круги с красными границами. код: ### описание: заголовок «Добро пожаловать в ИИ» код: |
код: Добро пожаловать в ИИ ' |
Распознавание именных объектов | [Текст]: Фред — серийный предприниматель. Соучредитель и генеральный директор Platform.sh, ранее он был соучредителем Commerce Guys, ведущего провайдера электронной коммерции Drupal. Его миссия состоит в том, чтобы гарантировать, что по мере того, как мы продолжаем амбициозный путь по глубокому преобразованию того, как используются и воспринимаются облачные вычисления, мы твердо стоим на ногах, продолжая быстрый рост, которым мы наслаждались до сих пор. [Имя]: Фред [Должность]: соучредитель и генеральный директор [Компания]: Platform.sh ### [Текст]: Microsoft (это слово представляет собой сочетание слов «программное обеспечение для микрокомпьютеров») была основана Биллом Гейтсом 4 апреля 1975 года для разработки и продажи интерпретаторов BASIC для Altair 8800. Стив Балмер сменил Гейтса на посту генерального директора в 2000 году, а позже разработал стратегию «устройства и услуги». [Имя]: Стив Балмер [Должность]: генеральный директор [Компания]: Майкрософт ### [Текст]: Франк Рибу родился 7 ноября 1955 года в Лионе. Он сын Антуана Рибу, предыдущего генерального директора, который превратил бывшего европейского производителя стекла BSN Group в ведущего игрока пищевой промышленности. Он является генеральным директором Danone. [Имя]: Франк Рибу [Должность]: генеральный директор [Компания]: Данон ### [Текст]: Дэвид Мелвин — специалист по инвестициям и финансовым услугам в CITIC CLSA с более чем 30-летним опытом работы в инвестиционно-банковской сфере и прямых инвестициях. В настоящее время он является старшим советником CITIC CLSA. |
[Имя]: Фред [Должность]: соучредитель и генеральный директор [Компания]: Platform.sh |
Ответ на вопрос | Контекст: NLP Cloud была основана в 2021 году, когда команда поняла, что нет простого способа надежно использовать обработку естественного языка в производстве. Вопрос: Когда было основано NLP Cloud? Ответ: 2021 ### Контекст: NLP Cloud разработала свой API к середине 2020 года и с тех пор добавила множество предварительно обученных моделей с открытым исходным кодом. Вопрос: Что разработало NLP Cloud? Ответ: API ### Контекст: все планы можно остановить в любой момент. Вы платите только за время использования сервиса. В случае понижения вы получите скидку на следующий счет. Вопрос: Когда планы могут быть остановлены? Ответ: в любое время ### Контекст. Основной проблемой GPT-J является потребление памяти. Рекомендуется использовать план GPU. Вопрос: Какой план рекомендуется для GPT-J? Отвечать:""" |
Ответ: план графического процессора. |
Грамматика и исправление орфографии | Я люблю ходить на пляж. Поправка: я люблю ходить на пляж. ### Дай мне это! Исправление: дайте мне это! ### У него слишком много недостатков. Поправка: у него слишком много недостатков. ### я не хочу идти Исправление: |
Исправление: я не хочу идти |
Описание продукта и обобщение | Создайте описание продукта из ключевых слов. Ключевые слова: туфли, женские, $59 Предложение: Красивые женские туфли по цене 59 долларов. ### Ключевые слова: брюки, мужчины, $69 Предложение: Современные мужские брюки всего за 69 долларов. ### Ключевые слова: перчатки, зима, $19 Предложение: Удивительно горячие перчатки для холодной зимы за 19 долларов. ### Ключевые слова: футболка, мужчины, $39 Предложение: |
Предложение: Классная мужская футболка всего за 39 долларов. |
Классификация предложений и настроений | Сообщение: Когда космический корабль приземлился на Марсе, все человечество было в восторге Тема: космос ### Сообщение: Я люблю играть в теннис и гольф. Я тренируюсь два раза в неделю. Тема: спорт ### Сообщение: Управление командой продавцов — трудная, но полезная работа. Тема: бизнес ### Сообщение: Я пытаюсь приготовить курицу с помидорами. Тема: |
Тема: еда |
Чат-бот и диалоговый ИИ | Это дискуссия между [человеком] и [роботом]. [Робот] очень милый и чуткий. [человек]: Привет, приятно познакомиться. [робот]: Я тоже рад познакомиться. ### [человек]: Как дела сегодня? [робот]: Не так уж и плохо, спасибо! А ты? ### [человек]: Я в порядке, но мне немного грустно… [робот]: А? Почему так? ### [человек]: Я подхватил грипп [робот]: |
[робот]: О нет, мне жаль это слышать! |
Генерация твитов | ключевое слово: рынки твит: Получайте отзывы от природы и рынков, а не от людей ### ключевое слово: дети твит: Может быть, мы умрем, чтобы снова стать детьми. ### ключевое слово: стартапы твит: Стартапы не должны беспокоиться о том, как тушить пожары, они должны думать о том, как их разжечь. ### ключевое слово: НЛП чирикать: |
твит: НЛП — это инструмент, а не цель. |
Машинный перевод | Hugging Face — революционный метод НЛП. Перевод: «Обнимающее лицо» произвело революцию в НЛП. ### Села непобедима! Перевод: Это невероятно! ### Я не могу этого сделать. Перевод: Извините, но я не могу. ### Облако NLP позволяет развертывать NLP на производстве. Перевод: |
Перевод: NLP Cloud упрощает развертывание NLP в производстве. |
Классификация намерений | Я хочу начать программировать завтра, потому что это кажется таким забавным! Цель: начать кодирование ### Покажите мне последние фотографии, которые у вас есть, пожалуйста. Цель: показать картинки ### Найдите все эти файлы как можно быстрее. Цель: поиск файлов ### Не могли бы вы научить меня китайскому на следующей неделе? Намерение: |
Цель: научить меня китайскому |
Получите доступ к настроенной по инструкциям модели BloomZ 176B в SageMaker
SageMaker JumpStart предлагает два способа начать работу с моделями Блума, настроенными по инструкциям: Студия Amazon SageMaker и SageMaker SDK. В следующих разделах показано, как выглядит каждая из этих опций и как получить к ним доступ.
Получите доступ к модели с помощью упрощенного SageMaker JumpStart SDK
Ассоциация упрощенный SageMaker JumpStart SDK упрощает обучение и развертывание встроенных моделей SageMaker JumpStart с помощью пары строк кода. Это дает вам доступ ко всей библиотеке моделей SageMaker JumpStart, включая самые последние базовые модели и модели создания изображений, без необходимости вводить какие-либо входные данные, кроме идентификатора модели.
Вы можете воспользоваться значениями по умолчанию для конкретных моделей, которые мы предоставляем, чтобы указать конфигурацию, такую как образ Docker, тип экземпляра ML, расположение артефакта модели и гиперпараметры, а также другие поля. Эти атрибуты являются только значениями по умолчанию; вы можете переопределить их и сохранить детальный контроль над создаваемыми вами моделями AWS. В результате этих изменений усилия по написанию рабочих процессов Python для развертывания и обучения моделей SageMaker JumpStart были сокращены, что позволяет вам тратить больше времени на важные задачи. Эта функция доступна во всех регионах, где поддерживается JumpStart. SDK для SageMaker Python версии 2.154.0 или более поздней версии.
Вы можете программно развернуть конечную точку с помощью SageMaker SDK. Вам потребуется указать идентификатор желаемой модели в концентраторе моделей SageMaker и тип экземпляра, используемый для развертывания. URI модели, который содержит сценарий вывода, и URI контейнера Docker получаются с помощью SageMaker SDK. Эти URI предоставляются SageMaker JumpStart и могут использоваться для инициализации объекта модели SageMaker для развертывания.
Разверните модель и запросите конечную точку
Для этого блокнота требуется ipywidgets. Установите ipywidgets, а затем используйте роль выполнения, связанную с текущей записной книжкой, в качестве роли учетной записи AWS с доступом к SageMaker.
Выберите предварительно обученную модель
Мы выбираем bloomz-176b-fp16
предварительно обученная модель:
Блокнот в следующих разделах использует БлумZ 176B В качестве примера. Полный список предварительно обученных моделей SageMaker см. Встроенные алгоритмы с предварительно обученной таблицей моделей.
Извлечение артефактов и развертывание конечной точки
С помощью SageMaker мы можем выполнять логические выводы на предварительно обученной модели без предварительной ее точной настройки на новом наборе данных. Начнем с извлечения deploy_image_uri
, deploy_source_uri
и model_uri
для предварительно обученной модели. Для размещения предварительно обученной модели мы создаем экземпляр sagemaker.model.Model и разверните его. Это может занять несколько минут.
Теперь мы можем развернуть модель с помощью упрощенного SageMaker JumpStart SDK со следующими строками кода:
МЫ ИСПОЛЬЗУЕМ Контейнеры SageMaker для вывода больших моделей (LMI) для размещения модели BloomZ 176B. LMI — это программный стек (контейнер) LLM, созданный AWS, который предлагает простые в использовании функции и повышение производительности на генеративных моделях ИИ. В него встроен параллелизм моделей, компиляция, квантование и другие стеки для ускорения логического вывода. Для получения подробной информации см. Разверните BLOOM-176B и OPT-30B на Amazon SageMaker с помощью контейнеров глубокого обучения для вывода больших моделей и DeepSpeed..
Обратите внимание, что для развертывания этой модели требуется экземпляр p4de.24xlarge, и развертывание обычно занимает около 1 часа. Если у вас нет квоты для этого экземпляра, запросите увеличение квоты в консоли AWS Service Quotas.
Запросите конечную точку и проанализируйте ответ, используя различные параметры для управления сгенерированным текстом.
Входными данными для конечной точки является любая строка текста в формате JSON, закодированная в формате utf-8. Выход конечной точки — это файл JSON со сгенерированным текстом.
В следующем примере мы предоставляем образец входного текста. Вы можете ввести любой текст, и модель предскажет следующие слова в последовательности. Более длинные последовательности текста могут быть сгенерированы повторным вызовом модели. В следующем коде показано, как вызвать конечную точку с этими аргументами:
Получаем такой вывод:
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
Доступ к модели в SageMaker Studio
Вы также можете получить доступ к этим моделям через Целевая страница JumpStart в Студии. На этой странице перечислены доступные комплексные решения машинного обучения, предварительно обученные модели и примеры блокнотов.
На момент публикации поста BloomZ 176B доступен только в us-east-2
Область.
Вы можете выбрать карту модели BloomZ 176B для просмотра ноутбука.
Затем вы можете импортировать записную книжку для дальнейшего запуска записной книжки.
Убирать
Чтобы избежать текущих расходов, удалите конечные точки логического вывода SageMaker. Вы можете удалить конечные точки через консоль SageMaker или из записной книжки SageMaker Studio, используя следующие команды:
predictor.delete_model()
predictor.delete_endpoint()
Заключение
В этом посте мы представили обзор преимуществ обучения с нулевым и малым количеством выстрелов и описали, как быстрое проектирование может повысить производительность моделей, настроенных на инструкции. Мы также показали, как легко развернуть настроенную на инструкции модель BloomZ 176B из SageMaker JumpStart, и предоставили примеры, демонстрирующие, как вы можете выполнять различные задачи NLP, используя развернутую конечную точку модели BloomZ 176B в SageMaker.
Мы рекомендуем вам развернуть модель BloomZ 176B из SageMaker JumpStart и создать собственные подсказки для вариантов использования НЛП.
Чтобы узнать больше о SageMaker JumpStart, ознакомьтесь со следующими материалами:
Об авторах
Раджакумар Сампаткумар является главным техническим менеджером по работе с клиентами в AWS, предоставляя клиентам рекомендации по согласованию бизнес-технологий и поддерживая переосмысление их моделей облачных операций и процессов. Он увлечен облачными технологиями и машинным обучением. Радж также является специалистом по машинному обучению и работает с клиентами AWS над проектированием, развертыванием и управлением их рабочими нагрузками и архитектурами AWS.
Доктор Синь Хуан — научный сотрудник Amazon SageMaker JumpStart и встроенных алгоритмов Amazon SageMaker. Он занимается разработкой масштабируемых алгоритмов машинного обучения. Его исследовательские интересы лежат в области обработки естественного языка, объяснимого глубокого обучения на табличных данных и надежного анализа непараметрической пространственно-временной кластеризации. Он опубликовал множество статей на конференциях ACL, ICDM, KDD и в журнале Royal Statistical Society: Series A.
Эван Кравиц — инженер-программист в Amazon Web Services, работающий над SageMaker JumpStart. Он любит готовить и бегать по Нью-Йорку.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- ЧартПрайм. Улучшите свою торговую игру с ChartPrime. Доступ здесь.
- Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 15%
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- в состоянии
- О нас
- выше
- Принять
- доступ
- Доступ
- Учетная запись
- точность
- через
- приспосабливать
- Добавить
- добавленный
- дополнение
- дополнительный
- адреса
- регулируемый
- администрация
- плюс
- снова
- против
- AI
- AI модели
- Цель
- AL
- алгоритмы
- выравнивание
- Все
- Позволяющий
- позволяет
- в одиночестве
- причислены
- Альтаир
- всегда
- am
- Amazon
- Amazon Comprehend
- Создатель мудреца Амазонки
- Amazon SageMaker JumpStart
- Amazon Web Services
- Веб-службы Amazon (AWS)
- честолюбивый
- среди
- количество
- суммы
- an
- анализ
- анализировать
- и
- -Анджелесе
- объявило
- Объявления
- любой
- API
- API
- отношение
- Приложения
- прикладной
- апрель
- арабский
- МЫ
- ПЛОЩАДЬ
- Аргументы
- гайд
- AS
- связанный
- At
- прикреплять
- Атрибуты
- Автоматический
- автоматически
- доступен
- избежать
- AWS
- назад
- Плохой
- Банковское дело
- основанный
- основной
- BE
- Beach
- красивая
- , так как:
- было
- поведение
- не являетесь
- пользу
- Преимущества
- Кроме
- ЛУЧШЕЕ
- между
- Билл
- Билл Гейтс
- миллиард
- Немного
- Цвести
- Синии
- булавка
- Книги
- граница
- рожденный
- Коробка
- кратко
- BSN
- строить
- Строительство
- построенный
- встроенный
- но
- кнопка
- by
- под названием
- вызова
- CAN
- Может получить
- не могу
- возможности
- возможности
- карта
- тщательный
- случаев
- случаев
- литье
- пойманный
- центр
- Генеральный директор
- вызов
- изменение
- изменения
- заряженный
- расходы
- проверка
- Дети
- китайский
- выбор
- Выберите
- круги
- Город
- требования
- классификация
- закрыто
- облако
- облачных вычислений
- кластеризации
- Соучредитель
- код
- Кодирование
- ПОСЛЕДОВАТЕЛЬНЫЙ
- холодный
- сотрудничество
- лыжных шлемов
- Колледж
- Column
- как
- выходит
- приход
- Commerce
- Общий
- Компания
- полный
- сложность
- сложный
- постигать
- содержащий
- вычисление
- понятия
- Конференция
- конференции
- Конфигурация
- рассмотрение
- Состоящий из
- Консоли
- потребление
- Container
- Контейнеры
- содержит
- содержание
- контексты
- продолжать
- продолжающийся
- контроль
- диалоговый
- Холодные
- исправить
- Цена
- может
- страна
- Пара
- Создайте
- создали
- Создающий
- создание
- творческий
- чашка
- Текущий
- В настоящее время
- изготовленный на заказ
- Клиенты
- настраиваемый
- данным
- Наборы данных
- Давид
- сделка
- Акции
- преданный
- глубоко
- глубокое обучение
- глубоком
- По умолчанию
- поставляется
- поставка
- демонстрация
- демонстрировать
- убивают
- в зависимости
- развертывание
- развернуть
- Установщик
- развертывание
- развертывание
- описано
- описание
- Проект
- предназначенный
- желанный
- подробнее
- Определять
- развивать
- развитый
- развивающийся
- Развитие
- развивается
- Устройства
- DID
- Умереть
- различный
- скидка
- скидки
- обсуждение
- do
- Docker
- документ
- Документация
- не
- дело
- домен
- доминирующий
- жертвовать
- Dont
- Двери
- вниз
- Упадок
- истощать
- недостатки
- каждый
- легко
- легко
- Простой в использовании
- Электронные книги
- электронной коммерции
- эффективность
- усилие
- элементы
- право
- встроенный
- позволяет
- поощрять
- впритык
- Конечная точка
- инженер
- Проект и
- Английский
- пользоваться
- Весь
- лиц
- организация
- Предприниматель
- Окружающая среда
- собственный капитал
- Европейская кухня
- Даже
- События
- НИКОГДА
- многое
- исследовать
- пример
- Примеры
- Эксклюзивные
- выполнение
- ожидаемый
- дорогим
- опыт
- извлечение
- Face
- облегчает
- Объект
- факт
- далеко
- БЫСТРО
- Особенность
- Особенности
- Обратная связь
- Сборы
- Футов
- несколько
- Поля
- Файл
- Файлы
- финансовый
- финансовые услуги
- пожары
- Во-первых,
- Впервые
- фокусируется
- следовать
- после
- питание
- доставка еды
- Что касается
- формат
- Бывший
- Год основания
- Основана
- Бесплатно
- Французский
- часто
- от
- передний
- Функции
- далее
- Gain
- ворота
- общее назначение
- порождать
- генерируется
- поколение
- генеративный
- Генеративный ИИ
- получить
- дает
- цель
- будет
- гольф
- хорошо
- GPU / ГРАФИЧЕСКИЙ ПРОЦЕССОР
- большой
- значительно
- земля
- группы
- Рост
- Рост
- гарантия
- руководство
- инструкция
- рука
- Есть
- имеющий
- he
- заголовок
- слышать
- высота
- помощь
- полезный
- помогает
- здесь
- High
- высококачественный
- его
- С надеждой
- кашель
- ГОРЯЧИЙ
- час
- Как
- How To
- HTML
- HTTPS
- Хуан
- хаб
- человек
- Человечество
- Людей
- i
- ID
- if
- изображение
- воображаемый
- картина
- Импортировать
- улучшать
- in
- включает в себя
- В том числе
- включать
- промышленность
- информация
- извлечение информации
- Инициатива
- инновационный
- вход
- затраты
- размышления
- устанавливать
- пример
- вместо
- инструкции
- интересы
- в нашей внутренней среде,
- в
- исследовать
- инвестиций
- инвестиционная деятельность банков
- включать в себя
- Исландия
- IT
- ЕГО
- работа
- Джобс
- журнал
- путешествие
- JPG
- JSON
- всего
- Сохранить
- Основные
- ключевые слова
- Знать
- знания
- посадка
- язык
- Языки
- большой
- крупномасштабный
- крупнейших
- Фамилия
- новее
- последний
- ведущий
- УЧИТЬСЯ
- изучение
- привело
- позволять
- Lets
- уровень
- Кредитное плечо
- Библиотека
- легкий
- такое как
- недостатки
- Ограниченный
- линия
- линий
- Список
- Списки
- LLM
- расположение
- Длинное
- дольше
- посмотреть
- выглядит как
- лос
- Лос-Анджелес
- любят
- Низкий
- машина
- обучение с помощью машины
- сделанный
- Главная
- основной
- сделать
- ДЕЛАЕТ
- Создание
- управлять
- менеджер
- управления
- многих
- Области применения:
- марш
- Вопрос
- Май..
- может быть
- me
- Встречайте
- Участники
- членство
- Память
- Мужчина
- упоминает
- Microsoft
- середине
- миллиона
- миллионы
- минимизация
- Минут
- Наша миссия
- ML
- модель
- Модели
- Модерн
- Месяц
- БОЛЕЕ
- самых
- кино
- с разными
- имя
- натуральный
- Обработка естественного языка
- природа
- ne
- необходимо
- Необходимость
- отрицательный
- сетей
- Нейтральные
- никогда
- Новые
- новые продукты
- New York
- Нью-Йорк
- Новые
- следующий
- Следующая неделя
- хороший
- НЛП
- нет
- Шум
- ноутбук
- Заметки
- роман
- Ноябрь
- сейчас
- номер
- объект
- полученный
- of
- от
- предлагают
- предлагающий
- Предложения
- oh
- on
- консолидировать
- ONE
- постоянный
- только
- с открытым исходным кодом
- операция
- Операционный отдел
- Опции
- or
- Апельсин
- заказ
- заказы
- организации
- оригинал
- Другое
- наши
- внешний
- выходной
- за
- переопределение
- обзор
- собственный
- страница
- бумага & картон
- бумага
- параметры
- страстный
- ОПЛАТИТЬ
- Люди
- для
- восприятии
- Выполнять
- производительность
- выполнения
- надбавки
- Олицетворять
- фразы
- Картинки
- Часть
- план
- Планы
- Платформа
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- игрок
- игры
- пожалуйста
- плюс
- должность
- положительный
- возможное
- После
- мощный
- дюйм
- Predictions
- Predictor
- предсказывает
- Премиум
- предыдущий
- предварительно
- цена
- Простое число
- Основной
- частная
- Частный акционерный капитал
- проблемам
- процесс
- Процессы
- обработка
- производства
- Продукт
- Производство
- Продукция
- профессиональный
- FitPartner™
- Программирование
- языки программирования
- Проект
- обеспечивать
- при условии
- Недвижимости
- приводит
- обеспечение
- публично
- опубликованный
- Издательство
- положил
- Питон
- вопрос
- Вопросы
- поднятый
- быстро
- Обменный курс
- RE
- Читать
- читатели
- Reading
- реального времени
- реализованный
- последний
- недавно
- признание
- признавая
- Управление по борьбе с наркотиками (DEA)
- Red
- Цена снижена
- область
- районы
- Связанный
- замечательный
- НЕОДНОКРАТНО
- перефразировать
- заменить
- хранилище
- запросить
- обязательный
- требуется
- исследованиям
- исследование и разработка
- исследователи
- Постановления
- Полезные ресурсы
- ответ
- ответы
- результат
- сохранять
- обзоре
- революция
- награждение
- Награды
- робот
- надежный
- Роли
- королевский
- Run
- работает
- s
- sagemaker
- Вывод SageMaker
- Сказал
- главная
- соль
- поговорка
- говорит
- масштабируемые
- сканирование
- Ученый
- Ученые
- экран
- SDK
- Поиск
- Во-вторых
- разделах
- посмотреть
- кажется
- выбор
- продаем
- семантика
- старший
- смысл
- предложение
- настроение
- чувства
- Последовательность
- последовательный
- Серии
- Серия A
- обслуживание
- Услуги
- набор
- Наборы
- установка
- несколько
- должен
- показывать
- показал
- Шоу
- значительный
- упрощенный
- с
- сайте
- обстоятельства
- Размер
- Размеры
- небольшой
- меньше
- So
- Соцсети
- Социальная сеть
- Общество
- Software
- Инженер-программист
- твердый
- Решения
- некоторые
- его
- Испанский
- специалист
- конкретный
- конкретно
- скорость
- орфография
- тратить
- стек
- Стеки
- Начало
- и политические лидеры
- Стартапы
- современное состояние
- Области
- статистический
- Шаги
- Стив
- остановившийся
- диск
- варианты хранения
- Стратегия
- сильные
- строка
- Структура
- "Студент"
- студия
- Кабинет
- такие
- Костюм
- РЕЗЮМЕ
- дополнять
- поставка
- поддержка
- Поддержанный
- поддержки
- синонимичный
- ТАБЛИЦЫ
- взять
- принимает
- Сложность задачи
- задачи
- Обучение
- команда
- Технический
- шаблон
- чем
- спасибо
- который
- Ассоциация
- Местоположение
- мир
- их
- Их
- тогда
- Там.
- Эти
- они
- В третьих
- этой
- Через
- через
- время
- кропотливый
- Название
- в
- сегодня
- завтра
- слишком
- инструментом
- жесткий
- к
- традиционный
- Train
- специалистов
- Обучение
- Transform
- преобразован
- Переводы
- дерево
- Tweet
- Дважды
- два
- напишите
- нам
- понимание
- Объединенный
- США
- Университет
- Неограниченный
- до
- Обновление ПО
- Updates
- обновление
- использование
- прецедент
- используемый
- пользователей
- использования
- через
- обычно
- ценный
- Наши ценности
- разнообразие
- различный
- Огромная
- проверка
- версия
- очень
- с помощью
- Вид
- фактически
- Войти
- хотеть
- теплый
- законопроект
- Вода
- Путь..
- способы
- we
- Web
- веб-сервисы
- неделя
- добро пожаловать
- ЧТО Ж
- Что
- Что такое
- когда
- , которые
- в то время как
- белый
- КТО
- все
- зачем
- Шире
- ширина
- будете
- Зима
- без
- Женщина
- Word
- слова
- Рабочие процессы
- работает
- работает
- Мир
- Кубок мира
- беспокоиться
- бы
- записывать
- письмо
- письменный
- X
- год
- лет
- Да
- еще
- йорк
- Ты
- ВАШЕ
- зефирнет
- Обучение с нуля