Amazon SageMaker JumpStart це центр машинного навчання (ML), який пропонує алгоритми, моделі та рішення ML. Завдяки SageMaker JumpStart спеціалісти з машинного навчання можуть вибирати з постійного списку найефективніших і загальнодоступних моделі фундаменту (FMs), наприклад BLOOM, полум'я 2, Сокіл-40Б, Стабільна дифузія, OpenLLaMA, Флан-Т5/UL2, або FM від Cohere та LightOn.
У цій публікації та в блокноті, що додається, ми демонструємо, як розгорнути модель основи BloomZ 176B за допомогою Спрощений SDK SageMaker Python in Amazon SageMaker JumpStart як кінцеву точку та використовувати його для різних завдань обробки природної мови (NLP). Ви також можете отримати доступ до моделей основи через Студія Amazon SageMaker. Модель BloomZ 176B, одна з найбільших загальнодоступних моделей, є найсучаснішою моделлю, налаштованою на інструкції, яка може виконувати різноманітні завдання НЛП із короткочасним і нульовим навчанням у контексті. Налаштування інструкцій — це техніка, яка включає в себе точне налаштування мовної моделі для набору завдань НЛП за допомогою інструкцій. Щоб дізнатися більше про налаштування інструкцій, див Підказка Zero-shot для моделі основи Flan-T5 в Amazon SageMaker JumpStart.
Нульове навчання в НЛП дозволяє попередньо навченому LLM генерувати відповіді на завдання, для яких він не був спеціально навчений. У цій техніці модель забезпечується вхідним текстом і підказкою, яка описує очікуваний результат моделі природною мовою. Навчання з нульовим ударом використовується в різноманітних завданнях НЛП, таких як:
- Багатомовний текст і класифікація настроїв
- Багатомовне запитання та відповідь
- Генерація коду
- Перефразування абзацу
- Узагальнення
- Розуміння здорового глузду та висновок природної мови
- Відповідь на запитання
- Класифікація речень і настроїв
- Генерація уявної статті на основі назви
- Реферування заголовка за статтею
Поодиноке навчання передбачає навчання моделі виконувати нові завдання, наводячи лише кілька прикладів. Це корисно, коли обмежені позначені дані доступні для навчання. Навчання з кількома показами використовується для виконання різноманітних завдань, зокрема:
- Конспектування тексту
- Генерація коду
- Розпізнавання сутності імені
- Відповідь на запитання
- Виправлення граматики та орфографії
- Опис і узагальнення товару
- Класифікація речень і настроїв
- Чат-бот і розмовний ШІ
- Генерація твітів
- Автоматичний переклад
- Класифікація намірів
Про Блум
Багатомовна модель BigScience Large Open-science Open-access Multilingual (BLOOM) — це велика мовна модель (LLM) на основі трансформатора. BLOOM — це авторегресійний LLM, навчений продовжувати текст із підказки на великій кількості текстових даних за допомогою обчислювальних ресурсів промислового масштабу. Таким чином, він здатний виводити зв’язний текст, який важко відрізнити від тексту, написаного людьми. BLOOM також можна доручити виконувати текстові завдання, яким він не був спеціально навчений, присвоюючи їх як завдання генерування тексту.
Завдяки 176 мільярдам параметрів BLOOM здатний генерувати текст на 46 природних мовах і 13 мовах програмування. Майже для всіх з них, таких як іспанська, французька та арабська, BLOOM є першою моделлю мови з понад 100 мільярдами параметрів, коли-небудь створених. Дослідники можуть завантажуйте, запускайте та вивчайте BLOOM щоб дослідити продуктивність і поведінку нещодавно розроблених LLM аж до їх найглибших внутрішніх операцій.
Огляд рішення
У цьому дописі ми покажемо, як використовувати найсучаснішу модель BloomZ 176B із налаштуваннями інструкцій від Обіймати обличчя для створення тексту. Ви можете використовувати модель BloomZ 176B з поодиноким і нульовим навчанням для багатьох завдань НЛП без тонкого налаштування моделі. Немає потреби навчати нову модель, тому що такі моделі, як BloomZ 176B, мають значну кількість параметрів, тому їх можна легко адаптувати до багатьох контекстів без повторного навчання. Модель BloomZ 176B навчена великою кількістю даних, тому її можна застосовувати для багатьох завдань загального призначення.
Код для всіх кроків у цій демонстрації доступний нижче ноутбук.
Налаштування інструкції
За останні кілька років розмір і складність LLM зросли. LLM продемонстрували надзвичайні здібності у вивченні семантики природної мови та створенні людських відповідей. Багато останніх LLM налаштовані за допомогою потужної техніки під назвою налаштування інструкції, який допомагає моделі виконувати нові завдання або генерувати відповіді на нові підказки без точного налаштування підказок. Модель, налаштована на інструкції, використовує своє розуміння пов’язаних завдань або концепцій для створення передбачень для нових підказок. Оскільки ця методика не передбачає оновлення вагових коефіцієнтів моделі, вона дозволяє уникнути трудомісткого та обчислювально дорогого процесу, необхідного для точного налаштування моделі для нового, раніше небаченого завдання.
Налаштування інструкцій включає в себе тонке налаштування мовної моделі на збірці завдань НЛП за допомогою інструкцій. У цій техніці модель навчається виконувати завдання, дотримуючись текстових інструкцій замість конкретних наборів даних для кожного завдання. Модель налаштована за допомогою набору вхідних і вихідних прикладів для кожного завдання, що дозволяє моделі узагальнювати нові завдання, для яких вона не була явно навчена, якщо для завдань надаються підказки. Налаштування інструкцій допомагає підвищити точність і ефективність моделей і корисно в ситуаціях, коли великі набори даних недоступні для конкретних завдань.
Швидка розробка для завдань НЛП із нульовим і кількома випадками на моделях BLOOM
Швидка інженерія займається створенням високоякісних підказок, щоб направляти модель до бажаних відповідей. Підказки потрібно розробляти на основі конкретного завдання та набору даних, що використовується. Мета тут полягає в тому, щоб надати моделі необхідну інформацію для створення високоякісних відповідей при мінімізації шуму. Це може включати ключові слова, додаткові контексти, запитання тощо.
Добре розроблена підказка може зробити модель більш творчою та узагальненою, щоб вона могла легко адаптуватися до нових завдань. Підказки також можуть допомогти включити знання предметної області щодо конкретних завдань і покращити інтерпретацію. Своєчасне проектування може значно покращити продуктивність моделей навчання з нульовим і невеликим числом кадрів. Створення високоякісних підказок вимагає ретельного розгляду поставленого завдання, а також глибокого розуміння сильних сторін і обмежень моделі.
У наведеній нижче таблиці модель BloomZ 176B використовується для генерації відповідей на різноманітні нульові та невеликі завдання НЛП. У першому стовпці показано завдання, у другому стовпці міститься підказка, надана моделі (де текст шаблону виділено жирним шрифтом, а нежирний текст є прикладом введення), а третій стовпець містить відповідь моделі на запит щодо підказки
Для всіх наступних завдань ми встановлюємо гіперпараметри як 600 max_length
, num_return_sequences
, top_k
бути 250, top_p
бути 0.95, і немає вибірки.
Завдання | Оперативний вхід | Вихід |
Нульові навчальні завдання | ||
Багатомовний текст або класифікація настроїв (з китайської на англійську) | 一个传奇的开端,一个不灭的神话=,这不仅仅是一部电影,而是作为一个走进新时代的标签,永远彪炳史册。Ви б оцінили попередній відгук як позитивний, нейтральний чи негативний? | позитивний |
Багатомовні відповіді на запитання (з англійської на китайську) | Поясніть мені традиційною китайською що таке зворотне поширення | 梯度反向传播算法是一种机器学习算法,用于训练人工神经网络。该算法使用梯度下降来最小化损失函数。 |
Генерація коду | Написати двійкове дерево пошуку з O(log(n)) обчислювальна складність. {code_start} |
def binary_search(a, x): низький = 0 високий = len(a) – 1 поки низький <= високий: середній = (низький + високий) // 2 якщо a[mid] < x: низький = середній + 1 elif a[mid] > x: високий = середній – 1 ще: повернення середини повернення -1′ ... ще: повернення середини повернутися низько' Вихідні дані скорочуються |
Перефразуйте абзац | Amazon Web Services (AWS) анонсувала дев’ять основних оновлень для своєї хмарної платформи машинного навчання SageMaker. SageMaker прагне надати сервіс машинного навчання, який можна використовувати для створення, навчання та розгортання моделей ML практично для будь-яких випадків використання. Під час цьогорічної конференції re:Invent компанія AWS оголосила про подальше вдосконалення можливостей SageMaker.nnЯк би ви коротко перефразували це англійською?Amazon Web Services (AWS) анонсувала дев’ять основних оновлень для своєї хмарної платформи машинного навчання SageMaker. SageMaker прагне надати сервіс машинного навчання, який можна використовувати для створення, навчання та розгортання моделей ML практично для будь-яких випадків використання. Під час цьогорічної конференції re:Invent компанія AWS зробила кілька оголошень про подальше вдосконалення можливостей SageMaker. пНаведене вище речення дуже складне. Будь ласка, надайте мені спрощену синонімічну версію, що складається з кількох речень: |
Amazon SageMaker отримує серйозне оновлення Amazon Web Services (AWS) анонсувала дев’ять основних оновлень для своєї хмарної платформи машинного навчання SageMaker. SageMaker прагне надати сервіс машинного навчання, який можна використовувати для створення, навчання та розгортання моделей ML практично для будь-яких випадків використання |
Узагальнення | Amazon Comprehend використовує обробку природної мови (NLP) для отримання інформації про вміст документів. Він розвиває ідеї, розпізнаючи сутності, ключові фрази, мову, настрої та інші загальні елементи в документі. Використовуйте Amazon Comprehend для створення нових продуктів на основі розуміння структури документів. Наприклад, за допомогою Amazon Comprehend ви можете шукати згадки про продукти в каналах соціальних мереж або сканувати все сховище документів на пошук ключових фраз. Ви можете отримати доступ до можливостей аналізу документів Amazon Comprehend за допомогою консолі Amazon Comprehend або API Amazon Comprehend. Ви можете запускати аналіз у реальному часі для невеликих робочих навантажень або запускати асинхронні завдання аналізу для великих наборів документів. Ви можете використовувати попередньо підготовлені моделі, які надає Amazon Comprehend, або навчити власні власні моделі для класифікації та розпізнавання об’єктів. Усі функції Amazon Comprehend приймають текстові документи UTF-8 як вхідні дані. Крім того, настроювана класифікація та настроюване розпізнавання об’єктів приймають файли зображень, PDF-файли та файли Word як вхідні дані. Amazon Comprehend може досліджувати та аналізувати документи різними мовами залежно від конкретної функції. Додаткову інформацію див. у розділі «Мови, які підтримуються в Amazon Comprehend». Функція домінантної мови Amazon Comprehend може перевіряти документи та визначати домінуючу мову для значно більшого вибору мов.nn===nНапишіть короткий виклад попереднього тексту англійською мовою: |
Amazon Comprehend використовує обробку природної мови (NLP) для отримання інформації про вміст документів. Він розвиває ідеї, розпізнаючи сутності, ключові фрази, мову, настрої та інші загальні елементи в документі. Використовуйте Amazon Comprehend для створення нових продуктів на основі розуміння структури документів. Наприклад, за допомогою Amazon Comprehend ви можете шукати згадки про продукти в каналах соціальних мереж або сканувати все сховище документів на пошук ключових фраз. Ви можете отримати доступ до можливостей аналізу документів Amazon Comprehend за допомогою консолі Amazon Comprehend або API Amazon Comprehend. Ви можете запускати аналіз у реальному часі для невеликих робочих навантажень або запускати асинхронні завдання аналізу для великих наборів документів. Ви можете використовувати попередньо підготовлені моделі, які надає Amazon Comprehend, або навчити власні власні моделі для класифікації та розпізнавання об’єктів. Усі функції Amazon Comprehend приймають текстові документи UTF-8 як вхідні дані. Крім того, настроювана класифікація та настроюване розпізнавання об’єктів приймають файли зображень, PDF-файли та файли Word як вхідні дані. Amazon Comprehend може досліджувати та аналізувати документи різними мовами залежно від конкретної функції. Додаткову інформацію див. у розділі «Мови, які підтримуються в Amazon Comprehend». Функція домінантної мови Amazon Comprehend може перевіряти документи та визначати домінуючу мову для значно більшого вибору мов. |
Розуміння здорового глузду та висновок природної мови | За умови У американському Лос-Анджелесі стартував чемпіонат світу з футболу. Чи випливає з цього Чемпіонат світу проходить у США. Так або ні?, У американському Лос-Анджелесі стартував чемпіонат світу з футболу. Використовуючи лише наведений вище опис і те, що ви знаєте про світ, є «Чемпіонат світу проходить у США» точно правильно? Так або ні?, |
Так |
Відповідь на запитання | питання: які ключові особливості нового Kindle?nnКонтекст: Найновіший та найінноваційніший Kindle дозволяє робити нотатки про мільйони книг і документів, писати списки та щоденники тощо. Для читачів, які завжди хотіли мати можливість писати у своїх електронних книгах, новий Kindle від Amazon дозволяє це робити. Kindle Scribe — це перший Kindle для читання та письма, який дозволяє користувачам доповнювати свої книги та документи нотатками, списками тощо. Ось усе, що вам потрібно знати про Kindle Scribe, включно з поширеними запитаннями. Kindle Scribe дозволяє легко читати та писати, як на папері Kindle Scribe має 10.2-дюймовий екран без відблисків (найбільший з усіх пристроїв Kindle), чітку роздільну здатність 300 ppi і 35 світлодіодних передніх індикаторів, які автоматично підлаштовуються під ваше середовище. Ще більше персоналізуйте свій досвід за допомогою регульованого теплого світла, розміру шрифту, міжрядкового інтервалу тощо. Він поставляється з ручкою Basic Pen або Premium Pen, якою ви пишете на екрані, як на папері. Вони також прикріплюються до вашого Kindle за допомогою магніту, і їх ніколи не потрібно заряджати. Перо Premium Pen містить спеціальну гумку та настроювану кнопку швидкого доступу. Kindle Scribe має найбільше варіантів пам’яті з усіх пристроїв Kindle: виберіть із 8 ГБ, 16 ГБ або 32 ГБ відповідно до вашого рівня читання та запису. nnВідповідь |
робити нотатки про мільйони книг і документів, писати списки та журнали тощо |
Класифікація речень і настроїв | Рецензія: нЦей фільм такий чудовий, що знову засліплює та захоплює насnЦе речення рецензії на фільм негативне чи позитивне?nВАРІАНТИ:n-позитивний n-від’ємний | Позитивний |
Генерація уявної статті на основі назви | Назва: «Університет має нове приміщення”nВраховуючи наведену вище назву уявної статті, уявіть статтю.n””” |
Проект вартістю 1.2 мільйона фунтів стерлінгів передбачає створення нового центру викладання та навчання в Університеті Хайлендс і островів (UHI) в Інвернесі. Його побудують на місці колишнього коледжу торгівлі в Інвернесі. UHI сказав, що нове приміщення буде використовуватися для викладання та навчання, а також для підтримки та адміністрування студентів. Університет сказав, що його також використовуватимуть для конференцій та заходів. Нова будівля буде побудована на місці колишнього коледжу торгівлі в Інвернесі Університет заявив, що нова будівля буде побудована на місці колишнього Інвернесського коледжу торгівлі, який закрився в 2013 році. Було сказано, що новий заклад використовуватиметься для викладання та навчання, а також для підтримки та адміністрування студентів. Він також буде використовуватися для конференцій та заходів. UHI сказав, що новий заклад буде побудований на місці колишнього коледжу торгівлі в Інвернесі Університет заявив, що нова будівля буде побудована на місці колишнього Інвернесського коледжу торгівлі, який закрився в 2013 році. Було сказано, що новий заклад використовуватиметься для викладання та навчання, а також для підтримки та адміністрування студентів. UHI повідомила, що новий заклад буде побудований на місці колишнього Інвернесс… |
Реферування заголовка за статтею | «Найновіший і найінноваційніший Kindle дозволяє робити нотатки про мільйони книг і документів, писати списки та щоденники тощо. Для читачів, які завжди хотіли мати можливість писати у своїх електронних книгах, новий Kindle від Amazon дозволяє це робити. Kindle Scribe — це перший Kindle для читання та письма, який дозволяє користувачам доповнювати свої книги та документи нотатками, списками тощо. Ось усе, що вам потрібно знати про Kindle Scribe, включно з поширеними запитаннями. Kindle Scribe дозволяє легко читати та писати, як на папері Kindle Scribe має 10.2-дюймовий екран без відблисків (найбільший з усіх пристроїв Kindle), чітку роздільну здатність 300 ppi і 35 світлодіодних передніх індикаторів, які автоматично підлаштовуються під ваше середовище. Ще більше персоналізуйте свій досвід за допомогою регульованого теплого світла, розміру шрифту, міжрядкового інтервалу тощо. Він поставляється з ручкою Basic Pen або Premium Pen, якою ви пишете на екрані, як на папері. Вони також прикріплюються до вашого Kindle за допомогою магніту, і їх ніколи не потрібно заряджати. Перо Premium Pen містить спеціальну гумку та настроювану кнопку швидкого доступу. Kindle Scribe має найбільше варіантів пам’яті серед усіх пристроїв Kindle: виберіть із 8 ГБ, 16 ГБ або 32 ГБ відповідно до вашого рівня читання та запису. nn nnДайте мені гарну назву для статті вище. |
Amazon Kindle Scribe: усе, що вам потрібно знати |
Покрокові навчальні завдання | ||
Узагальнення | [Оригінал]: вчені Amazon у співпраці з дослідниками з Університету Шеффілда вперше оприлюднюють масштабний набір даних для вилучення фактів і перевірки. Набір даних, що містить понад 185,000 XNUMX тверджень, підтверджених доказами, стає доступним для того, щоб, як ми сподіваємося, каталізувати дослідження та розробки, які вирішують проблеми вилучення фактів і перевірки в програмних додатках або хмарних службах, які виконують автоматичне вилучення інформації. [Підсумок]: дослідники Amazon і університету роблять набір даних для вилучення фактів і перевірки загальнодоступним. # # # [Оригінал]: учасники Prime у США можуть отримати ще більше до своїх дверей завдяки членству Prime. Тепер учасники можуть безкоштовно насолоджуватися одним роком Grubhub+ вартістю 9.99 доларів США на місяць — без додаткової плати за членство Prime. Щоб активувати цю угоду, відвідайте amazon.com/grubhub. Ця нова пропозиція включає необмежену плату за доставку їжі в розмірі 0 доларів США за замовлення на суму понад 12 доларів США, а також ексклюзивні бонуси для учасників Grubhub+ і винагороди, як-от безкоштовна їжа та знижки на замовлення. Крім того, відвідувачі можуть «добро поїсти, роблячи добро», вибравши участь у програмі Grubhub Donate the Change, ініціативі зі збору пожертвувань, яка лише у 25 році зібрала понад 2021 мільйонів доларів США, надавши користь понад 20 благодійним організаціям по всій країні. [Підсумок]: Основні учасники в США можуть користуватися Grubhub+ протягом одного року безкоштовно, без плати за доставку їжі для відповідних замовлень. # # # [Оригінал]: вчені Amazon у співпраці з дослідниками з Університету Шеффілда вперше оприлюднюють масштабний набір даних для вилучення фактів і перевірки. Набір даних, що містить понад 185,000 XNUMX тверджень, підтверджених доказами, стає доступним для того, щоб, як ми сподіваємося, каталізувати дослідження та розробки, які вирішують проблеми вилучення фактів і перевірки в програмних додатках або хмарних службах, які виконують автоматичне вилучення інформації. [Резюме]: |
[Резюме]: Дослідники Amazon і Університету роблять набір даних для вилучення фактів і перевірки загальнодоступним. |
Генерація коду | опис: помаранчева кнопка з написом "стоп". код: Стоп # # # опис: синє поле, яке містить жовті кола з червоною рамкою код: # # # опис: заголовок Ласкаво просимо до ШІ Код: |
код: Ласкаво просимо до ШІ ' |
Розпізнавання сутності імені | [Текст]: Фред — серійний підприємець. Співзасновник і генеральний директор Platform.sh, раніше він був співзасновником Commerce Guys, провідного постачальника електронної комерції Drupal. Його місія полягає в тому, щоб гарантувати, що, продовжуючи амбітний шлях до глибокої трансформації використання та сприйняття хмарних обчислень, ми міцно тримаємося на землі, продовжуючи швидке зростання, яким насолоджувалися досі. [Ім'я]: Фред [Посада]: співзасновник і генеральний директор [Компанія]: Platform.sh # # # [Текст]: Майкрософт (слово є портманто від «програмне забезпечення для мікрокомп’ютерів») було засновано Біллом Гейтсом 4 квітня 1975 року для розробки та продажу інтерпретаторів BASIC для Altair 8800. Стів Балмер змінив Гейтса на посаді генерального директора в 2000 році, а пізніше передбачив стратегію «пристроїв і послуг». [Ім'я]: Стів Балмер [Посада]: Генеральний директор [Компанія]: Microsoft # # # [Текст]: Франк Рібу народився 7 листопада 1955 року в Ліоні. Він син Антуана Рібу, попереднього генерального директора, який перетворив колишнього європейського виробника скла BSN Group на провідного гравця харчової промисловості. Він є генеральним директором Danone. [Ім'я]: Франк Рібу [Посада]: Генеральний директор [Компанія]: Danone # # # [Текст]: Девід Мелвін — професіонал з інвестиційних та фінансових послуг у CITIC CLSA з понад 30-річним досвідом роботи в інвестиційній банківській сфері та прямих інвестиціях. Зараз він є старшим радником CITIC CLSA. |
[Ім'я]: Фред [Посада]: співзасновник і генеральний директор [Компанія]: Platform.sh |
Відповідь на запитання | Контекст: NLP Cloud було засновано у 2021 році, коли команда зрозуміла, що немає простого способу надійно використовувати обробку природної мови у виробництві. Питання: Коли була заснована NLP Cloud? Відповідь: 2021 # # # Контекст: NLP Cloud розробила свій API до середини 2020 року, і з тих пір вони додали багато попередньо навчених моделей з відкритим кодом. Питання: Що розробила NLP Cloud? Відповідь: API # # # Контекст: усі плани можна будь-коли припинити. Ви платите лише за час користування послугою. У разі зниження рівня ви отримаєте знижку на наступний рахунок. Питання: Коли плани можна зупинити? Відповідь: Будь-коли # # # Контекст: головною проблемою GPT-J є використання пам’яті. Рекомендовано використовувати план GPU. Запитання: який план рекомендовано для GPT-J? Відповідь:””” |
Відповідь: план GPU' |
Виправлення граматики та орфографії | Я люблю ходити на пляж. Виправлення: я люблю ходити на пляж. # # # Дай мені це! Виправлення: дайте мені це! # # # У нього занадто багато недоліків. Виправлення: у нього занадто багато недоліків. # # # Я не хочу йти виправлення: |
Виправлення: я не хочу йти |
Опис і узагальнення товару | Створіть опис продукту з ключових слів. Ключові слова: туфлі, жінки, 59 $ Речення: Гарне взуття для жінок за ціною 59$. # # # Ключові слова: штани, чоловіки, 69 $ Вирок: сучасні чоловічі штани всього за 69 доларів. # # # Ключові слова: рукавички, зима, 19 $ Речення: неймовірно гарячі рукавички для холодної зими за 19 доларів. # # # Ключові слова: футболка, чоловіча, 39 $ Вирок: |
Вирок: крута чоловіча футболка всього за 39 доларів. |
Класифікація речень і настроїв | Повідомлення: Коли космічний корабель приземлився на Марсі, все людство було в захваті Тема: космос # # # Повідомлення: я люблю грати в теніс і гольф. Я тренуюся двічі на тиждень. Тема: спорт # # # Повідомлення: Керувати командою продавців — важка, але корисна робота. Тема: бізнес # # # Повідомлення: Пробую приготувати курку з помідорами. Тема: |
Тема: їжа |
Чат-бот і розмовний ШІ | Це розмова між [людиною] та [роботом]. [Робот] дуже милий і чуйний. [людина]: Привіт, приємно познайомитися. [робот]: Я теж радий познайомитися. # # # [людина]: Як справи сьогодні? [робот]: Не так вже й погано, дякую! Як щодо тебе? # # # [людина]: Я в порядку, але мені трохи сумно… [робот]: О? Чому це? # # # [людина]: Я підхопив грип [робот]: |
[робот]: О ні, мені прикро це чути! |
Генерація твітів | Ключове слово: ринки твіт: Беріть відгуки від природи та ринків, а не від людей # # # Ключове слово: діти твіт: Можливо, ми помремо, щоб повернутися дітьми. # # # Ключове слово: стартапи твіт: Стартапи не повинні турбуватися про те, як загасити пожежі, вони повинні турбуватися про те, як їх розпалювати. # # # Ключове слово: nlp твіт: |
твіт: НЛП - це інструмент, а не мета. |
Автоматичний переклад | Hugging Face - революційний НЛП. Переклад: Hugging Face революціонізував НЛП. # # # Cela est incroyable! Переклад: Це неймовірно! # # # Désolé je ne peux pas. Переклад: Вибачте, але я не можу. # # # NLP Cloud дозволяє розгортати NLP у виробництві. Переклад: |
Переклад: NLP Cloud полегшує розгортання NLP у виробництві. |
Класифікація намірів | Я хочу почати кодувати завтра, тому що це, здається, так весело! Намір: почати кодування # # # Будь ласка, покажіть мені останні фотографії, які у вас є. Мета: показати малюнки # # # Шукайте всі ці файли якомога швидше. Мета: пошук файлів # # # Чи можете ви навчити мене китайської наступного тижня? Намір: |
Намір: навчити мене китайської |
Отримайте доступ до налаштованої моделі BloomZ 176B у SageMaker
SageMaker JumpStart пропонує два способи розпочати використання цих налаштованих інструкцій моделей Bloom: Студія Amazon SageMaker і SageMaker SDK. У наступних розділах показано, як виглядає кожен із цих параметрів і як до них отримати доступ.
Отримайте доступ до моделі за допомогою спрощеного SDK SageMaker JumpStart
Команда спрощений SageMaker JumpStart SDK полегшує навчання та розгортання вбудованих моделей SageMaker JumpStart за допомогою кількох рядків коду. Це дає вам доступ до всієї бібліотеки моделей SageMaker JumpStart, включаючи найновіші базові моделі та моделі генерації зображень, без необхідності вводити будь-які дані, окрім ідентифікатора моделі.
Ви можете скористатися спеціальними для моделі значеннями за замовчуванням, які ми надаємо, щоб указати конфігурацію, як-от образ Docker, тип екземпляра ML, розташування артефакту моделі та гіперпараметри, серед інших полів. Ці атрибути є лише значеннями за замовчуванням; ви можете замінити їх і зберегти детальний контроль над моделями AWS, які ви створюєте. У результаті цих змін було зменшено зусилля для написання робочих процесів Python для розгортання та навчання моделей SageMaker JumpStart, що дозволяє вам витрачати більше часу на важливі завдання. Ця функція доступна в усіх регіонах, де підтримується JumpStart, і до неї можна отримати доступ за допомогою SageMaker Python SDK версія 2.154.0 або пізніша версія.
Ви можете програмно розгорнути кінцеву точку за допомогою SDK SageMaker. Вам потрібно буде вказати ідентифікатор потрібної моделі в центрі моделей SageMaker і тип екземпляра, який використовується для розгортання. URI моделі, який містить сценарій висновку, і URI контейнера Docker отримують через SDK SageMaker. Ці URI надає SageMaker JumpStart і їх можна використовувати для ініціалізації об’єкта моделі SageMaker для розгортання.
Розгорніть модель і запитайте кінцеву точку
Для цього блокнота потрібні ipywidgets. Встановіть ipywidgets, а потім використовуйте роль виконання, пов’язану з поточним блокнотом, як роль облікового запису AWS із доступом до SageMaker.
Виберіть попередньо навчену модель
Вибираємо bloomz-176b-fp16
попередньо навчена модель:
Зошит у наступних розділах використовує BloomZ 176B як приклад. Повний список попередньо навчених моделей SageMaker див Вбудовані алгоритми з попередньо навченою таблицею моделей.
Отримайте артефакти та розгорніть кінцеву точку
За допомогою SageMaker ми можемо робити висновок на попередньо навченій моделі без попереднього тонкого налаштування на новому наборі даних. Ми починаємо з отримання deploy_image_uri
, deploy_source_uri
та model_uri
для попередньо навченої моделі. Щоб розмістити попередньо навчену модель, ми створюємо екземпляр sagemaker.model.Model і розгорнути його. Це може зайняти кілька хвилин.
Тепер ми можемо розгорнути модель за допомогою спрощеного SageMaker JumpStart SDK із такими рядками коду:
Ми використовуємо Контейнери великої моделі (LMI) SageMaker для розміщення моделі BloomZ 176B. LMI — це програмний стек (контейнер) LLM, створений AWS, який пропонує прості у використанні функції та підвищення продуктивності на генеративних моделях ШІ. У нього вбудовано паралелізм моделей, компіляцію, квантування та інші стеки для прискорення висновків. Детальніше див Розгорніть BLOOM-176B і OPT-30B на Amazon SageMaker із великими контейнерами глибокого навчання та DeepSpeed..
Зауважте, що для розгортання цієї моделі потрібен екземпляр p4de.24xlarge, а розгортання зазвичай займає близько 1 години. Якщо у вас немає квоти для цього екземпляра, подайте запит на збільшення квоти на консолі AWS Service Quotas.
Запитуйте кінцеву точку та аналізуйте відповідь, використовуючи різні параметри для керування згенерованим текстом
Вхідними даними для кінцевої точки є будь-який рядок тексту, відформатований як JSON і закодований у форматі utf-8. Результатом кінцевої точки є файл JSON із згенерованим текстом.
У наступному прикладі ми надаємо зразок тексту введення. Ви можете вводити будь-який текст, і модель передбачає наступні слова в послідовності. Довші послідовності тексту можна згенерувати повторним викликом моделі. У наступному коді показано, як викликати кінцеву точку з такими аргументами:
Ми отримуємо наступний результат:
['How to make a pasta? boil a pot of water and add salt. Add the pasta to the water and cook until al dente. Drain the pasta.']
Отримайте доступ до моделі в SageMaker Studio
Ви також можете отримати доступ до цих моделей через Цільова сторінка JumpStart в студії. На цій сторінці перераховано доступні наскрізні рішення ML, попередньо навчені моделі та приклади блокнотів.
На момент публікації публікації BloomZ 176B доступний лише в us-east-2
Регіон.
Ви можете вибрати картку моделі BloomZ 176B для перегляду блокнота.
Потім ви можете імпортувати блокнот для подальшого запуску блокнота.
Прибирати
Щоб уникнути поточних платежів, видаліть кінцеві точки висновку SageMaker. Ви можете видалити кінцеві точки за допомогою консолі SageMaker або з блокнота SageMaker Studio за допомогою таких команд:
predictor.delete_model()
predictor.delete_endpoint()
Висновок
У цьому дописі ми зробили огляд переваг нульового та малократного навчання та описали, як оперативне проектування може покращити продуктивність моделей, налаштованих на інструкції. Ми також показали, як легко розгорнути налаштовану за інструкціями модель BloomZ 176B із SageMaker JumpStart, і надали приклади, щоб продемонструвати, як можна виконувати різні завдання NLP, використовуючи розгорнуту кінцеву точку моделі BloomZ 176B у SageMaker.
Ми рекомендуємо вам розгорнути модель BloomZ 176B від SageMaker JumpStart і створити власні підказки для випадків використання NLP.
Щоб дізнатися більше про SageMaker JumpStart, перегляньте наступне:
Про авторів
Раджакумар Сампаткумар є головним технічним менеджером по роботі з клієнтами в AWS, надає клієнтам рекомендації щодо узгодження бізнес-технологій та підтримує оновлення їхніх моделей і процесів у хмарі. Він захоплений хмарним та машинним навчанням. Радж також є фахівцем з машинного навчання та працює з клієнтами AWS, щоб проектувати, розгортати й керувати їхніми робочими навантаженнями та архітектурами AWS.
Доктор Синь Хуан є прикладним науковцем для вбудованих алгоритмів Amazon SageMaker JumpStart і Amazon SageMaker. Він зосереджується на розробці масштабованих алгоритмів машинного навчання. Його наукові інтереси пов’язані з обробкою природної мови, глибоким вивченням табличних даних та надійним аналізом непараметричної просторово-часової кластеризації. Він опублікував багато робіт у конференціях ACL, ICDM, KDD та журналі Royal Statistical Society: Series A.
Еван Кравіц є інженером-програмістом Amazon Web Services, працює над SageMaker JumpStart. Йому подобається готувати і бігати в Нью-Йорку.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. Автомобільні / електромобілі, вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- ChartPrime. Розвивайте свою торгову гру за допомогою ChartPrime. Доступ тут.
- BlockOffsets. Модернізація екологічної компенсаційної власності. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/zero-shot-and-few-shot-prompting-for-the-bloomz-176b-foundation-model-with-the-simplified-amazon-sagemaker-jumpstart-sdk/
- : має
- :є
- : ні
- :де
- $UP
- 000
- 1
- 10
- 100
- 11
- 12
- 13
- 15%
- 16
- 20
- 2000
- 2013
- 2021
- 24
- 250
- 30
- 32
- 33
- 7
- 8
- a
- Здатний
- МЕНЮ
- вище
- Прийняти
- доступ
- доступний
- рахунки
- точність
- через
- пристосовувати
- додавати
- доданий
- доповнення
- Додатковий
- адреси
- регульований
- адміністрація
- Перевага
- знову
- проти
- AI
- Моделі AI
- Цілі
- AL
- алгоритми
- вирівнювання
- ВСІ
- Дозволити
- дозволяє
- тільки
- Також
- Альтаїр
- завжди
- am
- Amazon
- «Амазонка»
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Веб-служби Amazon (AWS)
- честолюбний
- серед
- кількість
- суми
- an
- аналіз
- аналізувати
- та
- -Анджелесі
- оголошений
- Сповіщення
- будь-який
- API
- Інтерфейси
- застосовно
- застосування
- прикладної
- квітня
- арабська
- ЕСТЬ
- ПЛОЩА
- аргументація
- стаття
- AS
- асоційований
- At
- приєднувати
- Атрибути
- автоматичний
- автоматично
- доступний
- уникнути
- AWS
- назад
- поганий
- Banking
- заснований
- основний
- BE
- Пляж
- красивий
- оскільки
- було
- поведінка
- буття
- вигода
- Переваги
- крім
- КРАЩЕ
- між
- Білл
- Білл Гейтс
- Мільярд
- Біт
- Цвісти
- синій
- сміливий
- книги
- border
- народжений
- Box
- коротко
- BSN
- будувати
- Створюємо
- побудований
- вбудований
- але
- button
- by
- званий
- покликання
- CAN
- Може отримати
- не може
- можливості
- можливості
- карта
- обережний
- випадок
- випадків
- лиття
- спійманий
- центр
- Генеральний директор
- виклик
- зміна
- Зміни
- стягується
- вантажі
- перевірка
- діти
- китайський
- вибір
- Вибирати
- кола
- Місто
- претензій
- класифікація
- закрито
- хмара
- хмарних обчислень
- Кластеризація
- Співзасновник
- код
- Кодування
- КОГЕРЕНТНИЙ
- холодний
- співробітництво
- збір
- коледж
- Колонка
- Приходити
- приходить
- майбутній
- Торгівля
- загальний
- компанія
- повний
- складність
- складний
- осягнути
- що включає
- обчислення
- поняття
- конференція
- конференції
- конфігурація
- розгляду
- Складається
- Консоль
- споживання
- Контейнер
- Контейнери
- містить
- зміст
- контексти
- продовжувати
- триває
- контроль
- діалоговий
- Прохолодно
- виправити
- Коштувати
- може
- країна
- Пара
- створювати
- створений
- створення
- створення
- Креатив
- Чашка
- Поточний
- В даний час
- виготовлений на замовлення
- Клієнти
- настроюється
- дані
- набори даних
- Девід
- угода
- Пропозиції
- присвячених
- глибокий
- глибоке навчання
- найглибший
- дефолт
- поставляється
- доставка
- демонстрація
- демонструвати
- продемонстрований
- Залежно
- розгортання
- розгорнути
- розгортач
- розгортання
- розгортання
- описаний
- description
- дизайн
- призначений
- бажаний
- деталі
- Визначати
- розвивати
- розвиненою
- розвивається
- розробка
- розвивається
- прилади
- DID
- Померти
- різний
- Знижка
- знижки
- обговорення
- do
- Docker
- документ
- документація
- Ні
- справи
- домен
- домінуючий
- жертвувати
- Не знаю
- Двері
- вниз
- Downgrade
- виснажувати
- недоліки
- кожен
- легко
- легко
- легкий у використанні
- Електронні книги
- електронної комерції
- ефективність
- зусилля
- елементи
- має право
- вбудований
- дозволяє
- заохочувати
- кінець в кінець
- Кінцева точка
- інженер
- Машинобудування
- англійська
- користуватися
- Весь
- юридичні особи
- суб'єкта
- Підприємець
- Навколишнє середовище
- капітал
- Європейська
- Навіть
- Події
- НІКОЛИ
- все
- досліджувати
- приклад
- Приклади
- Ексклюзивний курс
- виконання
- очікуваний
- дорогий
- досвід
- витяг
- Face
- полегшує
- Об'єкт
- факт
- далеко
- ШВИДКО
- особливість
- риси
- зворотний зв'язок
- Інформація про оплату
- ноги
- кілька
- Поля
- філе
- Файли
- фінансовий
- фінансові послуги
- пожежі
- Перший
- перший раз
- фокусується
- стежити
- після
- харчування
- доставка їжі
- для
- формат
- Колишній
- фонд
- Заснований
- Безкоштовна
- французька
- часто
- від
- перед
- Функції
- далі
- Отримувати
- Гейтс
- Головна мета
- породжувати
- генерується
- покоління
- генеративний
- Генеративний ШІ
- отримати
- дає
- мета
- буде
- гольф
- добре
- GPU
- великий
- значно
- Земля
- Group
- Зростання
- Зростання
- гарантувати
- керівництво
- керівництво
- рука
- Мати
- має
- he
- headline
- чути
- висота
- допомога
- корисний
- допомагає
- тут
- Високий
- високоякісний
- його
- З надією
- господар
- ГАРЯЧА
- годину
- Як
- How To
- HTML
- HTTPS
- хуан
- Концентратор
- людина
- Людство
- Людей
- i
- ID
- if
- зображення
- уявний
- картина
- імпорт
- удосконалювати
- in
- includes
- У тому числі
- включати
- промисловість
- інформація
- вилучення інформації
- Ініціатива
- інноваційний
- вхід
- витрати
- розуміння
- встановлювати
- екземпляр
- замість
- інструкції
- інтереси
- внутрішній
- в
- дослідити
- інвестиції
- інвестиційний банкінг
- залучати
- Острови
- IT
- ЙОГО
- робота
- Джобс
- журнал
- подорож
- JPG
- json
- просто
- тримати
- ключ
- ключові слова
- Знати
- знання
- посадка
- мова
- мови
- великий
- масштабний
- найбільших
- останній
- пізніше
- останній
- провідний
- УЧИТЬСЯ
- вивчення
- Led
- дозволяти
- дозволяє
- рівень
- Важіль
- бібліотека
- світло
- як
- недоліки
- обмеженою
- Лінія
- ліній
- список
- списки
- LLM
- розташування
- Довго
- довше
- подивитися
- виглядає як
- в
- Лос-Анджелес
- любов
- низький
- машина
- навчання за допомогою машини
- made
- головний
- основний
- зробити
- РОБОТИ
- Робить
- управляти
- менеджер
- управління
- багато
- ринки
- березня
- Матерія
- Може..
- може бути
- me
- Зустрічатися
- члени
- членство
- пам'ять
- люди
- згадує
- Microsoft
- В середині
- мільйона
- мільйони
- мінімізація
- хвилин
- Місія
- ML
- модель
- Моделі
- сучасний
- місяць
- більше
- найбільш
- фільм
- множинний
- ім'я
- Природний
- Обробка природних мов
- природа
- ne
- необхідно
- Необхідність
- негативний
- мережа
- Нейтральний
- ніколи
- Нові
- нові продукти
- Нью-Йорк
- Нью-Йорк
- новітній
- наступний
- наступного тижня
- приємно
- nlp
- немає
- шум
- ноутбук
- примітки
- роман
- Листопад
- зараз
- номер
- об'єкт
- отриманий
- of
- від
- пропонувати
- пропонує
- Пропозиції
- oh
- on
- один раз
- ONE
- постійний
- тільки
- з відкритим вихідним кодом
- операція
- операції
- Опції
- or
- помаранчевий
- порядок
- замовлень
- організації
- оригінал
- Інше
- наші
- з
- вихід
- над
- перевизначення
- огляд
- власний
- сторінка
- Папір
- документи
- параметри
- пристрасний
- Платити
- Люди
- для
- сприймається
- Виконувати
- продуктивність
- виконанні
- надбавки
- Уособлювати
- фрази
- фотографії
- місце
- план
- плани
- платформа
- plato
- Інформація про дані Платона
- PlatoData
- гравець
- ігри
- будь ласка
- плюс
- положення
- позитивний
- це можливо
- пошта
- потужний
- ppi
- Прогнози
- Прогноз
- Прогнози
- Premium
- попередній
- раніше
- price
- Prime
- Головний
- приватний
- Private Equity
- проблеми
- процес
- процеси
- обробка
- виробництво
- Product
- Production
- Продукти
- професійний
- програма
- Програмування
- мови програмування
- проект
- забезпечувати
- за умови
- Постачальник
- забезпечує
- забезпечення
- публічно
- опублікований
- Видавничий
- put
- Python
- питання
- питань
- піднятий
- швидко
- ставка
- RE
- Читати
- читачі
- читання
- реального часу
- зрозумів,
- останній
- нещодавно
- визнання
- визнаючи
- рекомендований
- червоний
- Знижений
- регіон
- райони
- пов'язаний
- чудовий
- ПОВТОРНО
- перефразування
- замінити
- Сховище
- запросити
- вимагається
- Вимагається
- дослідження
- дослідження і розробка
- Дослідники
- дозвіл
- ресурси
- відповідь
- відповіді
- результат
- зберігати
- огляд
- революціонізували
- нагородження
- Нагороди
- робот
- міцний
- Роль
- королівський
- прогін
- пробіжки
- s
- мудрець
- Висновок SageMaker
- Зазначений
- продажів
- сіль
- приказка
- говорить
- масштабовані
- сканування
- вчений
- Вчені
- Екран
- Sdk
- Пошук
- другий
- розділам
- побачити
- Здається,
- вибір
- продавати
- семантика
- старший
- сенс
- пропозиція
- настрій
- почуття
- Послідовність
- послідовний
- Серія
- Серія A
- обслуговування
- Послуги
- комплект
- набори
- установка
- кілька
- Повинен
- Показувати
- показав
- Шоу
- значний
- спрощений
- з
- сайт
- ситуацій
- Розмір
- розміри
- невеликий
- менше
- So
- соціальна
- Соціальна мережа
- суспільство
- Софтвер
- Інженер-програміст
- solid
- Рішення
- деякі
- її
- іспанська
- спеціаліст
- конкретний
- конкретно
- швидкість
- орфографія
- витрачати
- стек
- Стеки
- старт
- почалася
- Стартапи
- впроваджений
- Штати
- статистичний
- заходи
- Стів
- зупинений
- зберігання
- варіанти зберігання
- Стратегія
- сильні сторони
- рядок
- структура
- студент
- студія
- Вивчення
- такі
- костюм
- РЕЗЮМЕ
- доповнювати
- поставка
- підтримка
- Підтриманий
- Підтримуючий
- синонімом
- таблиця
- Приймати
- приймає
- Завдання
- завдання
- Навчання
- команда
- технічний
- шаблон
- ніж
- дякувати
- Що
- Команда
- Площа
- світ
- їх
- Їх
- потім
- Там.
- Ці
- вони
- третій
- це
- через
- через
- час
- трудомісткий
- назва
- до
- сьогодні
- завтра
- занадто
- інструмент
- жорсткий
- до
- традиційний
- поїзд
- навчений
- Навчання
- Перетворення
- перетворений
- Переклад
- дерево
- чірікать
- Двічі
- два
- тип
- нас
- розуміння
- United
- Сполучені Штати
- університет
- необмежений
- до
- Оновити
- Updates
- оновлення
- використання
- використання випадку
- використовуваний
- користувачі
- використовує
- використання
- зазвичай
- цінний
- Цінності
- різноманітність
- різний
- величезний
- перевірка
- версія
- дуже
- через
- вид
- фактично
- візит
- хотіти
- теплий
- було
- вода
- шлях..
- способи
- we
- Web
- веб-сервіси
- week
- ласкаво просимо
- ДОБРЕ
- Що
- Що таке
- коли
- який
- в той час як
- білий
- ВООЗ
- всі
- чому
- ширше
- ширина
- волі
- Зима
- з
- без
- жінки
- слово
- слова
- Робочі процеси
- робочий
- працює
- світ
- Кубок світу
- турбуватися
- б
- запис
- лист
- письмовий
- X
- рік
- років
- так
- ще
- йорк
- Ти
- вашу
- зефірнет
- Zero-Shot Навчання