Ми раді повідомити про це Amazon SageMaker JumpStart тепер може транслювати відповіді на висновок великої мовної моделі (LLM). Потокова передача маркерів дозволяє вам бачити вихідні дані відповіді моделі під час їх створення, замість того, щоб чекати, поки LLM завершить генерацію відповіді, перш ніж він стане доступним для використання або відображення. Можливість потокової передачі в SageMaker JumpStart може допомогти вам створювати програми з кращим користуванням, створюючи відчуття низької затримки для кінцевого користувача.
У цій публікації ми розглянемо, як розгорнути та передати відповідь від a Модель Falcon 7B Instruct кінцева точка.
На момент написання цієї статті такі LLM, доступні в SageMaker JumpStart, підтримують потокове передавання:
- Містраль AI 7B, Містраль AI 7B Instruct
- Falcon 180B, Falcon 180B Чат
- Falcon 40B, Falcon 40B Instruct
- Falcon 7B, Falcon 7B Instruct
- Rinna Japanese GPT NeoX 4B Інструкція PPO
- Rinna Japanese GPT NeoX 3.6B Інструкція PPO
Щоб перевірити наявність оновлень у списку моделей, які підтримують потокове передавання в SageMaker JumpStart, знайдіть «huggingface-llm» на сторінці Вбудовані алгоритми з попередньо навченою таблицею моделей.
Зауважте, що ви можете використовувати функція потокової передачі of Amazon SageMaker хостинг із коробки для будь-якої моделі, розгорнутої за допомогою SageMaker TGI Deep Learning Container (DLC), як описано в Оголошуємо про запуск нових контейнерів Hugging Face LLM Inference на Amazon SageMaker.
Моделі основи в SageMaker
SageMaker JumpStart надає доступ до ряду моделей із популярних центрів моделювання, зокрема Hugging Face, PyTorch Hub і TensorFlow Hub, які ви можете використовувати в процесі розробки ML у SageMaker. Нещодавні досягнення в ML дали початок новому класу моделей, відомих як моделі фундаменту, які зазвичай навчаються на мільярдах параметрів і можуть бути адаптовані до широкої категорії випадків використання, таких як узагальнення тексту, створення цифрового мистецтва та мовний переклад. Оскільки навчання цих моделей є дорогим, клієнти хочуть використовувати існуючі попередньо навчені базові моделі та налаштовувати їх за потреби, а не навчати ці моделі самостійно. SageMaker надає підібраний список моделей, які можна вибрати на консолі SageMaker.
Тепер ви можете знайти моделі основи від різних постачальників моделей у SageMaker JumpStart, що дає змогу швидко розпочати роботу з моделями основи. SageMaker JumpStart пропонує базові моделі на основі різних завдань або постачальників моделей, і ви можете легко переглянути характеристики моделі та умови використання. Ви також можете спробувати ці моделі за допомогою тестового віджета інтерфейсу користувача. Якщо ви хочете використовувати базову модель у великому масштабі, ви можете зробити це, не виходячи з SageMaker, використовуючи готові блокноти від постачальників моделей. Оскільки моделі розміщуються та розгортаються на AWS, ви вірите, що ваші дані, незалежно від того, чи використовуються вони для оцінки чи використання моделі в масштабі, не будуть передані третім особам.
Потік токенів
Потокова передача маркерів дозволяє повертати відповідь висновку, коли вона генерується моделлю. Таким чином, ви можете бачити відповідь, згенеровану поступово, а не чекати, доки модель завершить роботу, перш ніж надавати повну відповідь. Потокове передавання може допомогти покращити взаємодію з користувачем, оскільки воно зменшує сприйняття затримки для кінцевого користувача. Ви можете почати переглядати вихідні дані, коли вони генеруються, і, отже, можете завчасно зупинити генерацію, якщо результати не виглядають корисними для ваших цілей. Потокове передавання може мати велике значення, особливо для тривалих запитів, оскільки ви можете почати бачити результати, коли вони генеруються, що може створити відчуття меншої затримки, навіть якщо наскрізна затримка залишається незмінною.
На момент написання цієї статті ви можете використовувати потокове передавання в SageMaker JumpStart для моделей, які використовують Hugging Face LLM Висновок про створення тексту DLC.
Відповідь без відпарювання | Відповідь за допомогою потокового передавання |
Огляд рішення
У цій публікації ми використовуємо модель Falcon 7B Instruct, щоб продемонструвати можливість потокової передачі SageMaker JumpStart.
Ви можете використовувати наступний код, щоб знайти інші моделі в SageMaker JumpStart, які підтримують потокове передавання:
Ми отримуємо такі ідентифікатори моделі, які підтримують потокове передавання:
Передумови
Перш ніж запустити ноутбук, потрібно виконати деякі початкові кроки для налаштування. Виконайте такі команди:
Розгортання моделі
Як перший крок, використовуйте SageMaker JumpStart для розгортання моделі Falcon 7B Instruct. Повні інструкції див Модель фундаменту Falcon 180B від TII тепер доступна через Amazon SageMaker JumpStart. Використовуйте наступний код:
Запит кінцевої точки та відповідь потоку
Далі створіть корисне навантаження для виклику вашої розгорнутої кінцевої точки. Важливо, що корисне навантаження має містити пару ключ/значення "stream": True
. Це вказує серверу висновку генерації тексту створити потокову відповідь.
Перш ніж запитувати кінцеву точку, вам потрібно створити ітератор, який зможе аналізувати відповідь потоку байтів від кінцевої точки. Дані для кожного токена надаються як окремий рядок у відповіді, тому цей ітератор повертає токен кожного разу, коли в потоковому буфері ідентифікується новий рядок. Цей ітератор мінімально розроблений, і ви можете налаштувати його поведінку для свого випадку використання; наприклад, хоча цей ітератор повертає рядки токенів, рядкові дані містять іншу інформацію, таку як ймовірності журналу токенів, яка може бути цікава.
Тепер ви можете використовувати Boto3 invoke_endpoint_with_response_stream
API на кінцевій точці, яку ви створили, і ввімкніть потокове передавання, переглянувши a TokenIterator
примірник:
Вказівка пустого end
параметр до print
увімкне візуальний потік без вставлення символів нового рядка. Це дає такий результат:
Ви можете використовувати цей код у блокноті чи інших програмах, таких як Streamlit або Gradio, щоб побачити потокове передавання в дії та досвід, який він надає вашим клієнтам.
Прибирати
Нарешті, не забудьте очистити свою розгорнуту модель і кінцеву точку, щоб уникнути додаткових витрат:
Висновок
У цій публікації ми показали вам, як використовувати нещодавно запущену функцію потокового передавання в SageMaker JumpStart. Ми сподіваємося, що ви використовуватимете можливість потокової передачі токенів для створення інтерактивних програм, які вимагають низької затримки для кращої взаємодії з користувачем.
Про авторів
Рачна Чадха є головним архітектором рішень AI/ML у Strategic Accounts в AWS. Рахна — оптиміст, який вірить, що етичне та відповідальне використання ШІ може покращити суспільство в майбутньому та принести економічне та соціальне процвітання. У вільний час Рачна любить проводити час з сім'єю, гуляти в походах і слухати музику.
Доктор Кайл Ульріх є прикладним науковцем з Вбудовані алгоритми Amazon SageMaker команда. Його дослідницькі інтереси включають масштабовані алгоритми машинного навчання, комп’ютерне бачення, часові ряди, байєсівські непараметричні процеси та процеси Гаусса. Його доктор філософії отримав в Університеті Дьюка, і він опублікував статті в NeurIPS, Cell і Neuron.
Доктор Ашиш Хетан є старшим прикладним науковим співробітником із вбудованими алгоритмами Amazon SageMaker і допомагає розробляти алгоритми машинного навчання. Він отримав ступінь доктора філософії в Іллінойському університеті Урбана-Шампейн. Він активно досліджує машинне навчання та статистичні висновки та опублікував багато статей на конференціях NeurIPS, ICML, ICLR, JMLR, ACL та EMNLP.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/stream-large-language-model-responses-in-amazon-sagemaker-jumpstart/
- : має
- :є
- $UP
- 1
- 10
- 100
- 12
- 13
- 14
- 19
- 7
- 8
- a
- МЕНЮ
- доступ
- Рахунки
- дію
- активний
- додавати
- Додатковий
- аванси
- рада
- AI
- AI / ML
- алгоритми
- дозволяє
- Також
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- та
- Оголосити
- будь-який
- API
- застосування
- прикладної
- ЕСТЬ
- Art
- AS
- At
- доступний
- уникнути
- AWS
- заснований
- Байєсівський
- BE
- оскільки
- перед тим
- поведінка
- буття
- вважає,
- Краще
- Великий
- мільярди
- тіло
- Box
- приносити
- буфера
- будувати
- вбудований
- але
- by
- CAN
- можливості
- випадок
- випадків
- Категорія
- характеристика
- символи
- перевірка
- Вибирати
- клас
- очистити
- клієнт
- код
- повний
- комплекс
- комп'ютер
- Комп'ютерне бачення
- конференції
- Консоль
- будувати
- містити
- Контейнер
- Контейнери
- містить
- зміст
- витрати
- може
- створювати
- створений
- створення
- CSS
- Куратор
- Клієнти
- дані
- зменшується
- глибокий
- глибоке навчання
- розгортання
- розгорнути
- описаний
- дизайн
- призначений
- Дизайнерка
- Визначати
- розвивати
- Розробник
- розробка
- різниця
- різний
- цифровий
- цифрове мистецтво
- дисплей
- do
- домен
- Доменне ім'я
- Герцог
- герцогський університет
- кожен
- Рано
- легко
- Економічний
- включіть
- дозволяє
- кінець в кінець
- Кінцева точка
- Двигуни
- забезпечувати
- особливо
- етичний
- оцінки
- Навіть
- приклад
- збуджений
- існуючий
- дорогий
- досвід
- Face
- сім'я
- особливість
- Фільтри
- знайти
- закінчення
- Перший
- після
- для
- фонд
- Рамки
- від
- Повний
- функція
- майбутнє
- в цілому
- породжувати
- генерується
- породжує
- покоління
- отримати
- даний
- Цілі
- є
- керівництво
- Мати
- he
- допомога
- корисний
- допомагає
- її
- його
- надія
- відбувся
- хостинг
- Як
- How To
- HTML
- HTTPS
- Концентратор
- концентратори
- HuggingFace
- i
- ідентифікований
- ідентифікатори
- if
- Іллінойс
- імпорт
- важливо
- удосконалювати
- in
- включати
- У тому числі
- вказує
- інформація
- початковий
- витрати
- встановлювати
- екземпляр
- замість
- інструкції
- інтерактивний
- інтерес
- інтереси
- IT
- ЙОГО
- японський
- JavaScript
- json
- тримати
- відомий
- затока
- мова
- великий
- Затримка
- запуск
- запущений
- вивчення
- догляд
- як
- Сподобалося
- Лінія
- список
- Прослуховування
- LLM
- журнал
- шукати
- низький
- знизити
- машина
- навчання за допомогою машини
- made
- підтримувати
- зробити
- багато
- Може..
- може бути
- ML
- модель
- Моделі
- музика
- ім'я
- Необхідність
- необхідний
- Нові
- нещодавно
- немає
- ноутбук
- зараз
- of
- Пропозиції
- on
- онлайн
- Оптимізувати
- or
- Інше
- з
- вихід
- виходи
- над
- пара
- документи
- параметр
- параметри
- Сторони
- сприйняття
- Вчений ступінь
- plato
- Інформація про дані Платона
- PlatoData
- популярний
- пошта
- Прогноз
- Головний
- процес
- процеси
- випускає
- правильно
- процвітання
- за умови
- Постачальник
- провайдери
- забезпечує
- забезпечення
- опублікований
- мета
- цілей
- піторх
- запити
- швидко
- діапазон
- швидше
- останній
- послатися
- регулярно
- запам'ятати
- вимагається
- дослідження
- дослідник
- ресурси
- відповідь
- відповіді
- відповідальний
- повертати
- Умови повернення
- огляд
- Зростання
- прогін
- біг
- мудрець
- то ж
- масштабовані
- шкала
- вчений
- Пошук
- Пошукові системи
- побачити
- бачачи
- Шукати
- SELF
- старший
- окремий
- Серія
- сервер
- Послуги
- установка
- загальні
- Повинен
- демонстрації
- показав
- плавно
- So
- соціальна
- суспільство
- рішення
- деякі
- Витрати
- старт
- почалася
- статистичний
- Крок
- заходи
- Стоп
- Стратегічний
- потік
- потоковий
- такі
- підтримка
- Підтримуючий
- Завдання
- завдання
- команда
- Шаблони
- тензорний потік
- terms
- тест
- текст
- ніж
- Що
- Команда
- Лінія
- Їх
- самі
- Там.
- отже
- Ці
- третій
- треті сторони
- це
- хоча?
- через
- час
- Часовий ряд
- до
- знак
- поїзд
- навчений
- Переклад
- правда
- Довіряйте
- намагатися
- навчальні посібники
- типово
- ui
- університет
- Оновити
- Updates
- Використання
- використання
- використання випадку
- використовуваний
- користувач
- User Experience
- використання
- використовувати
- через
- бачення
- чекати
- Очікування
- ходити
- хотіти
- шлях..
- we
- Web
- веб-сервіси
- веб-сайт
- коли
- Чи
- який
- в той час як
- ВООЗ
- широкий
- волі
- з
- в
- без
- робочий
- робочий
- лист
- Ти
- вашу
- зефірнет