Сьогодні ми раді повідомити, що модель фундаменту Falcon 180B, розроблена Інститутом технологічних інновацій (TII) і навчена на Amazon SageMaker, доступна для клієнтів через Amazon SageMaker JumpStart для розгортання одним клацанням для запуску висновку. З розміром у 180 мільярдів параметрів і навченим на величезному наборі даних із 3.5 трильйонів токенів, Falcon 180B є найбільшою та однією з найпродуктивніших моделей із відкрито доступними вагами. Ви можете випробувати цю модель за допомогою SageMaker JumpStart, центру машинного навчання (ML), який надає доступ до алгоритмів, моделей і рішень ML, щоб ви могли швидко розпочати роботу з ML. У цій публікації ми розповідаємо, як виявити та розгорнути модель Falcon 180B за допомогою SageMaker JumpStart.
Що таке Falcon 180B
Falcon 180B - модель, випущена компанією IIT який слідує за попередніми випусками сімейства Falcon. Це збільшена версія Falcon 40B, яка використовує багатозапитову увагу для кращої масштабованості. Це авторегресивна мовна модель, яка використовує оптимізовану трансформаторну архітектуру. Його було навчено на 3.5 трильйонах токенів даних, в основному з веб-даних з RefinedWeb (приблизно 85%). Модель має дві версії: 180B і 180B-Chat. 180B — це необроблена, попередньо навчена модель, яку необхідно додатково налаштувати для більшості випадків використання. 180B-Chat краще підходить для отримання загальних інструкцій. Модель чату було налаштовано на базі даних чату та інструкцій разом із кількома широкомасштабними наборами даних розмов.
Модель доступна за умовами Ліцензія Falcon-180B TII та Політика допустимого використання.
Falcon 180B був навчений TII на Amazon SageMaker, на кластері приблизно 4K A100 GPU. Він використовував спеціальну розподілену навчальну кодову базу під назвою Gigatron, яка використовує 3D-паралелізм із ZeRO, і призначені для користувача високопродуктивні ядра Triton. Використана архітектура розподіленого навчання Служба простого зберігання Amazon (Amazon S3) як єдиний уніфікований сервіс для завантаження даних і запису та читання контрольних точок, що особливо сприяло надійності робочого навантаження та простоті експлуатації.
Що таке SageMaker JumpStart
За допомогою SageMaker JumpStart фахівці з машинного навчання можуть вибирати зі списку найефективніших моделей основи, що постійно зростає. Практикуючі ML можуть розгортати базові моделі на виділених екземплярах SageMaker в ізольованому мережевому середовищі та налаштовувати моделі за допомогою Amazon SageMaker для навчання моделей і розгортання.
Тепер ви можете знайти та розгорнути Falcon 180B кількома клацаннями миші Студія Amazon SageMaker або програмно за допомогою SDK SageMaker Python, що дає змогу отримувати продуктивність моделі та елементи керування MLOps за допомогою таких функцій SageMaker, як Трубопроводи Amazon SageMaker, Налагоджувач Amazon SageMaker, або контейнерні журнали. Модель розгортається в захищеному середовищі AWS і під керуванням вашого VPC, що допомагає забезпечити безпеку даних. Falcon 180B доступний для виявлення та може бути розгорнутий у регіонах, де доступні необхідні екземпляри. Зараз екземпляри ml.p4de доступні на сході США (Північна Вірджинія) та на заході США (Орегон).
Відкрийте для себе моделі
Ви можете отримати доступ до базових моделей через SageMaker JumpStart в інтерфейсі користувача SageMaker Studio та SageMaker Python SDK. У цьому розділі ми розглянемо, як знайти моделі в SageMaker Studio.
SageMaker Studio — це інтегроване середовище розробки (IDE), яке забезпечує єдиний візуальний веб-інтерфейс, де ви можете отримати доступ до спеціально створених інструментів для виконання всіх етапів розробки ML, від підготовки даних до створення, навчання та розгортання ваших моделей ML. Докладніше про те, як розпочати роботу та налаштувати SageMaker Studio, див Студія Amazon SageMaker.
У SageMaker Studio ви можете отримати доступ до SageMaker JumpStart, який містить попередньо навчені моделі, блокноти та готові рішення, у розділі Готові та автоматизовані рішення.
На цільовій сторінці SageMaker JumpStart ви можете переглядати рішення, моделі, блокноти та інші ресурси. Ви можете знайти Falcon 180B в Основні моделі: генерація тексту карусель.
Ви також можете знайти інші варіанти моделі, вибравши Дослідіть усі моделі генерації тексту або шукає Falcon
.
Ви можете вибрати картку моделі, щоб переглянути деталі моделі, наприклад ліцензію, дані, які використовуються для навчання, і спосіб використання. Ви також знайдете дві кнопки, Розгортання та Відкрийте Блокнот, який допоможе вам використовувати модель (на наступному знімку екрана показано Розгортання варіант).
Розгорнути моделі
Коли ви обираєте Розгортання, почнеться розгортання моделі. Крім того, ви можете розгорнути за допомогою прикладу блокнота, який з’явиться, вибравши Відкрийте Блокнот. Приклад блокнота містить наскрізні вказівки щодо того, як розгорнути модель для висновків і очистити ресурси.
Для розгортання за допомогою ноутбука ми починаємо з вибору відповідної моделі, зазначеної в model_id
. Ви можете розгорнути будь-яку з вибраних моделей на SageMaker за допомогою такого коду:
Це розгортає модель на SageMaker із конфігураціями за замовчуванням, включаючи тип екземпляра за замовчуванням і конфігурації VPC за замовчуванням. Ви можете змінити ці конфігурації, вказавши значення, відмінні від замовчування JumpStartModel
. Щоб дізнатися більше, зверніться до Документація API. Після розгортання ви можете запустити висновок щодо розгорнутої кінцевої точки за допомогою предиктора SageMaker. Перегляньте наступний код:
Параметри висновку керують процесом генерації тексту в кінцевій точці. Максимальна кількість нових маркерів стосується розміру результату, створеного моделлю. Зауважте, що це не те саме, що кількість слів, оскільки словниковий запас моделі не такий самий, як словниковий запас англійської мови, і кожна лексема може не бути словом англійської мови. Температура контролює випадковість виведення. Більш висока температура призводить до більшої творчості та галюцинацій. Усі параметри висновку є необов’язковими.
Ця модель параметрів 180B має 335 ГБ і потребує ще більше пам’яті графічного процесора для достатнього виконання висновків із 16-бітною точністю. Наразі JumpStart підтримує цю модель лише на екземплярах ml.p4de.24xlarge. Можна розгорнути 8-розрядну квантовану модель на примірнику ml.p4d.24xlarge, надавши env={"HF_MODEL_QUANTIZE": "bitsandbytes"}
аргумент ключового слова до JumpStartModel
конструктор і специфікація instance_type="ml.p4d.24xlarge"
до способу розгортання. Однак зауважте, що затримка кожного токена приблизно в 5 разів менша для цієї квантованої конфігурації.
У наведеній нижче таблиці перераховано всі моделі Falcon, доступні в SageMaker JumpStart, разом із ідентифікаторами моделей, типами екземплярів за замовчуванням, максимальною загальною кількістю токенів (сума кількості введених токенів і кількості згенерованих токенів), які підтримуються, і типовою затримкою відповіді на маркер. для кожної з цих моделей.
Назва моделі | Ідентифікатор моделі | Тип екземпляра за замовчуванням | Максимальна загальна кількість токенів | Затримка на токен* |
Falcon 7B | huggingface-llm- falcon-7b-bf16 |
мл.g5.2xвеликий | 2048 | 34 мс |
Falcon 7B Instruct | huggingface-llm- falcon-7b-instruct-bf16 |
мл.g5.2xвеликий | 2048 | 34 мс |
Falcon 40B | huggingface-llm- falcon-40b-bf16 |
мл.g5.12xвеликий | 2048 | 57 мс |
Falcon 40B Instruct | huggingface-llm- falcon-40b-instruct-bf16 |
мл.g5.12xвеликий | 2048 | 57 мс |
Falcon 180B | huggingface-llm- falcon-180b-bf16 |
ml.p4de.24xlarge | 2048 | 45 мс |
Falcon 180B Чат | huggingface-llm- falcon-180b-chat-bf16 |
ml.p4de.24xlarge | 2048 | 45 мс |
*затримка на маркер надається для середнього часу відповіді прикладів підказок, наданих у цьому блозі; це значення змінюватиметься залежно від довжини вхідної та вихідної послідовностей.
Висновки та приклади для Falcon 180B
Моделі Falcon можна використовувати для доповнення будь-якого тексту. За допомогою генерації тексту ви можете виконувати різноманітні завдання, наприклад відповідати на запитання, перекладати мовою, аналізувати настрої та багато іншого. Кінцева точка приймає наступну схему корисного навантаження:
Ви можете дослідити їх визначення параметри клієнта та їхні значення за замовчуванням у репозиторії text-generation-inference.
Нижче наведено кілька прикладів підказок і тексту, створеного моделлю. Усі виходи тут генеруються з параметрами висновку {"max_new_tokens": 768, "stop": ["<|endoftext|>", "###"]}
.
Створити веб-сайт можна за 10 простих кроків:
Ви можете помітити, що ця попередньо навчена модель генерує довгі текстові послідовності, які не обов’язково ідеальні для випадків використання діалогу. Перш ніж ми покажемо, як точно налаштована модель чату працює для більшого набору діалогових підказок, наступні два приклади ілюструють, як використовувати моделі Falcon з невеликим кадровим навчанням у контексті, де ми надаємо навчальні зразки, доступні для моделі. Зауважте, що «поодиноке навчання» не коригує ваги моделі — ми лише виконуємо висновок щодо розгорнутої моделі під час цього процесу, надаючи кілька прикладів у контексті введення, щоб допомогти вивести модель гільдії.
Висновки та приклади для Falcon 180B-Chat
З моделями Falcon 180B-Chat, оптимізованими для випадків використання діалогу, вхідні дані для кінцевих точок моделі чату можуть містити попередню історію між помічником чату та користувачем. Ви можете задавати питання, пов’язані з розмовою, яка відбулася до цього часу. Ви також можете надати конфігурацію системи, як-от особи, які визначають поведінку помічника в чаті. Вхідне корисне навантаження на кінцеву точку таке ж, як і в моделі Falcon 180B, за винятком inputs
значення рядка має використовувати такий формат:
Нижче наведено кілька прикладів підказок і тексту, створеного моделлю. Усі виходи генеруються з параметрами висновку {"max_new_tokens":256, "stop": ["nUser:", "<|endoftext|>", " User:", "###"]}.
У наступному прикладі користувач мав розмову з помічником про туристичні місця в Парижі. Далі користувач запитує про перший варіант, рекомендований помічником у чаті.
Прибирати
Після того, як ви завершите роботу блокнота, переконайтеся, що ви видалили всі ресурси, які ви створили в процесі, щоб виставлення рахунків припинилося. Використовуйте наступний код:
Висновок
У цій публікації ми показали вам, як розпочати роботу з Falcon 180B у SageMaker Studio та розгорнути модель для висновку. Оскільки базові моделі проходять попередню підготовку, вони можуть допомогти знизити витрати на навчання та інфраструктуру, а також уможливити налаштування для вашого випадку використання. Щоб почати, відвідайте SageMaker JumpStart у SageMaker Studio.
ресурси
Про авторів
Доктор Кайл Ульріх є прикладним науковцем у команді Amazon SageMaker JumpStart. Його дослідницькі інтереси включають масштабовані алгоритми машинного навчання, комп’ютерне бачення, часові ряди, байєсівські непараметричні процеси та процеси Гаусса. Його доктор філософії отримав в Університеті Дьюка, і він опублікував статті в NeurIPS, Cell і Neuron.
Доктор Ашиш Хетан є старшим прикладним науковим співробітником Amazon SageMaker JumpStart і допомагає розробляти алгоритми машинного навчання. Він отримав ступінь доктора філософії в Іллінойському університеті Урбана-Шампейн. Він активно досліджує машинне навчання та статистичні висновки та опублікував багато статей на конференціях NeurIPS, ICML, ICLR, JMLR, ACL та EMNLP.
Олів'є Крушанt є головним архітектором рішень спеціаліста з машинного навчання в AWS, розташованому у Франції. Olivier допомагає клієнтам AWS – від невеликих стартапів до великих підприємств – розробляти та розгортати програми машинного навчання виробничого рівня. У вільний час він любить читати наукові статті та досліджувати дику природу з друзями та родиною.
Карл Альбертсен очолює центр базової моделі Amazon SageMaker, команди алгоритмів і партнерства.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. Автомобільні / електромобілі, вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- ChartPrime. Розвивайте свою торгову гру за допомогою ChartPrime. Доступ тут.
- BlockOffsets. Модернізація екологічної компенсаційної власності. Доступ тут.
- джерело: https://aws.amazon.com/blogs/machine-learning/falcon-180b-foundation-model-from-tii-is-now-available-via-amazon-sagemaker-jumpstart/
- : має
- :є
- : ні
- :де
- $UP
- 1
- 10
- 100
- 11
- 12
- 13
- 14
- 150
- 20
- 25
- 26%
- 3d
- 4k
- 7
- 8
- 9
- a
- МЕНЮ
- Приймає
- доступ
- доступною
- Achieve
- активний
- додавати
- Додатково
- адреса
- після
- проти
- алгоритми
- ВСІ
- дозволяє
- по
- Також
- завжди
- am
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- аналіз
- та
- та інфраструктури
- Оголосити
- Інший
- відповідь
- будь-який
- будь
- привабливий
- застосування
- прикладної
- відповідний
- приблизно
- архітектура
- ЕСТЬ
- аргумент
- Art
- стаття
- AS
- запитати
- Помічник
- At
- увагу
- залучати
- залучення
- Автоматизований
- доступний
- проспекти
- AWS
- заснований
- акумулятор
- Байєсівський
- BE
- красивий
- оскільки
- було
- перед тим
- поведінка
- Краще
- між
- біллінг
- Блог
- має
- браузер
- будівельник
- будівельники
- Створюємо
- бізнес
- але
- by
- кафе
- CAN
- можливості
- карта
- карусель
- випадок
- випадків
- зміна
- перевірка
- Вибирати
- Вибираючи
- вибраний
- Місто
- Класифікувати
- кластер
- См
- код
- Кодова база
- збір
- Колони
- COM
- комбінований
- загальний
- компанія
- повний
- завершення
- комп'ютер
- Комп'ютерне бачення
- конференції
- конфігурація
- Складається
- контакт
- містити
- Контейнер
- містить
- зміст
- контекст
- контекстуальний
- постійно
- внесок
- контроль
- управління
- Розмова
- діалоговий
- витрати
- створювати
- створений
- створення
- Креатив
- Чашка
- Поточний
- В даний час
- виготовлений на замовлення
- клієнт
- підтримка клієнтів
- Клієнти
- настройка
- налаштувати
- дані
- безпеку даних
- набори даних
- день
- рішення
- присвячених
- дефолт
- визначати
- визначення
- демонструвати
- Залежно
- розгортання
- розгорнути
- розгортання
- розгортання
- розгортає
- дизайн
- призначення
- деталі
- Визначати
- розвивати
- розвиненою
- розробка
- Діалог
- Діалог
- різний
- відкрити
- розподілений
- розподілене навчання
- do
- робить
- домен
- Доменне ім'я
- ДОМЕННІ ІМЕНА
- зроблений
- мрії
- Герцог
- герцогський університет
- під час
- кожен
- простота
- легко
- Схід
- легко
- включіть
- дозволяє
- кінець в кінець
- Кінцева точка
- енергія
- Машинобудування
- англійська
- забезпечувати
- підприємств
- Навколишнє середовище
- особливо
- Навіть
- приклад
- Приклади
- Крім
- збуджений
- експертиза
- дослідити
- Дослідження
- виражений
- розширення
- Розширення
- обширний
- сім'я
- знаменитий
- далеко
- захоплюючий
- риси
- кілька
- знайти
- Перший
- Поплавок
- після
- слідує
- для
- формат
- Колишній
- фонд
- чотири
- FRAME
- Франція
- французька
- друзі
- від
- функціонування
- далі
- Сади
- Гем
- породжувати
- генерується
- генерує
- покоління
- отримати
- скло
- Go
- мета
- Цілі
- буде
- добре
- є
- GPU
- Графічні процесори
- великий
- Зростання
- керівництво
- гільдії
- було
- сталося
- ненавидіти
- Мати
- має
- he
- Серце
- допомога
- корисний
- допомогу
- допомагає
- тут
- прихований
- прихований дорогоцінний камінь
- висока продуктивність
- вище
- його
- історія
- Головна
- господар
- хостинг
- Як
- How To
- Однак
- HTML
- HTTPS
- Концентратор
- i
- знакових
- ID
- ідеальний
- ідентифікатори
- if
- Іллінойс
- зображення
- зображень
- імпорт
- вражаючий
- in
- включати
- У тому числі
- неймовірний
- інформація
- Інфраструктура
- інновація
- вхід
- витрати
- екземпляр
- Інститут
- інструкції
- інтегрований
- зацікавлений
- інтереси
- інтерфейс
- в
- ізольований
- IT
- ЙОГО
- JPG
- відомий
- затока
- посадка
- мова
- великий
- Великі підприємства
- масштабний
- більше
- найбільших
- Затримка
- останній
- запуск
- Законодавство
- макет
- Веде за собою
- УЧИТЬСЯ
- вивчення
- довжина
- ліцензія
- світло
- вишикувався
- LINK
- зв'язку
- список
- списки
- погрузка
- Довго
- знизити
- Люксембург
- машина
- навчання за допомогою машини
- made
- зробити
- Робить
- управління
- управляє
- багато
- чудо
- Маса
- масивний
- Макс
- максимальний
- Може..
- сенс
- засоби
- Медіа
- середньовічний
- пам'ять
- повідомлення
- метод
- може бути
- Змішування
- суміш
- ML
- MLOps
- модель
- Моделі
- більше
- найбільш
- рух
- музей
- музика
- my
- ім'я
- Названий
- Імена
- Переміщення
- навігація
- обов'язково
- Необхідність
- негативний
- мережу
- мережу
- Нейтральний
- Нові
- наступний
- ніч
- немає
- ноутбук
- Зверніть увагу..
- зараз
- номер
- спостерігачі
- of
- Пропозиції
- Нафта
- Олівія
- on
- один раз
- ONE
- тільки
- відкрито
- оперативний
- оптимізований
- варіант
- Опції
- or
- Орегон
- Інше
- з
- викладені
- вихід
- над
- сторінка
- сторінок
- Palace
- документи
- параметр
- параметри
- Паріс
- Парк
- особливо
- партнерства
- оплата
- спосіб оплати
- Люди
- для
- ідеальний
- Виконувати
- продуктивність
- виступає
- Вчений ступінь
- телефон
- Фізика
- частина
- план
- plato
- Інформація про дані Платона
- PlatoData
- будь ласка
- позитивний
- це можливо
- пошта
- Пости
- Точність
- Прогноз
- підготовка
- представити
- попередній
- в першу чергу
- Головний
- проблеми
- процес
- процеси
- Product
- сприяти
- правильно
- забезпечувати
- за умови
- Постачальник
- забезпечує
- забезпечення
- опублікований
- мета
- put
- Python
- питань
- швидко
- випадковість
- Сировина
- читання
- рецепт
- рекомендований
- послатися
- відноситься
- Незалежно
- райони
- реєструвати
- реєструючий
- реєстратора
- Реєстрація
- відносний
- відносності
- випущений
- Релізи
- доречний
- надійність
- надійний
- запам'ятати
- Сховище
- представляє
- Вимагається
- необхідний
- дослідження
- дослідник
- ресурси
- відповідь
- результати
- Багаті
- Ride
- роялті
- прогін
- біг
- s
- мудрець
- сіль
- то ж
- масштабованість
- масштабовані
- шкала
- вчений
- Sdk
- SEA
- Пошук
- Грати короля карти - безкоштовно Nijumi логічна гра гри
- Сезон
- другий
- розділ
- безпечний
- безпеку
- побачити
- насіння
- обраний
- вибирає
- старший
- настрій
- Серія
- обслуговування
- Послуги
- комплект
- налаштування
- кілька
- Поділитись
- магазинів
- Короткий
- Повинен
- Показувати
- показав
- Шоу
- підпис
- простий
- простота
- просто
- один
- сайти
- Розмір
- Повільно
- невеликий
- So
- так далеко
- соціальна
- соціальні медіа
- Повідомлення в соціальних мережах
- Рішення
- деякі
- що в сім'ї щось
- Source
- Простір
- спеціаліст
- зазначений
- швидкість
- старт
- почалася
- Стартапи
- Штати
- станція
- статистичний
- заходи
- Стоп
- зупинений
- зберігання
- зберігати
- вулиця
- рядок
- студія
- Приголомшливий
- такі
- підтримка
- Підтриманий
- Опори
- Переконайтеся
- символ
- система
- таблиця
- Приймати
- взяття
- завдання
- ключі
- команда
- команди
- Технологія
- Технологічні інновації
- шаблон
- тест
- текст
- Що
- Команда
- світ
- їх
- Їх
- тема
- потім
- теорія
- Там.
- Ці
- вони
- третій
- це
- через
- час
- Часовий ряд
- до
- разом
- знак
- Жетони
- інструмент
- інструменти
- Усього:
- Башта
- поїзд
- навчений
- Навчання
- трансформатор
- переводити
- Переклад
- трильйон
- подорож
- Triton
- намагатися
- чірікать
- два
- тип
- Типи
- типовий
- ui
- при
- єдиний
- створеного
- університет
- до
- Завантаження
- us
- використання
- використання випадку
- використовуваний
- користувач
- користувачі
- використовує
- використання
- Вакуум
- значення
- Цінності
- різноманітність
- різний
- версія
- версії
- через
- Vibe
- Відео
- Відео
- вид
- думки
- Віргінія
- бачення
- візит
- відвідувачів
- візуально
- ходити
- хотіти
- було
- водяний знак
- we
- Web
- веб-сервіси
- Web-Based
- веб-сайт
- week
- тижня
- ДОБРЕ
- West
- Що
- Що таке
- коли
- який
- в той час як
- волі
- windows
- з
- в
- без
- слово
- слова
- світ
- лист
- так
- Ти
- вашу
- зефірнет
- нуль