Gemma тепер доступна в Amazon SageMaker JumpStart

Перевидано Платоном

читають: 0

Сьогодні ми раді повідомити, що Гемма модель тепер доступна для користувачів Amazon SageMaker JumpStart. Джемма - це сім'я мовні моделі на основі моделей Gemini від Google, навчених до 6 трильйонів токенів тексту. Сімейство Gemma складається з двох розмірів: моделі з 7 мільярдами параметрів і моделі з 2 мільярдами параметрів. Тепер ви можете використовувати моделі Gemma 2B і Gemma 7B, попередньо підготовлені та налаштовані за інструкціями, у межах SageMaker JumpStart. JumpStart — це центр машинного навчання (ML) SageMaker, який надає доступ до основних моделей на додаток до вбудованих алгоритмів і наскрізних шаблонів рішень, щоб допомогти вам швидко розпочати роботу з ML.

У цій публікації ми розповімо, як розгорнути модель Gemma та налаштувати її для ваших випадків використання в SageMaker JumpStart. Повний блокнот доступний на GitHub.

Модель Джемма

Гемма це сімейство легких, найсучасніших Моделі побудований на основі тих самих досліджень і технологій, які використовуються для створення Близнюки моделі. Розроблений Google DeepMind та іншими командами Google, Gemma черпає натхнення з Близнюків. Джемма демонструє сильні здібності широкого вивчення тексту та найсучасніші навички розуміння та міркування в масштабі. Він досягає кращої продуктивності порівняно з іншими загальнодоступними моделями подібного або більшого масштабу в різних сферах, включаючи відповіді на запитання, здоровий глузд, математику та науку, а також кодування. Gemma випустила вагові коефіцієнти моделей, щоб підтримати інновації розробників за допомогою моделей Gemma. Джемма була запущена з новим Responsible Generative AI Toolkit який містить вказівки та основні інструменти для створення безпечніших додатків ШІ за допомогою Gemma.

Моделі основи в SageMaker

JumpStart надає доступ до ряду моделей із популярних центрів моделювання, зокрема Hugging Face, PyTorch Hub і TensorFlow Hub, які ви можете використовувати в процесі розробки ML у SageMaker. Нещодавні досягнення в ML дали початок новому класу моделей, відомих як моделі фундаменту, які зазвичай навчаються на мільярдах параметрів і адаптуються до широкої категорії випадків використання, таких як узагальнення тексту, створення цифрового мистецтва та мовний переклад. Оскільки навчання цих моделей є дорогим, клієнти хочуть використовувати існуючі попередньо навчені базові моделі та налаштовувати їх за потреби, а не навчати ці моделі самостійно. SageMaker надає підібраний список моделей, які можна вибрати на консолі SageMaker.

Тепер ви можете знайти моделі основи від різних постачальників моделей у JumpStart, що дає змогу швидко розпочати роботу з моделями основи. Ви можете знайти основні моделі на основі різних завдань або постачальників моделей, а також переглянути характеристики моделі та умови використання. Ви також можете спробувати ці моделі за допомогою тестового віджета інтерфейсу користувача. Якщо ви хочете використовувати базову модель у великому масштабі, ви можете зробити це, не виходячи з SageMaker, використовуючи попередньо зібрані блокноти від постачальників моделей. Оскільки моделі розміщуються та розгортаються на AWS, ваші дані, незалежно від того, використовуються вони для оцінки моделі чи використовують її в масштабі, ніколи не передаються третім особам.

Давайте дослідимо, як можна використовувати модель Llama Guard у JumpStart.

Дослідіть модель Gemma в Jumpstart

Ви можете отримати доступ до моделей основи Gemma через SageMaker JumpStart в інтерфейсі користувача SageMaker Studio та SageMaker Python SDK. У цьому розділі ми розглянемо, як знайти моделі в SageMaker Studio.

SageMaker Studio — це інтегроване середовище розробки (IDE), яке забезпечує єдиний візуальний веб-інтерфейс, де ви можете отримати доступ до спеціально створених інструментів для виконання всіх етапів розробки ML, від підготовки даних до створення, навчання та розгортання ваших моделей ML. Щоб дізнатися більше про те, як почати роботу та налаштувати SageMaker Studio, див Студія Amazon SageMaker.

У консолі керування AWS для SageMaker Studio перейдіть до SageMaker JumpStart у розділі Готові та автоматизовані рішення. Jumpstart містить попередньо навчені моделі, блокноти та готові рішення.

Gemma тепер доступна в Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

На цільовій сторінці SageMaker JumpStart ви можете знайти модель Gemma, виконавши пошук Gemma.

Потім ви можете вибрати з безлічі варіантів моделей Gemma, включаючи Gemma 2B, Gemma 7B, Gemma 2B instruct і Gemma 7B instruct.

Gemma тепер доступна в Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Виберіть картку моделі, щоб переглянути деталі про модель, наприклад ліцензію, дані, які використовуються для навчання, і як використовувати модель. Ви також знайдете a Розгортання кнопку, яка спрямовує вас на цільову сторінку, де ви можете перевірити висновок за допомогою прикладу корисного навантаження.

Gemma тепер доступна в Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Розгорніть Gemma за допомогою SDK SageMaker Python

Ви можете знайти код, що показує розгортання Gemma, на JumpStart і приклад використання розгорнутої моделі в цей блокнот GitHub.

Почніть із вибору ідентифікатора моделі SageMaker Model Hub і версії моделі для використання під час розгортання Gemma.

model_id, model_version = "huggingface-llm-gemma-7b-instruct", "*"

Виберіть ідентифікатор моделі з наведеної нижче таблиці, де описано параметри конфігурації за замовчуванням для розгортання JumpStart. Через великий словниковий запас у 256 тисяч токенів Gemma 7B може поміститися лише на один графічний процесор A10G, якщо підтримується довжина контексту в 1 тисячу. З цієї причини JumpStart використовує більший екземпляр за замовчуванням для Gemma 7B.

Ідентифікатор моделі	Примірник висновку за замовчуванням	Паралельний ступінь тензора	Підтримувана довжина контексту
huggingface-llm-gemma-2b	ml.g5.xlarge	1	8k
huggingface-llm-gemma-2b-instruct	ml.g5.xlarge	1	8k
huggingface-llm-gemma-7b	мл.g5.12xвеликий	4	8k
huggingface-llm-gemma-7b-instruct	мл.g5.12xвеликий	4	8k

Тепер ви можете розгорнути модель за допомогою SageMaker JumpStart. Наступний код використовує екземпляр за замовчуванням ml.g5.12xlarge для кінцевої точки висновку Ви можете розгорнути модель на інших типах екземплярів, передавши instance_type в JumpStartModel клас. Розгортання може зайняти 5-10 хвилин.

from sagemaker.jumpstart.model import JumpStartModel

model = JumpStartModel(model_id=model_id, model_version=model_version)
predictor= model.deploy(accept_eula=False)  # manually accept EULA here!

Для успішного розгортання необхідно вручну змінити accept_eula аргумент у методі розгортання моделі True. Ця модель розгортається за допомогою контейнера глибокого навчання для генерації тексту (TGI).

Виклик кінцевої точки

Ви можете програмно отримати приклади корисних навантажень із JumpStartModel об'єкт. Це допоможе вам розпочати роботу, дотримуючись попередньо відформатованих інструкцій, які Джемма може отримати.

example_payloads = model.retrieve_all_examples()

for payload in example_payloads:
    response = predictor.predict(payload.body)
    print("Input:n", payload.body[payload.prompt_key])
    print("Output:n", response[0]["generated_text"].strip())
    print("n===============n")

Перш ніж ми розглянемо конкретні підказки, давайте розглянемо шаблон чату для моделей Gemma Instruct.

<bos><start_of_turn>usern[USER_PROMPT]<end_of_turn>n<start_of_turn>model

Тут ви розміщуєте підказку в [USER_PROMPT] Місцезнаходження. Немає підтримки системних інструкцій; замість цього ви можете додати бажану інструкцію до підказки користувача. Крім того, якщо у вас багаточергова розмова, підказка моделі може чергуватися між користувачем і помічником за потреби.

Тепер розглянемо кілька прикладів інструкцій. Тут ви просите Джемму написати програму Hello World.

payload = {
    "inputs": "<bos><start_of_turn>usernWrite a hello world module in Python<end_of_turn>n<start_of_turn>model",
    "parameters": {'max_new_tokens': 256},
}
predictor.predict(payload)

Очікуваний результат:

```python
# This is a Python module called hello.py

def hello():
  """Prints a hello message."""
  print("Hello, world!")

if __name__ == "__main__":
  hello()
```

**Usage:**

To use the hello.py module, you can import it and call the hello function like this:

```python
import hello

hello.hello()
```

**Output:**

```
Hello, world!
```

**Explanation:**

* The `hello.py` module defines a function called `hello()`.
* The `if __name__ == "__main__"` block checks if the script is being run directly or imported. If it is run directly, the `hello()` function is called.
* The `print("Hello, world!")` statement prints the hello message to the console.

**Note:**

* You can save the code above in a file named `hello.py` in your current directory.
* To run the script, you can use the following command:
```
python hello.py
```
* The output will be printed in the console:
```
Hello, world!
```

Далі викличте Джемму для творчого завдання написати вірш.

payload = {
    "inputs": "<bos><start_of_turn>usernWrite me a poem about Machine Learning.<end_of_turn>n<start_of_turn>model",
    "parameters": {'max_new_tokens': 256},
}
predictor.predict(payload)

Ось результат:

**Machine Learning**

In the realm of data, a tale unfolds,
Where algorithms dance and stories are told.
With every click, a model takes flight,
Unveiling patterns, hidden in the night.

Data whispers secrets, a treasure to find,
Machine learning listens, with a curious mind.
It sifts through terabytes, with lightning speed,
Uncovering insights, a hidden creed.

From images to text, it learns to see,
To understand the complexities of reality.
It paints a canvas, with insights deep,
Unveiling patterns, secrets to keep.

In the field of medicine, it takes a stand,
Diagnosing diseases, guiding a hand.
It analyzes data, with unmatched grace,
Bringing hope to those in a troubled place.

But with great power comes great responsibility,
As algorithms can bias, with malicious intent.
It's a journey of learning, a constant fight,
To ensure fairness, day and night.

So let us harness the power of this tool,
To create a future, where insights bloom.
With wisdom and caution, we must guide,
The path of machine learning, side by side.

Це виглядає досить добре!

Тепер давайте розглянемо порівняльний аналіз продуктивності затримки та пропускної здатності для обслуговування моделі з конфігурацією розгортання JumpStart за замовчуванням. Тут ми показуємо, як може відрізнятися продуктивність моделі для типового робочого навантаження кінцевої точки. У наведених нижче таблицях ви можете помітити, що запити невеликого розміру (256 вхідних слів і 256 вихідних маркерів) є досить продуктивними за великої кількості одночасних користувачів, досягаючи пропускної здатності маркерів порядку тисячі-двох тисяч маркерів на секунду. Однак, коли кількість вхідних слів наближається до максимальної підтримуваної Gemma довжини контексту у вісім тисяч токенів, кінцева точка насичує свою потужність пакетування — кількість одночасних запитів, які можна обробляти одночасно — через обмеження пам’яті екземпляра.

Щоб отримати додаткові відомості про те, як враховувати цю інформацію та налаштувати конфігурації розгортання для конкретного випадку використання, див Тестуйте та оптимізуйте розгортання кінцевої точки в Amazon SageMaker JumpStart.

.				Пропускна здатність (токени/с)
Одночасні користувачі				1	2	4	8	16	32	64	128
модель	Тип екземпляра	Вхідні слова	Вихідні жетони	.	.	.	.	.	.	.	.
gemma-2b-інструкція	ml.g5.xlarge	256	256	73	137	262	486	829	1330	1849	1834
		2048	256	69	126	227	373	537	704	764	-
		7936	256	60	100	147	195	226	230	-	-
gemma-7b-інструкція	мл.g5.12xвеликий	256	256	62	119	227	413	601	811	937	962
		2048	256	56	100	172	245	267	273	-	-
		7936	256	44	67	77	77	78	-	-	-

.				Затримка P50 (мс/токен)
Одночасні користувачі				1	2	4	8	16	32	64	128
модель	Тип екземпляра	Вхідні слова	Вихідні жетони	.	.	.	.	.	.	.	.
gemma-2b-інструкція	ml.g5.xlarge	256	256	13	14	15	16	19	23	33	49
		2048	256	14	15	17	20	28	43	79	-
		7936	256	16	19	26	39	68	136	-	-
Gemma-7b-інструкт	мл.g5.12xвеликий	256	256	16	16	17	19	26	38	57	110
		2048	256	17	19	23	32	52	119	-	-
		7936	256	22	29	45	105	197	-	-	-

Налаштуйте Gemma за допомогою SDK SageMaker Python

Далі ми покажемо вам, як точно налаштувати модель інструкцій Gemma 7B на наборі даних у діалоговому форматі за допомогою QLoRA техніка. Як згадувалося раніше, через великий словниковий запас у 256 тисяч і довжину контексту у 8 тисяч JumpStart пропонує такі стандартні конфігурації для тонкого налаштування QLoRA.

Ідентифікатор моделі	Типовий навчальний екземпляр	Максимальна довжина вхідної послідовності	Розмір навчальної партії для кожного пристрою	Ступені градієнтного накопичення
huggingface-llm-gemma-2b	мл.g5.2xвеликий	1024	1	4
huggingface-llm-gemma-2b-instruct	мл.g5.2xвеликий	1024	1	4
huggingface-llm-gemma-7b	мл.g5.12xвеликий	2048	1	4
huggingface-llm-gemma-7b-instruct	мл.g5.12xвеликий	2048	1	4

Давайте завантажимо та обробимо набір даних у розмовному форматі. Прикладом набору даних для цієї демонстрації є ТОП-1 тем розмов OpenAssistant.

from datasets import load_dataset

# Load the dataset
dataset = load_dataset("OpenAssistant/oasst_top1_2023-08-25")

Навчальні дані мають бути сформульовані в рядках JSON (.jsonl), де кожен рядок є словником, що представляє набір розмов. Нижче наведено один приклад у файлі рядків JSON. Докладніше про те, як обробити набір даних, див. у зошиті в GitHub.

{'dialog': [
  {'content': 'what is the height of the empire state building',
   'role': 'user'},
  {'content': '381 meters, or 1,250 feet, is the height of the Empire State Building. If you also account for the antenna, it brings up the total height to 443 meters, or 1,454 feet',
   'role': 'assistant'},
  {'content': 'Some people need to pilot an aircraft above it and need to know.nSo what is the answer in feet?',
   'role': 'user'},
  {'content': '1454 feet', 'role': 'assistant'}]
}
import os
import boto3
from sagemaker.session import Session
from sagemaker.jumpstart.estimator import JumpStartEstimator

model_id = "huggingface-llm-gemma-7b-instruct"

estimator = JumpStartEstimator(
    model_id=model_id, environment={"accept_eula": "false"} # manually accept EULA here!
)

# For the other hyperparameters, see the GitHub notebook attached in this blog.
estimator.set_hyperparameters(chat_dataset="True", peft_type="lora", max_input_length="2048", epoch="3")
estimator.fit({"training": <your_S3_bucket_hosting_the_train_data>})

В основі навчальних сценаріїв JumpStart використовує HuggingFace SFTTrainer з QLoRA та FlashAttention. Flash Attention забезпечує ефективність масштабування, що призводить до швидшого навчання та висновків. Окрім тонкого налаштування на основі чату, JumpStart також підтримує тонке налаштування інструкцій і адаптації домену за допомогою QLoRA. Детальніше дивіться в зошиті в GitHub.

Після точного налаштування ви можете розгорнути налаштовану модель на кінцевій точці SageMaker.

fine_tuned_predictor= estimator.deploy()

Ви можете вибрати розгортання моделі, точно налаштованої на даних розмови в кінцевій точці SageMaker Функція API повідомлень HuggingFace як альтернативний підхід. Перевага використання функції Message API полягає в тому, що вона дозволяє користувачам передавати приклади запитів у необробленому форматі, як показано в наведеній нижче таблиці, а chat_template у кінцевій точці перетворює приклади запитів у правильний формат перед надсиланням їх у модель. Додаткову інформацію див. у розділі розгортання після тонкого налаштування в ноутбук.

Після розгортання точно налаштованої моделі в кінцевій точці ви можете порівняти вихідні відповіді від попередньо навчених і точно налаштованих моделей Gemma. Приклади зібрані з тестових даних, які є резервним набором із навчальних даних. Параметри висновку є max_tokens як 512, top_p як 0.9, temperature як 0.4, і top_k станом на 50 рік.

Як ви бачите за результатами точного налаштування, відповіді агента більш точні.

Щоб глибше оцінити ваші точно налаштовані моделі, ви можете дослідити Оцінка FM за допомогою Amazon SageMaker Clarify щоб побачити ефективність вашої налаштованої моделі порівняно з базовою моделлю.

	Витрати	Основна правда	Відповідь від база модель	Відповідь від налаштованої моделі
1	Користувач: Я хочу попрацювати над своїм словниковим запасом, чи можете ви дати мені кілька простих способів, за допомогою яких я можу знайти нові слова для збільшення різноманітності своїх речень? Помічник: Звичайно! Покращення словникового запасу – це постійний процес, але ось кілька простих способів знайти нові слова та збільшити різноманітність ваших речень: 1. Читайте багато: читання книг, статей і блогів різних жанрів і тем відкриває для вас нові слова та фрази. Занотуйте будь-які незнайомі слова, які вам трапляються, і знайдіть їх значення. 2. Використовуйте тезаурус: щоразу, коли ви пишете або читаєте, використовуйте тезаурус, щоб знайти синоніми для часто вживаних слів. Це не тільки допоможе вам вивчити нові слова, але й покращить ваше розуміння їхніх тонких відмінностей у значенні. 3. Календарі або програми «слово на день». Підпишіться на електронну розсилку «слово на день» або завантажте програму для поповнення словникового запасу. Ці інструменти знайомлять вас із новим словом щодня разом із його значенням, вимовою та прикладами вживання. 4. Приєднайтеся до книжкового клубу чи дискусійної групи: участь у бесідах і обговореннях книг, статей або будь-якої іншої теми відкриває вам різні точки зору та новий словниковий запас. Уважно слухайте інших і намагайтеся використовувати нові слова в контексті. 5. Грайте в словесні ігри: такі ігри, як Scrabble, Boggle і кросворди, перевіряють ваш словниковий запас і допомагають вивчати нові слова в приємний спосіб. 6. Дивіться фільми, телешоу чи документальні фільми: візуальні медіа часто використовують різноманітну мову, сленг і жаргон. Перегляд фільмів, телешоу чи документальних фільмів із субтитрами може допомогти вам краще зрозуміти та запам’ятати нові слова. 7. Потренуйтеся писати: регулярне написання історій, есе чи щоденникових записів заохочує вас використовувати нові слова та фрази. Експериментуйте з різними стилями та жанрами письма, щоб розширити свій словниковий запас. 8. Вивчіть етимологію нового слова: розуміння походження та історії слова може полегшити його запам’ятовування та правильне використання. Дослідження етимології також відкриває вам споріднені слова та поняття. 9. Використовуйте картки або програмне забезпечення для повторення через інтервали: створюйте картки з новими словами, їхніми значеннями та прикладами речень. Регулярно переглядайте їх або використовуйте програмне забезпечення для повторення через інтервали, наприклад Anki, щоб оптимізувати навчання. 10. Встановіть особисті цілі: встановіть досяжні цілі, такі як вивчення п’яти нових слів на тиждень. Слідкуйте за своїм прогресом і винагороджуйте себе за досягнення своїх цілей. Постійно впроваджуючи ці стратегії у свій розпорядок дня, ви поступово створите різноманітний і потужний словниковий запас. Користувач: Хм, мені дуже подобається ідея читання. Чи можете ви порадити мені крутий науково-фантастичний трилер, який я міг би прочитати?	Помічник: Звичайно! Ось кілька рекомендацій щодо науково-фантастичних трилерів, які можуть вам сподобатися: 1. «Проблема трьох тіл» Лю Цісіня – цей відзначений нагородами роман досліджує перший контакт між людством та інопланетною цивілізацією, а також політичні та особисті наслідки цього. Це захоплююче та спонукає до роздумів читання, яке заглиблюється в глибокі питання про природу існування та Всесвіту. 2. «Знищення» Джеффа Вандерміра. Цей роман розповідає про групу вчених, які вирушають у таємничу територію, відому як «Зона X», де вони стикаються з дивними та тривожними явищами. Коли вони заглиблюються в цю територію, вони починають відкривати темні таємниці про природу реальності та світу навколо них. 3. «Темна матерія» Блейка Крауча – цей роман розповідає про геніального фізика на ім’я Джейсон Дессен, якого викрадають і транспортують до паралельного всесвіту. Коли він намагається знайти шлях назад до власної реальності, він повинен зіткнутися зі своїм власним вибором і наслідками своїх дій. 4. «Штам Андромеди» Майкла Крайтона – цей класичний роман розповідає про команду вчених, які намагаються стримати та вивчити смертоносний позаземний мікроб, який приземлився на Землю. Змагаючись із часом, щоб знайти спосіб нейтралізувати мікроб, їм також доводиться боротися з політичними інтригами та особистими конфліктами. 5. «Перший гравець напоготові» Ернеста Клайна – дія цього роману розгортається в антиутопічному майбутньому, де більшість населення проводить час у світі віртуальної реальності, відомому як OASIS. Коли творець OASIS помирає та залишає завдання знайти заховане пасхальне яйце, молодий герой вирушає на захоплюючий квест, який назавжди змінить його життя. Сподіваюся, одна з цих рекомендацій зацікавить вас!	Помічник: Текст не містить інформації про ваші читацькі вподобання чи інтереси, тому я не можу надати рекомендації щодо книги.	Помічник: Звичайно, ось кілька рекомендацій щодо науково-фантастичних трилерів, які можуть вам сподобатися: – «Дюна» Френка Герберта: дія цього епічного науково-фантастичного роману відбувається на пустельній планеті Арракіс, де молодий принц на ім’я Пол Атрейдес має зіткнутися з викликами ворожого оточення та підступного політичного ландшафту. – «Марсіанин» Енді Вейра: цей захоплюючий науково-фантастичний трилер розповідає історію Марка Вотні, астронавта, який опинився на Марсі після пилової бурі, коли він використовує свою винахідливість і винахідливість, щоб вижити і зрештою повернутися на Землю. – «Машина часу» Герберта Уеллса: цей класичний науково-фантастичний роман використовує філософський підхід до концепції подорожей у часі, досліджуючи наслідки зміни минулого та майбутнього. – «Той, що біжить по лезу» Філіпа К. Діка: цей науково-фантастичний роман у стилі неонуар, дія якого відбувається у футуристичному Лос-Анджелесі, досліджує перетин людського та штучного інтелекту та його вплив на суспільство та природу реальності. – «Андроїди» Айзека Азімова: цей науково-фантастичний роман досліджує концепцію штучного інтелекту та його потенційні наслідки, особливо коли люди розробляють вдосконалені андроїди, які кидають виклик традиційним людським цінностям і переконанням. Це лише кілька пропозицій, і зрештою вибір найкращої книги для вас залежатиме від ваших особистих уподобань і того, який досвід ви шукаєте в науково-фантастичному трилері. Але я сподіваюся, що ці рекомендації стануть гарною відправною точкою для вивчення жанру. Будь ласка, дайте мені знати, якщо у вас виникнуть додаткові запитання або якщо я можу чимось вам допомогти. користувач Дякую, що порадили мені ці книги! Я радий незабаром зануритися в один із них! модель Ласкаво просимо! Я радий, що зміг допомогти.
2	Користувач: Напишіть програму Hello World у VB.NET Помічник: Ось так: «`vbnet Загальнодоступний модуль HelloWorld Загальнодоступна підосновна() System.Console.WriteLine("Привіт, світ!") End Sub Кінцевий модуль " Користувач: зробіть так, щоб він вводив дані з $, а потім скажіть «Hello, $» замість «Hello, World!»	Помічник: публічний модуль HelloWorld Загальнодоступна підосновна() System.Console.WriteLine(“Як вас звати?”) Dim name As String = System.Console.ReadLine() System.Console.WriteLine(“Привіт, ” & name & “!”) End Sub Кінцевий модуль	Помічник: «`vbnet Загальнодоступний модуль HelloWorld Загальнодоступна підосновна() Dim name As String = Console.ReadLine() Console.WriteLine("Привіт, " & ім'я) End Sub Кінцевий модуль	Помічник: Звичайно! Ось приклад: «`vbnet Загальнодоступний модуль HelloWorld Загальнодоступна підосновна() Dim userName As String = System.Console.ReadLine() System.Console.WriteLine(“Привіт, ” & ім’я користувача & “!”) End Sub Кінцевий модуль "
3	Користувач: дайте мені список завдань під час запуску проекту з навчання великої мовної моделі, яка може розуміти людські запитання та відповідати на них Помічник: наведені нижче кроки є скороченим списком кроків, які необхідно виконати, починаючи проект з навчання великої мовної моделі, здатної розуміти людські запити та відповідати на них: 1. Визначте обсяг і цілі проекту, цільову аудиторію. 2. Зберіть і попередньо обробіть вичерпний/різноманітний набір текстових даних. 3. Виберіть відповідну архітектуру моделі, налаштуйте гіперпараметри на точність/швидкість. 4. Розділіть набір даних на підмножини для навчання, перевірки, тестування, запровадьте доповнення даних. 5. Навчання моделі, моніторинг прогресу набору перевірки, коригування за потреби. 6. Оцініть модель на тестовому наборі, порівняйте з контрольними показниками, проаналізуйте помилки та упередження. 7. Тонка настройка для конкретних завдань або доменів за допомогою перенесення навчання або тонкого налаштування. 8. Створити інтерфейс для введення даних користувача та відповіді моделі. 9. Тестуйте в контрольованому середовищі, збирайте відгуки для вдосконалення. 10. Постійно контролюйте та покращуйте продуктивність шляхом перепідготовки та вдосконалення. Це повинно дати вам базове уявлення про необхідні кроки. Чи варто детальніше зупинятися на одному з пунктів? Користувач: Ці завдання потрібно детальніше розбити. Не могли б ви надати оновлений список справ із більш детальним розподілом майбутніх завдань	Помічник: Ось більш детальна розбивка кожного кроку: 1. Встановіть обсяг і цілі проекту: важливо чітко визначити цілі проекту та цільову аудиторію. Це допоможе вам прийняти рішення про те, який тип даних збирати та яка архітектура моделі є прийнятною. 2. Збір і попередня обробка даних: це важливий крок, оскільки якість і різноманітність даних безпосередньо впливатимуть на продуктивність моделі. Попередня обробка може передбачати очищення даних, токенізацію тексту та перетворення слів у числове представлення. 3. Виберіть архітектуру моделі. Існує багато різних типів моделей на вибір, включаючи рекурентні нейронні мережі (RNN), трансформаторні моделі та згорткові нейронні мережі (CNN). Вибір залежатиме від конкретних вимог проекту та обсягу доступних даних. 4. Розділіть набір даних і запровадьте розширення даних: розділення даних на підмножини для навчання, перевірки та тестування є важливим для моніторингу ефективності моделі під час навчання. Розширення даних можна використовувати для штучного збільшення розміру набору даних і підвищення стійкості моделі. 5. Навчання моделі та моніторинг прогресу: цей крок передбачає навчання моделі на навчальних даних із використанням набору перевірки для моніторингу прогресу та коригування гіперпараметрів за потреби. Може знадобитися повторити цей процес кілька разів, доки модель не запрацює належним чином у наборі перевірки. 6. Оцініть модель на тестовому наборі: коли модель навчена, важливо оцінити її продуктивність на окремому тестовому наборі, щоб отримати уявлення про її здатність до узагальнення. Це можна зробити шляхом порівняння прогнозів моделі з фактичними результатами та аналізу помилок. 7. Точне налаштування для конкретних завдань або доменів: цей крок передбачає подальше навчання моделі на даних, що стосуються конкретних завдань, щоб покращити її продуктивність для конкретного домену. Це можна зробити за допомогою трансферного навчання, коли попередньо навчена модель налаштовується на нових даних, або за допомогою тонкого налаштування, коли модель навчається з нуля на нових даних. 8. Створіть інтерфейс для введення користувачами: це передбачає розробку інтерфейсу, який дозволяє користувачам вводити запитання чи запити та отримувати відповіді від моделі. 9. Тестування в контрольованому середовищі: перш ніж розгортати модель у реальному середовищі, важливо перевірити її в контрольованому середовищі та зібрати відгуки від користувачів. Це допоможе виявити будь-які помилки чи упередження в моделі та надасть можливості для вдосконалення. 10. Постійно відстежуйте та вдосконалюйте продуктивність: нарешті, важливо постійно відстежувати продуктивність моделі та за потреби вносити оновлення та вдосконалення. Це може включати перенавчання моделі на нових даних, тонке налаштування гіперпараметрів або оновлення архітектури.	Помічник: ## Список справ для навчання великої мовної моделі для відповідей на запитання 1. Обсяг і цілі проекту: * Визначте цілі проекту та бажані функціональні можливості. * Визначте цільову аудиторію та її конкретні потреби. * Визначити бажаний рівень точності та якості відповіді. 2. Збір даних і попередня обробка: * Визначайте джерела для навчальних даних і збирайте різноманітні текстові дані. * Очищення та попередня обробка текстових даних для забезпечення послідовності та якості. * Застосуйте методи збільшення даних, щоб збільшити обсяг навчальних даних. 3. Вибір моделі та конфігурація: * Виберіть відповідну архітектуру моделі на основі складності завдання та бажаної продуктивності. * Тонка настройка гіперпараметрів для оптимізації продуктивності моделі. * Виберіть найбільш підходящий фреймворк і інструменти для реалізації моделі. 4. Навчання та оцінка: * Розділіть навчальні дані на підмножини навчання, перевірки та тестування. * Навчіть модель, використовуючи вибрану структуру та гіперпараметри. * Відстежуйте прогрес навчання на перевірочному наборі та коригуйте параметри моделі за потреби. * Оцініть продуктивність моделі на тестовому наборі порівняно з контрольними показниками та бажаними цілями. 5. Тонка настройка та розробка інтерфейсу: * Тонке налаштування моделі для конкретних завдань або доменів за допомогою перенесення навчання. * Розробіть інтерфейс для введення користувачами та відповіді моделі, враховуючи зручність використання та доступність. * Інтегруйте модель з інтерфейсом і забезпечте безперебійну взаємодію. 6. Тестування та вдосконалення: * Перевірте модель у контрольованому середовищі з різними вхідними сценаріями. * Збирайте відгуки користувачів і експертів, щоб визначити сфери, які потрібно покращити. * Постійно відстежуйте та вдосконалюйте продуктивність моделі шляхом перепідготовки та точного налаштування. Додаткові зауваження: * Встановіть графік і бюджет для проекту. * Визначте потенційні проблеми та розробіть плани на випадок непередбачених обставин. * Задокументуйте процес і результати для подальшого використання та співпраці. Примітка. Цей список не є вичерпним і може потребувати адаптації відповідно до вимог конкретного проекту.	Помічник: Звичайно, ось більш детальна розбивка завдань, пов’язаних із навчанням великої мовної моделі розуміти людські запитання та відповідати на них: 1. Встановіть обсяг і цілі проекту – Визначте цілі та завдання проекту, включаючи цільову аудиторію та бажану функціональність моделі. – Визначте конкретні завдання, які модель повинна буде виконати. 2. Збір і попередня обробка комплексного/різноманітного набору текстових даних – Визначте джерела текстових даних, які відповідають цільовій аудиторії та завданням. – Очищення та попередня обробка текстових даних для забезпечення узгодженості та якості. – Створіть збалансований набір даних, який відображає різноманіття людської мови та мислення. 3. Виберіть відповідну архітектуру моделі, налаштуйте гіперпараметри для точності/швидкості – Виберіть архітектуру моделі, яка добре підходить для завдань і даних. – Точне налаштування гіперпараметрів моделі для оптимізації продуктивності та швидкості. – Відстежуйте продуктивність моделі на даних перевірки, щоб переконатися, що її можна узагальнити. 4. Розділіть набір даних на підмножини для навчання, перевірки, тестування, запровадьте розширення даних – Розділіть набір даних на підмножини для навчання, перевірки та тестування. – Впровадити методи розширення даних для збільшення різноманітності та розміру навчальних даних. 5. Навчання моделі, моніторинг прогресу перевірки, коригування за потреби – Навчіть модель за допомогою навчальних даних. – Відстежуйте прогрес моделі на даних перевірки, щоб визначити області для вдосконалення. – За потреби налаштуйте гіперпараметри або архітектуру моделі для оптимізації продуктивності. 6. Оцініть модель на тестовому наборі, порівняйте з контрольними показниками, проаналізуйте помилки та зміщення – Оцініть продуктивність моделі на основі тестових даних. – Порівняйте продуктивність моделі з контрольними показниками та галузевими стандартами. – Аналізуйте помилки та упередження, щоб визначити області для покращення. 7. Точна настройка для конкретних завдань або доменів за допомогою трансферного навчання або тонкої настройки – Тонко налаштуйте модель для конкретних завдань або областей шляхом передачі знань із попередньо навченої моделі. – Використовуйте перехідне навчання, щоб використовувати наявні знання та покращувати продуктивність моделі. 8. Створення інтерфейсу для введення даних користувача та відповіді моделі – Створіть інтерфейс, який дозволяє користувачам вводити запитання та отримувати відповіді від моделі. – Розробіть інтерфейс таким, щоб він був зручним та інтуїтивно зрозумілим. 9. Тестуйте в контрольованому середовищі, збирайте відгуки для покращення – Перевірте модель у контрольованому середовищі, щоб переконатися, що вона функціонує належним чином. – Збирайте відгуки від користувачів, щоб визначити сфери, які потрібно покращити. 10. Постійно контролюйте та вдосконалюйте продуктивність шляхом перенавчання та тонкої настройки – Постійно контролюйте продуктивність моделі. – За потреби перенавчіть і налаштуйте модель для покращення її продуктивності. Це етапи навчання великої мовної моделі для розуміння людських запитань і відповідей на них. Будь ласка, дайте мені знати, якщо у вас є запитання.

Прибирати

Після перевірки кінцевих точок видаліть кінцеві точки висновку SageMaker і модель, щоб уникнути стягнення плати.

Висновок

У цій публікації ми показали вам, як розпочати роботу з Gemma в SageMaker Studio та розгорнути модель для висновку. Ми також показали вам, як можна точно налаштувати моделі Gemma на SageMaker Jumpstart.

Оскільки базові моделі проходять попередню підготовку, вони можуть допомогти знизити витрати на навчання та інфраструктуру, а також уможливити налаштування для вашого випадку використання. Щоб почати, відвідайте SageMaker JumpStart у SageMaker Studio.

Ця інструкція призначена лише для інформаційних цілей. Ви все одно повинні провести власну незалежну оцінку та вжити заходів, щоб переконатися, що ви дотримуєтеся своїх власних практик і стандартів контролю якості, а також місцевих правил, законів, постанов, ліцензій і умов використання, які стосуються вас, вашого вмісту та модель стороннього виробника, на яку посилається в цьому посібнику. AWS не контролює та не має повноважень щодо моделі третьої сторони, на яку посилається в цьому посібнику, і не робить жодних заяв чи гарантій, що модель стороннього розробника безпечна, не містить вірусів, працює чи сумісна з вашим робочим середовищем і стандартами. AWS не робить жодних заяв, не гарантує, що будь-яка інформація в цьому посібнику призведе до певного результату.

Про авторів

Доктор Кайл Ульріх є прикладним науковцем з Вбудовані алгоритми Amazon SageMaker команда. Його дослідницькі інтереси включають масштабовані алгоритми машинного навчання, комп’ютерне бачення, часові ряди, байєсівські непараметричні процеси та процеси Гаусса. Його доктор філософії отримав в Університеті Дьюка, і він опублікував статті в NeurIPS, Cell і Neuron.

Доктор Синь Хуан є старшим прикладним науковим співробітником Amazon SageMaker JumpStart і вбудованих алгоритмів Amazon SageMaker. Він зосереджується на розробці масштабованих алгоритмів машинного навчання. Його дослідницькі інтереси стосуються обробки природної мови, пояснюваного глибокого навчання на табличних даних і надійного аналізу непараметричної просторово-часової кластеризації. Він опублікував багато статей на конференціях ACL, ICDM, KDD і Королівського статистичного товариства: серія A.

Рачна Чадха є головним архітектором рішень AI/ML у Strategic Accounts в AWS. Рахна — оптиміст, який вірить, що етичне та відповідальне використання ШІ може покращити суспільство в майбутньому та принести економічне та соціальне процвітання. У вільний час Рачна любить проводити час з сім'єю, гуляти в походах і слухати музику.

Еван Кравіц є інженером-програмістом Amazon Web Services, працює над SageMaker JumpStart. Йому подобається готувати і бігати в Нью-Йорку.

Доктор Ашиш Хетан є старшим прикладним науковим співробітником із вбудованими алгоритмами Amazon SageMaker і допомагає розробляти алгоритми машинного навчання. Він отримав ступінь доктора філософії в Іллінойському університеті Урбана-Шампейн. Він активно досліджує машинне навчання та статистичні висновки та опублікував багато статей на конференціях NeurIPS, ICML, ICLR, JMLR, ACL та EMNLP.

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
джерело: https://aws.amazon.com/blogs/machine-learning/gemma-is-now-available-in-amazon-sagemaker-jumpstart/

Часова мітка: Березня 13, 2024

Часова мітка: Березень 4, 2024

Перевидано Платоном

Як Medidata використовувала асинхронний висновок Amazon SageMaker для прискорення прогнозування логічного висновку до 30 разів швидше

Операціоналізуйте свої блокноти Amazon SageMaker Studio як заплановані завдання для ноутбуків

Представляємо маховик Amazon Comprehend для MLOps

Створюйте високоефективні моделі класифікації зображень за допомогою Amazon SageMaker JumpStart

Прискорення часу до аналізу за допомогою колекцій часових рядів MongoDB і Amazon SageMaker Canvas | Веб-сервіси Amazon

Аліда глибше розуміє відгуки клієнтів завдяки Amazon Bedrock | Веб-сервіси Amazon

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки