Ajustați Falcon 7B și alte LLM-uri pe Amazon SageMaker cu @remote Decorator

Republicat de Platon

Urmaritori: 0

Astăzi, modelele AI generative acoperă o varietate de sarcini, de la rezumarea textului, întrebări și răspunsuri și generarea de imagini și videoclipuri. Pentru a îmbunătăți calitatea rezultatelor, abordări precum n-short learning, Prompt engineering, Recuperare Augmented Generation (RAG) și se folosesc reglaje fine. Reglarea fină vă permite să ajustați aceste modele AI generative pentru a obține performanțe îmbunătățite în sarcinile specifice domeniului dvs.

cu Amazon SageMaker, acum puteți rula o lucrare de antrenament SageMaker pur și simplu adnotând codul dvs. Python cu @decorator la distanță. SageMaker Python SDK traduce automat mediul dvs. de lucru existent și orice cod de procesare a datelor și seturi de date asociate într-un job de instruire SageMaker care rulează pe platforma de instruire. Acest lucru are avantajul de a scrie codul într-un mod mai natural, orientat pe obiecte și încă folosește capabilitățile SageMaker pentru a rula joburi de instruire pe un cluster la distanță cu modificări minime.

În această postare, vă prezentăm cum să reglați fin a Soimul-7B Modele de fundație (FM) folosind @remote decorator de la SageMaker Python SDK. De asemenea, folosește Reglarea fină eficientă a parametrilor Hugging Face (PEFT) bibliotecă și tehnici de cuantizare prin biți și octeți pentru a sprijini reglajul fin. Codul prezentat în acest blog poate fi folosit și pentru a regla alte FM-uri, cum ar fi Lama-2 13b.

Reprezentările de precizie completă ale acestui model ar putea avea provocări pentru a se potrivi în memorie pe un singur sau chiar mai multe Unități de procesare grafică (GPU) — sau poate chiar avea nevoie de o instanță mai mare. Prin urmare, pentru a regla acest model fără a crește costul, folosim tehnica cunoscută ca LLM cuantizate cu adaptoare de rang scăzut (QLoRA). QLoRA este o abordare eficientă de reglare fină care reduce utilizarea memoriei LLM-urilor menținând în același timp o performanță foarte bună.

Avantajele utilizării @remote decorator

Înainte de a merge mai departe, să înțelegem cum decoratorul de la distanță îmbunătățește productivitatea dezvoltatorului în timp ce lucrează cu SageMaker:

@remote decorator declanșează o lucrare de instruire direct folosind codul python nativ, fără invocarea explicită a SageMaker Estimators și a canalelor de intrare SageMaker
Barieră scăzută de intrare pentru modele de instruire pentru dezvoltatori pe SageMaker.
Nu este nevoie să schimbați Medii de dezvoltare integrate (IDE). Continuați să scrieți cod în IDE-ul ales de dvs. și invocați joburi de formare SageMaker.
Nu este nevoie să înveți despre containere. Continuați să furnizați dependențe în a requirements.txt și furnizați-o decoratorului de la distanță.

Cerințe preliminare

Este necesar un cont AWS cu un Gestionarea identității și accesului AWS (AWS IAM) rol care are permisiuni de gestionare a resurselor create ca parte a soluției. Pentru detalii, consultați Crearea unui cont AWS.

În această postare, folosim Amazon SageMaker Studio cu Data Science 3.0 imagine și a ml.t3.medium instanță de lansare rapidă. Cu toate acestea, puteți utiliza orice mediu de dezvoltare integrat (IDE) la alegere. Trebuie doar să vă configurați Interfața liniei de comandă AWS (AWS CLI) corect. Pentru mai multe informații, consultați Configurați AWS CLI.

Pentru reglaj fin, Falcon-7B, an ml.g5.12xlarge instanța este folosită în această postare. Vă rugăm să asigurați o capacitate suficientă pentru această instanță în contul AWS.

Trebuie să clonezi asta Depozit Github pentru replicarea soluției demonstrate în această postare.

Prezentare generală a soluțiilor

Instalați cerințele preliminare pentru reglarea fină a modelului Falcon-7B
Configurați configurațiile decoratorului de la distanță
Preprocesează setul de date care conține întrebări frecvente ale serviciilor AWS
Ajustați Falcon-7B la întrebările frecvente ale serviciilor AWS
Testați modelele de reglare fină pe exemple de întrebări legate de serviciile AWS

1. Instalați cerințele preliminare pentru reglarea fină a modelului Falcon-7B

Lansați caietul falcon-7b-qlora-remote-decorator_qa.ipynb în SageMaker Studio selectând IMAGE as Data Science și Nucleu as Python 3. Instalați toate bibliotecile necesare menționate în requirements.txt. Puține dintre biblioteci trebuie instalate pe instanța de notebook în sine. Efectuați alte operațiuni necesare pentru procesarea setului de date și declanșarea unui job de instruire SageMaker.

%pip install -r requirements.txt %pip install -q -U transformers==4.31.0
%pip install -q -U datasets==2.13.1
%pip install -q -U peft==0.4.0
%pip install -q -U accelerate==0.21.0
%pip install -q -U bitsandbytes==0.40.2
%pip install -q -U boto3
%pip install -q -U sagemaker==2.154.0
%pip install -q -U scikit-learn

2. Configurați configurațiile decoratorului de la distanță

Creați un fișier de configurare în care sunt specificate toate configurațiile legate de jobul de instruire Amazon SageMaker. Acest fișier este citit de @remote decorator în timp ce rulează jobul de antrenament. Acest fișier conține setări cum ar fi dependențe, imagine de antrenament, instanță și rolul de execuție care va fi utilizat pentru munca de antrenament. Pentru o referință detaliată a tuturor setărilor acceptate de fișierul de configurare, consultați Configurarea și utilizarea setărilor implicite cu SageMaker Python SDK.

SchemaVersion: '1.0'
SageMaker: PythonSDK: Modules: RemoteFunction: Dependencies: ./requirements.txt ImageUri: '{aws_account_id}.dkr.ecr.{region}.amazonaws.com/huggingface-pytorch-training:2.0.0-transformers4.28.1-gpu-py310-cu118-ubuntu20.04' InstanceType: ml.g5.12xlarge RoleArn: arn:aws:iam::111122223333:role/ExampleSageMakerRole

Nu este obligatoriu să utilizați config.yaml fișier pentru a lucra cu decoratorul @remote. Acesta este doar o modalitate mai curată de a furniza toate configurațiile decoratorului @remote. Acest lucru păstrează parametrii legați de SageMaker și AWS în afara codului, cu un efort unic pentru configurarea fișierului de configurare utilizat pentru membrii echipei. Toate configurațiile ar putea fi, de asemenea, furnizate direct în argumentele decoratorului, dar asta reduce lizibilitatea și menținerea modificărilor pe termen lung. De asemenea, fișierul de configurare poate fi creat de un administrator și partajat cu toți utilizatorii dintr-un mediu.

Preprocesează setul de date care conține întrebări frecvente ale serviciilor AWS

Următorul pas este să încărcați și să preprocesați setul de date pentru a-l pregăti pentru munca de instruire. Mai întâi, să aruncăm o privire asupra setului de date:

Ajustați Falcon 7B și alte LLM-uri pe Amazon SageMaker cu @remote decorator | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Afișează întrebări frecvente pentru unul dintre serviciile AWS. Pe lângă QLoRA, bitsanbytes este folosit pentru a converti la precizia de 4 biți pentru a cuantifica LLM înghețat la 4 biți și pentru a atașa LoRA adaptoare pe el.

Creați un șablon de prompt pentru a converti fiecare eșantion de întrebări frecvente într-un format de prompt:

from random import randint # custom instruct prompt start
prompt_template = f"{{question}}n---nAnswer:n{{answer}}{{eos_token}}" # template dataset to add prompt to each sample
def template_dataset(sample): sample["text"] = prompt_template.format(question=sample["question"], answer=sample["answers"], eos_token=tokenizer.eos_token) return sample

Următorul pas este să convertiți intrările (textul) în ID-uri de simbol. Acest lucru este realizat de a Hugging Face Transformers Tokenizer.

from transformers import AutoTokenizer model_id = "tiiuae/falcon-7b" tokenizer = AutoTokenizer.from_pretrained(model_id)
# Set the Falcon tokenizer
tokenizer.pad_token = tokenizer.eos_token

Acum pur și simplu utilizați prompt_template funcția de a converti toate întrebările frecvente în format prompt și de a configura seturile de date de tren și de testare.

Ajustați Falcon 7B și alte LLM-uri pe Amazon SageMaker cu @remote decorator | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

4. Ajustați Falcon-7B la întrebările frecvente ale serviciilor AWS

Acum puteți pregăti scriptul de antrenament și puteți defini funcția de antrenament train_fn și pune @remote decorator pe funcție.

Funcția de antrenament face următoarele:

tokenizează și fragmentează setul de date
instituit BitsAndBytesConfig, care specifică că modelul ar trebui să fie încărcat pe 4 biți, dar în timp ce calculul ar trebui convertit în bfloat16.
Încărcați modelul
Găsiți module țintă și actualizați matricele necesare utilizând metoda utilitarului find_all_linear_names
Crea LoRA configurații care specifică clasarea matricelor de actualizare (s), factorul de scalare (lora_alpha), modulele pentru aplicarea matricelor de actualizare LoRA (target_modules), probabilitatea de abandon pentru straturile Lora(lora_dropout), task_type, Etc
Începeți pregătirea și evaluarea

import bitsandbytes as bnb def find_all_linear_names(hf_model): lora_module_names = set() for name, module in hf_model.named_modules(): if isinstance(module, bnb.nn.Linear4bit): names = name.split(".") lora_module_names.add(names[0] if len(names) == 1 else names[-1]) if "lm_head" in lora_module_names: lora_module_names.remove("lm_head") return list(lora_module_names)
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
from sagemaker.remote_function import remote
import torch
from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import transformers # Start training
@remote(volume_size=50)
def train_fn( model_name, train_ds, test_ds, lora_r=8, lora_alpha=32, lora_dropout=0.05, per_device_train_batch_size=8, per_device_eval_batch_size=8, learning_rate=2e-4, num_train_epochs=1
): # tokenize and chunk dataset lm_train_dataset = train_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, batch_size=24, remove_columns=list(train_dataset.features) ) lm_test_dataset = test_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, remove_columns=list(test_dataset.features) ) # Print total number of samples print(f"Total number of train samples: {len(lm_train_dataset)}") bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_use_double_quant=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.bfloat16 ) # Falcon requires you to allow remote code execution. This is because the model uses a new architecture that is not part of transformers yet. # The code is provided by the model authors in the repo. model = AutoModelForCausalLM.from_pretrained( model_name, trust_remote_code=True, quantization_config=bnb_config, device_map="auto") model.gradient_checkpointing_enable() model = prepare_model_for_kbit_training(model, use_gradient_checkpointing=True) # get lora target modules modules = find_all_linear_names(model) print(f"Found {len(modules)} modules to quantize: {modules}") config = LoraConfig( r=lora_r, lora_alpha=lora_alpha, target_modules=modules, lora_dropout=lora_dropout, bias="none", task_type="CAUSAL_LM" ) model = get_peft_model(model, config) print_trainable_parameters(model) trainer = transformers.Trainer( model=model, train_dataset=lm_train_dataset, eval_dataset=lm_test_dataset, args=transformers.TrainingArguments( per_device_train_batch_size=per_device_train_batch_size, per_device_eval_batch_size=per_device_eval_batch_size, logging_steps=2, num_train_epochs=num_train_epochs, learning_rate=learning_rate, bf16=True, save_strategy="no", output_dir="outputs" ), data_collator=transformers.DataCollatorForLanguageModeling(tokenizer, mlm=False), ) model.config.use_cache = False trainer.train() trainer.evaluate() model.save_pretrained("/opt/ml/model")

Și invocă train_fn()

train_fn(model_id, train_dataset, test_dataset)

Lucrarea de reglare ar rula pe clusterul de antrenament Amazon SageMaker. Așteptați finalizarea lucrării de reglare.

5. Testați modelele de reglare fină pe exemple de întrebări legate de serviciile AWS

Acum, este timpul să rulăm câteva teste pe model. Mai întâi, să încărcăm modelul:

from peft import PeftModel, PeftConfig
import torch
from transformers import AutoModelForCausalLM device = 'cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu' config = PeftConfig.from_pretrained("./model")
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, trust_remote_code=True)
model = PeftModel.from_pretrained(model, "./model")
model.to(device)

Acum încărcați un exemplu de întrebare din setul de date de antrenament pentru a vedea răspunsul inițial și apoi puneți aceeași întrebare din modelul reglat pentru a vedea răspunsul în comparație.

Iată un exemplu de întrebare din setul de antrenament și răspunsul original:

Ajustați Falcon 7B și alte LLM-uri pe Amazon SageMaker cu @remote decorator | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Acum, aceeași întrebare este adresată modelului Falcon-7B reglat:

Ajustați Falcon 7B și alte LLM-uri pe Amazon SageMaker cu @remote decorator | Amazon Web Services PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Aceasta încheie implementarea reglajului fin Falcon-7B pe setul de date FAQ privind serviciile AWS folosind @remote decorator de la Amazon SageMaker Python SDK.

A curăța

Parcurgeți următorii pași pentru a vă curăța resursele:

Închideți instanțele Amazon SageMaker Studio pentru a evita costuri suplimentare.
Curățați sistemul de fișiere Amazon Elastic (Amazon EFS) prin ștergerea directorului cache Hugging Face:
```
rm -R ~/.cache/huggingface/hub
```

Concluzie

În această postare, v-am arătat cum să utilizați eficient capacitățile decoratorului @remote pentru a regla fin modelul Falcon-7B folosind QLoRA, Hugging Face PEFT cu bitsandbtyes fără a aplica modificări semnificative în caietul de antrenament și a folosit capabilitățile Amazon SageMaker pentru a rula lucrări de instruire pe un cluster la distanță.

Tot codul afișat ca parte a acestei postări pentru a regla finul Falcon-7B este disponibil în GitHub depozit. Depozitul conține, de asemenea, un notebook care arată cum să reglați fin Llama-13B.

Ca pas următor, vă încurajăm să verificați @funcționalitatea decoratorului de la distanță și API-ul Python SDK și utilizați-l în mediul și IDE alese. Exemple suplimentare sunt disponibile în amazon-sagemaker-exemple depozit pentru a începe rapid. De asemenea, puteți consulta următoarele postări:

Despre Autori

Bruno Pistone este un arhitect specializat în soluții AI/ML pentru AWS cu sediul în Milano. Lucrează cu clienți mari, ajutându-i să-și înțeleagă în profunzime nevoile tehnice și să proiecteze soluții de AI și de învățare automată care folosesc cel mai bine AWS Cloud și stiva Amazon Machine Learning. Expertiza sa includ: Machine Learning end to end, Machine Learning Industrialization și Generative AI. Îi place să petreacă timpul cu prietenii săi și să exploreze locuri noi, precum și să călătorească către noi destinații.

Vikesh Pandey este arhitect de soluții specializat în învățare automată la AWS, ajutând clienții din industriile financiare să proiecteze și să construiască soluții pe IA generativă și ML. În afara serviciului, lui Vikesh îi place să încerce diferite bucătării și să facă sporturi în aer liber.

Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
PlatoESG. Automobile/VE-uri, carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
ChartPrime. Crește-ți jocul de tranzacționare cu ChartPrime. Accesați Aici.
BlockOffsets. Modernizarea proprietății de compensare a mediului. Accesați Aici.
Sursa: https://aws.amazon.com/blogs/machine-learning/fine-tune-falcon-7b-and-other-llms-on-amazon-sagemaker-with-remote-decorator/

Timestamp-ul: 14 Septembrie, 2023

Timestamp-ul: Aprilie 23, 2024

Republicat de Platon

Noi funcții pentru Amazon SageMaker Pipelines și Amazon SageMaker SDK

Instruire distribuită și scalare eficientă cu Amazon SageMaker Model Parallel and Data Parallel Libraries | Amazon Web Services

Implementați o soluție MLOps care găzduiește punctele finale ale modelului dvs. în AWS Lambda

AlexaTM 20B este acum disponibil în Amazon SageMaker JumpStart

Creați o conductă de analiză a sentimentelor MLOps folosind Amazon SageMaker Ground Truth și Databricks MLflow

Preziceți prețurile imobiliare rezidențiale la ImmoScout24 cu Amazon SageMaker

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont