Verfijn Falcon 7B en andere LLM's op Amazon SageMaker met @remote Decorator

Heruitgegeven door Plato

volgers: 0

Tegenwoordig bestrijken generatieve AI-modellen een verscheidenheid aan taken, van het samenvatten van teksten, vragen en antwoorden en het genereren van afbeeldingen en video's. Om de kwaliteit van de output te verbeteren, zijn benaderingen als n-short learning, Prompt engineering, Ophalen van Augmented Generation (RAG) en fijnafstemming worden gebruikt. Met fijnafstemming kunt u deze generatieve AI-modellen aanpassen om betere prestaties te bereiken bij uw domeinspecifieke taken.

met Amazon Sage Maker, nu kunt u een SageMaker-trainingstaak uitvoeren door eenvoudigweg uw Python-code te annoteren met @externe binnenhuisarchitect. De SageMaker Python-SDK vertaalt automatisch uw bestaande werkruimteomgeving en eventuele bijbehorende gegevensverwerkingscode en datasets naar een SageMaker-trainingstaak die op het trainingsplatform draait. Dit heeft het voordeel dat de code op een meer natuurlijke, objectgeoriënteerde manier wordt geschreven en dat er nog steeds gebruik wordt gemaakt van de mogelijkheden van SageMaker om trainingstaken uit te voeren op een extern cluster met minimale wijzigingen.

In dit bericht laten we zien hoe u een Valk-7B Foundation Models (FM) met behulp van @remote decorateur van SageMaker Python SDK. Het gebruikt ook De parameter-efficiënte fijnafstemming van Hugging Face (PEFT) bibliotheek en kwantiseringstechnieken door bitsandbytes ter ondersteuning van de fijnafstemming. De code die in deze blog wordt gepresenteerd, kan ook worden gebruikt om andere FM's te verfijnen, zoals Lama-2 13b.

De volledige precisierepresentaties van dit model kunnen problemen hebben om in het geheugen van één of zelfs meerdere modellen te passen Grafische verwerkingseenheden (GPU's) – of heeft misschien zelfs een groter exemplaar nodig. Om dit model te verfijnen zonder de kosten te verhogen, gebruiken we daarom de techniek die bekend staat als Gekwantiseerde LLM's met Low-Rank Adapters (QLoRA). QLoRA is een efficiënte aanpak voor fijnafstemming die het geheugengebruik van LLM's vermindert terwijl de zeer goede prestaties behouden blijven.

Voordelen van het gebruik van @remote decorateur

Laten we, voordat we verder gaan, eerst begrijpen hoe een externe decorateur de productiviteit van ontwikkelaars verbetert tijdens het werken met SageMaker:

@remote decorateur activeert een trainingstaak rechtstreeks met behulp van native Python-code, zonder de expliciete aanroep van SageMaker Estimators en SageMaker-invoerkanalen
Lage toegangsdrempel voor ontwikkelaars die modellen trainen op SageMaker.
Overstappen is niet nodig Geïntegreerde ontwikkelomgevingen (IDE's). Ga door met het schrijven van code in de IDE van uw keuze en roep SageMaker-trainingstaken aan.
U hoeft niets over containers te leren. Ga door met het verstrekken van afhankelijkheden in a requirements.txt en geef dat aan een externe decorateur.

Voorwaarden

Er is een AWS-account nodig met een AWS Identiteits- en toegangsbeheer (AWS IAM) rol die machtigingen heeft om bronnen te beheren die zijn gemaakt als onderdeel van de oplossing. Voor details, zie Een AWS-account aanmaken.

In dit bericht gebruiken we Amazon SageMaker Studio met de Data Science 3.0 afbeelding en een ml.t3.medium snelle lanceringsinstantie. U kunt echter elke geïntegreerde ontwikkelomgeving (IDE) van uw keuze gebruiken. U hoeft alleen maar uw AWS-opdrachtregelinterface (AWS CLI) referenties correct. Voor meer informatie, zie Configureer de AWS CLI.

Voor fijnafstemming is er de Falcon-7B, een ml.g5.12xlarge instance wordt in dit bericht gebruikt. Zorg ervoor dat er voldoende capaciteit is voor deze instantie in het AWS-account.

Je moet dit klonen Github-repository voor het repliceren van de oplossing die in dit bericht wordt gedemonstreerd.

Overzicht oplossingen

Installeer de vereisten voor het verfijnen van het Falcon-7B-model
Configureer configuraties voor externe decorateurs
Verwerk de dataset met veelgestelde vragen over AWS-services voor
Verfijn Falcon-7B op veelgestelde vragen over AWS-services
Test de verfijnde modellen op voorbeeldvragen met betrekking tot AWS-services

1. Installeer de vereisten om het Falcon-7B-model nauwkeurig af te stemmen

Start de notebook falcon-7b-qlora-remote-decorator_qa.ipynb in SageMaker Studio door de Itovenaar as Data Science en pit as Python 3. Installeer alle vereiste bibliotheken vermeld in de requirements.txt. Er hoeven maar weinig bibliotheken op de notebookinstantie zelf te worden geïnstalleerd. Voer andere bewerkingen uit die nodig zijn voor de verwerking van gegevenssets en het activeren van een SageMaker-trainingstaak.

%pip install -r requirements.txt %pip install -q -U transformers==4.31.0
%pip install -q -U datasets==2.13.1
%pip install -q -U peft==0.4.0
%pip install -q -U accelerate==0.21.0
%pip install -q -U bitsandbytes==0.40.2
%pip install -q -U boto3
%pip install -q -U sagemaker==2.154.0
%pip install -q -U scikit-learn

2. Configuraties voor externe decorateurs instellen

Maak een configuratiebestand waarin alle configuraties met betrekking tot de Amazon SageMaker-trainingstaak worden gespecificeerd. Dit bestand wordt gelezen door @remote decorateur tijdens het uitvoeren van de trainingstaak. Dit bestand bevat instellingen zoals afhankelijkheden, trainingsimage, exemplaar en de uitvoeringsrol die voor de trainingstaak moet worden gebruikt. Voor een gedetailleerde referentie van alle instellingen die door het configuratiebestand worden ondersteund, ga naar Standaardinstellingen configureren en gebruiken met de SageMaker Python SDK.

SchemaVersion: '1.0'
SageMaker: PythonSDK: Modules: RemoteFunction: Dependencies: ./requirements.txt ImageUri: '{aws_account_id}.dkr.ecr.{region}.amazonaws.com/huggingface-pytorch-training:2.0.0-transformers4.28.1-gpu-py310-cu118-ubuntu20.04' InstanceType: ml.g5.12xlarge RoleArn: arn:aws:iam::111122223333:role/ExampleSageMakerRole

Het is niet verplicht om de config.yaml bestand om met @remote decorateur te kunnen werken. Dit is gewoon een schonere manier om alle configuraties aan de @remote-decorateur te leveren. Hierdoor blijven SageMaker- en AWS-gerelateerde parameters buiten de code, met een eenmalige inspanning voor het instellen van het configuratiebestand dat door de teamleden wordt gebruikt. Alle configuraties kunnen ook rechtstreeks in de decorator-argumenten worden opgegeven, maar dat vermindert op de lange termijn de leesbaarheid en onderhoudbaarheid van wijzigingen. Ook kan het configuratiebestand door een beheerder worden aangemaakt en gedeeld met alle gebruikers in een omgeving.

Verwerk de dataset met veelgestelde vragen over AWS-services voor

De volgende stap is het laden en voorbewerken van de dataset, zodat deze klaar is voor de trainingstaak. Laten we eerst eens kijken naar de dataset:

Verfijn Falcon 7B en andere LLM's op Amazon SageMaker met @remote decorateur | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Het toont veelgestelde vragen voor een van de AWS-services. Naast QLoRA, bitsanbytes wordt gebruikt om te converteren naar 4-bits precisie om bevroren LLM naar 4-bit te kwantiseren en te koppelen LoRA adapters erop.

Maak een promptsjabloon om elk voorbeeld van veelgestelde vragen naar een promptindeling te converteren:

from random import randint # custom instruct prompt start
prompt_template = f"{{question}}n---nAnswer:n{{answer}}{{eos_token}}" # template dataset to add prompt to each sample
def template_dataset(sample): sample["text"] = prompt_template.format(question=sample["question"], answer=sample["answers"], eos_token=tokenizer.eos_token) return sample

De volgende stap is het converteren van de invoer (tekst) naar token-ID's. Dit wordt gedaan door een Knuffelen Gezicht Transformers Tokenizer.

from transformers import AutoTokenizer model_id = "tiiuae/falcon-7b" tokenizer = AutoTokenizer.from_pretrained(model_id)
# Set the Falcon tokenizer
tokenizer.pad_token = tokenizer.eos_token

Gebruik nu eenvoudig de prompt_template functie om alle veelgestelde vragen naar het promptformaat te converteren en trein- en testdatasets in te stellen.

Verfijn Falcon 7B en andere LLM's op Amazon SageMaker met @remote decorateur | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

4. Verfijn Falcon-7B op veelgestelde vragen over AWS-services

Nu kunt u het trainingsscript voorbereiden en de trainingsfunctie definiëren train_fn en zet @remote decorateur op de functie.

De trainingsfunctie doet het volgende:

tokeniseert en deelt de gegevensset op
instellen BitsAndBytesConfig, wat specificeert dat het model in 4-bit moet worden geladen, maar terwijl de berekening moet worden geconverteerd naar bfloat16.
Laad het model
Zoek doelmodules en update de benodigde matrices met behulp van de utility-methode find_all_linear_names
creëren LoRA configuraties die de rangschikking van updatematrices specificeren (s), schaalfactor (lora_alpha), de modules om de LoRA-updatematrices toe te passen (target_modules), uitvalkans voor Lora-lagen (lora_dropout), task_type, Etc.
Start de training en evaluatie

import bitsandbytes as bnb def find_all_linear_names(hf_model): lora_module_names = set() for name, module in hf_model.named_modules(): if isinstance(module, bnb.nn.Linear4bit): names = name.split(".") lora_module_names.add(names[0] if len(names) == 1 else names[-1]) if "lm_head" in lora_module_names: lora_module_names.remove("lm_head") return list(lora_module_names)
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
from sagemaker.remote_function import remote
import torch
from transformers import AutoModelForCausalLM, BitsAndBytesConfig
import transformers # Start training
@remote(volume_size=50)
def train_fn( model_name, train_ds, test_ds, lora_r=8, lora_alpha=32, lora_dropout=0.05, per_device_train_batch_size=8, per_device_eval_batch_size=8, learning_rate=2e-4, num_train_epochs=1
): # tokenize and chunk dataset lm_train_dataset = train_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, batch_size=24, remove_columns=list(train_dataset.features) ) lm_test_dataset = test_ds.map( lambda sample: tokenizer(sample["text"]), batched=True, remove_columns=list(test_dataset.features) ) # Print total number of samples print(f"Total number of train samples: {len(lm_train_dataset)}") bnb_config = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_use_double_quant=True, bnb_4bit_quant_type="nf4", bnb_4bit_compute_dtype=torch.bfloat16 ) # Falcon requires you to allow remote code execution. This is because the model uses a new architecture that is not part of transformers yet. # The code is provided by the model authors in the repo. model = AutoModelForCausalLM.from_pretrained( model_name, trust_remote_code=True, quantization_config=bnb_config, device_map="auto") model.gradient_checkpointing_enable() model = prepare_model_for_kbit_training(model, use_gradient_checkpointing=True) # get lora target modules modules = find_all_linear_names(model) print(f"Found {len(modules)} modules to quantize: {modules}") config = LoraConfig( r=lora_r, lora_alpha=lora_alpha, target_modules=modules, lora_dropout=lora_dropout, bias="none", task_type="CAUSAL_LM" ) model = get_peft_model(model, config) print_trainable_parameters(model) trainer = transformers.Trainer( model=model, train_dataset=lm_train_dataset, eval_dataset=lm_test_dataset, args=transformers.TrainingArguments( per_device_train_batch_size=per_device_train_batch_size, per_device_eval_batch_size=per_device_eval_batch_size, logging_steps=2, num_train_epochs=num_train_epochs, learning_rate=learning_rate, bf16=True, save_strategy="no", output_dir="outputs" ), data_collator=transformers.DataCollatorForLanguageModeling(tokenizer, mlm=False), ) model.config.use_cache = False trainer.train() trainer.evaluate() model.save_pretrained("/opt/ml/model")

En roep de train_fn()

train_fn(model_id, train_dataset, test_dataset)

De afstemmingstaak zou worden uitgevoerd op het Amazon SageMaker-trainingscluster. Wacht tot de afstemmingstaak is voltooid.

5. Test de fine-tune-modellen op voorbeeldvragen met betrekking tot AWS-services

Nu is het tijd om enkele tests op het model uit te voeren. Laten we eerst het model laden:

from peft import PeftModel, PeftConfig
import torch
from transformers import AutoModelForCausalLM device = 'cuda' if torch.cuda.is_available() else 'mps' if torch.backends.mps.is_available() else 'cpu' config = PeftConfig.from_pretrained("./model")
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, trust_remote_code=True)
model = PeftModel.from_pretrained(model, "./model")
model.to(device)

Laad nu een voorbeeldvraag uit de trainingsgegevensset om het oorspronkelijke antwoord te zien en stel vervolgens dezelfde vraag vanuit het afgestemde model om het antwoord in vergelijking te zien.

Hier is een voorbeeld van een vraag uit de trainingsset en het oorspronkelijke antwoord:

Verfijn Falcon 7B en andere LLM's op Amazon SageMaker met @remote decorateur | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Nu wordt dezelfde vraag gesteld aan het afgestemde Falcon-7B-model:

Verfijn Falcon 7B en andere LLM's op Amazon SageMaker met @remote decorateur | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Hiermee is de implementatie afgerond van het verfijnen van Falcon-7B op de dataset met veelgestelde vragen over AWS-services met behulp van @remote decorateur van Amazon SageMaker Python SDK.

Schoonmaken

Voer de volgende stappen uit om uw bronnen op te schonen:

Sluit de Amazon SageMaker Studio-instanties af om extra kosten te voorkomen.
Ruim uw Amazon Elastic File System op (Amazon EFS) map door de cachemap van Hugging Face te wissen:
```
rm -R ~/.cache/huggingface/hub
```

Conclusie

In dit bericht hebben we u laten zien hoe u de mogelijkheden van @remote decorateur effectief kunt gebruiken om het Falcon-7B-model te verfijnen met behulp van QLoRA, Hugging Face PEFT met bitsandbtyes zonder significante wijzigingen in het trainingsnotebook aan te brengen, en de mogelijkheden van Amazon SageMaker te gebruiken om trainingstaken op een extern cluster uit te voeren.

Alle code die als onderdeel van dit bericht wordt weergegeven om Falcon-7B te verfijnen, is beschikbaar in de GitHub-repository. De repository bevat ook een notitieboekje dat laat zien hoe je Llama-13B kunt verfijnen.

Als volgende stap raden we je aan om de @remote decorateur-functionaliteit en Python SDK-API en gebruik het in uw keuze van omgeving en IDE. Meer voorbeelden zijn beschikbaar in de amazon-sagemaker-voorbeelden repository zodat u snel aan de slag kunt. Je kunt ook de volgende berichten bekijken:

Over de auteurs

Bruno Piston is een AI/ML Specialist Solutions Architect voor AWS, gevestigd in Milaan. Hij werkt met grote klanten en helpt hen hun technische behoeften diepgaand te begrijpen en AI- en Machine Learning-oplossingen te ontwerpen die optimaal gebruik maken van de AWS Cloud en de Amazon Machine Learning-stack. Zijn expertise omvat onder meer: machine learning van begin tot eind, machine learning-industrialisatie en generatieve AI. Hij brengt graag tijd door met zijn vrienden en ontdekt graag nieuwe plaatsen, maar ook reist hij graag naar nieuwe bestemmingen.

Vikesh Pandey is een Machine Learning Specialist Solutions Architect bij AWS, die klanten uit de financiële sector helpt bij het ontwerpen en bouwen van oplossingen op basis van generatieve AI en ML. Buiten het werk houdt Vikesh ervan om verschillende keukens uit te proberen en buitensporten te beoefenen.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. Automotive / EV's, carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
ChartPrime. Verhoog uw handelsspel met ChartPrime. Toegang hier.
BlockOffsets. Eigendom voor milieucompensatie moderniseren. Toegang hier.
Bron: https://aws.amazon.com/blogs/machine-learning/fine-tune-falcon-7b-and-other-llms-on-amazon-sagemaker-with-remote-decorator/

Tijdstempel: 14 september 2023

Tijdstempel: 23-2024-XNUMX

Heruitgegeven door Plato

Nieuwe functies voor Amazon SageMaker Pipelines en de Amazon SageMaker SDK

Gedistribueerde training en efficiënt schalen met de Amazon SageMaker Model Parallel en Data Parallel Libraries | Amazon-webservices

Implementeer een MLOps-oplossing die uw modeleindpunten host in AWS Lambda

AlexaTM 20B is nu beschikbaar in Amazon SageMaker JumpStart

Bouw een MLOps-pijplijn voor sentimentanalyse met Amazon SageMaker Ground Truth en Databricks MLflow

Voorspel de prijzen van residentieel vastgoed bij ImmoScout24 met Amazon SageMaker

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account