Instructie Fine-tuning voor FLAN T5 XL met Amazon SageMaker Jumpstart

Heruitgegeven door Plato

volgers: 0

Generatieve AI bevindt zich midden in een periode van verbluffende groei. Er worden continu steeds betere basismodellen uitgebracht, waarbij grote taalmodellen (LLM's) een van de meest zichtbare modelklassen zijn. LLM's zijn modellen die zijn samengesteld uit miljarden parameters die zijn getraind op uitgebreide tekstcorpora, tot honderden miljarden of zelfs een biljoen tokens. Deze modellen zijn buitengewoon effectief gebleken voor een breed scala aan op tekst gebaseerde taken, van het beantwoorden van vragen tot sentimentanalyse.

De kracht van LLM's komt voort uit hun vermogen om te leren en te generaliseren van uitgebreide en diverse trainingsgegevens. De initiële training van deze modellen wordt uitgevoerd met verschillende doelstellingen, onder toezicht, zonder toezicht of hybride. Tekstaanvulling of imputatie is een van de meest voorkomende doelstellingen zonder toezicht: gegeven een stuk tekst leert het model nauwkeurig te voorspellen wat er daarna komt (bijvoorbeeld de volgende zin voorspellen). Modellen kunnen ook onder toezicht worden getraind met behulp van gelabelde gegevens om een reeks taken uit te voeren (is deze filmrecensie bijvoorbeeld positief, negatief of neutraal). Of het model nu is getraind voor tekstaanvulling of een andere taak, het is vaak niet de taak waarvoor klanten het model willen gebruiken.

Om de prestaties van een vooraf getrainde LLM op een specifieke taak te verbeteren, kunnen we het model afstemmen met behulp van voorbeelden van de doeltaak in een proces dat bekend staat als instructie fijnafstemming. Bij het afstemmen van instructies wordt een reeks gelabelde voorbeelden gebruikt in de vorm van {prompt, respons}-paren om het vooraf getrainde model verder te trainen in het adequaat voorspellen van de reactie op de prompt. Dit proces wijzigt de gewichten van het model.

In dit bericht wordt beschreven hoe u instructie-fijnafstemming van een LLM uitvoert, namelijk FLAN T5 XL, met behulp van Amazon SageMaker-jumpstart. We laten zien hoe u dit kunt bereiken met behulp van zowel de Jumpstart-gebruikersinterface als een notebook in Amazon SageMaker Studio U kunt de bijbehorende notebook in de amazon-sagemaker-voorbeelden GitHub-opslagplaats.

Overzicht oplossingen

De doeltaak in dit bericht is om, gegeven een stuk tekst in de prompt, vragen te retourneren die verband houden met de tekst, maar die niet kunnen worden beantwoord op basis van de informatie die het bevat. Dit is een nuttige taak om ontbrekende informatie in een beschrijving te identificeren of om te bepalen of een vraag meer informatie nodig heeft om te worden beantwoord.

FLAN T5-modellen zijn nauwkeurig afgestemd op instructies voor een breed scala aan taken om de zero-shot-prestaties van deze modellen voor veel voorkomende taken te verbeteren[1]. Het afstemmen van aanvullende instructies voor een bepaalde klanttaak kan de nauwkeurigheid van deze modellen verder vergroten, vooral als de doeltaak niet eerder werd gebruikt om een FLAN T5-model te trainen, zoals het geval is voor onze taak.

In onze voorbeeldtaak zijn we geïnteresseerd in het genereren van relevante maar onbeantwoorde vragen. Hiertoe gebruiken we een subset van versie 2 van de Stanford Question Answering Dataset (SQuAD2.0)[2] om het model te verfijnen. Deze dataset bevat vragen van menselijke annotators over een reeks Wikipedia-artikelen. Naast vragen met antwoorden bevat SQuAD2.0 zo'n 50,000 onbeantwoordbare vragen. Dergelijke vragen zijn plausibel, maar kunnen niet direct worden beantwoord vanuit de inhoud van artikelen. We gebruiken alleen de onbeantwoordbare vragen. Onze gegevens zijn gestructureerd als een JSON Lines-bestand, waarbij elke regel een context en een vraag bevat.

Screenshot van enkele ingangen van de SQuADv2-dataset.

Voorwaarden

Om te beginnen heb je alleen een AWS-account nodig waarin je Studio kunt gebruiken. U moet een gebruikersprofiel voor Studio maken als u er nog geen heeft.

Verfijn FLAN-T5 met de Jumpstart UI

Voer de volgende stappen uit om het model af te stemmen met de Jumpstart-gebruikersinterface:

Open Studio op de SageMaker-console.
Onder SageMaker-startpagina in het navigatievenster, kies Modellen, notebooks, oplossingen.

U ziet een lijst met funderingsmodellen, waaronder FLAN T5 XL, die is gemarkeerd als fijnafstelbaar.

Kies Bekijk model.

De JumpStart-gebruikersinterface met FLAN-T5 XL.

Onder Databron, kunt u het pad naar uw trainingsgegevens opgeven. De bron voor de gegevens die in dit bericht worden gebruikt, wordt standaard verstrekt.
U kunt de standaardwaarde voor de implementatieconfiguratie (inclusief instantietype), beveiliging en hyperparameters behouden, maar u moet het aantal tijdperken verhogen tot ten minste drie om goede resultaten te krijgen.
Kies Trainen om het model te trainen.

De JumpStart-treininterface voor het FLAN-T5 XL-model.

U kunt de status van de trainingstaak volgen in de gebruikersinterface.

Jumpstart-gebruikersinterface voor lopende training.

Wanneer de training is voltooid (in ons geval na ongeveer 53 minuten), kiest u Implementeren om het verfijnde model in te zetten.

JumpStart UI-training voltooid.

Nadat het eindpunt is gemaakt (enkele minuten), kunt u een notitieblok openen en uw verfijnde model gaan gebruiken.

Verfijn FLAN-T5 met behulp van een Python-notebook

Onze voorbeeldnotitieblok laat zien hoe u Jumpstart en SageMaker kunt gebruiken om een FLAN T5 XL-model programmatisch af te stemmen en te implementeren. Het kan in Studio of lokaal worden uitgevoerd.

In dit gedeelte lopen we eerst door een aantal algemene instellingen. Vervolgens stem je het model af met behulp van de SQuADv2-datasets. Vervolgens implementeert u de vooraf getrainde versie van het model achter een SageMaker-eindpunt en doet u hetzelfde met het verfijnde model. Ten slotte kunt u de eindpunten opvragen en de kwaliteit van de uitvoer van het vooraf getrainde en verfijnde model vergelijken. U zult merken dat de uitvoer van het verfijnde model van veel hogere kwaliteit is.

Vereisten instellen

Begin met het installeren en upgraden van de benodigde pakketten. Start de kernel opnieuw op na het uitvoeren van de volgende code:

!pip install nest-asyncio==1.5.5 --quiet
!pip install ipywidgets==8.0.4 --quiet
!pip install --upgrade sagemaker --quiet

Verkrijg vervolgens de uitvoeringsrol die is gekoppeld aan de huidige notebookinstantie:

import boto3
import sagemaker
# Get current region, role, and default bucket
aws_region = boto3.Session().region_name
aws_role = sagemaker.session.Session().get_caller_identity_arn()
output_bucket = sagemaker.Session().default_bucket()
# This will be useful for printing
newline, bold, unbold = "n", "33[1m", "33[0m"
print(f"{bold}aws_region:{unbold} {aws_region}")
print(f"{bold}aws_role:{unbold} {aws_role}")
print(f"{bold}output_bucket:{unbold} {output_bucket}"

U kunt een handig vervolgkeuzemenu definiëren met de beschikbare modelmaten voor fijnafstemming:

import IPython
from ipywidgets import Dropdown
from sagemaker.jumpstart.filters import And
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models
# Default model choice
model_id = "huggingface-text2text-flan-t5-xl"
# Identify FLAN T5 models that support fine-tuning
filter_value = And( "task == text2text", "framework == huggingface", "training_supported == true"
)
model_list = [m for m in list_jumpstart_models(filter=filter_value) if "flan-t5" in m]
# Display the model IDs in a dropdown, for user to select
dropdown = Dropdown(
value=model_id,
options=model_list,
description="FLAN T5 models available for fine-tuning:",
style={"description_width": "initial"},
layout={"width": "max-content"},
)
display(IPython.display.Markdown("### Select a pre-trained model from the dropdown below"))
display(dropdown)

Jumpstart haalt automatisch de juiste typen training en deductie-instanties op voor het model dat u hebt gekozen:

from sagemaker.instance_types import retrieve_default
model_id, model_version = dropdown.value, "*"
# Instance types for training and inference
training_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="training"
)
inference_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="inference"
)
print(f"{bold}model_id:{unbold} {model_id}")
print(f"{bold}training_instance_type:{unbold} {training_instance_type}")
print(f"{bold}inference_instance_type:{unbold} {inference_instance_type}") If you have chosen the FLAN T5 XL, you will see the following output: model_id: huggingface-text2text-flan-t5-xl training_instance_type: ml.p3.16xlarge inference_instance_type: ml.g5.2xlarge

U bent nu klaar om te beginnen met finetunen.

Train het model opnieuw op de gegevensset voor fijnafstelling

Nadat uw installatie is voltooid, voert u de volgende stappen uit:

Gebruik de volgende code om de URI voor de benodigde artefacten op te halen:

from sagemaker import image_uris, model_uris, script_uris
# Training instance will use this image
train_image_uri = image_uris.retrieve(
region=aws_region,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="training",
instance_type=training_instance_type,
)
# Pre-trained model
train_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="training"
)
# Script to execute on the training instance
train_script_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="training"
)
print(f"{bold}image uri:{unbold} {train_image_uri}")
print(f"{bold}model uri:{unbold} {train_model_uri}")
print(f"{bold}script uri:{unbold} {train_script_uri}")

De trainingsgegevens bevinden zich in een openbare ruimte Amazon eenvoudige opslagservice (Amazon S3) emmer.

Gebruik de volgende code om naar de locatie van de gegevens te verwijzen en stel de uitvoerlocatie in een bucket in uw account in:

from sagemaker.s3 import S3Downloader # We will use the train split of SQuAD2.0
original_data_file = "train-v2.0.json" # The data was mirrored in the following bucket
original_data_location = f"s3://sagemaker-sample-files/datasets/text/squad2.0/{original_data_file}"
S3Downloader.download(original_data_location, ".")

De oorspronkelijke gegevens hebben niet de indeling die overeenkomt met de taak waarvoor u het model aan het verfijnen bent, dus u kunt deze opnieuw formatteren:

import json local_data_file = "task-data.jsonl"  # any name with .jsonl extension with open(original_data_file) as f:
data = json.load(f) with open(local_data_file, "w") as f:
for article in data["data"]:
for paragraph in article["paragraphs"]:
# iterate over questions for a given paragraph
for qas in paragraph["qas"]:
if qas["is_impossible"]:
# the question is relevant, but cannot be answered
example = {"context": paragraph["context"], "question": qas["question"]}
json.dump(example, f)
f.write("n") template = { "prompt": "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}", "completion": "{question}",
}
with open("template.json", "w") as f:
json.dump(template, f) from sagemaker.s3 import S3Uploader train_data_location = f"s3://{output_bucket}/train_data"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"{bold}training data:{unbold} {train_data_location}")

Nu kunt u enkele hyperparameters voor de training definiëren:

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for fine-tuning the model
hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) # We will override some default hyperparameters with custom values
hyperparameters["epochs"] = "3"
# TODO
# hyperparameters["max_input_length"] = "300"  # data inputs will be truncated at this length
# hyperparameters["max_output_length"] = "40"  # data outputs will be truncated at this length
# hyperparameters["generation_max_length"] = "40"  # max length of generated output
print(hyperparameters)

U bent nu klaar om de trainingstaak te starten:

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base model_name = "-".join(model_id.split("-")[2:])  # get the most informative part of ID
training_job_name = name_from_base(f"js-demo-{model_name}-{hyperparameters['epochs']}")
print(f"{bold}job name:{unbold} {training_job_name}") training_metric_definitions = [
{"Name": "val_loss", "Regex": "'eval_loss': ([0-9.]+)"},
{"Name": "train_loss", "Regex": "'loss': ([0-9.]+)"},
{"Name": "epoch", "Regex": "'epoch': ([0-9.]+)"},
] # Create SageMaker Estimator instance
sm_estimator = Estimator(
role=aws_role,
image_uri=train_image_uri,
model_uri=train_model_uri,
source_dir=train_script_uri,
entry_point="transfer_learning.py",
instance_count=1,
instance_type=training_instance_type,
volume_size=300,
max_run=360000,
hyperparameters=hyperparameters,
output_path=output_location,
metric_definitions=training_metric_definitions,
) # Launch a SageMaker training job over data located in the given S3 path
# Training jobs can take hours, it is recommended to set wait=False,
# and monitor job status through SageMaker console
sm_estimator.fit({"training": train_data_location}, job_name=training_job_name, wait=False)

Afhankelijk van de grootte van de fijnafstemmingsgegevens en het gekozen model, kan de fijnafstemming enkele uren duren.

U kunt prestatiestatistieken zoals training en validatieverlies bewaken met behulp van Amazon Cloud Watch tijdens de training. Handig is dat u ook de meest recente snapshot van metrische gegevens kunt ophalen door de volgende code uit te voeren:

from sagemaker import TrainingJobAnalytics # This can be called while the job is still running
df = TrainingJobAnalytics(training_job_name=training_job_name).dataframe()
df.head(10) model uri: s3://sagemaker-us-west-2-802376408542/avkan/training-huggingface-text2text-huggingface-text2text-flan-t5-xl-repack.tar.gz
job name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738
INFO:sagemaker:Creating training-job with name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738

Als de training is afgerond, beschikt u over een gefinetuned model model_uri. Laten we het gebruiken!

U kunt twee gevolgtrekkingseindpunten maken: één voor het oorspronkelijke, vooraf getrainde model en één voor het verfijnde model. Hierdoor kunt u de uitvoer van beide versies van het model vergelijken. In de volgende stap implementeert u een deductie-eindpunt voor het vooraf getrainde model. Vervolgens implementeert u een eindpunt voor uw verfijnde model.

Het vooraf getrainde model implementeren

Laten we beginnen met het implementeren van het vooraf getrainde model om de gevolgtrekking Docker-afbeeldings-URI op te halen. Dit is de basisafbeelding van de Hugging Face-container. Gebruik de volgende code:

from sagemaker import image_uris # Retrieve the inference docker image URI. This is the base HuggingFace container image
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="inference",
instance_type=inference_instance_type,
)

U kunt nu het eindpunt maken en het vooraf getrainde model implementeren. Houd er rekening mee dat u de Predictor-klasse moet doorgeven bij het implementeren van het model via de Model-klasse om deductie via de SageMaker API te kunnen uitvoeren. Zie de volgende code:

from sagemaker import model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base # Retrieve the URI of the pre-trained model
pre_trained_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) pre_trained_name = name_from_base(f"jumpstart-demo-pre-trained-{model_id}") # Create the SageMaker model instance of the pre-trained model
if ("small" in model_id) or ("base" in model_id):
deploy_source_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="inference"
)
pre_trained_model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
entry_point="inference.py",
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
)
else:
# For those large models, we already repack the inference script and model
# artifacts for you, so the `source_dir` argument to Model is not required.
pre_trained_model = Model(
image_uri=deploy_image_uri,
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {pre_trained_model_uri}")
print("Deploying an endpoint ...") # Deploy the pre-trained model. Note that we need to pass Predictor class when we deploy model
# through Model class, for being able to run inference through the SageMaker API
pre_trained_predictor = pre_trained_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=pre_trained_name,
)
print(f"{newline}Deployed an endpoint {pre_trained_name}")

Het maken van het eindpunt en de implementatie van het model kan enkele minuten duren, waarna uw eindpunt klaar is om inferentieoproepen te ontvangen.

Het verfijnde model implementeren

Laten we het verfijnde model implementeren op zijn eigen eindpunt. Het proces is bijna identiek aan het proces dat we eerder gebruikten voor het vooraf getrainde model. Het enige verschil is dat we de verfijnde modelnaam en URI gebruiken:

from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base fine_tuned_name = name_from_base(f"jumpstart-demo-fine-tuned-{model_id}")
fine_tuned_model_uri = f"{output_location}{training_job_name}/output/model.tar.gz" # Create the SageMaker model instance of the fine-tuned model
fine_tuned_model = Model(
image_uri=deploy_image_uri,
model_data=fine_tuned_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=fine_tuned_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {fine_tuned_model_uri}")
print("Deploying an endpoint ...") # Deploy the fine-tuned model.
fine_tuned_predictor = fine_tuned_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=fine_tuned_name,
)
print(f"{newline}Deployed an endpoint {fine_tuned_name}")

Wanneer dit proces is voltooid, worden zowel vooraf getrainde als nauwkeurig afgestelde modellen geïmplementeerd achter hun eigen eindpunten. Laten we hun output vergelijken.

Genereer output en vergelijk de resultaten

Definieer enkele hulpprogramma-functies om het eindpunt op te vragen en het antwoord te ontleden:

import boto3
import json # Parameters of (output) text generation. A great introduction to generation
# parameters can be found at https://huggingface.co/blog/how-to-generate
parameters = { "max_length": 40,  # restrict the length of the generated text "num_return_sequences": 5,  # we will inspect several model outputs "num_beams": 10,  # use beam search
} # Helper functions for running inference queries
def query_endpoint_with_json_payload(payload, endpoint_name):
encoded_json = json.dumps(payload).encode("utf-8")
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
generated_text = model_predictions["generated_texts"]
return generated_text def generate_questions(endpoint_name, text):
expanded_prompt = prompt.replace("{context}", text)
payload = {"text_inputs": expanded_prompt, **parameters}
query_response = query_endpoint_with_json_payload(payload, endpoint_name=endpoint_name)
generated_texts = parse_response_multiple_texts(query_response)
for i, generated_text in enumerate(generated_texts):
print(f"Response {i}: {generated_text}{newline}")

In het volgende codefragment definiëren we de prompt en de testgegevens. Het beschrijft onze doeltaak, namelijk het genereren van vragen die verband houden met de verstrekte tekst, maar die op basis daarvan niet kunnen worden beantwoord.

De testgegevens bestaan uit drie verschillende paragrafen, een over de Australische stad Adelaide uit de eerste twee alinea's van de Wikipedia-pagina, een betreffende Amazon elastische blokwinkel (Amazon EBS) van de Amazon EBS-documentatieen een van Amazon begrijpt het van het Amazon Comprehend-documentatie. We verwachten dat het model vragen met betrekking tot deze alinea's identificeert, maar dat kan niet worden beantwoord met de daarin verstrekte informatie.

prompt = "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}" test_paragraphs = [ """
Adelaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south. """, """
Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes. """, """
Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages. """
]

U kunt nu de eindpunten testen met behulp van de voorbeeldartikelen

print(f"{bold}Prompt:{unbold} {repr(prompt)}")
for paragraph in test_paragraphs:
print("-" * 80)
print(paragraph)
print("-" * 80)
print(f"{bold}pre-trained{unbold}")
generate_questions(pre_trained_name, paragraph)
print(f"{bold}fine-tuned{unbold}")
generate_questions(fine_tuned_name, paragraph)

Testgegevens: Adelaide

We gebruiken de volgende context:

delaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south.

De vooraf getrainde modelrespons is als volgt:

Response 0: What is the area of the city centre and surrounding parklands called in the Kaurna language?
Response 1: What is the area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language?
Response 2: What is the area of the city centre and surrounding parklands called in Kaurna?
Response 3: What is the capital city of South Australia?
Response 4: What is the area of the city centre and surrounding parklands known as in the Kaurna language?

De verfijnde modelreacties zijn als volgt:

Response 0: What is the second most populous city in Australia?
Response 1: What is the fourth most populous city in Australia?
Response 2: What is the population of Gawler?
Response 3: What is the largest city in Australia?
Response 4: What is the fifth most populous city in the world?

Testgegevens: Amazon EBS

We gebruiken de volgende context:

Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes.

De vooraf getrainde modelreacties zijn als volgt:

esponse 0: What is the difference between Amazon EBS and Amazon Elastic Block Store (Amazon EBS)?
Response 1: What is the difference between Amazon EBS and Amazon Elastic Block Store?
Response 2: What is the difference between Amazon EBS and Amazon Simple Storage Service (Amazon S3)?
Response 3: What is Amazon Elastic Block Store (Amazon EBS)?
Response 4: What is the difference between Amazon EBS and a hard drive?

De verfijnde modelreacties zijn als volgt:

Response 0: What type of applications are not well suited to Amazon EBS?
Response 1: What behaves like formatted block devices?
Response 2: What type of applications are not suited to Amazon EBS?
Response 3: What type of applications are not well suited for Amazon EBS?
Response 4: What type of applications are not suited for Amazon EBS?

Testgegevens: Amazon Comprehend

We gebruiken de volgende context:

Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages.

De vooraf getrainde modelreacties zijn als volgt:

Response 0: What does Amazon Comprehend use to extract insights about the content of documents?
Response 1: How does Amazon Comprehend extract insights about the content of documents?
Response 2: What does Amazon Comprehend use to develop insights about the content of documents?
Response 3: How does Amazon Comprehend develop insights about the content of documents?
Response 4: What does Amazon Comprehend use to extract insights about the content of a document?

De verfijnde modelreacties zijn als volgt:

Response 0: What does Amazon Comprehend use to extract insights about the structure of documents?
Response 1: How does Amazon Comprehend recognize sentiments in a document?
Response 2: What does Amazon Comprehend use to extract insights about the content of social networking feeds?
Response 3: What does Amazon Comprehend use to extract insights about the content of documents?
Response 4: What type of files does Amazon Comprehend reject as input?

Het verschil in uitvoerkwaliteit tussen het vooraf getrainde model en het verfijnde model is groot. De vragen van het verfijnde model raken aan een breder scala aan onderwerpen. Het zijn systematisch zinvolle vragen, wat niet altijd het geval is voor het vooraf getrainde model, zoals geïllustreerd met het Amazon EBS-voorbeeld.

Hoewel dit geen formele en systematische evaluatie is, is het duidelijk dat het proces van fijnafstemming de kwaliteit van de antwoorden van het model op deze taak heeft verbeterd.

Opruimen

Vergeet ten slotte niet om de eindpunten op te ruimen en te verwijderen:

# Delete resources
pre_trained_predictor.delete_model()
pre_trained_predictor.delete_endpoint()
fine_tuned_predictor.delete_model()
fine_tuned_predictor.delete_endpoint()

Conclusie

In dit bericht hebben we laten zien hoe u instructie-fijnafstemming kunt gebruiken met FLAN T5-modellen met behulp van de Jumpstart-gebruikersinterface of een Jupyter-notebook die in Studio draait. We hebben code geleverd waarin wordt uitgelegd hoe het model opnieuw kan worden getraind met behulp van gegevens voor de doeltaak en hoe het verfijnde model achter een eindpunt kan worden geïmplementeerd. De doeltaak in dit bericht was om vragen te identificeren die betrekking hebben op een stuk tekst in de invoer, maar die niet kunnen worden beantwoord op basis van de informatie in die tekst. We hebben aangetoond dat een model dat is afgestemd op deze specifieke taak betere resultaten oplevert dan een vooraf getraind model.

Nu u weet hoe u een model kunt verfijnen met Jumpstart, kunt u krachtige modellen maken die zijn aangepast voor uw toepassing. Verzamel wat gegevens voor uw use case, upload deze naar Amazon S3 en gebruik de Studio UI of de notebook om een FLAN T5-model af te stemmen!

Referenties

[1] Chung, Hyung Won, et al. "Schaalbare instructie-fijn afgestemde taalmodellen." arXiv voordruk arXiv:2210.11416 (2022).

[2] Rajpurkar, Pranav, Robin Jia en Percy Liang. "Weet wat je niet weet: onbeantwoordbare vragen voor SQuAD." Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Deel 2: Short Papers). 2018.

Over de auteurs

Laurent Callot is een Principal Applied Scientist en manager bij AWS AI Labs die heeft gewerkt aan verschillende machine learning-problemen, van fundamentele modellen en generatieve AI tot prognoses, afwijkingsdetectie, causaliteit en AI Ops.

Andrew Kan is een Senior Applied Scientist bij AWS AI Labs met interesses en ervaring op verschillende gebieden van Machine Learning. Dit omvat onderzoek naar funderingsmodellen, maar ook ML-toepassingen voor grafieken en tijdreeksen.

Dr Ashish Khetan is een Senior Applied Scientist met ingebouwde algoritmen van Amazon SageMaker en helpt bij het ontwikkelen van algoritmen voor machine learning. Hij promoveerde aan de Universiteit van Illinois, Urbana Champaign. Hij is een actief onderzoeker op het gebied van machine learning en statistische inferentie en heeft veel artikelen gepubliceerd op NeurIPS-, ICML-, ICLR-, JMLR-, ACL- en EMNLP-conferenties.

Baris Kurt is Applied Scientist bij AWS AI Labs. Zijn interesses liggen bij de detectie van afwijkingen in tijdreeksen en funderingsmodellen. Hij houdt ervan om gebruiksvriendelijke ML-systemen te ontwikkelen.

Jonas Kubler is Applied Scientist bij AWS AI Labs. Hij werkt aan funderingsmodellen met als doel use-case specifieke toepassingen mogelijk te maken.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoAiStream. Web3 gegevensintelligentie. Kennis versterkt. Toegang hier.
De toekomst slaan met Adryenn Ashley. Toegang hier.
Koop en verkoop aandelen in PRE-IPO-bedrijven met PREIPO®. Toegang hier.
Bron: https://aws.amazon.com/blogs/machine-learning/instruction-fine-tuning-for-flan-t5-xl-with-amazon-sagemaker-jumpstart/

Tijdstempel: 22 mei 2023

Tijdstempel: December 1, 2023

Heruitgegeven door Plato

Bereik een vier keer hogere ML-inferentiedoorvoer tegen drie keer lagere kosten per inferentie met Amazon EC2 G5-instanties voor NLP- en CV PyTorch-modellen

Introductie van het Amazon Comprehend-vliegwiel voor MLOps

Knowledge Bases in Amazon Bedrock vereenvoudigen nu het stellen van vragen over één enkel document | Amazon-webservices

Bied live assistentie van uw chatbotgebruikers met Amazon Lex en Talkdesk cloudcontactcentrum | Amazon-webservices

MLOps aan de rand met Amazon SageMaker Edge Manager en AWS IoT Greengrass

Organiseer uw machine learning-reis met Amazon SageMaker Experiments en Amazon SageMaker Pipelines

De productiviteit van ontwikkelaars verhogen: hoe Deloitte Amazon SageMaker Canvas gebruikt voor machine learning zonder/low-code | Amazon-webservices

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account