Instruktion Finjustering For FLAN T5 XL Med Amazon SageMaker Jumpstart

Genudgivet af Platon

Abonnenter: 0

Generativ AI er midt i en periode med forbløffende vækst. Stadig mere dygtige fundamentmodeller frigives løbende, hvor store sprogmodeller (LLM'er) er en af de mest synlige modelklasser. LLM'er er modeller sammensat af milliarder af parametre trænet på omfattende tekstkorpus, op til hundreder af milliarder eller endda en billion tokens. Disse modeller har vist sig ekstremt effektive til en bred vifte af tekstbaserede opgaver, lige fra besvarelse af spørgsmål til sentimentanalyse.

Styrken ved LLM'er kommer fra deres evne til at lære og generalisere fra omfattende og forskelligartede træningsdata. Den indledende træning af disse modeller udføres med en række forskellige mål, overvåget, uden opsyn eller hybrid. Tekstfuldførelse eller imputering er et af de mest almindelige uovervågede mål: Givet en del tekst lærer modellen præcist at forudsige, hvad der kommer næste gang (for eksempel forudsige den næste sætning). Modeller kan også trænes på en overvåget måde ved hjælp af mærkede data til at udføre et sæt opgaver (er f.eks. denne filmanmeldelse positiv, negativ eller neutral). Uanset om modellen er trænet til tekstudfyldelse eller en anden opgave, er det ofte ikke den opgave, kunderne ønsker at bruge modellen til.

For at forbedre ydeevnen af en præ-trænet LLM på en specifik opgave, kan vi tune modellen ved hjælp af eksempler på målopgaven i en proces kendt som finjustering af instruktion. Instruktionsfinjustering bruger et sæt mærkede eksempler i form af {prompt, respons}-par til yderligere at træne den forudtrænede model i tilstrækkeligt at forudsige svaret givet prompten. Denne proces ændrer modellens vægte.

Dette indlæg beskriver, hvordan man udfører instruktionsfinjustering af en LLM, nemlig FLAN T5 XL, vha. Amazon SageMaker Jumpstart. Vi demonstrerer, hvordan du opnår dette ved at bruge både Jumpstart UI og en notesbog i Amazon SageMaker Studio. Du kan finde medfølgende notesbog i amazon-sagemaker-eksempler GitHub -depot.

Løsningsoversigt

Målopgaven i dette indlæg er, givet et stykke tekst i prompten, at returnere spørgsmål, der er relateret til teksten, men som ikke kan besvares baseret på den information, den indeholder. Dette er en nyttig opgave til at identificere manglende oplysninger i en beskrivelse eller identificere, om en forespørgsel har brug for flere oplysninger for at blive besvaret.

FLAN T5-modeller er instruktion finjusteret på en lang række opgaver for at øge disse modellers nul-skuds ydeevne på mange almindelige opgaver[1]. Yderligere instruktionsfinjustering for en bestemt kundeopgave kan yderligere øge nøjagtigheden af disse modeller, især hvis målopgaven ikke tidligere blev brugt til at træne en FLAN T5-model, som det er tilfældet for vores opgave.

I vores eksempelopgave er vi interesserede i at generere relevante, men ubesvarede spørgsmål. Til dette formål bruger vi en delmængde af version 2 af Stanford Question Answering Dataset (SQuAD2.0)[2] til at finjustere modellen. Dette datasæt indeholder spørgsmål stillet af menneskelige annotatorer på et sæt Wikipedia-artikler. Ud over spørgsmål med svar indeholder SQuAD2.0 omkring 50,000 ubesvarede spørgsmål. Sådanne spørgsmål er plausible, men kan ikke besvares direkte ud fra artiklernes indhold. Vi bruger kun de ubesvarede spørgsmål. Vores data er struktureret som en JSON Lines-fil, hvor hver linje indeholder en kontekst og et spørgsmål.

Skærmbillede af nogle få poster i SQuADv2-datasættet.

Forudsætninger

For at komme i gang behøver du kun en AWS-konto, hvor du kan bruge Studio. Du skal oprette en brugerprofil til Studio, hvis du ikke allerede har en.

Finjuster FLAN-T5 med Jumpstart UI

Udfør følgende trin for at finjustere modellen med Jumpstart UI:

Åbn Studio på SageMaker-konsollen.
Under SageMaker Jumpstart i navigationsruden skal du vælge Modeller, notesbøger, løsninger.

Du vil se en liste over fundamentmodeller, inklusive FLAN T5 XL, som er markeret som finjusterbar.

Vælg Se model.

JumpStart UI med FLAN-T5 XL.

Under Datakilde, kan du angive stien til dine træningsdata. Kilden til de data, der bruges i dette indlæg, er angivet som standard.
Du kan beholde standardværdien for implementeringskonfigurationen (inklusive instanstype), sikkerhed og hyperparametrene, men du bør øge antallet af epoker til mindst tre for at få gode resultater.
Vælg Tog at træne modellen.

JumpStart tog UI til FLAN-T5 XL modellen.

Du kan spore status for træningsjobbet i brugergrænsefladen.

Jumpstart UI til træning i gang.

Når træningen er afsluttet (efter ca. 53 minutter i vores tilfælde), skal du vælge Implementer at implementere den finjusterede model.

JumpStart UI-træning afsluttet.

Når slutpunktet er oprettet (et par minutter), kan du åbne en notesbog og begynde at bruge din finjusterede model.

Finjuster FLAN-T5 ved hjælp af en Python-notesbog

Vores eksempel-notesbog viser, hvordan man bruger Jumpstart og SageMaker til programmæssigt at finjustere og implementere en FLAN T5 XL-model. Det kan køres i Studio eller lokalt.

I dette afsnit gennemgår vi først nogle generelle opsætninger. Derefter finjusterer du modellen ved hjælp af SQuADv2-datasættene. Dernæst implementerer du den fortrænede version af modellen bag et SageMaker-endepunkt og gør det samme med den finjusterede model. Endelig kan du forespørge på slutpunkterne og sammenligne kvaliteten af outputtet fra den fortrænede og finjusterede model. Du vil opdage, at outputtet fra den finjusterede model er af meget højere kvalitet.

Opsæt forudsætninger

Begynd med at installere og opgradere de nødvendige pakker. Genstart kernen efter at have kørt følgende kode:

!pip install nest-asyncio==1.5.5 --quiet
!pip install ipywidgets==8.0.4 --quiet
!pip install --upgrade sagemaker --quiet

Få derefter den udførelsesrolle, der er knyttet til den aktuelle notesbogsforekomst:

import boto3
import sagemaker
# Get current region, role, and default bucket
aws_region = boto3.Session().region_name
aws_role = sagemaker.session.Session().get_caller_identity_arn()
output_bucket = sagemaker.Session().default_bucket()
# This will be useful for printing
newline, bold, unbold = "n", "33[1m", "33[0m"
print(f"{bold}aws_region:{unbold} {aws_region}")
print(f"{bold}aws_role:{unbold} {aws_role}")
print(f"{bold}output_bucket:{unbold} {output_bucket}"

Du kan definere en praktisk rullemenu, der viser de modelstørrelser, der er tilgængelige for finjustering:

import IPython
from ipywidgets import Dropdown
from sagemaker.jumpstart.filters import And
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models
# Default model choice
model_id = "huggingface-text2text-flan-t5-xl"
# Identify FLAN T5 models that support fine-tuning
filter_value = And( "task == text2text", "framework == huggingface", "training_supported == true"
)
model_list = [m for m in list_jumpstart_models(filter=filter_value) if "flan-t5" in m]
# Display the model IDs in a dropdown, for user to select
dropdown = Dropdown(
value=model_id,
options=model_list,
description="FLAN T5 models available for fine-tuning:",
style={"description_width": "initial"},
layout={"width": "max-content"},
)
display(IPython.display.Markdown("### Select a pre-trained model from the dropdown below"))
display(dropdown)

Jumpstart henter automatisk passende trænings- og slutningsforekomsttyper for den model, du har valgt:

from sagemaker.instance_types import retrieve_default
model_id, model_version = dropdown.value, "*"
# Instance types for training and inference
training_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="training"
)
inference_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="inference"
)
print(f"{bold}model_id:{unbold} {model_id}")
print(f"{bold}training_instance_type:{unbold} {training_instance_type}")
print(f"{bold}inference_instance_type:{unbold} {inference_instance_type}") If you have chosen the FLAN T5 XL, you will see the following output: model_id: huggingface-text2text-flan-t5-xl training_instance_type: ml.p3.16xlarge inference_instance_type: ml.g5.2xlarge

Du er nu klar til at begynde at finjustere.

Genoplær modellen på finjusteringsdatasættet

Når din opsætning er fuldført, skal du udføre følgende trin:

Brug følgende kode til at hente URI'en for de nødvendige artefakter:

from sagemaker import image_uris, model_uris, script_uris
# Training instance will use this image
train_image_uri = image_uris.retrieve(
region=aws_region,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="training",
instance_type=training_instance_type,
)
# Pre-trained model
train_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="training"
)
# Script to execute on the training instance
train_script_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="training"
)
print(f"{bold}image uri:{unbold} {train_image_uri}")
print(f"{bold}model uri:{unbold} {train_model_uri}")
print(f"{bold}script uri:{unbold} {train_script_uri}")

Træningsdataene er placeret i en offentlighed Amazon Simple Storage Service (Amazon S3) spand.

Brug følgende kode til at pege på placeringen af dataene og konfigurer outputplaceringen i en bøtte på din konto:

from sagemaker.s3 import S3Downloader # We will use the train split of SQuAD2.0
original_data_file = "train-v2.0.json" # The data was mirrored in the following bucket
original_data_location = f"s3://sagemaker-sample-files/datasets/text/squad2.0/{original_data_file}"
S3Downloader.download(original_data_location, ".")

De originale data er ikke i et format, der svarer til den opgave, som du finjusterer modellen til, så du kan omformatere den:

import json local_data_file = "task-data.jsonl"  # any name with .jsonl extension with open(original_data_file) as f:
data = json.load(f) with open(local_data_file, "w") as f:
for article in data["data"]:
for paragraph in article["paragraphs"]:
# iterate over questions for a given paragraph
for qas in paragraph["qas"]:
if qas["is_impossible"]:
# the question is relevant, but cannot be answered
example = {"context": paragraph["context"], "question": qas["question"]}
json.dump(example, f)
f.write("n") template = { "prompt": "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}", "completion": "{question}",
}
with open("template.json", "w") as f:
json.dump(template, f) from sagemaker.s3 import S3Uploader train_data_location = f"s3://{output_bucket}/train_data"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"{bold}training data:{unbold} {train_data_location}")

Nu kan du definere nogle hyperparametre for træningen:

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for fine-tuning the model
hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) # We will override some default hyperparameters with custom values
hyperparameters["epochs"] = "3"
# TODO
# hyperparameters["max_input_length"] = "300"  # data inputs will be truncated at this length
# hyperparameters["max_output_length"] = "40"  # data outputs will be truncated at this length
# hyperparameters["generation_max_length"] = "40"  # max length of generated output
print(hyperparameters)

Du er nu klar til at starte træningsjobbet:

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base model_name = "-".join(model_id.split("-")[2:])  # get the most informative part of ID
training_job_name = name_from_base(f"js-demo-{model_name}-{hyperparameters['epochs']}")
print(f"{bold}job name:{unbold} {training_job_name}") training_metric_definitions = [
{"Name": "val_loss", "Regex": "'eval_loss': ([0-9.]+)"},
{"Name": "train_loss", "Regex": "'loss': ([0-9.]+)"},
{"Name": "epoch", "Regex": "'epoch': ([0-9.]+)"},
] # Create SageMaker Estimator instance
sm_estimator = Estimator(
role=aws_role,
image_uri=train_image_uri,
model_uri=train_model_uri,
source_dir=train_script_uri,
entry_point="transfer_learning.py",
instance_count=1,
instance_type=training_instance_type,
volume_size=300,
max_run=360000,
hyperparameters=hyperparameters,
output_path=output_location,
metric_definitions=training_metric_definitions,
) # Launch a SageMaker training job over data located in the given S3 path
# Training jobs can take hours, it is recommended to set wait=False,
# and monitor job status through SageMaker console
sm_estimator.fit({"training": train_data_location}, job_name=training_job_name, wait=False)

Afhængigt af størrelsen på de finjusteringsdata og den valgte model, kan finjusteringen tage op til et par timer.

Du kan overvåge præstationsmålinger såsom træning og valideringstab ved hjælp af amazoncloudwatch under træning. Du kan bekvemt også hente det seneste øjebliksbillede af metrics ved at køre følgende kode:

from sagemaker import TrainingJobAnalytics # This can be called while the job is still running
df = TrainingJobAnalytics(training_job_name=training_job_name).dataframe()
df.head(10) model uri: s3://sagemaker-us-west-2-802376408542/avkan/training-huggingface-text2text-huggingface-text2text-flan-t5-xl-repack.tar.gz
job name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738
INFO:sagemaker:Creating training-job with name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738

Når uddannelsen er færdig, har du en finjusteret model kl model_uri. Lad os bruge det!

Du kan oprette to inferensendepunkter: et for den oprindelige fortrænede model og et for den finjusterede model. Dette giver dig mulighed for at sammenligne output fra begge versioner af modellen. I det næste trin implementerer du et inferensendepunkt for den forudtrænede model. Derefter implementerer du et slutpunkt til din finjusterede model.

Implementer den fortrænede model

Lad os starte med at implementere den præ-trænede model og hente inferens Docker image URI. Dette er det grundlæggende Hugging Face-beholderbillede. Brug følgende kode:

from sagemaker import image_uris # Retrieve the inference docker image URI. This is the base HuggingFace container image
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="inference",
instance_type=inference_instance_type,
)

Du kan nu oprette slutpunktet og implementere den forudtrænede model. Bemærk, at du skal bestå Predictor-klassen, når du implementerer modellen gennem Model-klassen for at kunne køre inferens gennem SageMaker API. Se følgende kode:

from sagemaker import model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base # Retrieve the URI of the pre-trained model
pre_trained_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) pre_trained_name = name_from_base(f"jumpstart-demo-pre-trained-{model_id}") # Create the SageMaker model instance of the pre-trained model
if ("small" in model_id) or ("base" in model_id):
deploy_source_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="inference"
)
pre_trained_model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
entry_point="inference.py",
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
)
else:
# For those large models, we already repack the inference script and model
# artifacts for you, so the `source_dir` argument to Model is not required.
pre_trained_model = Model(
image_uri=deploy_image_uri,
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {pre_trained_model_uri}")
print("Deploying an endpoint ...") # Deploy the pre-trained model. Note that we need to pass Predictor class when we deploy model
# through Model class, for being able to run inference through the SageMaker API
pre_trained_predictor = pre_trained_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=pre_trained_name,
)
print(f"{newline}Deployed an endpoint {pre_trained_name}")

Oprettelse af slutpunkt og modelimplementering kan tage et par minutter, så er dit slutpunkt klar til at modtage inferensopkald.

Implementer den finjusterede model

Lad os implementere den finjusterede model til sit eget slutpunkt. Processen er næsten identisk med den, vi tidligere brugte til den fortrænede model. Den eneste forskel er, at vi bruger det finjusterede modelnavn og URI:

from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base fine_tuned_name = name_from_base(f"jumpstart-demo-fine-tuned-{model_id}")
fine_tuned_model_uri = f"{output_location}{training_job_name}/output/model.tar.gz" # Create the SageMaker model instance of the fine-tuned model
fine_tuned_model = Model(
image_uri=deploy_image_uri,
model_data=fine_tuned_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=fine_tuned_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {fine_tuned_model_uri}")
print("Deploying an endpoint ...") # Deploy the fine-tuned model.
fine_tuned_predictor = fine_tuned_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=fine_tuned_name,
)
print(f"{newline}Deployed an endpoint {fine_tuned_name}")

Når denne proces er afsluttet, er både fortrænede og finjusterede modeller implementeret bag deres egne endepunkter. Lad os sammenligne deres output.

Generer output og sammenlign resultaterne

Definer nogle hjælpefunktioner til at forespørge på slutpunktet og analysere svaret:

import boto3
import json # Parameters of (output) text generation. A great introduction to generation
# parameters can be found at https://huggingface.co/blog/how-to-generate
parameters = { "max_length": 40,  # restrict the length of the generated text "num_return_sequences": 5,  # we will inspect several model outputs "num_beams": 10,  # use beam search
} # Helper functions for running inference queries
def query_endpoint_with_json_payload(payload, endpoint_name):
encoded_json = json.dumps(payload).encode("utf-8")
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
generated_text = model_predictions["generated_texts"]
return generated_text def generate_questions(endpoint_name, text):
expanded_prompt = prompt.replace("{context}", text)
payload = {"text_inputs": expanded_prompt, **parameters}
query_response = query_endpoint_with_json_payload(payload, endpoint_name=endpoint_name)
generated_texts = parse_response_multiple_texts(query_response)
for i, generated_text in enumerate(generated_texts):
print(f"Response {i}: {generated_text}{newline}")

I det næste kodestykke definerer vi prompten og testdataene. Den beskriver vores målopgave, som er at generere spørgsmål, der er relateret til den angivne tekst, men som ikke kan besvares ud fra den.

Testdataene består af tre forskellige afsnit, et om den australske by Adelaide fra første to afsnit af den Wikipedia-side, en vedr Amazon Elastic Block Store (Amazon EBS) fra Amazon EBS dokumentation, og en af Amazon Comprehend fra Amazon Comprehend dokumentation. Vi forventer, at modellen identificerer spørgsmål relateret til disse afsnit, men det kan ikke besvares med oplysningerne deri.

prompt = "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}" test_paragraphs = [ """
Adelaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south. """, """
Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes. """, """
Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages. """
]

Du kan nu teste endepunkterne ved at bruge eksempelartiklerne

print(f"{bold}Prompt:{unbold} {repr(prompt)}")
for paragraph in test_paragraphs:
print("-" * 80)
print(paragraph)
print("-" * 80)
print(f"{bold}pre-trained{unbold}")
generate_questions(pre_trained_name, paragraph)
print(f"{bold}fine-tuned{unbold}")
generate_questions(fine_tuned_name, paragraph)

Testdata: Adelaide

Vi bruger følgende kontekst:

delaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south.

Den forudtrænede modelrespons er som følger:

Response 0: What is the area of the city centre and surrounding parklands called in the Kaurna language?
Response 1: What is the area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language?
Response 2: What is the area of the city centre and surrounding parklands called in Kaurna?
Response 3: What is the capital city of South Australia?
Response 4: What is the area of the city centre and surrounding parklands known as in the Kaurna language?

De finjusterede modelsvar er som følger:

Response 0: What is the second most populous city in Australia?
Response 1: What is the fourth most populous city in Australia?
Response 2: What is the population of Gawler?
Response 3: What is the largest city in Australia?
Response 4: What is the fifth most populous city in the world?

Testdata: Amazon EBS

Vi bruger følgende kontekst:

Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes.

De prætrænede modelsvar er som følger:

esponse 0: What is the difference between Amazon EBS and Amazon Elastic Block Store (Amazon EBS)?
Response 1: What is the difference between Amazon EBS and Amazon Elastic Block Store?
Response 2: What is the difference between Amazon EBS and Amazon Simple Storage Service (Amazon S3)?
Response 3: What is Amazon Elastic Block Store (Amazon EBS)?
Response 4: What is the difference between Amazon EBS and a hard drive?

De finjusterede modelsvar er som følger:

Response 0: What type of applications are not well suited to Amazon EBS?
Response 1: What behaves like formatted block devices?
Response 2: What type of applications are not suited to Amazon EBS?
Response 3: What type of applications are not well suited for Amazon EBS?
Response 4: What type of applications are not suited for Amazon EBS?

Testdata: Amazon Comprehend

Vi bruger følgende kontekst:

Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages.

De prætrænede modelsvar er som følger:

Response 0: What does Amazon Comprehend use to extract insights about the content of documents?
Response 1: How does Amazon Comprehend extract insights about the content of documents?
Response 2: What does Amazon Comprehend use to develop insights about the content of documents?
Response 3: How does Amazon Comprehend develop insights about the content of documents?
Response 4: What does Amazon Comprehend use to extract insights about the content of a document?

De finjusterede modelsvar er som følger:

Response 0: What does Amazon Comprehend use to extract insights about the structure of documents?
Response 1: How does Amazon Comprehend recognize sentiments in a document?
Response 2: What does Amazon Comprehend use to extract insights about the content of social networking feeds?
Response 3: What does Amazon Comprehend use to extract insights about the content of documents?
Response 4: What type of files does Amazon Comprehend reject as input?

Forskellen i outputkvalitet mellem den fortrænede model og den finjusterede model er markant. Spørgsmålene fra den finjusterede model berører en bredere vifte af emner. De er systematisk meningsfulde spørgsmål, hvilket ikke altid er tilfældet for den fortrænede model, som illustreret med Amazon EBS-eksemplet.

Selvom dette ikke er en formel og systematisk evaluering, er det klart, at finjusteringsprocessen har forbedret kvaliteten af modellens svar på denne opgave.

Ryd op

Husk endelig at rydde op og slette endepunkterne:

# Delete resources
pre_trained_predictor.delete_model()
pre_trained_predictor.delete_endpoint()
fine_tuned_predictor.delete_model()
fine_tuned_predictor.delete_endpoint()

Konklusion

I dette indlæg viste vi, hvordan man bruger instruktionsfinjustering med FLAN T5-modeller ved hjælp af Jumpstart UI eller en Jupyter-notebook, der kører i Studio. Vi leverede kode, der forklarer, hvordan man genoplærer modellen ved hjælp af data til målopgaven og implementerer den finjusterede model bag et slutpunkt. Målopgaven i dette indlæg var at identificere spørgsmål, der relaterer sig til en del af teksten i inputtet, men som ikke kan besvares baseret på oplysningerne i den tekst. Vi demonstrerede, at en model, der er finjusteret til denne specifikke opgave, giver bedre resultater end en præ-trænet model.

Nu hvor du ved, hvordan du instruerer, finjusterer en model med Jumpstart, kan du oprette kraftfulde modeller, der er tilpasset din applikation. Saml nogle data til din brugssag, upload det til Amazon S3, og brug enten Studio UI eller notebooken til at tune en FLAN T5-model!

Referencer

[1] Chung, Hyung Won, et al. "Skalering af instruktionsfinjusterede sprogmodeller." arXiv preprint arXiv:2210.11416 (2022).

[2] Rajpurkar, Pranav, Robin Jia og Percy Liang. "Vid, hvad du ikke ved: Ubesvarlige spørgsmål til SQuAD." Forhandlinger fra det 56. årsmøde i Foreningen for Datalingvistik (Bind 2: Korte artikler). 2018.

Om forfatterne

Laurent Callot er en Principal Applied Scientist og leder ved AWS AI Labs, som har arbejdet med en række maskinlæringsproblemer, fra grundlæggende modeller og generativ AI til prognose, anomalidetektion, kausalitet og AI Ops.

Andrey Kan er Senior Applied Scientist hos AWS AI Labs inden for interesser og erfaring inden for forskellige områder af Machine Learning. Disse omfatter forskning i fundamentmodeller samt ML-applikationer til grafer og tidsserier.

Dr. Ashish Khetan er en Senior Applied Scientist med Amazon SageMaker indbyggede algoritmer og hjælper med at udvikle machine learning algoritmer. Han fik sin ph.d. fra University of Illinois Urbana Champaign. Han er en aktiv forsker i maskinlæring og statistisk inferens og har publiceret mange artikler i NeurIPS, ICML, ICLR, JMLR, ACL og EMNLP konferencer.

Baris Kurt er en anvendt videnskabsmand ved AWS AI Labs. Hans interesser er i tidsserieanomalidetektion og funderingsmodeller. Han elsker at udvikle brugervenlige ML-systemer.

Jonas Kübler er en anvendt videnskabsmand ved AWS AI Labs. Han arbejder på funderingsmodeller med det mål at lette brugsspecifikke applikationer.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
Køb og sælg aktier i PRE-IPO-virksomheder med PREIPO®. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/instruction-fine-tuning-for-flan-t5-xl-with-amazon-sagemaker-jumpstart/

Tidsstempel: Maj 22, 2023

Tidsstempel: December 1, 2023

Genudgivet af Platon

Opnå fire gange højere ML-inferensgennemløb til tre gange lavere pris pr. slutning med Amazon EC2 G5-instanser til NLP- og CV PyTorch-modeller

Introduktion af Amazon Comprehend-svinghjulet til MLOps

Vidensbaser i Amazon Bedrock forenkler nu at stille spørgsmål til et enkelt dokument | Amazon Web Services

Giv live agent assistance til dine chatbot-brugere med Amazon Lex og Talkdesk cloud-kontaktcenter | Amazon Web Services

MLOps på kanten med Amazon SageMaker Edge Manager og AWS IoT Greengrass

Organiser din maskinlæringsrejse med Amazon SageMaker Experiments og Amazon SageMaker Pipelines

Forøgelse af udviklerproduktivitet: Sådan bruger Deloitte Amazon SageMaker Canvas til maskinlæring uden kode/lavkode | Amazon Web Services

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto