Instruksjon Finjustering For FLAN T5 XL Med Amazon SageMaker Jumpstart

Publisert av Platon

Følgere: 0

Generativ AI er midt i en periode med imponerende vekst. Stadig mer dyktige grunnmodeller utgis kontinuerlig, med store språkmodeller (LLM) som en av de mest synlige modellklassene. LLM-er er modeller sammensatt av milliarder av parametere trent på omfattende tekstkorpus, opptil hundrevis av milliarder eller til og med en billion tokens. Disse modellene har vist seg ekstremt effektive for et bredt spekter av tekstbaserte oppgaver, fra spørsmålssvar til sentimentanalyse.

Kraften til LLM-er kommer fra deres evne til å lære og generalisere fra omfattende og varierte opplæringsdata. Den første opplæringen av disse modellene utføres med en rekke mål, overvåket, uten tilsyn eller hybrid. Tekstfullføring eller imputering er et av de vanligste uovervåkede målene: gitt en del tekst lærer modellen å forutsi nøyaktig hva som kommer etterpå (for eksempel forutsi neste setning). Modeller kan også trenes på en overvåket måte ved å bruke merkede data for å utføre et sett med oppgaver (er for eksempel denne filmanmeldelsen positiv, negativ eller nøytral). Enten modellen er trent for tekstutfylling eller en annen oppgave, er det ofte ikke den oppgaven kundene ønsker å bruke modellen til.

For å forbedre ytelsen til en forhåndstrent LLM på en spesifikk oppgave, kan vi justere modellen ved å bruke eksempler på måloppgaven i en prosess kjent som finjustering av instruksjonene. Instruksjonsfinjustering bruker et sett med merkede eksempler i form av {spørring, svar}-par for å trene den forhåndstrente modellen videre i å forutsi svaret på en adekvat måte gitt ledeteksten. Denne prosessen modifiserer vektene til modellen.

Dette innlegget beskriver hvordan du utfører instruksjonsfinjustering av en LLM, nemlig FLAN T5 XL, ved å bruke Amazon SageMaker Jumpstart. Vi demonstrerer hvordan du oppnår dette ved å bruke både Jumpstart UI og en notatbok i Amazon SageMaker Studio. Du finner medfølgende notatbok i amazon-sagemaker-eksempler GitHub-depot.

Løsningsoversikt

Måloppgaven i dette innlegget er å, gitt en del av teksten i ledeteksten, returnere spørsmål som er relatert til teksten, men som ikke kan besvares basert på informasjonen den inneholder. Dette er en nyttig oppgave for å identifisere manglende informasjon i en beskrivelse eller identifisere om en forespørsel trenger mer informasjon for å bli besvart.

FLAN T5-modeller er instruksjoner finjustert på et bredt spekter av oppgaver for å øke nullskuddsytelsen til disse modellene på mange vanlige oppgaver[1]. Ytterligere finjustering av instruksjoner for en bestemt kundeoppgave kan ytterligere øke nøyaktigheten til disse modellene, spesielt hvis måloppgaven ikke tidligere ble brukt til å trene en FLAN T5-modell, slik tilfellet er for vår oppgave.

I eksempeloppgaven vår er vi interessert i å generere relevante, men ubesvarte spørsmål. For dette formål bruker vi et undersett av versjon 2 av Stanford Question Answering Dataset (SQuAD2.0)[2] for å finjustere modellen. Dette datasettet inneholder spørsmål stilt av menneskelige kommentatorer på et sett med Wikipedia-artikler. I tillegg til spørsmål med svar, inneholder SQuAD2.0 omtrent 50,000 XNUMX ubesvarte spørsmål. Slike spørsmål er plausible, men kan ikke besvares direkte fra artiklenes innhold. Vi bruker kun de ubesvarte spørsmålene. Dataene våre er strukturert som en JSON Lines-fil, der hver linje inneholder en kontekst og et spørsmål.

Skjermbilde av noen få oppføringer i SQuADv2-datasettet.

Forutsetninger

For å komme i gang trenger du bare en AWS-konto der du kan bruke Studio. Du må opprette en brukerprofil for Studio hvis du ikke allerede har en.

Finjuster FLAN-T5 med Jumpstart UI

For å finjustere modellen med Jumpstart UI, fullfør følgende trinn:

Åpne Studio på SageMaker-konsollen.
Under SageMaker Jumpstart Velg navigasjonsruten Modeller, notatbøker, løsninger.

Du vil se en liste over fundamentmodeller, inkludert FLAN T5 XL, som er merket som finjusterbar.

Velg Se modell.

JumpStart UI med FLAN-T5 XL.

Under Datakilde, kan du angi banen til treningsdataene dine. Kilden for dataene som brukes i dette innlegget er gitt som standard.
Du kan beholde standardverdien for distribusjonskonfigurasjonen (inkludert instanstype), sikkerhet og hyperparametrene, men du bør øke antallet epoker til minst tre for å få gode resultater.
Velg Tog å trene modellen.

JumpStart tog-UI for FLAN-T5 XL-modellen.

Du kan spore statusen til treningsjobben i brukergrensesnittet.

Jumpstart UI for trening pågår.

Når treningen er fullført (etter ca. 53 minutter i vårt tilfelle), velg Distribuer å distribuere den finjusterte modellen.

JumpStart UI-opplæring fullført.

Etter at endepunktet er opprettet (noen få minutter), kan du åpne en notatbok og begynne å bruke den finjusterte modellen.

Finjuster FLAN-T5 med en Python-notisbok

Vår eksempelnotisbok viser hvordan du bruker Jumpstart og SageMaker til å programmere finjustere og distribuere en FLAN T5 XL-modell. Den kan kjøres i Studio eller lokalt.

I denne delen går vi først gjennom noen generelle oppsett. Deretter finjusterer du modellen ved å bruke SQuADv2-datasettene. Deretter distribuerer du den ferdigtrente versjonen av modellen bak et SageMaker-endepunkt, og gjør det samme med den finjusterte modellen. Til slutt kan du spørre etter endepunktene og sammenligne kvaliteten på utdataene til den forhåndstrente og finjusterte modellen. Du vil oppdage at resultatet fra den finjusterte modellen er av mye høyere kvalitet.

Sett opp forutsetninger

Begynn med å installere og oppgradere de nødvendige pakkene. Start kjernen på nytt etter å ha kjørt følgende kode:

!pip install nest-asyncio==1.5.5 --quiet
!pip install ipywidgets==8.0.4 --quiet
!pip install --upgrade sagemaker --quiet

Deretter får du utførelsesrollen knyttet til gjeldende notatbokforekomst:

import boto3
import sagemaker
# Get current region, role, and default bucket
aws_region = boto3.Session().region_name
aws_role = sagemaker.session.Session().get_caller_identity_arn()
output_bucket = sagemaker.Session().default_bucket()
# This will be useful for printing
newline, bold, unbold = "n", "33[1m", "33[0m"
print(f"{bold}aws_region:{unbold} {aws_region}")
print(f"{bold}aws_role:{unbold} {aws_role}")
print(f"{bold}output_bucket:{unbold} {output_bucket}"

Du kan definere en praktisk rullegardinmeny som viser modellstørrelsene som er tilgjengelige for finjustering:

import IPython
from ipywidgets import Dropdown
from sagemaker.jumpstart.filters import And
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models
# Default model choice
model_id = "huggingface-text2text-flan-t5-xl"
# Identify FLAN T5 models that support fine-tuning
filter_value = And( "task == text2text", "framework == huggingface", "training_supported == true"
)
model_list = [m for m in list_jumpstart_models(filter=filter_value) if "flan-t5" in m]
# Display the model IDs in a dropdown, for user to select
dropdown = Dropdown(
value=model_id,
options=model_list,
description="FLAN T5 models available for fine-tuning:",
style={"description_width": "initial"},
layout={"width": "max-content"},
)
display(IPython.display.Markdown("### Select a pre-trained model from the dropdown below"))
display(dropdown)

Jumpstart henter automatisk passende trenings- og slutningsforekomsttyper for modellen du valgte:

from sagemaker.instance_types import retrieve_default
model_id, model_version = dropdown.value, "*"
# Instance types for training and inference
training_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="training"
)
inference_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="inference"
)
print(f"{bold}model_id:{unbold} {model_id}")
print(f"{bold}training_instance_type:{unbold} {training_instance_type}")
print(f"{bold}inference_instance_type:{unbold} {inference_instance_type}") If you have chosen the FLAN T5 XL, you will see the following output: model_id: huggingface-text2text-flan-t5-xl training_instance_type: ml.p3.16xlarge inference_instance_type: ml.g5.2xlarge

Du er nå klar til å begynne finjusteringen.

Tren modellen på nytt på finjusteringsdatasettet

Etter at oppsettet er fullført, fullfør følgende trinn:

Bruk følgende kode for å hente URI for artefaktene som trengs:

from sagemaker import image_uris, model_uris, script_uris
# Training instance will use this image
train_image_uri = image_uris.retrieve(
region=aws_region,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="training",
instance_type=training_instance_type,
)
# Pre-trained model
train_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="training"
)
# Script to execute on the training instance
train_script_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="training"
)
print(f"{bold}image uri:{unbold} {train_image_uri}")
print(f"{bold}model uri:{unbold} {train_model_uri}")
print(f"{bold}script uri:{unbold} {train_script_uri}")

Treningsdataene er plassert i en offentlig Amazon enkel lagringstjeneste (Amazon S3) bøtte.

Bruk følgende kode for å peke til plasseringen av dataene og konfigurer utdataplasseringen i en bøtte i kontoen din:

from sagemaker.s3 import S3Downloader # We will use the train split of SQuAD2.0
original_data_file = "train-v2.0.json" # The data was mirrored in the following bucket
original_data_location = f"s3://sagemaker-sample-files/datasets/text/squad2.0/{original_data_file}"
S3Downloader.download(original_data_location, ".")

De originale dataene er ikke i et format som tilsvarer oppgaven du finjusterer modellen for, så du kan formatere den på nytt:

import json local_data_file = "task-data.jsonl"  # any name with .jsonl extension with open(original_data_file) as f:
data = json.load(f) with open(local_data_file, "w") as f:
for article in data["data"]:
for paragraph in article["paragraphs"]:
# iterate over questions for a given paragraph
for qas in paragraph["qas"]:
if qas["is_impossible"]:
# the question is relevant, but cannot be answered
example = {"context": paragraph["context"], "question": qas["question"]}
json.dump(example, f)
f.write("n") template = { "prompt": "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}", "completion": "{question}",
}
with open("template.json", "w") as f:
json.dump(template, f) from sagemaker.s3 import S3Uploader train_data_location = f"s3://{output_bucket}/train_data"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"{bold}training data:{unbold} {train_data_location}")

Nå kan du definere noen hyperparametre for treningen:

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for fine-tuning the model
hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) # We will override some default hyperparameters with custom values
hyperparameters["epochs"] = "3"
# TODO
# hyperparameters["max_input_length"] = "300"  # data inputs will be truncated at this length
# hyperparameters["max_output_length"] = "40"  # data outputs will be truncated at this length
# hyperparameters["generation_max_length"] = "40"  # max length of generated output
print(hyperparameters)

Du er nå klar til å starte opplæringsjobben:

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base model_name = "-".join(model_id.split("-")[2:])  # get the most informative part of ID
training_job_name = name_from_base(f"js-demo-{model_name}-{hyperparameters['epochs']}")
print(f"{bold}job name:{unbold} {training_job_name}") training_metric_definitions = [
{"Name": "val_loss", "Regex": "'eval_loss': ([0-9.]+)"},
{"Name": "train_loss", "Regex": "'loss': ([0-9.]+)"},
{"Name": "epoch", "Regex": "'epoch': ([0-9.]+)"},
] # Create SageMaker Estimator instance
sm_estimator = Estimator(
role=aws_role,
image_uri=train_image_uri,
model_uri=train_model_uri,
source_dir=train_script_uri,
entry_point="transfer_learning.py",
instance_count=1,
instance_type=training_instance_type,
volume_size=300,
max_run=360000,
hyperparameters=hyperparameters,
output_path=output_location,
metric_definitions=training_metric_definitions,
) # Launch a SageMaker training job over data located in the given S3 path
# Training jobs can take hours, it is recommended to set wait=False,
# and monitor job status through SageMaker console
sm_estimator.fit({"training": train_data_location}, job_name=training_job_name, wait=False)

Avhengig av størrelsen på finjusteringsdataene og modellen som er valgt, kan finjusteringen ta opptil et par timer.

Du kan overvåke ytelsesberegninger som trening og tap av validering ved å bruke Amazon CloudWatch under trening. Beleilig kan du også hente det nyeste øyeblikksbildet av beregninger ved å kjøre følgende kode:

from sagemaker import TrainingJobAnalytics # This can be called while the job is still running
df = TrainingJobAnalytics(training_job_name=training_job_name).dataframe()
df.head(10) model uri: s3://sagemaker-us-west-2-802376408542/avkan/training-huggingface-text2text-huggingface-text2text-flan-t5-xl-repack.tar.gz
job name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738
INFO:sagemaker:Creating training-job with name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738

Når opplæringen er ferdig har du en finjustert modell kl model_uri. La oss bruke det!

Du kan opprette to slutningsendepunkter: ett for den opprinnelige forhåndstrente modellen og ett for den finjusterte modellen. Dette lar deg sammenligne utdataene til begge versjonene av modellen. I neste trinn distribuerer du et inferensendepunkt for den forhåndstrente modellen. Deretter distribuerer du et endepunkt for din finjusterte modell.

Implementer den forhåndstrente modellen

La oss starte med å distribuere den forhåndstrente modellen for å hente inferens Docker image URI. Dette er det grunnleggende Hugging Face-beholderbildet. Bruk følgende kode:

from sagemaker import image_uris # Retrieve the inference docker image URI. This is the base HuggingFace container image
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="inference",
instance_type=inference_instance_type,
)

Du kan nå opprette endepunktet og distribuere den forhåndstrente modellen. Merk at du må bestå Predictor-klassen når du distribuerer modellen gjennom Model-klassen for å kunne kjøre inferens gjennom SageMaker API. Se følgende kode:

from sagemaker import model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base # Retrieve the URI of the pre-trained model
pre_trained_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) pre_trained_name = name_from_base(f"jumpstart-demo-pre-trained-{model_id}") # Create the SageMaker model instance of the pre-trained model
if ("small" in model_id) or ("base" in model_id):
deploy_source_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="inference"
)
pre_trained_model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
entry_point="inference.py",
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
)
else:
# For those large models, we already repack the inference script and model
# artifacts for you, so the `source_dir` argument to Model is not required.
pre_trained_model = Model(
image_uri=deploy_image_uri,
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {pre_trained_model_uri}")
print("Deploying an endpoint ...") # Deploy the pre-trained model. Note that we need to pass Predictor class when we deploy model
# through Model class, for being able to run inference through the SageMaker API
pre_trained_predictor = pre_trained_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=pre_trained_name,
)
print(f"{newline}Deployed an endpoint {pre_trained_name}")

Opprettelsen av endepunkt og modellimplementering kan ta noen minutter, deretter er endepunktet ditt klart til å motta slutningsanrop.

Implementer den finjusterte modellen

La oss distribuere den finjusterte modellen til sitt eget endepunkt. Prosessen er nesten identisk med den vi brukte tidligere for den ferdigtrente modellen. Den eneste forskjellen er at vi bruker det finjusterte modellnavnet og URI:

from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base fine_tuned_name = name_from_base(f"jumpstart-demo-fine-tuned-{model_id}")
fine_tuned_model_uri = f"{output_location}{training_job_name}/output/model.tar.gz" # Create the SageMaker model instance of the fine-tuned model
fine_tuned_model = Model(
image_uri=deploy_image_uri,
model_data=fine_tuned_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=fine_tuned_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {fine_tuned_model_uri}")
print("Deploying an endpoint ...") # Deploy the fine-tuned model.
fine_tuned_predictor = fine_tuned_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=fine_tuned_name,
)
print(f"{newline}Deployed an endpoint {fine_tuned_name}")

Når denne prosessen er fullført, blir både forhåndstrente og finjusterte modeller distribuert bak sine egne endepunkter. La oss sammenligne resultatene deres.

Generer utdata og sammenlign resultatene

Definer noen verktøyfunksjoner for å spørre endepunktet og analysere svaret:

import boto3
import json # Parameters of (output) text generation. A great introduction to generation
# parameters can be found at https://huggingface.co/blog/how-to-generate
parameters = { "max_length": 40,  # restrict the length of the generated text "num_return_sequences": 5,  # we will inspect several model outputs "num_beams": 10,  # use beam search
} # Helper functions for running inference queries
def query_endpoint_with_json_payload(payload, endpoint_name):
encoded_json = json.dumps(payload).encode("utf-8")
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
generated_text = model_predictions["generated_texts"]
return generated_text def generate_questions(endpoint_name, text):
expanded_prompt = prompt.replace("{context}", text)
payload = {"text_inputs": expanded_prompt, **parameters}
query_response = query_endpoint_with_json_payload(payload, endpoint_name=endpoint_name)
generated_texts = parse_response_multiple_texts(query_response)
for i, generated_text in enumerate(generated_texts):
print(f"Response {i}: {generated_text}{newline}")

I den neste kodebiten definerer vi ledeteksten og testdataene. Den beskriver måloppgaven vår, som er å generere spørsmål som er relatert til den oppgitte teksten, men som ikke kan besvares basert på den.

Testdataene består av tre forskjellige avsnitt, ett om den australske byen Adelaide fra to første avsnitt av Wikipedia-siden, en vedr Amazon Elastic Block Store (Amazon EBS) fra Amazon EBS-dokumentasjon, og en av Amazon Comprehend fra Amazon Comprehend-dokumentasjon. Vi forventer at modellen identifiserer spørsmål knyttet til disse avsnittene, men det kan ikke besvares med informasjonen som er gitt der.

prompt = "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}" test_paragraphs = [ """
Adelaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south. """, """
Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes. """, """
Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages. """
]

Du kan nå teste endepunktene ved å bruke eksempelartiklene

print(f"{bold}Prompt:{unbold} {repr(prompt)}")
for paragraph in test_paragraphs:
print("-" * 80)
print(paragraph)
print("-" * 80)
print(f"{bold}pre-trained{unbold}")
generate_questions(pre_trained_name, paragraph)
print(f"{bold}fine-tuned{unbold}")
generate_questions(fine_tuned_name, paragraph)

Testdata: Adelaide

Vi bruker følgende kontekst:

delaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south.

Den forhåndstrente modellens respons er som følger:

Response 0: What is the area of the city centre and surrounding parklands called in the Kaurna language?
Response 1: What is the area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language?
Response 2: What is the area of the city centre and surrounding parklands called in Kaurna?
Response 3: What is the capital city of South Australia?
Response 4: What is the area of the city centre and surrounding parklands known as in the Kaurna language?

De finjusterte modellsvarene er som følger:

Response 0: What is the second most populous city in Australia?
Response 1: What is the fourth most populous city in Australia?
Response 2: What is the population of Gawler?
Response 3: What is the largest city in Australia?
Response 4: What is the fifth most populous city in the world?

Testdata: Amazon EBS

Vi bruker følgende kontekst:

Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes.

De forhåndstrente modellsvarene er som følger:

esponse 0: What is the difference between Amazon EBS and Amazon Elastic Block Store (Amazon EBS)?
Response 1: What is the difference between Amazon EBS and Amazon Elastic Block Store?
Response 2: What is the difference between Amazon EBS and Amazon Simple Storage Service (Amazon S3)?
Response 3: What is Amazon Elastic Block Store (Amazon EBS)?
Response 4: What is the difference between Amazon EBS and a hard drive?

De finjusterte modellsvarene er som følger:

Response 0: What type of applications are not well suited to Amazon EBS?
Response 1: What behaves like formatted block devices?
Response 2: What type of applications are not suited to Amazon EBS?
Response 3: What type of applications are not well suited for Amazon EBS?
Response 4: What type of applications are not suited for Amazon EBS?

Testdata: Amazon Comprehend

Vi bruker følgende kontekst:

Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages.

De forhåndstrente modellsvarene er som følger:

Response 0: What does Amazon Comprehend use to extract insights about the content of documents?
Response 1: How does Amazon Comprehend extract insights about the content of documents?
Response 2: What does Amazon Comprehend use to develop insights about the content of documents?
Response 3: How does Amazon Comprehend develop insights about the content of documents?
Response 4: What does Amazon Comprehend use to extract insights about the content of a document?

De finjusterte modellsvarene er som følger:

Response 0: What does Amazon Comprehend use to extract insights about the structure of documents?
Response 1: How does Amazon Comprehend recognize sentiments in a document?
Response 2: What does Amazon Comprehend use to extract insights about the content of social networking feeds?
Response 3: What does Amazon Comprehend use to extract insights about the content of documents?
Response 4: What type of files does Amazon Comprehend reject as input?

Forskjellen i utskriftskvalitet mellom den forhåndstrente modellen og den finjusterte modellen er sterk. Spørsmålene fra den finjusterte modellen berører et bredere spekter av emner. De er systematisk meningsfulle spørsmål, noe som ikke alltid er tilfellet for den forhåndstrente modellen, som illustrert med Amazon EBS-eksemplet.

Selv om dette ikke utgjør en formell og systematisk evaluering, er det tydelig at finjusteringsprosessen har forbedret kvaliteten på modellens svar på denne oppgaven.

Rydd opp

Til slutt, husk å rydde opp og slette endepunktene:

# Delete resources
pre_trained_predictor.delete_model()
pre_trained_predictor.delete_endpoint()
fine_tuned_predictor.delete_model()
fine_tuned_predictor.delete_endpoint()

konklusjonen

I dette innlegget viste vi hvordan du bruker instruksjonsfinjustering med FLAN T5-modeller ved å bruke Jumpstart UI eller en Jupyter-notebook som kjører i Studio. Vi ga kode som forklarer hvordan du trener modellen på nytt ved å bruke data for måloppgaven og distribuerer den finjusterte modellen bak et endepunkt. Måloppgaven i dette innlegget var å identifisere spørsmål som er relatert til en del av teksten som er gitt i inndataene, men som ikke kan besvares basert på informasjonen i den teksten. Vi demonstrerte at en modell finjustert for denne spesifikke oppgaven gir bedre resultater enn en forhåndstrent modell.

Nå som du vet hvordan du instruerer finjustere en modell med Jumpstart, kan du lage kraftige modeller tilpasset din applikasjon. Samle litt data for brukssaken din, last den opp til Amazon S3, og bruk enten Studio UI eller den bærbare PC-en til å finjustere en FLAN T5-modell!

Referanser

[1] Chung, Hyung Won, et al. "Skalering av instruksjonsfinjusterte språkmodeller." arXiv preprint arXiv:2210.11416 (2022).

[2] Rajpurkar, Pranav, Robin Jia og Percy Liang. "Vet hva du ikke vet: Ubesvarlige spørsmål for SQuAD." Saker fra det 56. årsmøtet i Association for Computational Linguistics (Volum 2: Short Papers). 2018.

Om forfatterne

Laurent Callot er en Principal Applied Scientist og leder ved AWS AI Labs som har jobbet med en rekke maskinlæringsproblemer, fra grunnleggende modeller og generativ AI til prognoser, avviksdeteksjon, kausalitet og AI-operasjoner.

Andrey Kan er Senior Applied Scientist ved AWS AI Labs innen interesser og erfaring innen forskjellige felt innen maskinlæring. Disse inkluderer forskning på grunnmodeller, samt ML-applikasjoner for grafer og tidsserier.

Dr. Ashish Khetan er en Senior Applied Scientist med Amazon SageMaker innebygde algoritmer og hjelper til med å utvikle maskinlæringsalgoritmer. Han fikk sin doktorgrad fra University of Illinois Urbana Champaign. Han er en aktiv forsker innen maskinlæring og statistisk inferens og har publisert mange artikler i NeurIPS, ICML, ICLR, JMLR, ACL og EMNLP-konferanser.

Baris Kurt er en Applied Scientist ved AWS AI Labs. Hans interesser er i tidsserieavviksdeteksjon og fundamentmodeller. Han elsker å utvikle brukervennlige ML-systemer.

Jonas Kübler er en Applied Scientist ved AWS AI Labs. Han jobber med fundamentmodeller med mål om å lette bruksspesifikke applikasjoner.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoAiStream. Web3 Data Intelligence. Kunnskap forsterket. Tilgang her.
Minting the Future med Adryenn Ashley. Tilgang her.
Kjøp og selg aksjer i PRE-IPO-selskaper med PREIPO®. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/instruction-fine-tuning-for-flan-t5-xl-with-amazon-sagemaker-jumpstart/

Tidstempel: Kan 22, 2023

Tidstempel: Desember 1, 2023

Publisert av Platon

Oppnå fire ganger høyere ML-slutningsgjennomstrømning til tre ganger lavere kostnad per slutning med Amazon EC2 G5-forekomster for NLP- og CV PyTorch-modeller

Vi introduserer Amazon Comprehend-svinghjulet for MLOps

Kunnskapsbaser i Amazon Bedrock gjør det nå enklere å stille spørsmål på ett enkelt dokument | Amazon Web Services

Gi live agenthjelp for chatbot-brukerne dine med Amazon Lex og Talkdesk skykontaktsenter | Amazon Web Services

MLOps på kanten med Amazon SageMaker Edge Manager og AWS IoT Greengrass

Organiser din maskinlæringsreise med Amazon SageMaker Experiments og Amazon SageMaker Pipelines

Øk utviklerproduktiviteten: Hvordan Deloitte bruker Amazon SageMaker Canvas for maskinlæring uten kode/lavkode | Amazon Web Services

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn