Instruction Réglage précis pour FLAN T5 XL avec Amazon SageMaker Jumpstart

Republié par Platon

Suiveurs: 0

L'IA générative est au milieu d'une période de croissance fulgurante. Des modèles de base de plus en plus performants sont publiés en continu, les grands modèles de langage (LLM) étant l'une des classes de modèles les plus visibles. Les LLM sont des modèles composés de milliards de paramètres formés sur de vastes corpus de texte, jusqu'à des centaines de milliards, voire un billion de jetons. Ces modèles se sont avérés extrêmement efficaces pour un large éventail de tâches textuelles, de la réponse aux questions à l'analyse des sentiments.

La puissance des LLM vient de leur capacité à apprendre et à généraliser à partir de données de formation étendues et diverses. L'entraînement initial de ces modèles est effectué avec une variété d'objectifs, supervisés, non supervisés ou hybrides. La complétion de texte ou l'imputation est l'un des objectifs non supervisés les plus courants : étant donné un morceau de texte, le modèle apprend à prédire avec précision ce qui vient ensuite (par exemple, prédire la phrase suivante). Les modèles peuvent également être formés de manière supervisée à l'aide de données étiquetées pour accomplir un ensemble de tâches (par exemple, cette critique de film est-elle positive, négative ou neutre). Que le modèle soit formé pour la complétion de texte ou pour une autre tâche, ce n'est souvent pas la tâche pour laquelle les clients veulent utiliser le modèle.

Pour améliorer les performances d'un LLM pré-formé sur une tâche spécifique, nous pouvons ajuster le modèle en utilisant des exemples de la tâche cible dans un processus connu sous le nom de mise au point des instructions. Le réglage fin des instructions utilise un ensemble d'exemples étiquetés sous la forme de paires {invite, réponse} pour entraîner davantage le modèle pré-entraîné à prédire de manière adéquate la réponse donnée à l'invite. Ce processus modifie les poids du modèle.

Cet article décrit comment effectuer le réglage fin des instructions d'un LLM, à savoir FLAN T5 XL, à l'aide Démarrage d'Amazon SageMaker. Nous montrons comment accomplir cela en utilisant à la fois l'interface utilisateur Jumpstart et un bloc-notes dans Amazon SageMakerStudio. Vous pouvez trouver le carnet d'accompagnement dans le amazon-sagemaker-exemples Référentiel GitHub.

Vue d'ensemble de la solution

La tâche cible de cet article est de, étant donné un morceau de texte dans l'invite, renvoyer les questions liées au texte mais auxquelles il est impossible de répondre en fonction des informations qu'il contient. Il s'agit d'une tâche utile pour identifier les informations manquantes dans une description ou pour déterminer si une requête nécessite plus d'informations pour y répondre.

Les modèles FLAN T5 sont des instructions affinées sur un large éventail de tâches pour augmenter les performances zéro coup de ces modèles sur de nombreuses tâches courantes[1]. Un réglage fin des instructions supplémentaires pour une tâche client particulière peut encore augmenter la précision de ces modèles, en particulier si la tâche cible n'a pas été utilisée auparavant pour former un modèle FLAN T5, comme c'est le cas pour notre tâche.

Dans notre exemple de tâche, nous souhaitons générer des questions pertinentes mais sans réponse. À cette fin, nous utilisons un sous-ensemble de la version 2 du Stanford Question Answering Dataset (SQuAD2.0)[2] pour affiner le modèle. Cet ensemble de données contient des questions posées par des annotateurs humains sur un ensemble d'articles de Wikipédia. En plus des questions avec réponses, SQuAD2.0 contient environ 50,000 XNUMX questions sans réponse. De telles questions sont plausibles mais ne peuvent pas être directement résolues à partir du contenu des articles. Nous n'utilisons que les questions sans réponse. Nos données sont structurées sous la forme d'un fichier JSON Lines, chaque ligne contenant un contexte et une question.

Capture d'écran de quelques entrées du jeu de données SQuADv2.

Pré-requis

Pour commencer, tout ce dont vous avez besoin est un compte AWS dans lequel vous pouvez utiliser Studio. Vous devrez créer un profil utilisateur pour Studio si vous n'en avez pas déjà un.

Ajustez FLAN-T5 avec l'interface utilisateur Jumpstart

Pour affiner le modèle avec l'interface utilisateur Jumpstart, procédez comme suit :

Sur la console SageMaker, ouvrez Studio.
Sous Démarrage de SageMaker dans le volet de navigation, choisissez Modèles, cahiers, solutions.

Vous verrez une liste de modèles de base, y compris FLAN T5 XL, qui est marqué comme pouvant être réglé avec précision.

Selectionnez Voir le modèle.

L'interface utilisateur JumpStart avec FLAN-T5 XL.

Sous La source de données, vous pouvez indiquer le chemin d'accès à vos données d'entraînement. La source des données utilisées dans cet article est fournie par défaut.
Vous pouvez conserver la valeur par défaut pour la configuration de déploiement (y compris le type d'instance), la sécurité et les hyperparamètres, mais vous devez augmenter le nombre d'époques à au moins trois pour obtenir de bons résultats.
Selectionnez Train pour former le modèle.

L'interface utilisateur du train JumpStart pour le modèle FLAN-T5 XL.

Vous pouvez suivre l'état de la tâche d'entraînement dans l'interface utilisateur.

Interface utilisateur Jumpstart pour la formation en cours.

Lorsque la formation est terminée (après environ 53 minutes dans notre cas), choisissez Déployer pour déployer le modèle affiné.

Formation JumpStart UI terminée.

Une fois le point de terminaison créé (quelques minutes), vous pouvez ouvrir un bloc-notes et commencer à utiliser votre modèle affiné.

Ajuster FLAN-T5 à l'aide d'un bloc-notes Python

Notre exemple de bloc-notes montre comment utiliser Jumpstart et SageMaker pour affiner et déployer par programmation un modèle FLAN T5 XL. Il peut être exécuté dans Studio ou localement.

Dans cette section, nous parcourons d'abord une configuration générale. Ensuite, vous ajustez le modèle à l'aide des jeux de données SQuADv2. Ensuite, vous déployez la version pré-formée du modèle derrière un point de terminaison SageMaker et faites de même avec le modèle affiné. Enfin, vous pouvez interroger les points de terminaison et comparer la qualité de la sortie du modèle pré-formé et affiné. Vous constaterez que la sortie du modèle affiné est de bien meilleure qualité.

Configurer les prérequis

Commencez par installer et mettre à niveau les packages nécessaires. Redémarrez le noyau après avoir exécuté le code suivant :

!pip install nest-asyncio==1.5.5 --quiet
!pip install ipywidgets==8.0.4 --quiet
!pip install --upgrade sagemaker --quiet

Ensuite, obtenez le rôle d'exécution associé à l'instance de notebook actuelle :

import boto3
import sagemaker
# Get current region, role, and default bucket
aws_region = boto3.Session().region_name
aws_role = sagemaker.session.Session().get_caller_identity_arn()
output_bucket = sagemaker.Session().default_bucket()
# This will be useful for printing
newline, bold, unbold = "n", "33[1m", "33[0m"
print(f"{bold}aws_region:{unbold} {aws_region}")
print(f"{bold}aws_role:{unbold} {aws_role}")
print(f"{bold}output_bucket:{unbold} {output_bucket}"

Vous pouvez définir un menu déroulant pratique qui répertorie les tailles de modèle disponibles pour un réglage précis :

import IPython
from ipywidgets import Dropdown
from sagemaker.jumpstart.filters import And
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models
# Default model choice
model_id = "huggingface-text2text-flan-t5-xl"
# Identify FLAN T5 models that support fine-tuning
filter_value = And( "task == text2text", "framework == huggingface", "training_supported == true"
)
model_list = [m for m in list_jumpstart_models(filter=filter_value) if "flan-t5" in m]
# Display the model IDs in a dropdown, for user to select
dropdown = Dropdown(
value=model_id,
options=model_list,
description="FLAN T5 models available for fine-tuning:",
style={"description_width": "initial"},
layout={"width": "max-content"},
)
display(IPython.display.Markdown("### Select a pre-trained model from the dropdown below"))
display(dropdown)

Jumpstart récupère automatiquement les types d'instances d'entraînement et d'inférence appropriés pour le modèle que vous avez choisi :

from sagemaker.instance_types import retrieve_default
model_id, model_version = dropdown.value, "*"
# Instance types for training and inference
training_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="training"
)
inference_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="inference"
)
print(f"{bold}model_id:{unbold} {model_id}")
print(f"{bold}training_instance_type:{unbold} {training_instance_type}")
print(f"{bold}inference_instance_type:{unbold} {inference_instance_type}") If you have chosen the FLAN T5 XL, you will see the following output: model_id: huggingface-text2text-flan-t5-xl training_instance_type: ml.p3.16xlarge inference_instance_type: ml.g5.2xlarge

Vous êtes maintenant prêt à commencer le réglage fin.

Réentraîner le modèle sur le jeu de données de réglage fin

Une fois votre configuration terminée, procédez comme suit :

Utilisez le code suivant pour récupérer l'URI des artefacts nécessaires :

from sagemaker import image_uris, model_uris, script_uris
# Training instance will use this image
train_image_uri = image_uris.retrieve(
region=aws_region,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="training",
instance_type=training_instance_type,
)
# Pre-trained model
train_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="training"
)
# Script to execute on the training instance
train_script_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="training"
)
print(f"{bold}image uri:{unbold} {train_image_uri}")
print(f"{bold}model uri:{unbold} {train_model_uri}")
print(f"{bold}script uri:{unbold} {train_script_uri}")

Les données d'entraînement se trouvent dans un espace public Service de stockage simple Amazon (Amazon S3) seau.

Utilisez le code suivant pour pointer vers l'emplacement des données et configurer l'emplacement de sortie dans un bucket de votre compte :

from sagemaker.s3 import S3Downloader # We will use the train split of SQuAD2.0
original_data_file = "train-v2.0.json" # The data was mirrored in the following bucket
original_data_location = f"s3://sagemaker-sample-files/datasets/text/squad2.0/{original_data_file}"
S3Downloader.download(original_data_location, ".")

Les données d'origine ne sont pas dans un format qui correspond à la tâche pour laquelle vous ajustez le modèle, vous pouvez donc les reformater :

import json local_data_file = "task-data.jsonl"  # any name with .jsonl extension with open(original_data_file) as f:
data = json.load(f) with open(local_data_file, "w") as f:
for article in data["data"]:
for paragraph in article["paragraphs"]:
# iterate over questions for a given paragraph
for qas in paragraph["qas"]:
if qas["is_impossible"]:
# the question is relevant, but cannot be answered
example = {"context": paragraph["context"], "question": qas["question"]}
json.dump(example, f)
f.write("n") template = { "prompt": "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}", "completion": "{question}",
}
with open("template.json", "w") as f:
json.dump(template, f) from sagemaker.s3 import S3Uploader train_data_location = f"s3://{output_bucket}/train_data"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"{bold}training data:{unbold} {train_data_location}")

Vous pouvez maintenant définir des hyperparamètres pour l'entraînement :

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for fine-tuning the model
hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) # We will override some default hyperparameters with custom values
hyperparameters["epochs"] = "3"
# TODO
# hyperparameters["max_input_length"] = "300"  # data inputs will be truncated at this length
# hyperparameters["max_output_length"] = "40"  # data outputs will be truncated at this length
# hyperparameters["generation_max_length"] = "40"  # max length of generated output
print(hyperparameters)

Vous êtes maintenant prêt à lancer la tâche d'entraînement :

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base model_name = "-".join(model_id.split("-")[2:])  # get the most informative part of ID
training_job_name = name_from_base(f"js-demo-{model_name}-{hyperparameters['epochs']}")
print(f"{bold}job name:{unbold} {training_job_name}") training_metric_definitions = [
{"Name": "val_loss", "Regex": "'eval_loss': ([0-9.]+)"},
{"Name": "train_loss", "Regex": "'loss': ([0-9.]+)"},
{"Name": "epoch", "Regex": "'epoch': ([0-9.]+)"},
] # Create SageMaker Estimator instance
sm_estimator = Estimator(
role=aws_role,
image_uri=train_image_uri,
model_uri=train_model_uri,
source_dir=train_script_uri,
entry_point="transfer_learning.py",
instance_count=1,
instance_type=training_instance_type,
volume_size=300,
max_run=360000,
hyperparameters=hyperparameters,
output_path=output_location,
metric_definitions=training_metric_definitions,
) # Launch a SageMaker training job over data located in the given S3 path
# Training jobs can take hours, it is recommended to set wait=False,
# and monitor job status through SageMaker console
sm_estimator.fit({"training": train_data_location}, job_name=training_job_name, wait=False)

En fonction de la taille des données de réglage fin et du modèle choisi, le réglage fin peut prendre jusqu'à quelques heures.

Vous pouvez surveiller les mesures de performance telles que la formation et la perte de validation à l'aide de Amazon Cloud Watch pendant la formation. De manière pratique, vous pouvez également récupérer l'instantané le plus récent des métriques en exécutant le code suivant :

from sagemaker import TrainingJobAnalytics # This can be called while the job is still running
df = TrainingJobAnalytics(training_job_name=training_job_name).dataframe()
df.head(10) model uri: s3://sagemaker-us-west-2-802376408542/avkan/training-huggingface-text2text-huggingface-text2text-flan-t5-xl-repack.tar.gz
job name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738
INFO:sagemaker:Creating training-job with name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738

Lorsque la formation est terminée, vous disposez d'un modèle affiné à model_uri. Utilisons-le !

Vous pouvez créer deux points de terminaison d'inférence : un pour le modèle pré-entraîné d'origine et un pour le modèle affiné. Cela vous permet de comparer la sortie des deux versions du modèle. À l'étape suivante, vous déployez un point de terminaison d'inférence pour le modèle pré-entraîné. Ensuite, vous déployez un point de terminaison pour votre modèle affiné.

Déployer le modèle pré-entraîné

Commençons par déployer le modèle pré-entraîné et récupérons l'URI de l'image Docker d'inférence. Il s'agit de l'image de base du conteneur Hugging Face. Utilisez le code suivant :

from sagemaker import image_uris # Retrieve the inference docker image URI. This is the base HuggingFace container image
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="inference",
instance_type=inference_instance_type,
)

Vous pouvez maintenant créer le point de terminaison et déployer le modèle pré-entraîné. Notez que vous devez transmettre la classe Predictor lors du déploiement du modèle via la classe Model pour pouvoir exécuter l'inférence via l'API SageMaker. Voir le code suivant :

from sagemaker import model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base # Retrieve the URI of the pre-trained model
pre_trained_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) pre_trained_name = name_from_base(f"jumpstart-demo-pre-trained-{model_id}") # Create the SageMaker model instance of the pre-trained model
if ("small" in model_id) or ("base" in model_id):
deploy_source_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="inference"
)
pre_trained_model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
entry_point="inference.py",
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
)
else:
# For those large models, we already repack the inference script and model
# artifacts for you, so the `source_dir` argument to Model is not required.
pre_trained_model = Model(
image_uri=deploy_image_uri,
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {pre_trained_model_uri}")
print("Deploying an endpoint ...") # Deploy the pre-trained model. Note that we need to pass Predictor class when we deploy model
# through Model class, for being able to run inference through the SageMaker API
pre_trained_predictor = pre_trained_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=pre_trained_name,
)
print(f"{newline}Deployed an endpoint {pre_trained_name}")

La création du point de terminaison et le déploiement du modèle peuvent prendre quelques minutes, puis votre point de terminaison est prêt à recevoir des appels d'inférence.

Déployer le modèle affiné

Déployons le modèle affiné sur son propre point de terminaison. Le processus est presque identique à celui que nous avons utilisé précédemment pour le modèle pré-entraîné. La seule différence est que nous utilisons le nom de modèle et l'URI affinés :

from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base fine_tuned_name = name_from_base(f"jumpstart-demo-fine-tuned-{model_id}")
fine_tuned_model_uri = f"{output_location}{training_job_name}/output/model.tar.gz" # Create the SageMaker model instance of the fine-tuned model
fine_tuned_model = Model(
image_uri=deploy_image_uri,
model_data=fine_tuned_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=fine_tuned_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {fine_tuned_model_uri}")
print("Deploying an endpoint ...") # Deploy the fine-tuned model.
fine_tuned_predictor = fine_tuned_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=fine_tuned_name,
)
print(f"{newline}Deployed an endpoint {fine_tuned_name}")

Lorsque ce processus est terminé, les modèles pré-formés et affinés sont déployés derrière leurs propres terminaux. Comparons leurs sorties.

Générer une sortie et comparer les résultats

Définissez des fonctions utilitaires pour interroger le point de terminaison et analyser la réponse :

import boto3
import json # Parameters of (output) text generation. A great introduction to generation
# parameters can be found at https://huggingface.co/blog/how-to-generate
parameters = { "max_length": 40,  # restrict the length of the generated text "num_return_sequences": 5,  # we will inspect several model outputs "num_beams": 10,  # use beam search
} # Helper functions for running inference queries
def query_endpoint_with_json_payload(payload, endpoint_name):
encoded_json = json.dumps(payload).encode("utf-8")
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
generated_text = model_predictions["generated_texts"]
return generated_text def generate_questions(endpoint_name, text):
expanded_prompt = prompt.replace("{context}", text)
payload = {"text_inputs": expanded_prompt, **parameters}
query_response = query_endpoint_with_json_payload(payload, endpoint_name=endpoint_name)
generated_texts = parse_response_multiple_texts(query_response)
for i, generated_text in enumerate(generated_texts):
print(f"Response {i}: {generated_text}{newline}")

Dans l'extrait de code suivant, nous définissons l'invite et les données de test. Le décrit notre tâche cible, qui consiste à générer des questions liées au texte fourni mais auxquelles il est impossible de répondre en fonction de celui-ci.

Les données de test se composent de trois paragraphes différents, l'un sur la ville australienne d'Adélaïde du les deux premiers paragraphes de la page Wikipédia, une concernant Boutique de blocs élastiques Amazon (Amazon EBS) de la Documentation AmazonEBSet l'un des Amazon comprendre du Documentation d'Amazon Comprehend. Nous nous attendons à ce que le modèle identifie les questions liées à ces paragraphes, mais il est impossible de répondre avec les informations qui y sont fournies.

prompt = "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}" test_paragraphs = [ """
Adelaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south. """, """
Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes. """, """
Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages. """
]

Vous pouvez maintenant tester les points de terminaison à l'aide des exemples d'articles

print(f"{bold}Prompt:{unbold} {repr(prompt)}")
for paragraph in test_paragraphs:
print("-" * 80)
print(paragraph)
print("-" * 80)
print(f"{bold}pre-trained{unbold}")
generate_questions(pre_trained_name, paragraph)
print(f"{bold}fine-tuned{unbold}")
generate_questions(fine_tuned_name, paragraph)

Données de test : Adélaïde

Nous utilisons le contexte suivant :

delaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south.

La réponse du modèle pré-entraîné est la suivante :

Response 0: What is the area of the city centre and surrounding parklands called in the Kaurna language?
Response 1: What is the area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language?
Response 2: What is the area of the city centre and surrounding parklands called in Kaurna?
Response 3: What is the capital city of South Australia?
Response 4: What is the area of the city centre and surrounding parklands known as in the Kaurna language?

Les réponses du modèle affiné sont les suivantes :

Response 0: What is the second most populous city in Australia?
Response 1: What is the fourth most populous city in Australia?
Response 2: What is the population of Gawler?
Response 3: What is the largest city in Australia?
Response 4: What is the fifth most populous city in the world?

Données de test : Amazon EBS

Nous utilisons le contexte suivant :

Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes.

Les réponses du modèle pré-entraîné sont les suivantes :

esponse 0: What is the difference between Amazon EBS and Amazon Elastic Block Store (Amazon EBS)?
Response 1: What is the difference between Amazon EBS and Amazon Elastic Block Store?
Response 2: What is the difference between Amazon EBS and Amazon Simple Storage Service (Amazon S3)?
Response 3: What is Amazon Elastic Block Store (Amazon EBS)?
Response 4: What is the difference between Amazon EBS and a hard drive?

Les réponses du modèle affiné sont les suivantes :

Response 0: What type of applications are not well suited to Amazon EBS?
Response 1: What behaves like formatted block devices?
Response 2: What type of applications are not suited to Amazon EBS?
Response 3: What type of applications are not well suited for Amazon EBS?
Response 4: What type of applications are not suited for Amazon EBS?

Données de test : Amazon Comprehend

Nous utilisons le contexte suivant :

Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages.

Les réponses du modèle pré-entraîné sont les suivantes :

Response 0: What does Amazon Comprehend use to extract insights about the content of documents?
Response 1: How does Amazon Comprehend extract insights about the content of documents?
Response 2: What does Amazon Comprehend use to develop insights about the content of documents?
Response 3: How does Amazon Comprehend develop insights about the content of documents?
Response 4: What does Amazon Comprehend use to extract insights about the content of a document?

Les réponses du modèle affiné sont les suivantes :

Response 0: What does Amazon Comprehend use to extract insights about the structure of documents?
Response 1: How does Amazon Comprehend recognize sentiments in a document?
Response 2: What does Amazon Comprehend use to extract insights about the content of social networking feeds?
Response 3: What does Amazon Comprehend use to extract insights about the content of documents?
Response 4: What type of files does Amazon Comprehend reject as input?

La différence de qualité de sortie entre le modèle pré-entraîné et le modèle affiné est flagrante. Les questions fournies par le modèle affiné touchent à un plus large éventail de sujets. Ce sont systématiquement des questions significatives, ce qui n'est pas toujours le cas pour le modèle pré-entraîné, comme l'illustre l'exemple d'Amazon EBS.

Bien que cela ne constitue pas une évaluation formelle et systématique, il est clair que le processus d'ajustement a amélioré la qualité des réponses du modèle sur cette tâche.

Nettoyer

Enfin, n'oubliez pas de nettoyer et de supprimer les points de terminaison :

# Delete resources
pre_trained_predictor.delete_model()
pre_trained_predictor.delete_endpoint()
fine_tuned_predictor.delete_model()
fine_tuned_predictor.delete_endpoint()

Conclusion

Dans cet article, nous avons montré comment utiliser le réglage fin des instructions avec les modèles FLAN T5 à l'aide de l'interface utilisateur Jumpstart ou d'un notebook Jupyter exécuté dans Studio. Nous avons fourni du code expliquant comment recycler le modèle à l'aide de données pour la tâche cible et déployer le modèle affiné derrière un point de terminaison. La tâche cible de cet article était d'identifier les questions liées à un morceau de texte fourni dans l'entrée, mais auxquelles il est impossible de répondre sur la base des informations fournies dans ce texte. Nous avons démontré qu'un modèle affiné pour cette tâche spécifique donne de meilleurs résultats qu'un modèle pré-entraîné.

Maintenant que vous savez comment affiner un modèle avec Jumpstart, vous pouvez créer des modèles puissants personnalisés pour votre application. Rassemblez des données pour votre cas d'utilisation, téléchargez-les sur Amazon S3 et utilisez l'interface utilisateur de Studio ou le bloc-notes pour régler un modèle FLAN T5 !

Bibliographie

[1] Chung, Hyung Won, et al. "Mise à l'échelle des modèles de langage optimisés pour l'instruction." prétirage arXiv arXiv:2210.11416 (2022).

[2] Rajpurkar, Pranav, Robin Jia et Percy Liang. "Savoir ce que vous ne savez pas : questions sans réponse pour SQuAD." Actes de la 56e réunion annuelle de l'Association for Computational Linguistics (Volume 2 : Documents courts). 2018.

À propos des auteurs

Laurent Callot est un scientifique appliqué principal et directeur chez AWS AI Labs qui a travaillé sur une variété de problèmes d'apprentissage automatique, des modèles fondamentaux et de l'IA générative à la prévision, la détection d'anomalies, la causalité et les opérations d'IA.

Andreï Kan est un scientifique appliqué senior chez AWS AI Labs avec des intérêts et une expérience dans différents domaines de l'apprentissage automatique. Il s'agit notamment de la recherche sur les modèles de base, ainsi que des applications ML pour les graphiques et les séries chronologiques.

Dr Ashish Khetan est un scientifique appliqué senior avec les algorithmes intégrés d'Amazon SageMaker et aide à développer des algorithmes d'apprentissage automatique. Il a obtenu son doctorat à l'Université de l'Illinois Urbana Champaign. Il est un chercheur actif en apprentissage automatique et en inférence statistique et a publié de nombreux articles dans les conférences NeurIPS, ICML, ICLR, JMLR, ACL et EMNLP.

Baris Kurt est scientifique appliquée chez AWS AI Labs. Il s'intéresse à la détection d'anomalies dans les séries chronologiques et aux modèles de fondation. Il aime développer des systèmes ML conviviaux.

Jonas Kübler est scientifique appliquée chez AWS AI Labs. Il travaille sur des modèles de base dans le but de faciliter des applications spécifiques à des cas d'utilisation.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
Frapper l'avenir avec Adryenn Ashley. Accéder ici.
Achetez et vendez des actions de sociétés PRE-IPO avec PREIPO®. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/instruction-fine-tuning-for-flan-t5-xl-with-amazon-sagemaker-jumpstart/

Horodatage: 22 mai 2023

Horodatage: Le 1 décembre 2023

Republié par Platon

Obtenez un débit d'inférence ML quatre fois plus élevé à un coût par inférence trois fois inférieur avec les instances Amazon EC2 G5 pour les modèles NLP et CV PyTorch

Présentation du volant d'inertie Amazon Comprehend pour MLOps

Les bases de connaissances d'Amazon Bedrock simplifient désormais la pose de questions sur un seul document | Services Web Amazon

Fournissez une assistance d'agent en direct aux utilisateurs de votre chatbot avec le centre de contact cloud Amazon Lex et Talkdesk | Services Web Amazon

MLOps à la périphérie avec Amazon SageMaker Edge Manager et AWS IoT Greengrass

Organisez votre parcours d'apprentissage automatique avec Amazon SageMaker Experiments et Amazon SageMaker Pipelines

Augmenter la productivité des développeurs : comment Deloitte utilise Amazon SageMaker Canvas pour l'apprentissage automatique sans code/low code | Services Web Amazon

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte