Instruções de ajuste fino para FLAN T5 XL com Amazon SageMaker Jumpstart

Republicado por Platão

seguidores: 0

A IA generativa está no meio de um período de crescimento impressionante. Modelos de fundação cada vez mais capazes estão sendo lançados continuamente, com grandes modelos de linguagem (LLMs) sendo uma das classes de modelo mais visíveis. LLMs são modelos compostos por bilhões de parâmetros treinados em extensos corpora de texto, até centenas de bilhões ou até mesmo um trilhão de tokens. Esses modelos provaram ser extremamente eficazes para uma ampla gama de tarefas baseadas em texto, desde respostas a perguntas até análises de sentimentos.

O poder dos LLMs vem de sua capacidade de aprender e generalizar a partir de dados de treinamento extensos e diversos. O treinamento inicial desses modelos é realizado com diversos objetivos, supervisionados, não supervisionados ou híbridos. A conclusão ou imputação de texto é um dos objetivos não supervisionados mais comuns: dado um pedaço de texto, o modelo aprende a prever com precisão o que vem a seguir (por exemplo, prever a próxima frase). Os modelos também podem ser treinados de forma supervisionada usando dados rotulados para realizar um conjunto de tarefas (por exemplo, esta crítica de filme é positiva, negativa ou neutra). Se o modelo é treinado para conclusão de texto ou alguma outra tarefa, frequentemente não é a tarefa para a qual os clientes desejam usar o modelo.

Para melhorar o desempenho de um LLM pré-treinado em uma tarefa específica, podemos ajustar o modelo usando exemplos da tarefa de destino em um processo conhecido como instrução de ajuste fino. O ajuste fino de instrução usa um conjunto de exemplos rotulados na forma de pares {prompt, response} para treinar ainda mais o modelo pré-treinado para prever adequadamente a resposta dada ao prompt. Este processo modifica os pesos do modelo.

Este post descreve como realizar o ajuste fino de instrução de um LLM, ou seja, FLAN T5 XL, usando Início rápido do Amazon SageMaker. Demonstramos como fazer isso usando a IU do Jumpstart e um notebook em Estúdio Amazon SageMaker. Você pode encontrar o caderno de acompanhamento no exemplos de amazon-sagemaker Repositório GitHub.

Visão geral da solução

A tarefa de destino neste post é, dado um pedaço de texto no prompt, retornar perguntas relacionadas ao texto, mas que não podem ser respondidas com base nas informações que ele contém. Esta é uma tarefa útil para identificar informações ausentes em uma descrição ou identificar se uma consulta precisa de mais informações para ser respondida.

Os modelos FLAN T5 são instruções ajustadas em uma ampla gama de tarefas para aumentar o desempenho zero-shot desses modelos em muitas tarefas comuns[1]. O ajuste fino de instruções adicionais para uma determinada tarefa do cliente pode aumentar ainda mais a precisão desses modelos, especialmente se a tarefa de destino não tiver sido usada anteriormente para treinar um modelo FLAN T5, como é o caso de nossa tarefa.

Em nossa tarefa de exemplo, estamos interessados em gerar perguntas relevantes, mas não respondidas. Para esse fim, usamos um subconjunto da versão 2 do Stanford Question Answering Dataset (SQuAD2.0)[2] para ajustar o modelo. Este conjunto de dados contém perguntas feitas por anotadores humanos em um conjunto de artigos da Wikipédia. Além das perguntas com respostas, o SQuAD2.0 contém cerca de 50,000 perguntas sem resposta. Essas perguntas são plausíveis, mas não podem ser respondidas diretamente a partir do conteúdo dos artigos. Nós só usamos as perguntas irrespondíveis. Nossos dados são estruturados como um arquivo JSON Lines, com cada linha contendo um contexto e uma pergunta.

Captura de tela de algumas entradas do conjunto de dados SQuADv2.

Pré-requisitos

Para começar, tudo o que você precisa é de uma conta da AWS na qual possa usar o Studio. Você precisará criar um perfil de usuário para o Studio se ainda não tiver um.

Ajuste o FLAN-T5 com a interface do usuário do Jumpstart

Para ajustar o modelo com a IU do Jumpstart, conclua as seguintes etapas:

No console do SageMaker, abra Studio.
Debaixo Início rápido do SageMaker no painel de navegação, escolha Modelos, notebooks, soluções.

Você verá uma lista de modelos básicos, incluindo o FLAN T5 XL, marcado como ajustável.

Escolha Ver modelo.

A interface do usuário JumpStart com FLAN-T5 XL.

Debaixo Fonte de dados, você pode fornecer o caminho para seus dados de treinamento. A fonte dos dados usados nesta postagem é fornecida por padrão.
Você pode manter o valor padrão para a configuração de implantação (incluindo tipo de instância), segurança e hiperparâmetros, mas deve aumentar o número de épocas para pelo menos três para obter bons resultados.
Escolha Trem para treinar o modelo.

A interface do usuário do trem JumpStart para o modelo FLAN-T5 XL.

Você pode acompanhar o status do trabalho de treinamento na interface do usuário.

Jumpstart UI para treinamento em andamento.

Quando o treino estiver completo (após cerca de 53 minutos no nosso caso), escolha Implantação para implantar o modelo ajustado.

Treinamento da IU do JumpStart concluído.

Depois que o ponto de extremidade é criado (alguns minutos), você pode abrir um notebook e começar a usar seu modelo ajustado.

Ajuste o FLAN-T5 usando um notebook Python

Nosso notebook de exemplo mostra como usar o Jumpstart e o SageMaker para ajustar e implantar programaticamente um modelo FLAN T5 XL. Pode ser executado no Studio ou localmente.

Nesta seção, primeiro percorremos algumas configurações gerais. Em seguida, você ajusta o modelo usando os conjuntos de dados SQuADv2. Em seguida, você implanta a versão pré-treinada do modelo por trás de um endpoint do SageMaker e faz o mesmo com o modelo ajustado. Por fim, você pode consultar os endpoints e comparar a qualidade da saída do modelo pré-treinado e ajustado. Você descobrirá que a saída do modelo ajustado é de qualidade muito superior.

Pré-requisitos de configuração

Comece instalando e atualizando os pacotes necessários. Reinicie o kernel após executar o seguinte código:

!pip install nest-asyncio==1.5.5 --quiet
!pip install ipywidgets==8.0.4 --quiet
!pip install --upgrade sagemaker --quiet

Em seguida, obtenha a função de execução associada à instância de notebook atual:

import boto3
import sagemaker
# Get current region, role, and default bucket
aws_region = boto3.Session().region_name
aws_role = sagemaker.session.Session().get_caller_identity_arn()
output_bucket = sagemaker.Session().default_bucket()
# This will be useful for printing
newline, bold, unbold = "n", "33[1m", "33[0m"
print(f"{bold}aws_region:{unbold} {aws_region}")
print(f"{bold}aws_role:{unbold} {aws_role}")
print(f"{bold}output_bucket:{unbold} {output_bucket}"

Você pode definir um menu suspenso conveniente que listará os tamanhos de modelo disponíveis para ajuste fino:

import IPython
from ipywidgets import Dropdown
from sagemaker.jumpstart.filters import And
from sagemaker.jumpstart.notebook_utils import list_jumpstart_models
# Default model choice
model_id = "huggingface-text2text-flan-t5-xl"
# Identify FLAN T5 models that support fine-tuning
filter_value = And( "task == text2text", "framework == huggingface", "training_supported == true"
)
model_list = [m for m in list_jumpstart_models(filter=filter_value) if "flan-t5" in m]
# Display the model IDs in a dropdown, for user to select
dropdown = Dropdown(
value=model_id,
options=model_list,
description="FLAN T5 models available for fine-tuning:",
style={"description_width": "initial"},
layout={"width": "max-content"},
)
display(IPython.display.Markdown("### Select a pre-trained model from the dropdown below"))
display(dropdown)

O Jumpstart recupera automaticamente os tipos de instância de treinamento e inferência apropriados para o modelo que você escolheu:

from sagemaker.instance_types import retrieve_default
model_id, model_version = dropdown.value, "*"
# Instance types for training and inference
training_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="training"
)
inference_instance_type = retrieve_default(
model_id=model_id, model_version=model_version, scope="inference"
)
print(f"{bold}model_id:{unbold} {model_id}")
print(f"{bold}training_instance_type:{unbold} {training_instance_type}")
print(f"{bold}inference_instance_type:{unbold} {inference_instance_type}") If you have chosen the FLAN T5 XL, you will see the following output: model_id: huggingface-text2text-flan-t5-xl training_instance_type: ml.p3.16xlarge inference_instance_type: ml.g5.2xlarge

Agora você está pronto para começar o ajuste fino.

Retreine o modelo no conjunto de dados de ajuste fino

Após a conclusão da configuração, conclua as seguintes etapas:

Use o código a seguir para recuperar o URI dos artefatos necessários:

from sagemaker import image_uris, model_uris, script_uris
# Training instance will use this image
train_image_uri = image_uris.retrieve(
region=aws_region,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="training",
instance_type=training_instance_type,
)
# Pre-trained model
train_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="training"
)
# Script to execute on the training instance
train_script_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="training"
)
print(f"{bold}image uri:{unbold} {train_image_uri}")
print(f"{bold}model uri:{unbold} {train_model_uri}")
print(f"{bold}script uri:{unbold} {train_script_uri}")

Os dados de treinamento estão localizados em um arquivo público Serviço de armazenamento simples da Amazon (Amazon S3).

Use o código a seguir para apontar para o local dos dados e configurar o local de saída em um bloco em sua conta:

from sagemaker.s3 import S3Downloader # We will use the train split of SQuAD2.0
original_data_file = "train-v2.0.json" # The data was mirrored in the following bucket
original_data_location = f"s3://sagemaker-sample-files/datasets/text/squad2.0/{original_data_file}"
S3Downloader.download(original_data_location, ".")

Os dados originais não estão em um formato que corresponda à tarefa para a qual você está ajustando o modelo, então você pode reformatá-lo:

import json local_data_file = "task-data.jsonl"  # any name with .jsonl extension with open(original_data_file) as f:
data = json.load(f) with open(local_data_file, "w") as f:
for article in data["data"]:
for paragraph in article["paragraphs"]:
# iterate over questions for a given paragraph
for qas in paragraph["qas"]:
if qas["is_impossible"]:
# the question is relevant, but cannot be answered
example = {"context": paragraph["context"], "question": qas["question"]}
json.dump(example, f)
f.write("n") template = { "prompt": "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}", "completion": "{question}",
}
with open("template.json", "w") as f:
json.dump(template, f) from sagemaker.s3 import S3Uploader train_data_location = f"s3://{output_bucket}/train_data"
S3Uploader.upload(local_data_file, train_data_location)
S3Uploader.upload("template.json", train_data_location)
print(f"{bold}training data:{unbold} {train_data_location}")

Agora você pode definir alguns hiperparâmetros para o treinamento:

from sagemaker import hyperparameters # Retrieve the default hyper-parameters for fine-tuning the model
hyperparameters = hyperparameters.retrieve_default(model_id=model_id, model_version=model_version) # We will override some default hyperparameters with custom values
hyperparameters["epochs"] = "3"
# TODO
# hyperparameters["max_input_length"] = "300"  # data inputs will be truncated at this length
# hyperparameters["max_output_length"] = "40"  # data outputs will be truncated at this length
# hyperparameters["generation_max_length"] = "40"  # max length of generated output
print(hyperparameters)

Agora você está pronto para iniciar o trabalho de treinamento:

from sagemaker.estimator import Estimator
from sagemaker.utils import name_from_base model_name = "-".join(model_id.split("-")[2:])  # get the most informative part of ID
training_job_name = name_from_base(f"js-demo-{model_name}-{hyperparameters['epochs']}")
print(f"{bold}job name:{unbold} {training_job_name}") training_metric_definitions = [
{"Name": "val_loss", "Regex": "'eval_loss': ([0-9.]+)"},
{"Name": "train_loss", "Regex": "'loss': ([0-9.]+)"},
{"Name": "epoch", "Regex": "'epoch': ([0-9.]+)"},
] # Create SageMaker Estimator instance
sm_estimator = Estimator(
role=aws_role,
image_uri=train_image_uri,
model_uri=train_model_uri,
source_dir=train_script_uri,
entry_point="transfer_learning.py",
instance_count=1,
instance_type=training_instance_type,
volume_size=300,
max_run=360000,
hyperparameters=hyperparameters,
output_path=output_location,
metric_definitions=training_metric_definitions,
) # Launch a SageMaker training job over data located in the given S3 path
# Training jobs can take hours, it is recommended to set wait=False,
# and monitor job status through SageMaker console
sm_estimator.fit({"training": train_data_location}, job_name=training_job_name, wait=False)

Dependendo do tamanho dos dados de ajuste fino e do modelo escolhido, o ajuste fino pode levar algumas horas.

Você pode monitorar métricas de desempenho, como perda de treinamento e validação usando Amazon CloudWatch durante o treinamento. Convenientemente, você também pode buscar o instantâneo mais recente das métricas executando o seguinte código:

from sagemaker import TrainingJobAnalytics # This can be called while the job is still running
df = TrainingJobAnalytics(training_job_name=training_job_name).dataframe()
df.head(10) model uri: s3://sagemaker-us-west-2-802376408542/avkan/training-huggingface-text2text-huggingface-text2text-flan-t5-xl-repack.tar.gz
job name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738
INFO:sagemaker:Creating training-job with name: jumpstart-demo-xl-3-2023-04-06-08-16-42-738

Quando o treinamento estiver completo, você terá um modelo ajustado em model_uri. Vamos usá-lo!

Você pode criar dois endpoints de inferência: um para o modelo pré-treinado original e outro para o modelo ajustado. Isso permite que você compare a saída de ambas as versões do modelo. Na próxima etapa, você implanta um endpoint de inferência para o modelo pré-treinado. Em seguida, você implanta um endpoint para seu modelo ajustado.

Implante o modelo pré-treinado

Vamos começar implantando o modelo pré-treinado para recuperar o URI da imagem do Docker de inferência. Esta é a imagem base do contêiner Hugging Face. Use o seguinte código:

from sagemaker import image_uris # Retrieve the inference docker image URI. This is the base HuggingFace container image
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,  # automatically inferred from model_id
model_id=model_id,
model_version=model_version,
image_scope="inference",
instance_type=inference_instance_type,
)

Agora você pode criar o endpoint e implantar o modelo pré-treinado. Observe que você precisa passar a classe Predictor ao implantar o modelo por meio da classe Model para poder executar a inferência por meio da API do SageMaker. Veja o seguinte código:

from sagemaker import model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base # Retrieve the URI of the pre-trained model
pre_trained_model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) pre_trained_name = name_from_base(f"jumpstart-demo-pre-trained-{model_id}") # Create the SageMaker model instance of the pre-trained model
if ("small" in model_id) or ("base" in model_id):
deploy_source_uri = script_uris.retrieve(
model_id=model_id, model_version=model_version, script_scope="inference"
)
pre_trained_model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
entry_point="inference.py",
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
)
else:
# For those large models, we already repack the inference script and model
# artifacts for you, so the `source_dir` argument to Model is not required.
pre_trained_model = Model(
image_uri=deploy_image_uri,
model_data=pre_trained_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=pre_trained_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {pre_trained_model_uri}")
print("Deploying an endpoint ...") # Deploy the pre-trained model. Note that we need to pass Predictor class when we deploy model
# through Model class, for being able to run inference through the SageMaker API
pre_trained_predictor = pre_trained_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=pre_trained_name,
)
print(f"{newline}Deployed an endpoint {pre_trained_name}")

A criação do endpoint e a implantação do modelo podem levar alguns minutos, então seu endpoint está pronto para receber chamadas de inferência.

Implante o modelo ajustado

Vamos implantar o modelo ajustado em seu próprio endpoint. O processo é quase idêntico ao que usamos anteriormente para o modelo pré-treinado. A única diferença é que usamos o nome do modelo e o URI ajustados:

from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base fine_tuned_name = name_from_base(f"jumpstart-demo-fine-tuned-{model_id}")
fine_tuned_model_uri = f"{output_location}{training_job_name}/output/model.tar.gz" # Create the SageMaker model instance of the fine-tuned model
fine_tuned_model = Model(
image_uri=deploy_image_uri,
model_data=fine_tuned_model_uri,
role=aws_role,
predictor_cls=Predictor,
name=fine_tuned_name,
) print(f"{bold}image URI:{unbold}{newline} {deploy_image_uri}")
print(f"{bold}model URI:{unbold}{newline} {fine_tuned_model_uri}")
print("Deploying an endpoint ...") # Deploy the fine-tuned model.
fine_tuned_predictor = fine_tuned_model.deploy(
initial_instance_count=1,
instance_type=inference_instance_type,
predictor_cls=Predictor,
endpoint_name=fine_tuned_name,
)
print(f"{newline}Deployed an endpoint {fine_tuned_name}")

Quando esse processo é concluído, os modelos pré-treinados e ajustados são implantados atrás de seus próprios endpoints. Vamos comparar suas saídas.

Gerar saída e comparar os resultados

Defina algumas funções utilitárias para consultar o terminal e analisar a resposta:

import boto3
import json # Parameters of (output) text generation. A great introduction to generation
# parameters can be found at https://huggingface.co/blog/how-to-generate
parameters = { "max_length": 40,  # restrict the length of the generated text "num_return_sequences": 5,  # we will inspect several model outputs "num_beams": 10,  # use beam search
} # Helper functions for running inference queries
def query_endpoint_with_json_payload(payload, endpoint_name):
encoded_json = json.dumps(payload).encode("utf-8")
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
generated_text = model_predictions["generated_texts"]
return generated_text def generate_questions(endpoint_name, text):
expanded_prompt = prompt.replace("{context}", text)
payload = {"text_inputs": expanded_prompt, **parameters}
query_response = query_endpoint_with_json_payload(payload, endpoint_name=endpoint_name)
generated_texts = parse_response_multiple_texts(query_response)
for i, generated_text in enumerate(generated_texts):
print(f"Response {i}: {generated_text}{newline}")

No próximo trecho de código, definimos o prompt e os dados de teste. O descreve nossa tarefa de destino, que é gerar perguntas relacionadas ao texto fornecido, mas que não podem ser respondidas com base nele.

Os dados do teste consistem em três parágrafos diferentes, um na cidade australiana de Adelaide do primeiros dois parágrafos da página da Wikipédia, um sobre Loja de blocos elásticos da Amazon (Amazônia EBS) da Documentação do Amazon EBSe um dos Amazon Comprehend do Documentação do Amazon Comprehend. Esperamos que o modelo identifique questões relacionadas a esses parágrafos, mas que não podem ser respondidas com as informações fornecidas neles.

prompt = "Ask a question which is related to the following text, but cannot be answered based on the text. Text: {context}" test_paragraphs = [ """
Adelaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south. """, """
Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes. """, """
Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages. """
]

Agora você pode testar os endpoints usando os artigos de exemplo

print(f"{bold}Prompt:{unbold} {repr(prompt)}")
for paragraph in test_paragraphs:
print("-" * 80)
print(paragraph)
print("-" * 80)
print(f"{bold}pre-trained{unbold}")
generate_questions(pre_trained_name, paragraph)
print(f"{bold}fine-tuned{unbold}")
generate_questions(fine_tuned_name, paragraph)

Dados de teste: Adelaide

Usamos o seguinte contexto:

delaide is the capital city of South Australia, the state's largest city and the fifth-most populous city in Australia. "Adelaide" may refer to either Greater Adelaide (including the Adelaide Hills) or the Adelaide city centre.
The demonym Adelaidean is used to denote the city and the residents of Adelaide. The Traditional Owners of the Adelaide
region are the Kaurna people. The area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language. Adelaide is situated on the Adelaide Plains north of the Fleurieu Peninsula, between the Gulf St Vincent in the west and
the Mount Lofty Ranges in the east. Its metropolitan area extends 20 km (12 mi) from the coast to the foothills of
the Mount Lofty Ranges, and stretches 96 km (60 mi) from Gawler in the north to Sellicks Beach in the south.

A resposta do modelo pré-treinado é a seguinte:

Response 0: What is the area of the city centre and surrounding parklands called in the Kaurna language?
Response 1: What is the area of the city centre and surrounding parklands is called Tarndanya in the Kaurna language?
Response 2: What is the area of the city centre and surrounding parklands called in Kaurna?
Response 3: What is the capital city of South Australia?
Response 4: What is the area of the city centre and surrounding parklands known as in the Kaurna language?

As respostas do modelo ajustado são as seguintes:

Response 0: What is the second most populous city in Australia?
Response 1: What is the fourth most populous city in Australia?
Response 2: What is the population of Gawler?
Response 3: What is the largest city in Australia?
Response 4: What is the fifth most populous city in the world?

Dados de teste: Amazon EBS

Usamos o seguinte contexto:

Amazon Elastic Block Store (Amazon EBS) provides block level storage volumes for use with EC2 instances. EBS volumes behave like raw, unformatted block devices. You can mount these volumes as devices on your instances. EBS volumes that are attached to an instance are exposed as storage volumes that persist independently from the life of the instance. You can create a file system on top of these volumes, or use them in any way you would use a block device (such as a hard drive). You can dynamically change the configuration of a volume attached to an instance. We recommend Amazon EBS for data that must be quickly accessible and requires long-term persistence. EBS volumes are particularly well-suited for use as the primary storage for file systems, databases, or for any applications that require fine granular updates and access to raw, unformatted, block-level storage. Amazon EBS is well suited to both database-style applications that rely on random reads and writes, and to throughput-intensive applications that perform long, continuous reads and writes.

As respostas do modelo pré-treinado são as seguintes:

esponse 0: What is the difference between Amazon EBS and Amazon Elastic Block Store (Amazon EBS)?
Response 1: What is the difference between Amazon EBS and Amazon Elastic Block Store?
Response 2: What is the difference between Amazon EBS and Amazon Simple Storage Service (Amazon S3)?
Response 3: What is Amazon Elastic Block Store (Amazon EBS)?
Response 4: What is the difference between Amazon EBS and a hard drive?

As respostas do modelo ajustado são as seguintes:

Response 0: What type of applications are not well suited to Amazon EBS?
Response 1: What behaves like formatted block devices?
Response 2: What type of applications are not suited to Amazon EBS?
Response 3: What type of applications are not well suited for Amazon EBS?
Response 4: What type of applications are not suited for Amazon EBS?

Dados de teste: Amazon Comprehend

Usamos o seguinte contexto:

Amazon Comprehend uses natural language processing (NLP) to extract insights about the content of documents. It develops insights by recognizing the entities, key phrases, language, sentiments, and other common elements in a document. Use Amazon Comprehend to create new products based on understanding the structure of documents. For example, using Amazon Comprehend you can search social networking feeds for mentions of products or scan an entire document repository for key phrases. You can access Amazon Comprehend document analysis capabilities using the Amazon Comprehend console or using the Amazon Comprehend APIs. You can run real-time analysis for small workloads or you can start asynchronous analysis jobs for large document sets. You can use the pre-trained models that Amazon Comprehend provides, or you can train your own custom models for classification and entity recognition. All of the Amazon Comprehend features accept UTF-8 text documents as the input. In addition, custom classification and custom entity recognition accept image files, PDF files, and Word files as input. Amazon Comprehend can examine and analyze documents in a variety of languages, depending on the specific feature. For more information, see Languages supported in Amazon Comprehend. Amazon Comprehend's Dominant language capability can examine documents and determine the dominant language for a far wider selection of languages.

As respostas do modelo pré-treinado são as seguintes:

Response 0: What does Amazon Comprehend use to extract insights about the content of documents?
Response 1: How does Amazon Comprehend extract insights about the content of documents?
Response 2: What does Amazon Comprehend use to develop insights about the content of documents?
Response 3: How does Amazon Comprehend develop insights about the content of documents?
Response 4: What does Amazon Comprehend use to extract insights about the content of a document?

As respostas do modelo ajustado são as seguintes:

Response 0: What does Amazon Comprehend use to extract insights about the structure of documents?
Response 1: How does Amazon Comprehend recognize sentiments in a document?
Response 2: What does Amazon Comprehend use to extract insights about the content of social networking feeds?
Response 3: What does Amazon Comprehend use to extract insights about the content of documents?
Response 4: What type of files does Amazon Comprehend reject as input?

A diferença na qualidade de saída entre o modelo pré-treinado e o modelo ajustado é gritante. As perguntas fornecidas pelo modelo ajustado abrangem uma gama mais ampla de tópicos. São perguntas sistematicamente significativas, o que nem sempre é o caso do modelo pré-treinado, conforme ilustrado no exemplo do Amazon EBS.

Embora isso não constitua uma avaliação formal e sistemática, é claro que o processo de ajuste fino melhorou a qualidade das respostas do modelo nessa tarefa.

limpar

Por fim, lembre-se de limpar e excluir os endpoints:

# Delete resources
pre_trained_predictor.delete_model()
pre_trained_predictor.delete_endpoint()
fine_tuned_predictor.delete_model()
fine_tuned_predictor.delete_endpoint()

Conclusão

Nesta postagem, mostramos como usar o ajuste fino de instrução com modelos FLAN T5 usando a interface do usuário do Jumpstart ou um notebook Jupyter em execução no Studio. Fornecemos um código que explica como treinar novamente o modelo usando dados para a tarefa de destino e implantar o modelo ajustado por trás de um endpoint. A tarefa de destino nesta postagem era identificar perguntas relacionadas a um pedaço de texto fornecido na entrada, mas que não pode ser respondida com base nas informações fornecidas nesse texto. Demonstramos que um modelo ajustado para esta tarefa específica retorna melhores resultados do que um modelo pré-treinado.

Agora que você sabe como fazer o ajuste fino de um modelo com o Jumpstart, você pode criar modelos poderosos personalizados para sua aplicação. Reúna alguns dados para o seu caso de uso, carregue-os no Amazon S3 e use a interface do usuário do Studio ou o notebook para ajustar um modelo FLAN T5!

Referências

[1] Chung, Hyung Won, e outros. “Modelos de linguagem sintonizados com instruções de escalabilidade.” pré-impressão arXiv arXiv:2210.11416 (2022).

[2] Rajpurkar, Pranav, Robin Jia e Percy Liang. “Saiba o que você não sabe: perguntas sem resposta para o SQUAD.” Anais da 56ª Reunião Anual da Association for Computational Linguistics (Volume 2: Short Papers). 2018.

Sobre os autores

Laurent Callot é um cientista aplicado principal e gerente do AWS AI Labs que trabalhou em uma variedade de problemas de aprendizado de máquina, desde modelos fundamentais e IA generativa até previsão, detecção de anomalias, causalidade e operações de IA.

Andrey Kan é um cientista aplicado sênior no AWS AI Labs com interesses e experiência em diferentes campos de aprendizado de máquina. Isso inclui pesquisas sobre modelos de fundação, bem como aplicativos de ML para gráficos e séries temporais.

Dr. é um cientista aplicado sênior com algoritmos integrados do Amazon SageMaker e ajuda a desenvolver algoritmos de aprendizado de máquina. Ele obteve seu PhD pela University of Illinois Urbana Champaign. Ele é um pesquisador ativo em aprendizado de máquina e inferência estatística e publicou muitos artigos em conferências NeurIPS, ICML, ICLR, JMLR, ACL e EMNLP.

Baris Kurt é um cientista aplicado no AWS AI Labs. Seus interesses estão na detecção de anomalias de séries temporais e modelos de fundação. Ele adora desenvolver sistemas de ML amigáveis.

Jonas Kubler é um cientista aplicado no AWS AI Labs. Ele está trabalhando em modelos básicos com o objetivo de facilitar aplicativos específicos de casos de uso.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoAiStream. Inteligência de Dados Web3. Conhecimento Amplificado. Acesse aqui.
Cunhando o Futuro com Adryenn Ashley. Acesse aqui.
Compre e venda ações em empresas PRE-IPO com PREIPO®. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/instruction-fine-tuning-for-flan-t5-xl-with-amazon-sagemaker-jumpstart/

Carimbo de hora: 22 de maio de 2023

Carimbo de hora: Junho 20, 2023

Republicado por Platão

Detectar entradas de adversários usando o Amazon SageMaker Model Monitor e o Amazon SageMaker Debugger

Geração aumentada de recuperação com LangChain, Amazon SageMaker JumpStart e pesquisa semântica do MongoDB Atlas | Amazon Web Services

Crie aplicativos de IA generativos prontos para produção para pesquisa corporativa usando pipelines Haystack e Amazon SageMaker JumpStart com LLMs | Amazon Web Services

Reconstrução de imagens médicas baseada em nuvem usando redes neurais profundas

Apresentando as novas visualizações incorporadas do Amazon SageMaker Data Wrangler

O InformedIQ automatiza as verificações para empréstimos automáticos da Origence usando aprendizado de máquina

Reduza o consumo de energia de suas cargas de trabalho de machine learning em até 90% com os aceleradores da AWS criados especificamente para isso | Amazon Web Services

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta