Crie um aplicativo de resumo de documentos HCLS com Falcon usando Amazon SageMaker JumpStart

Republicado por Platão

seguidores: 0

Os clientes de saúde e ciências biológicas (HCLS) estão adotando a IA generativa como uma ferramenta para aproveitar melhor seus dados. Os casos de uso incluem o resumo de documentos para ajudar os leitores a se concentrarem nos pontos-chave de um documento e a transformação de texto não estruturado em formatos padronizados para destacar atributos importantes. Com formatos de dados exclusivos e requisitos regulatórios rigorosos, os clientes procuram opções para selecionar o modelo com melhor desempenho e custo-benefício, bem como a capacidade de realizar a personalização necessária (ajuste fino) para se adequar ao seu caso de uso comercial. Nesta postagem, orientamos você na implantação de um modelo de linguagem grande (LLM) Falcon usando JumpStart do Amazon SageMaker e usar o modelo para resumir documentos longos com LangChain e Python.

Visão geral da solução

Amazon Sage Maker baseia-se nas duas décadas de experiência da Amazon no desenvolvimento de aplicativos de ML do mundo real, incluindo recomendações de produtos, personalização, compras inteligentes, robótica e dispositivos assistidos por voz. SageMaker é um serviço gerenciado qualificado para HIPAA que fornece ferramentas que permitem que cientistas de dados, engenheiros de ML e analistas de negócios inovem com ML. Dentro do SageMaker está Estúdio Amazon SageMaker, um ambiente de desenvolvimento integrado (IDE) desenvolvido especificamente para fluxos de trabalho colaborativos de ML, que, por sua vez, contém uma ampla variedade de soluções de início rápido e modelos de ML pré-treinados em um hub integrado chamado SageMaker JumpStart. Com o SageMaker JumpStart, você pode usar modelos pré-treinados, como o Falcon LLM, com notebooks de amostra pré-construídos e suporte SDK para experimentar e implantar esses poderosos modelos de transformadores. Você pode usar o SageMaker Studio e o SageMaker JumpStart para implantar e consultar seu próprio modelo generativo em sua conta da AWS.

Você também pode garantir que os dados da carga útil de inferência não saiam da VPC. Você pode provisionar modelos como endpoints de locatário único e implantá-los com isolamento de rede. Além disso, você pode selecionar e gerenciar o conjunto selecionado de modelos que atendem aos seus próprios requisitos de segurança usando o recurso de hub de modelo privado no SageMaker JumpStart e armazenando os modelos aprovados nele. SageMaker está no escopo para HIPAA BAA, SOC123 e HITRUST LCR.

A Falcão LLM é um grande modelo de linguagem, treinado por pesquisadores do Technology Innovation Institute (TII) em mais de 1 trilhão de tokens usando AWS. O Falcon tem muitas variações diferentes, com seus dois constituintes principais, Falcon 40B e Falcon 7B, compostos por 40 bilhões e 7 bilhões de parâmetros, respectivamente, com versões ajustadas e treinadas para tarefas específicas, como seguir instruções. O Falcon tem um bom desempenho em uma variedade de tarefas, incluindo resumo de texto, análise de sentimentos, resposta a perguntas e conversas. Esta postagem fornece um passo a passo que você pode seguir para implantar o Falcon LLM em sua conta AWS, usando uma instância de notebook gerenciado por meio do SageMaker JumpStart para experimentar o resumo de texto.

O hub do modelo SageMaker JumpStart inclui notebooks completos para implantar e consultar cada modelo. No momento em que este artigo foi escrito, havia seis versões do Falcon disponíveis no hub do modelo SageMaker JumpStart: Falcon 40B Instruct BF16, Falcon 40B BF16, Falcon 180B BF16, Falcon 180B Chat BF16, Falcon 7B Instruct BF16 e Falcon 7B BF16. Esta postagem usa o modelo Falcon 7B Instruct.

Nas seções a seguir, mostramos como começar a resumir documentos implantando o Falcon 7B no SageMaker Jumpstart.

Pré-requisitos

Para este tutorial, você precisará de uma conta AWS com um domínio SageMaker. Se você ainda não possui um domínio SageMaker, consulte Integrado ao domínio do Amazon SageMaker para criar um.

Implante o Falcon 7B usando o SageMaker JumpStart

Para implantar seu modelo, conclua as etapas a seguir:

Navegue até o ambiente do SageMaker Studio no console do SageMaker.
Dentro do IDE, em SageMaker JumpStart no painel de navegação, escolha Modelos, notebooks, soluções.
Implante o modelo Falcon 7B Instruct em um endpoint para inferência.

Isso abrirá o cartão de modelo do modelo Falcon 7B Instruct BF16. Nesta página você encontra o Implantação or Trem opções, bem como links para abrir os blocos de notas de amostra no SageMaker Studio. Esta postagem usará o notebook de exemplo do SageMaker JumpStart para implantar o modelo.

Escolha Caderno aberto.

Execute as primeiras quatro células do notebook para implantar o endpoint Falcon 7B Instruct.

Você pode ver seus modelos JumpStart implantados na página Ativos JumpStart lançados Disputas de Comerciais.

No painel de navegação, em Início rápido do SageMaker, escolha Ativos JumpStart lançados.
Escolha o Pontos de extremidade do modelo para visualizar o status do seu endpoint.

Com o endpoint Falcon LLM implantado, você está pronto para consultar o modelo.

Execute sua primeira consulta

Para executar uma consulta, conclua as seguintes etapas:

No Envie o menu, escolha Novo e Portátil para abrir um novo bloco de notas.

Você também pode baixar o caderno completo SUA PARTICIPAÇÃO FAZ A DIFERENÇA.

Selecione a imagem, o kernel e o tipo de instância quando solicitado. Para esta postagem, escolhemos a imagem Data Science 3.0, o kernel Python 3 e a instância ml.t3.medium.

Importe os módulos Boto3 e JSON inserindo as duas linhas a seguir na primeira célula:

import json
import boto3

Press Shift+Enter para executar a célula.
A seguir, você pode definir uma função que chamará seu endpoint. Esta função pega uma carga de dicionário e a usa para invocar o cliente de tempo de execução SageMaker. Em seguida, desserializa a resposta e imprime a entrada e o texto gerado.

newline, bold, unbold = 'n', '33[1m', '33[0m'
endpoint_name = 'ENDPOINT_NAME' def query_endpoint(payload): client = boto3.client('runtime.sagemaker') response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/json', Body=json.dumps(payload).encode('utf-8')) model_predictions = json.loads(response['Body'].read()) generated_text = model_predictions[0]['generated_text'] print ( f"Input Text: {payload['inputs']}{newline}" f"Generated Text: {bold}{generated_text}{unbold}{newline}")

A carga inclui o prompt como entradas, juntamente com os parâmetros de inferência que serão passados para o modelo.

Você pode usar estes parâmetros com o prompt para ajustar a saída do modelo para seu caso de uso:

payload = { "inputs": "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", "parameters":{ "max_new_tokens": 50, "return_full_text": False, "do_sample": True, "top_k":10 }
}

Consulta com um prompt de resumo

Esta postagem usa um exemplo de artigo de pesquisa para demonstrar o resumo. O arquivo de texto de exemplo refere-se ao resumo automático de texto na literatura biomédica. Conclua as seguintes etapas:

Baixar o PDF e copie o texto em um arquivo chamado document.txt.
No SageMaker Studio, escolha o ícone de upload e carregue o arquivo para sua instância do SageMaker Studio.

Fazendo upload do arquivo para o SageMaker Studio

Pronto para uso, o Falcon LLM fornece suporte para resumo de texto.

Vamos criar uma função que use técnicas de engenharia imediata para resumir document.txt:

def summarize(text_to_summarize): summarization_prompt = """Process the following text and then perform the instructions that follow: {text_to_summarize} Provide a short summary of the preceeding text. Summary:""" payload = { "inputs": summarization_prompt, "parameters":{ "max_new_tokens": 150, "return_full_text": False, "do_sample": True, "top_k":10 } } response = query_endpoint(payload) print(response) with open("document.txt") as f: text_to_summarize = f.read() summarize(text_to_summarize)

Você notará que, para documentos mais longos, aparece um erro – o Falcon, junto com todos os outros LLMs, tem um limite no número de tokens passados como entrada. Podemos contornar esse limite usando os recursos aprimorados de resumo do LangChain, que permitem que uma entrada muito maior seja passada para o LLM.

Importe e execute uma cadeia de resumo

LangChain é uma biblioteca de software de código aberto que permite que desenvolvedores e cientistas de dados criem, ajustem e implantem rapidamente aplicativos generativos personalizados sem gerenciar interações complexas de ML, comumente usado para abstrair muitos dos casos de uso comuns para modelos de linguagem de IA generativos em apenas alguns linhas de código. O suporte do LangChain para serviços AWS inclui suporte para endpoints SageMaker.

LangChain fornece uma interface acessível para LLMs. Seus recursos incluem ferramentas para modelagem e encadeamento de prompts. Essas cadeias podem ser usadas para resumir documentos de texto que são mais longos do que o modelo de linguagem suporta em uma única chamada. Você pode usar uma estratégia de redução de mapa para resumir documentos longos, dividindo-os em partes gerenciáveis, resumindo-os e combinando-os (e resumindo-os novamente, se necessário).

Vamos instalar o LangChain para começar:

%pip install langchain

Importe os módulos relevantes e divida o documento longo em partes:

import langchain
from langchain import SagemakerEndpoint, PromptTemplate
from langchain.llms.sagemaker_endpoint import LLMContentHandler
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document text_splitter = RecursiveCharacterTextSplitter( chunk_size = 500, chunk_overlap = 20, separators = [" "], length_function = len )
input_documents = text_splitter.create_documents([text_to_summarize])

Para fazer o LangChain funcionar de maneira eficaz com o Falcon, você precisa definir as classes de manipulador de conteúdo padrão para entrada e saída válidas:

class ContentHandlerTextSummarization(LLMContentHandler): content_type = "application/json" accepts = "application/json" def transform_input(self, prompt: str, model_kwargs={}) -> bytes: input_str = json.dumps({"inputs": prompt, **model_kwargs}) return input_str.encode("utf-8") def transform_output(self, output: bytes) -> json: response_json = json.loads(output.read().decode("utf-8")) generated_text = response_json[0]['generated_text'] return generated_text.split("summary:")[-1] content_handler = ContentHandlerTextSummarization()

Você pode definir prompts personalizados como PromptTemplate objetos, o principal veículo de prompt com LangChain, para a abordagem de resumo de redução de mapa. Esta é uma etapa opcional porque os prompts de mapeamento e combinação são fornecidos por padrão se os parâmetros na chamada para carregar a cadeia de resumo (load_summarize_chain) são indefinidos.

map_prompt = """Write a concise summary of this text in a few complete sentences: {text} Concise summary:""" map_prompt_template = PromptTemplate( template=map_prompt, input_variables=["text"] ) combine_prompt = """Combine all these following summaries and generate a final summary of them in a few complete sentences: {text} Final summary:""" combine_prompt_template = PromptTemplate( template=combine_prompt, input_variables=["text"] )

LangChain oferece suporte a LLMs hospedados em endpoints de inferência do SageMaker, portanto, em vez de usar o AWS Python SDK, você pode inicializar a conexão por meio do LangChain para maior acessibilidade:

summary_model = SagemakerEndpoint( endpoint_name = endpoint_name, region_name= "us-east-1", model_kwargs= {}, content_handler=content_handler )

Finalmente, você pode carregar uma cadeia de resumo e executar um resumo nos documentos de entrada usando o seguinte código:

summary_chain = load_summarize_chain(llm=summary_model, chain_type="map_reduce", map_prompt=map_prompt_template, combine_prompt=combine_prompt_template, verbose=True ) summary = summary_chain({"input_documents": input_documents, 'token_max': 700}, return_only_outputs=True)
print(summary["output_text"])

Porque o verbose parâmetro está definido como True, você verá todos os resultados intermediários da abordagem de redução de mapa. Isto é útil para seguir a sequência de eventos para chegar a um resumo final. Com essa abordagem de redução de mapa, você pode resumir documentos de maneira eficaz por muito mais tempo do que normalmente é permitido pelo limite máximo de tokens de entrada do modelo.

limpar

Depois de terminar de usar o endpoint de inferência, é importante excluí-lo para evitar incorrer em custos desnecessários por meio das seguintes linhas de código:

client = boto3.client('runtime.sagemaker')
client.delete_endpoint(EndpointName=endpoint_name)

Usando outros modelos de base no SageMaker JumpStart

A utilização de outros modelos básicos disponíveis no SageMaker JumpStart para resumo de documentos requer sobrecarga mínima para configuração e implantação. Ocasionalmente, os LLMs variam de acordo com a estrutura dos formatos de entrada e saída e, à medida que novos modelos e soluções pré-fabricadas são adicionados ao SageMaker JumpStart, dependendo da implementação da tarefa, pode ser necessário fazer as seguintes alterações no código:

Se você estiver executando a compactação por meio do summarize() método (o método sem usar LangChain), pode ser necessário alterar a estrutura JSON do payload parâmetro, bem como o tratamento da variável de resposta no query_endpoint() função
Se você estiver realizando um resumo via LangChain's load_summarize_chain() método, talvez seja necessário modificar o ContentHandlerTextSummarization classe, especificamente o transform_input() e transform_output() funções, para lidar corretamente com a carga útil que o LLM espera e a saída que o LLM retorna

Os modelos básicos variam não apenas em fatores como velocidade e qualidade de inferência, mas também em formatos de entrada e saída. Consulte a página de informações relevantes do LLM sobre entradas e saídas esperadas.

Conclusão

O modelo Falcon 7B Instruct está disponível no hub do modelo SageMaker JumpStart e funciona em vários casos de uso. Esta postagem demonstrou como você pode implantar seu próprio endpoint Falcon LLM em seu ambiente usando o SageMaker JumpStart e fazer seus primeiros experimentos no SageMaker Studio, permitindo que você crie protótipos rapidamente de seus modelos e faça uma transição perfeita para um ambiente de produção. Com Falcon e LangChain, você pode resumir com eficácia documentos extensos de saúde e ciências biológicas em grande escala.

Para obter mais informações sobre como trabalhar com IA generativa na AWS, consulte Anunciando novas ferramentas para criar com IA generativa na AWS. Você pode começar a experimentar e criar provas de conceito de resumo de documentos para seus aplicativos GenAI orientados para saúde e ciências biológicas usando o método descrito nesta postagem. Quando Rocha Amazônica estiver disponível para o público geral, publicaremos uma postagem de acompanhamento mostrando como você pode implementar o resumo de documentos usando Amazon Bedrock e LangChain.

Sobre os autores

Crie um aplicativo de resumo de documentos HCLS com Falcon usando Amazon SageMaker JumpStart | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai. John Kitaoka é arquiteto de soluções na Amazon Web Services. John ajuda os clientes a projetar e otimizar cargas de trabalho de IA/ML na AWS para ajudá-los a atingir suas metas de negócios.

Crie um aplicativo de resumo de documentos HCLS com Falcon usando Amazon SageMaker JumpStart | Inteligência de dados PlatoBlockchain da Amazon Web Services. Pesquisa vertical. Ai. Josh Famestad é arquiteto de soluções na Amazon Web Services. Josh trabalha com clientes do setor público para criar e executar abordagens baseadas em nuvem para atender às prioridades de negócios.

Conteúdo com tecnologia de SEO e distribuição de relações públicas. Seja amplificado hoje.
PlatoData.Network Gerativa Vertical Ai. Capacite-se. Acesse aqui.
PlatoAiStream. Inteligência Web3. Conhecimento Amplificado. Acesse aqui.
PlatãoESG. Carbono Tecnologia Limpa, Energia, Ambiente, Solar, Gestão de resíduos. Acesse aqui.
PlatoHealth. Inteligência em Biotecnologia e Ensaios Clínicos. Acesse aqui.
Fonte: https://aws.amazon.com/blogs/machine-learning/create-an-hcls-document-summarization-application-with-falcon-using-amazon-sagemaker-jumpstart/

Carimbo de hora: 4 de outubro de 2023

Carimbo de hora: Junho 29, 2023

Crie um aplicativo de resumo de documentos HCLS com Falcon usando Amazon SageMaker JumpStart | Amazon Web Services

Republicado por Platão

Visão geral da solução

Pré-requisitos

Implante o Falcon 7B usando o SageMaker JumpStart

Execute sua primeira consulta

Consulta com um prompt de resumo

Importe e execute uma cadeia de resumo

limpar

Usando outros modelos de base no SageMaker JumpStart

Conclusão

Sobre os autores

Mais de Aprendizado de máquina da AWS

Crie dados de alta qualidade para modelos de ML com o Amazon SageMaker Ground Truth

Integre Amazon Lex e plataforma humana digital da Uneeq

Design de funções modulares para Advanced Driver Assistance Systems (ADAS) na AWS

Desenvolvendo sistemas avançados de aprendizado de máquina na Trumid com a Deep Graph Library for Knowledge Embedding

AWS oferece novos guias de inteligência artificial, aprendizado de máquina e IA generativa para planejar sua estratégia de IA | Amazon Web Services

Sobre Nós

Pesquisa vertical e IA

Plataforma

Fique Ligado

Conta