Opprett en HCLS-dokumentoppsummeringsapplikasjon med Falcon ved å bruke Amazon SageMaker JumpStart

Publisert av Platon

Følgere: 0

Healthcare and life sciences (HCLS)-kunder tar i bruk generativ AI som et verktøy for å få mer ut av dataene sine. Brukstilfeller inkluderer dokumentoppsummering for å hjelpe lesere med å fokusere på nøkkelpunkter i et dokument og transformere ustrukturert tekst til standardiserte formater for å fremheve viktige egenskaper. Med unike dataformater og strenge regulatoriske krav, leter kunder etter valg for å velge den mest effektive og kostnadseffektive modellen, samt muligheten til å utføre nødvendig tilpasning (finjustering) for å passe deres forretningsbruk. I dette innlegget leder vi deg gjennom distribusjon av en Falcon Large Language Model (LLM) ved hjelp av Amazon SageMaker JumpStart og bruke modellen til å oppsummere lange dokumenter med LangChain og Python.

Løsningsoversikt

Amazon SageMaker er bygget på Amazons to tiår med erfaring med å utvikle virkelige ML-applikasjoner, inkludert produktanbefalinger, personalisering, intelligent shopping, robotikk og stemmeassisterte enheter. SageMaker er en HIPAA-kvalifisert administrert tjeneste som gir verktøy som gjør det mulig for dataforskere, ML-ingeniører og forretningsanalytikere å innovere med ML. Innen SageMaker er Amazon SageMaker Studio, et integrert utviklingsmiljø (IDE) spesialbygd for samarbeidende ML-arbeidsflyter, som igjen inneholder et bredt utvalg av hurtigstartløsninger og forhåndstrente ML-modeller i en integrert hub kalt SageMaker JumpStart. Med SageMaker JumpStart kan du bruke ferdigtrente modeller, for eksempel Falcon LLM, med forhåndsbygde eksempelnotatbøker og SDK-støtte for å eksperimentere med og distribuere disse kraftige transformatormodellene. Du kan bruke SageMaker Studio og SageMaker JumpStart til å distribuere og spørre etter din egen generative modell i AWS-kontoen din.

Du kan også sikre at slutningsdataene for nyttelast ikke forlater VPC-en din. Du kan klargjøre modeller som endepunkter med én leietaker og distribuere dem med nettverksisolasjon. Videre kan du kurere og administrere det valgte settet med modeller som tilfredsstiller dine egne sikkerhetskrav ved å bruke den private modellhub-funksjonen i SageMaker JumpStart og lagre de godkjente modellene der. SageMaker er i omfang for HIPAA BAA, SOC123og HITRUST CSF.

De Falcon LLM er en stor språkmodell, trent av forskere ved Technology Innovation Institute (TII) på over 1 billion tokens ved hjelp av AWS. Falcon har mange forskjellige variasjoner, med sine to hovedbestanddeler Falcon 40B og Falcon 7B, bestående av henholdsvis 40 milliarder og 7 milliarder parametere, med finjusterte versjoner som er trent for spesifikke oppgaver, for eksempel å følge instruksjoner. Falcon presterer godt på en rekke oppgaver, inkludert tekstoppsummering, sentimentanalyse, svar på spørsmål og samtale. Dette innlegget gir en gjennomgang som du kan følge for å distribuere Falcon LLM til AWS-kontoen din, ved å bruke en administrert notatbokforekomst gjennom SageMaker JumpStart for å eksperimentere med tekstoppsummering.

SageMaker JumpStart-modellhuben inkluderer komplette bærbare datamaskiner for å distribuere og spørre hver modell. Når dette skrives, er det seks versjoner av Falcon tilgjengelig i SageMaker JumpStart-modellhuben: Falcon 40B Instruct BF16, Falcon 40B BF16, Falcon 180B BF16, Falcon 180B Chat BF16, Falcon 7B Instruct BF16 og Falcon 7B B. Dette innlegget bruker Falcon 16B Instruct-modellen.

I de følgende delene viser vi hvordan du kommer i gang med dokumentoppsummering ved å distribuere Falcon 7B på SageMaker Jumpstart.

Forutsetninger

For denne opplæringen trenger du en AWS-konto med et SageMaker-domene. Hvis du ikke allerede har et SageMaker-domene, se Ombord på Amazon SageMaker Domain å lage en.

Distribuer Falcon 7B ved hjelp av SageMaker JumpStart

For å distribuere modellen, fullfør følgende trinn:

Naviger til SageMaker Studio-miljøet fra SageMaker-konsollen.
Innenfor IDE, under SageMaker JumpStart Velg navigasjonsruten Modeller, notatbøker, løsninger.
Distribuer Falcon 7B Instruct-modellen til et endepunkt for slutning.

Dette vil åpne modellkortet for Falcon 7B Instruct BF16-modellen. På denne siden finner du Distribuer or Tog alternativer samt lenker for å åpne prøvenotatbøkene i SageMaker Studio. Dette innlegget vil bruke eksempelnotisboken fra SageMaker JumpStart for å distribuere modellen.

Velg Åpne notatboken.

Kjør de fire første cellene i den bærbare datamaskinen for å distribuere Falcon 7B Instruct-endepunktet.

Du kan se dine utplasserte JumpStart-modeller på Lanserte JumpStart-ressurser side.

I navigasjonsruten under SageMaker Jumpstart, velg Lanserte JumpStart-ressurser.
Velg Modellens endepunkter for å se statusen til endepunktet ditt.

Med Falcon LLM-endepunktet utplassert, er du klar til å spørre etter modellen.

Kjør din første spørring

For å kjøre en spørring, fullfør følgende trinn:

På filet meny, velg Ny og bærbare for å åpne en ny notisbok.

Du kan også laste ned den ferdige notatboken her..

Velg bildet, kjernen og forekomsttypen når du blir bedt om det. For dette innlegget velger vi Data Science 3.0-bildet, Python 3-kjernen og ml.t3.medium-forekomsten.

Importer Boto3- og JSON-modulene ved å skrive inn følgende to linjer i den første cellen:

import json
import boto3

Press Skift + Enter å kjøre cellen.
Deretter kan du definere en funksjon som kaller endepunktet ditt. Denne funksjonen tar en ordboknyttelast og bruker den til å starte SageMaker runtime-klient. Deretter deserialiserer den responsen og skriver ut input og generert tekst.

newline, bold, unbold = 'n', '33[1m', '33[0m'
endpoint_name = 'ENDPOINT_NAME' def query_endpoint(payload): client = boto3.client('runtime.sagemaker') response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/json', Body=json.dumps(payload).encode('utf-8')) model_predictions = json.loads(response['Body'].read()) generated_text = model_predictions[0]['generated_text'] print ( f"Input Text: {payload['inputs']}{newline}" f"Generated Text: {bold}{generated_text}{unbold}{newline}")

Nyttelasten inkluderer ledeteksten som innganger, sammen med slutningsparametrene som sendes til modellen.

Du kan bruke disse parameterne med ledeteksten for å justere utdataene til modellen for ditt bruksområde:

payload = { "inputs": "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", "parameters":{ "max_new_tokens": 50, "return_full_text": False, "do_sample": True, "top_k":10 }
}

Spørring med en oppsummeringsprompt

Dette innlegget bruker en prøveoppgave for å demonstrere oppsummering. Eksempeltekstfilen handler om automatisk tekstoppsummering i biomedisinsk litteratur. Fullfør følgende trinn:

Last ned PDF-filen og kopier teksten til en fil med navn document.txt.
I SageMaker Studio velger du opplastingsikonet og laster opp filen til SageMaker Studio-forekomsten.

Laster opp fil til SageMaker Studio

Ut av esken gir Falcon LLM støtte for tekstoppsummering.

La oss lage en funksjon som bruker raske ingeniørteknikker for å oppsummere document.txt:

def summarize(text_to_summarize): summarization_prompt = """Process the following text and then perform the instructions that follow: {text_to_summarize} Provide a short summary of the preceeding text. Summary:""" payload = { "inputs": summarization_prompt, "parameters":{ "max_new_tokens": 150, "return_full_text": False, "do_sample": True, "top_k":10 } } response = query_endpoint(payload) print(response) with open("document.txt") as f: text_to_summarize = f.read() summarize(text_to_summarize)

Du vil legge merke til at for lengre dokumenter vises en feil – Falcon har, sammen med alle andre LLM-er, en grense på antall tokens som sendes som input. Vi kan komme rundt denne grensen ved å bruke LangChains forbedrede oppsummeringsfunksjoner, som gjør at mye større input kan sendes til LLM.

Importer og kjør en oppsummeringskjede

LangChain er et åpen kildekode-programvarebibliotek som lar utviklere og dataforskere raskt bygge, justere og distribuere tilpassede generative applikasjoner uten å administrere komplekse ML-interaksjoner, ofte brukt til å abstrahere mange av de vanlige brukstilfellene for generative AI-språkmodeller på bare noen få linjer med kode. LangChains støtte for AWS-tjenester inkluderer støtte for SageMaker-endepunkter.

LangChain gir et tilgjengelig grensesnitt til LLM-er. Funksjonene inkluderer verktøy for rask maling og rask kjeding. Disse kjedene kan brukes til å oppsummere tekstdokumenter som er lengre enn hva språkmodellen støtter i en enkelt samtale. Du kan bruke en kartreduksjonsstrategi for å oppsummere lange dokumenter ved å dele dem opp i håndterbare biter, oppsummere dem og kombinere dem (og oppsummere igjen, hvis nødvendig).

La oss installere LangChain for å begynne:

%pip install langchain

Importer de relevante modulene og del ned det lange dokumentet i biter:

import langchain
from langchain import SagemakerEndpoint, PromptTemplate
from langchain.llms.sagemaker_endpoint import LLMContentHandler
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document text_splitter = RecursiveCharacterTextSplitter( chunk_size = 500, chunk_overlap = 20, separators = [" "], length_function = len )
input_documents = text_splitter.create_documents([text_to_summarize])

For å få LangChain til å fungere effektivt med Falcon, må du definere standard innholdsbehandlerklassene for gyldig input og output:

class ContentHandlerTextSummarization(LLMContentHandler): content_type = "application/json" accepts = "application/json" def transform_input(self, prompt: str, model_kwargs={}) -> bytes: input_str = json.dumps({"inputs": prompt, **model_kwargs}) return input_str.encode("utf-8") def transform_output(self, output: bytes) -> json: response_json = json.loads(output.read().decode("utf-8")) generated_text = response_json[0]['generated_text'] return generated_text.split("summary:")[-1] content_handler = ContentHandlerTextSummarization()

Du kan definere egendefinerte ledetekster som PromptTemplate objekter, hovedredskapet for spørring med LangChain, for tilnærmingen til kartreduser oppsummering. Dette er et valgfritt trinn fordi kartleggings- og kombineringsforespørsler leveres som standard hvis parametrene i kallet for å laste oppsummeringskjeden (load_summarize_chain) er udefinerte.

map_prompt = """Write a concise summary of this text in a few complete sentences: {text} Concise summary:""" map_prompt_template = PromptTemplate( template=map_prompt, input_variables=["text"] ) combine_prompt = """Combine all these following summaries and generate a final summary of them in a few complete sentences: {text} Final summary:""" combine_prompt_template = PromptTemplate( template=combine_prompt, input_variables=["text"] )

LangChain støtter LLM-er som er vert på SageMaker inferensendepunkter, så i stedet for å bruke AWS Python SDK, kan du initialisere forbindelsen gjennom LangChain for større tilgjengelighet:

summary_model = SagemakerEndpoint( endpoint_name = endpoint_name, region_name= "us-east-1", model_kwargs= {}, content_handler=content_handler )

Til slutt kan du laste inn en oppsummeringskjede og kjøre et sammendrag på inndatadokumentene ved å bruke følgende kode:

summary_chain = load_summarize_chain(llm=summary_model, chain_type="map_reduce", map_prompt=map_prompt_template, combine_prompt=combine_prompt_template, verbose=True ) summary = summary_chain({"input_documents": input_documents, 'token_max': 700}, return_only_outputs=True)
print(summary["output_text"])

Fordi verbose parameter er satt til True, vil du se alle de mellomliggende utgangene til kartreduksjonsmetoden. Dette er nyttig for å følge hendelsesforløpet for å komme frem til et endelig sammendrag. Med denne kartreduserende tilnærmingen kan du effektivt oppsummere dokumenter mye lenger enn det som normalt er tillatt av modellens maksimale inndatatokengrense.

Rydd opp

Etter at du er ferdig med å bruke slutningsendepunktet, er det viktig å slette det for å unngå å pådra deg unødvendige kostnader gjennom følgende kodelinjer:

client = boto3.client('runtime.sagemaker')
client.delete_endpoint(EndpointName=endpoint_name)

Bruker andre fundamentmodeller i SageMaker JumpStart

Bruk av andre grunnlagsmodeller som er tilgjengelige i SageMaker JumpStart for dokumentoppsummering krever minimale overhead å sette opp og distribuere. LLM-er varierer av og til med strukturen til input- og outputformater, og ettersom nye modeller og ferdiglagde løsninger legges til SageMaker JumpStart, avhengig av oppgaveimplementeringen, må du kanskje gjøre følgende kodeendringer:

Hvis du utfører oppsummering via summarize() metoden (metoden uten å bruke LangChain), må du kanskje endre JSON-strukturen til payload parameter, samt håndtering av responsvariabelen i query_endpoint() funksjon
Hvis du utfører oppsummering via LangChain's load_summarize_chain() metoden må du kanskje endre ContentHandlerTextSummarization klasse, spesielt transform_input() og transform_output() funksjoner, for å håndtere nyttelasten som LLM forventer og utdataene LLM returnerer

Grunnmodeller varierer ikke bare i faktorer som inferenshastighet og kvalitet, men også input- og outputformater. Se LLMs relevante informasjonsside om forventet input og output.

konklusjonen

Falcon 7B Instruct-modellen er tilgjengelig på SageMaker JumpStart-modellhuben og fungerer på en rekke bruksområder. Dette innlegget demonstrerte hvordan du kan distribuere ditt eget Falcon LLM-endepunkt i miljøet ditt ved å bruke SageMaker JumpStart og gjøre dine første eksperimenter fra SageMaker Studio, slik at du raskt kan prototype modellene dine og sømløs gå over til et produksjonsmiljø. Med Falcon og LangChain kan du effektivt oppsummere langformede helse- og biovitenskapsdokumenter i stor skala.

For mer informasjon om arbeid med generativ AI på AWS, se Annonserer nye verktøy for bygging med generativ AI på AWS. Du kan begynne å eksperimentere og bygge dokumentoppsummeringsbevis for konseptet for dine helse- og livsvitenskapsorienterte GenAI-applikasjoner ved å bruke metoden som er skissert i dette innlegget. Når Amazonas grunnfjell er generelt tilgjengelig, vil vi publisere et oppfølgende innlegg som viser hvordan du kan implementere dokumentoppsummering ved hjelp av Amazon Bedrock og LangChain.

Om forfatterne

Opprett en HCLS dokumentoppsummeringsapplikasjon med Falcon ved å bruke Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. John Kitaoka er løsningsarkitekt hos Amazon Web Services. John hjelper kunder med å designe og optimalisere AI/ML-arbeidsbelastninger på AWS for å hjelpe dem med å nå forretningsmålene sine.

Opprett en HCLS dokumentoppsummeringsapplikasjon med Falcon ved å bruke Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Josh Famestad er løsningsarkitekt hos Amazon Web Services. Josh jobber med offentlige kunder for å bygge og utføre skybaserte tilnærminger for å levere på forretningsprioriteringer.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/create-an-hcls-document-summarization-application-with-falcon-using-amazon-sagemaker-jumpstart/

Tidstempel: Oktober 4, 2023

Tidstempel: Juni 29, 2023

Opprett en HCLS dokumentoppsummeringsapplikasjon med Falcon ved å bruke Amazon SageMaker JumpStart | Amazon Web Services

Publisert av Platon

Løsningsoversikt

Forutsetninger

Distribuer Falcon 7B ved hjelp av SageMaker JumpStart

Kjør din første spørring

Spørring med en oppsummeringsprompt

Importer og kjør en oppsummeringskjede

Rydd opp

Bruker andre fundamentmodeller i SageMaker JumpStart

konklusjonen

Om forfatterne

Mer fra AWS maskinlæring

Lag data av høy kvalitet for ML-modeller med Amazon SageMaker Ground Truth

Integrer Amazon Lex og Uneeqs digitale menneskelige plattform

Modulær funksjonsdesign for Advanced Driver Assistance Systems (ADAS) på AWS

Utvikler avanserte maskinlæringssystemer hos Trumid med Deep Graph Library for Knowledge Embedding

AWS tilbyr ny kunstig intelligens, maskinlæring og generative AI-guider for å planlegge AI-strategien din | Amazon Web Services

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn