Skapa en HCLS-dokumentsammanfattningsapplikation med Falcon med Amazon SageMaker JumpStart

Återutgiven av Platon

anhängare: 0

Kunder inom hälsovård och biovetenskap (HCLS) använder generativ AI som ett verktyg för att få ut mer av sin data. Användningsfall inkluderar dokumentsammanfattningar för att hjälpa läsarna att fokusera på viktiga punkter i ett dokument och omvandla ostrukturerad text till standardiserade format för att framhäva viktiga attribut. Med unika dataformat och strikta regulatoriska krav letar kunderna efter val för att välja den mest prestanda och kostnadseffektiva modellen, samt möjligheten att utföra nödvändig anpassning (finjustering) för att passa deras affärsanvändning. I det här inlägget går vi igenom hur du implementerar en Falcon Large Language Model (LLM) med hjälp av Amazon SageMaker JumpStart och använda modellen för att sammanfatta långa dokument med LangChain och Python.

Lösningsöversikt

Amazon SageMaker bygger på Amazons två decenniers erfarenhet av att utveckla verkliga ML-applikationer, inklusive produktrekommendationer, personalisering, intelligent shopping, robotteknik och röstassisterade enheter. SageMaker är en HIPAA-godkänd hanterad tjänst som tillhandahåller verktyg som gör det möjligt för datavetare, ML-ingenjörer och affärsanalytiker att förnya med ML. Inom SageMaker är Amazon SageMaker Studio, en integrerad utvecklingsmiljö (IDE) specialbyggd för kollaborativa ML-arbetsflöden, som i sin tur innehåller ett brett utbud av snabbstartslösningar och förutbildade ML-modeller i en integrerad hubb som heter SageMaker JumpStart. Med SageMaker JumpStart kan du använda förtränade modeller, som Falcon LLM, med förbyggda exempel på bärbara datorer och SDK-stöd för att experimentera med och distribuera dessa kraftfulla transformatormodeller. Du kan använda SageMaker Studio och SageMaker JumpStart för att distribuera och fråga efter din egen generativa modell i ditt AWS-konto.

Du kan också se till att slutsatsens nyttolastdata inte lämnar din VPC. Du kan tillhandahålla modeller som slutpunkter för en enda klient och distribuera dem med nätverksisolering. Dessutom kan du kurera och hantera den utvalda uppsättningen modeller som uppfyller dina egna säkerhetskrav genom att använda den privata modellhubbens kapacitet inom SageMaker JumpStart och lagra de godkända modellerna där. SageMaker är i utrymme för HIPAA BAA, SOC123och HITRUST CSF.

Smakämnen Falcon LLM är en stor språkmodell, utbildad av forskare vid Technology Innovation Institute (TII) på över 1 biljon tokens med hjälp av AWS. Falcon har många olika varianter, med sina två huvudbeståndsdelar Falcon 40B och Falcon 7B, bestående av 40 miljarder respektive 7 miljarder parametrar, med finjusterade versioner tränade för specifika uppgifter, som att följa instruktioner. Falcon presterar bra på en mängd olika uppgifter, inklusive textsammanfattning, sentimentanalys, svar på frågor och konversation. Det här inlägget ger en genomgång som du kan följa för att distribuera Falcon LLM till ditt AWS-konto, med hjälp av en hanterad anteckningsbok-instans via SageMaker JumpStart för att experimentera med textsammanfattning.

SageMaker JumpStart modellnavet innehåller kompletta bärbara datorer för att distribuera och fråga varje modell. När detta skrivs finns det sex versioner av Falcon tillgängliga i SageMaker JumpStart modellnavet: Falcon 40B Instruct BF16, Falcon 40B BF16, Falcon 180B BF16, Falcon 180B Chat BF16, Falcon 7B Instruct BF16 och Falcon 7B B. Det här inlägget använder Falcon 16B Instruct-modellen.

I följande avsnitt visar vi hur du kommer igång med dokumentsammanfattning genom att distribuera Falcon 7B på SageMaker Jumpstart.

Förutsättningar

För den här handledningen behöver du ett AWS-konto med en SageMaker-domän. Om du inte redan har en SageMaker-domän, se Ombord på Amazon SageMaker Domain att skapa en.

Distribuera Falcon 7B med SageMaker JumpStart

Utför följande steg för att distribuera din modell:

Navigera till din SageMaker Studio-miljö från SageMaker-konsolen.
Inom IDE, under SageMaker JumpStart välj i navigeringsfönstret Modeller, anteckningsböcker, lösningar.
Distribuera Falcon 7B Instruct-modellen till en slutpunkt för slutledning.

Detta öppnar modellkortet för Falcon 7B Instruct BF16-modellen. På den här sidan kan du hitta Distribuera or Tåg alternativ samt länkar för att öppna provanteckningsböckerna i SageMaker Studio. Det här inlägget kommer att använda exempelanteckningsboken från SageMaker JumpStart för att distribuera modellen.

Välja Öppna anteckningsboken.

Kör de första fyra cellerna i notebook-datorn för att distribuera Falcon 7B Instruct-slutpunkten.

Du kan se dina utplacerade JumpStart-modeller på Lanserade JumpStart-tillgångar sida.

I navigeringsfönstret, under SageMaker Jumpstartväljer Lanserade JumpStart-tillgångar.
Välj Modellens slutpunkter fliken för att se status för din slutpunkt.

Med Falcon LLM-slutpunkten utplacerad är du redo att fråga efter modellen.

Kör din första fråga

Utför följande steg för att köra en fråga:

På Fil meny, välj Nya och Notebook för att öppna en ny anteckningsbok.

Du kan också ladda ner den färdiga anteckningsboken här..

Välj bild, kärna och instanstyp när du uppmanas. För det här inlägget väljer vi Data Science 3.0-bilden, Python 3-kärnan och ml.t3.medium-instansen.

Importera Boto3- och JSON-modulerna genom att ange följande två rader i den första cellen:

import json
import boto3

Presse Skift + Ange att köra cellen.
Därefter kan du definiera en funktion som anropar din slutpunkt. Den här funktionen tar en ordboknyttolast och använder den för att anropa SageMaker runtime-klient. Sedan deserialiserar den svaret och skriver ut inmatningen och den genererade texten.

newline, bold, unbold = 'n', '33[1m', '33[0m'
endpoint_name = 'ENDPOINT_NAME' def query_endpoint(payload): client = boto3.client('runtime.sagemaker') response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/json', Body=json.dumps(payload).encode('utf-8')) model_predictions = json.loads(response['Body'].read()) generated_text = model_predictions[0]['generated_text'] print ( f"Input Text: {payload['inputs']}{newline}" f"Generated Text: {bold}{generated_text}{unbold}{newline}")

Nyttolasten inkluderar prompten som indata, tillsammans med inferensparametrarna som kommer att skickas till modellen.

Du kan använda dessa parametrar med uppmaningen för att ställa in modellens utdata för ditt användningsfall:

payload = { "inputs": "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", "parameters":{ "max_new_tokens": 50, "return_full_text": False, "do_sample": True, "top_k":10 }
}

Fråga med en summeringsuppmaning

Det här inlägget använder ett exempel på forskningsrapport för att visa sammanfattning. Exempeltextfilen handlar om automatisk textsammanfattning i biomedicinsk litteratur. Slutför följande steg:

Download PDF-filen och kopiera texten till en fil med namnet document.txt.
I SageMaker Studio, välj uppladdningsikonen och ladda upp filen till din SageMaker Studio-instans.

Laddar upp fil till SageMaker Studio

Out of the box ger Falcon LLM stöd för textsammanfattning.

Låt oss skapa en funktion som använder snabba ingenjörstekniker för att sammanfatta document.txt:

def summarize(text_to_summarize): summarization_prompt = """Process the following text and then perform the instructions that follow: {text_to_summarize} Provide a short summary of the preceeding text. Summary:""" payload = { "inputs": summarization_prompt, "parameters":{ "max_new_tokens": 150, "return_full_text": False, "do_sample": True, "top_k":10 } } response = query_endpoint(payload) print(response) with open("document.txt") as f: text_to_summarize = f.read() summarize(text_to_summarize)

Du kommer att märka att för längre dokument visas ett fel—Falcon har, tillsammans med alla andra LLM:er, en gräns för antalet tokens som skickas som indata. Vi kan komma runt denna gräns genom att använda LangChains förbättrade sammanfattningsmöjligheter, vilket gör att en mycket större input kan skickas till LLM.

Importera och kör en sammanfattningskedja

LangChain är ett mjukvarubibliotek med öppen källkod som gör det möjligt för utvecklare och datavetare att snabbt bygga, ställa in och distribuera anpassade generativa applikationer utan att hantera komplexa ML-interaktioner, som vanligtvis används för att abstrahera många av de vanliga användningsfallen för generativa AI-språkmodeller på bara ett fåtal kodrader. LangChains stöd för AWS-tjänster inkluderar stöd för SageMaker-ändpunkter.

LangChain tillhandahåller ett tillgängligt gränssnitt för LLM:er. Dess funktioner inkluderar verktyg för snabb mallbildning och snabbkedja. Dessa kedjor kan användas för att sammanfatta textdokument som är längre än vad språkmodellen stödjer i ett enda samtal. Du kan använda en kartreduceringsstrategi för att sammanfatta långa dokument genom att dela upp dem i hanterbara bitar, sammanfatta dem och kombinera dem (och sammanfatta igen om det behövs).

Låt oss installera LangChain för att börja:

%pip install langchain

Importera relevanta moduler och dela upp det långa dokumentet i bitar:

import langchain
from langchain import SagemakerEndpoint, PromptTemplate
from langchain.llms.sagemaker_endpoint import LLMContentHandler
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document text_splitter = RecursiveCharacterTextSplitter( chunk_size = 500, chunk_overlap = 20, separators = [" "], length_function = len )
input_documents = text_splitter.create_documents([text_to_summarize])

För att få LangChain att fungera effektivt med Falcon måste du definiera standardinnehållshanterarklasserna för giltig input och output:

class ContentHandlerTextSummarization(LLMContentHandler): content_type = "application/json" accepts = "application/json" def transform_input(self, prompt: str, model_kwargs={}) -> bytes: input_str = json.dumps({"inputs": prompt, **model_kwargs}) return input_str.encode("utf-8") def transform_output(self, output: bytes) -> json: response_json = json.loads(output.read().decode("utf-8")) generated_text = response_json[0]['generated_text'] return generated_text.split("summary:")[-1] content_handler = ContentHandlerTextSummarization()

Du kan definiera anpassade uppmaningar som PromptTemplate objekt, det huvudsakliga verktyget för prompt med LangChain, för kartreducerande sammanfattningsmetod. Det här är ett valfritt steg eftersom mappnings- och kombinationsuppmaningar tillhandahålls som standard om parametrarna i anropet för att ladda summeringskedjan (load_summarize_chain) är odefinierade.

map_prompt = """Write a concise summary of this text in a few complete sentences: {text} Concise summary:""" map_prompt_template = PromptTemplate( template=map_prompt, input_variables=["text"] ) combine_prompt = """Combine all these following summaries and generate a final summary of them in a few complete sentences: {text} Final summary:""" combine_prompt_template = PromptTemplate( template=combine_prompt, input_variables=["text"] )

LangChain stöder LLM:er som finns på SageMaker slutpunkter, så istället för att använda AWS Python SDK kan du initiera anslutningen via LangChain för större tillgänglighet:

summary_model = SagemakerEndpoint( endpoint_name = endpoint_name, region_name= "us-east-1", model_kwargs= {}, content_handler=content_handler )

Slutligen kan du ladda i en sammanfattningskedja och köra en sammanfattning på inmatningsdokumenten med hjälp av följande kod:

summary_chain = load_summarize_chain(llm=summary_model, chain_type="map_reduce", map_prompt=map_prompt_template, combine_prompt=combine_prompt_template, verbose=True ) summary = summary_chain({"input_documents": input_documents, 'token_max': 700}, return_only_outputs=True)
print(summary["output_text"])

Eftersom den verbose parameter är inställd på True, kommer du att se alla mellanliggande utgångar för kartreduceringsmetoden. Detta är användbart för att följa händelseförloppet för att komma fram till en slutlig sammanfattning. Med denna kartminskningsmetod kan du effektivt sammanfatta dokument mycket längre än vad som normalt tillåts av modellens maximala indatatokengräns.

Städa upp

När du har slutat använda slutpunktens slutpunkt är det viktigt att ta bort den för att undvika onödiga kostnader genom följande kodrader:

client = boto3.client('runtime.sagemaker')
client.delete_endpoint(EndpointName=endpoint_name)

Använder andra grundmodeller i SageMaker JumpStart

Att använda andra grundmodeller som finns tillgängliga i SageMaker JumpStart för dokumentsammanfattning kräver minimala kostnader för att installera och distribuera. LLM:er varierar ibland med strukturen för inmatnings- och utdataformat, och eftersom nya modeller och färdiga lösningar läggs till i SageMaker JumpStart, beroende på uppgiftsimplementeringen, kan du behöva göra följande kodändringar:

Om du utför en sammanfattning via summarize() metod (metoden utan att använda LangChain), kan du behöva ändra JSON-strukturen för payload parameter, samt hanteringen av svarsvariabeln i query_endpoint() fungera
Om du utför summering via LangChain's load_summarize_chain() metod kan du behöva ändra ContentHandlerTextSummarization klass, närmare bestämt transform_input() och transform_output() funktioner, för att korrekt hantera nyttolasten som LLM förväntar sig och utdata som LLM returnerar

Grundmodeller varierar inte bara i faktorer som slutledningshastighet och kvalitet, utan även inmatnings- och utdataformat. Se LLM:s relevanta informationssida om förväntad input och output.

Slutsats

Falcon 7B Instruct-modellen är tillgänglig på SageMaker JumpStart modellnavet och fungerar på ett antal användningsfall. Det här inlägget visade hur du kan distribuera din egen Falcon LLM-slutpunkt i din miljö med SageMaker JumpStart och göra dina första experiment från SageMaker Studio, så att du snabbt kan prototyper av dina modeller och sömlöst gå över till en produktionsmiljö. Med Falcon och LangChain kan du effektivt sammanfatta långformade vård- och biovetenskapsdokument i stor skala.

För mer information om att arbeta med generativ AI på AWS, se Tillkännager nya verktyg för att bygga med generativ AI på AWS. Du kan börja experimentera och bygga dokumentsammanfattningsbevis för dina sjukvårds- och biovetenskapsorienterade GenAI-applikationer med den metod som beskrivs i det här inlägget. När Amazonas berggrund är allmänt tillgänglig kommer vi att publicera ett uppföljningsinlägg som visar hur du kan implementera dokumentsammanfattning med Amazon Bedrock och LangChain.

Om författarna

Skapa ett HCLS dokumentsammanfattningsprogram med Falcon med Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikal sökning. Ai. John Kitaoka är en lösningsarkitekt på Amazon Web Services. John hjälper kunder att designa och optimera AI/ML-arbetsbelastningar på AWS för att hjälpa dem att nå sina affärsmål.

Skapa ett HCLS dokumentsammanfattningsprogram med Falcon med Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikal sökning. Ai. Josh Famestad är en lösningsarkitekt på Amazon Web Services. Josh arbetar med kunder i den offentliga sektorn för att bygga och utföra molnbaserade tillvägagångssätt för att uppnå affärsprioriteringar.

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
Källa: https://aws.amazon.com/blogs/machine-learning/create-an-hcls-document-summarization-application-with-falcon-using-amazon-sagemaker-jumpstart/

Tidsstämpel: Oktober 4, 2023

Tidsstämpel: Juni 29, 2023

Skapa ett HCLS dokumentsammanfattningsprogram med Falcon med Amazon SageMaker JumpStart | Amazon webbtjänster

Återutgiven av Platon

Lösningsöversikt

Förutsättningar

Distribuera Falcon 7B med SageMaker JumpStart

Kör din första fråga

Fråga med en summeringsuppmaning

Importera och kör en sammanfattningskedja

Städa upp

Använder andra grundmodeller i SageMaker JumpStart

Slutsats

Om författarna

Mer från AWS maskininlärning

Skapa data av hög kvalitet för ML-modeller med Amazon SageMaker Ground Truth

Integrera Amazon Lex och Uneeqs digitala mänskliga plattform

Modulär funktionsdesign för Advanced Driver Assistance Systems (ADAS) på AWS

Utveckla avancerade maskininlärningssystem på Trumid med Deep Graph Library for Knowledge Embedding

AWS erbjuder nya artificiell intelligens, maskininlärning och generativa AI-guider för att planera din AI-strategi | Amazon webbtjänster

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto