Maak een HCLS-documentsamenvattingstoepassing met Falcon met behulp van Amazon SageMaker JumpStart

Heruitgegeven door Plato

volgers: 0

Klanten uit de gezondheidszorg en life sciences (HCLS) adopteren generatieve AI als hulpmiddel om meer uit hun data te halen. Gebruiksvoorbeelden zijn onder meer het samenvatten van documenten om lezers te helpen zich te concentreren op de belangrijkste punten van een document en het transformeren van ongestructureerde tekst in gestandaardiseerde formaten om belangrijke kenmerken te benadrukken. Met unieke dataformaten en strikte wettelijke vereisten zijn klanten op zoek naar keuzes om het meest performante en kosteneffectieve model te selecteren, evenals de mogelijkheid om de noodzakelijke aanpassingen (fine-tuning) uit te voeren die passen bij hun zakelijke gebruiksscenario. In dit bericht begeleiden we u bij het implementeren van een Falcon Large Language Model (LLM) met behulp van Amazon SageMaker JumpStart en het model gebruiken om lange documenten samen te vatten met LangChain en Python.

Overzicht oplossingen

Amazon Sage Maker is gebouwd op de twintig jaar ervaring van Amazon met het ontwikkelen van real-world ML-applicaties, waaronder productaanbevelingen, personalisatie, intelligent winkelen, robotica en spraakgestuurde apparaten. SageMaker is een beheerde service die in aanmerking komt voor HIPAA en die tools biedt waarmee datawetenschappers, ML-ingenieurs en bedrijfsanalisten kunnen innoveren met ML. Binnen SageMaker is dat zo Amazon SageMaker Studio, een geïntegreerde ontwikkelomgeving (IDE), speciaal gebouwd voor collaboratieve ML-workflows, die op hun beurt een breed scala aan snelstartoplossingen en vooraf getrainde ML-modellen bevatten in een geïntegreerde hub genaamd SageMaker JumpStart. Met SageMaker JumpStart kunt u vooraf getrainde modellen, zoals de Falcon LLM, met vooraf gebouwde voorbeeldnotebooks en SDK-ondersteuning gebruiken om te experimenteren met deze krachtige transformatormodellen en deze in te zetten. U kunt SageMaker Studio en SageMaker JumpStart gebruiken om uw eigen generatieve model in uw AWS-account te implementeren en te bevragen.

U kunt er ook voor zorgen dat de payloadgegevens van de gevolgtrekking uw VPC niet verlaten. U kunt modellen inrichten als eindpunten met één tenant en deze implementeren met netwerkisolatie. Bovendien kunt u de geselecteerde reeks modellen samenstellen en beheren die aan uw eigen beveiligingsvereisten voldoen door gebruik te maken van de privé-modelhub-mogelijkheid binnen SageMaker JumpStart en de goedgekeurde modellen daarin op te slaan. SageMaker is in scope voor HIPAA BAA, SOC123 en HITRUST CSF.

De Falcon LLM is een groot taalmodel, getraind door onderzoekers van het Technology Innovation Institute (TII) op meer dan 1 biljoen tokens met behulp van AWS. Falcon heeft veel verschillende variaties, met als twee hoofdbestanddelen Falcon 40B en Falcon 7B, die respectievelijk 40 miljard en 7 miljard parameters bevatten, met verfijnde versies die zijn getraind voor specifieke taken, zoals het volgen van instructies. Falcon presteert goed bij een verscheidenheid aan taken, waaronder het samenvatten van teksten, sentimentanalyse, het beantwoorden van vragen en het voeren van gesprekken. Dit bericht biedt een walkthrough die u kunt volgen om de Falcon LLM in uw AWS-account te implementeren, met behulp van een beheerde notebookinstantie via SageMaker JumpStart om te experimenteren met tekstsamenvatting.

De SageMaker JumpStart-modelhub bevat complete notebooks om elk model te implementeren en te bevragen. Op het moment van schrijven zijn er zes versies van Falcon beschikbaar in de SageMaker JumpStart-modelhub: Falcon 40B Instruct BF16, Falcon 40B BF16, Falcon 180B BF16, Falcon 180B Chat BF16, Falcon 7B Instruct BF16 en Falcon 7B BF16. Dit bericht maakt gebruik van het Falcon 7B Instruct-model.

In de volgende secties laten we zien hoe u aan de slag kunt gaan met het samenvatten van documenten door Falcon 7B op SageMaker Jumpstart te implementeren.

Voorwaarden

Voor deze tutorial heb je een AWS-account met een SageMaker-domein nodig. Als u nog geen SageMaker-domein heeft, raadpleegt u Aan boord van Amazon SageMaker Domain om er een te maken.

Implementeer Falcon 7B met SageMaker JumpStart

Voer de volgende stappen uit om uw model te implementeren:

Navigeer naar uw SageMaker Studio-omgeving vanuit de SageMaker-console.
Binnen de IO, onder SageMaker JumpStart in het navigatievenster, kies Modellen, notebooks, oplossingen.
Implementeer het Falcon 7B Instruct-model op een eindpunt voor gevolgtrekking.

Hierdoor wordt de modelkaart voor het Falcon 7B Instruct BF16-model geopend. Op deze pagina vindt u de Implementeren or Trainen opties en koppelingen om de voorbeeldnotitieboekjes in SageMaker Studio te openen. In dit bericht wordt het voorbeeldnotitieboekje van SageMaker JumpStart gebruikt om het model te implementeren.

Kies Notitieblok openen.

Voer de eerste vier cellen van de notebook uit om het Falcon 7B Instruct-eindpunt te implementeren.

U kunt uw geïmplementeerde JumpStart-modellen zien op de JumpStart-middelen gelanceerd pagina.

In het navigatievenster, onder SageMaker-startpagina, kiezen JumpStart-middelen gelanceerd.
Kies de Eindpunten modelleren tabblad om de status van uw eindpunt te bekijken.

Nu het Falcon LLM-eindpunt is geïmplementeerd, bent u klaar om het model te bevragen.

Voer uw eerste query uit

Voer de volgende stappen uit om een query uit te voeren:

Op de Dien in menu, kies New en Notitieboek om een nieuw notitieboek te openen.

U kunt ook het ingevulde notitieboekje downloaden hier.

Selecteer de afbeelding, de kernel en het exemplaartype wanneer daarom wordt gevraagd. Voor dit bericht kiezen we de Data Science 3.0-image, Python 3-kernel en ml.t3.medium-instantie.

Importeer de Boto3- en JSON-modules door de volgende twee regels in de eerste cel in te voeren:

import json
import boto3

Media Shift + Enter om de cel te laten draaien.
Vervolgens kunt u een functie definiëren die uw eindpunt aanroept. Deze functie neemt een woordenboekpayload en gebruikt deze om de SageMaker-runtimeclient aan te roepen. Vervolgens deserialiseert het het antwoord en drukt de invoer en de gegenereerde tekst af.

newline, bold, unbold = 'n', '33[1m', '33[0m'
endpoint_name = 'ENDPOINT_NAME' def query_endpoint(payload): client = boto3.client('runtime.sagemaker') response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/json', Body=json.dumps(payload).encode('utf-8')) model_predictions = json.loads(response['Body'].read()) generated_text = model_predictions[0]['generated_text'] print ( f"Input Text: {payload['inputs']}{newline}" f"Generated Text: {bold}{generated_text}{unbold}{newline}")

De payload bevat de prompt als invoer, samen met de gevolgtrekkingsparameters die aan het model worden doorgegeven.

U kunt deze parameters gebruiken met de prompt om de uitvoer van het model af te stemmen op uw gebruiksscenario:

payload = { "inputs": "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", "parameters":{ "max_new_tokens": 50, "return_full_text": False, "do_sample": True, "top_k":10 }
}

Query met een samenvattingsprompt

Dit bericht maakt gebruik van een voorbeeld van een onderzoekspaper om de samenvatting aan te tonen. Het voorbeeldtekstbestand gaat over automatische tekstsamenvatting in de biomedische literatuur. Voer de volgende stappen uit:

Downloaden de PDF en kopieer de tekst naar een bestand met de naam document.txt.
Kies in SageMaker Studio het uploadpictogram en upload het bestand naar uw SageMaker Studio-instantie.

Bestand uploaden naar SageMaker Studio

Out-of-the-box biedt de Falcon LLM ondersteuning voor tekstsamenvatting.

Laten we een functie maken die snelle technische technieken gebruikt om samen te vatten document.txt:

def summarize(text_to_summarize): summarization_prompt = """Process the following text and then perform the instructions that follow: {text_to_summarize} Provide a short summary of the preceeding text. Summary:""" payload = { "inputs": summarization_prompt, "parameters":{ "max_new_tokens": 150, "return_full_text": False, "do_sample": True, "top_k":10 } } response = query_endpoint(payload) print(response) with open("document.txt") as f: text_to_summarize = f.read() summarize(text_to_summarize)

U zult merken dat er voor langere documenten een foutmelding verschijnt: Falcon heeft, net als alle andere LLM's, een limiet op het aantal tokens dat als invoer wordt doorgegeven. We kunnen deze limiet omzeilen met behulp van de verbeterde samenvattingsmogelijkheden van LangChain, waardoor een veel grotere input aan de LLM kan worden doorgegeven.

Importeer en voer een samenvattingsketen uit

LangChain is een open-source softwarebibliotheek waarmee ontwikkelaars en datawetenschappers snel aangepaste generatieve applicaties kunnen bouwen, afstemmen en implementeren zonder complexe ML-interacties te beheren, die vaak worden gebruikt om veel van de algemene gebruiksscenario's voor generatieve AI-taalmodellen in slechts een paar regels code. De ondersteuning van LangChain voor AWS-services omvat ondersteuning voor SageMaker-eindpunten.

LangChain biedt een toegankelijke interface voor LLM's. De functies omvatten tools voor prompt-templates en prompt-chaining. Deze ketens kunnen worden gebruikt om tekstdocumenten die langer zijn dan wat het taalmodel ondersteunt, in één oproep samen te vatten. U kunt een kaartverkleiningsstrategie gebruiken om lange documenten samen te vatten door deze op te splitsen in hanteerbare stukken, ze samen te vatten en te combineren (en indien nodig opnieuw samen te vatten).

Laten we LangChain installeren om te beginnen:

%pip install langchain

Importeer de relevante modules en deel het lange document op in stukjes:

import langchain
from langchain import SagemakerEndpoint, PromptTemplate
from langchain.llms.sagemaker_endpoint import LLMContentHandler
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document text_splitter = RecursiveCharacterTextSplitter( chunk_size = 500, chunk_overlap = 20, separators = [" "], length_function = len )
input_documents = text_splitter.create_documents([text_to_summarize])

Om LangChain effectief te laten werken met Falcon, moet u de standaard inhoudshandlerklassen definiëren voor geldige invoer en uitvoer:

class ContentHandlerTextSummarization(LLMContentHandler): content_type = "application/json" accepts = "application/json" def transform_input(self, prompt: str, model_kwargs={}) -> bytes: input_str = json.dumps({"inputs": prompt, **model_kwargs}) return input_str.encode("utf-8") def transform_output(self, output: bytes) -> json: response_json = json.loads(output.read().decode("utf-8")) generated_text = response_json[0]['generated_text'] return generated_text.split("summary:")[-1] content_handler = ContentHandlerTextSummarization()

U kunt aangepaste aanwijzingen definiëren als PromptTemplate objecten, het belangrijkste voertuig voor het vragen met LangChain, voor de samenvattingsbenadering met kaartverkleining. Dit is een optionele stap omdat toewijzings- en combinatieprompts standaard worden geleverd als de parameters binnen de aanroep om de samenvattingsketen te laden (load_summarize_chain) zijn niet gedefinieerd.

map_prompt = """Write a concise summary of this text in a few complete sentences: {text} Concise summary:""" map_prompt_template = PromptTemplate( template=map_prompt, input_variables=["text"] ) combine_prompt = """Combine all these following summaries and generate a final summary of them in a few complete sentences: {text} Final summary:""" combine_prompt_template = PromptTemplate( template=combine_prompt, input_variables=["text"] )

LangChain ondersteunt LLM's die worden gehost op SageMaker-inferentie-eindpunten, dus in plaats van de AWS Python SDK te gebruiken, kunt u de verbinding initialiseren via LangChain voor betere toegankelijkheid:

summary_model = SagemakerEndpoint( endpoint_name = endpoint_name, region_name= "us-east-1", model_kwargs= {}, content_handler=content_handler )

Ten slotte kunt u een samenvattingsketen laden en een samenvatting van de invoerdocumenten uitvoeren met behulp van de volgende code:

summary_chain = load_summarize_chain(llm=summary_model, chain_type="map_reduce", map_prompt=map_prompt_template, combine_prompt=combine_prompt_template, verbose=True ) summary = summary_chain({"input_documents": input_documents, 'token_max': 700}, return_only_outputs=True)
print(summary["output_text"])

Omdat de verbose parameter is ingesteld op True, ziet u alle tussenresultaten van de kaartverkleiningsaanpak. Dit is handig als u de volgorde van de gebeurtenissen wilt volgen om tot een definitieve samenvatting te komen. Met deze kaartverkleinende aanpak kunt u documenten effectief veel langer samenvatten dan normaal is toegestaan door de maximale invoertokenlimiet van het model.

Opruimen

Nadat u klaar bent met het gebruik van het inferentie-eindpunt, is het belangrijk om dit te verwijderen om te voorkomen dat u onnodige kosten maakt via de volgende coderegels:

client = boto3.client('runtime.sagemaker')
client.delete_endpoint(EndpointName=endpoint_name)

Andere funderingsmodellen gebruiken in SageMaker JumpStart

Het gebruik van andere basismodellen die beschikbaar zijn in SageMaker JumpStart voor het samenvatten van documenten vereist minimale overhead bij het opzetten en implementeren. LLM's variëren af en toe afhankelijk van de structuur van invoer- en uitvoerformaten, en naarmate nieuwe modellen en kant-en-klare oplossingen aan SageMaker JumpStart worden toegevoegd, moet u, afhankelijk van de taakimplementatie, mogelijk de volgende codewijzigingen aanbrengen:

Als u samenvattingen uitvoert via de summarize() methode (de methode zonder LangChain te gebruiken), moet u mogelijk de JSON-structuur van de payload parameter, evenals de verwerking van de responsvariabele in de query_endpoint() functie
Als u samenvattingen uitvoert via LangChain's load_summarize_chain() methode, moet u mogelijk de ContentHandlerTextSummarization klasse, in het bijzonder de transform_input() en transform_output() functies, om de lading die de LLM verwacht en de output die de LLM retourneert correct af te handelen

Funderingsmodellen variëren niet alleen in factoren zoals inferentiesnelheid en kwaliteit, maar ook in invoer- en uitvoerformaten. Raadpleeg de relevante informatiepagina van de LLM over de verwachte input en output.

Conclusie

Het Falcon 7B Instruct-model is beschikbaar op de SageMaker JumpStart-modelhub en presteert in een aantal gebruiksscenario's. Dit bericht demonstreerde hoe u uw eigen Falcon LLM-eindpunt in uw omgeving kunt implementeren met behulp van SageMaker JumpStart en uw eerste experimenten kunt doen vanuit SageMaker Studio, zodat u snel een prototype van uw modellen kunt maken en naadloos kunt overstappen naar een productieomgeving. Met Falcon en LangChain kunt u lange documenten op het gebied van de gezondheidszorg en de levenswetenschappen effectief op schaal samenvatten.

Voor meer informatie over het werken met generatieve AI op AWS, zie Aankondiging van nieuwe tools voor bouwen met generatieve AI op AWS. U kunt beginnen met experimenteren en proofs of concept voor documentsamenvattingen bouwen voor uw op gezondheidszorg en biowetenschappen gerichte GenAI-toepassingen met behulp van de methode die in dit bericht wordt beschreven. Wanneer Amazonebodem algemeen beschikbaar is, zullen we een vervolgpost publiceren waarin wordt getoond hoe u documentsamenvatting kunt implementeren met behulp van Amazon Bedrock en LangChain.

Over de auteurs

Maak een HCLS-documentsamenvattingstoepassing met Falcon met behulp van Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Johannes Kitaoka is oplossingsarchitect bij Amazon Web Services. John helpt klanten bij het ontwerpen en optimaliseren van AI/ML-workloads op AWS om hen te helpen hun bedrijfsdoelen te bereiken.

Maak een HCLS-documentsamenvattingstoepassing met Falcon met behulp van Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Josh Famestad is oplossingsarchitect bij Amazon Web Services. Josh werkt samen met klanten uit de publieke sector om cloudgebaseerde benaderingen te ontwikkelen en uit te voeren om zakelijke prioriteiten te verwezenlijken.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
Bron: https://aws.amazon.com/blogs/machine-learning/create-an-hcls-document-summarization-application-with-falcon-using-amazon-sagemaker-jumpstart/

Tijdstempel: 4 oktober 2023

Tijdstempel: Juni 29, 2023

Maak een HCLS-documentsamenvattingstoepassing met Falcon met behulp van Amazon SageMaker JumpStart | Amazon-webservices

Heruitgegeven door Plato

Overzicht oplossingen

Voorwaarden

Implementeer Falcon 7B met SageMaker JumpStart

Voer uw eerste query uit

Query met een samenvattingsprompt

Importeer en voer een samenvattingsketen uit

Opruimen

Andere funderingsmodellen gebruiken in SageMaker JumpStart

Conclusie

Over de auteurs

Meer van AWS-machine learning

Maak hoogwaardige gegevens voor ML-modellen met Amazon SageMaker Ground Truth

Integreer het digitale menselijke platform van Amazon Lex en Uneeq

Ontwerp met modulaire functies voor Advanced Driver Assistance Systems (ADAS) op AWS

Geavanceerde machine learning-systemen ontwikkelen bij Trumid met de Deep Graph Library for Knowledge Embedding

AWS biedt nieuwe kunstmatige intelligentie, machine learning en generatieve AI-gidsen om uw AI-strategie te plannen | Amazon-webservices

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account