Utwórz aplikację podsumowującą dokument HCLS za pomocą Falcona, korzystając z Amazon SageMaker JumpStart

Opublikowane ponownie przez Plato

Obserwuje: 0

Klienci z branży opieki zdrowotnej i nauk przyrodniczych (HCLS) wykorzystują generatywną sztuczną inteligencję jako narzędzie umożliwiające lepsze wykorzystanie danych. Przypadki użycia obejmują podsumowania dokumentu, które pomagają czytelnikom skupić się na kluczowych punktach dokumentu i przekształcanie nieustrukturyzowanego tekstu w standardowe formaty w celu podkreślenia ważnych atrybutów. Dzięki unikalnym formatom danych i surowym wymaganiom regulacyjnym klienci szukają możliwości wyboru najbardziej wydajnego i opłacalnego modelu, a także możliwości przeprowadzenia niezbędnego dostosowania (dostrajania) w celu dopasowania do swojego przypadku biznesowego. W tym poście przeprowadzimy Cię przez proces wdrażania modelu dużego języka Falcon (LLM) przy użyciu Amazon SageMaker JumpStart oraz wykorzystanie modelu do podsumowania długich dokumentów za pomocą LangChain i Python.

Omówienie rozwiązania

Amazon Sage Maker opiera się na dwudziestoletnim doświadczeniu firmy Amazon w tworzeniu rzeczywistych aplikacji ML, w tym rekomendacji produktów, personalizacji, inteligentnych zakupów, robotyki i urządzeń wspomaganych głosowo. SageMaker to usługa zarządzana zgodna ze standardem HIPAA, która zapewnia narzędzia umożliwiające analitykom danych, inżynierom uczenia maszynowego i analitykom biznesowym wprowadzanie innowacji za pomocą uczenia maszynowego. W SageMaker jest Studio Amazon SageMaker, zintegrowane środowisko programistyczne (IDE) zaprojektowane specjalnie z myślą o wspólnych przepływach pracy ML, które z kolei zawiera szeroką gamę rozwiązań szybkiego startu i wstępnie wyszkolonych modeli ML w zintegrowanym centrum o nazwie SageMaker JumpStart. Dzięki SageMaker JumpStart możesz używać wstępnie wytrenowanych modeli, takich jak Falcon LLM, z gotowymi przykładowymi notatnikami i obsługą SDK, aby eksperymentować i wdrażać te potężne modele transformatorów. Możesz używać SageMaker Studio i SageMaker JumpStart do wdrażania własnego modelu generatywnego i wysyłania zapytań do niego na swoim koncie AWS.

Możesz także mieć pewność, że dane ładunku wnioskowania nie opuszczą Twojej VPC. Można udostępniać modele jako punkty końcowe z jedną dzierżawą i wdrażać je z izolacją sieci. Co więcej, możesz wybierać i zarządzać wybranym zestawem modeli, który spełnia Twoje własne wymagania bezpieczeństwa, korzystając z funkcji centrum modeli prywatnych w SageMaker JumpStart i przechowując tam zatwierdzone modele. SageMaker jest objęty zakresem HIPAA BAA, SOC123, HITRUST CSF.

Połączenia Firma Falcon LLM to duży model językowy, trenowany przez naukowców z Technology Innovation Institute (TII) na ponad 1 bilionie tokenów przy użyciu AWS. Falcon ma wiele różnych odmian, a jego dwa główne składniki to Falcon 40B i Falcon 7B, składające się odpowiednio z 40 miliardów i 7 miliardów parametrów, z precyzyjnie dostrojonymi wersjami przeszkolonymi do określonych zadań, takich jak wykonywanie instrukcji. Falcon dobrze radzi sobie z różnymi zadaniami, w tym podsumowaniem tekstu, analizą nastrojów, odpowiadaniem na pytania i rozmowami. Ten post zawiera przewodnik, który możesz wykonać, aby wdrożyć Falcon LLM na swoim koncie AWS, korzystając z instancji zarządzanego notatnika za pośrednictwem SageMaker JumpStart w celu eksperymentowania z podsumowaniem tekstu.

Centrum modeli SageMaker JumpStart zawiera kompletne notesy umożliwiające wdrażanie i wysyłanie zapytań do każdego modelu. W chwili pisania tego tekstu w centrum modeli SageMaker JumpStart dostępnych jest sześć wersji Falcona: Falcon 40B Instruct BF16, Falcon 40B BF16, Falcon 180B BF16, Falcon 180B Chat BF16, Falcon 7B Instruct BF16 i Falcon 7B BF16. W tym poście wykorzystano model Falcon 7B Instruct.

W poniższych sekcjach pokazujemy, jak rozpocząć podsumowywanie dokumentów, wdrażając Falcon 7B w SageMaker Jumpstart.

Wymagania wstępne

Do tego samouczka potrzebne będzie konto AWS z domeną SageMaker. Jeśli nie masz jeszcze domeny SageMaker, zapoznaj się z sekcją Na pokładzie do domeny Amazon SageMaker stworzyć jeden.

Rozmieść Falcona 7B za pomocą SageMaker JumpStart

Aby wdrożyć model, wykonaj następujące kroki:

Przejdź do środowiska SageMaker Studio z konsoli SageMaker.
W IDE, pod SageMaker Szybki start w okienku nawigacji wybierz Modele, notebooki, rozwiązania.
Wdróż model Falcon 7B Instruct w punkcie końcowym w celu wyciągnięcia wniosków.

Spowoduje to otwarcie karty modelu Falcon 7B Instruct BF16. Na tej stronie znajdziesz Rozmieścić or Pociąg opcje, a także łącza umożliwiające otwarcie przykładowych notatników w SageMaker Studio. W tym poście do wdrożenia modelu wykorzystany zostanie przykładowy notatnik z SageMaker JumpStart.

Dodaj Otwórz notatnik.

Uruchom pierwsze cztery komórki notatnika, aby wdrożyć punkt końcowy Falcon 7B Instruct.

Możesz zobaczyć wdrożone modele JumpStart na stronie Uruchomiono zasoby JumpStart strona.

W okienku nawigacji w obszarze Szybki start SageMakerawybierz Uruchomiono zasoby JumpStart.
Wybierz Punkty końcowe modelu aby wyświetlić stan punktu końcowego.

Po wdrożeniu punktu końcowego Falcon LLM możesz wysłać zapytanie do modelu.

Uruchom swoje pierwsze zapytanie

Aby uruchomić zapytanie, wykonaj następujące kroki:

Na filet menu, wybierz Nowości i Notatnik aby otworzyć nowy notatnik.

Możesz także pobrać wypełniony notatnik tutaj.

Po wyświetleniu monitu wybierz obraz, jądro i typ instancji. W tym poście wybieramy obraz Data Science 3.0, jądro Python 3 i instancję ml.t3.medium.

Zaimportuj moduły Boto3 i JSON, wprowadzając następujące dwie linie w pierwszej komórce:

import json
import boto3

Naciśnij przycisk Shift + Enter do obsługi komórki.
Następnie możesz zdefiniować funkcję, która będzie wywoływać Twój punkt końcowy. Ta funkcja pobiera ładunek słownikowy i używa go do wywołania klienta wykonawczego SageMaker. Następnie deserializuje odpowiedź i drukuje wprowadzony i wygenerowany tekst.

newline, bold, unbold = 'n', '33[1m', '33[0m'
endpoint_name = 'ENDPOINT_NAME' def query_endpoint(payload): client = boto3.client('runtime.sagemaker') response = client.invoke_endpoint(EndpointName=endpoint_name, ContentType='application/json', Body=json.dumps(payload).encode('utf-8')) model_predictions = json.loads(response['Body'].read()) generated_text = model_predictions[0]['generated_text'] print ( f"Input Text: {payload['inputs']}{newline}" f"Generated Text: {bold}{generated_text}{unbold}{newline}")

Ładunek zawiera zachętę jako dane wejściowe wraz z parametrami wnioskowania, które zostaną przekazane do modelu.

Możesz użyć tych parametrów z podpowiedzią, aby dostroić dane wyjściowe modelu do swojego przypadku użycia:

payload = { "inputs": "Girafatron is obsessed with giraffes, the most glorious animal on the face of this Earth. Giraftron believes all other animals are irrelevant when compared to the glorious majesty of the giraffe.nDaniel: Hello, Girafatron!nGirafatron:", "parameters":{ "max_new_tokens": 50, "return_full_text": False, "do_sample": True, "top_k":10 }
}

Zapytanie z monitem podsumowującym

W tym poście wykorzystano przykładowy artykuł badawczy w celu zademonstrowania podsumowania. Przykładowy plik tekstowy dotyczy automatycznego podsumowania tekstu w literaturze biomedycznej. Wykonaj następujące kroki:

Do pobrania PDF i skopiuj tekst do pliku o nazwie document.txt.
W SageMaker Studio wybierz ikonę przesyłania i prześlij plik do instancji SageMaker Studio.

Przesyłanie pliku do SageMaker Studio

Po wyjęciu z pudełka Falcon LLM zapewnia obsługę podsumowań tekstu.

Stwórzmy funkcję, która do podsumowania użyje szybkich technik inżynieryjnych document.txt:

def summarize(text_to_summarize): summarization_prompt = """Process the following text and then perform the instructions that follow: {text_to_summarize} Provide a short summary of the preceeding text. Summary:""" payload = { "inputs": summarization_prompt, "parameters":{ "max_new_tokens": 150, "return_full_text": False, "do_sample": True, "top_k":10 } } response = query_endpoint(payload) print(response) with open("document.txt") as f: text_to_summarize = f.read() summarize(text_to_summarize)

Zauważysz, że w przypadku dłuższych dokumentów pojawia się błąd — Falcon, podobnie jak wszystkie inne LLM, ma ograniczenie liczby tokenów przekazywanych jako dane wejściowe. Możemy obejść ten limit, korzystając z ulepszonych możliwości podsumowania LangChain, które pozwalają na przekazanie znacznie większych danych wejściowych do LLM.

Zaimportuj i uruchom łańcuch podsumowań

LangChain to biblioteka oprogramowania typu open source, która umożliwia programistom i badaczom danych szybkie tworzenie, dostrajanie i wdrażanie niestandardowych aplikacji generatywnych bez zarządzania złożonymi interakcjami ML, powszechnie używanymi do wyodrębniania wielu typowych przypadków użycia generatywnych modeli języka AI w zaledwie kilku linie kodu. Wsparcie LangChain dla usług AWS obejmuje obsługę punktów końcowych SageMaker.

LangChain zapewnia dostępny interfejs dla LLM. Jego funkcje obejmują narzędzia do szybkiego tworzenia szablonów i szybkiego łączenia. Łańcuchów tych można używać do podsumowywania dokumentów tekstowych dłuższych niż te, które obsługuje model języka w jednym wywołaniu. Możesz użyć strategii zmniejszania mapy, aby podsumować długie dokumenty, dzieląc je na łatwe do zarządzania fragmenty, podsumowując je i łącząc (i ponownie podsumowując, jeśli to konieczne).

Na początek zainstalujmy LangChain:

%pip install langchain

Zaimportuj odpowiednie moduły i podziel długi dokument na części:

import langchain
from langchain import SagemakerEndpoint, PromptTemplate
from langchain.llms.sagemaker_endpoint import LLMContentHandler
from langchain.chains.summarize import load_summarize_chain
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.docstore.document import Document text_splitter = RecursiveCharacterTextSplitter( chunk_size = 500, chunk_overlap = 20, separators = [" "], length_function = len )
input_documents = text_splitter.create_documents([text_to_summarize])

Aby LangChain efektywnie współpracował z Falconem, musisz zdefiniować domyślne klasy obsługi treści dla poprawnych danych wejściowych i wyjściowych:

class ContentHandlerTextSummarization(LLMContentHandler): content_type = "application/json" accepts = "application/json" def transform_input(self, prompt: str, model_kwargs={}) -> bytes: input_str = json.dumps({"inputs": prompt, **model_kwargs}) return input_str.encode("utf-8") def transform_output(self, output: bytes) -> json: response_json = json.loads(output.read().decode("utf-8")) generated_text = response_json[0]['generated_text'] return generated_text.split("summary:")[-1] content_handler = ContentHandlerTextSummarization()

Monity niestandardowe można zdefiniować jako PromptTemplate obiektów, głównego narzędzia podpowiedzi za pomocą LangChain, w podejściu podsumowującym z redukcją mapy. Jest to krok opcjonalny, ponieważ monity o mapowanie i łączenie są domyślnie udostępniane, jeśli parametry w wywołaniu ładującym łańcuch podsumowań (load_summarize_chain) są nieokreślone.

map_prompt = """Write a concise summary of this text in a few complete sentences: {text} Concise summary:""" map_prompt_template = PromptTemplate( template=map_prompt, input_variables=["text"] ) combine_prompt = """Combine all these following summaries and generate a final summary of them in a few complete sentences: {text} Final summary:""" combine_prompt_template = PromptTemplate( template=combine_prompt, input_variables=["text"] )

LangChain obsługuje LLM hostowane na punktach końcowych wnioskowania SageMaker, więc zamiast korzystać z zestawu AWS Python SDK, możesz zainicjować połączenie za pośrednictwem LangChain, aby uzyskać większą dostępność:

summary_model = SagemakerEndpoint( endpoint_name = endpoint_name, region_name= "us-east-1", model_kwargs= {}, content_handler=content_handler )

Na koniec możesz załadować łańcuch podsumowań i uruchomić podsumowanie w dokumentach wejściowych, używając następującego kodu:

summary_chain = load_summarize_chain(llm=summary_model, chain_type="map_reduce", map_prompt=map_prompt_template, combine_prompt=combine_prompt_template, verbose=True ) summary = summary_chain({"input_documents": input_documents, 'token_max': 700}, return_only_outputs=True)
print(summary["output_text"])

Ponieważ verbose parametr jest ustawiony na True, zobaczysz wszystkie pośrednie wyniki podejścia polegającego na zmniejszaniu mapy. Jest to przydatne do śledzenia sekwencji zdarzeń w celu uzyskania ostatecznego podsumowania. Dzięki temu podejściu polegającemu na zmniejszeniu mapy można skutecznie podsumowywać dokumenty znacznie dłużej, niż zwykle pozwala na to maksymalny limit tokenów wejściowych modelu.

Sprzątać

Po zakończeniu korzystania z punktu końcowego wnioskowania ważne jest, aby go usunąć, aby uniknąć ponoszenia niepotrzebnych kosztów związanych z następującymi wierszami kodu:

client = boto3.client('runtime.sagemaker')
client.delete_endpoint(EndpointName=endpoint_name)

Korzystanie z innych modeli fundamentów w SageMaker JumpStart

Wykorzystywanie innych podstawowych modeli dostępnych w SageMaker JumpStart do podsumowywania dokumentów wymaga minimalnego nakładu pracy przy konfiguracji i wdrożeniu. LLM czasami różnią się strukturą formatów wejściowych i wyjściowych, a w miarę dodawania nowych modeli i gotowych rozwiązań do SageMaker JumpStart, w zależności od realizacji zadania, może być konieczne wprowadzenie następujących zmian w kodzie:

Jeśli przeprowadzasz podsumowanie za pośrednictwem summarize() (metoda bez użycia LangChain), może być konieczna zmiana struktury JSON pliku payload parametru, a także obsługę zmiennej odpowiedzi w pliku query_endpoint() funkcjonować
Jeśli przeprowadzasz podsumowanie za pośrednictwem LangChain load_summarize_chain() może być konieczne zmodyfikowanie metody ContentHandlerTextSummarization klasa, a konkretnie transform_input() i transform_output() funkcje, aby poprawnie obsłużyć ładunek, jakiego oczekuje LLM, i dane wyjściowe, które LLM zwraca

Modele podstawowe różnią się nie tylko takimi czynnikami, jak szybkość i jakość wnioskowania, ale także formatami wejściowymi i wyjściowymi. Zapoznaj się z odpowiednią stroną informacyjną LLM dotyczącą oczekiwanych danych wejściowych i wyjściowych.

Wnioski

Model Falcon 7B Instruct jest dostępny w centrum modeli SageMaker JumpStart i sprawdza się w wielu przypadkach użycia. W tym poście pokazano, jak wdrożyć własny punkt końcowy Falcon LLM w swoim środowisku za pomocą SageMaker JumpStart i przeprowadzić pierwsze eksperymenty w SageMaker Studio, co umożliwi szybkie prototypowanie modeli i płynne przejście do środowiska produkcyjnego. Dzięki Falcon i LangChain możesz skutecznie podsumowywać długoterminowe dokumenty z zakresu opieki zdrowotnej i nauk przyrodniczych na dużą skalę.

Aby uzyskać więcej informacji na temat pracy z generatywną sztuczną inteligencją w AWS, zobacz Ogłaszamy nowe narzędzia do budowania z generatywną sztuczną inteligencją w AWS. Możesz rozpocząć eksperymentowanie i tworzenie podsumowań dokumentów potwierdzających słuszność koncepcji aplikacji GenAI zorientowanych na opiekę zdrowotną i nauki przyrodnicze, korzystając z metody opisanej w tym poście. Gdy Amazońska skała macierzysta jest ogólnie dostępny, opublikujemy kolejny post pokazujący, jak można wdrożyć podsumowania dokumentów za pomocą Amazon Bedrock i LangChain.

O autorach

Create an HCLS document summarization application with Falcon using Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Johna Kitaoki jest architektem rozwiązań w Amazon Web Services. John pomaga klientom projektować i optymalizować obciążenia AI/ML w AWS, aby pomóc im osiągnąć cele biznesowe.

Create an HCLS document summarization application with Falcon using Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai. Josha Famestada jest architektem rozwiązań w Amazon Web Services. Josh współpracuje z klientami z sektora publicznego, aby budować i wdrażać podejścia oparte na chmurze, aby realizować priorytety biznesowe.

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://aws.amazon.com/blogs/machine-learning/create-an-hcls-document-summarization-application-with-falcon-using-amazon-sagemaker-jumpstart/

Znak czasu: 4 października 2023 r.

Znak czasu: Czerwiec 29, 2023

Utwórz aplikację do podsumowania dokumentów HCLS za pomocą Falcona, korzystając z Amazon SageMaker JumpStart | Usługi internetowe Amazona

Opublikowane ponownie przez Plato

Omówienie rozwiązania

Wymagania wstępne

Rozmieść Falcona 7B za pomocą SageMaker JumpStart

Uruchom swoje pierwsze zapytanie

Zapytanie z monitem podsumowującym

Zaimportuj i uruchom łańcuch podsumowań

Sprzątać

Korzystanie z innych modeli fundamentów w SageMaker JumpStart

Wnioski

O autorach

Więcej z Uczenie maszynowe AWS

Twórz wysokiej jakości dane dla modeli ML za pomocą Amazon SageMaker Ground Truth

Zintegruj Amazon Lex i cyfrową platformę ludzką Uneeq

Modułowe projektowanie funkcji dla zaawansowanych systemów wspomagania kierowcy (ADAS) w AWS

Opracowywanie zaawansowanych systemów uczenia maszynowego w firmie Trumid za pomocą biblioteki Deep Graph Library do osadzania wiedzy

AWS oferuje nowe przewodniki dotyczące sztucznej inteligencji, uczenia maszynowego i generatywnej sztucznej inteligencji, które pomogą Ci zaplanować strategię AI | Usługi sieciowe Amazona

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto