Podsumowanie tekstu z Amazon SageMaker i przytulanie twarzy

Opublikowane ponownie przez Plato

Obserwuje: 0

W tym poście pokazujemy, jak zaimplementować jeden z najczęściej pobieranych wstępnie wytrenowanych modeli Hugging Face, używanych do podsumowania tekstu, DestylacjaBART-CNN-12-6, w notatniku Jupyter przy użyciu Amazon Sage Maker oraz Zestaw narzędzi do wnioskowania o przytulaniu twarzy SageMaker. Na podstawie kroków przedstawionych w tym poście możesz spróbować podsumować tekst z WikiTekst-2 zestaw danych zarządzany przez fast.ai, dostępny na Rejestr otwartych danych na AWS.

Globalne wolumeny danych rosną w skali zettabajta, ponieważ firmy i konsumenci coraz częściej korzystają z produktów cyfrowych i usług online. Aby lepiej zrozumieć te rosnące dane, techniki przetwarzania języka naturalnego (NLP) uczące się maszynowo (ML) do analizy tekstu ewoluowały w celu rozwiązania przypadków użycia obejmujących podsumowywanie tekstu, rozpoznawanie jednostek, klasyfikację, tłumaczenie i inne. AWS oferuje przeszkolenie Usługi AWS AI które można zintegrować z aplikacjami za pomocą wywołań API i nie wymagają doświadczenia w ML. Na przykład, Amazon Comprehend może wykonywać zadania NLP, takie jak rozpoznawanie niestandardowych jednostek, analiza sentymentu, wyodrębnianie kluczowych fraz, modelowanie tematów i inne, aby zebrać wgląd w tekst. Może wykonać analiza tekstu w wielu różnych językach ze względu na jego różne cechy.

Podsumowanie tekstu jest techniką pomocną w zrozumieniu dużych ilości danych tekstowych, ponieważ tworzy podzbiór informacji o znaczeniu kontekstowym z dokumentów źródłowych. Możesz zastosować tę technikę NLP do dłuższych dokumentów tekstowych i artykułów, umożliwiając szybsze wykorzystanie i bardziej efektywne indeksowanie dokumentów, na przykład podsumowywanie notatek telefonicznych ze spotkań.

Przytulanie Twarzy to popularna biblioteka open source dla NLP, zawierająca ponad 49,000 185 wstępnie wytrenowanych modeli w ponad XNUMX językach z obsługą różnych platform. AWS i Hugging Face mają współpraca który umożliwia bezproblemową integrację za pośrednictwem SageMaker z zestawem kontenerów głębokiego uczenia AWS (DLC) do szkolenia i wnioskowania w PyTorch lub TensorFlow oraz estymatorów i predyktorów Hugging Face dla pakietu SDK SageMaker Python. Te możliwości w SageMaker ułatwiają programistom i analitykom danych rozpoczęcie pracy z NLP w AWS. Przetwarzanie tekstów za pomocą transformatorów w strukturach głębokiego uczenia, takich jak PyTorch, jest zazwyczaj złożonym i czasochłonnym zadaniem dla naukowców zajmujących się danymi, często prowadząc do frustracji i braku wydajności podczas opracowywania projektów NLP. Rozwój społeczności AI, takich jak Hugging Face, w połączeniu z możliwościami usług ML w chmurze, takich jak SageMaker, przyspiesza i upraszcza rozwój tych zadań związanych z przetwarzaniem tekstu. SageMaker pomaga budować, trenować, wdrażać i operować modelami Hugging Face.

Przegląd podsumowania tekstu

Możesz zastosować podsumowanie tekstu, aby zidentyfikować kluczowe zdania w dokumencie lub zidentyfikować kluczowe zdania w wielu dokumentach. Podsumowanie tekstu może generować dwa rodzaje podsumowań: ekstrakcyjne i abstrakcyjne. Wyodrębnianie podsumowań nie zawiera żadnego tekstu generowanego maszynowo i jest zbiorem ważnych zdań wybranych z dokumentu wejściowego. Streszczenia abstrakcyjne zawierają nowe, czytelne dla człowieka frazy i zdania generowane przez model podsumowania tekstu. Większość systemów podsumowania tekstu opiera się na podsumowaniu ekstrakcyjnym, ponieważ dokładne streszczenie tekstu abstrakcyjnego jest trudne do osiągnięcia.

Hugging Face ma ponad 400 wytrenowanych, najnowocześniejszych technologii dostępne modele podsumowania tekstu, wdrażając różne kombinacje technik NLP. Modele te są szkolone na różnych zestawach danych, przesyłane i utrzymywane przez firmy technologiczne i członków społeczności Hugging Face. Możesz filtrować modele według najczęściej pobieranych lub najbardziej lubianych i ładować je bezpośrednio podczas korzystania z rurociąg podsumowujący API transformatora Hugging Face. Transformator Hugging Face upraszcza proces implementacji NLP, dzięki czemu wysokowydajne modele NLP można dostroić w celu dostarczania streszczeń tekstowych, bez konieczności posiadania rozległej wiedzy na temat obsługi ML.

Modele podsumowania tekstu Hugging Face w AWS

SageMaker oferuje analitykom biznesowym, analitykom danych i inżynierom MLOps wybór narzędzi do projektowania i obsługi obciążeń ML w AWS. Narzędzia te zapewniają szybszą implementację i testowanie modeli ML w celu osiągnięcia optymalnych wyników.

Z Zestaw narzędzi do wnioskowania o przytulaniu twarzy SageMaker, biblioteka typu open source, przedstawiamy trzy różne sposoby implementacji i hostowania modeli podsumowania tekstu Hugging Face za pomocą notatnika Jupyter:

Potok podsumowania przytulania twarzy - Stwórz Potok podsumowania przytulania twarzy używając "summarization” identyfikator zadania, aby użyć domyślnego modelu podsumowania tekstu do wnioskowania w notatniku Jupyter. Te potoki abstrahują od złożonego kodu, oferując początkującym praktykom ML prosty interfejs API do szybkiego implementowania podsumowania tekstu bez konfigurowania punktu końcowego wnioskowania. Potok umożliwia również praktykowi ML wybranie określonego wstępnie wytrenowanego modelu i skojarzonego z nim tokenizera. Tokenizatory przygotowują tekst, aby był gotowy jako dane wejściowe dla modelu, dzieląc tekst na słowa lub podsłowa, które następnie są konwertowane na identyfikatory za pomocą tabeli wyszukiwania. Dla uproszczenia poniższy fragment kodu zapewnia domyślny przypadek podczas korzystania z potoków. The DestylacjaBART-CNN-12-6 model jest jednym z najczęściej pobieranych modeli podsumowujących na Hugging Face i jest domyślny model potoku podsumowania. Ostatni wiersz wywołuje wstępnie wytrenowany model, aby uzyskać podsumowanie przekazanego tekstu, biorąc pod uwagę dostarczone dwa argumenty.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```

Punkt końcowy SageMaker ze wstępnie wytrenowanym modelem – Utwórz punkt końcowy SageMaker za pomocą wstępnie wytrenowanego modelu z Przytulanie twarzy Model Hub i wdróż go w punkcie końcowym wnioskowania, takim jak wystąpienie ml.m5.xlarge w poniższym fragmencie kodu. Ta metoda umożliwia doświadczonym praktykom ML szybkie wybieranie określonych modeli typu open source, dostrajanie ich i wdrażanie modeli w wysoce wydajnych instancjach wnioskowania.

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")

Punkt końcowy SageMaker z wyszkolonym modelem – Utwórz punkt końcowy modelu SageMaker z wytrenowanym modelem przechowywanym w Usługa Amazon Simple Storage (Amazon S3) i wdróż go w punkcie końcowym wnioskowania. Ta metoda pozwala doświadczonym praktykom ML na szybkie wdrażanie własnych modeli przechowywanych w Amazon S3 na wysoce wydajne instancje wnioskowania. Sam model jest pobierany z Hugging Face i kompresowany, a następnie można go wgrać do Amazon S3. Ten krok jest przedstawiony w następującym fragmencie kodu:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

AWS ma kilka dostępnych zasobów, które pomogą Ci we wdrażaniu obciążeń ML. The Obiektyw uczenia maszynowego ukończenia Dobrze zaprojektowany framework AWS zaleca najlepsze praktyki dotyczące obciążeń ML, w tym optymalizację zasobów i redukcję kosztów. Te zalecane zasady projektowania zapewniają, że dobrze zaprojektowane obciążenia ML w AWS są wdrażane w środowisku produkcyjnym. Polecający wnioskowanie Amazon SageMaker pomaga wybrać odpowiednie wystąpienie do wdrożenia modeli ML przy optymalnej wydajności i kosztach wnioskowania. Recommender wnioskowania przyspiesza wdrażanie modelu i skraca czas wprowadzania na rynek dzięki automatyzacji testowania obciążenia i optymalizacji wydajności modelu w instancjach ML.

W następnych sekcjach pokazujemy, jak załadować wyszkolony model z zasobnika S3 i wdrożyć go w odpowiednim wystąpieniu wnioskowania.

Wymagania wstępne

W tej instrukcji należy spełnić następujące wymagania wstępne:

An Konto AWS.
Wewnątrz notatnik Jupyter Studio Amazon SageMaker lub instancje notatników SageMaker. W tym poście używamy obrazu „Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)” z dostarczonymi fragmentami kodu, ale możesz użyć dowolnej innej wyższej wersji obrazu PyTorch z dostępne jądra SageMaker.
Zbiór danych w zasobniku S3, taki jak WikiTekst-2 zbiór danych z Rejestr otwartych danych na AWS.

Załaduj model Przytulonej twarzy do programu SageMaker, aby uzyskać wnioski dotyczące podsumowania tekstu

Użyj poniższego kodu, aby pobrać wstępnie wytrenowany model podsumowania tekstu Hugging Face DestylacjaBART-CNN-12-6 i jego tokenizer i zapisz je lokalnie w SageMaker w katalogu notatnika Jupyter:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

Skompresuj zapisany model podsumowania tekstu i jego tokenizer do formatu tar.gz i prześlij skompresowany artefakt modelu do zasobnika S3:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

Wybierz wnioskowanie obraz kontenera Docker wykonać wnioskowanie podsumowujące tekst. Zdefiniuj system operacyjny Linux, platformę PyTorch i wersję Hugging Face Transformer i określ Elastyczna chmura obliczeniowa Amazon (Amazon EC2) typ wystąpienia do uruchomienia kontenera.

Obraz Dockera jest dostępny w Rejestr elastycznego pojemnika Amazon (Amazon ECR) tego samego konta AWS, a link do tego obrazu kontenera jest zwracany jako identyfikator URI.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

Zdefiniuj model podsumowania tekstu, który ma zostać wdrożony przez wybrany obraz kontenera wykonujący wnioskowanie. W poniższym fragmencie kodu wdrażany jest skompresowany model przesłany do Amazon S3:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

Przetestuj wdrożony model podsumowania tekstu na przykładowych danych wejściowych:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

Użyj rekomendacji wnioskowania, aby ocenić optymalną instancję EC2 dla zadania wnioskowania

Następnie utwórz wiele próbek ładunku tekstu wejściowego w formacie JSON i skompresuj je w jeden plik ładunku. Te próbki ładunku są używane przez wnioskowanie rekomendujące do porównywania wydajności wnioskowania między różnymi typami wystąpień EC2. Każdy z przykładowych ładunków musi być zgodny z pokazanym wcześniej formatem JSON. Możesz uzyskać przykłady z WikiTekst-2 zestaw danych zarządzany przez fast.ai, dostępny na Rejestr otwartych danych na AWS.

Prześlij skompresowany artefakt modelu podsumowania tekstu i skompresowany przykładowy plik ładunku do zasobnika S3. Przesłaliśmy model we wcześniejszym kroku, ale dla jasności dołączamy kod, aby przesłać go ponownie:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

Przejrzyj listę standardowych modeli ML dostępnych w SageMaker w całym kraju wspólne wzorcowe ogrody zoologiczne, takich jak NLP i wizja komputerowa. Wybierz model NLP, aby przeprowadzić wnioskowanie podsumowujące tekst:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

Poniższy przykład wykorzystuje bert-base-cased Model NLP. Zarejestruj model podsumowania tekstu w Rejestr modeli SageMaker z poprawnie zidentyfikowaną domeną, frameworkiem i zadaniem z poprzedniego kroku. Parametry tego przykładu są wyświetlane na początku poniższego fragmentu kodu.

Zwróć uwagę na zakres typów instancji EC2, które mają być oceniane przez rekomendację wnioskowania w SupportedRealtimeInferenceInstanceTypes w poniższym kodzie. Upewnij się, że limity usług dla konta AWS pozwalają na wdrożenie tego typu węzłów wnioskowania.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

Utwórz domyślne zadanie rekomendacji wnioskowania za pomocą ModelPackageVersion wynikające z poprzedniego kroku. The uuid Biblioteka Pythona służy do generowania unikalnej nazwy zadania.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

Stan zadania rekomendacji wnioskowania można uzyskać, uruchamiając następujący kod:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

Kiedy status pracy to COMPLETED, porównaj opóźnienie wnioskowania, czas wykonywania i inne metryki typów instancji EC2 oceniane przez domyślne zadanie rekomendacji wnioskowania. Wybierz odpowiedni typ węzła na podstawie wymagań dotyczących przypadku użycia.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

Wnioski

SageMaker oferuje wiele sposobów korzystania z modeli Hugging Face; więcej przykładów znajdziesz w Przykłady AWS GitHub. W zależności od złożoności przypadku użycia i potrzeby dopracowania modelu, możesz wybrać optymalny sposób wykorzystania tych modeli. Rurociągi Hugging Face mogą być dobrym punktem wyjścia do szybkiego eksperymentowania i wyboru odpowiednich modeli. Gdy musisz dostosować i sparametryzować wybrane modele, możesz pobrać modele i wdrożyć je w dostosowanych punktach końcowych wnioskowania. Aby dokładniej dostosować model do konkretnego przypadku użycia, musisz go przeszkolić po pobraniu.

Ogólnie modele NLP, w tym modele podsumowania tekstu, działają lepiej po przeszkoleniu na zestawie danych, który jest specyficzny dla przypadku użycia. MLOP i funkcje monitorowania modelu w SageMaker zapewniają, że wdrożony model nadal działa zgodnie z oczekiwaniami. W tym poście użyliśmy rekomendacji wnioskowania do oceny najlepiej dopasowanego typu wystąpienia do wdrożenia modelu podsumowania tekstu. Te zalecenia mogą zoptymalizować wydajność i koszty dla przypadku użycia ML.

O autorach

Dr Nidal AlBeiruti jest starszym architektem rozwiązań w Amazon Web Services, pasjonuje się rozwiązaniami z zakresu uczenia maszynowego. Nidal ma ponad 25-letnie doświadczenie w pracy na różnych globalnych stanowiskach IT na różnych poziomach i w różnych branżach. Nidal działa jako zaufany doradca dla wielu klientów AWS, wspierając i przyspieszając ich podróż do przyjęcia chmury.

Darek Ko jest architektem rozwiązań z siedzibą w Londynie. Doradza klientom z małych i średnich firm z Wielkiej Brytanii i Irlandii w zakresie przebudowy i innowacji w chmurze. Darren interesuje się aplikacjami zbudowanymi w architekturze bezserwerowej i pasjonuje go rozwiązywanie problemów związanych ze zrównoważonym rozwojem za pomocą uczenia maszynowego.

Znak czasu: 15 czerwca 2022 r.

Znak czasu: Września 13, 2022

Podsumowanie tekstu za pomocą Amazon SageMaker i Hugging Face

Opublikowane ponownie przez Plato

Przegląd podsumowania tekstu

Modele podsumowania tekstu Hugging Face w AWS

Wymagania wstępne

Załaduj model Przytulonej twarzy do programu SageMaker, aby uzyskać wnioski dotyczące podsumowania tekstu

Użyj rekomendacji wnioskowania, aby ocenić optymalną instancję EC2 dla zadania wnioskowania

Wnioski

O autorach

Więcej z Uczenie maszynowe AWS

Model Hosting Patterns w SageMaker: Najlepsze praktyki w testowaniu i aktualizowaniu modeli w SageMaker

Przygotuj dane z Amazon EMR do uczenia maszynowego za pomocą Amazon SageMaker Data Wrangler

Zbuduj detektor anomalii punktów lojalnościowych za pomocą Amazon Lookout for Metrics

Zapobiegaj przejmowaniu kont przy logowaniu dzięki nowemu modelowi Account Takeover Insights w Amazon Fraud Detector

Zautomatyzuj i zaimplementuj kontrolę wersji często zadawanych pytań Amazon Kendra

Uzyskaj informacje z SAP ERP za pomocą rozwiązań ML bez kodu dzięki Amazon AppFlow i Amazon SageMaker Canvas

Przygotuj dane na dużą skalę w Amazon SageMaker Studio za pomocą bezserwerowych interaktywnych sesji AWS Glue

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto