Text Summarization With Amazon SageMaker And Hugging Face

Taasavaldanud Platon

järgijaid: 0

Selles postituses näitame teile, kuidas rakendada ühte enim allalaaditud Hugging Face'i eelkoolitatud mudelit, mida kasutatakse teksti kokkuvõtete tegemiseks, DistilBART-CNN-12-6, Jupyteri sülearvutis kasutades Amazon SageMaker ja SageMakeri kallistava näo järelduse tööriistakomplekt. Selles postituses näidatud sammude põhjal võite proovida teha tekstist kokkuvõte WikiTekst-2 andmestik haldab fast.ai, saadaval aadressil AWS-i avaandmete register.

Ülemaailmsed andmemahud kasvavad zettabaitide skaalal, kuna ettevõtted ja tarbijad laiendavad oma digitaalsete toodete ja võrguteenuste kasutamist. Nende kasvavate andmete paremaks mõistmiseks on tekstianalüüsi jaoks välja töötatud masinõppe (ML) loomuliku keele töötlemise (NLP) tehnikad, mis käsitlevad kasutusjuhtumeid, mis hõlmavad teksti kokkuvõtet, olemi tuvastamist, klassifitseerimist, tõlkimist ja palju muud. AWS pakub eelkoolitatud AWS AI teenused mida saab API-kõnede abil rakendustesse integreerida ja mis ei nõua ML-i kogemust. Näiteks, Amazoni mõistmine saab täita NLP-ülesandeid, nagu kohandatud olemi tuvastamine, sentimentide analüüs, võtmefraaside eraldamine, teemade modelleerimine ja palju muud, et koguda tekstist teadmisi. See võib esineda tekstianalüüs paljudes keeltes selle erinevate funktsioonide pärast.

Teksti kokkuvõte on kasulik tehnika suurte tekstiandmete mõistmisel, kuna see loob lähtedokumentidest kontekstuaalselt tähendusliku teabe alamhulga. Seda NLP-tehnikat saate rakendada pikemate tekstidokumentide ja artiklite puhul, mis võimaldab kiiremat tarbimist ja tõhusamat dokumentide indekseerimist, näiteks koosolekute kõnemärkmete kokkuvõtmiseks.

Kallistav nägu on populaarne avatud lähtekoodiga teek NLP jaoks, mis sisaldab üle 49,000 185 eelkoolitatud mudeli rohkem kui XNUMX keeles ja toetab erinevaid raamistikke. AWS-il ja Hugging Face'il on a partnerlus mis võimaldab sujuvat integreerimist SageMakeri kaudu AWS-i süvaõppekonteinerite (DLC-de) komplektiga PyTorchis või TensorFlow's treenimiseks ja järelduste tegemiseks ning SageMaker Python SDK jaoks mõeldud Hugging Face hindajate ja ennustajatega. Need SageMakeri võimalused aitavad arendajatel ja andmeteadlastel NLP-ga AWS-is hõlpsamini alustada. Tekstide töötlemine transformaatoritega sügavates õpperaamistikes, nagu PyTorch, on andmeteadlaste jaoks tavaliselt keeruline ja aeganõudev ülesanne, mis põhjustab NLP-projektide arendamisel sageli pettumust ja ebaefektiivsust. Tehisintellekti kogukondade, nagu Hugging Face, tõus koos pilves olevate ML-teenuste (nt SageMaker) võimsusega kiirendab ja lihtsustab nende tekstitöötlusülesannete arendamist. SageMaker aitab teil Hugging Face mudeleid ehitada, koolitada, juurutada ja kasutusele võtta.

Teksti kokkuvõtte ülevaade

Saate rakendada teksti kokkuvõtet, et tuvastada dokumendi põhilaused või tuvastada võtmelaused mitmes dokumendis. Teksti kokkuvõte võib anda kahte tüüpi kokkuvõtteid: ekstraheerivad ja abstraktsed. Väljavõttelised kokkuvõtted ei sisalda masinaga loodud teksti ja on sisenddokumendist valitud oluliste lausete kogu. Abstraktsed kokkuvõtted sisaldavad uusi inimloetavaid fraase ja lauseid, mis on genereeritud teksti kokkuvõtte mudeli abil. Enamik teksti kokkuvõtete süsteeme põhinevad väljavõtlikul kokkuvõttel, kuna täpset abstraktset teksti kokkuvõtet on raske saavutada.

Hugging Face'is on üle 400 eelkoolitatud tipptasemel seadme Saadaval on teksti kokkuvõtte mudelid, rakendades erinevaid NLP tehnikate kombinatsioone. Neid mudeleid koolitatakse erinevate andmekogumitega, neid laadivad üles ja hooldavad tehnoloogiaettevõtted ja Hugging Face kogukonna liikmed. Saate mudeleid filtreerida enim allalaaditud või enim meeldinud järgi ning neid kasutades otse laadida kokkuvõte torujuhe Hugging Face transformer API. Hugging Face trafo lihtsustab NLP juurutamise protsessi, nii et suure jõudlusega NLP-mudeleid saab tekstikokkuvõtete edastamiseks peenhäälestada, ilma et oleks vaja ulatuslikke ML-operatsiooniteadmisi.

Kallistava näo teksti kokkuvõtte mudelid AWS-is

SageMaker pakub ärianalüütikutele, andmeteadlastele ja MLOpsi inseneridele valikut tööriistu AWS-is ML-i töökoormuste kavandamiseks ja käitamiseks. Need tööriistad pakuvad teile optimaalsete tulemuste saavutamiseks ML-mudelite kiiremat juurutamist ja testimist.

Alates SageMakeri kallistava näo järelduse tööriistakomplekt, avatud lähtekoodiga raamatukogu, kirjeldame kolme erinevat viisi Hugging Face teksti kokkuvõtete mudelite juurutamiseks ja hostimiseks Jupyteri märkmiku abil:

Kallistava näo kokkuvõtte torujuhe - Loo Kallistava näo kokkuvõtte torujuhe kasutadessummarization” ülesande identifikaator, et kasutada Jupyteri märkmikus järelduste tegemiseks vaiketeksti kokkuvõtte mudelit. Need torujuhtmed eemaldavad keeruka koodi, pakkudes algajatele ML-i praktikutele lihtsat API-d, et kiiresti rakendada teksti kokkuvõtet ilma järelduse lõpp-punkti konfigureerimata. Samuti võimaldab torujuhe ML-i praktikul valida konkreetse eelkoolitatud mudeli ja sellega seotud tokenisaatori. Tokenisaatorid valmistavad teksti ette mudeli sisendiks, jagades teksti sõnadeks või alamsõnadeks, mis seejärel teisendatakse otsingutabeli kaudu ID-deks. Lihtsuse huvides näeb järgmine koodilõik torujuhtmete kasutamisel ette vaikejuhtumi. The DistilBART-CNN-12-6 mudel on Hugging Face'i üks enim allalaaditud kokkuvõttemudeleid ja on kokkuvõtte konveieri vaikemudel. Viimane rida kutsub eelkoolitatud mudelit, et saada läbitud teksti kokkuvõte, võttes arvesse kahte argumenti.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```

SageMakeri lõpp-punkt eelkoolitatud mudeliga – Looge SageMakeri lõpp-punkt eelnevalt koolitatud mudeliga Kallistavate näomudelite keskus ja juurutage see järelduse lõpp-punktis, näiteks järgmise koodilõigu eksemplaris ml.m5.xlarge. See meetod võimaldab kogenud ML-praktikutel kiiresti valida konkreetseid avatud lähtekoodiga mudeleid, neid peenhäälestada ja kasutada mudeleid suure jõudlusega järelduseksemplaridel.

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")

SageMakeri lõpp-punkt koolitatud mudeliga – Looge SageMakeri mudeli lõpp-punkt väljaõppinud mudeliga, mis on salvestatud an Amazoni lihtne salvestusteenus (Amazon S3) ämbrisse ja juurutage see järelduse lõpp-punktis. See meetod võimaldab kogenud ML-praktikutel kiiresti juurutada oma Amazon S3-sse salvestatud mudeleid suure jõudlusega järelduseksemplaridele. Mudel ise laaditakse Hugging Face'ist alla ja tihendatakse ning seejärel saab selle Amazon S3-sse üles laadida. Seda sammu demonstreeritakse järgmises koodilõigul:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

AWS-il on saadaval mitmeid ressursse, mis aitavad teil ML-i töökoormusi juurutada. The Masinõppeobjektiiv Euroopa AWS hästi arhitektuurne raamistik soovitab ML töökoormuse parimaid tavasid, sealhulgas ressursside optimeerimist ja kulude vähendamist. Need soovitatavad disainipõhimõtted tagavad, et AWS-is rakendatakse hästi läbimõeldud ML-töökoormust tootmises. Amazon SageMakeri järelduste soovitus aitab teil valida õige eksemplari ML-mudelite juurutamiseks optimaalse jõudluse ja kuludega. Inference Recommender kiirendab mudeli juurutamist ja vähendab turule jõudmiseks kuluvat aega, automatiseerides koormustesti ja optimeerides mudeli jõudlust ML eksemplaride lõikes.

Järgmistes osades demonstreerime, kuidas laadida treenitud mudel S3 ämbrist ja juurutada see sobivasse järelduseksemplari.

Eeldused

Selle ülevaate jaoks peaksid teil olema järgmised eeltingimused.

An AWS-i konto.
Jupyteri märkmik sees Amazon SageMaker Studio or SageMaker notebook instances. In this post, we use the “Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)” image with the provided code snippets, but you can use any other higher version PyTorch image from the available SageMaker kernels.
A dataset in your S3 bucket, such as the WikiTekst-2 andmestik alates AWS-i avaandmete register.

Laadige Kallistava näo mudel SageMakerisse teksti kokkuvõtte tegemiseks

Kasutage Hugging Face eelkoolitatud teksti kokkuvõtte mudeli allalaadimiseks järgmist koodi DistilBART-CNN-12-6 ja selle tokeniseerija ning salvestage need kohapeal SageMakeris oma Jupyteri märkmiku kataloogi:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

Tihendage salvestatud teksti kokkuvõttemudel ja selle tokenisaator vormingusse tar.gz ja laadige tihendatud mudeli artefakt üles S3 ämbrisse:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

Valige a järeldus Dockeri konteineri kujutis teksti kokkuvõtte tegemiseks. Määratlege Linuxi OS, PyTorchi raamistik ja Hugging Face Transformeri versioon ning määrake Amazon Elastic Compute Cloud (Amazon EC2) eksemplari tüüp konteineri käitamiseks.

Dockeri pilt on saadaval aadressil Amazoni elastsete konteinerite register (Amazon ECR) sama AWS-i konto ja selle konteineri kujutise link tagastatakse URI-na.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

Määratlege teksti kokkuvõtte mudel, mille juurutab valitud konteineri kujutis, mis teeb järeldusi. Järgmises koodilõigul juurutatakse Amazon S3-sse üles laaditud tihendatud mudel:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

Testige juurutatud teksti kokkuvõtte mudelit näidissisendil:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

Järeldusülesande optimaalse EC2 eksemplari hindamiseks kasutage Järeldussoovitust

Järgmisena looge JSON-vormingus sisendteksti mitu kasuliku koormuse näidist ja tihendage need üheks kasuliku koormuse failiks. Neid kasuliku koormuse näidiseid kasutab Järeldussoovitaja, et võrrelda järelduste jõudlust erinevate EC2 eksemplaritüüpide vahel. Iga näidiskoormus peab vastama varem näidatud JSON-vormingule. Näiteid saate aadressilt WikiTekst-2 andmestik haldab fast.ai, saadaval aadressil AWS-i avaandmete register.

Laadige tihendatud teksti kokkuvõtte mudeli artefakt ja tihendatud kasuliku koormuse näidisfail üles S3 ämbrisse. Laadisime mudeli üles varasemas etapis, kuid selguse huvides lisame selle uuesti üleslaadimiseks koodi:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

Vaadake üle SageMakeris saadaolevate standardsete ML-mudelite loend tavalised loomaaiad, nagu NLP ja arvutinägemine. Valige teksti kokkuvõtte tegemiseks NLP-mudel:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

Järgmises näites kasutatakse bert-base-cased NLP mudel. Registreerige teksti kokkuvõtte mudel jaotisesse SageMakeri mudeliregister eelmises etapis õigesti tuvastatud domeeni, raamistiku ja ülesandega. Selle näite parameetrid on näidatud järgmise koodilõigu alguses.

Pange tähele EC2 eksemplaritüüpide vahemikku, mida Järeldussoovitaja peab hindama SupportedRealtimeInferenceInstanceTypes järgmises koodis. Veenduge, et AWS-i konto teenusepiirangud võimaldavad seda tüüpi järeldussõlmede juurutamist.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

Looge Järeldussoovitaja vaiketöö, kasutades ModelPackageVersion mis tuleneb eelmisest etapist. The uuid Pythoni teeki kasutatakse töö kordumatu nime loomiseks.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

Järeldussoovitaja töö oleku saate vaadata, käivitades järgmise koodi:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

Kui töö staatus on COMPLETED, võrrelge järelduste soovituse vaiketööga hinnatud EC2 eksemplari tüüpide järelduste latentsust, käitusaega ja muid mõõdikuid. Valige sobiv sõlme tüüp vastavalt oma kasutusjuhtumi nõuetele.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

Järeldus

SageMaker pakub Hugging Face mudelite kasutamiseks mitmeid viise; rohkemate näidete saamiseks vaadake AWS-i näidised GitHubis. Olenevalt kasutusjuhtumi keerukusest ja mudeli peenhäälestamise vajadusest saate valida optimaalse viisi nende mudelite kasutamiseks. Hugging Face torujuhtmed võivad olla hea lähtepunkt kiireks katsetamiseks ja sobivate mudelite valimiseks. Kui teil on vaja valitud mudeleid kohandada ja parameetreid muuta, saate mudelid alla laadida ja kohandatud järelduste lõpp-punktidesse juurutada. Mudeli täpsemaks häälestamiseks konkreetse kasutusjuhtumi jaoks peate mudelit pärast allalaadimist koolitama.

NLP mudelid üldiselt, sealhulgas teksti kokkuvõtete mudelid, toimivad paremini pärast seda, kui neid on õpetatud konkreetsele kasutusjuhtumile vastava andmestikuga. SageMakeri MLOP-id ja mudeli jälgimise funktsioonid tagavad, et juurutatud mudel toimib jätkuvalt ootuste piires. Selles postituses kasutasime teksti kokkuvõtte mudeli juurutamiseks kõige sobivama eksemplaritüübi hindamiseks Inference Recommenderit. Need soovitused võivad teie ML-i kasutusjuhtumi jaoks jõudlust ja kulusid optimeerida.

Autoritest

Dr Nidal AlBeiruti on Amazon Web Servicesi vanemlahenduste arhitekt, kelle kirg on masinõppelahendused. Nidalil on üle 25-aastane kogemus erinevatel globaalsetel IT-rollidel erinevatel tasanditel ja erinevatel vertikaaltel. Nidal on paljude AWS-i klientide jaoks usaldusväärne nõustaja, kes toetab ja kiirendab nende pilve kasutuselevõttu.

Darren Ko on Londonis asuv lahenduste arhitekt. Ta nõustab Ühendkuningriigi ja Iirimaa VKE-kliente pilvepõhise ümberarhitektuuri ja uuenduste tegemisel. Darrenit huvitavad serverita arhitektuuriga loodud rakendused ja ta on kirglik jätkusuutlikkuse väljakutsete lahendamise vastu masinõppega.

Ajatempel: Juuni 15, 2022

Ajatempel: September 13, 2022

Teksti kokkuvõte rakendusega Amazon SageMaker ja Hugging Face

Taasavaldanud Platon

Teksti kokkuvõtte ülevaade

Kallistava näo teksti kokkuvõtte mudelid AWS-is

Eeldused

Laadige Kallistava näo mudel SageMakerisse teksti kokkuvõtte tegemiseks

Järeldusülesande optimaalse EC2 eksemplari hindamiseks kasutage Järeldussoovitust

Järeldus

Autoritest

Veel alates AWS-i masinõpe

Mudelite hostimise mustrid SageMakeris: SageMakeri mudelite testimise ja värskendamise parimad tavad

Valmistage Amazon EMR-i andmed ette masinõppeks, kasutades Amazon SageMaker Data Wrangleri

Looge Amazon Lookout for Metricsi abil lojaalsuspunktide anomaaliate detektor

Ennetage konto ülevõtmist sisselogimisel Amazoni pettustedetektori uue konto ülevõtmise ülevaate mudeliga

Automatiseerige ja rakendage Amazon Kendra KKK-de versioonikontrolli

Hankige teavet SAP ERP-st koodita ML-lahendustega Amazon AppFlow ja Amazon SageMaker Canvasega

Valmistage Amazon SageMaker Studios mastaapsed andmed ette, kasutades serverita AWS Glue interaktiivseid seansse

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto