Zero-shot tekstklassificering med Amazon SageMaker JumpStart

Genudgivet af Platon

Abonnenter: 0

Naturlig sprogbehandling (NLP) er feltet inden for maskinlæring (ML), der handler om at give computere evnen til at forstå tekst og talte ord på samme måde, som mennesker kan. For nylig har state-of-the-art arkitekturer som transformer arkitektur bruges til at opnå næsten menneskelig præstation på NLP-downstream-opgaver som tekstresumé, tekstklassificering, enhedsgenkendelse og mere.

Store sprogmodeller (LLM'er) er transformatorbaserede modeller trænet på en stor mængde umærket tekst med hundredvis af millioner (BERTI) til over en billion parametre (MiCS), og hvis størrelse gør single-GPU-træning upraktisk. På grund af deres iboende kompleksitet er uddannelse af en LLM fra bunden en meget udfordrende opgave, som meget få organisationer har råd til. En almindelig praksis for NLP-downstream-opgaver er at tage en foruddannet LLM og finjustere den. For mere information om finjustering, se Domænetilpasning Finjustering af fundamentmodeller i Amazon SageMaker JumpStart på finansielle data , Finjuster transformatorsprogmodeller til sproglig mangfoldighed med Hugging Face på Amazon SageMaker.

Zero-shot læring i NLP tillader en foruddannet LLM at generere svar på opgaver, som det ikke er blevet eksplicit trænet til (selv uden finjustering). Specifikt taler om tekstklassificering, Zero-shot tekstklassificering er en opgave i naturlig sprogbehandling, hvor en NLP-model bruges til at klassificere tekst fra usete klasser, i modsætning til overvåget klassificering, hvor NLP-modeller kun kan klassificere tekst, der hører til klasser i træningsdataene.

Vi har for nylig lanceret understøttelse af nul-skudsklassifikationsmodel i Amazon SageMaker JumpStart. SageMaker JumpStart er ML-hubben i Amazon SageMaker der giver adgang til forudtrænede fundamentmodeller (FM'er), LLM'er, indbyggede algoritmer og løsningsskabeloner for at hjælpe dig med hurtigt at komme i gang med ML. I dette indlæg viser vi, hvordan du kan udføre nul-skudsklassificering ved hjælp af fortrænede modeller i SageMaker Jumpstart. Du vil lære, hvordan du bruger SageMaker Jumpstart UI og SageMaker Python SDK til at implementere løsningen og køre inferens ved hjælp af de tilgængelige modeller.

Zero-shot læring

Zero-shot klassifikation er et paradigme, hvor en model kan klassificere nye, usete eksempler, der hører til klasser, der ikke var til stede i træningsdataene. For eksempel kan en sprogmodel, der er blevet trænet til at forstå menneskeligt sprog, bruges til at klassificere nytårsforsætter-tweets på flere klasser som f.eks. career, healthog finance, uden at sprogmodellen er eksplicit trænet på tekstklassificeringsopgaven. Dette er i modsætning til finjustering af modellen, da sidstnævnte indebærer genoptræning af modellen (gennem transfer learning), mens nul-skudslæring ikke kræver yderligere træning.

Følgende diagram illustrerer forskellene mellem overførselslæring (venstre) vs. nulskudslæring (højre).

Yin et al. foreslået en ramme for oprettelse af nul-skudsklassifikatorer ved hjælp af naturlig sproginferens (NLI). Rammen fungerer ved at placere sekvensen, der skal klassificeres som en NLI-præmis og konstruerer en hypotese ud fra hver kandidatlabel. For eksempel hvis vi ønsker at evaluere, om en sekvens hører til klassen politics, kunne vi konstruere en hypotese om "Denne tekst handler om politik." Sandsynlighederne for involvering og modsigelse konverteres derefter til mærkesandsynligheder. Som en hurtig gennemgang betragter NLI to sætninger: en præmis og en hypotese. Opgaven er at afgøre, om hypotesen er sand (medfølgende) eller falsk (modsigelse) givet præmissen. Følgende tabel giver nogle eksempler.

forudsætning	etiket	Hypotese
En mand inspicerer uniformen af en figur i et østasiatisk land.	Modsigelse	Manden sover.
En ældre og yngre mand smiler.	Neutral	To mænd smiler og griner af kattene, der leger på gulvet.
En fodboldkamp med flere mænd, der spiller.	medvirken	Nogle mænd dyrker en sport.

Løsningsoversigt

I dette indlæg diskuterer vi følgende:

Sådan implementerer du forudtrænede zero-shot tekstklassificeringsmodeller ved hjælp af SageMaker JumpStart UI og kører inferens på den implementerede model ved hjælp af korte tekstdata
Sådan bruger du SageMaker Python SDK til at få adgang til de forudtrænede nul-shot-tekstklassificeringsmodeller i SageMaker JumpStart og bruge inferensscriptet til at implementere modellen til et SageMaker-slutpunkt for en real-time tekstklassificering
Sådan bruger du SageMaker Python SDK til at få adgang til forudtrænede zero-shot tekstklassificeringsmodeller og bruge SageMaker batch transformation til en batch tekstklassificering use case

SageMaker JumpStart giver finjustering og implementering med et enkelt klik til en lang række præ-trænede modeller på tværs af populære ML-opgaver, samt et udvalg af end-to-end-løsninger, der løser almindelige forretningsproblemer. Disse funktioner fjerner de tunge løft fra hvert trin i ML-processen, hvilket forenkler udviklingen af højkvalitetsmodeller og reducerer tiden til implementering. Det JumpStart API'er giver dig mulighed for programmæssigt at implementere og finjustere et stort udvalg af forudtrænede modeller på dine egne datasæt.

JumpStart-modelhubben giver adgang til et stort antal NLP-modeller, der muliggør overførselsindlæring og finjustering på brugerdefinerede datasæt. Når dette skrives, indeholder JumpStart-modelhubben over 300 tekstmodeller på tværs af en række populære modeller, såsom Stable Diffusion, Flan T5, Alexa TM, Bloom og mere.

Bemærk, at ved at følge trinene i dette afsnit, vil du implementere infrastruktur til din AWS-konto, som kan medføre omkostninger.

Implementer en selvstændig nul-shot-tekstklassificeringsmodel

I dette afsnit demonstrerer vi, hvordan man implementerer en nul-skuds klassificeringsmodel ved hjælp af SageMaker JumpStart. Du kan få adgang til fortrænede modeller via JumpStart-landingssiden i Amazon SageMaker Studio. Udfør følgende trin:

I SageMaker Studio skal du åbne JumpStart-destinationssiden.
Der henvises til Åbn og brug JumpStart for flere detaljer om, hvordan du navigerer til SageMaker JumpStart.
I Tekstmodeller karrusel, skal du finde modelkortet "Zero-Shot Text Classification".
Vælg Se model at få adgang til facebook-bart-large-mnli model.
Alternativt kan du søge efter nulskudsklassifikationsmodellen i søgefeltet og komme til modellen i SageMaker JumpStart.
Angiv en implementeringskonfiguration, SageMaker-hostingforekomsttype, slutpunktsnavn, Amazon Simple Storage Service (Amazon S3) spandnavn og andre nødvendige parametre.
Du kan eventuelt angive sikkerhedskonfigurationer som f.eks AWS identitets- og adgangsstyring (IAM) rolle, VPC-indstillinger og AWS Key Management Service (AWS KMS) krypteringsnøgler.
Vælg Implementer for at oprette et SageMaker-slutpunkt.

Dette trin tager et par minutter at fuldføre. Når det er færdigt, kan du køre slutninger mod SageMaker-slutpunktet, der er vært for nul-skudsklassifikationsmodellen.

I den følgende video viser vi en gennemgang af trinene i dette afsnit.

Brug JumpStart programmatisk med SageMaker SDK

I SageMaker JumpStart-sektionen af SageMaker Studio, under Lynstartløsninger, kan du finde løsningsskabeloner. SageMaker JumpStart løsningsskabeloner er et-klik, end-to-end-løsninger til mange almindelige ML-brugstilfælde. Når dette skrives, er over 20 løsninger tilgængelige til flere anvendelsessager, såsom efterspørgselsprognoser, svindeldetektion og personlige anbefalinger, for at nævne nogle få.

"Zero Shot Text Classification with Hugging Face"-løsningen giver en måde at klassificere tekst på uden at skulle træne en model til specifikke etiketter (nulskudsklassifikation) ved at bruge en forudtrænet tekstklassifikator. Standard nul-skuds klassificeringsmodellen for denne løsning er facebook-bart-large-mnli (BART) model. Til denne løsning bruger vi 2015 nytårsforsætter datasæt at klassificere resolutioner. Et undersæt af det originale datasæt, der kun indeholder Resolution_Category (ground truth label) og text kolonner indgår i løsningens aktiver.

Inputdataene inkluderer tekststrenge, en liste over ønskede kategorier til klassificering, og om klassificeringen er multi-label eller ej til synkron (realtids) inferens. Til asynkron (batch) inferens giver vi en liste over tekststrenge, listen over kategorier for hver streng, og om klassificeringen er multi-label eller ej i en JSON-linjers formateret tekstfil.

Resultatet af slutningen er et JSON-objekt, der ligner det følgende skærmbillede.

Vi har den originale tekst i sequence felt, de etiketter, der bruges til tekstklassificeringen i labels felt, og sandsynligheden, der er tildelt hver etiket (i samme rækkefølge) i feltet scores.

Udfør følgende trin for at implementere Zero Shot Text Classification with Hugging Face-løsningen:

På SageMaker JumpStart-landingssiden skal du vælge Modeller, notesbøger, løsninger i navigationsruden.
I Løsninger sektion, skal du vælge Udforsk alle løsninger.
På Løsninger side, skal du vælge modelkortet Zero Shot Text Classification with Hugging Face.
Gennemgå installationsdetaljerne, og vælg, hvis du er enig Launch.

Implementeringen vil levere et SageMaker-realtidsslutpunkt til realtidsslutning og en S3-bøtte til lagring af batchtransformationsresultaterne.

Følgende diagram illustrerer arkitekturen af denne metode.

Udfør inferens i realtid ved hjælp af en nul-skuds klassificeringsmodel

I dette afsnit gennemgår vi, hvordan du bruger Python SDK til at køre nul-shot tekstklassificering (ved at bruge en af de tilgængelige modeller) i realtid ved hjælp af et SageMaker-slutpunkt.

Først konfigurerer vi inferensnyttelastanmodningen til modellen. Dette er modelafhængigt, men for BART-modellen er inputtet et JSON-objekt med følgende struktur:

{
“inputs”: # The text to be classified
“parameters”: {
“candidate_labels”: # A list of the labels we want to use for the text classification
“multi_label”: True | False
}
}

Bemærk, at BART-modellen ikke er eksplicit trænet i candidate_labels. Vi vil bruge nul-skuds klassifikationsteknikken til at klassificere tekstsekvensen til usete klasser. Følgende kode er et eksempel, der bruger tekst fra datasættet med nytårsforsætter og de definerede klasser:

classification_categories = ['Health', 'Humor', 'Personal Growth', 'Philanthropy', 'Leisure', 'Career', 'Finance', 'Education', 'Time Management']
data_zero_shot = { "inputs": "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", "parameters": { "candidate_labels": classification_categories, "multi_label": False
}
}

Dernæst kan du kalde et SageMaker-slutpunkt med nul-skuds nyttelasten. SageMaker-endepunktet er implementeret som en del af SageMaker JumpStart-løsningen.

response = runtime.invoke_endpoint(EndpointName=sagemaker_endpoint_name,
ContentType='application/json',
Body=json.dumps(payload)) parsed_response = json.loads(response['Body'].read())

Inferensresponsobjektet indeholder den originale sekvens, etiketterne sorteret efter score fra maks. til min, og scorerne pr. etiket:

{'sequence': "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", 'labels': ['Personal Growth', 'Health', 'Time Management', 'Leisure', 'Education', 'Humor', 'Career', 'Philanthropy', 'Finance'], 'scores': [0.4198768436908722,
0.2169460505247116,
0.16591140627861023,
0.09742163866758347,
0.031757451593875885,
0.027988269925117493,
0.015974704176187515,
0.015464971773326397,
0.008658630773425102]}

Kør et SageMaker batch transformationsjob ved hjælp af Python SDK

Dette afsnit beskriver, hvordan man kører batchtransformationsinferens med nul-skudsklassifikationen facebook-bart-large-mnli model ved hjælp af SageMaker Python SDK. Udfør følgende trin:

Formater inputdataene i JSON-linjeformat og upload filen til Amazon S3.
SageMaker batchtransformation udfører slutninger om de datapunkter, der er uploadet i S3-filen.

Konfigurer modelimplementeringsartefakter med følgende parametre:

model_id - Brug huggingface-zstc-facebook-bart-large-mnli.
deploy_image_uri - Brug image_uris Python SDK-funktion til at få det forudbyggede SageMaker Docker-billede til model_id. Funktionen returnerer Amazon Elastic Container Registry (Amazon ECR) URI.
deploy_source_uri – Brug script_uris utility-API til at hente S3-URI'en, der indeholder scripts til at køre præ-trænet modelslutning. Vi specificerer script_scope as inference.

model_uri - Brug model_uri for at få modelartefakter fra Amazon S3 til den angivne model_id.

#imports
from sagemaker import image_uris, model_uris, script_uris, hyperparameters #set model id and version
model_id, model_version, = ( "huggingface-zstc-facebook-bart-large-mnli", "*",
) # Retrieve the inference Docker container URI. This is the base Hugging Face container image for the default model above.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None, # Automatically inferred from model_id
image_scope="inference",
model_id=model_id,
model_version=model_version,
instance_type="ml.g4dn.xlarge",
) # Retrieve the inference script URI. This includes all dependencies and scripts for model loading, inference handling, and more.
deploy_source_uri = script_uris.retrieve(model_id=model_id, model_version=model_version, script_scope="inference") # Retrieve the model URI. This includes the pre-trained model and parameters.
model_uri = model_uris.retrieve(model_id=model_id, model_version=model_version, model_scope="inference")

Brug HF_TASK at definere opgaven for Hugging Face transformers pipeline og HF_MODEL_ID for at definere den model, der bruges til at klassificere teksten:

# Hub model configuration <https://huggingface.co/models>
hub = { 'HF_MODEL_ID':'facebook/bart-large-mnli', # The model_id from the Hugging Face Hub 'HF_TASK':'zero-shot-classification' # The NLP task that you want to use for predictions
}

For en komplet liste over opgaver, se Rørledninger i Knusende ansigt-dokumentationen.

Opret et Hugging Face-modelobjekt, der skal implementeres med SageMaker batch-transformationsjobbet:

# Create HuggingFaceModel class
huggingface_model_zero_shot = HuggingFaceModel(
model_data=model_uri, # path to your trained sagemaker model
env=hub, # configuration for loading model from Hub
role=role, # IAM role with permissions to create an endpoint
transformers_version="4.17", # Transformers version used
pytorch_version="1.10", # PyTorch version used
py_version='py38', # Python version used
)

Opret en transformation for at køre et batchjob:

# Create transformer to run a batch job
batch_job = huggingface_model_zero_shot.transformer(
instance_count=1,
instance_type='ml.m5.xlarge',
strategy='SingleRecord',
assemble_with='Line',
output_path=s3_path_join("s3://",sagemaker_config['S3Bucket'],"zero_shot_text_clf", "results"), # we are using the same s3 path to save the output with the input
)

Start et batchtransformationsjob og brug S3-data som input:

batch_job.transform(
data=data_upload_path,
content_type='application/json',
split_type='Line',
logs=False,
wait=True
)

Du kan overvåge dit batchbehandlingsjob på SageMaker-konsollen (vælg Batch transformation job under Inferens i navigationsruden). Når jobbet er færdigt, kan du kontrollere modelforudsigelsesoutputtet i S3-filen specificeret i output_path.

For en liste over alle tilgængelige fortrænede modeller i SageMaker JumpStart, se Indbyggede algoritmer med fortrænet modelbord. Brug søgeordet "zstc" (forkortelse for nul-skuds tekstklassificering) i søgefeltet for at finde alle modeller, der er i stand til at lave nul-skuds tekstklassificering.

Ryd op

Når du er færdig med at køre notesbogen, skal du sørge for at slette alle ressourcer, der er oprettet i processen, for at sikre, at omkostningerne påløbet af de aktiver, der er implementeret i denne vejledning, stoppes. Koden til at rydde op i de implementerede ressourcer findes i de notesbøger, der er knyttet til nul-shot-tekstklassificeringsløsningen og -modellen.

Standard sikkerhedskonfigurationer

SageMaker JumpStart-modellerne implementeres ved hjælp af følgende standardsikkerhedskonfigurationer:

For at lære mere om SageMaker sikkerhedsrelaterede emner, tjek ud Konfigurer sikkerhed i Amazon SageMaker.

Konklusion

I dette indlæg viste vi dig, hvordan du implementerer en nul-skudsklassificeringsmodel ved hjælp af SageMaker JumpStart UI og udfører inferens ved hjælp af det implementerede slutpunkt. Vi brugte SageMaker JumpStart nytårsfortsætter-løsningen til at vise, hvordan du kan bruge SageMaker Python SDK til at bygge en ende-til-ende-løsning og implementere nul-skuds klassificeringsapplikation. SageMaker JumpStart giver adgang til hundredvis af præ-trænede modeller og løsninger til opgaver som computersyn, naturlig sprogbehandling, anbefalingssystemer og mere. Prøv løsningen på egen hånd og fortæl os dine tanker.

Om forfatterne

David Laredo er Prototyping Architect hos AWS Envision Engineering i LATAM, hvor han har hjulpet med at udvikle flere maskinlæringsprototyper. Tidligere har han arbejdet som Machine Learning Engineer og har lavet maskinlæring i over 5 år. Hans interesseområder er NLP, tidsserier og end-to-end ML.

Vikram Elango er en AI/ML Specialist Solutions Architect hos Amazon Web Services, baseret i Virginia, USA. Vikram hjælper finans- og forsikringsbranchens kunder med design og tankelederskab med at bygge og implementere maskinlæringsapplikationer i stor skala. Han er i øjeblikket fokuseret på naturlig sprogbehandling, ansvarlig AI, inferensoptimering og skalering af ML på tværs af virksomheden. I sin fritid nyder han at rejse, vandre, lave mad og campere med sin familie.

Dr. Vivek Madan er en anvendt videnskabsmand hos Amazon SageMaker JumpStart-teamet. Han fik sin ph.d. fra University of Illinois i Urbana-Champaign og var postdoktor ved Georgia Tech. Han er en aktiv forsker i maskinlæring og algoritmedesign og har publiceret artikler i EMNLP, ICLR, COLT, FOCS og SODA konferencer.

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
PlatoESG. Automotive/elbiler, Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
ChartPrime. Løft dit handelsspil med ChartPrime. Adgang her.
BlockOffsets. Modernisering af miljømæssig offset-ejerskab. Adgang her.
Kilde: https://aws.amazon.com/blogs/machine-learning/zero-shot-text-classification-with-amazon-sagemaker-jumpstart/

Tidsstempel: August 11, 2023

Tidsstempel: September 30, 2022

Zero-shot tekstklassificering med Amazon SageMaker JumpStart | Amazon Web Services

Genudgivet af Platon

Zero-shot læring

Løsningsoversigt

Implementer en selvstændig nul-shot-tekstklassificeringsmodel

Brug JumpStart programmatisk med SageMaker SDK

Udfør inferens i realtid ved hjælp af en nul-skuds klassificeringsmodel

Kør et SageMaker batch transformationsjob ved hjælp af Python SDK

Ryd op

Standard sikkerhedskonfigurationer

Konklusion

Om forfatterne

Mere fra AWS maskinindlæring

Hvordan LotteON byggede dynamisk A/B-test til deres personlige anbefalingssystem | Amazon Web Services

Reducer den tid, det tager at implementere dine modeller til Amazon SageMaker til test

Annoncering af AWS DeepRacer League 2022

Byg videnbaserede samtaleapplikationer ved hjælp af LlamaIndex og Llama 2-Chat | Amazon Web Services

Reducer omkostningerne og kompleksiteten af ML-forbehandling med Amazon S3 Object Lambda

Hvordan Patsnap brugte GPT-2-inferens på Amazon SageMaker med lav forsinkelse og pris | Amazon Web Services

Byg fleksible og skalerbare distribuerede træningsarkitekturer ved hjælp af Kubeflow på AWS og Amazon SageMaker

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto