Zero-shot textklassificering med Amazon SageMaker JumpStart

Återutgiven av Platon

anhängare: 0

Naturlig språkbehandling (NLP) är det område inom maskininlärning (ML) som handlar om att ge datorer förmågan att förstå text och talade ord på samma sätt som människor kan. Nyligen har state-of-the-art arkitekturer som transformatorarkitektur används för att uppnå nästan mänsklig prestation på NLP-nedströmsuppgifter som textsammanfattning, textklassificering, enhetsigenkänning och mer.

Stora språkmodeller (LLM) är transformatorbaserade modeller tränade på en stor mängd omärkt text med hundratals miljoner (BERTI) till över en biljon parametrar (MiCS), och vars storlek gör träning med en GPU opraktisk. På grund av deras inneboende komplexitet är att träna en LLM från grunden en mycket utmanande uppgift som väldigt få organisationer har råd med. En vanlig praxis för NLP nedströms uppgifter är att ta en förutbildad LLM och finjustera den. För mer information om finjustering, se Domänanpassning Finjustering av grundmodeller i Amazon SageMaker JumpStart på finansiell data och Finjustera transformatorspråksmodeller för språklig mångfald med Hugging Face på Amazon SageMaker.

Zero-shot inlärning i NLP tillåter en förutbildad LLM för att generera svar på uppgifter som den inte explicit har tränats för (även utan finjustering). När det gäller textklassificering, nollbildstextklassificering är en uppgift inom naturlig språkbehandling där en NLP-modell används för att klassificera text från osynliga klasser, till skillnad från övervakad klassificering, där NLP-modeller endast kan klassificera text som hör till klasser i träningsdata.

Vi lanserade nyligen zero-shot klassificeringsmodellstöd i Amazon SageMaker JumpStart. SageMaker JumpStart är ML-navet i Amazon SageMaker som ger tillgång till förutbildade grundmodeller (FM), LLM, inbyggda algoritmer och lösningsmallar för att hjälpa dig att snabbt komma igång med ML. I det här inlägget visar vi hur du kan utföra nollskottsklassificering med hjälp av förtränade modeller i SageMaker Jumpstart. Du kommer att lära dig hur du använder SageMaker Jumpstart UI och SageMaker Python SDK för att distribuera lösningen och köra slutledning med de tillgängliga modellerna.

Zero-shot lärande

Nollskottsklassificering är ett paradigm där en modell kan klassificera nya, osynliga exempel som tillhör klasser som inte fanns i träningsdatan. Till exempel kan en språkmodell som har tränats för att förstå mänskligt språk användas för att klassificera nyårslöftens tweets på flera klasser som career, healthoch finance, utan att språkmodellen är explicit tränad på textklassificeringsuppgiften. Detta står i motsats till att finjustera modellen, eftersom den senare innebär att man tränar om modellen (genom överföringsinlärning) medan noll-shot-inlärning inte kräver ytterligare träning.

Följande diagram illustrerar skillnaderna mellan överföringsinlärning (vänster) och nollskottsinlärning (höger).

Yin et al. föreslog ett ramverk för att skapa nollskottsklassificerare med hjälp av naturlig språkinferens (NLI). Ramverket fungerar genom att posera sekvensen som ska klassificeras som en NLI-premiss och konstruerar en hypotes från varje kandidatetikett. Till exempel om vi vill utvärdera om en sekvens tillhör klassen politics, skulle vi kunna konstruera en hypotes om "Den här texten handlar om politik." Sannolikheterna för innebörd och motsägelse omvandlas sedan till etikettsannolikheter. Som en snabb genomgång överväger NLI två meningar: en premiss och en hypotes. Uppgiften är att avgöra om hypotesen är sann (entailment) eller falsk (motsägelse) givet premissen. Följande tabell ger några exempel.

Premiss	etikett	Hypotes
En man inspekterar uniformen för en figur i något östasiatiskt land.	Motsägelse	Mannen sover.
En äldre och yngre man ler.	Neutral	Två män ler och skrattar åt katterna som leker på golvet.
En fotbollsmatch med flera män som spelar.	medföljande	Vissa män ägnar sig åt en sport.

Lösningsöversikt

I det här inlägget diskuterar vi följande:

Så här distribuerar du förtränade zero-shot-textklassificeringsmodeller med SageMaker JumpStart UI och kör inferens på den distribuerade modellen med kort textdata
Hur man använder SageMaker Python SDK för att komma åt de förtränade nollbildstextklassificeringsmodellerna i SageMaker JumpStart och använda inferensskriptet för att distribuera modellen till en SageMaker-slutpunkt för ett användningsfall för textklassificering i realtid
Hur man använder SageMaker Python SDK för att komma åt förtränade nollbildstextklassificeringsmodeller och använda SageMaker batchtransform för en grupptextklassificeringsanvändning

SageMaker JumpStart tillhandahåller finjustering och driftsättning med ett klick för en mängd olika förutbildade modeller över populära ML-uppgifter, såväl som ett urval av helhetslösningar som löser vanliga affärsproblem. Dessa funktioner tar bort de tunga lyften från varje steg i ML-processen, vilket förenklar utvecklingen av högkvalitativa modeller och minskar tiden till implementering. De JumpStart API:er låter dig programmera distribuera och finjustera ett stort urval av förtränade modeller på dina egna datamängder.

JumpStart-modellhubben ger tillgång till ett stort antal NLP-modeller som möjliggör överföringsinlärning och finjustering av anpassade datamängder. När detta skrivs innehåller JumpStart-modellhubben över 300 textmodeller över en mängd populära modeller, såsom Stable Diffusion, Flan T5, Alexa TM, Bloom och mer.

Observera att genom att följa stegen i det här avsnittet kommer du att distribuera infrastruktur till ditt AWS-konto som kan medföra kostnader.

Distribuera en fristående nollbildstextklassificeringsmodell

I det här avsnittet visar vi hur man distribuerar en klassificeringsmodell med nollbilder med SageMaker JumpStart. Du kan komma åt förtränade modeller via JumpStart-målsidan i Amazon SageMaker Studio. Slutför följande steg:

Öppna JumpStart-målsidan i SageMaker Studio.
Hänvisa till Öppna och använd JumpStart för mer information om hur du navigerar till SageMaker JumpStart.
I Textmodeller karusell, leta reda på modellkortet "Zero-Shot Text Classification".
Välja Visa modell för att komma åt facebook-bart-large-mnli modell.
Alternativt kan du söka efter nollskottsklassificeringsmodellen i sökfältet och komma till modellen i SageMaker JumpStart.
Ange en distributionskonfiguration, SageMaker-värdinstanstyp, slutpunktsnamn, Amazon enkel lagringstjänst (Amazon S3) hinknamn och andra nödvändiga parametrar.
Alternativt kan du ange säkerhetskonfigurationer som AWS identitets- och åtkomsthantering (IAM) roll, VPC-inställningar och AWS nyckelhanteringstjänst (AWS KMS) krypteringsnycklar.
Välja Distribuera för att skapa en SageMaker-slutpunkt.

Det här steget tar ett par minuter att slutföra. När den är klar kan du köra slutledning mot SageMaker-slutpunkten som är värd för nollskottsklassificeringsmodellen.

I följande video visar vi en genomgång av stegen i det här avsnittet.

Använd JumpStart programmatiskt med SageMaker SDK

I SageMaker JumpStart-delen av SageMaker Studio, under Snabbstartslösningar, kan du hitta lösningsmallar. SageMaker JumpStart-lösningsmallar är ett klick, end-to-end-lösningar för många vanliga ML-användningsfall. När detta skrivs finns över 20 lösningar tillgängliga för flera användningsfall, såsom efterfrågeprognoser, bedrägeriupptäckt och personliga rekommendationer, för att nämna några.

Lösningen "Zero Shot Text Classification with Hugging Face" ger ett sätt att klassificera text utan att behöva träna en modell för specifika etiketter (nollskottsklassificering) genom att använda en förtränad textklassificerare. Standard nollskottsklassificeringsmodellen för denna lösning är facebook-bart-large-mnli (BART) modell. För denna lösning använder vi 2015 års nyårslöften dataset att klassificera resolutioner. En delmängd av den ursprungliga datamängden som endast innehåller Resolution_Category (ground truth label) och text kolumner ingår i lösningens tillgångar.

Indata inkluderar textsträngar, en lista över önskade kategorier för klassificering, och om klassificeringen är multi-label eller inte för synkron (realtids) slutledning. För asynkron (batch) slutledning tillhandahåller vi en lista med textsträngar, listan över kategorier för varje sträng och om klassificeringen är multi-label eller inte i en JSON-radformaterad textfil.

Resultatet av slutledningen är ett JSON-objekt som ser ut ungefär som följande skärmdump.

Vi har originaltexten i sequence fältet, etiketterna som används för textklassificeringen i labels fältet och sannolikheten som tilldelas varje etikett (i samma ordningsföljd) i fältet scores.

Utför följande steg för att distribuera Zero Shot Text Classification with Hugging Face-lösningen:

Välj på SageMaker JumpStart-målsidan Modeller, anteckningsböcker, lösningar i navigeringsfönstret.
I Lösningar avsnitt väljer Utforska alla lösningar.
På Lösningar sida, välj modellkortet Zero Shot Text Classification with Hugging Face.
Granska distributionsdetaljerna och välj om du accepterar Starta.

Implementeringen kommer att tillhandahålla en SageMaker-realtidsslutpunkt för realtidsslutning och en S3-bucket för att lagra batchtransformationsresultaten.

Följande diagram illustrerar arkitekturen för denna metod.

Utför inferens i realtid med hjälp av en klassificeringsmodell med nollbilder

I det här avsnittet granskar vi hur du använder Python SDK för att köra nollbildstextklassificering (med någon av de tillgängliga modellerna) i realtid med hjälp av en SageMaker-slutpunkt.

Först konfigurerar vi inferensnyttolastbegäran till modellen. Detta är modellberoende, men för BART-modellen är indata ett JSON-objekt med följande struktur:

{
“inputs”: # The text to be classified
“parameters”: {
“candidate_labels”: # A list of the labels we want to use for the text classification
“multi_label”: True | False
}
}

Observera att BART-modellen inte är explicit utbildad på candidate_labels. Vi kommer att använda nollskottsklassificeringstekniken för att klassificera textsekvensen till osynliga klasser. Följande kod är ett exempel som använder text från datasetet med nyårslöften och de definierade klasserna:

classification_categories = ['Health', 'Humor', 'Personal Growth', 'Philanthropy', 'Leisure', 'Career', 'Finance', 'Education', 'Time Management']
data_zero_shot = { "inputs": "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", "parameters": { "candidate_labels": classification_categories, "multi_label": False
}
}

Därefter kan du anropa en SageMaker-slutpunkt med nollskottsnyttolasten. SageMaker-slutpunkten distribueras som en del av SageMaker JumpStart-lösningen.

response = runtime.invoke_endpoint(EndpointName=sagemaker_endpoint_name,
ContentType='application/json',
Body=json.dumps(payload)) parsed_response = json.loads(response['Body'].read())

Inferenssvarsobjektet innehåller den ursprungliga sekvensen, etiketterna sorterade efter poäng från max till min, och poängen per etikett:

{'sequence': "#newyearsresolution :: read more books, no scrolling fb/checking email b4 breakfast, stay dedicated to pt/yoga to squash my achin' back!", 'labels': ['Personal Growth', 'Health', 'Time Management', 'Leisure', 'Education', 'Humor', 'Career', 'Philanthropy', 'Finance'], 'scores': [0.4198768436908722,
0.2169460505247116,
0.16591140627861023,
0.09742163866758347,
0.031757451593875885,
0.027988269925117493,
0.015974704176187515,
0.015464971773326397,
0.008658630773425102]}

Kör ett SageMaker batchtransformeringsjobb med Python SDK

Det här avsnittet beskriver hur man kör batchtransformeringsinferens med nollskottsklassificeringen facebook-bart-large-mnli modell med hjälp av SageMaker Python SDK. Slutför följande steg:

Formatera indata i JSON-linjeformat och ladda upp filen till Amazon S3.
SageMaker batchtransformering kommer att göra slutledning om datapunkterna som laddas upp i S3-filen.

Ställ in artefakter för modelldistribution med följande parametrar:

modell_id - Använda sig av huggingface-zstc-facebook-bart-large-mnli.
deploy_image_uri - Använd image_uris Python SDK-funktion för att få den förbyggda SageMaker Docker-bilden för model_id. Funktionen returnerar Amazon Elastic Container Registry (Amazon ECR) URI.
deploy_source_uri – Använd script_uris verktygs-API för att hämta S3 URI som innehåller skript för att köra förtränad modellinferens. Vi specificerar script_scope as inference.

model_uri - Använda sig av model_uri för att få modellartefakter från Amazon S3 för den angivna model_id.

#imports
from sagemaker import image_uris, model_uris, script_uris, hyperparameters #set model id and version
model_id, model_version, = ( "huggingface-zstc-facebook-bart-large-mnli", "*",
) # Retrieve the inference Docker container URI. This is the base Hugging Face container image for the default model above.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None, # Automatically inferred from model_id
image_scope="inference",
model_id=model_id,
model_version=model_version,
instance_type="ml.g4dn.xlarge",
) # Retrieve the inference script URI. This includes all dependencies and scripts for model loading, inference handling, and more.
deploy_source_uri = script_uris.retrieve(model_id=model_id, model_version=model_version, script_scope="inference") # Retrieve the model URI. This includes the pre-trained model and parameters.
model_uri = model_uris.retrieve(model_id=model_id, model_version=model_version, model_scope="inference")

Använda HF_TASK att definiera uppgiften för transformatorrörledningen Hugging Face och HF_MODEL_ID för att definiera modellen som används för att klassificera texten:
```
# Hub model configuration <https://huggingface.co/models>
hub = { 'HF_MODEL_ID':'facebook/bart-large-mnli', # The model_id from the Hugging Face Hub 'HF_TASK':'zero-shot-classification' # The NLP task that you want to use for predictions
}
```
För en komplett lista över uppgifter, se Rörledningar i dokumentationen för Hugging Face.

Skapa ett Hugging Face-modellobjekt som ska distribueras med SageMaker batchtransformeringsjobb:

# Create HuggingFaceModel class
huggingface_model_zero_shot = HuggingFaceModel(
model_data=model_uri, # path to your trained sagemaker model
env=hub, # configuration for loading model from Hub
role=role, # IAM role with permissions to create an endpoint
transformers_version="4.17", # Transformers version used
pytorch_version="1.10", # PyTorch version used
py_version='py38', # Python version used
)

Skapa en transformation för att köra ett batchjobb:

# Create transformer to run a batch job
batch_job = huggingface_model_zero_shot.transformer(
instance_count=1,
instance_type='ml.m5.xlarge',
strategy='SingleRecord',
assemble_with='Line',
output_path=s3_path_join("s3://",sagemaker_config['S3Bucket'],"zero_shot_text_clf", "results"), # we are using the same s3 path to save the output with the input
)

Starta ett batchtransformeringsjobb och använd S3-data som indata:

batch_job.transform(
data=data_upload_path,
content_type='application/json',
split_type='Line',
logs=False,
wait=True
)

Du kan övervaka ditt batchbearbetningsjobb på SageMaker-konsolen (välj Batchomvandlingsjobb under Slutledning i navigeringsfönstret). När jobbet är klart kan du kontrollera modellförutsägelsen i S3-filen som anges i output_path.

För en lista över alla tillgängliga förtränade modeller i SageMaker JumpStart, se Inbyggda algoritmer med förtränad modellbord. Använd nyckelordet "zstc" (förkortning för zero-shot text classification) i sökfältet för att hitta alla modeller som kan göra noll-shot textklassificering.

Städa upp

När du är klar med att köra anteckningsboken, se till att ta bort alla resurser som skapats i processen för att säkerställa att kostnaderna för tillgångarna som distribueras i den här guiden stoppas. Koden för att rensa upp de distribuerade resurserna finns i de anteckningsböcker som är associerade med nollbildstextklassificeringslösningen och modellen.

Standard säkerhetskonfigurationer

SageMaker JumpStart-modellerna distribueras med följande standardsäkerhetskonfigurationer:

För att lära dig mer om SageMaker säkerhetsrelaterade ämnen, kolla in Konfigurera säkerhet i Amazon SageMaker.

Slutsats

I det här inlägget visade vi dig hur du distribuerar en nollbildsklassificeringsmodell med SageMaker JumpStart UI och utför slutledning med den distribuerade slutpunkten. Vi använde SageMaker JumpStart nyårslöften lösning för att visa hur du kan använda SageMaker Python SDK för att bygga en helhetslösning och implementera noll-shot-klassificeringsapplikation. SageMaker JumpStart ger tillgång till hundratals förutbildade modeller och lösningar för uppgifter som datorseende, naturlig språkbehandling, rekommendationssystem och mer. Prova lösningen på egen hand och låt oss veta dina tankar.

Om författarna

David Laredo är en prototyparkitekt på AWS Envision Engineering i LATAM, där han har hjälpt till att utveckla flera prototyper för maskininlärning. Tidigare har han arbetat som Machine Learning Engineer och har hållit på med maskininlärning i över 5 år. Hans intresseområden är NLP, tidsserier och end-to-end ML.

Vikram Elango är en AI/ML Specialist Solutions Architect på Amazon Web Services, baserad i Virginia, USA. Vikram hjälper finans- och försäkringsbranschens kunder med design och tankeledarskap att bygga och distribuera maskininlärningsapplikationer i stor skala. Han är för närvarande fokuserad på naturlig språkbehandling, ansvarsfull AI, slutledningsoptimering och skalning av ML över hela företaget. På fritiden tycker han om att resa, vandra, laga mat och campa med sin familj.

Dr. Vivek Madan är en tillämpad forskare med Amazon SageMaker JumpStart-teamet. Han tog sin doktorsexamen från University of Illinois i Urbana-Champaign och var postdoktor vid Georgia Tech. Han är en aktiv forskare inom maskininlärning och algoritmdesign och har publicerat artiklar på EMNLP-, ICLR-, COLT-, FOCS- och SODA-konferenser.

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Fordon / elbilar, Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
ChartPrime. Höj ditt handelsspel med ChartPrime. Tillgång här.
BlockOffsets. Modernisera miljökompensation ägande. Tillgång här.
Källa: https://aws.amazon.com/blogs/machine-learning/zero-shot-text-classification-with-amazon-sagemaker-jumpstart/

Tidsstämpel: Augusti 11, 2023

Tidsstämpel: September 30, 2022

Zero-shot textklassificering med Amazon SageMaker JumpStart | Amazon webbtjänster

Återutgiven av Platon

Zero-shot lärande

Lösningsöversikt

Distribuera en fristående nollbildstextklassificeringsmodell

Använd JumpStart programmatiskt med SageMaker SDK

Utför inferens i realtid med hjälp av en klassificeringsmodell med nollbilder

Kör ett SageMaker batchtransformeringsjobb med Python SDK

Städa upp

Standard säkerhetskonfigurationer

Slutsats

Om författarna

Mer från AWS maskininlärning

Hur LotteON byggde dynamiska A/B-tester för deras personliga rekommendationssystem | Amazon webbtjänster

Minska tiden det tar att distribuera dina modeller till Amazon SageMaker för testning

Tillkännage AWS DeepRacer League 2022

Bygg kunskapsdrivna konversationsapplikationer med LlamaIndex och Llama 2-Chat | Amazon webbtjänster

Minska kostnaderna och komplexiteten för ML-förbearbetning med Amazon S3 Object Lambda

Hur Patsnap använde GPT-2-inferens på Amazon SageMaker med låg latens och kostnad | Amazon webbtjänster

Bygg flexibla och skalbara distribuerade utbildningsarkitekturer med Kubeflow på AWS och Amazon SageMaker

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto