Accelerera klientframgångshantering genom e-postklassificering med kramande ansikte på Amazon SageMaker

Återutgiven av Platon

anhängare: 0

Detta är ett gästinlägg från Skalbar kapital, en ledande FinTech i Europa som erbjuder digital förmögenhetsförvaltning och en mäklarplattform med schablonbelopp.

Som ett snabbväxande företag är Scalable Capitals mål att inte bara bygga en innovativ, robust och pålitlig infrastruktur, utan också att erbjuda de bästa upplevelserna för våra kunder, särskilt när det kommer till kundtjänster.

Scalable tar emot hundratals e-postförfrågningar från våra kunder dagligen. Genom att implementera en modern NLP-modell (natural language processing) har svarsprocessen formats mycket mer effektivt och väntetiden för klienter har minskat enormt. Maskininlärningsmodellen (ML) klassificerar nya inkommande kundförfrågningar så snart de anländer och omdirigerar dem till fördefinierade köer, vilket gör att våra dedikerade klientframgångsagenter kan fokusera på innehållet i e-postmeddelandena enligt deras kompetens och ge lämpliga svar.

I det här inlägget visar vi de tekniska fördelarna med att använda Hugging Face-transformatorer utplacerade med Amazon SageMaker, såsom utbildning och experiment i stor skala, och ökad produktivitet och kostnadseffektivitet.

Problem uttalande

Scalable Capital är en av de snabbast växande FinTechs i Europa. Med målet att demokratisera investeringar ger företaget sina kunder enkel tillgång till finansmarknaderna. Kunder till Scalable kan aktivt delta på marknaden genom företagets mäklarhandelsplattform, eller använda Scalable Wealth Management för att investera på ett intelligent och automatiserat sätt. Under 2021 upplevde Scalable Capital en tiofaldig ökning av sin kundbas, från tiotusentals till hundratusentals.

För att ge våra kunder en förstklassig (och konsekvent) användarupplevelse över produkter och kundservice, letade företaget efter automatiserade lösningar för att generera effektivitetsvinster för en skalbar lösning med bibehållen operativ excellens. Scalable Capitals datavetenskap och kundtjänstteam identifierade att en av de största flaskhalsarna i att betjäna våra kunder var att svara på e-postförfrågningar. Specifikt var flaskhalsen klassificeringssteget, där anställda var tvungna att läsa och märka förfrågningstexter dagligen. Efter att e-postmeddelandena dirigerats till sina rätta köer, engagerade sig respektive specialist snabbt och löste ärendena.

För att effektivisera denna klassificeringsprocess byggde och implementerade datavetenskapsteamet på Scalable en multitask NLP-modell med hjälp av den senaste transformatorarkitekturen, baserad på den förutbildade distilbert-bas-tysk-fodral modell publicerad av Hugging Face. distilbert-bas-tysk-fodral använder kunskapsdestillation metod för att förträna en mindre allmän språkrepresentationsmodell än den ursprungliga BERT-basmodellen. Den destillerade versionen uppnår jämförbar prestanda som originalversionen, samtidigt som den är mindre och snabbare. För att underlätta vår ML-livscykelprocess beslutade vi att använda SageMaker för att bygga, distribuera, betjäna och övervaka våra modeller. I följande avsnitt presenterar vi vår projektarkitekturdesign.

Lösningsöversikt

Scalable Capitals ML-infrastruktur består av två AWS-konton: ett som miljö för utvecklingsstadiet och det andra för produktionsskedet.

Följande diagram visar arbetsflödet för vårt e-postklassificeringsprojekt, men kan också generaliseras till andra datavetenskapliga projekt.

E-postklassificeringsprojektdiagram

Arbetsflödet består av följande komponenter:

Modellexperiment – Dataforskare använder Amazon SageMaker Studio att utföra de första stegen i datavetenskapens livscykel: explorativ dataanalys (EDA), datarensning och förberedelse samt bygga prototypmodeller. När den utforskande fasen är klar, vänder vi oss till VSCode med en SageMaker-anteckningsbok som vårt fjärrutvecklingsverktyg för att modularisera och producera vår kodbas. För att utforska olika typer av modeller och modellkonfigurationer, och samtidigt hålla koll på våra experiment, använder vi SageMaker Training och SageMaker Experiments.
Modellbyggd – Efter att vi bestämt oss för en modell för vårt produktionsanvändningsfall, i det här fallet en multi-task distilbert-bas-tysk-fodral modell, finjusterad från den förtränade modellen från Hugging Face, förbinder vi oss och skickar vår kod till Github-utvecklargrenen. Github merge-händelsen utlöser vår Jenkins CI-pipeline, som i sin tur startar ett SageMaker Pipelines-jobb med testdata. Detta fungerar som ett test för att säkerställa att koder körs som förväntat. En teständpunkt distribueras för teständamål.
Modelldistribution – Efter att ha sett till att allt fungerar som förväntat slår datavetare samman utveckla-grenen till den primära grenen. Denna sammanslagningshändelse utlöser nu ett SageMaker Pipelines-jobb som använder produktionsdata i utbildningssyfte. Efteråt produceras modellartefakter och lagras i en utgång Amazon enkel lagringstjänst (Amazon S3) hink, och en ny modellversion loggas i SageMakers modellregister. Dataforskare undersöker prestandan för den nya modellen och godkänner sedan om den är i linje med förväntningarna. Modellgodkännandehändelsen fångas upp av Amazon EventBridge, som sedan distribuerar modellen till en SageMaker-slutpunkt i produktionsmiljön.
MLOps – Eftersom SageMaker-slutpunkten är privat och inte kan nås av tjänster utanför VPC, an AWS Lambda funktion och Amazon API Gateway offentliga slutpunkter krävs för att kommunicera med CRM. Närhelst nya e-postmeddelanden kommer till CRM-inkorgen, anropar CRM API Gateways offentliga slutpunkt, vilket i sin tur utlöser Lambda-funktionen för att anropa den privata SageMaker-slutpunkten. Funktionen vidarebefordrar sedan klassificeringen tillbaka till CRM via API Gateway public endpoint. För att övervaka prestandan för vår implementerade modell implementerar vi en återkopplingsslinga mellan CRM och dataforskarna för att hålla reda på förutsägelsemått från modellen. På månadsbasis uppdaterar CRM de historiska data som används för experiment och modellträning. Vi använder Amazon Managed Workflows för Apache Airflow (Amazon MWAA) som schemaläggare för vår månatliga omskolning.

I följande avsnitt bryter vi ner stegen för dataförberedelse, modellexperimentering och modelldistribution mer i detalj.

Dataförberedelse

Scalable Capital använder ett CRM-verktyg för att hantera och lagra e-postdata. Relevant e-postinnehåll består av ämne, text och depåbanker. Det finns tre etiketter att tilldela varje e-postmeddelande: vilken bransch e-postmeddelandet kommer från, vilken kö som är lämplig och det specifika ämnet för e-postmeddelandet.

Innan vi börjar träna några NLP-modeller ser vi till att indata är rena och att etiketterna tilldelas enligt förväntningarna.

För att hämta rent frågeinnehåll från skalbara klienter tar vi bort från rå e-postdata och extra text och symboler, såsom e-postsignaturer, impressum, citat från tidigare meddelanden i e-postkedjor, CSS-symboler och så vidare. Annars kan våra framtida utbildade modeller uppleva försämrad prestanda.

Etiketter för e-postmeddelanden utvecklas över tiden när skalbara kundtjänstteam lägger till nya och förfinar eller tar bort befintliga för att tillgodose affärsbehov. För att säkerställa att etiketter för träningsdata samt förväntade klassificeringar för förutsägelse är uppdaterade arbetar datavetenskapsteamet i nära samarbete med kundtjänstteamet för att säkerställa att etiketterna är korrekta.

Modellexperiment

Vi börjar vårt experiment med de lättillgängliga förtränade distilbert-bas-tysk-fodral modell publicerad av Hugging Face. Eftersom den förtränade modellen är en språkrepresentationsmodell för allmänt bruk, kan vi anpassa arkitekturen för att utföra specifika nedströmsuppgifter – såsom klassificering och frågesvar – genom att fästa lämpliga huvuden till det neurala nätverket. I vårt användningsfall är den nedströmsuppgift vi är intresserade av sekvensklassificering. Utan att ändra befintlig arkitekturbestämmer vi oss för att finjustera tre separata förtränade modeller för var och en av våra nödvändiga kategorier. Med SageMaker Hugging Face Deep Learning Containers (DLC), start och hantering av NLP-experiment görs enkelt med Hugging Face-behållare och SageMaker Experiments API.

Följande är ett kodavsnitt av train.py:

config = AutoConfig.from_pretrained("distilbert-base-german-cased") # load original config
config.num_labels = num_labels # adapt original config to a specific number of labels (default is 2)
# instantiate a pretrained model
model = DistilBertForSequenceClassification.from_pretrained("distilbert-base-german-cased", config=config) trainer = Trainer( model=model, # the instantiated Transformers model to be trained args=training_args, # training arguments, defined above train_dataset=train_dataset, # training dataset eval_dataset=val_dataset # evaluation dataset
)
trainer.train()

Följande kod är Hugging Face-estimatorn:

huggingface_estimator = HuggingFace( entry_point='train.py', source_dir='./scripts', instance_type='ml.p3.2xlarge', instance_count=1, role=role, transformers_version='4.26.0', pytorch_version='1.13.1', py_version='py39', hyperparameters = hyperparameters
)

För att validera de finjusterade modellerna använder vi F1-poäng på grund av den obalanserade naturen hos vår e-postdatauppsättning, men också för att beräkna andra mätvärden som noggrannhet, precision och återkallelse. För att SageMaker Experiments API ska registrera träningsjobbets mätvärden måste vi först logga mätvärdena till träningsjobbets lokala konsol, som hämtas av amazoncloudwatch. Sedan definierar vi det korrekta regex-formatet för att fånga CloudWatch-loggarna. Metrikdefinitionerna inkluderar namnet på måtten och regex-validering för att extrahera måtten från träningsjobbet:

metric_definitions = [ {"Name": "train:loss", "Regex": "'loss': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "learning_rate", "Regex": "'learning_rate': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:loss", "Regex": "'eval_loss': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:accuracy", "Regex": "'train_accuracy': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:accuracy", "Regex": "'eval_accuracy': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:precision", "Regex": "'train_precision': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:precision", "Regex": "'eval_precision': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:recall", "Regex": "'train_recall': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:recall", "Regex": "'eval_recall': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:f1", "Regex": "'train_f1': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:f1", "Regex": "'eval_f1': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:runtime", "Regex": "'eval_runtime': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:samples_per_second", "Regex": "'eval_samples_per_second': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "epoch", "Regex": "'epoch': ([0-9]+(.|e-)[0-9]+),?"},
]

Som en del av träningsiterationen för klassificeringsmodellen använder vi en förvirringsmatris och klassificeringsrapport för att utvärdera resultatet. Följande figur visar förvirringsmatrisen för förutsägelse av bransch.

Förvirringsmatris

Följande skärmdump visar ett exempel på klassificeringsrapporten för branschprognos.

Klassificeringsrapport

Som en nästa iteration av vårt experiment kommer vi att dra nytta av multi-task inlärning att förbättra vår modell. Multi-task learning är en form av träning där en modell lär sig att lösa flera uppgifter samtidigt, eftersom den delade informationen mellan uppgifter kan förbättra inlärningseffektiviteten. Genom att koppla ytterligare två klassificeringshuvuden till den ursprungliga distilbert-arkitekturen kan vi utföra multi-task finjustering, vilket uppnår rimliga mätvärden för vårt kundserviceteam.

Modelldistribution

I vårt användningsfall ska e-postklassificeraren distribueras till en slutpunkt, till vilken vår CRM-pipeline kan skicka en grupp oklassificerade e-postmeddelanden och få tillbaka förutsägelser. Eftersom vi har andra logiker – som rensning av indata och förutsägelser om flera uppgifter – förutom Hugging Face-modellinferens, måste vi skriva ett anpassat slutledningsskript som följer SageMaker standard.

Följande är ett kodavsnitt av inference.py:

def model_fn(model_dir): model = load_from_artifact(model_dir) return model def transform_fn(model, input_data, content_type, accept): if content_type == "application/json": data = json.loads(input_data) data = pd.DataFrame(data) else: raise ValueError(f"Unsupported content type: {content_type}") data = preprocess(data) # Inference with torch.no_grad(): predictions = model(data) predictions = postprocess(predictions) if content_type == 'application/json': return json.dumps(predictions.to_dict(orient="records")) else: raise NotImplementedError

När allt är klart och klart använder vi SageMaker Pipelines för att hantera vår träningspipeline och koppla den till vår infrastruktur för att slutföra vår MLOps-installation.

För att övervaka prestandan för den distribuerade modellen bygger vi en återkopplingsslinga för att göra det möjligt för CRM att förse oss med statusen för hemligstämplade e-postmeddelanden när ärenden avslutas. Baserat på denna information gör vi justeringar för att förbättra den distribuerade modellen.

Slutsats

I det här inlägget delade vi hur SageMaker underlättar datavetenskapsteamet på Scalable att hantera livscykeln för ett datavetenskapsprojekt på ett effektivt sätt, nämligen e-postklassificeringsprojektet. Livscykeln börjar med den inledande fasen av dataanalys och utforskning med SageMaker Studio; går vidare till modellexperiment och implementering med SageMaker-utbildning, slutledning och DLC:er för Hugging Face; och kompletteras med en utbildningspipeline med SageMaker Pipelines integrerade med andra AWS-tjänster. Tack vare denna infrastruktur kan vi iterera och distribuera nya modeller mer effektivt och kan därför förbättra befintliga processer inom Scalable såväl som våra kunders upplevelser.

För att lära dig mer om Hugging Face och SageMaker, se följande resurser:

Om författarna

Dr Sandra Schmid är chef för dataanalys på Scalable GmbH. Hon ansvarar för datadrivna arbetssätt och användningsfall i företaget tillsammans med sina team. Hennes huvudfokus är att hitta den bästa kombinationen av maskininlärning och datavetenskapliga modeller och affärsmål för att få så mycket affärsnytta och effektivitet av data som möjligt.

Huy Dang Data Scientist på Scalable GmbH. Hans ansvar inkluderar dataanalys, att bygga och distribuera modeller för maskininlärning, samt att utveckla och underhålla infrastruktur för datavetenskapsteamet. På fritiden tycker han om att läsa, vandra, klättra och hålla sig uppdaterad med de senaste maskininlärningsutvecklingarna.

Mia Chang är en ML Specialist Solutions Architect för Amazon Web Services. Hon arbetar med kunder i EMEA och delar bästa praxis för att köra AI/ML-arbetsbelastningar i molnet med sin bakgrund inom tillämpad matematik, datavetenskap och AI/ML. Hon fokuserar på NLP-specifika arbetsbelastningar och delar med sig av sin erfarenhet som konferenstalare och bokförfattare. På fritiden tycker hon om yoga, brädspel och att brygga kaffe.

Moritz Guertler är en Account Executive i segmentet Digital Native Businesses på AWS. Han fokuserar på kunder inom FinTech-området och stödjer dem i att accelerera innovation genom säker och skalbar molninfrastruktur.

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Fordon / elbilar, Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
ChartPrime. Höj ditt handelsspel med ChartPrime. Tillgång här.
BlockOffsets. Modernisera miljökompensation ägande. Tillgång här.
Källa: https://aws.amazon.com/blogs/machine-learning/accelerate-client-success-management-through-email-classification-with-hugging-face-on-amazon-sagemaker/

Tidsstämpel: September 12, 2023

Accelerera klientframgångshantering genom e-postklassificering med Hugging Face på Amazon SageMaker | Amazon webbtjänster

Återutgiven av Platon

Problem uttalande

Lösningsöversikt

Dataförberedelse

Modellexperiment

Modelldistribution

Slutsats

Om författarna

Mer från AWS maskininlärning

Analysera och visualisera händelser med flera kamera med Amazon SageMaker Studio Lab

Distribuera stora språkmodeller på AWS Inferentia2 med hjälp av stora modellinferensbehållare

Att skydda konsumenter och främja innovation – AI-reglering och bygga förtroende för ansvarsfull AI

Förbered data från Databricks för maskininlärning med Amazon SageMaker Data Wrangler

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto