Akselerer administrasjon av klientsuksess gjennom e-postklassifisering med et klemt ansikt på Amazon SageMaker

Publisert av Platon

Følgere: 0

Dette er et gjestepost fra Skalerbar kapital, en ledende FinTech i Europa som tilbyr digital formueforvaltning og en meglerplattform med en flat rate for handel.

Som et raskt voksende selskap er Scalable Capitals mål å ikke bare bygge en innovativ, robust og pålitelig infrastruktur, men også å gi de beste opplevelsene for våre kunder, spesielt når det gjelder kundetjenester.

Scalable mottar hundrevis av e-posthenvendelser fra våre kunder daglig. Ved å implementere en moderne naturlig språkbehandlingsmodell (NLP) har responsprosessen blitt formet mye mer effektivt, og ventetiden for klienter er redusert enormt. Maskinlæringsmodellen (ML) klassifiserer nye innkommende kundeforespørsler så snart de kommer og omdirigerer dem til forhåndsdefinerte køer, noe som lar våre dedikerte klientsuksessagenter fokusere på innholdet i e-postene i henhold til deres ferdigheter og gi passende svar.

I dette innlegget viser vi de tekniske fordelene ved å bruke Hugging Face-transformatorer utplassert med Amazon SageMaker, som opplæring og eksperimentering i stor skala, og økt produktivitet og kostnadseffektivitet.

Problemstilling

Scalable Capital er en av de raskest voksende FinTechs i Europa. Med sikte på å demokratisere investeringer, gir selskapet sine kunder enkel tilgang til finansmarkedene. Kunder av Scalable kan aktivt delta i markedet gjennom selskapets meglerhandelsplattform, eller bruke Scalable Wealth Management til å investere på en intelligent og automatisert måte. I 2021 opplevde Scalable Capital en tidobling av kundebasen, fra titusenvis til hundretusener.

For å gi kundene våre en førsteklasses (og konsistent) brukeropplevelse på tvers av produkter og kundeservice, var selskapet på utkikk etter automatiserte løsninger for å generere effektivitet for en skalerbar løsning samtidig som den opprettholder operasjonell fortreffelighet. Scalable Capitals datavitenskap og kundeserviceteam identifiserte at en av de største flaskehalsene i å betjene kundene våre var å svare på e-posthenvendelser. Spesifikt var flaskehalsen klassifiseringstrinnet, der ansatte måtte lese og merke forespørselstekster på daglig basis. Etter at e-postene ble rutet til de riktige køene, engasjerte de respektive spesialistene seg raskt og løste sakene.

For å strømlinjeforme denne klassifiseringsprosessen bygde og implementerte datavitenskapsteamet hos Scalable en multitask NLP-modell ved bruk av toppmoderne transformatorarkitektur, basert på den forhåndsopplærte distilbert-base-tysk-hylster modell utgitt av Hugging Face. distilbert-base-tysk-hylster bruker kunnskapsdestillasjon metode for å forhåndstrene en mindre generell språkrepresentasjonsmodell enn den originale BERT-basismodellen. Den destillerte versjonen oppnår sammenlignbar ytelse med originalversjonen, samtidig som den er mindre og raskere. For å lette livssyklusprosessen vår for ML, bestemte vi oss for å ta i bruk SageMaker for å bygge, distribuere, betjene og overvåke modellene våre. I den følgende delen introduserer vi vår prosjektarkitekturdesign.

Løsningsoversikt

Scalable Capitals ML-infrastruktur består av to AWS-kontoer: en som et miljø for utviklingsstadiet og den andre for produksjonsstadiet.

Følgende diagram viser arbeidsflyten for e-postklassifiseringsprosjektet vårt, men kan også generaliseres til andre datavitenskapelige prosjekter.

E-postklassifisering prosjektdiagram

Arbeidsflyten består av følgende komponenter:

Modelleksperimentering – Dataforskere bruker Amazon SageMaker Studio å gjennomføre de første trinnene i datavitenskapens livssyklus: utforskende dataanalyse (EDA), datarensing og forberedelse, og bygge prototypemodeller. Når den utforskende fasen er fullført, henvender vi oss til VSCode hostet av en SageMaker-notisbok som vårt fjernutviklingsverktøy for å modularisere og produsere kodebasen vår. For å utforske ulike typer modeller og modellkonfigurasjoner, og samtidig holde styr på eksperimentene våre, bruker vi SageMaker Training og SageMaker Experiments.
Modellbygg – Etter at vi har bestemt oss for en modell for vår produksjonsbruk, i dette tilfellet en multi-task distilbert-base-tysk-hylster modell, finjustert fra den forhåndstrente modellen fra Hugging Face, vi forplikter og sender koden vår til Github-utviklergrenen. Github-sammenslåingshendelsen utløser vår Jenkins CI-pipeline, som igjen starter en SageMaker Pipelines-jobb med testdata. Dette fungerer som en test for å sikre at koder kjører som forventet. Et testendepunkt er distribuert for testformål.
Modellutplassering – Etter å ha forsikret seg om at alt går som forventet, slår dataforskere sammen utviklingsgrenen til primærgrenen. Denne sammenslåingshendelsen utløser nå en SageMaker Pipelines-jobb som bruker produksjonsdata til opplæringsformål. Etterpå produseres modellartefakter og lagres i en utgang Amazon enkel lagringstjeneste (Amazon S3) bøtte, og en ny modellversjon er logget i SageMaker modellregister. Dataforskere undersøker ytelsen til den nye modellen, og godkjenner deretter om den er i tråd med forventningene. Modellgodkjenningshendelsen fanges opp av Amazon EventBridge, som deretter distribuerer modellen til et SageMaker-endepunkt i produksjonsmiljøet.
MLOps – Fordi SageMaker-endepunktet er privat og ikke kan nås av tjenester utenfor VPC, an AWS Lambda funksjon og Amazon API-gateway offentlige endepunkter kreves for å kommunisere med CRM. Hver gang nye e-poster kommer inn i CRM-innboksen, påkaller CRM API Gateways offentlige endepunkt, som igjen utløser Lambda-funksjonen for å påkalle det private SageMaker-endepunktet. Funksjonen videresender deretter klassifiseringen tilbake til CRM gjennom det offentlige endepunktet for API Gateway. For å overvåke ytelsen til vår distribuerte modell implementerer vi en tilbakemeldingssløyfe mellom CRM og dataforskerne for å holde styr på prediksjonsverdier fra modellen. På månedlig basis oppdaterer CRM de historiske dataene som brukes til eksperimentering og modelltrening. Vi bruker Amazon administrerte arbeidsflyter for Apache Airflow (Amazon MWAA) som planlegger for vår månedlige omskolering.

I de følgende delene bryter vi ned trinnene for dataforberedelse, modelleksperimentering og modelldistribusjon mer detaljert.

Dataforberedelse

Scalable Capital bruker et CRM-verktøy for å administrere og lagre e-postdata. Relevant e-postinnhold består av emne, kropp og depotbanker. Det er tre etiketter som skal tildeles til hver e-post: hvilken bransje e-posten kommer fra, hvilken kø som passer, og det spesifikke emnet for e-posten.

Før vi begynner å trene noen NLP-modeller, sikrer vi at inndataene er rene og etikettene tildeles i henhold til forventningene.

For å hente rent forespørselsinnhold fra skalerbare klienter, fjerner vi fra rå e-postdata og ekstra tekst og symboler, som e-postsignaturer, impressum, sitater fra tidligere meldinger i e-postkjeder, CSS-symboler og så videre. Ellers kan våre fremtidige trente modeller oppleve dårligere ytelse.

Etiketter for e-poster utvikler seg over tid ettersom skalerbare kundeserviceteam legger til nye og avgrenser eller fjerner eksisterende for å imøtekomme forretningsbehov. For å sikre at etiketter for treningsdata samt forventede klassifiseringer for prediksjon er oppdatert, jobber datavitenskapsteamet i tett samarbeid med kundeserviceteamet for å sikre riktigheten av etikettene.

Modelleksperimentering

Vi starter vårt eksperiment med de lett tilgjengelige forhåndstrente distilbert-base-tysk-hylster modell utgitt av Hugging Face. Fordi den forhåndstrente modellen er en generell språkrepresentasjonsmodell, kan vi tilpasse arkitekturen til å utføre spesifikke nedstrømsoppgaver – som klassifisering og spørsmålssvar – ved å feste passende hoder til det nevrale nettverket. I vårt brukstilfelle er nedstrømsoppgaven vi er interessert i sekvensklassifisering. Uten å endre eksisterende arkitektur, bestemmer vi oss for å finjustere tre separate forhåndstrente modeller for hver av våre nødvendige kategorier. Med SageMaker Hugging Face Deep Learning Containers (DLC), start og administrasjon av NLP-eksperimenter er gjort enkelt med Hugging Face-beholdere og SageMaker Experiments API.

Følgende er en kodebit av train.py:

config = AutoConfig.from_pretrained("distilbert-base-german-cased") # load original config
config.num_labels = num_labels # adapt original config to a specific number of labels (default is 2)
# instantiate a pretrained model
model = DistilBertForSequenceClassification.from_pretrained("distilbert-base-german-cased", config=config) trainer = Trainer( model=model, # the instantiated Transformers model to be trained args=training_args, # training arguments, defined above train_dataset=train_dataset, # training dataset eval_dataset=val_dataset # evaluation dataset
)
trainer.train()

Følgende kode er Hugging Face-estimatoren:

huggingface_estimator = HuggingFace( entry_point='train.py', source_dir='./scripts', instance_type='ml.p3.2xlarge', instance_count=1, role=role, transformers_version='4.26.0', pytorch_version='1.13.1', py_version='py39', hyperparameters = hyperparameters
)

For å validere de finjusterte modellene bruker vi F1-stillingen på grunn av den ubalanserte naturen til e-postdatasettet vårt, men også for å beregne andre beregninger som nøyaktighet, presisjon og tilbakekalling. For at SageMaker Experiments API skal registrere treningsjobbens beregninger, må vi først logge beregningene til treningsjobbens lokale konsoll, som hentes av Amazon CloudWatch. Deretter definerer vi riktig regex-format for å fange CloudWatch-loggene. Beregningsdefinisjonene inkluderer navnet på metrikkene og regex-validering for å trekke ut beregningene fra treningsjobben:

metric_definitions = [ {"Name": "train:loss", "Regex": "'loss': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "learning_rate", "Regex": "'learning_rate': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:loss", "Regex": "'eval_loss': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:accuracy", "Regex": "'train_accuracy': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:accuracy", "Regex": "'eval_accuracy': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:precision", "Regex": "'train_precision': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:precision", "Regex": "'eval_precision': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:recall", "Regex": "'train_recall': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:recall", "Regex": "'eval_recall': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "train:f1", "Regex": "'train_f1': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:f1", "Regex": "'eval_f1': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:runtime", "Regex": "'eval_runtime': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "val:samples_per_second", "Regex": "'eval_samples_per_second': ([0-9]+(.|e-)[0-9]+),?"}, {"Name": "epoch", "Regex": "'epoch': ([0-9]+(.|e-)[0-9]+),?"},
]

Som en del av treningsiterasjonen for klassifiseringsmodellen bruker vi en forvirringsmatrise og klassifiseringsrapport for å evaluere resultatet. Følgende figur viser forvirringsmatrisen for bransjeprediksjon.

Forvirringsmatrise

Følgende skjermbilde viser et eksempel på klassifiseringsrapporten for bransjeprediksjon.

Klassifiseringsrapport

Som en neste iterasjon av eksperimentet vårt vil vi dra nytte av fleroppgavelæring å forbedre modellen vår. Fleroppgavelæring er en form for opplæring der en modell lærer å løse flere oppgaver samtidig, fordi den delte informasjonen mellom oppgaver kan forbedre læringseffektiviteten. Ved å knytte ytterligere to klassifiseringshoder til den originale distilbert-arkitekturen, kan vi utføre multi-task finjustering, som oppnår rimelige beregninger for vårt kundeserviceteam.

Modellutplassering

I vårt brukstilfelle skal e-postklassifisereren distribueres til et endepunkt, som vår CRM-pipeline kan sende en gruppe uklassifiserte e-poster til og få tilbake spådommer til. Fordi vi har andre logikker – for eksempel rensing av inngangsdata og spådommer om flere oppgaver – i tillegg til Hugging Face-modellslutning, må vi skrive et tilpasset inferensskript som følger SageMaker standard.

Følgende er en kodebit av inference.py:

def model_fn(model_dir): model = load_from_artifact(model_dir) return model def transform_fn(model, input_data, content_type, accept): if content_type == "application/json": data = json.loads(input_data) data = pd.DataFrame(data) else: raise ValueError(f"Unsupported content type: {content_type}") data = preprocess(data) # Inference with torch.no_grad(): predictions = model(data) predictions = postprocess(predictions) if content_type == 'application/json': return json.dumps(predictions.to_dict(orient="records")) else: raise NotImplementedError

Når alt er oppe og klart, bruker vi SageMaker Pipelines til å administrere treningspipeline og koble den til infrastrukturen vår for å fullføre MLOps-oppsettet vårt.

For å overvåke ytelsen til den distribuerte modellen bygger vi en tilbakemeldingssløyfe for å gjøre det mulig for CRM å gi oss statusen til klassifiserte e-poster når saker avsluttes. Basert på denne informasjonen foretar vi justeringer for å forbedre den distribuerte modellen.

konklusjonen

I dette innlegget delte vi hvordan SageMaker legger til rette for datavitenskapsteamet hos Scalable for å administrere livssyklusen til et datavitenskapsprosjekt effektivt, nemlig e-postklassifiseringsprosjektet. Livssyklusen starter med den innledende fasen av dataanalyse og utforskning med SageMaker Studio; går videre til modelleksperimentering og distribusjon med SageMaker-trening, slutninger og DLC-er for Hugging Face; og kompletteres med en opplæringspipeline med SageMaker Pipelines integrert med andre AWS-tjenester. Takket være denne infrastrukturen er vi i stand til å iterere og distribuere nye modeller mer effektivt, og er derfor i stand til å forbedre eksisterende prosesser innenfor Scalable så vel som våre kunders erfaringer.

For å lære mer om Hugging Face og SageMaker, se følgende ressurser:

Om forfatterne

Dr. Sandra Schmid er sjef for dataanalyse i Scalable GmbH. Hun er ansvarlig for datadrevne tilnærminger og brukssaker i selskapet sammen med teamene sine. Hennes hovedfokus er å finne den beste kombinasjonen av maskinlæring og datavitenskapelige modeller og forretningsmål for å få så mye forretningsverdi og effektivitet ut av data som mulig.

Huy Dang Dataforsker hos Scalable GmbH. Hans ansvar inkluderer dataanalyse, bygging og distribusjon av maskinlæringsmodeller, samt utvikling og vedlikehold av infrastruktur for datavitenskapsteamet. På fritiden liker han å lese, gå på fotturer, klatre og holde seg oppdatert på de siste maskinlæringsutviklingene.

Mia Chang er en ML Specialist Solutions Architect for Amazon Web Services. Hun jobber med kunder i EMEA og deler beste praksis for å kjøre AI/ML-arbeidsbelastninger på skyen med bakgrunnen hennes innen anvendt matematikk, informatikk og AI/ML. Hun fokuserer på NLP-spesifikke arbeidsmengder, og deler sin erfaring som konferansetaler og bokforfatter. På fritiden liker hun yoga, brettspill og å brygge kaffe.

Moritz Guertler er en Account Executive i Digital Native Businesses-segmentet hos AWS. Han fokuserer på kunder i FinTech-området og støtter dem i å akselerere innovasjon gjennom sikker og skalerbar skyinfrastruktur.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Bil / elbiler, Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
ChartPrime. Hev handelsspillet ditt med ChartPrime. Tilgang her.
BlockOffsets. Modernisering av eierskap for miljøkompensasjon. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/accelerate-client-success-management-through-email-classification-with-hugging-face-on-amazon-sagemaker/

Tidstempel: September 12, 2023

Fremskynd styring av klientsuksess gjennom e-postklassifisering med Hugging Face på Amazon SageMaker | Amazon Web Services

Publisert av Platon

Problemstilling

Løsningsoversikt

Dataforberedelse

Modelleksperimentering

Modellutplassering

konklusjonen

Om forfatterne

Mer fra AWS maskinlæring

Analyser og visualiser hendelser med flere kameraer ved hjelp av Amazon SageMaker Studio Lab

Distribuer store språkmodeller på AWS Inferentia2 ved å bruke store modellslutningsbeholdere

Beskytte forbrukere og fremme innovasjon – AI-regulering og bygge tillit til ansvarlig AI

Forbered data fra Databricks for maskinlæring ved hjelp av Amazon SageMaker Data Wrangler

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn