Dette innlegget er skrevet av Hesham Fahim fra Thomson Reuters.
Thomson Reuters (TR) er en av verdens mest pålitelige informasjonsorganisasjoner for bedrifter og profesjonelle. Det gir bedrifter intelligensen, teknologien og menneskelig ekspertise de trenger for å finne pålitelige svar, slik at de kan ta bedre beslutninger raskere. TRs kunder spenner over finans-, risiko-, juridisk-, skatt-, regnskaps- og mediemarkedene.
Thomson Reuters tilbyr markedsledende produkter i kampanjen Tax, Legal and News, som brukere kan registrere seg for ved hjelp av en abonnementslisensieringsmodell. For å forbedre denne opplevelsen for kundene ønsket TR å lage en sentralisert anbefalingsplattform som gjorde det mulig for salgsteamet å foreslå de mest relevante abonnementspakkene til kundene sine, og generere forslag som bidrar til å øke bevisstheten om produkter som kan hjelpe kundene deres å betjene markedet bedre gjennom skreddersydde produktutvalg.
Før byggingen av denne sentraliserte plattformen, hadde TR en eldre regelbasert motor for å generere fornyelsesanbefalinger. Reglene i denne motoren var forhåndsdefinert og skrevet i SQL, som bortsett fra å utgjøre en utfordring å administrere, også slet med å takle spredningen av data fra TRs ulike integrerte datakilder. TR-kundedata endres raskere enn forretningsreglene kan utvikle seg for å reflektere endrede kundebehov. Nøkkelkravet for TRs nye maskinlæring (ML)-baserte personaliseringsmotor var sentrert rundt et nøyaktig anbefalingssystem som tar hensyn til nyere kundetrender. Den ønskede løsningen ville være en med lave driftskostnader, evnen til å akselerere levering av forretningsmål og en personaliseringsmotor som kontinuerlig kan trenes opp med oppdaterte data for å håndtere endrede forbrukervaner og nye produkter.
Personalisering av fornyelsesanbefalingene basert på hva som ville være verdifulle produkter for TRs kunder var en viktig forretningsutfordring for salgs- og markedsteamet. TR har et vell av data som kan brukes til personalisering som er samlet inn fra kundeinteraksjoner og lagret i et sentralisert datavarehus. TR har vært en tidlig adopter av ML med Amazon SageMaker, og deres modenhet i AI/ML-domenet betydde at de hadde samlet et betydelig datasett med relevante data i et datavarehus, som teamet kunne trene en personaliseringsmodell med. TR har fortsatt sin AI/ML-innovasjon og har nylig utviklet en fornyet anbefalingsplattform ved hjelp av Amazon Tilpasse, som er en fullstendig administrert ML-tjeneste som bruker brukerinteraksjoner og elementer for å generere anbefalinger for brukere. I dette innlegget forklarer vi hvordan TR brukte Amazon Personalize til å bygge et skalerbart anbefalingssystem med flere leietakere som gir de beste produktabonnementsplanene og tilhørende priser til kundene deres.
Løsningsarkitektur
Løsningen måtte utformes med tanke på TRs kjernevirksomhet rundt å forstå brukere gjennom data; å gi disse brukerne personlig tilpasset og relevant innhold fra et stort datakorpus var et forretningskritisk krav. Å ha et godt utformet anbefalingssystem er nøkkelen til å få kvalitetsanbefalinger som er tilpasset hver brukers krav.
Løsningen krevde innsamling og forberedelse av brukeratferdsdata, opplæring av en ML-modell ved hjelp av Amazon Personalize, generering av personlige anbefalinger gjennom den trente modellen og fremdrift av markedsføringskampanjer med de personlig tilpassede anbefalingene.
TR ønsket å dra nytte av AWS administrerte tjenester der det var mulig for å forenkle operasjoner og redusere udifferensierte tunge løft. TR brukt AWS Lim DataBrew og AWS-batch jobber for å utføre uttrekk, transformasjon og lasting (ETL)-jobber i ML-rørledningene, og SageMaker sammen med Amazon Personalize for å skreddersy anbefalingene. Fra et treningsdatavolum og kjøretidsperspektiv, måtte løsningen være skalerbar for å behandle millioner av poster innenfor tidsrammen som allerede er forpliktet til nedstrømsforbrukere i TRs forretningsteam.
De følgende avsnittene forklarer komponentene som er involvert i løsningen.
ML treningspipeline
Interaksjoner mellom brukerne og innholdet samles inn i form av clickstream-data, som genereres etter hvert som kunden klikker på innholdet. TR analyserer om dette er en del av abonnementsplanen deres eller utover abonnementsplanen, slik at de kan gi ytterligere detaljer om prisen og alternativene for planregistrering. Dataene om brukerinteraksjoner fra ulike kilder er bevart i datavarehuset deres.
Følgende diagram illustrerer ML-treningspipeline.
Rørledningen starter med en AWS Batch-jobb som trekker ut dataene fra datavarehuset og transformerer dataene for å lage interaksjoner, brukere og varedatasett.
Følgende datasett brukes til å trene modellen:
- Strukturerte produktdata – Abonnementer, bestillinger, produktkatalog, transaksjoner og kundedetaljer
- Semistrukturerte atferdsdata – Brukere, bruk og interaksjoner
Disse transformerte dataene lagres i en Amazon enkel lagringstjeneste (Amazon S3) bøtte, som importeres til Amazon Personalize for ML-trening. Fordi TR ønsker å generere personlige anbefalinger for sine brukere, bruker de USER_PERSONALIZATION oppskrift for å trene ML-modeller for deres tilpassede data, som omtales som å lage en løsningsversjon. Etter at løsningsversjonen er opprettet, brukes den til å generere personlige anbefalinger for brukerne.
Hele arbeidsflyten er orkestrert ved hjelp av AWS trinnfunksjoner. Varslene og varslene fanges opp og publiseres til Microsoft Teams ved hjelp av Amazon enkel varslingstjeneste (Amazon SNS) og Amazon EventBridge.
Generering av personaliserte anbefalinger-pipeline: Batch-inferens
Kundens krav og preferanser endres veldig ofte, og de siste interaksjonene som er fanget opp i klikkstrømdata fungerer som et nøkkeldatapunkt for å forstå kundens endrede preferanser. For å tilpasse seg stadig skiftende kundepreferanser, genererer TR personlige anbefalinger på daglig basis.
Følgende diagram illustrerer rørledningen for å generere personlige anbefalinger.
En DataBrew-jobb trekker ut dataene fra TR-datavarehuset for brukerne som er kvalifisert til å gi anbefalinger under fornyelse basert på gjeldende abonnementsplan og nylig aktivitet. DataBrew-verktøyet for visuell dataforberedelse gjør det enkelt for TR-dataanalytikere og dataforskere å rense og normalisere data for å forberede dem for analyser og ML. Muligheten til å velge mellom over 250 forhåndsbygde transformasjoner i det visuelle dataforberedelsesverktøyet for å automatisere dataforberedelsesoppgaver, alt uten å måtte skrive noen kode, var en viktig funksjon. DataBrew-jobben genererer et inkrementelt datasett for interaksjoner og input for batch-anbefalingsjobben og lagrer utdataene i en S3-bøtte. Det nylig genererte inkrementelle datasettet importeres til interaksjonsdatasettet. Når den inkrementelle datasettimporteringsjobben er vellykket, utløses en Amazon Personalize batch-anbefalingsjobb med inndataene. Amazon Personalize genererer de siste anbefalingene for brukerne som er gitt i inndataene og lagrer dem i en S3-bøtte med anbefalinger.
Prisoptimalisering er det siste trinnet før de nyopprettede anbefalingene er klare til bruk. TR kjører en kostnadsoptimaliseringsjobb på anbefalingene som genereres og bruker SageMaker til å kjøre tilpassede modeller på anbefalingene som en del av dette siste trinnet. En AWS Glue-jobb kuraterer utdataene generert fra Amazon Personalize og transformerer det til inndataformatet som kreves av den tilpassede SageMaker-modellen. TR er i stand til å dra fordel av bredden av tjenestene som AWS tilbyr, ved å bruke både Amazon Personalize og SageMaker i anbefalingsplattformen for å skreddersy anbefalinger basert på type kundefirma og sluttbrukere.
Hele arbeidsflyten er frakoblet og orkestrert ved hjelp av Step Functions, som gir fleksibiliteten til å skalere rørledningen avhengig av databehandlingskravene. Varslene og varslene fanges opp ved hjelp av Amazon SNS og EventBridge.
Driver e-postkampanjer
Anbefalingene som genereres sammen med prisresultatene brukes til å drive e-postkampanjer til TRs kunder. En AWS Batch-jobb brukes til å kuratere anbefalingene for hver kunde og berike den med den optimaliserte prisinformasjonen. Disse anbefalingene tas inn i TRs kampanjesystemer, som driver følgende e-postkampanjer:
- Automatisert abonnementsfornyelse eller oppgraderingskampanjer med nye produkter som kan interessere kunden
- Mid-kontrakt fornyelseskampanjer med bedre tilbud og mer relevante produkter og juridisk innholdsmateriell
Informasjonen fra denne prosessen kopieres også til kundeportalen, slik at kunder som vurderer sitt nåværende abonnement kan se de nye fornyelsesanbefalingene. TR har sett en høyere konverteringsrate fra e-postkampanjer, noe som har ført til økte salgsordrer, siden implementeringen av den nye anbefalingsplattformen.
Hva er det neste: Anbefalingspipeline i sanntid
Kundekrav og handleatferd endres i sanntid, og å tilpasse anbefalingene til sanntidsendringene er nøkkelen til å levere riktig innhold. Etter å ha sett en stor suksess med å distribuere et batch-anbefalingssystem, planlegger TR nå å ta denne løsningen til neste nivå ved å implementere en sanntidsanbefalingspipeline for å generere anbefalinger ved hjelp av Amazon Personalize.
Følgende diagram illustrerer arkitekturen for å gi sanntidsanbefalinger.
Sanntidsintegreringen starter med å samle inn live brukerengasjementdata og strømme dem til Amazon Personalize. Ettersom brukerne samhandler med TRs applikasjoner, genererer de clickstream-hendelser som publiseres i Amazon Kinesis datastrømmer. Deretter tas hendelsene inn i TRs sentraliserte strømmeplattform, som er bygget på toppen av Amazon administrerte strømming for Kafka (Amazon MSK). Amazon MSK gjør det enkelt å innta og behandle strømmedata i sanntid med fullt administrert Apache Kafka. I denne arkitekturen fungerer Amazon MSK som en strømmeplattform og utfører alle datatransformasjoner som kreves på de rå innkommende klikkstrømhendelsene. Deretter en AWS Lambda funksjonen utløses for å filtrere hendelsene til skjemaet som er kompatibelt med Amazon Personalize-datasettet og skyve disse hendelsene til en Amazon Personalize-hendelsessporer ved hjelp av en putEvent
API. Dette gjør at Amazon Personalize kan lære av brukerens siste oppførsel og inkludere relevante elementer i anbefalinger.
TRs nettapplikasjoner påkaller et API distribuert i Amazon API-gateway for å få anbefalinger, som utløser en Lambda-funksjon for å påkalle en GetRecommendations
API-anrop med Amazon Personalize. Amazon Personalize gir det siste settet med personlig tilpassede anbefalinger tilpasset brukeratferden, som leveres tilbake til nettapplikasjonene via Lambda og API Gateway.
Med denne sanntidsarkitekturen kan TR betjene kundene sine med personlige anbefalinger tilpasset deres nyeste oppførsel og betjene deres behov bedre.
konklusjonen
I dette innlegget viste vi deg hvordan TR brukte Amazon Personalize og andre AWS-tjenester for å implementere en anbefalingsmotor. Amazon Personalize gjorde det mulig for TR å akselerere utviklingen og distribusjonen av høyytelsesmodeller for å gi anbefalinger til kundene sine. TR er i stand til å ombord en ny serie produkter i løpet av uker nå, sammenlignet med måneder tidligere. Med Amazon Personalize og SageMaker er TR i stand til å heve kundeopplevelsen med bedre innholdsabonnementsplaner og priser for kundene deres.
Hvis du likte å lese denne bloggen og ønsker å lære mer om Amazon Personalize og hvordan det kan hjelpe organisasjonen din med å bygge anbefalingssystemer, vennligst se utviklerveiledning.
Om forfatterne
Hisham Fahim er en ledende maskinlæringsingeniør og personaliseringsmotorarkitekt hos Thomson Reuters. Han har jobbet med organisasjoner i akademia og industri, alt fra store bedrifter til mellomstore startups. Med fokus på skalerbare dyplæringsarkitekturer, har han erfaring innen mobil robotikk, biomedisinsk bildeanalyse samt anbefalingssystemer. Bortsett fra datamaskiner liker han astrofotografering, lesing og langdistansesykling.
Srinivasa Shaik er løsningsarkitekt ved AWS med base i Boston. Han hjelper Enterprise-kunder med å akselerere reisen til skyen. Han er lidenskapelig opptatt av containere og maskinlæringsteknologier. På fritiden liker han å tilbringe tid med familien, lage mat og reise.
Vamshi Krishna Enabothala er en Sr. Applied AI Specialist Architect ved AWS. Han jobber med kunder fra forskjellige sektorer for å akselerere effektive data, analyser og maskinlæringsinitiativer. Han brenner for anbefalingssystemer, NLP og datasyn innen AI og ML. Utenom jobben er Vamshi en RC-entusiast, og bygger RC-utstyr (fly, biler og droner), og liker også hagearbeid.
Simone Zucchet er Senior Solutions Architect hos AWS. Med over 6 års erfaring som Cloud Architect, liker Simone å jobbe med innovative prosjekter som bidrar til å transformere måten organisasjoner tilnærmer seg forretningsproblemer. Han hjelper til med å støtte store bedriftskunder hos AWS og er en del av Machine Learning TFC. Utenom yrkeslivet liker han å jobbe med biler og fotografering.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-delivers-personalized-content-subscription-plans-at-scale-using-amazon-personalize/
- 100
- 7
- a
- evne
- I stand
- Om oss
- Academia
- akselerere
- Logg inn
- Regnskap og administrasjon
- nøyaktig
- tvers
- aktivitet
- tilpasse
- Ytterligere
- Fordel
- Etter
- AI
- AI / ML
- Alle
- tillater
- allerede
- Amazon
- Amazon Tilpasse
- analyse
- analytikere
- analytics
- analyser
- og
- svar
- Apache
- api
- søknader
- anvendt
- Anvendt AI
- tilnærming
- arkitektur
- områder
- rundt
- assosiert
- automatisere
- bevissthet
- AWS
- AWS Lim
- tilbake
- basert
- basis
- fordi
- før du
- BEST
- Bedre
- mellom
- Beyond
- biomedisinsk
- Blogg
- boston
- bredde
- bygge
- Bygning
- bygget
- virksomhet
- bedrifter
- ring
- Kampanje
- valgkamp
- Kampanjer
- biler
- katalog
- sentrert
- sentralisert
- utfordre
- endring
- Endringer
- endring
- Velg
- Cloud
- kode
- Samle
- forpliktet
- Selskaper
- sammenlignet
- kompatibel
- komponenter
- datamaskin
- Datamaskin syn
- datamaskiner
- vurderer
- stadig
- forbruker
- Forbrukere
- Containere
- innhold
- fortsatte
- Konvertering
- Kjerne
- Kostnad
- kunne
- skape
- opprettet
- Opprette
- kuratert
- kuraterer
- Gjeldende
- skikk
- kunde
- kunde Data
- kundeopplevelse
- Kunder
- daglig
- dato
- Dataklargjøring
- databehandling
- datasett
- avtale
- avgjørelser
- dyp
- dyp læring
- levere
- leverer
- avhengig
- utplassert
- utplasserings
- distribusjon
- designet
- detaljer
- utviklet
- Utvikling
- forskjellig
- avstand
- domene
- stasjonen
- kjøring
- Droner
- under
- hver enkelt
- Tidligere
- Tidlig
- Hev
- kvalifisert
- emalje
- aktivert
- muliggjør
- engasjement
- Motor
- ingeniør
- berike
- Enterprise
- bedrifter
- entusiast
- Hele
- utstyr
- Event
- hendelser
- stadig skiftende
- utvikle seg
- erfaring
- ekspertise
- Forklar
- trekke ut
- ekstrakter
- familie
- raskere
- Trekk
- filtrere
- slutt~~POS=TRUNC
- finansiell
- Finn
- Firm
- fleksibilitet
- Fokus
- etter
- skjema
- format
- dannet
- RAMME
- fra
- fullt
- funksjon
- funksjoner
- gateway
- generere
- generert
- genererer
- genererer
- få
- få
- gir
- Mål
- flott
- å ha
- hjelpe
- hjelper
- høy ytelse
- høyere
- Hvordan
- HTML
- HTTPS
- menneskelig
- bilde
- iverksette
- implementere
- importere
- viktig
- in
- inkludere
- Innkommende
- økt
- industri
- informasjon
- initiativer
- Innovasjon
- innovative
- inngang
- integrert
- integrering
- Intelligens
- samhandler
- interaksjoner
- interesse
- involvert
- IT
- varer
- Jobb
- Jobb
- reise
- nøkkel
- stor
- Siste
- siste
- føre
- ledende
- LÆRE
- læring
- Legacy
- Lovlig
- Nivå
- Lisensiering
- Life
- løfte
- leve
- laste
- Lang
- Lav
- maskin
- maskinlæring
- gjøre
- GJØR AT
- administrer
- fikk til
- marked
- markedsledende
- Marketing
- Markets
- modenhet
- Media
- Microsoft
- Microsoft-team
- kunne
- millioner
- ML
- Mobil
- modell
- modeller
- måneder
- mer
- mest
- Trenger
- behov
- Ny
- nye produkter
- nyheter
- neste
- nlp
- varsling
- varslinger
- Tilbud
- Ombord
- ONE
- operasjonell
- Drift
- optimalisering
- optimalisert
- alternativer
- ordrer
- organisasjon
- organisasjoner
- Annen
- utenfor
- pakker
- del
- lidenskapelig
- Utfør
- utfører
- Tilpassing
- tilpasse
- Personlig
- perspektiv
- fotografering
- rørledning
- fly
- planlegging
- planer
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- vær så snill
- Point
- Portal
- mulig
- Post
- preferanser
- Forbered
- forbereder
- pris
- Prisene
- prising
- problemer
- prosess
- prosessering
- Produkt
- Produkter
- profesjonell
- fagfolk
- prosjekter
- gi
- forutsatt
- gir
- gi
- publisert
- Skyv
- kvalitet
- raskt
- heve
- spenner
- Sats
- Raw
- Lesning
- klar
- ekte
- sanntids
- nylig
- nylig
- .
- Anbefaling
- anbefalinger
- poster
- redusere
- referert
- reflektere
- relevant
- replikert
- påkrevd
- behov
- Krav
- Resultater
- Reuters
- gjennomgå
- Risiko
- robotikk
- regler
- Kjør
- sagemaker
- salg
- skalerbar
- Skala
- skalering
- forskere
- seksjoner
- sektorer
- se
- senior
- betjene
- serverer
- tjeneste
- Tjenester
- servering
- sett
- Shopping
- undertegne
- signifikant
- Enkelt
- forenkle
- siden
- So
- løsning
- Solutions
- kilde
- Kilder
- spesialist
- utgifter
- starter
- startups
- Trinn
- lagring
- lagret
- butikker
- streaming
- abonnement
- abonnementer
- suksess
- vellykket
- suite
- støtte
- system
- Systemer
- skreddersydd
- Ta
- tar
- oppgaver
- skatt
- lag
- lag
- Technologies
- Teknologi
- De
- deres
- Thomson Reuters
- Gjennom
- tid
- til
- verktøy
- topp
- Tog
- trent
- Kurs
- Transaksjoner
- Transform
- transformasjoner
- forvandlet
- Traveling
- Trender
- utløst
- klarert
- forstå
- forståelse
- up-to-date
- oppgradering
- bruk
- bruke
- Bruker
- Brukere
- Verdifull
- ulike
- versjon
- av
- syn
- volum
- ønsket
- Rikdom
- web
- nettapplikasjoner
- uker
- Hva
- hvilken
- HVEM
- innenfor
- uten
- Arbeid
- arbeidet
- arbeid
- virker
- Verdens
- ville
- skrive
- skrevet
- år
- Du
- Din
- zephyrnet