Dette indlæg er skrevet af Hesham Fahim fra Thomson Reuters.
Thomson Reuters (TR) er en af verdens mest betroede informationsorganisationer for virksomheder og professionelle. Det giver virksomheder den intelligens, teknologi og menneskelige ekspertise, de har brug for for at finde pålidelige svar, hvilket gør dem i stand til at træffe bedre beslutninger hurtigere. TRs kunder spænder over finans-, risiko-, juridiske, skatte-, regnskabs- og mediemarkederne.
Thomson Reuters leverer markedsledende produkter i kampagnen Tax, Legal and News, som brugere kan tilmelde sig ved hjælp af en abonnementslicensmodel. For at forbedre denne oplevelse for deres kunder ønskede TR at skabe en centraliseret anbefalingsplatform, der gjorde det muligt for deres salgsteam at foreslå de mest relevante abonnementspakker til deres kunder, og generere forslag, der hjælper med at øge bevidstheden om produkter, der kunne hjælpe deres kunder med at betjene markedet bedre gennem skræddersyet produktudvalg.
Før opbygningen af denne centraliserede platform havde TR en ældre regelbaseret motor til at generere fornyelsesanbefalinger. Reglerne i denne motor var foruddefinerede og skrevet i SQL, som udover at være en udfordring at administrere, også kæmpede for at klare udbredelsen af data fra TRs forskellige integrerede datakilder. TR-kundedata ændrer sig hurtigere, end forretningsreglerne kan udvikle sig for at afspejle skiftende kundebehov. Nøglekravet til TRs nye maskinlæringsbaserede (ML)-baserede personaliseringsmotor var centreret omkring et nøjagtigt anbefalingssystem, der tager højde for de seneste kundetrends. Den ønskede løsning ville være en med lave driftsomkostninger, evnen til at accelerere levering af forretningsmål og en personaliseringsmotor, der konstant kunne trænes med opdaterede data til at håndtere ændrede forbrugervaner og nye produkter.
Personalisering af fornyelsesanbefalingerne baseret på, hvad der ville være værdifulde produkter for TRs kunder, var en vigtig forretningsudfordring for salgs- og marketingteamet. TR har et væld af data, der kan bruges til personalisering, som er blevet indsamlet fra kundeinteraktioner og lagret i et centraliseret datavarehus. TR har været en early adopter af ML med Amazon SageMaker, og deres modenhed i AI/ML-domænet betød, at de havde samlet et betydeligt datasæt af relevante data i et datavarehus, som teamet kunne træne en personaliseringsmodel med. TR har fortsat deres AI/ML-innovation og har for nylig udviklet en fornyet anbefalingsplatform ved hjælp af Amazon Tilpas, som er en fuldt administreret ML-tjeneste, der bruger brugerinteraktioner og elementer til at generere anbefalinger til brugere. I dette indlæg forklarer vi, hvordan TR brugte Amazon Personalize til at bygge et skalerbart anbefalingssystem med flere lejere, der giver de bedste produktabonnementer og tilhørende priser til deres kunder.
Løsningsarkitektur
Løsningen skulle designes under hensyntagen til TR's kerneoperationer omkring forståelse af brugere gennem data; at give disse brugere personligt tilpasset og relevant indhold fra et stort korpus af data var et missionskritisk krav. At have et veldesignet anbefalingssystem er nøglen til at få kvalitetsanbefalinger, der er tilpasset hver brugers krav.
Løsningen krævede indsamling og forberedelse af brugeradfærdsdata, træning af en ML-model ved hjælp af Amazon Personalize, generering af personlige anbefalinger gennem den trænede model og kørsel af marketingkampagner med de personlige anbefalinger.
TR ønskede at drage fordel af AWS-administrerede tjenester, hvor det var muligt, for at forenkle driften og reducere udifferentierede tunge løft. TR brugt AWS Glue Data Brew , AWS batch jobs til at udføre udtrække, transformere og indlæse (ETL) jobs i ML pipelines, og SageMaker sammen med Amazon Personalize for at skræddersy anbefalingerne. Ud fra et træningsdatavolumen og runtime-perspektiv skulle løsningen være skalerbar til at behandle millioner af poster inden for den tidsramme, der allerede er forpligtet til downstream-forbrugere i TRs forretningsteams.
De følgende afsnit forklarer de komponenter, der er involveret i løsningen.
ML uddannelse pipeline
Interaktioner mellem brugerne og indholdet indsamles i form af klikstrømsdata, som genereres i takt med, at kunden klikker på indholdet. TR analyserer, om dette er en del af deres abonnementsplan eller ud over deres abonnementsplan, så de kan give yderligere detaljer om prisen og mulighederne for plantilmelding. Brugerinteraktionsdata fra forskellige kilder bevares i deres datavarehus.
Følgende diagram illustrerer ML-træningspipeline.
Pipelinen starter med et AWS Batch-job, der udtrækker dataene fra datavarehuset og transformerer dataene for at skabe interaktioner, brugere og varedatasæt.
Følgende datasæt bruges til at træne modellen:
- Strukturerede produktdata – Abonnementer, ordrer, produktkatalog, transaktioner og kundeoplysninger
- Semistrukturerede adfærdsdata – Brugere, brug og interaktioner
Disse transformerede data lagres i en Amazon Simple Storage Service (Amazon S3) spand, som importeres til Amazon Personalize til ML-træning. Fordi TR ønsker at generere personlige anbefalinger til deres brugere, bruger de USER_PERSONALIZATION opskrift på at træne ML-modeller til deres brugerdefinerede data, hvilket omtales som at skabe en løsningsversion. Når løsningsversionen er oprettet, bruges den til at generere personlige anbefalinger til brugerne.
Hele arbejdsgangen orkestreres vha AWS-trinfunktioner. Advarslerne og meddelelserne fanges og udgives til Microsoft Teams ved hjælp af Amazon Simple Notification Service (Amazon SNS) og Amazon Eventbridge.
Generering af personaliserede anbefalingers pipeline: Batch-inferens
Kundekrav og præferencer ændrer sig meget ofte, og de seneste interaktioner fanget i klikstrømsdata fungerer som et nøgledatapunkt for at forstå kundens ændrede præferencer. For at tilpasse sig stadigt skiftende kundepræferencer, genererer TR personlige anbefalinger på daglig basis.
Følgende diagram illustrerer pipelinen til at generere personlige anbefalinger.
Et DataBrew-job udtrækker dataene fra TR-datavarehuset for de brugere, der er berettiget til at give anbefalinger under fornyelse baseret på den aktuelle abonnementsplan og seneste aktivitet. DataBrews visuelle dataforberedelsesværktøj gør det nemt for TR-dataanalytikere og dataforskere at rense og normalisere data for at forberede dem til analyser og ML. Evnen til at vælge mellem over 250 forudbyggede transformationer i det visuelle dataforberedelsesværktøj til at automatisere dataforberedelsesopgaver, alt sammen uden at skulle skrive nogen kode, var en vigtig funktion. DataBrew-jobbet genererer et inkrementelt datasæt til interaktioner og input til batchanbefalingsjobbet og gemmer outputtet i en S3-bøtte. Det nyligt genererede trinvise datasæt importeres til interaktionsdatasættet. Når det inkrementelle datasætimportjob er vellykket, udløses et Amazon Personalize batchanbefalingsjob med inputdataene. Amazon Personalize genererer de seneste anbefalinger til de brugere, der er angivet i inputdataene og gemmer dem i en S3-anbefalingsbøtte.
Prisoptimering er det sidste skridt, før de nydannede anbefalinger er klar til brug. TR kører et omkostningsoptimeringsjob på de genererede anbefalinger og bruger SageMaker til at køre tilpassede modeller på anbefalingerne som en del af dette sidste trin. Et AWS Glue-job kuraterer output genereret fra Amazon Personalize og transformerer det til det inputformat, der kræves af den tilpassede SageMaker-model. TR er i stand til at drage fordel af bredden af de tjenester, som AWS leverer, ved at bruge både Amazon Personalize og SageMaker i anbefalingsplatformen til at skræddersy anbefalinger baseret på typen af kundefirma og slutbrugere.
Hele arbejdsgangen er afkoblet og orkestreret ved hjælp af Step Functions, som giver fleksibiliteten til at skalere pipelinen afhængigt af databehandlingskravene. Advarslerne og meddelelserne fanges ved hjælp af Amazon SNS og EventBridge.
Fremme af e-mail-kampagner
Anbefalingerne, der genereres sammen med prissætningsresultaterne, bruges til at drive e-mail-kampagner til TRs kunder. Et AWS Batch-job bruges til at sammensætte anbefalingerne for hver kunde og berige den med de optimerede prisoplysninger. Disse anbefalinger indlæses i TR's kampagnesystemer, som driver følgende e-mail-kampagner:
- Automatisk abonnementsfornyelse eller opgraderingskampagner med nye produkter, der kan interessere kunden
- Mid-kontrakt fornyelseskampagner med bedre tilbud og mere relevante produkter og lovligt indholdsmateriale
Oplysningerne fra denne proces replikeres også til kundeportalen, så kunder, der gennemgår deres nuværende abonnement, kan se de nye fornyelsesanbefalinger. TR har oplevet en højere konverteringsrate fra e-mail-kampagner, hvilket har ført til øgede salgsordrer, siden implementeringen af den nye anbefalingsplatform.
Hvad er det næste: Anbefalingspipeline i realtid
Kundekrav og indkøbsadfærd ændrer sig i realtid, og tilpasning af anbefalinger til ændringerne i realtid er nøglen til at levere det rigtige indhold. Efter at have set en stor succes med at implementere et batch-anbefalingssystem, planlægger TR nu at tage denne løsning til næste niveau ved at implementere en realtidsanbefalingspipeline til at generere anbefalinger ved hjælp af Amazon Personalize.
Følgende diagram illustrerer arkitekturen for at give anbefalinger i realtid.
Realtidsintegrationen starter med at indsamle live brugerengagementdata og streame dem til Amazon Personalize. Efterhånden som brugerne interagerer med TRs applikationer, genererer de clickstream events, som publiceres i Amazon Kinesis datastrømme. Herefter indtages begivenhederne i TRs centraliserede streamingplatform, som er bygget ovenpå Amazon administrerede streaming til Kafka (Amazon MSK). Amazon MSK gør det nemt at indtage og behandle streamingdata i realtid med fuldt administreret Apache Kafka. I denne arkitektur fungerer Amazon MSK som en streamingplatform og udfører alle nødvendige datatransformationer på de rå indkommende clickstream-begivenheder. Derefter en AWS Lambda funktionen udløses for at filtrere hændelserne til skemaet, der er kompatibelt med Amazon Personalize-datasættet og skubbe disse hændelser til en Amazon Personalize-hændelsessporing ved hjælp af en putEvent
API. Dette giver Amazon Personalize mulighed for at lære af din brugers seneste adfærd og inkludere relevante elementer i anbefalinger.
TR's webapplikationer påberåber sig en API implementeret i Amazon API Gateway for at få anbefalinger, som udløser en Lambda-funktion til at påkalde en GetRecommendations
API-kald med Amazon Personalize. Amazon Personalize leverer det seneste sæt af personlige anbefalinger tilpasset brugeradfærden, som leveres tilbage til webapplikationerne via Lambda og API Gateway.
Med denne realtidsarkitektur kan TR betjene deres kunder med personlige anbefalinger, der er tilpasset deres seneste adfærd og bedre opfylde deres behov.
Konklusion
I dette indlæg viste vi dig, hvordan TR brugte Amazon Personalize og andre AWS-tjenester til at implementere en anbefalingsmotor. Amazon Personalize gjorde det muligt for TR at fremskynde udviklingen og implementeringen af højtydende modeller for at give anbefalinger til deres kunder. TR er i stand til at ombord på en ny suite af produkter inden for få uger nu, sammenlignet med måneder tidligere. Med Amazon Personalize og SageMaker er TR i stand til at løfte kundeoplevelsen med bedre indholdsabonnementer og priser for deres kunder.
Hvis du kunne lide at læse denne blog og gerne vil lære mere om Amazon Personalize, og hvordan det kan hjælpe din organisation med at opbygge anbefalingssystemer, så se venligst udviklervejledning.
Om forfatterne
Hisham Fahim er en Lead Machine Learning Engineer og Personalization Engine Architect hos Thomson Reuters. Han har arbejdet med organisationer i den akademiske verden og industrien lige fra store virksomheder til mellemstore startups. Med fokus på skalerbare deep learning-arkitekturer har han erfaring med mobil robotik, biomedicinsk billedanalyse samt anbefalingssystemer. Væk fra computere nyder han astrofotografering, læsning og langdistancecykling.
Srinivasa Shaik er Solutions Architect hos AWS med base i Boston. Han hjælper Enterprise-kunder med at fremskynde deres rejse til skyen. Han brænder for containere og maskinlæringsteknologier. I sin fritid nyder han at bruge tid sammen med sin familie, lave mad og rejse.
Vamshi Krishna Enabothala er Sr. Applied AI Specialist Architect hos AWS. Han arbejder med kunder fra forskellige sektorer for at fremskynde effektive data, analyser og maskinlæringsinitiativer. Han brænder for anbefalingssystemer, NLP og computervisionsområder inden for AI og ML. Uden for arbejdet er Vamshi en RC-entusiast, der bygger RC-udstyr (fly, biler og droner) og nyder også havearbejde.
Simone Zucchet er Senior Solutions Architect hos AWS. Med over 6 års erfaring som Cloud-arkitekt nyder Simone at arbejde på innovative projekter, der hjælper med at transformere den måde, organisationer griber forretningsproblemer på. Han hjælper med at støtte store virksomhedskunder hos AWS og er en del af Machine Learning TFC. Uden for sit professionelle liv nyder han at arbejde med biler og fotografering.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-delivers-personalized-content-subscription-plans-at-scale-using-amazon-personalize/
- 100
- 7
- a
- evne
- I stand
- Om
- Academy
- fremskynde
- Konto
- Bogføring og administration
- præcis
- tværs
- aktivitet
- tilpasse
- Yderligere
- Fordel
- Efter
- AI
- AI / ML
- Alle
- tillader
- allerede
- Amazon
- Amazon Tilpas
- analyse
- Analytikere
- analytics
- analyser
- ,
- svar
- Apache
- api
- applikationer
- anvendt
- Anvendt AI
- tilgang
- arkitektur
- områder
- omkring
- forbundet
- automatisere
- bevidsthed
- AWS
- AWS Lim
- tilbage
- baseret
- grundlag
- fordi
- før
- BEDSTE
- Bedre
- mellem
- Beyond
- biomedicinsk
- Blog
- boston
- bredde
- bygge
- Bygning
- bygget
- virksomhed
- virksomheder
- ringe
- Kampagne
- valgkamp
- Kampagner
- biler
- katalog
- centreret
- centraliseret
- udfordre
- lave om
- Ændringer
- skiftende
- Vælg
- Cloud
- kode
- Indsamling
- engageret
- Virksomheder
- sammenlignet
- kompatibel
- komponenter
- computer
- Computer Vision
- computere
- Overvejer
- konstant
- forbruger
- Forbrugere
- Beholdere
- indhold
- fortsatte
- Konvertering
- Core
- Koste
- kunne
- skabe
- oprettet
- Oprettelse af
- kurateret
- kuraterer
- Nuværende
- skik
- kunde
- kundedata
- Kundeoplevelse
- Kunder
- dagligt
- data
- Dataforberedelse
- databehandling
- datasæt
- deal
- afgørelser
- dyb
- dyb læring
- leverer
- leverer
- Afhængigt
- indsat
- implementering
- implementering
- konstrueret
- detaljer
- udviklet
- Udvikling
- forskellige
- afstand
- domæne
- køre
- kørsel
- Drones
- i løbet af
- hver
- tidligere
- Tidligt
- OPHØJE
- berettiget
- aktiveret
- muliggør
- engagement
- Engine (Motor)
- ingeniør
- berige
- Enterprise
- virksomheder
- entusiast
- Hele
- udstyr
- begivenhed
- begivenheder
- evigt skiftende
- udvikle sig
- erfaring
- ekspertise
- Forklar
- ekstrakt
- Uddrag
- familie
- hurtigere
- Feature
- filtrere
- endelige
- finansielle
- Finde
- Firm
- Fleksibilitet
- Fokus
- efter
- formular
- format
- dannet
- FRAME
- fra
- fuldt ud
- funktion
- funktioner
- gateway
- generere
- genereret
- genererer
- generere
- få
- få
- giver
- Mål
- stor
- have
- hjælpe
- hjælper
- Høj ydeevne
- højere
- Hvordan
- HTML
- HTTPS
- menneskelig
- billede
- gennemføre
- gennemføre
- importere
- vigtigt
- in
- omfatter
- Indgående
- øget
- industrien
- oplysninger
- initiativer
- Innovation
- innovativ
- indgang
- integreret
- integration
- Intelligens
- interaktion
- interaktioner
- interesse
- involverede
- IT
- Varer
- Job
- Karriere
- rejse
- Nøgle
- stor
- Efternavn
- seneste
- føre
- førende
- LÆR
- læring
- Legacy
- Politikker
- Niveau
- Licenser
- Livet
- løft
- leve
- belastning
- Lang
- Lav
- maskine
- machine learning
- lave
- maerker
- administrere
- lykkedes
- Marked
- markedsledende
- Marketing
- Markeder
- modenhed
- Medier
- microsoft
- microsoft teams
- måske
- millioner
- ML
- Mobil
- model
- modeller
- måned
- mere
- mest
- Behov
- behov
- Ny
- nye produkter
- nyheder
- næste
- NLP
- underretning
- meddelelser
- Tilbud
- Ombord
- ONE
- operationelle
- Produktion
- optimering
- optimeret
- Indstillinger
- ordrer
- organisation
- organisationer
- Andet
- uden for
- pakker
- del
- lidenskabelige
- Udfør
- udfører
- Personalisering
- Tilpas
- Personlig
- perspektiv
- fotografering
- pipeline
- fly
- planlægning
- planer
- perron
- plato
- Platon Data Intelligence
- PlatoData
- Vær venlig
- Punkt
- Portal
- mulig
- Indlæg
- præferencer
- Forbered
- forberede
- pris
- Priser
- prissætning
- problemer
- behandle
- forarbejdning
- Produkt
- Produkter
- professionel
- professionelle partnere
- projekter
- give
- forudsat
- giver
- leverer
- offentliggjort
- Skub ud
- kvalitet
- hurtigt
- rejse
- spænder
- Sats
- Raw
- Læsning
- klar
- ægte
- realtid
- nylige
- for nylig
- opskrift
- Anbefaling
- anbefalinger
- optegnelser
- reducere
- benævnt
- afspejler
- relevant
- replikeres
- påkrævet
- krav
- Krav
- Resultater
- Reuters
- gennemgå
- Risiko
- robotteknik
- regler
- Kør
- sagemaker
- salg
- skalerbar
- Scale
- skalering
- forskere
- sektioner
- Sektorer
- se
- senior
- tjener
- tjener
- tjeneste
- Tjenester
- servering
- sæt
- Shopping
- underskrive
- signifikant
- Simpelt
- forenkle
- siden
- So
- løsninger
- Løsninger
- Kilde
- Kilder
- specialist
- udgifterne
- starter
- Nystartede
- Trin
- opbevaring
- opbevaret
- forhandler
- streaming
- abonnement
- abonnementer
- succes
- vellykket
- suite
- support
- systemet
- Systemer
- skræddersyet
- Tag
- tager
- opgaver
- skat
- hold
- hold
- Teknologier
- Teknologier
- deres
- Thomson Reuters
- Gennem
- tid
- til
- værktøj
- top
- Tog
- uddannet
- Kurser
- Transaktioner
- Transform
- transformationer
- omdannet
- Traveling
- Tendenser
- udløst
- betroet
- forstå
- forståelse
- up-to-date
- opgradering
- Brug
- brug
- Bruger
- brugere
- Værdifuld
- forskellige
- udgave
- via
- vision
- bind
- ønskede
- Rigdom
- web
- webapplikationer
- uger
- Hvad
- som
- WHO
- inden for
- uden
- Arbejde
- arbejdede
- arbejder
- virker
- Verdens
- ville
- skriver
- skriftlig
- år
- Du
- Din
- zephyrnet