Dit bericht is mede geschreven door Hesham Fahim van Thomson Reuters.
Thomson Reuters (TR) is een van 's werelds meest vertrouwde informatieorganisaties voor bedrijven en professionals. Het biedt bedrijven de intelligentie, technologie en menselijke expertise die ze nodig hebben om betrouwbare antwoorden te vinden, waardoor ze sneller betere beslissingen kunnen nemen. De klanten van TR strekken zich uit over de financiรซle, risico-, juridische, fiscale, boekhoudkundige en mediamarkten.
Thomson Reuters levert marktleidende producten in de Tax, Legal en News-campagne, waarvoor gebruikers zich kunnen aanmelden met behulp van een abonnementslicentiemodel. Om deze ervaring voor hun klanten te verbeteren, wilde TR een gecentraliseerd aanbevelingsplatform creรซren waarmee hun verkoopteam de meest relevante abonnementspakketten aan hun klanten kon voorstellen en suggesties kon genereren die de bekendheid van producten helpen vergroten waarmee hun klanten de markt beter kunnen bedienen door productselecties op maat.
Voordat dit gecentraliseerde platform werd gebouwd, had TR een oude, op regels gebaseerde engine om aanbevelingen voor verlenging te genereren. De regels in deze engine waren vooraf gedefinieerd en geschreven in SQL, wat niet alleen een uitdaging vormde om te beheren, maar ook moeite had om het hoofd te bieden aan de verspreiding van gegevens uit de verschillende geรฏntegreerde gegevensbronnen van TR. TR-klantgegevens veranderen sneller dan de bedrijfsregels kunnen evolueren om veranderende klantbehoeften te weerspiegelen. De belangrijkste vereiste voor TR's nieuwe op machine learning (ML) gebaseerde personalisatie-engine was gecentreerd rond een nauwkeurig aanbevelingssysteem dat rekening houdt met recente klanttrends. De gewenste oplossing zou er een zijn met een lage operationele overhead, de mogelijkheid om sneller zakelijke doelen te behalen en een personalisatie-engine die voortdurend kan worden getraind met up-to-date gegevens om te kunnen omgaan met veranderende consumentengewoonten en nieuwe producten.
Het personaliseren van de verlengingsaanbevelingen op basis van wat waardevolle producten zouden zijn voor de klanten van TR, was een belangrijke zakelijke uitdaging voor het verkoop- en marketingteam. TR heeft een schat aan gegevens die kunnen worden gebruikt voor personalisatie, die zijn verzameld uit klantinteracties en zijn opgeslagen in een gecentraliseerd datawarehouse. TR is een early adopter van ML geweest met Amazon Sage Maker, en hun volwassenheid in het AI/ML-domein betekende dat ze een aanzienlijke dataset met relevante gegevens hadden verzameld in een datawarehouse, waarmee het team een โโpersonalisatiemodel kon trainen. TR heeft hun AI/ML-innovatie voortgezet en heeft onlangs een vernieuwd aanbevelingsplatform ontwikkeld met behulp van Amazon personaliseren, een volledig beheerde ML-service die gebruikersinteracties en items gebruikt om aanbevelingen voor gebruikers te genereren. In dit bericht leggen we uit hoe TR Amazon Personalize gebruikte om een โโschaalbaar, multi-tenant aanbevelingssysteem te bouwen dat de beste productabonnementen en bijbehorende prijzen aan hun klanten biedt.
Oplossingsarchitectuur
De oplossing moest worden ontworpen rekening houdend met de kernactiviteiten van TR rond het begrijpen van gebruikers door middel van gegevens; deze gebruikers voorzien van gepersonaliseerde en relevante inhoud uit een grote verzameling gegevens was een essentiรซle vereiste. Het hebben van een goed ontworpen aanbevelingssysteem is de sleutel tot kwaliteitsaanbevelingen die zijn aangepast aan de eisen van elke gebruiker.
De oplossing vereiste het verzamelen en voorbereiden van gegevens over gebruikersgedrag, het trainen van een ML-model met behulp van Amazon Personalize, het genereren van gepersonaliseerde aanbevelingen via het getrainde model en het aansturen van marketingcampagnes met de gepersonaliseerde aanbevelingen.
TR wilde waar mogelijk profiteren van door AWS beheerde services om operaties te vereenvoudigen en ongedifferentieerd zwaar tillen te verminderen. TR gebruikt AWS lijm DataBrew en AWS-batch jobs om de ETL-taken (extraheren, transformeren en laden) in de ML-pijplijnen uit te voeren, en SageMaker samen met Amazon Personalize om de aanbevelingen op maat te maken. Vanuit het oogpunt van trainingsgegevensvolume en runtime moest de oplossing schaalbaar zijn om miljoenen records te verwerken binnen het tijdsbestek dat al was vastgelegd voor downstream-consumenten in de zakelijke teams van TR.
In de volgende secties worden de onderdelen van de oplossing uitgelegd.
ML-trainingspijplijn
Interacties tussen de gebruikers en de inhoud worden verzameld in de vorm van clickstream-gegevens, die worden gegenereerd wanneer de klant op de inhoud klikt. TR analyseert of dit deel uitmaakt van hun abonnement of buiten hun abonnement, zodat ze aanvullende informatie kunnen geven over de prijs en abonnementsopties. De gegevens over gebruikersinteracties uit verschillende bronnen worden bewaard in hun datawarehouse.
Het volgende diagram illustreert de ML-trainingspijplijn.
De pijplijn begint met een AWS Batch-taak die de gegevens uit het datawarehouse haalt en de gegevens transformeert om interacties, gebruikers en itemdatasets te creรซren.
De volgende datasets worden gebruikt om het model te trainen:
- Gestructureerde productgegevens โ Abonnementen, bestellingen, productcatalogus, transacties en klantgegevens
- Semi-gestructureerde gedragsgegevens โ Gebruikers, gebruik en interacties
Deze getransformeerde gegevens worden opgeslagen in een Amazon eenvoudige opslagservice (Amazon S3) bucket, die wordt geรฏmporteerd in Amazon Personalize voor ML-training. Omdat TR gepersonaliseerde aanbevelingen voor hun gebruikers wil genereren, gebruiken ze de GEBRUIKER_PERSONALISATIE recept om ML-modellen te trainen voor hun aangepaste gegevens, ook wel het maken van een oplossingsversie genoemd. Nadat de oplossingsversie is gemaakt, wordt deze gebruikt voor het genereren van gepersonaliseerde aanbevelingen voor de gebruikers.
De hele workflow wordt georkestreerd met behulp van AWS Stap Functies. De waarschuwingen en meldingen worden vastgelegd en gepubliceerd naar Microsoft Teams met behulp van Amazon eenvoudige meldingsservice (Amazon SNS) en Amazon EventBridge.
Pijplijn met gepersonaliseerde aanbevelingen genereren: Batchgevolgtrekking
De eisen en voorkeuren van de klant veranderen heel vaak, en de nieuwste interacties die zijn vastgelegd in clickstream-gegevens dienen als een belangrijk gegevenspunt om inzicht te krijgen in de veranderende voorkeuren van de klant. Om zich aan te passen aan de steeds veranderende klantvoorkeuren, genereert TR dagelijks gepersonaliseerde aanbevelingen.
Het volgende diagram illustreert de pijplijn voor het genereren van gepersonaliseerde aanbevelingen.
Een DataBrew-taak extraheert de gegevens uit het TR-datawarehouse voor de gebruikers die tijdens de verlenging in aanmerking komen om aanbevelingen te doen op basis van het huidige abonnement en recente activiteit. De DataBrew tool voor visuele gegevensvoorbereiding maakt het voor TR-gegevensanalisten en gegevenswetenschappers gemakkelijk om gegevens op te schonen en te normaliseren om deze voor te bereiden op analyse en ML. De mogelijkheid om te kiezen uit meer dan 250 vooraf gebouwde transformaties binnen de tool voor visuele gegevensvoorbereiding om taken voor gegevensvoorbereiding te automatiseren, allemaal zonder dat er code geschreven hoeft te worden, was een belangrijk kenmerk. De DataBrew-taak genereert een incrementele gegevensset voor interacties en invoer voor de taak met batchaanbevelingen en slaat de uitvoer op in een S3-bucket. De nieuw gegenereerde incrementele dataset wordt geรฏmporteerd in de interacties-dataset. Wanneer de incrementele dataset-importtaak succesvol is, wordt een Amazon Personalize batch-aanbevelingstaak geactiveerd met de invoergegevens. Amazon Personalize genereert de nieuwste aanbevelingen voor de gebruikers in de invoergegevens en slaat deze op in een S3-bucket met aanbevelingen.
Prijsoptimalisatie is de laatste stap voordat de nieuw gevormde aanbevelingen klaar zijn voor gebruik. TR voert een kostenoptimalisatietaak uit op de gegenereerde aanbevelingen en gebruikt SageMaker om aangepaste modellen uit te voeren op basis van de aanbevelingen als onderdeel van deze laatste stap. Een AWS Glue-taak beheert de uitvoer die wordt gegenereerd door Amazon Personalize en transformeert deze naar het invoerformaat dat vereist is voor het aangepaste SageMaker-model. TR kan profiteren van de breedte van de services die AWS biedt, door zowel Amazon Personalize als SageMaker in het aanbevelingsplatform te gebruiken om aanbevelingen op maat te maken op basis van het type klantbedrijf en eindgebruikers.
De volledige workflow is ontkoppeld en georkestreerd met behulp van Step Functions, wat de flexibiliteit biedt om de pijplijn te schalen, afhankelijk van de vereisten voor gegevensverwerking. De waarschuwingen en meldingen worden vastgelegd met behulp van Amazon SNS en EventBridge.
Aansturen van e-mailcampagnes
De aanbevelingen die samen met de prijsresultaten worden gegenereerd, worden gebruikt om e-mailcampagnes naar de klanten van TR te sturen. Een AWS Batch-taak wordt gebruikt om de aanbevelingen voor elke klant samen te stellen en deze te verrijken met de geoptimaliseerde prijsinformatie. Deze aanbevelingen worden opgenomen in de campagnesystemen van TR, die de volgende e-mailcampagnes aansturen:
- Geautomatiseerde abonnementsverlenging of upgradecampagnes met nieuwe producten die de klant mogelijk interesseren
- Campagnes voor tussentijdse contractverlenging met betere aanbiedingen en relevantere producten en legale inhoud
De informatie van dit proces wordt ook gerepliceerd naar het klantenportaal, zodat klanten die hun huidige abonnement bekijken, de nieuwe verlengingsaanbevelingen kunnen zien. TR heeft sinds de implementatie van het nieuwe aanbevelingsplatform een โโhogere conversieratio van e-mailcampagnes gezien, wat heeft geleid tot meer verkooporders.
Wat volgt: pijplijn met real-time aanbevelingen
De eisen van de klant en het winkelgedrag veranderen in realtime, en het aanpassen van aanbevelingen aan de realtime veranderingen is de sleutel tot het aanbieden van de juiste inhoud. Na een groot succes te hebben gezien bij het implementeren van een batch-aanbevelingssysteem, is TR nu van plan om deze oplossing naar een hoger niveau te tillen door een realtime aanbevelingenpijplijn te implementeren om aanbevelingen te genereren met behulp van Amazon Personalize.
Het volgende diagram illustreert de architectuur om real-time aanbevelingen te doen.
De real-time integratie begint met het verzamelen van de live gegevens over gebruikersbetrokkenheid en het streamen ervan naar Amazon Personalize. Terwijl de gebruikers interactie hebben met de applicaties van TR, genereren ze clickstream-gebeurtenissen, die worden gepubliceerd in Amazon Kinesis-gegevensstromen. Vervolgens worden de evenementen opgenomen in het gecentraliseerde streamingplatform van TR, waarop is gebouwd Amazon Managed Streaming voor Kafka (Amazone MSK). Amazon MSK maakt het eenvoudig om streaminggegevens in realtime op te nemen en te verwerken met volledig beheerde Apache Kafka. In deze architectuur fungeert Amazon MSK als een streamingplatform en voert het alle gegevenstransformaties uit die nodig zijn voor de onbewerkte inkomende clickstream-gebeurtenissen. Dan een AWS Lambda functie wordt geactiveerd om de gebeurtenissen te filteren naar het schema dat compatibel is met de Amazon Personalize-dataset en die gebeurtenissen naar een Amazon Personalize-gebeurtenissentracker te pushen met behulp van een putEvent
API. Hierdoor kan Amazon Personalize leren van het meest recente gedrag van uw gebruiker en relevante items opnemen in aanbevelingen.
De webapplicaties van TR roepen een API aan die is geรฏmplementeerd in Amazon API-gateway om aanbevelingen te krijgen, die een Lambda-functie activeren om een GetRecommendations
API-oproep met Amazon Personalize. Amazon Personalize biedt de nieuwste set gepersonaliseerde aanbevelingen die zijn samengesteld op basis van het gebruikersgedrag en die via Lambda en API Gateway worden teruggestuurd naar de webapplicaties.
Met deze real-time architectuur kan TR hun klanten van dienst zijn met gepersonaliseerde aanbevelingen die zijn samengesteld op basis van hun meest recente gedrag en beter in hun behoeften voorzien.
Conclusie
In dit bericht hebben we je laten zien hoe TR Amazon Personalize en andere AWS-services gebruikte om een โโaanbevelingsengine te implementeren. Amazon Personalize stelde TR in staat om de ontwikkeling en implementatie van krachtige modellen te versnellen om hun klanten aanbevelingen te doen. TR is nu in staat om binnen enkele weken een nieuwe reeks producten aan boord te krijgen, in vergelijking met maanden eerder. Met Amazon Personalize en SageMaker kan TR de klantervaring naar een hoger niveau tillen met betere contentabonnementen en prijzen voor hun klanten.
Als je deze blog met plezier hebt gelezen en meer wilt weten over Amazon Personalize en hoe het jouw organisatie kan helpen bij het bouwen van aanbevelingssystemen, ga dan naar de ontwikkelaarshandleiding.
Over de auteurs
Hisham Fahim is Lead Machine Learning Engineer en Personalisatie Engine Architect bij Thomson Reuters. Hij heeft gewerkt met organisaties in de academische wereld en het bedrijfsleven, variรซrend van grote ondernemingen tot middelgrote startups. Met een focus op schaalbare deep learning-architecturen, heeft hij ervaring in mobiele robotica, biomedische beeldanalyse en aanbevelingssystemen. Naast computers houdt hij van astrofotografie, lezen en fietsen over lange afstanden.
Srinivasa Shaik is een Solutions Architect bij AWS in Boston. Hij helpt Enterprise-klanten om hun reis naar de cloud te versnellen. Hij is gepassioneerd door containers en machine learning-technologieรซn. In zijn vrije tijd brengt hij graag tijd door met zijn gezin, koken en reizen.
Vamshi Krishna Enabothala is Sr. Applied AI Specialist Architect bij AWS. Hij werkt samen met klanten uit verschillende sectoren om high-impact data-, analyse- en machine learning-initiatieven te versnellen. Hij is gepassioneerd door aanbevelingssystemen, NLP en computervisiegebieden in AI en ML. Naast zijn werk is Vamshi een RC-liefhebber, bouwt hij RC-apparatuur (vliegtuigen, auto's en drones) en houdt hij ook van tuinieren.
Simone Zuchet is Senior Solutions Architect bij AWS. Met meer dan 6 jaar ervaring als Cloud Architect werkt Simone graag aan innovatieve projecten die helpen de manier waarop organisaties zakelijke problemen benaderen te transformeren. Hij helpt grote zakelijke klanten bij AWS te ondersteunen en maakt deel uit van de Machine Learning TFC. Buiten zijn professionele leven werkt hij graag aan auto's en fotografie.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- Platoblockchain. Web3 Metaverse Intelligentie. Kennis versterkt. Toegang hier.
- Bron: https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-delivers-personalized-content-subscription-plans-at-scale-using-amazon-personalize/
- 100
- 7
- a
- vermogen
- in staat
- Over
- Academie
- versnellen
- Account
- Accounting
- accuraat
- over
- activiteit
- aanpassen
- Extra
- Voordeel
- Na
- AI
- AI / ML
- Alles
- toestaat
- al
- Amazone
- Amazon personaliseren
- analyse
- analisten
- analytics
- analyseert
- en
- antwoorden
- apache
- api
- toepassingen
- toegepast
- Toegepaste AI
- nadering
- architectuur
- gebieden
- rond
- geassocieerd
- automatiseren
- bewustzijn
- AWS
- AWS lijm
- terug
- gebaseerde
- basis
- omdat
- vaardigheden
- BEST
- Betere
- tussen
- Verder
- biomedische
- Blog
- Boston
- breedte
- bouw
- Gebouw
- bebouwd
- bedrijfsdeskundigen
- ondernemingen
- Bellen
- Campagne
- campagne voeren
- Campagnes
- auto's
- catalogus
- gecentreerd
- gecentraliseerde
- uitdagen
- verandering
- Wijzigingen
- veranderende
- Kies
- Cloud
- code
- Het verzamelen van
- toegewijd
- Bedrijven
- vergeleken
- verenigbaar
- componenten
- computer
- Computer visie
- computers
- aangezien
- permanent
- consument
- Consumenten
- containers
- content
- voortgezet
- Camper ombouw
- Kern
- Kosten
- kon
- en je merk te creรซren
- aangemaakt
- Wij creรซren
- curated
- curator
- Actueel
- gewoonte
- klant
- klantgegevens
- klantervaring
- Klanten
- dagelijks
- gegevens
- Data voorbereiding
- gegevensverwerking
- datasets
- transactie
- beslissingen
- deep
- diepgaand leren
- het leveren van
- levert
- Afhankelijk
- ingezet
- het inzetten
- inzet
- ontworpen
- gegevens
- ontwikkelde
- Ontwikkeling
- anders
- afstand
- domein
- rit
- aandrijving
- Drones
- gedurende
- elk
- Vroeger
- Vroeg
- ELEVATE
- geschikt
- ingeschakeld
- waardoor
- engagement
- Motor
- ingenieur
- verrijken
- Enterprise
- bedrijven
- enthousiast
- Geheel
- uitrusting
- Event
- EVENTS
- steeds veranderend
- ontwikkelen
- ervaring
- expertise
- Verklaren
- extract
- extracten
- familie
- sneller
- Kenmerk
- filter
- finale
- financieel
- VIND DE PLEK DIE PERFECT VOOR JOU IS
- Stevig
- Flexibiliteit
- Focus
- volgend
- formulier
- formaat
- gevormd
- FRAME
- oppompen van
- geheel
- functie
- functies
- poort
- voortbrengen
- gegenereerde
- genereert
- het genereren van
- krijgen
- het krijgen van
- geeft
- Doelen
- groot
- met
- hulp
- helpt
- hoge performantie
- hoger
- Hoe
- HTML
- HTTPS
- menselijk
- beeld
- uitvoeren
- uitvoering
- importeren
- belangrijk
- in
- omvatten
- Inkomend
- meer
- -industrie
- informatie
- initiatieven
- Innovatie
- innovatieve
- invoer
- geรฏntegreerde
- integratie
- Intelligentie
- interactie
- interacties
- belang
- betrokken zijn
- IT
- artikelen
- Jobomschrijving:
- Vacatures
- sleutel
- Groot
- Achternaam*
- laatste
- leiden
- leidend
- LEARN
- leren
- Nalatenschap
- Juridisch
- Niveau
- Licenties
- Life
- facelift
- leven
- laden
- lang
- Laag
- machine
- machine learning
- maken
- MERKEN
- beheer
- beheerd
- Markt
- markt leidend
- Marketing
- Markten
- ะทัะตะปะพััั
- Media
- Microsoft
- Microsoft teams
- macht
- miljoenen
- ML
- Mobile
- model
- modellen
- maanden
- meer
- meest
- Noodzaak
- behoeften
- New
- nieuwe producten
- nieuws
- volgende
- nlp
- notificatie
- meldingen
- Aanbod
- Aan boord
- EEN
- operationele
- Operations
- optimalisatie
- geoptimaliseerde
- Opties
- orders
- organisatie
- organisaties
- Overige
- buiten
- Paketten
- deel
- hartstochtelijk
- Uitvoeren
- presteert
- Personalisatie
- Verpersoonlijken
- Gepersonaliseerde
- perspectief
- fotografie
- pijpleiding
- plan
- planning
- plannen
- platform
- Plato
- Plato gegevensintelligentie
- PlatoData
- dan
- punt
- Portaal
- mogelijk
- Post
- voorkeuren
- Voorbereiden
- voorbereiding
- prijs
- Prijzen
- prijsstelling
- problemen
- verwerking
- Product
- Producten
- professioneel
- professionals
- projecten
- zorgen voor
- mits
- biedt
- het verstrekken van
- gepubliceerde
- Duwen
- kwaliteit
- snel
- verhogen
- variรซrend
- tarief
- Rauw
- lezing
- klaar
- vast
- real-time
- recent
- onlangs
- recept
- Aanbeveling
- aanbevelingen
- archief
- verminderen
- verwezen
- reflecteren
- relevante
- gerepliceerd
- nodig
- vereiste
- Voorwaarden
- Resultaten
- Reuters
- herzien
- Risico
- robotica
- reglement
- lopen
- sagemaker
- verkoop
- schaalbare
- Scale
- scaling
- wetenschappers
- secties
- Sectoren
- te zien
- senior
- dienen
- bedient
- service
- Diensten
- serveer-
- reeks
- Winkelen
- teken
- aanzienlijke
- Eenvoudig
- vereenvoudigen
- sinds
- So
- oplossing
- Oplossingen
- bron
- bronnen
- specialist
- Uitgaven
- starts
- Startups
- Stap voor
- mediaopslag
- opgeslagen
- winkels
- streaming
- abonnement
- abonnementen
- succes
- geslaagd
- suite
- ondersteuning
- system
- Systems
- op maat gemaakt
- Nemen
- neemt
- taken
- belasting
- team
- teams
- Technologies
- Technologie
- De
- hun
- Thomson Reuters
- Door
- niet de tijd of
- naar
- tools
- top
- Trainen
- getraind
- Trainingen
- Transacties
- Transformeren
- transformaties
- getransformeerd
- Reizend
- Trends
- veroorzaakt
- vertrouwde
- begrijpen
- begrip
- up-to-date
- upgrade
- Gebruik
- .
- Gebruiker
- gebruikers
- waardevol
- divers
- versie
- via
- visie
- volume
- gezocht
- Rijkdom
- web
- Webapplicaties
- weken
- Wat
- welke
- WIE
- binnen
- zonder
- Mijn werk
- werkte
- werkzaam
- Bedrijven
- s werelds
- zou
- schrijven
- geschreven
- jaar
- You
- Your
- zephyrnet