这篇文章由汤森路透的 Hesham Fahim 与人合着。
汤森路透 (TR) 是世界上最受企业和专业人士信赖的信息组织之一。 它为公司提供寻找可信答案所需的情报、技术和人员专业知识,使他们能够更快地做出更好的决策。 TR 的客户遍及金融、风险、法律、税务、会计和媒体市场。
汤森路透在税务、法律和新闻活动中提供市场领先的产品,用户可以注册使用订阅许可模式。 为了增强客户的这种体验,TR 希望创建一个集中式推荐平台,使他们的销售团队能够向客户推荐最相关的订阅包,生成有助于提高产品知名度的建议,从而帮助客户更好地服务于市场量身定制的产品选择。
在构建这个集中式平台之前,TR 有一个基于规则的遗留引擎来生成续订建议。 该引擎中的规则是用 SQL 预定义和编写的,除了对管理构成挑战外,还难以应对来自 TR 各种集成数据源的数据激增。 TR 客户数据的变化速度比业务规则的变化速度更快,以反映不断变化的客户需求。 TR 新的基于机器学习 (ML) 的个性化引擎的关键要求围绕着一个准确的推荐系统,该系统考虑了最近的客户趋势。 理想的解决方案将是一个具有低运营开销、能够加速实现业务目标的能力,以及一个可以用最新数据不断训练以应对不断变化的消费者习惯和新产品的个性化引擎。
根据对 TR 客户有价值的产品来个性化续订建议是销售和营销团队面临的一项重要业务挑战。 TR 拥有大量可用于个性化的数据,这些数据已从客户交互中收集并存储在中央数据仓库中。 TR 是 ML 的早期采用者 亚马逊SageMaker,他们在 AI/ML 领域的成熟度意味着他们已经在数据仓库中整理了一个重要的相关数据集,团队可以用它来训练个性化模型。 TR 继续他们的 AI/ML 创新,最近开发了一个改进的推荐平台,使用 亚马逊个性化,这是一个完全托管的 ML 服务,它使用用户交互和项目为用户生成推荐。 在本文中,我们将解释 TR 如何使用 Amazon Personalize 构建可扩展的多租户推荐系统,为客户提供最佳产品订阅计划和相关定价。
解决方案架构
该解决方案的设计必须考虑到 TR 围绕通过数据了解用户的核心业务; 从大量数据中为这些用户提供个性化和相关的内容是一项关键任务要求。 拥有设计良好的推荐系统是获得根据每个用户需求定制的高质量推荐的关键。
该解决方案需要收集和准备用户行为数据,使用 Amazon Personalize 训练 ML 模型,通过训练模型生成个性化推荐,并使用个性化推荐推动营销活动。
TR 希望尽可能利用 AWS 托管服务来简化操作并减少无差别的繁重工作。 使用的TR AWS Glue 数据酿造 和 AWS批处理 作业在 ML 管道中执行提取、转换和加载 (ETL) 作业,SageMaker 与 Amazon Personalize 一起定制推荐。 从训练数据量和运行时的角度来看,该解决方案需要具有可扩展性,以便在已经提交给 TR 业务团队中的下游消费者的时间范围内处理数百万条记录。
以下部分解释了解决方案中涉及的组件。
机器学习训练管道
用户与内容之间的交互以点击流数据的形式收集,点击流数据是在客户点击内容时生成的。 TR 分析这是他们的订阅计划的一部分还是超出他们的订阅计划,以便他们可以提供有关价格和计划注册选项的更多详细信息。 来自各种来源的用户交互数据保存在他们的数据仓库中。
下图说明了 ML 训练管道。
管道从 AWS Batch 作业开始,该作业从数据仓库中提取数据并转换数据以创建交互、用户和项目数据集。
以下数据集用于训练模型:
- 结构化产品数据 – 订阅、订单、产品目录、交易和客户详细信息
- 半结构化行为数据 – 用户、使用和交互
此转换后的数据存储在 亚马逊简单存储服务 (Amazon S3) 存储桶,导入到 Amazon Personalize 以进行 ML 训练。 因为 TR 想要为他们的用户生成个性化推荐,所以他们使用 用户_个性化 为其自定义数据训练 ML 模型的配方,这称为创建解决方案版本。 解决方案版本创建后,用于为用户生成个性化推荐。
整个工作流程是使用编排的 AWS步骤功能. 使用以下方法捕获警报和通知并将其发布到 Microsoft Teams 亚马逊简单通知服务 (Amazon SNS)和 亚马逊EventBridge.
生成个性化推荐管道:批量推理
客户要求和偏好经常变化,点击流数据中捕获的最新交互是了解客户不断变化的偏好的关键数据点。 为了适应不断变化的客户偏好,TR 每天都会生成个性化推荐。
下图说明了生成个性化推荐的管道。
DataBrew 作业从 TR 数据仓库中提取数据,为有资格在续订期间根据当前订阅计划和近期活动提供推荐的用户提供数据。 DataBrew 可视化数据准备工具使 TR 数据分析师和数据科学家可以轻松清理和规范化数据,为分析和 ML 做好准备。 能够从可视化数据准备工具中的 250 多个预建转换中进行选择以自动执行数据准备任务,而无需编写任何代码,这是一项重要功能。 DataBrew 作业为批量推荐作业的交互和输入生成增量数据集,并将输出存储在 S3 存储桶中。 新生成的增量数据集被导入到交互数据集中。 当增量数据集导入作业成功时,将使用输入数据触发 Amazon Personalize 批量推荐作业。 Amazon Personalize 为输入数据中提供的用户生成最新推荐并将其存储在推荐 S3 存储桶中。
价格优化是新形成的建议可以使用之前的最后一步。 作为最后一步的一部分,TR 针对生成的建议运行成本优化作业,并使用 SageMaker 根据建议运行自定义模型。 AWS Glue 作业管理从 Amazon Personalize 生成的输出并将其转换为 SageMaker 自定义模型所需的输入格式。 TR 能够利用 AWS 提供的广泛服务,在推荐平台中使用 Amazon Personalize 和 SageMaker,根据客户公司和最终用户的类型定制推荐。
整个工作流程使用 Step Functions 解耦和编排,这提供了根据数据处理要求灵活扩展管道的能力。 警报和通知是使用 Amazon SNS 和 EventBridge 捕获的。
推动电子邮件活动
与定价结果一起生成的建议用于推动向 TR 客户发送电子邮件活动。 AWS Batch 作业用于为每个客户整理建议,并使用优化的定价信息丰富它。 这些建议被吸收到 TR 的活动系统中,该系统推动了以下电子邮件活动:
- 使用客户可能感兴趣的新产品自动续订或升级活动
- 提供更好的报价和更多相关产品和法律内容材料的中期合同续签活动
此过程中的信息也将复制到客户门户,以便查看当前订阅的客户可以看到新的续订建议。 自从实施新的推荐平台以来,TR 发现电子邮件活动的转化率更高,从而导致销售订单增加。
接下来是什么:实时推荐管道
客户需求和购物行为实时变化,根据实时变化调整推荐是提供正确内容的关键。 在看到部署批量推荐系统取得巨大成功后,TR 现在计划通过实施实时推荐管道以使用 Amazon Personalize 生成推荐,将此解决方案提升到一个新的水平。
下图说明了提供实时推荐的架构。
实时集成从收集实时用户参与数据并将其流式传输到 Amazon Personalize 开始。 当用户与 TR 的应用程序交互时,他们会生成点击流事件,这些事件会发布到 Amazon Kinesis数据流. 然后事件被引入 TR 的集中式流媒体平台,该平台建立在 适用于 Kafka 的 Amazon Managed Streaming (亚马逊 MSK)。 Amazon MSK 通过完全托管的 Apache Kafka 可以轻松地实时摄取和处理流数据。 在此架构中,Amazon MSK 用作流媒体平台并执行原始传入点击流事件所需的任何数据转换。 然后一个 AWS Lambda 函数被触发以将事件过滤到与 Amazon Personalize 数据集兼容的模式,并使用 putEvent
应用程序接口。 这允许 Amazon Personalize 从您的用户最近的行为中学习并将相关项目包含在推荐中。
TR 的 Web 应用程序调用部署在 Amazon API网关 获得推荐,这会触发 Lambda 函数来调用 GetRecommendations
使用 Amazon Personalize 进行 API 调用。 Amazon Personalize 提供最新的一组针对用户行为的个性化建议,这些建议通过 Lambda 和 API 网关提供回 Web 应用程序。
借助这种实时架构,TR 可以为他们的客户提供针对他们最近行为的个性化推荐,更好地满足他们的需求。
结论
在本文中,我们向您展示了 TR 如何使用 Amazon Personalize 和其他 AWS 服务来实施推荐引擎。 Amazon Personalize 使 TR 能够加速高性能模型的开发和部署,从而为他们的客户提供建议。 与几个月前相比,TR 现在能够在数周内推出一套新产品。 借助 Amazon Personalize 和 SageMaker,TR 能够通过更好的内容订阅计划和价格为其客户提升客户体验。
如果您喜欢阅读此博客并希望了解有关 Amazon Personalize 的更多信息以及它如何帮助您的组织构建推荐系统,请参阅 开发者指南.
作者简介
赫舍姆 法希姆 是汤森路透的首席机器学习工程师和个性化引擎架构师。 他曾与学术界和工业界的组织合作,从大型企业到中型初创企业。 他专注于可扩展的深度学习架构,在移动机器人、生物医学图像分析以及推荐系统方面拥有丰富的经验。 除了电脑之外,他还喜欢天文摄影、阅读和长途骑行。
斯里尼瓦沙沙伊克 是位于波士顿的 AWS 的解决方案架构师。 他帮助企业客户加速他们的云之旅。 他热衷于容器和机器学习技术。 在业余时间,他喜欢与家人共度时光、烹饪和旅行。
瓦姆什·克里希纳·埃纳博塔拉 是 AWS 的高级应用人工智能专家架构师。 他与来自不同行业的客户合作,以加速具有高影响力的数据、分析和机器学习计划。 他对 AI 和 ML 中的推荐系统、NLP 和计算机视觉领域充满热情。 工作之余,Vamshi 是一名遥控爱好者,建造遥控设备(飞机、汽车和无人机),还喜欢园艺。
西蒙娜祖切特 是 AWS 的高级解决方案架构师。 Simone 拥有超过 6 年的云架构师经验,喜欢从事有助于转变组织处理业务问题的方式的创新项目。 他帮助支持 AWS 的大型企业客户,并且是机器学习 TFC 的成员。 在他的职业生涯之外,他喜欢从事汽车和摄影工作。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/how-thomson-reuters-delivers-personalized-content-subscription-plans-at-scale-using-amazon-personalize/
- 100
- 7
- a
- 对,能力--
- Able
- 关于
- 学院
- 加快
- 账号管理
- 基本会计和财务报表
- 精准的
- 横过
- 活动
- 适应
- 额外
- 优点
- 后
- AI
- AI / ML
- 所有类型
- 允许
- 已经
- Amazon
- 亚马逊个性化
- 分析
- 分析师
- 分析
- 分析
- 和
- 答案
- 阿帕奇
- API
- 应用领域
- 应用的
- 应用人工智能
- 的途径
- 架构
- 地区
- 围绕
- 相关
- 自动化
- 意识
- AWS
- AWS胶水
- 背部
- 基于
- 基础
- 因为
- before
- 最佳
- 更好
- 之间
- 超越
- 生物医学
- 博客
- 波士顿
- 宽度
- 建立
- 建筑物
- 建
- 商业
- 企业
- 呼叫
- 营销活动
- 竞选
- 活动
- 汽车
- 检索目录
- 中心
- 集中
- 挑战
- 更改
- 更改
- 改变
- 云端技术
- 码
- 收藏
- 提交
- 公司
- 相比
- 兼容
- 组件
- 一台
- 计算机视觉
- 电脑
- 考虑
- 经常
- 消费者
- 消费者
- 集装箱
- 内容
- 持续
- 转化
- 核心
- 价格
- 可以
- 创建信息图
- 创建
- 创造
- 策划
- 策展人
- 电流
- 习俗
- 顾客
- 客户数据
- 客户体验
- 合作伙伴
- 每天
- data
- 资料准备
- 数据处理
- 数据集
- 处理
- 决定
- 深
- 深入学习
- 交付
- 提供
- 根据
- 部署
- 部署
- 部署
- 设计
- 详情
- 发达
- 研发支持
- 不同
- 距离
- 域
- 驾驶
- 驾驶
- 无人机电调
- ,我们将参加
- 每
- 此前
- 早
- ELEVATE
- 合格
- 邮箱地址
- 启用
- 使
- 订婚
- 发动机
- 工程师
- 丰富
- 企业
- 企业
- 爱好者
- 整个
- 设备
- 活动
- 事件
- 千变万化
- 发展
- 体验
- 专门知识
- 说明
- 提取
- 提取物
- 家庭
- 快
- 专栏
- 过滤
- 最后
- 金融
- 找到最适合您的地方
- 公司
- 高度灵活
- 专注焦点
- 以下
- 申请
- 格式
- 形成
- FRAME
- 止
- 充分
- 功能
- 功能
- 网关
- 生成
- 产生
- 产生
- 发电
- 得到
- 越来越
- 给
- 理想中
- 大
- 有
- 帮助
- 帮助
- 高性能
- 更高
- 创新中心
- HTML
- HTTPS
- 人
- 图片
- 实施
- 实施
- 进口
- 重要
- in
- 包括
- 来电
- 增加
- 行业中的应用:
- 信息
- 项目
- 創新
- 创新
- 输入
- 集成
- 积分
- 房源搜索
- 互动
- 互动
- 兴趣
- 参与
- IT
- 项目
- 工作
- 工作机会
- 旅程
- 键
- 大
- 名:
- 最新
- 铅
- 领导
- 学习用品
- 学习
- 遗产
- 法律咨询
- Level
- 许可证
- 生活
- 翻新
- 生活
- 加载
- 长
- 低
- 机
- 机器学习
- 使
- 制作
- 管理
- 管理
- 市场
- 引领市场
- 营销
- 市场
- 到期
- 媒体
- 微软
- 微软团队
- 可能
- 百万
- ML
- 联络号码
- 模型
- 模型
- 个月
- 更多
- 最先进的
- 需求
- 需要
- 全新
- 新产品
- 消息
- 下页
- NLP
- 通知
- 通知
- 优惠精选
- 板载
- 一
- 操作
- 运营
- 优化
- 优化
- 附加选项
- 订单
- 组织
- 组织
- 其他名称
- 学校以外
- 包
- 部分
- 多情
- 演出
- 施行
- 个性化
- 个性化
- 个性化你的
- 透视
- 摄影
- 管道
- 计划
- 规划行程
- 计划
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 请
- 点
- 门户网站
- 可能
- 帖子
- 喜好
- Prepare
- 准备
- 车资
- 价格
- 价格
- 问题
- 过程
- 处理
- 产品
- 热销产品
- 所以专业
- 专业人士
- 项目
- 提供
- 提供
- 提供
- 优
- 出版
- 推
- 质量
- 很快
- 提高
- 范围
- 率
- 原
- 阅读
- 准备
- 真实
- 实时的
- 最近
- 最近
- 食谱
- 推荐
- 建议
- 记录
- 减少
- 简称
- 反映
- 相应
- 复制
- 必须
- 需求
- 岗位要求
- 成果
- 路透社
- 回顾
- 风险
- 机器人
- 定位、竞价/采购和分析/优化数字媒体采购,但算法只不过是解决问题的操作和规则。
- 运行
- sagemaker
- 销售
- 可扩展性
- 鳞片
- 缩放
- 科学家
- 部分
- 行业
- 看到
- 前辈
- 服务
- 服务
- 服务
- 特色服务
- 服务
- 集
- 购物
- 签署
- 显著
- 简易
- 简化
- 自
- So
- 方案,
- 解决方案
- 来源
- 来源
- 专家
- 花费
- 启动
- 初创企业
- 步
- 存储
- 存储
- 商店
- 流
- 订阅
- 订阅
- 成功
- 成功
- 套房
- SUPPORT
- 系统
- 产品
- 量身定制
- 采取
- 需要
- 任务
- 税
- 团队
- 队
- 技术
- 专业技术
- 其
- 汤森路透
- 通过
- 次
- 至
- 工具
- 最佳
- 培训
- 熟练
- 产品培训
- 交易
- 改造
- 转换
- 转化
- 旅游
- 趋势
- 引发
- 信任
- 理解
- 理解
- 跟上时代的
- 升级
- 用法
- 使用
- 用户
- 用户
- 有价值
- 各个
- 版本
- 通过
- 愿景
- 体积
- 通缉
- 财富
- 卷筒纸
- 网络应用
- 周
- 什么是
- 这
- WHO
- 中
- 也完全不需要
- 工作
- 工作
- 加工
- 合作
- 世界
- 将
- 写
- 书面
- 年
- 完全
- 您一站式解决方案
- 和风网