本文由 Salesforce Einstein AI 产品总监 Daryl Martis 共同撰写。
这是讨论 Salesforce 数据云与集成的系列文章中的第三篇文章 亚马逊SageMaker.
In 部分1 和 部分2中,我们展示了 Salesforce Data Cloud 和 Einstein Studio 与 SageMaker 的集成如何允许企业使用 SageMaker 安全地访问其 Salesforce 数据,并使用其工具构建、训练模型并将其部署到 SageMaker 上托管的端点。 SageMaker 端点可以注册到 Salesforce 数据云以激活 Salesforce 中的预测。
在这篇文章中,我们演示了业务分析师和公民数据科学家如何在没有任何代码的情况下创建机器学习 (ML) 模型 亚马逊 SageMaker 画布 并部署经过训练的模型以与 Salesforce Einstein Studio 集成,以创建强大的业务应用程序。 SageMaker Canvas 提供无代码体验,只需单击几下即可从 Salesforce Data Cloud 访问数据并构建、测试和部署模型。 SageMaker Canvas 还使您能够使用特征重要性和 SHAP 值来理解您的预测,从而使您可以轻松解释 ML 模型所做的预测。
SageMaker 画布
SageMaker Canvas 使业务分析师和数据科学团队能够构建和使用 ML 和生成式 AI 模型,而无需编写任何代码。 SageMaker Canvas 提供了一个可视化的点击式界面,可为分类、回归、预测、自然语言处理 (NLP) 和计算机视觉 (CV) 生成准确的 ML 预测。 此外,您还可以访问和评估基础模型 (FM) 亚马逊基岩 或来自的公共 FM 亚马逊SageMaker JumpStart 用于内容生成、文本提取和文本摘要,以支持生成式 AI 解决方案。 SageMaker Canvas 允许您 将构建的机器学习模型带到任何地方 并直接在 SageMaker Canvas 中生成预测。
Salesforce 数据云和 Einstein Studio
Salesforce Data Cloud 是一个数据平台,可为企业提供来自任何接触点的客户数据的实时更新。
Einstein Studio 是 Salesforce Data Cloud 上 AI 工具的网关。 借助 Einstein Studio,管理员和数据科学家只需点击几下或使用代码即可轻松创建模型。 Einstein Studio 的自带模型 (BYOM) 体验提供了将自定义或生成 AI 模型从 SageMaker 等外部平台连接到 Salesforce Data Cloud 的功能。
解决方案概述
为了演示如何使用 SageMaker Canvas 使用 Salesforce Data Cloud 中的数据构建机器学习模型,我们创建了一个预测模型来推荐产品。 该模型使用 Salesforce Data Cloud 中存储的功能,例如客户人口统计、营销活动和购买历史记录。 产品推荐模型是使用 SageMaker Canvas 无代码用户界面使用 Salesforce Data Cloud 中的数据构建和部署的。
我们使用以下 样本数据集 存储在 亚马逊简单存储服务 (亚马逊 S3)。 要在 Salesforce Data Cloud 中使用此数据集,请参阅 在数据云中创建 Amazon S3 数据流。 创建模型需要以下属性:
- 俱乐部会员 – 如果客户是俱乐部会员
- 营销活动 – 客户参与的活动
- 州/领地 – 客户居住的州或省
- 月 – 购买月份
- 病例数 – 客户提出的案例数量
- 案例类型 返回 – 客户在过去一年内是否退回过任何产品
- 箱体类型 货物损坏 – 客户去年是否有任何货物损坏
- 参与分数 – 客户的参与程度(对邮寄活动的响应、登录在线商店等)
- 保有 – 客户与公司关系的期限
- 点击 – 客户在购买前一周内的平均点击次数
- 访问的页面 – 客户在购买前一周内访问的平均页面数
- 购买的产品 – 实际购买的产品
以下步骤概述了如何使用 SageMaker Canvas 中启动的 Salesforce Data Cloud 连接器来访问企业数据并构建预测模型:
- 配置 Salesforce 连接的应用程序以注册 SageMaker Canvas 域。
- 在 SageMaker Canvas 中为 Salesforce Data Cloud 设置 OAuth。
- 使用内置 SageMaker Canvas Salesforce Data Cloud 连接器连接到 Salesforce Data Cloud 数据并导入数据集。
- 在 SageMaker Canvas 中构建和训练模型。
- 在 SageMaker Canvas 中部署模型并进行预测。
- 部署 Amazon API网关 端点作为 SageMaker 推理端点的前端连接。
- 在 Einstein Studio 中注册 API 网关端点。 有关说明,请参阅 将您自己的 AI 模型引入数据云.
下图说明了解决方案体系结构。
先决条件
在开始之前,请完成以下先决步骤来创建 SageMaker 域并启用 SageMaker Canvas:
- 创建 亚马逊SageMaker Studio 领域。 有关说明,请参阅 加入 Amazon SageMaker 域.
- 记下已创建并将由您的用户配置文件使用的域 ID 和执行角色。 您可以在后续步骤中向该角色添加权限。
以下屏幕截图显示了我们为此帖子创建的域。
- 接下来,转到用户个人资料并选择 编辑.
- 导航到 Amazon SageMaker Canvas 设置 部分并选择 启用 Canvas 基本权限.
- 选择 启用 Canvas 模型的直接部署 和 为所有用户启用模型注册表权限.
这允许 SageMaker Canvas 将模型部署到 SageMaker 控制台上的端点。 这些设置可以在域或用户配置文件级别进行配置。 用户配置文件设置优先于域设置。
创建或更新 Salesforce 连接的应用程序
接下来,我们创建一个连接 Salesforce 的应用程序,以启用从 SageMaker Canvas 到 Salesforce Data Cloud 的 OAuth 流。 完成以下步骤:
- 登录 Salesforce 并导航至 设置.
- 寻找 应用程序管理器 并创建一个新的连接应用程序。
- 提供以下输入:
- 针对 连接的应用程序名称,输入名称。
- 针对 接口名称,保留默认值(它会自动填充)。
- 针对 电子邮箱,输入您的联系电子邮件地址。
- 选择 启用 OAuth 设置.
- 针对 回调网址,输入
https://<domain-id>.studio.<region>.sagemaker.aws/canvas/default/lab
,并提供您的 SageMaker 域中的域 ID 和区域。
- 在连接的应用程序上配置以下范围:
- 通过 API 管理用户数据(
api
). - 随时执行请求(
refresh_token
,offline_access
). - 对 Salesforce Data Cloud 数据执行 ANSI SQL 查询(数据
Cloud_query_api
). - 管理数据云配置文件数据(
Data Cloud_profile_api
). - 访问身份 URL 服务(
id
,profile
,email
,address
,phone
). - 访问唯一的用户标识符(
openid
).
- 通过 API 管理用户数据(
- 设置您连接的应用程序 知识产权放宽 设置 放宽IP限制。
为 Salesforce Data Cloud 连接器配置 OAuth 设置
SageMaker Canvas 使用 AWS机密管理器 以安全地存储来自 Salesforce 连接应用程序的连接信息。 SageMaker Canvas 允许管理员为个人用户配置文件或域级别配置 OAuth 设置。 请注意,您可以将密钥添加到域和用户配置文件中,但 SageMaker Canvas 首先在用户配置文件中查找密钥。
要配置 OAuth 设置,请完成以下步骤:
- 导航以在 SageMaker 控制台中编辑域或用户配置文件设置。
- 画布设置 在导航窗格中。
- 下 OAuth 设置,为 数据源,选择 Salesforce 数据云.
- 针对 秘密设置,您可以创建新的密钥或使用现有的密钥。 在此示例中,我们创建一个新密钥,并从 Salesforce 连接的应用程序输入客户端 ID 和客户端密钥。
有关在 SageMaker Canvas 中启用 OAuth 的更多详细信息,请参阅 为 Salesforce Data Cloud 设置 OAuth.
这样就完成了设置,允许从 Salesforce Data Cloud 访问 SageMaker Canvas 来构建 AI 和 ML 模型。
从 Salesforce Data Cloud 导入数据
要导入您的数据,请完成以下步骤:
- 从您使用 SageMaker 域创建的用户配置文件中,选择 实行 并选择 帆布.
第一次访问 Canvas 应用程序时,创建过程大约需要 10 分钟。
- 数据管理员 在导航窗格中。
- 点击 创建 菜单中选择 表格 创建表格数据集。
- 命名数据集并选择 创建.
- 针对 数据源,选择 Salesforce 数据云 和 添加连接 导入数据湖对象。
如果您之前配置了与 Salesforce Data Cloud 的连接,您将看到一个使用该连接而不是创建新连接的选项。
- 为新的 Salesforce Data Cloud 连接提供名称并选择 添加连接.
需要几分钟才能完成。
- 你将被重定向到 销售人员登录 页面来授权连接。
登录成功后,请求将被重定向回 SageMaker Canvas,并列出数据湖对象。
- 选择包含通过 Amazon S3 上传的模型训练功能的数据集。
- 拖放文件,然后选择 在 SQL 中编辑.
Salesforce 添加了一个 “__c
“ 到所有数据云对象字段。 根据 SageMaker Canvas 命名约定, ”__“
字段名称中不允许使用。
- 编辑 SQL 以重命名列并删除与模型训练无关的元数据。 将表名称替换为您的对象名称。
- 运行 SQL 然后 创建数据集.
- 选择数据集并选择 创建模型.
- 要创建模型来预测产品推荐,请提供模型名称,然后选择 预测分析 问题类型,并选择 创建.
构建和训练模型
完成以下步骤来构建和训练您的模型:
- 模型启动后,将目标列设置为
product_purchased
.
SageMaker Canvas 显示关键统计信息以及每列与目标列的相关性。 SageMaker Canvas 为您提供了在开始构建之前预览模型和验证数据的工具。
- 使用预览模型功能可以查看模型的准确性并验证数据集以防止构建模型时出现问题。
- 查看数据并对数据集进行任何更改后,选择您的构建类型。 这 快速建立 选项可能会更快,但它只会使用数据的子集来构建模型。 为了这篇文章的目的,我们选择了 标准构建 选项。
标准构建可能需要 2-4 小时才能完成。
SageMaker Canvas 在构建模型时自动处理数据集中的缺失值。 它还将应用其他数据准备转换,为您准备好用于 ML 的数据。
- 模型开始构建后,您可以离开该页面。
当模型显示为 各就各位 在 我的模特 页面,它已准备好进行分析和预测。
- 模型构建完成后,导航至 My 模型,选择 查看 查看您创建的模型,然后选择最新版本。
- 去 分析 选项卡可查看每个特征对预测的影响。
- 有关模型预测的更多信息,请导航至 进球 标签。
- 预测 启动产品预测。
部署模型并进行预测
完成以下步骤来部署模型并开始进行预测:
- 您可以选择进行批量或单个预测。 出于本文的目的,我们选择 单次预测.
当你选择 单次预测,SageMaker Canvas 显示您可以为其提供输入的功能。
- 您可以通过选择来更改值 更新 并查看实时预测。
将显示模型的准确性以及每个特征对特定预测的影响。
- 要部署模型,请提供部署名称,选择实例类型和实例计数,然后选择 部署.
模型部署将需要几分钟时间。
模型状态更新为 在服务 部署成功后。
SageMaker Canvas 提供了一个测试部署的选项。
- 查看详情.
更多信息 选项卡提供模型端点详细信息。 实例类型、计数、输入格式、响应内容和端点是显示的一些关键详细信息。
- 测试部署 测试已部署的端点。
与单一预测类似,该视图显示输入特征并提供实时更新和测试端点的选项。
新的预测与端点调用结果一起返回给用户。
创建 API 以公开 SageMaker 端点
要生成为 Salesforce 中的业务应用程序提供支持的预测,您需要通过 API Gateway 公开由 SageMaker Canvas 部署创建的 SageMaker 推理端点,并将其注册到 Salesforce Einstein 中。
Salesforce Einstein 和 SageMaker 推理端点之间的请求和响应格式有所不同。 您可以使用 API Gateway 来执行转换或使用 AWS Lambda 转换请求并映射响应。 参考 使用 Amazon API Gateway 和 AWS Lambda 调用 Amazon SageMaker 模型终端节点 通过 Lambda 和 API Gateway 公开 SageMaker 端点。
以下代码片段是一个 Lambda 函数,用于转换请求和响应
更新 endpoint
和 prediction_label
Lambda 函数中的值基于您的配置。
- 添加环境变量
SAGEMAKER_ENDPOINT_NAME
捕获 SageMaker 推理端点。 - 设置预测标签以匹配在 Einstein Studio 中注册的模型输出 JSON 键。
Lambda 函数的默认超时为 3 秒。 根据预测请求输入大小,SageMaker 实时推理 API 可能需要 3 秒以上的时间来响应。
- 增加 Lambda 函数超时但将其保持在低于 API网关默认集成超时,即 29 秒。
在 Salesforce Einstein Studio 中注册模型
要在 Einstein Studio 中注册 API Gateway 端点,请参阅 将您自己的 AI 模型引入数据云.
结论
在这篇文章中,我们解释了如何使用 SageMaker Canvas 连接到 Salesforce Data Cloud 并通过自动化 ML 功能生成预测,而无需编写任何代码。 我们演示了 SageMaker Canvas 模型构建功能,可在运行使用完整数据集训练模型的标准构建之前对模型性能进行早期预览。 我们还展示了模型创建后的活动,例如使用 SageMaker Canvas 中的单一预测界面以及使用特征重要性了解您的预测。 接下来,我们使用在 SageMaker Canvas 中创建的 SageMaker 端点,并将其作为 API 提供,以便您可以将其与 Salesforce Einstein Studio 集成并创建强大的 Salesforce 应用程序。
在即将发布的文章中,我们将向您展示如何在 SageMaker Canvas 中使用来自 Salesforce Data Cloud 的数据,通过可视化界面和简单的自然语言提示,使数据洞察和准备变得更加简单。
要开始使用 SageMaker Canvas,请参阅 SageMaker Canvas 沉浸日 并参考 Amazon SageMaker Canvas 入门.
关于作者
达里尔·马蒂斯 是 Salesforce Data Cloud 的 Einstein Studio 产品总监。 他在为企业客户规划、构建、启动和管理世界一流的解决方案(包括 AI/ML 和云解决方案)方面拥有 10 多年的经验。 他此前曾在纽约市的金融服务行业工作。 关注他 LinkedIn.
拉奇纳查达 是 AWS 战略客户部门的首席 AI/ML 解决方案架构师。 Rachna 是一位乐观主义者,他相信以道德和负责任的方式使用人工智能可以改善未来社会,带来经济和社会繁荣。 在业余时间,Rachna 喜欢与家人共度时光、徒步旅行和听音乐。
伊夫·斯图尔特 是 AWS 战略 ISV 部门的首席解决方案架构师。 过去 2 年,她一直致力于 Salesforce Data Cloud,帮助构建跨 Salesforce 和 AWS 的集成客户体验。 Ife 拥有超过 10 年的技术经验。 她是技术领域多元化和包容性的倡导者。
拉维·巴蒂普鲁 是 AWS 的高级合作伙伴解决方案架构师。 Ravi 与战略合作伙伴 Salesforce 和 Tableau 合作,提供创新且架构完善的产品和解决方案,帮助共同客户实现其业务目标。
米里亚姆·勒博维茨 是 AWS 战略 ISV 部门的解决方案架构师。 她与 Salesforce 的团队(包括 Salesforce Data Cloud)合作,专门从事数据分析。 工作之余,她喜欢烘焙、旅行以及与朋友和家人共度美好时光。
- :具有
- :是
- :不是
- $UP
- 1
- 10
- 100
- 29
- 7
- 8
- a
- 关于
- ACCESS
- 账户
- 精准的
- 横过
- 活动
- 实际
- 加
- 增加
- 额外
- 附加信息
- 地址
- 添加
- 管理员
- 主张
- 后
- AI
- AI模型
- AI / ML
- 所有类型
- 允许
- 允许
- 沿
- 还
- Amazon
- Amazon API网关
- 亚马逊SageMaker
- 亚马逊 SageMaker 画布
- 亚马逊网络服务
- an
- 分析
- 分析师
- 分析
- 和
- 任何
- API
- APIs
- 应用
- 应用领域
- 使用
- 架构
- 保健
- AS
- At
- 属性
- 授权
- 自动化
- 自动
- 可使用
- AWS
- 背部
- 基地
- 基于
- BE
- 很
- before
- 开始
- 相信
- 如下。
- 之间
- 身体
- 都
- 带来
- 建立
- 建筑物
- 建立
- 建
- 内建的
- 商业
- 商业应用
- 企业
- 但是
- by
- 加州
- 营销活动
- 活动
- CAN
- 帆布
- 能力
- 捕获
- 例
- 更改
- 更改
- 选择
- 公民
- 城市
- 分类
- 客户
- 云端技术
- 俱乐部
- 码
- 柱
- 列
- 完成
- 完成对
- 一台
- 计算机视觉
- 进行
- 配置
- 配置
- 分享链接
- 已联繫
- 地都
- 安慰
- CONTACT
- 包含
- 内容
- 内容生成
- 上下文
- 相关
- 可以
- 创建信息图
- 创建
- 创造
- 创建
- 习俗
- 顾客
- 客户数据
- 合作伙伴
- data
- 数据访问
- 数据分析
- 数据湖
- 数据平台
- 数据科学
- 默认
- 交付
- 民主化
- 人口统计
- 演示
- 证明
- 根据
- 部署
- 部署
- 部署
- 部署
- 详情
- 直接
- 直接
- 副总经理
- 讨论
- 显示
- 显示器
- 多元化
- 多样性和包容性
- 域
- 向下
- 下降
- 每
- 早
- 经济
- 费力
- 爱因斯坦
- 或
- 邮箱地址
- enable
- 使
- 使
- 端点
- 从事
- 订婚
- 订婚
- 输入
- 企业
- 环境
- 伦理
- 评估
- 甚至
- 活动
- 例子
- 执行
- 现有
- 体验
- 体验
- 说明
- 解释
- 外部
- 萃取
- 家庭
- 快
- 专栏
- 特征
- 少数
- 部分
- 字段
- 文件
- 金融
- 金融服务
- (名字)
- 第一次
- 流
- 遵循
- 以下
- 针对
- 格式
- 基金会
- 朋友
- 止
- ,
- 功能
- 未来
- 网关
- 生成
- 代
- 生成的
- 生成式人工智能
- 得到
- 给
- Go
- 民政事务总署
- 手柄
- 有
- he
- 帮助
- 这里
- 他
- 历史
- 托管
- HOURS
- 创新中心
- How To
- HTML
- HTTP
- HTTPS
- ID
- 身份标识
- 身分
- if
- 说明
- 浸没
- 影响力故事
- 进口
- 重要性
- 改善
- in
- 包含
- 包容
- 个人
- 行业中的应用:
- 信息
- 开始
- 创新
- 输入
- 输入
- 可行的洞见
- 例
- 代替
- 说明
- 整合
- 集成
- 积分
- 接口
- IP
- 问题
- ISV
- IT
- 它的
- 联合
- JPG
- JSON
- 只是
- 保持
- 键
- 标签
- 湖泊
- 语言
- (姓氏)
- 推出
- 发射
- 学习
- 离开
- Level
- 喜欢
- 喜欢
- Line
- 听力
- 清单
- 登录
- LOOKS
- 机
- 机器学习
- 制成
- 邮件
- 使
- 制作
- 管理的
- 地图
- 营销
- 匹配
- 可能..
- 元数据
- 分钟
- 失踪
- ML
- 模型
- 模型
- 月
- 更多
- 最先进的
- 音乐
- 姓名
- 名称
- 命名
- 自然
- 自然语言处理
- 导航
- 旅游导航
- 需求
- 打印车票
- 全新
- 纽约
- 纽约市
- 下页
- NLP
- 注意
- 数
- OAuth的
- 对象
- 目标
- of
- on
- 一
- 在线
- 仅由
- 附加选项
- or
- OS
- 其他名称
- 产量
- 学校以外
- 超过
- 简介
- 己
- 页
- 网页
- 面包
- 部分
- 合伙人
- 伙伴
- 为
- 演出
- 性能
- 权限
- 规划行程
- 平台
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 人口稠密
- 帖子
- 功率
- 强大
- 预测
- 预测
- 预测
- 准备
- 防止
- 预览
- 先前
- 校长
- 先
- 处理
- 产品
- 核心产品
- 本人简介
- 提示
- 繁荣
- 提供
- 提供
- 国家
- 采购
- 目的
- 质量
- 查询
- 凸
- 准备
- 真实
- 实时的
- 实现
- 最近
- 建议
- 推荐
- 参考
- 地区
- 寄存器
- 在相关机构注册的
- 注册处
- 关系
- 相应
- 更换
- 请求
- 要求
- 回应
- 响应
- 提供品牌战略规划
- 限制
- 导致
- 回报
- 回顾
- 角色
- 运行
- 运行
- sagemaker
- SageMaker 推理
- Salesforce的
- 科学
- 科学家
- 秒
- 秘密
- 秘密
- 部分
- 安全
- 看到
- 段
- 选择
- 选
- 系列
- 服务
- 特色服务
- 集
- 设置
- 设置
- 格局
- 她
- 显示
- 展出
- 作品
- 简易
- 单
- 尺寸
- 片段
- So
- 社会
- 社会
- 方案,
- 解决方案
- 一些
- 专业
- 具体的
- 花费
- 标准
- 开始
- 开始
- 州/领地
- 统计
- Status
- 步骤
- 斯图尔特
- 存储
- 商店
- 存储
- 简单的
- 善用
- 战略合作伙伴
- 流
- 工作室
- 随后
- 成功
- 这样
- SUPPORT
- 表
- 画面
- 采取
- 目标
- 队
- 专业技术
- test
- 文本
- 比
- 这
- 未来
- 国家
- 其
- 然后
- 博曼
- 第三
- Free Introduction
- 通过
- 次
- 至
- 工具
- 触摸
- 培训
- 熟练
- 产品培训
- 火车
- 改造
- 转型
- 转换
- 旅游
- 类型
- 理解
- 理解
- 独特
- 即将上市
- 更新
- 更新
- 最新动态
- 上传
- 网址
- 使用
- 用过的
- 用户
- 用户界面
- 使用
- 运用
- 验证
- 价值观
- 变量
- 版本
- 通过
- 查看
- 愿景
- 参观
- 视觉
- 是
- 华盛顿
- we
- 卷筒纸
- Web服务
- 周
- 井
- 是否
- 这
- 而
- WHO
- 将
- 中
- 也完全不需要
- 工作
- 工作
- 合作
- 工作坊
- 世界级
- 写
- 写作
- 年
- 纽约
- 完全
- 您一站式解决方案
- 和风网