机器学习 (ML) 通过优化营销、制造、运营、销售、财务和客户服务等多个业务部门的核心业务功能,帮助组织创造收入、降低成本、降低风险、提高效率和提高质量。 借助 AWS ML,组织可以将价值创造从几个月缩短到几天。 亚马逊 SageMaker 画布 是一种可视化的点击式服务,允许业务分析师生成准确的 ML 预测,而无需编写一行代码或不需要 ML 专业知识。 您可以使用模型以交互方式进行预测,并对批量数据集进行批量评分。
在本文中,我们展示了业务团队如何通过在 Canvas 中生成预测来使用随处构建的 ML 模型并实现有效业务成果的架构模式。
这种模型开发和共享的集成在业务和数据科学团队之间建立了更紧密的协作,并缩短了实现价值的时间。 业务团队可以使用其数据科学家或其他部门构建的现有模型来解决业务问题,而不是在外部环境中重建新模型。
最后,业务分析师只需单击几下即可将共享模型导入 Canvas 并在部署到生产环境之前生成预测。
解决方案概述
下图描述了三种不同的架构模式,以演示数据科学家如何与业务分析师共享模型,然后业务分析师可以在 Canvas 的可视化界面中直接从这些模型生成预测:
先决条件
要使用 SageMaker 训练和构建您的模型并将您的模型引入 Canvas,请完成以下先决条件:
- 如果您还没有 SageMaker 域和 Studio 用户, 设置 Studio 用户并将其加入 SageMaker 域.
- 启用和设置画布 您的用户的基本权限和 授予用户与 Studio 协作的权限.
- 您必须拥有来自 Autopilot、JumpStart 或模型注册表的经过训练的模型。 对于您在 SageMaker 之外构建的任何模型,您必须先在模型注册表中注册您的模型,然后再将其导入 Canvas。
现在让我们假设数据科学家的角色,他希望针对这三种架构模式中的每一种模式训练、构建、部署和与业务分析师共享 ML 模型。
使用自动驾驶仪和画布
Autopilot 自动执行自动 ML (AutoML) 过程的关键任务,例如探索数据、为问题类型选择相关算法,然后进行训练和调整。 所有这一切都可以实现,同时允许您保持对数据集的完全控制和可见性。 Autopilot 自动探索不同的解决方案以找到最佳模型,用户可以迭代 ML 模型或直接一键将模型部署到生产中。
在此示例中,我们使用客户流失合成 数据集 来自电信领域,负责识别可能面临流失风险的客户。 完成以下步骤以使用 Autopilot AutoML 构建、训练、部署 ML 模型并与业务分析师共享:
- 下载 数据集, 将其上传到 Amazon S3 (亚马逊简单存储服务) 存储桶,并记下 S3 URI。
- 在 Studio 控制台上,选择 AutoML 在导航窗格中。
- 创建 AutoML 实验.
- 指定实验名称(对于这篇文章,
Telecom-Customer-Churn-AutoPilot
)、S3数据输入、输出位置。 - 将目标列设置为流失。
- 在部署设置中,您可以启用自动部署选项来创建一个端点来部署您的最佳模型并在端点上运行推理。
有关更多信息,请参阅 创建 Amazon SageMaker Autopilot 实验.
- 选择你的实验,然后选择你最好的模型并选择 分享模型.
- 添加 Canvas 用户并选择 Share 分享模型。
(备注:您不能与用于 Studio 登录的同一 Canvas 用户共享模型。 例如,Studio 用户 A 无法与 Canvas 用户 A 共享模型。 但用户A可以与用户B共享模型,因此选择不同的模型共享用途)
有关更多信息,请参阅 Studio 用户:将模型共享到 SageMaker Canvas.
使用 JumpStart 和画布
JumpStart 是一个 ML 中心,可为广泛的 ML 用例(例如欺诈检测、信用风险预测和产品缺陷检测)提供预训练的开源模型。 您可以为表格、视觉、文本和音频数据部署 300 多个预训练模型。
对于本文,我们使用 JumpStart 的 LightGBM 回归预训练模型。 我们在自定义数据集上训练模型并与 Canvas 用户(业务分析师)共享模型。 可以将预训练模型部署到端点以进行推理。 JumpStart 提供了一个示例笔记本,用于在部署后访问模型。
在此示例中,我们使用 鲍鱼数据集. 该数据集包含八个物理测量值的示例,例如长度、直径和高度,以预测鲍鱼的年龄(回归问题)。
- 下载 鲍鱼数据集 来自 Kaggle。
- 创建 S3 存储桶并上传训练、验证和自定义标头数据集。
- 在 Studio 控制台上,在 SageMaker 快速启动 在导航窗格中,选择 模型、笔记本、解决方案.
- 下 表格模型,选择 LightGBM 回归.
- 下 火车模型, 为训练、验证和列标题数据集指定 S3 URI。
- 培训.
- 在导航窗格中,选择 推出 JumpStart 资产.
- 点击 培训工作 选项卡,选择您的培训工作。
- 点击 Share 菜单中选择 分享到画布.
- 选择要与之共享的 Canvas 用户,指定模型详细信息,然后选择 Share.
有关更多信息,请参阅 Studio 用户:将模型共享到 SageMaker Canvas.
使用 SageMaker 模型注册表和 Canvas
借助 SageMaker 模型注册表,您可以为生产模型编目、管理模型版本、关联元数据、管理模型的批准状态、将模型部署到生产环境,以及使用 CI/CD 自动化模型部署。
让我们假设数据科学家的角色。 对于此示例,您正在构建一个端到端的 ML 项目,其中包括数据准备、模型训练、模型托管、模型注册以及与业务分析师共享模型。 或者,对于数据准备和预处理或后处理步骤,您可以使用 亚马逊SageMaker数据牧马人 和 Amazon SageMaker处理作业. 在这个例子中,我们使用从 LIBSVM 下载的鲍鱼数据集。 目标变量是鲍鱼的年龄。
- 在 Studio 中,克隆 GitHub回购.
- 完成 README 文件中列出的步骤。
- 在 Studio 控制台上,在 型号 在导航窗格中,选择 模型注册.
- 选择型号
sklearn-reg-ablone
. - 将模型注册表中的模型版本 1 共享到 Canvas。
- 选择要与之共享的 Canvas 用户,指定模型详细信息,然后选择 Share.
有关说明,请参阅 模型注册表 部分 Studio 用户:将模型共享到 SageMaker Canvas.
管理共享模型
使用上述任何一种方法共享模型后,您可以转到 型号 Studio 中的部分并查看所有共享模型。 在下面的屏幕截图中,我们看到一个 Studio 用户(数据科学家)与不同的 Canvas 用户(业务团队)共享了 3 个不同的模型。
导入共享模型并使用 Canvas 进行预测
让我们假设业务分析师的角色,并使用您的 Canvas 用户登录 Canvas。
当数据科学家或 Studio 用户与 Canvas 用户共享模型时,您会在 Canvas 应用程序中收到一条通知,通知您 Studio 用户已与您共享模型。 在 Canvas 应用程序中,通知类似于以下屏幕截图。
你可以选择 查看更新 查看共享模型,或者您可以转到 型号 Canvas 应用程序中的页面以发现已与您共享的所有模型。 从 Studio 导入模型最多可能需要 20 分钟。
导入模型后,可以查看其指标并生成 带有假设分析或批量预测的实时预测.
需要考虑的事项
与 Canvas 共享模型时请记住以下几点:
- 您将训练和验证数据集存储在 Amazon S3 中,并将 S3 URI 传递给 Canvas AWS身份和访问管理 (IAM) 权限。
- 将目标列提供给 Canvas 或使用第一列作为默认值。
- 对于解析推理数据的 Canvas 容器,Canvas 端点接受文本 (CSV) 或应用程序 (JSON)。
- Canvas 不支持多个容器或推理管道。
- 如果训练和验证数据集中没有提供标头,则会向 Canvas 提供数据模式。 默认情况下,JumpStart 平台不在训练和验证数据集中提供标头。
- 使用 Jumpstart,训练作业需要先完成,然后才能与 Canvas 共享。
请参阅 限制和故障排除 帮助您解决共享模型时遇到的任何问题。
清理
为避免将来产生费用,请删除或关闭您在关注此帖子时创建的资源。 参考 注销 Amazon SageMaker 画布 更多细节。 关闭单个资源,包括笔记本、终端、内核、应用程序和实例。 有关详细信息,请参阅 关闭资源。 删除 模型版本, SageMaker 端点和资源, 自动驾驶实验资源及 S3斗.
结论
Studio 允许数据科学家通过几个简单的步骤与业务分析师共享 ML 模型。 业务分析师可以受益于数据科学家已经构建的 ML 模型来解决业务问题,而不是在 Canvas 中创建新模型。 但是,由于技术要求和导入模型的手动过程,可能很难在构建它们的环境之外使用这些模型。 这通常会迫使用户重建 ML 模型,从而导致重复工作以及额外的时间和资源。 Canvas 消除了这些限制,因此您可以在 Canvas 中使用您在任何地方训练过的模型生成预测。 通过使用本文中说明的三种模式,您可以在 SageMaker 模型注册表(ML 模型的元数据存储)中注册 ML 模型,并将它们导入 Canvas。 然后,业务分析师可以分析 Canvas 中的任何模型并生成预测。
要了解有关使用 SageMaker 服务的更多信息,请查看以下资源:
如果您有任何问题或建议,请发表评论。
关于作者
阿曼夏尔马 是 AWS 的高级解决方案架构师。 他与 APJ 地区的初创企业、中小型企业和企业客户合作,在咨询、架构和解决方案方面拥有超过 19 年的经验。 他热衷于使 AI 和 ML 大众化,并帮助客户设计他们的数据和 ML 策略。 工作之余,他喜欢探索自然和野生动物。
聂子辰 是 AWS SageMaker 的高级软件工程师,去年领导了将您自己的模型引入 SageMaker Canvas 的项目。 她在亚马逊工作了 7 年多,在亚马逊供应链优化和 AWS AI 服务方面都有经验。 下班后,她喜欢 Barre 锻炼和音乐。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/bring-your-own-ml-model-into-amazon-sagemaker-canvas-and-generate-accurate-predictions/
- :具有
- :是
- $UP
- 1
- 100
- 20
- 7
- a
- 关于
- 加快
- 接受
- ACCESS
- 精准的
- 实现
- 横过
- 额外
- 后
- AI
- 人工智能服务
- 算法
- 所有类型
- 允许
- 允许
- 已经
- Amazon
- 亚马逊SageMaker
- 亚马逊SageMaker自动驾驶仪
- 亚马逊 SageMaker 画布
- an
- 分析
- 分析人士
- 分析师
- 分析
- 和
- 任何
- 分析数据
- 应用领域
- 批准
- 应用
- 建筑的
- 架构
- 保健
- AS
- 律师
- At
- 音频
- 汽车
- 自动化
- 自动化
- 自动表
- 自动
- AutoML
- 避免
- AWS
- 基地
- BE
- 很
- before
- 得益
- 最佳
- 之间
- 都
- 带来
- 建立
- 建筑物
- 建
- 商业
- 业务功能
- 企业
- 但是
- by
- CAN
- 帆布
- 例
- 检索目录
- 链
- 收费
- 查
- 点击
- 码
- 合作
- 合作
- 柱
- 评论
- 完成
- 安慰
- 咨询
- 容器
- 包含
- 控制
- 核心
- 成本
- 创建信息图
- 创建
- 创建
- 创造
- 创建
- 信用
- 习俗
- 顾客
- 客户服务
- 合作伙伴
- data
- 资料准备
- 数据科学
- 数据科学家
- 数据集
- 一年中的
- 默认
- 民主化
- 演示
- 部门
- 部署
- 部署
- 部署
- 部署
- 部署
- 设计
- 详情
- 检测
- 研发支持
- 不同
- 难
- 直接
- 通过各种方式找到
- 不会
- 域
- 别
- 向下
- 驾驶
- 两
- 每
- 有效
- 效率
- 努力
- 或
- enable
- 端至端
- 端点
- 工程师
- 企业
- 环境中
- 例子
- 例子
- 现有
- 体验
- 实验
- 专门知识
- 探索
- 探讨
- 探索
- 少数
- 数字
- 文件
- 金融
- 找到最适合您的地方
- (名字)
- 以下
- 针对
- 部队
- 骗局
- 欺诈检测
- 止
- ,
- 功能
- 未来
- 生成
- 发电
- Go
- 有
- he
- 头
- 高度
- 帮助
- 帮助
- 帮助
- 于是
- 托管
- 创新中心
- 但是
- HTML
- HTTP
- HTTPS
- 中心
- 确定
- 身分
- if
- 进口
- 输入
- 改善
- in
- 包括
- 包含
- 个人
- 信息
- 输入
- 代替
- 说明
- 积分
- 接口
- 成
- 问题
- IT
- 它的
- 工作
- JPG
- JSON
- 只是
- 键
- (姓氏)
- 去年
- 领导
- 学习用品
- 学习
- 离开
- 长度
- 喜欢
- 喜欢
- 限制
- Line
- 已发布
- 圖書分館的位置
- 日志
- 登录
- 寻找
- 保持
- 使
- 管理
- 手册
- 制造业
- 营销
- 测量
- 中等
- 元数据
- 方法
- 指标
- 可能
- 介意
- 分钟
- 减轻
- ML
- 模型
- 模型
- 个月
- 更多
- 多
- 音乐
- 必须
- 姓名
- 自然
- 旅游导航
- 需要
- 全新
- 没有
- 笔记本
- 通知
- of
- 经常
- on
- 板载
- 一
- 开放源码
- 运营
- 优化
- 追求项目的积极优化
- 附加选项
- or
- 组织
- 其他名称
- 输出
- 结果
- 产量
- 学校以外
- 己
- 页
- 面包
- 通过
- 多情
- 模式
- 权限
- 的
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 帖子
- 可能
- 预测
- 预测
- 预测
- 先决条件
- 市场问题
- 问题
- 过程
- 过程
- 处理
- 产品
- 生产
- 项目
- 提供
- 提供
- 提供
- 质量
- 有疑问吗?
- 范围
- 接收
- 减少
- 地区
- 寄存器
- 注册处
- 相应
- 岗位要求
- 资源
- 导致
- 收入
- 检讨
- 风险
- 角色
- sagemaker
- 销售
- 同
- 科学
- 科学家
- 科学家
- 得分
- 部分
- 看到
- 选择
- 前辈
- 服务
- 特色服务
- 集
- 设置
- Share
- 共用的,
- 分享
- 共享
- 她
- 展示
- 关闭
- 类似
- 简易
- 单
- 小
- So
- 软件
- 软件工程师
- 解决方案
- 解决
- 初创公司
- Status
- 步骤
- 存储
- 商店
- 策略
- 工作室
- 这样
- 供应
- 供应链
- 供应链优化
- SUPPORT
- 合成的
- 采取
- 目标
- 任务
- 队
- 文案
- 电信
- 终端
- 比
- 这
- 其
- 他们
- 然后
- 博曼
- 他们
- Free Introduction
- 那些
- 三
- 更紧
- 次
- 至
- 培训
- 熟练
- 产品培训
- 类型
- 下
- 单位
- 使用
- 用过的
- 用户
- 用户
- 运用
- 验证
- 折扣值
- 创造价值
- 版本
- 查看
- 能见度
- 愿景
- we
- ,尤其是
- 这
- 而
- WHO
- 宽
- 大范围
- 中
- 也完全不需要
- 工作
- 加工
- 合作
- 写作
- 年
- 年
- 完全
- 您一站式解决方案
- 和风网