使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

使用 SageMaker Studio 中的共享空间组织机器学习开发以实现实时协作

亚马逊SageMaker Studio 是第一个用于机器学习 (ML) 的完全集成的开发环境 (IDE)。 它提供了一个基于 Web 的单一可视界面,您可以在其中执行所有 ML 开发步骤,包括准备数据以及构建、训练和部署模型。

在一个 Amazon SageMaker 域,用户可以提供个人 Amazon SageMaker Studio IDE 应用程序,该应用程序运行带有内置集成的免费 JupyterServer 来检查 Amazon SageMaker实验, 编排 Amazon SageMaker管道, 以及更多。 用户只需为笔记本内核的灵活计算付费。 这些个人应用程序会自动挂载相应用户的私有应用程序 亚马逊弹性文件系统 (Amazon EFS) 主目录,以便他们可以将代码、数据和其他文件与其他用户隔离开来。 亚马逊 SageMaker 工作室 已经支持在私有应用程序之间共享笔记本, 但异步机制会减慢迭代过程。

现在用 Amazon SageMaker Studio 中的共享空间,用户可以通过创建一个共享的 IDE 应用程序来组织协作 ML 努力和计划,用户可以使用他们自己的 Amazon SageMaker 用户配置文件。 在共享空间中协作的数据工作者可以访问 Amazon SageMaker Studio 环境,他们可以在其中实时访问、阅读、编辑和共享他们的笔记本,这为他们提供了与同行开始迭代新想法的最快途径。 数据工作者甚至可以使用实时协作功能同时在同一个笔记本上进行协作。 笔记本用不同的光标指示每个共同编辑用户,显示他们各自的用户配置文件名称。

SageMaker Studio 中的共享空间会自动标记资源,例如在工作区范围内创建的训练作业、处理作业、实验、管道和模型注册表条目及其各自的 sagemaker:space-arn. 该空间会在 Amazon SageMaker Studio 用户界面 (UI) 中过滤这些资源,因此用户只会看到与他们的 ML 工作相关的 SageMaker 实验、管道和其他资源。

解决方案概述


由于共享空间会自动标记资源,因此管理员可以使用以下工具轻松监控与 ML 工作相关的成本并计划预算 AWS 预算AWS 成本管理器. 作为管理员,您只需要附上 成本分配标签 sagemaker:space-arn.

为 sagemaker:space-arn 附加成本分配标签

完成后,您可以使用 AWS Cost Explorer 来确定单个 ML 项目对您的组织造成的成本。

完成后,您可以使用 AWS Cost Explorer 来确定单个 ML 项目对您的组织造成的成本。

开始使用 Amazon SageMaker Studio 中的共享空间

在本节中,我们将分析在 Amazon SageMaker Studio 中创建和利用共享空间的典型工作流程。

在 Amazon SageMaker Studio 中创建共享空间

您可以使用 Amazon SageMaker 控制台或 AWS命令行界面 (AWS CLI) 以向现有域添加对空间的支持。 有关最新信息,请检查 创建共享空间. 共享空间仅适用于 JupyterLab 3 SageMaker Studio 图像和使用 AWS Identity and Access Management (AWS IAM) 身份验证的 SageMaker 域。

控制台创建

要在指定的 Amazon SageMaker 域中创建空间,您首先需要设置指定的空间默认执行角色。 来自 域详细信息 页面,选择 域设置 选项​​卡,并选择 编辑. 然后可以设置一个空间默认执行角色,每个Domain只需要完成一次,如下图所示:

使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

接下来,您可以转到 空间管理 您域中的选项卡并选择 创建 按钮,如下图所示:

转到域中的“空间管理”选项卡,然后选择“创建”按钮

AWS CLI 创建

您还可以从 AWS CLI 设置默认域空间执行角色。 为了确定您所在地区的 JupyterLab3 映像 ARN,请检查 设置默认的 JupyterLab 版本.

aws --region  
sagemaker update-domain 
--domain-id  
--default-space-settings "ExecutionRole="

完成您的域后,您可以从 CLI 创建共享空间。

aws --region  
sagemaker create-space 
--domain-id  
--space-name  

在 Amazon SageMaker Studio 中启动共享空间

用户可以通过选择 实行 在 AWS 控制台中他们的 Amazon SageMaker 域的用户配置文件旁边的按钮。
使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

选择后 余位 在协作部分下,然后选择要启动的空间:
使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

或者,用户可以生成预签名 URL 以通过 AWS CLI 启动空间:

aws sagemaker create-presigned-domain-url 
--region  
--domain-id  
--space-name  
--user-profile-name  

实时协作

加载 Amazon SageMaker Studio 共享空间 IDE 后,用户可以选择 协作者 左侧面板上的选项卡以查看哪些用户正在您的空间中积极工作以及使用什么笔记本。 如果不止一个人在同一个笔记本上工作,那么您会在他们正在编辑的地方看到一个带有其他用户个人资料名称的光标:

使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

在以下屏幕截图中,您可以看到编辑和查看同一笔记本的不同用户体验:
使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。

结论

在本文中,我们向您展示了 SageMaker Studio 中的共享空间如何为 Amazon SageMaker Studio 添加实时协作 IDE 体验。 自动标记可帮助用户确定范围和过滤他们的 Amazon SageMaker 资源,其中包括:实验、管道和模型注册表条目,以最大限度地提高用户工作效率。 此外,管理员可以使用这些应用的标签来监控与给定空间相关的成本,并使用 AWS Cost Explorer 和 AWS Budgets 设置适当的预算。

今天通过在 Amazon SageMaker Studio 中为您的特定机器学习工作设置共享空间来加速您团队的协作!


关于作者

肖恩·摩根(Sean Morgan)肖恩·摩根(Sean Morgan) 是 AWS 的 AI/ML 解决方案架构师。 他在半导体和学术研究领域拥有丰富的经验,并利用自己的经验帮助客户在 AWS 上实现目标。 在空闲时间,Sean 是一名活跃的开源贡献者/维护者,并且是 TensorFlow Add-ons 的特殊兴趣小组负责人。

使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。张涵 是 Amazon Web Services 的高级软件工程师。 她是 Amazon SageMaker Notebooks 和 Amazon SageMaker Studio 发布团队的一员,一直专注于为客户构建安全的机器学习环境。 在业余时间,她喜欢在太平洋西北地区远足和滑雪。

使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。阿尔卡普拉瓦德 是 AWS 的高级软件工程师。 他已在 Amazon 工作 7 年多,目前致力于改善 Amazon SageMaker Studio IDE 体验。 你可以在 LinkedIn.

使用 SageMaker Studio 中的共享空间组织机器学习开发,以实现实时协作 PlatoBlockchain 数据智能。 垂直搜索。 人工智能。库纳尔贾 是 AWS 的高级产品经理。 他专注于将 Amazon SageMaker Studio 构建为所有 ML 开发步骤的首选 IDE。 在业余时间,Kunal 喜欢滑雪和探索太平洋西北部。 你可以找到他 LinkedIn.

时间戳记:

更多来自 AWS机器学习