这篇文章是与宝马集团的 Marc Neumann、Amor Steinberg 和 Marinus Krommenhoek 共同撰写的。
宝马集团 – 总部位于德国慕尼黑 – 由全球 149,000 名员工推动,在 30 个国家/地区拥有 15 多个生产和装配工厂。 如今,宝马集团已成为全球领先的优质汽车和摩托车制造商以及优质金融和移动服务提供商。 宝马集团作为创新领导者,通过智能材料组合、数字化技术转型和资源节约型生产引领了生产技术和可持续发展的趋势。
在日益数字化和快速变化的世界中,宝马集团的业务和产品开发战略严重依赖数据驱动的决策。 因此,对数据科学家和机器学习 (ML) 工程师的需求显着增长。 这些技术精湛的专业人员的任务是构建和部署模型,以提高宝马业务流程的质量和效率,并实现明智的领导决策。
数据科学家和机器学习工程师的工作需要强大的工具和足够的计算能力。 因此,宝马几年前就在本地建立了集中式机器学习/深度学习基础设施,并不断对其进行升级。 为了为人工智能的发展铺平道路,宝马集团需要在可扩展性和弹性方面实现飞跃,同时减少运营开销、软件许可和硬件管理。
在这篇文章中,我们将讨论宝马集团如何与 AWS Professional Services 合作构建 Jupyter Managed (JuMa) 服务来应对这些挑战。 JuMa 是宝马集团 AI 平台为其数据分析师、机器学习工程师和数据科学家提供的一项服务,它提供了一个带有集成开发环境 (IDE) 的用户友好的工作空间。 它的动力来自 亚马逊SageMaker Studio 并提供适用于 Python 的 JupyterLab 和适用于 R 的 Posit Workbench。该产品使 BMW ML 工程师能够执行以代码为中心的数据分析和 ML,通过提供自助服务功能和基础设施自动化来提高开发人员的工作效率,并与 BMW 的集中式 IT 工具环境紧密集成。
JuMa 现在可供宝马集团的所有数据科学家、机器学习工程师和数据分析师使用。 该服务通过提供经济高效且可扩展的开发环境,促进全球数据科学和工程团队之间的无缝协作,简化了整个 BMW 的机器学习开发和生产工作流程 (MLOps)。 这导致更快的实验和更短的想法验证周期。 此外,JuMa基础设施基于 AWS 无服务器 和托管服务,有助于减少 DevOps 团队的运营开销,使他们能够专注于支持用例并加速宝马集团的人工智能创新。
发展本地人工智能平台的挑战
在推出 JuMa 服务之前,全球 BMW 团队使用两个本地平台为团队提供 JupyterHub 和 RStudio 环境。 这些平台在 CPU、GPU 和内存方面过于有限,无法实现宝马集团人工智能的可扩展性。 通过管理更多的本地硬件、更多的软件许可证和支持费用来扩展这些平台将需要大量的前期投资和大量的维护工作。 除此之外,可用的自助服务功能有限,需要其 DevOps 团队付出大量的运营努力。 更重要的是,这些平台的使用与宝马集团的 IT 云优先战略不一致。 例如,使用这些平台的团队错过了将其 AI/ML 原型轻松迁移到 AWS 上运行的解决方案的工业化过程。 相比之下,已经直接使用 AWS 进行实验的数据科学和分析团队还需要负责构建和运营其 AWS 基础设施,同时确保遵守宝马集团的内部政策、当地法律和法规。 这包括一系列配置和治理活动,从订购 AWS 帐户、限制互联网访问、使用允许列出的包到保持 Docker 映像最新。
解决方案概述
JuMa 是一个完全托管的多租户、安全强化的 AI 平台服务,基于 AWS 构建, SageMaker 工作室 在核心。 通过依靠 AWS 无服务器和托管服务作为基础设施的主要构建块,JuMa DevOps 团队无需担心修补服务器、升级存储或管理任何其他基础设施组件。 该服务自动处理所有这些流程,提供一个强大的技术平台,该平台通常是最新的且可供使用。
JuMa 用户可以通过自助服务门户轻松订购工作空间,为其团队创建安全且隔离的开发和实验环境。 配置 JuMa 工作区后,用户只需单击几下即可在 SageMaker Studio 中启动 JupyterLab 或 Posit 工作台环境,并使用他们最熟悉的工具和框架立即开始开发。 JuMa 与一系列 BMW Central IT 服务紧密集成,包括身份和访问管理、角色和权限管理、 宝马云数据中心 (宝马在 AWS 上的数据湖)和本地数据库。 后者可以帮助 AI/ML 团队无缝访问所需数据(只要他们获得授权),而无需构建数据管道。 此外,笔记本可以集成到企业 Git 存储库中,以便使用版本控制进行协作。
该解决方案消除了与 AI/ML 团队的 AWS 账户管理、配置和定制相关的所有技术复杂性,使他们能够完全专注于 AI 创新。 该平台确保工作空间配置立即满足 BMW 的安全性和合规性要求。
下图描述了该架构的高级上下文视图。
用户旅程
BMW AI/ML 团队成员可以使用 BMW 的标准目录服务订购 JuMa 工作空间。 经直线经理批准后,订购的 JuMa 工作空间将由平台全自动配置。 工作区配置工作流程包括以下步骤(如架构图中的编号)。
- 数据科学家团队在 BMW 目录中订购了一个新的 JuMa 工作区。 JuMa 会自动为工作区配置一个新的 AWS 账户。 这确保了遵循中提到的联合模型帐户结构的工作区之间的完全隔离 SageMaker Studio 管理最佳实践.
- JuMa 配置一个工作区(这是一个 Sagemaker 域)只允许预定义 亚马逊SageMaker 实验和开发、特定定制内核和生命周期配置所需的功能。 它还设置所需的子网和安全组,以确保笔记本电脑在安全的环境中运行。
- 配置工作区后,授权用户登录 JuMa 门户并使用 SageMaker 预签名 URL 访问其工作区中的 SageMaker Studio IDE。 用户可以选择打开 SageMaker Studio 私人空间或 共享空间。 共享空间鼓励团队中不同成员之间的协作,这些成员可以在同一笔记本上并行工作,而私有空间则为单独的工作负载提供开发环境。
- 使用 BMW 数据门户,用户可以请求访问本地数据库或存储在 BMW 云数据中心中的数据,使其可在工作空间中进行开发和实验,从数据准备和分析到模型训练和验证。
在聚码中开发并验证人工智能模型后,人工智能团队可以使用宝马人工智能平台的MLOPs服务将其快速、轻松地部署到生产中。 该服务使用 SageMaker 在 AWS 上为用户提供生产级 ML 基础设施和管道,只需点击几下即可在几分钟内完成设置。 用户只需在预配置的基础设施上托管其模型并自定义管道即可满足其特定用例需求。 这样,AI平台就覆盖了宝马集团的整个AI生命周期。
车码特点
JuMa 服务遵循 AWS 上的最佳实践架构,根据 AWS架构完善的框架。 以下各节详细描述了每个 Well-Architected 支柱的架构决策。
安全性和合规性
为了确保租户之间的完全隔离,每个工作区都有自己的 AWS 帐户,授权用户可以在其中共同协作执行分析任务以及开发和试验 AI/ML 模型。 JuMa 门户本身使用基于策略的隔离在运行时强制隔离 AWS身份和访问管理 (IAM) 和 JuMa 用户的上下文。 有关此策略的更多信息,请参阅 使用 IAM 进行运行时、基于策略的隔离.
数据科学家只能通过门户生成的预签名 URL 通过 BMW 网络访问其域。 在其域内禁用直接互联网访问。 他们的 Sagemaker 域权限是使用构建的 Amazon SageMaker 角色管理器 角色,以确保对开发所需的 AWS 服务(例如 SageMaker)的最低权限访问, 亚马逊雅典娜, 亚马逊简单存储服务 (亚马逊 S3)和 AWS胶水。 该角色实现了 ML 护栏(例如中描述的那些) 治理与控制),包括强制执行机器学习训练 亚马逊虚拟私有云 (Amazon VPC)或没有互联网,并且仅允许使用 JuMa 的自定义审核和最新 SageMaker 映像。
由于 JuMa 专为开发、实验和临时分析而设计,因此它实施保留策略以在 30 天后删除数据。 为了在需要时访问数据并长期存储数据,JuMa 与 BMW 云数据中心和 BMW 本地数据库无缝集成。
最后,JuMa支持多个地区遵守当地的特殊法律情况,例如,要求其在本地处理数据以实现宝马的数据主权。
卓越运营
JuMa平台后端和工作区都是通过以下方式实现的 AWS 无服务器 和托管服务。 使用这些服务有助于最大限度地减少 BMW 平台团队维护和运营端到端解决方案的工作量,努力成为无操作服务。 工作区和门户均使用以下方式进行监控 亚马逊CloudWatch 日志、指标和警报,以检查关键绩效指标 (KPI) 并主动向平台团队通知任何问题。 此外, AWS X 射线 分布式跟踪系统用于跟踪多个组件中的请求,并使用工作区相关上下文注释 CloudWatch 日志。
JuMa 基础设施的所有更改均通过使用基础设施即代码 (IaC) 的自动化进行管理和实施。 这有助于减少手动工作和人为错误,提高一致性,并确保 JuMa 平台后端工作区中的更改可重复且受版本控制。 具体来说,所有工作区都是通过构建在以下基础上的入职流程来配置和更新的: AWS步骤功能, AWS 代码构建和地形。 因此,无需手动配置即可将新工作区加载到 JuMa 平台。
成本优化
通过使用 AWS 无服务器服务,JuMa 确保了按需可扩展性、预先批准的实例大小以及根据 AI/ML 团队的需求在开发和实验活动期间使用的资源的即用即付模式。 为了进一步优化成本,JuMa 平台会监控和识别 SageMaker Studio 内的闲置资源,并自动关闭它们,以防止因未使用的资源而产生费用。
永续发展
JuMa 取代了 BMW 的两个用于分析和深度学习工作负载的本地平台,这些平台即使在不使用时也会消耗大量电力并产生二氧化碳排放。 通过将 AI/ML 工作负载从本地迁移到 AWS,宝马将通过停用本地平台来减少对环境的影响。
此外,在 JuMa 中实现的闲置资源自动关闭机制、数据保留策略以及向其所有者提供工作空间使用情况报告,有助于进一步最大限度地减少在 AWS 上运行 AI/ML 工作负载的环境足迹。
性能效率
通过使用 SageMaker Studio,BMW 团队可以轻松采用最新的 SageMaker 功能,从而帮助加速他们的实验。 例如,他们可以使用 亚马逊SageMaker JumpStart 能够使用最新的预训练开源模型。 此外,它还有助于减少 AI/ML 团队从实验到解决方案产业化的工作量,因为开发环境提供相同的 AWS 核心服务,但仅限于开发功能。
值得信赖
SageMaker Studio 域以仅 VPC 模式部署,以管理 Internet 访问,并且仅允许访问预期的 AWS 服务。 该网络部署在两个可用区中,以防止单点故障,从而为用户提供更高的弹性和可用性。
在升级客户环境之前,使用 IaC 和 CI/CD 管道,对 JuMa 工作区的更改自动部署并测试到开发和集成环境。
最后,数据存储在 亚马逊弹性文件系统 出于备份目的而删除卷后,SageMaker Studio 域的 (Amazon EFS) 将保留。
结论
在这篇文章中,我们介绍了 BMW 集团如何与 AWS ProServe 合作,使用 SageMaker Studio 和其他 AWS 无服务器和托管服务在 AWS 上开发完全托管的 AI 平台服务。
借助 JuMa,宝马的人工智能/机器学习团队能够通过加速颠覆性人工智能解决方案的实验和上市时间来释放新的业务价值。 此外,通过从本地平台迁移,宝马可以减少总体运营工作和成本,同时提高可持续性和整体安全状况。
要了解有关在 AWS 上运行 AI/ML 实验和开发工作负载的更多信息,请访问 亚马逊SageMaker Studio.
作者简介
马克·纽曼 是 BMP 集团中央人工智能平台的负责人。 他负责制定和实施战略,利用人工智能技术在整个宝马集团创造业务价值。 他的主要目标是确保人工智能的使用是可持续和可扩展的,这意味着它可以在整个组织中一致应用,以推动长期增长和创新。 通过他的领导,诺伊曼的目标是将宝马集团定位为汽车行业及其他领域人工智能驱动的创新和价值创造的领导者。
阿莫·斯坦伯格 是宝马集团的机器学习工程师,也是 Jupyter Managed 的服务负责人,Jupyter Managed 是一项新服务,旨在为宝马集团的工程师和数据科学家提供以代码为中心的分析和机器学习工作台。 他过去在金融机构担任 DevOps 工程师的经验使他能够对欧盟银行面临的挑战有独特的理解,并在努力技术创新、遵守法律法规和最大限度地提高客户安全之间保持平衡。
马里努斯·克罗门霍克 是宝马集团的高级云解决方案架构师和软件开发人员。 他热衷于通过最先进的服务实现 IT 环境的现代化,这些服务可增加高价值且易于维护和操作。 Marinus 是微服务、无服务器架构和敏捷工作的大力倡导者。 他拥有与全球大型企业的分布式团队合作的记录。
尼古拉斯·雅各布·贝尔 是 AWS ProServe 的首席云应用程序架构师,主要关注数据工程和机器学习,总部位于瑞士。 他与企业客户密切合作,设计数据平台并构建高级分析和机器学习用例。
华金·里诺多 是 AWS ProServe 的首席安全架构师。 他热衷于构建帮助开发人员提高软件质量的解决方案。 在加入 AWS 之前,他曾在安全行业的多个领域工作过,从移动安全到云和合规性相关主题。 在空闲时间,华金喜欢与家人共度时光和阅读科幻小说。
舒赫拉特·霍贾耶夫 是 AWS ProServe 的高级全球参与经理。 他专门提供有影响力的大数据和 AI/ML 解决方案,使 AWS 客户能够通过数据利用最大化其业务价值。
- :具有
- :是
- :不是
- :在哪里
- $UP
- 000
- 100
- 120
- 15%
- 30
- 7
- 971
- a
- 关于
- 摘要
- 加快
- 加速
- ACCESS
- 根据
- 账号管理
- 帐户管理
- 账户
- 实现
- 横过
- 活动
- 加
- 另外
- 地址
- 管理
- 采用
- 高级
- 主张
- 后
- 驳
- 敏捷
- 前
- AI
- 人工智能平台
- AI / ML
- 目标
- 所有类型
- 让
- 允许
- 允许
- 允许
- 已经
- 还
- Amazon
- 亚马逊SageMaker
- 亚马逊SageMaker Studio
- 亚马逊网络服务
- 量
- an
- 分析
- 分析师
- 分析
- 和
- 和基础设施
- 任何
- 应用领域
- 应用的
- 批准
- 建筑的
- 架构
- 保健
- AS
- 组装
- 相关
- 保证
- At
- 授权
- 汽车
- 自动
- 自动化和干细胞工程
- 汽车
- 汽车行业
- 可用性
- 可使用
- 远离
- AWS
- AWS专业服务
- 后端
- 备份工具
- 当前余额
- 银行
- 基于
- BE
- 因为
- before
- 得益
- 最佳
- 之间
- 超越
- 大
- 大数据运用
- 吹氣梢
- 宝马
- 都
- 盒子
- 建立
- 建筑物
- 建
- 商业
- 但是
- by
- CAN
- 能力
- 能力
- 能力
- 关心
- 案件
- 例
- 检索目录
- 中央
- 集中
- 挑战
- 更改
- 改变
- 查
- 密切
- 云端技术
- 码
- 合作
- 合作
- 复杂性
- 符合
- 执行
- 组件
- 计算
- 配置
- 大量
- 始终如一
- 消耗
- 上下文
- 一直
- 对比
- 控制
- 核心
- 公司
- 成本
- 国家
- 盖
- 创建信息图
- 创建
- 习俗
- 顾客
- 合作伙伴
- 定制
- 定制
- 周期
- data
- 数据分析
- 数据湖
- 资料准备
- 数据科学
- 数据科学家
- 数据驱动
- 数据库
- 日期
- 一年中的
- 决策
- 决定
- 深
- 深入学习
- 交付
- 部署
- 部署
- 部署
- 描述
- 设计
- 设计
- 细节
- 发达
- 开发商
- 开发
- 发展
- 研发支持
- 不同
- 数字
- 数字化
- 直接
- 直接
- 禁用
- 破坏性
- 分布
- do
- 码头工人
- 不会
- 域
- 域名
- 向下
- 驾驶
- 驱动
- ,我们将参加
- 每
- 易
- 效率
- 努力
- 费力
- 工作的影响。
- 或
- 电力
- 排放
- 员工
- 自主性的
- enable
- 启用
- 使
- 使
- 鼓励
- 端至端
- 强制
- 订婚
- 工程师
- 工程师
- 工程师
- 确保
- 确保
- 保证
- 企业
- 企业
- 热心
- 整个
- 环境
- 环境的
- 环境中
- 故障
- 成熟
- 欧洲
- 欧洲联盟
- 甚至
- 例子
- 开支
- 体验
- 面孔
- 功能有助于
- 设备
- 失败
- 熟悉
- 家庭
- 快
- 特征
- 费用
- 少数
- 文件
- 金融
- 金融机构
- 专注焦点
- 以下
- Footprint
- 针对
- 框架
- Free
- 止
- ,
- 充分
- 进一步
- 此外
- 收集
- 通常
- 产生
- 德国
- 混帐
- 特定
- 全球
- 地球
- 目标
- 治理
- GPU
- 更大的
- 团队
- 组的
- 成长
- 长大的
- 事业发展
- 手柄
- 硬件
- he
- 头
- 总部设
- 严重
- 帮助
- 帮助
- 高
- 高价值
- 高水平
- 他
- 他的
- 主持人
- 创新中心
- HTML
- HTTP
- HTTPS
- 中心
- 人
- 主意
- 识别
- 身分
- 空闲
- 图片
- 立即
- 影响力故事
- 有影响力的
- 实施
- 实施
- 器物
- 重要的
- 改善
- in
- 包括
- 包括
- 包含
- 增加
- 增加
- 增加
- 日益
- 指标
- 行业中的应用:
- 信息
- 通知
- 基础设施
- 創新
- 例
- 机构
- 集成
- 集成
- 积分
- 智能化
- 拟
- 内部
- 网络
- 互联网接入
- 成
- 介绍
- 投资
- 孤立
- 隔离
- 问题
- IT
- 它的
- 本身
- 雅各
- JPG
- 只是
- 保持
- 保持
- 不停
- 键
- 湖泊
- 景观
- 大
- 大企业
- 最新
- 发射
- 法律
- 法律法规
- 铅
- 领导者
- 领导团队
- 领导
- 飞跃
- 学习用品
- 学习
- 最少
- 法律咨询
- 许可证
- 许可证
- 生命周期
- 有限
- 限制
- Line
- 已发布
- 本地
- 当地
- 日志
- 长
- 长期
- 机
- 机器学习
- 主要
- 保持
- 维护
- 保养
- 使
- 制作
- 管理
- 管理
- 颠覆性技术
- 经理
- 管理的
- 手册
- 生产厂家
- 材料
- 生产力
- 最大化
- 意
- 机制
- 满足
- 会见
- 成员
- 内存
- 提到
- 指标
- 微服务
- 迁移
- 移民
- 分钟
- 错过
- 混合
- ML
- 多播
- 联络号码
- 手机安全
- 流动性
- 时尚
- 模型
- 模型
- 现代化
- 监控
- 显示器
- 更多
- 此外
- 最先进的
- 摩托车
- 移动
- 多
- 需求
- 打印车票
- 需要
- 需要
- 网络
- 全新
- 没有
- 现在
- 编号
- of
- 提供
- on
- 点播
- 板载
- 前期洽谈
- 仅由
- 打开
- 开放源码
- 开放
- 操作
- 操作
- 操作
- 优化
- or
- 秩序
- 订单
- 组织
- 其他名称
- 输出
- 超过
- 最划算
- 己
- 业主
- 包
- 并行
- 多情
- 过去
- 修补
- 铺
- 为
- 演出
- 性能
- 支柱
- 管道
- 平台
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 政策
- 门户网站
- 位置
- 帖子
- 供电
- 强大
- 在练习上
- 高级版
- 准备
- 防止
- 小学
- 校长
- 先
- 私立
- 特权
- 权限
- 过程
- 过程
- 生产
- 产品
- 产品开发
- 生产
- 生产率
- 所以专业
- 专业人士
- 保护
- 原型
- 提供
- 提供
- 提供者
- 提供
- 优
- 目的
- 蟒蛇
- 质量
- 很快
- R
- 范围
- 急速
- 阅读
- 准备
- 接收
- 记录
- 减少
- 减少
- 参考
- 关于
- 地区
- 法规
- 依靠
- 依托
- 去掉
- 业务报告
- 请求
- 要求
- 要求
- 必须
- 岗位要求
- 资源
- 提供品牌战略规划
- 受限
- 成果
- 保留
- 权利
- 角色
- 角色
- 运行
- 运行
- 运行
- sagemaker
- 同
- 可扩展性
- 可扩展性
- 缩放
- 科学
- 科学家
- 科学家
- 无缝的
- 无缝
- 部分
- 安全
- 保安
- 自助服务
- 前辈
- 无服务器
- 服务器
- 服务
- 特色服务
- 集
- 套数
- 几个
- 共用的,
- 转移
- 关闭
- 关闭
- 显著
- 显著
- 简易
- 只是
- 单
- 情况
- 尺寸
- 技能的
- So
- 软件
- 方案,
- 解决方案
- 来源
- 主权
- 太空
- 剩余名额
- 特别
- 专业
- 具体的
- 特别是
- 花费
- 标准
- 开始
- 国家的最先进的
- 步
- 步骤
- 存储
- 商店
- 存储
- 策略
- 策略
- 流线
- 努力
- 强烈
- 结构体
- 工作室
- 子网
- 这样
- 足够
- SUPPORT
- 支持
- 永续发展
- 可持续发展
- 瑞士
- 系统
- 采取
- 谈论
- 任务
- 团队
- 团队成员
- 队
- 文案
- 技术性
- 专业技术
- 术语
- Terraform
- 测试
- 这
- 线
- 其
- 他们
- 因此
- 博曼
- 他们
- Free Introduction
- 那些
- 通过
- 始终
- 紧紧
- 次
- 至
- 今晚
- 也有
- 工具
- 最佳
- Topics
- 向
- 追踪
- 追踪
- 产品培训
- 趋势
- 二
- 理解
- 工会
- 独特
- 开锁
- 跟上时代的
- 更新
- 升级
- 网址
- 用法
- 使用
- 用例
- 用过的
- 用户友好
- 用户
- 运用
- 验证
- 验证
- 折扣值
- 创造价值
- 版本
- 经审查
- 通过
- 查看
- 在线会议
- 参观
- 卷
- 是
- 方法..
- we
- 卷筒纸
- Web服务
- 井
- 为
- ,尤其是
- 每当
- 而
- 这
- 而
- 将
- 中
- 也完全不需要
- 工作
- 工作
- 工作流程
- 工作流程
- 加工
- 合作
- 世界
- 世界
- 全世界
- 担心
- 将
- 年
- 您一站式解决方案
- 和风网
- 区