AWS 通过 Amazon SageMaker 庆祝 5 周年创新

短短5年时间,已有数以万计的客户使用 亚马逊SageMaker 创建数百万个模型,使用数十亿个参数训练模型,并每月生成数千亿个预测。

机器学习 (ML) 范式转变的种子已经存在了数十年,但随着几乎无限计算能力的随时可用、数据的大量扩散以及 ML 技术的快速发展,各行业的客户现在都可以利用其变革性技术好处。为了利用这个机会并将机器学习从研究实验室带到组织手中,AWS 创建了 Amazon SageMaker。今年,我们庆祝 Amazon SageMaker 成立 5 周年,这是我们的旗舰级完全托管 ML 服务,该服务在 AWS re:Invent 2017 上推出,并成为 AWS 历史上增长最快的服务之一。

AWS 推出了 Amazon SageMaker,以打破 ML 的障碍并实现尖端技术的民主化。今天,这种成功似乎是不可避免的,但在 2017 年,机器学习仍然需要专门技能,这些技能通常由少数开发人员、研究人员、博士或围绕机器学习开展业务的公司所拥有。以前,开发人员和数据科学家必须首先将数据可视化、转换和预处理为算法可用于训练模型的格式,这需要大量的计算能力、漫长的训练周期以及专门的团队来管理通常跨越多个 GPU 的环境。启用的服务器以及大量的手动性能调整。此外,在应用程序中部署经过训练的模型需要应用程序设计和分布式系统方面的一组不同的专业技能。随着数据集和变量的增长,随着旧模型变得过时,公司必须重复这个过程来学习新信息并不断发展。这些挑战和障碍意味着除了资金充足的组织和研究机构之外,大多数人都无法使用机器学习。

机器学习新时代的曙光

因此,我们推出了 Amazon SageMaker,这是我们的旗舰 ML 托管服务,使开发人员、数据科学家和业务分析师能够快速轻松地准备数据,并大规模构建、训练和部署高质量的 ML 模型。在过去 5 年中,我们添加了 250 多项新特性和功能,包括世界上第一个用于 ML 的集成开发环境 (IDE)、调试器、模型监视器、分析器、AutoML、特征存储、无代码功能以及第一个专门构建的持续集成和持续交付 (CI/CD) 工具,可降低机器学习的复杂性,并在云和边缘设备上提高可扩展性。

2021 年,我们进一步推动民主化,让更多用户能够接触到机器学习。 Amazon SageMaker 使更多的人能够创建 ML 模型,包括无代码环境 亚马逊 SageMaker 画布 面向没有 ML 经验的业务分析师,以及一个无需设置、免费的 ML 环境,供学生更快地学习和实验 ML。

如今,客户可以通过多种工具(面向数据科学家的 IDE 和面向业务分析师的无代码界面)使用 Amazon SageMaker 进行创新。他们可以访问、标记和处理大量结构化数据(表格数据)和非结构化数据(照片、视频和音频)以进行机器学习。借助 Amazon SageMaker,客户可以通过优化的基础设施将培训时间从几小时缩短至几分钟。最后,客户可以在整个组织中自动化和标准化机器学习操作 (MLOps) 实践,以大规模构建、训练、部署和管理模型。

下一代创新的新功能

展望未来,AWS 将继续积极开发新功能,帮助客户进一步推进机器学习。例如,Amazon SageMaker 多模型终端节点 (MME) 允许客户在单个 Amazon SageMaker 终端节点上部署数千个 ML 模型,并通过在所有模型之间共享终端节点后面预置的实例来降低成本。直到最近,MME 仅在 CPU 上受支持,但 Amazon SageMaker MME 现在支持 GPU。客户可以使用 Amazon SageMaker MME 在 GPU 实例上部署深度学习模型,并通过将数千个深度学习模型部署到单个多模型终端节点来节省高达 90% 的成本。 Amazon SageMaker 还扩展了对计算优化的支持 亚马逊弹性计算云 (Amazon EC2) 实例由 AWS Graviton 2 和 Graviton 3 处理器,非常适合基于 CPU 的 ML 推理,因此客户可以在适合其工作负载的最佳实例类型上部署模型。

Amazon SageMaker 客户正在释放机器学习的力量

每天,各种规模、各个行业的客户都在转向 Amazon SageMaker,以比以往更短的时间和更低的成本进行实验、创新和部署 ML 模型。因此,现在的话题正从可能性的艺术转向通过机器学习释放新的生产力水平。如今,客户包括金融服务领域的第一资本和房利美、医疗保健和生命科学领域的飞利浦和阿斯利康、媒体领域的康泰纳仕和汤森路透、体育领域的 NFL 和一级方程式、零售领域的亚马逊和 Mercado Libre、以及医疗领域的西门子和拜耳。工业部门使用 AWS 上的 ML 服务来加速业务创新。他们与数以万计的其他 Amazon SageMaker 客户一起使用该服务来管理数百万个模型、使用数十亿个参数训练模型,并每月进行数千亿次预测。

更多创新等待着您。但与此同时,我们停下来庆祝我们的客户所取得的许多成功。

汤森路透

汤森路透是一家领先的商业信息服务提供商,利用 Amazon SageMaker 的强大功能为其客户创建更直观的服务。

汤森路透实验室工程总监 Danilo Tommasina 表示:“我们不断寻求基于人工智能的可靠解决方案,以实现长期的积极投资回报。” “Amazon SageMaker 是我们 AI 研发工作的核心。它使我们能够有效地将研究成果转化为成熟且高度自动化的解决方案。借助 Amazon SageMaker Studio,研究人员和工程师可以在单个 IDE 中使用 ML 工作流程所需的所有工具专注于解决业务问题。我们直接在 Amazon SageMaker Studio 中执行所有 ML 开发活动,包括笔记本、实验管理、ML 管道自动化和调试。”

Salesforce

全球领先的 CRM 平台 Salesforce 最近宣布了新的集成,可以将 Amazon SageMaker 与 Salesforce 的 AI 技术 Einstein 一起使用。

Einstein 执行副总裁 Rahul Auradkar 表示:“Salesforce Einstein 是第一个针对 CRM 的综合人工智能,使每个公司能够通过一套集成的销售、营销、商务、服务和 IT 人工智能技术,更智能地预测客户。”以及 Salesforce 的统一数据服务。 “公司当今面临的最大挑战之一是他们的数据是孤立的。将数据整合在一起以跨所有接触点实时提供客户参与并收集有意义的业务见解是很困难的。在 Salesforce 的实时客户数据平台 Genie 的支持下,Salesforce 和 Amazon SageMaker 集成使数据团队能够无缝访问统一和协调的客户数据,以便在 Amazon SageMaker 中构建和训练 ML 模型。部署后,这些 Amazon SageMaker 模型可以与 Einstein 一起使用,以支持整个 Salesforce 平台的预测和见解。随着人工智能的发展,我们继续通过自带建模 (BYOM) 来增强 Einstein,以满足开发人员和数据科学家工作的需要。”

元人工智能

Meta AI是Meta Platforms Inc.旗下的人工智能实验室。

Meta AI 应用 AI 工程经理 Geeta Chauhan 表示:“Meta AI 与 AWS 合作增强了 torch.distributed,以帮助开发人员使用 Amazon SageMaker 和基于 Trainium 的实例扩展他们的训练。” “通过这些增强功能,根据我们的测试,我们发现大型模型的训练时间有所减少。我们很高兴看到 Amazon SageMaker 支持 PyTorch 分布式训练以加速 ML 创新。”

泰森食品有限公司

泰森食品公司 (Tyson Foods Inc.) 是全球最大的肉类加工商和营销商之一,依赖 Amazon SageMaker、 亚马逊SageMaker地面真相AWS全景图 提高效率。

泰森食品公司新兴技术高级经理 Barret Miller 表示:“卓越运营是泰森食品公司的首要任务。我们使用 AWS 上的 ML 提供支持的计算机视觉来提高生产效率、自动化流程并改善耗时或容易出错的任务。我们与 Amazon 机器学习解决方案实验室合作,使用 Amazon SageMaker Ground Truth 和 AWS Panorama 创建最先进的对象检测模型。借助该解决方案,我们可以获得近乎实时的洞察,帮助我们生产所需的库存,同时最大限度地减少浪费。”

欧特克

AutoCAD 是 Autodesk 的商业计算机辅助设计和绘图软件应用程序。 AutoCAD 依靠 Amazon SageMaker 来优化其生成设计流程。

AutoCAD 产品管理总监 Dania El Hassan 表示:“我们希望通过提供个性化的即时使用提示和见解,帮助 AutoCAD 客户提高效率,确保他们在 AutoCAD 上花费的时间尽可能高效” ,在欧特克。 “Amazon SageMaker 是一个重要的工具,它帮助我们向用户提供主动的命令和快捷方式建议,使他们能够实现强大的新设计成果。”

托克人工智能

借助 Amazon SageMaker 和 Amazon SageMaker 分布式数据并行 (SMDDP) 库, 托克人工智能自 2005 年以来一直是自动驾驶汽车领域的领导者,目前正在将自动驾驶卡车商业化,以实现货运行业安全、持续、长途运输。

“我的团队现在能够使用 Amazon SageMaker 模型训练和 Amazon SageMaker 分布式数据并行 (SMDDP) 库轻松运行大规模分布式训练作业,涉及 TB 级的训练数据和具有数百万个参数的模型,”副总裁 Derek Johnson 说道。 Torc.ai 工程总裁。 “Amazon SageMaker 分布式模型训练和 SMDDP 帮助我们无缝扩展,而无需管理训练基础设施。它将我们训练模型的时间从几天缩短到几个小时,使我们能够压缩设计周期,并比以往更快地为我们的车队带来新的自动驾驶汽车功能。”

LG人工智能研究所

LG AI Research 旨在通过使用 Amazon SageMaker 更快地训练和部署 ML 模型来引领 AI 的下一个时代。

LG AI Research 副总裁兼视觉实验室负责人 Seung Hwan Kim 表示:“我们最近推出了由 EXAONE 提供支持的 AI 艺术家 Tilda,EXAONE 是一个超级巨型 AI 系统,可以处理 250 亿个高清图像文本对数据集。” “多模态人工智能使 Tilda 能够自行创建新图像,并具有超越其感知的语言进行探索的能力。 Amazon SageMaker 对于开发 EXAONE 至关重要,因为它具有可扩展性和分布式训练功能。具体来说,由于训练这个超巨型人工智能需要大量计算,高效的并行处理非常重要。我们还需要持续管理大规模数据并灵活应对新获取的数据。使用 Amazon SageMaker 模型训练和分布式训练库,我们优化了分布式训练并将模型训练速度提高了 59%,而无需对训练代码进行重大修改。”

穆勒水产品

Mueller Water Products 生产工程阀门、消防栓、管道连接和维修产品、计量产品、泄漏检测解决方案等。它使用 Amazon SageMaker 开发创新的 ML 解决方案来更快地检测漏水。

Mueller Water Products 智能基础设施总监 Dave Johnston 表示:“我们的使命是到 7.7 年减少 2027 亿加仑的水损失。” “借助基于 Amazon SageMaker 构建的 ML 模型,我们提高了基于声学的异常检测系统 EchoShore-DX 的精度。因此,当发生泄漏时,我们可以更快地通知公用事业客户。该解决方案预计在 675 年节省了 2021 亿加仑的水。我们很高兴继续使用 AWS ML 服务来进一步增强我们的技术组合,并继续为我们的公用事业客户提高效率和可持续性。”

canva

Canva 是流行的在线设计和发布工具的制造商,依靠 Amazon SageMaker 的强大功能来快速实施。

Canva 数据平台主管 Greg Roodt 表示:“为了让 Canva 实现规模化增长,我们需要一种工具来帮助我们在不出现任何延迟或问题的情况下推出新功能。” “Amazon SageMaker 的适应性使我们能够用更少的资源管理更多的任务,从而实现更快、更高效的工作负载。这让我们的工程团队相信他们推出的功能将适应他们的用例。借助 Amazon SageMaker,我们使用强大的托管基础​​设施在两周内部署了文本到图像模型,我们期待在不久的将来将此功能扩展到数百万用户。”

启发

Inspire 是一项以消费者为中心的医疗保健信息服务,依靠 Amazon SageMaker 提供可行的见解,以实现更好的护理、治疗和结果。

Inspire 首席执行官兼创始人 Brian Loew 表示:“我们的内容推荐引擎是我们价值主张的主要驱动力。” “我们用它来引导我们的用户(生活在特定条件下)看到相关且特定的帖子或文章。借助 Amazon SageMaker,我们可以轻松构建、训练和部署深度学习模型。我们基于 Amazon SageMaker 的复杂 ML 解决方案帮助我们提高内容推荐引擎向 2 万注册用户推荐相关内容的能力,这些内容是从我们包含 1.5 个条件的 3,600 亿字库中提取的。 Amazon SageMaker 使我们能够准确地将患者和护理人员与更加个性化的内容和资源联系起来,包括罕见疾病信息和治疗途径。”

瑞思迈

ResMed 是一家为睡眠呼吸暂停、慢性阻塞性肺病、哮喘和其他慢性病患者提供云连接解决方​​案的领先提供商。 2014年,瑞思迈推出了个性化治疗管理平台和应用程序MyAir,供患者跟踪睡眠治疗。

“在 Amazon SageMaker 之前,所有 MyAir 用户无论身体状况如何,都会同时从应用程序收到相同的消息,”ResMed 数据科学副总裁 Badri Raghavan 表示。 “Amazon SageMaker 使我们能够根据患者使用的特定 ResMed 设备、清醒时间和其他上下文数据,通过 MyAir 与患者进行交互。我们利用 Amazon SageMaker 的多项功能来训练模型管道并选择部署类型(包括近实时和批量推理)以提供定制内容。 Amazon SageMaker 使我们能够在几天或几周(而不是几个月)内部署模型,从而实现在全球范围内嵌入 ML 功能的目标。”

Verisk

Verisk 提供专家数据驱动的分析见解,帮助企业、人员和社会变得更强大、更有弹性和可持续发展。它使用 Amazon SageMaker 来简化 ML 工作流程。

“Verisk 和 Vexcel 正在密切合作,在 AWS 上存储和处理大量数据,包括 Vexcel 在全球 26 个国家/地区捕获的超高分辨率航空图像数据,”Verisk 3D Visual 总裁 Jeffrey C. Taylor 说道智力。 “Amazon SageMaker 帮助我们简化 ML 和 MLOps 团队的工作,使我们能够专注于满足客户的需求,包括保险、房地产、建筑等领域的房地产利益相关者。”

斯马特奥克托有限公司

在 Amazon SageMaker 的帮助下,Smartocto BV 向全球 350 家新闻编辑室和媒体公司提供由 ML 驱动的内容分析。

Smartocto 首席数据官 Ilija Susa 表示:“随着业务规模的扩大,我们需要简化 ML 模型的部署、缩短上市时间并扩大我们的产品范围。” “然而,结合开源和云解决方案来自行托管我们的机器学习工作负载,管理起来越来越耗时。我们将 ML 模型迁移到 Amazon SageMaker 终端节点,并在不到 3 个月的时间里推出了 Smartify,这是一种新的 AWS 原生解决方案。 Smartify 使用 Amazon SageMaker 提供近乎实时的预测性编辑分析,这有助于客户改进内容并扩大受众。”

视觉织物

Visualfabriq 为一些世界领先的消费品公司提供具有应用人工智能功能的收入管理解决方案。它使用 Amazon SageMaker 大规模提高 ML 模型的性能和准确性。

Visualfabriq 的需求预测、人工智能和收入增长管理团队负责人 Jelle Verstraaten 表示:“我们希望调整我们的技术堆栈,以提高性能和可扩展性,并使模型更易于添加、更新和重新训练。” “迁移到 Amazon SageMaker 的最大影响是我们的解决方案性能得到显着提升。通过在专用服务器而不是 Web 服务器上运行推理,我们的解决方案更加高效,并且成本一致且透明。我们将需求预测服务(预测促销活动对零售商销量的影响)的响应时间提高了 200%,并部署了可扩展的解决方案,该解决方案需要更少的人工干预并加速新客户的加入。”

Sophos的

Sophos 是下一代网络安全解决方案和服务的全球领导者,它使用 Amazon SageMaker 更有效地训练其 ML 模型。

Sophos 人工智能主管 Konstantin Berlin 表示:“我们强大的技术可以检测并消除巧妙地带有恶意软件的文件。” “然而,使用 XGBoost 模型来处理多 TB 大小的数据集非常耗时,有时在有限的内存空间下根本不可能实现。借助 Amazon SageMaker 分布式训练,我们可以成功训练轻量级 XGBoost 模型,该模型在磁盘上(最多小 25 倍)和内存(最多小 XNUMX 倍)比其前身小得多。使用 Amazon SageMaker 自动模型调整和 Spot 实例的分布式训练,我们可以快速、更有效地修改和重新训练模型,而无需调整扩展到如此大的数据集所需的底层训练基础设施。”

西北大学(Northwestern University)

西北大学人工智能理学硕士(MSA​​I)项目的学生参观了 Amazon SageMaker Studio 实验室 在黑客马拉松期间使用它之前。

“Amazon SageMaker Studio Lab 的易用性使学生能够快速应用所学知识来构建创意解决方案,”MSAI 项目副主任 Mohammed Alam 说道。 “我们希望学生们能够在短短5个小时的比赛中自然地遇到一些障碍。相反,他们不仅完成了所有项目,还进行了令人印象深刻的演示,将复杂的机器学习概念应用于重要的现实问题,超出了我们的预期。”

伦斯勒理工学院

纽约技术研究大学伦斯勒理工学院 (RPI) 使用 Amazon SageMaker Studio 帮助学生快速学习 ML 概念。

“RPI 拥有世界上最强大的超级计算机之一,但人工智能的学习曲线很陡,”计算机科学教授 Mohammed J. Zaki 说。 “我们需要一种让学生能够经济高效地开始学习的方法。 Amazon SageMaker Studio Lab 直观的界面使我们的学生能够快速入门,并提供强大的 GPU,使他们能够在其顶点项目中使用复杂的深度学习模型。”

香港专业教育学院

香港专业教育学院 (Lee Wai Lee) 的 IT 部门使用 Amazon SageMaker Studio Lab 为学生提供开展实际 ML 项目的机会。

“我们在基础 ML 和 Python 相关课程中使用 Amazon SageMaker Studio Lab,为学生提供许多云技术的坚实基础,”高级讲师 Cyrus Wong 说道。 “Amazon SageMaker Studio Lab 使我们的学生能够获得实际数据科学项目的实践经验,而无需陷入设置或配置的困境。与其他供应商不同的是,这是一款面向学生的 Linux 机器,使他们能够进行更多的编码练习。”

MapmyIndi​​a

MapmyIndi​​a 是印度数字地图、地理空间软件和基于位置的物联网 (IoT) 技术的领先提供商,它使用 Amazon SageMaker 来构建、训练和部署其 ML 模型。

“MapmyIndi​​a 和我们的全球平台 Mappls 为许多用例提供强大、高度准确的全球人工智能和计算机视觉驱动的基于卫星和街道图像的分析,例如衡量经济发展、人口增长、农业MapmyIndi​​a 首席执行官兼执行董事 Rohan Verma 表示: “我们能够快速、准确地创建、训练和部署模型,这使我们与众不同。我们很高兴与 AWS 合作提供 AI/ML 产品,并对 Amazon SageMaker 快速扩展的能力感到兴奋。”

星期六

SatSure 是一家总部位于印度的决策智能解决方案领导者,利用地球观测数据生成见解,依靠 Amazon SageMaker 来准备和训练 PB 级的 ML 数据。

SatSure 首席执行官 Prateep Basu 表示:“我们使用 Amazon SageMaker 处理 PB 级的 EO、GIS、金融、文本和业务数据集,利用其 AI/ML 功能快速创新和扩展我们的模型。” “我们自 2017 年以来一直在使用 AWS,帮助金融机构向印度、尼日利亚和菲律宾超过 2 万农民提供贷款,同时每周监控 1 万平方公里的土地。”

结论

要开始使用 Amazon SageMaker,请访问 aws.amazon.com/sagemaker.


关于作者

AWS 借助 Amazon SageMaker Plato 区块链数据智能庆祝创新 5 周年。垂直搜索。人工智能。安库尔·梅赫罗特拉 于 2008 年加入 Amazon,现任 Amazon SageMaker 总经理。在加入 Amazon SageMaker 之前,他致力于构建 Amazon.com 的广告系统和自动定价技术。

时间戳记:

更多来自 AWS机器学习