Meta 的 Llama 2 基础模型现已在 Amazon SageMaker JumpStart 中提供

由柏拉图重新发布

关注： 0

今天，我们很高兴地宣布 Meta 开发的 Llama 2 基础模型可供客户通过亚马逊SageMaker JumpStart。 Llama 2 系列大型语言模型 (LLM) 是预先训练和微调的生成文本模型的集合，其规模从 7 亿到 70 亿个参数不等。经过微调的 LLM，称为 Llama-2-chat，针对对话用例进行了优化。您可以轻松尝试这些模型并将其与 SageMaker JumpStart 结合使用，SageMaker JumpStart 是一个机器学习 (ML) 中心，可提供对算法、模型和 ML 解决方案的访问，以便您可以快速开始使用 ML。

在这篇文章中，我们将介绍如何通过 SageMaker JumpStart 使用 Llama 2 模型。

什么是骆驼 2

Llama 2 是一种使用优化的 Transformer 架构的自回归语言模型。 Llama 2 旨在用于英语商业和研究用途。它具有一系列参数大小（7 亿、13 亿和 70 亿）以及预训练和微调的变量。根据 Meta 的说法，调整后的版本使用监督微调（SFT）和带有人类反馈的强化学习（RLHF）来符合人类对帮助和安全的偏好。 Llama 2 使用来自公开来源的 2 万亿个代币数据进行了预训练。调整后的模型旨在用于类似助理的聊天，而预训练的模型可适用于各种自然语言生成任务。无论开发人员使用哪个版本的模型， Meta 的负责任使用指南可以帮助指导通过适当的安全缓解措施定制和优化模型可能需要的额外微调。

什么是 SageMaker JumpStart

借助 SageMaker JumpStart，机器学习从业者可以从多种开源基础模型中进行选择。机器学习从业者可以将基础模型部署到专用的亚马逊SageMaker 来自网络隔离环境的实例，并使用 SageMaker 自定义模型进行模型训练和部署。

您现在只需点击几下即可发现并部署 Llama 2 亚马逊SageMaker Studio 或通过 SageMaker Python SDK 以编程方式，使您能够利用 SageMaker 功能导出模型性能和 MLOps 控制，例如 Amazon SageMaker管道, Amazon SageMaker调试器，或容器日志。该模型部署在 AWS 安全环境中并受您的 VPC 控制，有助于确保数据安全。 Llama 2 模型现已在 Amazon SageMaker Studio 中提供，最初在 us-east 1 和 us-west 2 地区。

探索型号

您可以通过 SageMaker Studio UI 和 SageMaker Python SDK 中的 SageMaker JumpStart 访问基础模型。在本节中，我们将介绍如何在 SageMaker Studio 中发现模型。

SageMaker Studio 是一个集成开发环境 (IDE)，提供基于 Web 的单一可视化界面，您可以在其中访问专用工具来执行所有 ML 开发步骤，从准备数据到构建、训练和部署 ML 模型。有关如何开始和设置 SageMaker Studio 的更多详细信息，请参阅亚马逊SageMaker Studio.

进入 SageMaker Studio 后，您可以访问 SageMaker JumpStart，其中包含预训练的模型、笔记本和预构建的解决方案，位于 预构建和自动化解决方案.