获得 AWS 认证可以帮助您推动职业发展,无论您是想寻找新角色、展示您承担新项目的技能,还是成为您团队的首选专家。 由于 AWS 认证考试是由相关角色或技术领域的专家创建的,因此准备其中一门考试可以帮助您培养该领域的熟练从业者所确定的所需技能。
阅读与您的认证考试相关的 AWS 服务的常见问题解答页面对于更深入地了解该服务非常重要。 但是,这可能需要相当长的时间。 即使是阅读一项服务的常见问题解答,也可能需要半天时间才能阅读和理解。 例如, 亚马逊SageMaker FAQ 仅在 SageMaker 上就包含大约 33 页(打印的)内容。
如果您可以使用系统在 AWS 服务常见问题解答页面上进行自我测试,那不是更轻松、更有趣的学习体验吗? 实际上,您可以使用最先进的语言模型和几行 Python 开发这样的系统。
在这篇文章中,我们基于 AI21 Jurassic-2 Jumbo Instruct 基础模型,提供了为任何 AWS 服务的常见问题解答页面部署多项选择测验解决方案的综合指南 亚马逊 SageMaker 快速启动.
大型语言模型
近年来,语言模型的规模和流行度都出现了巨大的增长。 2018年, BERT-large 首次亮相 凭借其 340 亿个参数和创新的转换器架构,为 NLP 任务的性能设定了基准。 在短短几年内,最先进的模型尺寸膨胀了 500 多倍; 具有 3 亿个参数的 OpenAI 的 GPT-176 和 Bloom 175 B,以及具有 21 亿个参数的 AI2 Jurassic-178 Jumbo Instruct 只是大型语言模型 (LLM) 提高自然语言处理 (NLP) 准确性标准的三个示例。
SageMaker 基础模型
SageMaker 提供了一系列来自流行模型中心的模型,包括 Hugging Face、PyTorch Hub 和 TensorFlow Hub,以及来自 AI21、Cohere 和 LightOn 的专有模型,您可以在 SageMaker 的机器学习 (ML) 开发工作流程中访问这些模型。 机器学习的最新进展催生了一类新的模型,称为 基础模型,它有数十亿个参数,并接受了大量数据的训练。 这些基础模型可以适应广泛的用例,例如文本摘要、生成数字艺术和语言翻译。 由于这些模型的训练成本可能很高,因此客户希望使用现有的预训练基础模型并根据需要对其进行微调,而不是自己训练这些模型。 SageMaker 提供了精选的模型列表,您可以在 SageMaker 控制台上从中进行选择。
通过 JumpStart,您可以找到来自不同供应商的基础模型,使您能够快速开始使用基础模型。 您可以查看模型特征和使用条款,并使用测试 UI 小部件试用这些模型。 当您准备好大规模使用基础模型时,您无需离开 SageMaker 即可使用模型提供商提供的预建笔记本轻松实现。 您的数据,无论是用于评估还是大规模使用模型,都绝不会与第三方共享,因为这些模型是在 AWS 上托管和部署的。
AI21 Jurassic-2 巨型指令
Jurassic-2 Jumbo Instruct 是 AI21 Labs 的 LLM,可应用于任何语言理解或生成任务。 它经过优化以遵循自然语言指令和上下文,因此无需为其提供任何示例。 端点预加载了模型,并准备好通过易于使用的 API 和 Python SDK 提供查询服务,因此您可以立即开始运行。 Jurassic-2 Jumbo Instruct 是 HELM 的佼佼者,尤其是在与阅读和写作相关的任务方面。
解决方案概述
在以下部分中,我们将完成在 SageMaker 中测试 Jurassic-2 Jumbo 指令模型的步骤:
- 在 SageMaker 控制台上选择 Jurassic-2 Jumbo 指令模型。
- 使用 playground 评估模型。
- 使用与基础模型关联的笔记本将其部署到您的环境中。
通过 SageMaker 控制台访问 Jurassic-2 Jumbo Instruct
第一步是登录 SageMaker 控制台。 在下面 快速启动 在导航窗格中,选择 基础模型 请求访问模型列表。
在您的帐户被列入允许列表后,您可以在此页面上看到模型列表并搜索 Jurassic-2 Jumbo Instruct 模型。
在模型操场中评估 Jurassic-2 Jumbo Instruct 模型
在 AI21 Jurassic-2 Jumbo Instruct 列表中,选择 查看模型. 您将看到模型的描述和您可以执行的任务。 在继续之前通读模型的 EULA。
让我们首先试用该模型,以根据 SageMaker 常见问题解答页面生成测试。 导航到 游乐场 标签。
点击 游乐场 选项卡,您可以向 Jurassic-2 Jumbo Instruct 模型提供示例提示并查看输出。
请注意,您最多可以使用 500 个令牌。 我们将最大长度设置为 500,这是要生成的最大令牌数。 该模型有一个 8,192 个令牌的上下文窗口(提示加上完成的长度最多应为 8,192 个令牌)。
为了更容易看到提示,您可以放大 提示 框。
因为我们最多可以使用 500 个代币,所以我们取了一小部分 Amazon SageMaker 常见问题页面是, 低代码机器学习 部分,用于我们的测试提示。
我们使用以下提示:
提示工程是一个迭代过程。 您应该清晰具体,并给模型时间思考。
这里我们将带有##的上下文指定为停止序列,它表示模型在生成此字符或字符串后停止生成。 这在使用少量提示时很有用。
接下来,我们在提示中非常明确且非常具体,要求进行多项选择测验,由四个问题和四个选项组成。 我们要求模型使用起始字符串包含每个问题的正确答案 'Correct Answer:'
所以我们可以稍后使用 Python 解析它:
设计良好的提示可以使模型更具创造性和泛化性,从而轻松适应新任务。 提示还可以帮助将领域知识融入特定任务并提高可解释性。 Prompt engineering 可以极大地提高零样本和少样本学习模型的性能。 创建高质量的提示需要仔细考虑手头的任务,以及对模型的优势和局限性的深刻理解。
在这篇文章的范围内,我们不会进一步涵盖这个广泛的领域。
复制提示并将其输入 提示 框,然后选择 生成文本.
这会将提示发送到 Jurassic-2 Jumbo Instruct 模型进行推理。 请注意,在操场上进行试验是免费的。
还要记住,尽管 LLM 具有前沿性,但它们仍然容易出现偏见、错误和幻觉。
在仔细仔细地阅读模型输出后,我们可以看到模型生成了一个很好的测验!
玩完模型后,就可以使用笔记本并将其部署为环境中的端点了。 我们使用一个小的 Python 函数来解析输出并模拟交互式测试。
从笔记本部署 Jurassic-2 Jumbo Instruct 基础模型
您可以使用以下内容 样本笔记本 使用 SageMaker 部署 Jurassic-2 Jumbo Instruct。 请注意,此示例使用 ml.p4d.24xlarge 实例。 如果您的 AWS 账户的默认限制是 0,您需要 请求提高限额 对于这个 GPU 实例。
让我们使用 SageMaker 推理创建终端节点。 首先,我们设置必要的变量,然后从模型包中部署模型:
部署端点后,您可以对模型运行推理查询。
部署模型后,您可以使用以下代码片段与部署的端点进行交互:
通过在 ml.p2d.4xlarge 实例 SageMaker 端点上部署 Jurassic-24 Jumbo Instruct 基础模型,您可以使用带有 4,096 个令牌的提示。 您可以采用我们在 playground 中使用的相同提示并添加更多问题。 在此示例中,我们添加了 FAQ 的整个 低代码机器学习 部分作为上下文进入提示。
我们可以看到模型的输出,它生成了一个包含四个问题和每个问题四个选项的多项选择测验。
现在您可以开发一个 Python 函数来解析输出并创建交互式多项选择测验。
使用几行代码开发这样的功能非常简单。 您可以轻松解析答案,因为模型为每个问题创建了一行“正确答案:”,完全按照我们在提示中的要求。 在本文的范围内,我们不提供生成测验的 Python 代码。
在笔记本中运行测验
使用我们之前创建的 Python 函数和 Jurassic-2 Jumbo Instruct 基础模型的输出,我们在笔记本中运行交互式测验。
你可以看到我答对了四道题中的三道,并且得到了 75% 的分数。 也许我需要多读几遍 SageMaker 常见问题解答!
清理
试用端点后,请确保删除 SageMaker 推理端点和模型以防止产生任何费用:
结论
在本文中,我们向您展示了如何使用 SageMaker 测试和使用 AI21 的 Jurassic-2 Jumbo Instruct 模型来构建自动测验生成系统。 这是通过使用一个相当简单的提示实现的,提示中嵌入了公开可用的 SageMaker FAQ 页面的文本和几行 Python 代码。
与博文中提到的这个例子类似,您只需几个带标签的例子就可以为您的业务定制一个基础模型。 因为所有数据都经过加密并且不会离开您的 AWS 账户,所以您可以相信您的数据将保持私密和机密。
请求访问 试用基础模型 今天在 SageMaker 中,让我们知道您的反馈!
关于作者
埃坦·塞拉(Eitan Sela) 是 Amazon Web Services 的机器学习专家解决方案架构师。 他与 AWS 客户合作,提供指导和技术援助,帮助他们在 AWS 上构建和运行机器学习解决方案。 在业余时间,Eitan 喜欢慢跑和阅读最新的机器学习文章。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- 使用 PREIPO® 买卖 PRE-IPO 公司的股票。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/accelerate-your-learning-towards-aws-certification-exams-with-automated-quiz-generation-using-amazon-sagemaker-foundations-models/
- :具有
- :是
- :不是
- 1
- 100
- 14
- 15%
- 17
- 2018
- 23
- 500
- 7
- 8
- 9
- a
- 关于
- 加快
- ACCESS
- 账号管理
- 实现
- 获得
- 通
- 适应
- 加
- 添加
- 进步
- 后
- 驳
- 算法
- 所有类型
- 让
- 还
- Amazon
- 亚马逊SageMaker
- 亚马逊SageMaker自动驾驶仪
- 亚马逊SageMaker JumpStart
- 亚马逊网络服务
- 量
- an
- 和
- 回答
- 任何
- API
- 应用的
- 架构
- 保健
- 国家 / 地区
- 艺术
- 刊文
- AS
- 帮助
- 相关
- At
- 自动化
- 可使用
- AWS
- 酒吧
- 基地
- 基于
- BE
- 因为
- 成为
- before
- 基准
- 偏见
- 亿
- 十亿美元
- Bloom
- 都
- 盒子
- 建立
- 内建的
- 商业
- by
- CAN
- 寻找工作
- 小心
- 小心
- 案件
- 例
- 证书
- 认证
- 字符
- 特点
- 收费
- 选择
- 程
- 分类
- 清除
- 码
- 如何
- 购买的订单均
- 完成
- 全面
- 考虑
- 组成
- 安慰
- 包含
- 内容
- 上下文
- 正确
- 可以
- 外壳
- 创建信息图
- 创建
- 创造
- 创意奖学金
- 策划
- 合作伙伴
- 定制
- 定制
- 前沿
- data
- 天
- 深
- 更深
- 默认
- 需求
- 需求预测
- 部署
- 部署
- 部署
- 描述
- 尽管
- 检测
- 开发
- 研发支持
- 不同
- 数字
- 数码艺术
- do
- 不会
- 域
- 别
- 每
- 此前
- 更容易
- 容易
- 易于使用
- 嵌入式
- 使
- 加密
- 端点
- 工程师
- 放大
- 输入
- 整个
- 环境
- 故障
- 评估
- 甚至
- 究竟
- 考试
- 例子
- 例子
- 现有
- 昂贵
- 体验
- 技术专家
- 专家
- 面部彩妆
- 常见问题
- 少数
- 部分
- 找到最适合您的地方
- (名字)
- 适合
- 遵循
- 以下
- 针对
- 基金会
- Foundations
- 四
- 骗局
- 欺诈检测
- 自由的
- 止
- 充分
- 开玩笑
- 功能
- 进一步
- 生成
- 产生
- 发电
- 代
- 得到
- 越来越
- 给
- 特定
- Go
- 非常好
- GPU
- 经验
- 非常
- 陆运
- 指导
- 指南
- 半
- 手
- 有
- he
- 帮助
- 帮助
- 帮助
- 高品质
- 他的
- 击中
- 托管
- 创新中心
- 但是
- HTML
- HTTPS
- 中心
- 巨大
- i
- 确定
- if
- 图片
- 图像分类
- 重要
- 改善
- in
- 包括
- 包括
- 包含
- 合并
- 信息
- 创新
- 输入
- 例
- 说明
- 相互作用
- 互动
- 成
- IT
- 它的
- 工作
- 只是
- 保持
- 知道
- 知识
- 已知
- 实验室
- 语言
- 大
- 后来
- 最新
- 发射
- 学习
- 离开
- 离开
- 长度
- 让
- 极限
- 限制
- Line
- 线
- 清单
- 已发布
- 清单
- LLM
- 日志
- 寻找
- 机
- 机器学习
- 制成
- 保养
- 使
- 手动
- 许多
- 大规模
- 最大
- 最多
- 提到
- 百万
- 介意
- ML
- 模型
- 模型
- 修改
- 更多
- 最先进的
- 多
- my
- 自然
- 自然语言处理
- 自然
- 导航
- 旅游导航
- 必要
- 需求
- 打印车票
- 决不要
- 全新
- NLP
- 没有
- 笔记本
- 数
- 对象
- 物体检测
- of
- 最多线路
- on
- 一
- 那些
- 正在进行
- 开放源码
- 操作
- 优化
- 附加选项
- or
- 秩序
- 我们的
- 输出
- 产量
- 超过
- 包
- 页
- 面包
- 参数
- 尤其
- 各方
- 演出
- 性能
- 表演者
- 也许
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 播放
- 加
- 热门
- 声望
- 一部分
- 帖子
- 预报器
- 准备
- 当下
- 防止
- 预览
- 私立
- 过程
- 处理
- 生产
- 项目
- 推进
- 所有权
- 提供
- 供应商
- 提供
- 公然
- 蟒蛇
- pytorch
- 查询
- 题
- 有疑问吗?
- 很快
- 提高
- 范围
- 宁
- 阅读
- 阅读
- 准备
- 最近
- 有关
- 相应
- 留
- 去掉
- 请求
- 必须
- 需要
- 检讨
- 上升
- 角色
- 运行
- 运行
- sagemaker
- SageMaker 推理
- 同
- 鳞片
- 范围
- 脚本
- SDK
- 搜索
- 部分
- 部分
- 看到
- 看到
- 发送
- 句子
- 服务
- 服务
- 特色服务
- 集
- 设置
- 共用的,
- 短
- 应该
- 展示
- 显示
- 信号
- 简易
- 尺寸
- 技能的
- 技能
- 小
- So
- 方案,
- 解决方案
- 一些
- 专家
- 具体的
- 指定
- 开始
- 开始
- 国家的最先进的
- 步
- 步骤
- 仍
- Stop 停止
- 停止
- 简单的
- 优势
- 串
- 这样
- 支持
- 支持
- 浪涌
- 系统
- 采取
- 任务
- 任务
- 文案
- tensorflow
- 条款
- test
- 文字分类
- 比
- 这
- 他们
- 他们自己
- 然后
- 那里。
- 博曼
- 他们
- 认为
- 第三
- 第三者
- Free Introduction
- 透
- 那些
- 三
- 通过
- 次
- 时
- 至
- 今晚
- 令牌
- 最佳
- 主题
- 向
- 培训
- 熟练
- 产品培训
- 变压器
- 翻译
- 试用
- 试验
- 尝试
- 信任
- 尝试
- ui
- 下
- 理解
- 理解
- 更新
- us
- 用法
- 使用
- 用例
- 用过的
- 使用
- 运用
- 非常
- 通过
- 查看
- 愿景
- 参观
- 想
- 是
- we
- 卷筒纸
- Web服务
- 井
- 什么是
- ,尤其是
- 是否
- 这
- 宽
- 大范围
- 将
- 中
- 也完全不需要
- 工作流程
- 合作
- 写作
- XGBoost
- 年
- 含
- 完全
- 您一站式解决方案
- 你自己
- 和风网