在当今的数字世界中,大多数消费者宁愿自己寻找客户服务问题的答案,也不愿花时间与企业和/或服务提供商联系。 这篇博文探讨了一种创新的解决方案,用于构建问答聊天机器人 亚马逊Lex 使用您网站上的现有常见问题解答。 这种人工智能驱动的工具可以对现实世界的询问提供快速、准确的响应,使客户能够快速、轻松地独立解决常见问题。
单个 URL 摄取
许多企业在其网站上为客户提供了一组已发布的常见问题解答。 在这种情况下,我们希望为客户提供一个聊天机器人,可以回答我们发布的常见问题解答中的问题。 在标题为 使用 LLM 增强 Amazon Lex 的对话式常见问题解答功能中,我们演示了如何结合使用 Amazon Lex 和 LlamaIndex 来构建由现有知识源(例如 PDF 或 Word 文档)提供支持的聊天机器人。 为了支持简单的常见问题解答,基于常见问题解答网站,我们需要创建一个摄取流程,可以抓取网站并创建 LlamaIndex 可以使用的嵌入来回答客户问题。 在这种情况下,我们将在创建的机器人的基础上进行构建 以前的博文,它用用户的话语查询这些嵌入,并从网站常见问题解答中返回答案。
下图显示了提取过程和 Amazon Lex 机器人如何协同工作以实现我们的解决方案。
在解决方案工作流程中,包含常见问题解答的网站通过 AWS Lambda。 此 Lambda 函数抓取网站并将结果文本存储在 亚马逊简单存储服务 (亚马逊 S3)存储桶。 然后,S3 存储桶会触发 Lambda 函数,该函数使用 LlamaIndex 创建存储在 Amazon S3 中的嵌入。 当最终用户提出问题(例如“您的退货政策是什么?”)时,Amazon Lex 机器人会使用其 Lambda 函数,通过基于 RAG 的方法和 LlamaIndex 来查询嵌入。 有关此方法和先决条件的更多信息,请参阅博客文章: 使用 LLM 增强 Amazon Lex 的对话式常见问题解答功能.
完成上述博客的先决条件后,第一步是将常见问题解答提取到可以由 LlamaIndex 进行矢量化和索引的文档存储库中。 以下代码显示了如何完成此操作:
在前面的示例中,我们从 Zappos 获取预定义的常见问题解答网站 URL,并使用 EZWebLoader
班级。 通过这个类,我们导航到 URL 并将页面中的所有问题加载到索引中。 我们现在可以问“Zappos 有礼品卡吗?”之类的问题。 并直接从我们网站上的常见问题解答中获取答案。 以下屏幕截图显示了 Amazon Lex 机器人测试控制台回答常见问题解答中的该问题。
我们能够实现这一目标是因为我们在第一步中抓取了 URL 并创建了 LlamaIndex 可以用来搜索问题答案的嵌入。 我们的机器人的 Lambda 函数显示了每当返回后备意图时如何运行此搜索:
当单个网页包含所有答案时,此解决方案效果很好。 然而,大多数常见问题解答网站都不是构建在单个页面上的。 例如,在我们的 Zappos 示例中,如果我们提出问题“你们有价格匹配政策吗?”,那么我们会得到一个不太令人满意的答案,如下面的屏幕截图所示。
在前面的交互中,价格匹配策略答案对我们的用户没有帮助。 这个答案很短,因为引用的常见问题解答是指向有关价格匹配政策的特定页面的链接,而我们的网络爬行仅针对单个页面。 获得更好的答案也意味着抓取这些链接。 下一节将介绍如何获得需要两级或更多级别页面深度的问题的答案。
N级爬取
当我们抓取网页获取FAQ知识时,我们想要的信息就可以包含在链接的页面中。 例如,在我们的 Zappos 示例中,我们提出问题“你们有价格匹配政策吗?” 答案是“是的,请访问了解更多。” 如果有人问“你们的价格匹配政策是什么?” 那么我们想用政策给出一个完整的答案。 实现这一目标意味着我们需要遍历链接来为最终用户获取实际信息。 在摄取过程中,我们可以使用 Web 加载器查找其他 HTML 页面的锚链接,然后遍历它们。 对我们的网络爬虫进行以下代码更改使我们能够在爬行的页面中查找链接。 它还包括一些额外的逻辑,以避免循环爬行并允许按前缀过滤。
在前面的代码中,我们引入了爬取 N 层深度的能力,并给出了一个前缀,允许我们将爬取限制为仅以特定 URL 模式开头的内容。 在我们的 Zappos 示例中,客户服务页面均源自 zappos.com/c
,因此我们将其作为前缀,以将我们的爬网限制为更小且更相关的子集。 该代码展示了我们如何摄取最多两层的深度。 我们的机器人的 Lambda 逻辑保持不变,因为除了爬虫摄取更多文档之外没有任何变化。
现在我们已经对所有文档建立了索引,我们可以提出更详细的问题。 在下面的屏幕截图中,我们的机器人提供了“你们有价格匹配政策吗?”问题的正确答案。
现在我们对价格匹配的问题有了完整的答案。 它不是简单地告诉我们“是的,请参阅我们的政策”,而是为我们提供第二级爬网的详细信息。
清理
为了避免产生未来费用,请继续删除在此练习中部署的所有资源。 我们提供了一个脚本来正常关闭 Sagemaker 端点。 使用详细信息位于自述文件中。 此外,要删除您可以运行的所有其他资源 cdk destroy
与其他 cdk 命令位于同一目录中,以取消配置堆栈中的所有资源。
结论
将一组常见问题解答引入聊天机器人的功能使您的客户能够通过简单的自然语言查询找到问题的答案。 通过将 Amazon Lex 中对回退处理的内置支持与 LlamaIndex 等 RAG 解决方案相结合,我们可以为客户提供一条快速路径,以获得令人满意的、精心策划且经过批准的常见问题解答。 通过将 N 级爬行应用到我们的解决方案中,我们可以提供可能跨越多个常见问题解答链接的答案,并为客户的查询提供更深入的答案。 通过执行这些步骤,您可以将强大的基于 LLM 的问答功能和高效的 URL 提取无缝集成到您的 Amazon Lex 聊天机器人中。 这使得与用户的交互更加准确、全面且具有情境意识。
关于作者
马克斯·汉克尔-华莱士 是 AWS Lex 的软件开发工程师。 他喜欢利用技术来最大限度地提高客户的成功。 工作之余,他热衷于烹饪、与朋友共度时光以及背包旅行。
宋峰 是 AWS AI 实验室的高级应用科学家,专门研究自然语言处理和人工智能。 她的研究探索了这些领域的各个方面,包括基于文档的对话建模、面向任务的对话推理以及使用多模式数据的交互式文本生成。
约翰贝克 是 AWS 的首席 SDE,负责自然语言处理、大型语言模型和其他 ML/AI 相关项目。 他已在 Amazon 工作 9 年多,曾在 AWS、Alexa 和 Amazon.com 工作过。 在业余时间,约翰喜欢在太平洋西北地区滑雪和进行其他户外活动。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- PlatoData.Network 垂直生成人工智能。 赋予自己力量。 访问这里。
- 柏拉图爱流。 Web3 智能。 知识放大。 访问这里。
- 柏拉图ESG。 汽车/电动汽车, 碳, 清洁科技, 能源, 环境, 太阳能, 废物管理。 访问这里。
- 块偏移量。 现代化环境抵消所有权。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/enhance-amazon-lex-with-llms-and-improve-the-faq-experience-using-url-ingestion/
- :具有
- :是
- :不是
- :在哪里
- $UP
- 1
- 10
- 100
- 12
- 14
- 16
- 19
- 23
- 36
- 7
- 80
- a
- 对,能力--
- Able
- 关于
- 完成
- 精准的
- 实现
- 横过
- 活动
- 实际
- 额外
- 另外
- AI
- AI供电
- Alexa的
- 所有类型
- 让
- 允许
- 允许
- 已经
- 还
- Amazon
- 亚马逊Lex
- 亚马逊网络服务
- Amazon.com
- an
- 锚
- 和
- 回答
- 答案
- 应用的
- 应用
- 的途径
- 批准
- 保健
- 抵达
- 人造的
- 人工智能
- AS
- 方面
- At
- 可使用
- 避免
- 察觉
- AWS
- 背部
- 基地
- 基于
- BE
- 因为
- 很
- 开始
- 作为
- 更好
- 博客
- 身体
- 博特
- 建立
- 建
- 内建的
- 企业
- by
- CAN
- 能力
- 牌
- 案件
- 一定
- 更改
- 变
- 聊天机器人
- 检查
- 程
- 客户
- 关闭
- 码
- COM的
- 组合
- 结合
- 未来
- 相当常见
- 完成
- 全面
- 安慰
- 消费者
- 包含
- 内容
- Contents
- 上下文
- 听起来像对话
- 兑换
- 转换
- 正确
- 可以
- Counter
- 履带
- 创建信息图
- 创建
- 策划
- 顾客
- 客户服务
- 客户成功
- 合作伙伴
- 周期
- data
- 深
- 更深
- 默认
- 证明
- 部署
- 深度
- 详细
- 详情
- 研发支持
- 对话
- 数字
- 数字世界
- 直接
- 文件
- 文件
- 向下
- 下载
- 重复
- ,我们将参加
- e
- 每
- 容易
- 高效
- 其他
- 使
- 结束
- 端点
- 工程师
- 提高
- 企业
- 条目
- 活动
- 例子
- 除
- 例外
- 锻炼
- 现有
- 开支
- 体验
- 探讨
- 常见问题
- 特征
- 字段
- 档
- 过滤
- 找到最适合您的地方
- 姓氏:
- 以下
- 针对
- 发现
- 朋友
- 止
- 功能
- 未来
- 代
- 得到
- 礼物
- 礼品卡
- 给
- 特定
- 给
- Go
- 民政事务总署
- 处理
- 有
- he
- 头
- 有帮助
- 这里
- 他的
- 创新中心
- How To
- 但是
- HTML
- HTTP
- HTTPS
- if
- 进口
- 改善
- in
- 包括
- 包括
- 包含
- 来电
- 合并
- 独立地
- 指数
- 索引
- info
- 信息
- 创新
- 输入
- 咨询内容
- 例
- 代替
- 房源搜索
- 意图
- 相互作用
- 互动
- 互动
- 成
- 介绍
- IT
- 它的
- John
- JPG
- JSON
- 键
- 知识
- 实验室
- 语言
- 大
- 学习用品
- Level
- 各级
- 借力
- 喜欢
- 极限
- 友情链接
- 链接
- 链接
- Linux的
- 清单
- 加载
- 装载机
- 本地
- 当地
- 记录
- 逻辑
- 匹配
- 匹配
- 生产力
- 意味着
- 手段
- 的话
- 条未读消息
- 造型
- 模型
- 更多
- 最先进的
- 多
- 姓名
- 自然
- 自然语言处理
- 需求
- 下页
- 没什么
- 现在
- 数
- 对象
- of
- 提供
- on
- 一
- 仅由
- or
- OS
- 其他名称
- 我们的
- 输出
- 学校以外
- 己
- 太平洋
- 页
- 网页
- 部分
- 多情
- 径
- 模式
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 请
- 政策
- 或者
- 帖子
- 供电
- 强大
- 防止
- 车资
- 校长
- 问题
- 过程
- 处理
- 项目
- 提供
- 提供
- 供应商
- 提供
- 出版
- 查询
- 题
- 有疑问吗?
- 快速
- 很快
- 提高
- 宁
- RE
- 达到
- 读者
- 真实的世界
- 有关
- 相应
- 遗迹
- 去掉
- 知识库
- 请求
- 要求
- 要求
- 研究
- 资源
- 响应
- 回复
- 限制
- 导致
- 成果
- 回报
- 回报
- 根
- 路线
- 运行
- s
- sagemaker
- 同
- 科学家
- 无缝
- 搜索
- 部分
- 看到
- 自
- 前辈
- 服务
- 服务供应商
- 特色服务
- 集
- 短
- 如图
- 作品
- 关闭
- 简易
- 只是
- 单
- 网站
- 网站
- 插槽
- 小
- So
- 软件
- 软件开发
- 方案,
- 解决
- 一些
- 有人
- 来源
- 跨度
- 专业
- 具体的
- 花费
- 堆
- 开始
- 步
- 步骤
- 存储
- 商店
- 存储
- 商店
- 简单的
- 成功
- 这样
- SUPPORT
- SYS
- 采取
- 服用
- 专业技术
- test
- 比
- 这
- 信息
- 其
- 他们
- 然后
- 博曼
- 事
- Free Introduction
- 那些
- 始终
- 次
- 标题
- 至
- 今天的
- 一起
- 工具
- 治疗
- true
- 尝试
- 二
- 类型
- 网址
- us
- 用法
- 使用
- 用过的
- 用户
- 用户
- 使用
- 运用
- 各个
- 通过
- 参观
- 参观
- 想
- 是
- we
- 卷筒纸
- Web服务
- 您的网站
- 井
- 为
- ,尤其是
- 每当
- 这
- 将
- Word
- 工作
- 一起工作
- 工作
- 工作流程
- 加工
- 合作
- 世界
- 将
- 书面
- X11
- 年
- 完全
- 您一站式解决方案
- 和风网