亚马逊肯德拉 是一种由机器学习 (ML) 提供支持的高度准确且易于使用的智能搜索服务。 Amazon Kendra 提供了一套数据源连接器来简化您的内容的摄取和索引过程,无论它位于何处。
对于许多组织而言,Box Content Cloud 是其内容存储和生命周期管理战略的核心部分。 企业 Box 帐户通常包含大量资产,例如文档、演示文稿、知识文章等。 现在,借助适用于 Box 的新 Amazon Kendra 数据源连接器,这些资产和任何相关的任务或评论都可以通过 Amazon Kendra 的智能搜索服务进行索引,以显示内容并解锁答案以响应用户的查询。
在这篇文章中,我们将向您展示如何设置新的 Amazon Kendra Box 连接器以选择性地索引您的 Box Enterprise 存储库中的内容。
解决方案概述
该解决方案包括以下高级步骤:
- 通过 Box 开发者控制台为 Amazon Kendra 创建一个 Box 应用程序。
- 将示例文档添加到您的 Box 帐户。
- 通过 Amazon Kendra 控制台创建 Box 数据源。
- 索引 Box 帐户中的示例文档。
先决条件
要试用适用于 Box 的 Amazon Kendra 连接器,您需要以下内容:
- An AWS账户 具有创建权限 AWS身份和访问管理 (IAM) 角色和策略。 有关详细信息,请参阅 访问管理概述:权限和策略.
- AWS 的基本知识和 Box Enterprise 管理的工作知识。
- 对 Box Enterprise 工作区的管理员访问权限。
为 Amazon Kendra 创建一个 Box 应用程序
在配置 Amazon Kendra Box 数据源连接器之前,您必须先创建一个 Box 应用程序。
- 登录 Box Enterprise 开发者控制台.
- 创建新应用.
- 自定义应用程序.
- 服务器身份验证(使用 JWT).
- 输入您的应用程序的名称。 例如,
KendraConnector
. - 建立应用程式.
- 在您创建的应用程序中 我的应用, 选择 配置 标签。
- 在 应用访问级别 部分中,选择 应用 + 企业访问.
- 在 应用范围 部分,检查是否启用了以下权限:
- 在 高级功能 部分,选择 使用 as-user 标头进行 API 调用.
- 在 添加和管理公钥 部分中,选择 生成公钥/私钥对.
这需要两步验证。 JSON 文本文件将下载到您的计算机。
您的 Box Enterprise 所有者需要先批准该应用程序,然后您才能使用它。
转到计算机上的下载目录以查看下载的 JSON 文件。 它包含客户端 ID、客户端密码、公钥 ID、私钥、密码短语和企业 ID。 您需要这些值在后面的步骤中创建 Box 数据源。
将示例文档添加到您的 Box 帐户
在此步骤中,您将示例文档上传到您的 Box 帐户。 稍后,我们使用 Amazon Kendra Box 数据源对这些文档进行爬网和索引。
- 下载 AWS_白皮书.zip 到您的计算机。
- 将文件解压缩到名为
AWS_Whitepapers
.
- 上载
AWS_Whitepapers
文件夹到您的 Box 帐户。
创建 Box 数据源
要使用 Box 连接器将数据源添加到您的 Amazon Kendra 索引,您可以使用现有的 Amazon Kendra 索引,或者 创建新的 Amazon Kendra 索引. 然后完成以下步骤以创建 Box 数据源:
- 在Amazon Kendra控制台上,选择 指数 在导航窗格中。
- 从索引列表中,选择要将数据源添加到的索引。
- 添加数据源.
- 从数据源连接器列表中,选择 添加连接器 下 盒子.
- 点击 指定数据源详细信息 页面,输入数据源名称和可选描述。
- 下一页.
- 打开从 Box Developer Console 下载的 JSON 文件。
它包含以下值 clientID
, clientSecret
, publicKeyID
, privateKey
, passphrase
及 enterpriseID
.
- 点击 定义访问和安全性 页面,在 来源 部分,用于 盒子企业ID, 输入值
enterpriseID
领域。 - 在 认证 部分,下 AWS Secrets Manager 密钥,选择 创建并添加一个新的秘密.
- 针对 秘密名称,输入密钥的名称,例如,
boxsecret1
. - 对于其余字段,输入下载的 JSON 文件中的相应值。
- 保存并添加秘密.
- 在 IAM角色 部分中,选择 创建新角色(推荐) 并输入角色名称,例如,
box-role
.
有关包含在 IAM 角色中的所需权限的更多信息,请参阅 数据源的IAM角色.
- 下一页.
- 点击 配置同步设置 页面,在 同步范围 部分,除了文件内容之外,您还可以在索引中包含 Box Web 链接、评论和任务。 使用此帖子的默认设置(未选中)。
- 针对 附加配置(更改日志) – 可选,使用默认设置(未选中)。
- 针对 附加配置(正则表达式模式)——可选,选择 包括模式.
- 针对 Type,选择 途径
- 针对 路径 - 可选,输入您之前上传的示例文档的路径:
AWS_Whitepapers/
. - 地址.
- 在 同步运行计划 部分中,选择 按需运行.
- 下一页.
- 点击 设置字段映射 页面,您可以定义数据源如何将属性从 Box 对象映射到您的索引。 使用此帖子的默认设置。
- 下一页.
- 点击 查看并创建 页面,查看 Box 数据源的详细信息。
- 要进行更改,请选择 编辑 要更改的项目旁边的按钮。
- 完成后,选择 添加数据源 添加您的 Box 数据源。
在你选择之后 添加数据源, Amazon Kendra 开始创建数据源。 创建数据源可能需要几分钟时间。 完成后,数据源的状态从 Creating
至 Active
.
索引 Box 帐户中的示例文档
您将数据源同步运行计划配置为按需运行,因此您需要手动启动它。
当前同步状态更改为 Syncing – crawling
,然后到 Syncing – indexing
.
大约 10 分钟后,当前同步状态变为 idle
, 上次同步状态变为 Successful
,并 同步运行历史 面板显示更多详细信息,包括添加的文档数量。
测试解决方案
现在您已将您的 Box 账户中的 AWS 白皮书提取到您的 Amazon Kendra 索引中,您可以测试一些查询。
恭喜! 您已成功使用 Amazon Kendra 根据从您的 Box 账户中索引的内容提出答案和见解。
清理
为避免产生未来成本,请清理您在此解决方案中创建的资源。
- 如果您在测试此解决方案时创建了新的 Amazon Kendra 索引,请将其删除。
- 如果您使用 Box 的 Amazon Kendra 连接器添加了新数据源,请删除该数据源。
- 删除
AWS_Whitepapers
Box 帐户中的文件夹及其内容。
结论
借助 Amazon Kendra Box 连接器,组织可以使用由 Amazon Kendra 提供支持的智能搜索安全地将其 Box 帐户中的宝贵信息提供给用户。
在这篇文章中,我们向您介绍了基础知识,但还有许多我们没有介绍的附加功能。 例如:
- 您可以为您的 Amazon Kendra 索引启用基于用户的访问控制,并根据您已在 Box 中配置的访问控制限制对 Box 文档的访问
- 您可以索引其他 Box 对象类型,例如任务、评论和 Web 链接
- 您可以将 Box 对象属性映射到 Amazon Kendra 索引属性,并启用它们进行分面、搜索和显示在搜索结果中
- 您可以将 Box 数据源与 Amazon Kendra 中的自定义文档丰富 (CDE) 功能集成,以在提取期间执行其他属性映射逻辑甚至自定义内容转换
要了解这些可能性及更多信息,请参阅 Amazon Kendra 开发人员指南.
作者简介
- "
- 10
- 100
- 关于
- ACCESS
- 账号管理
- 精准的
- 增加
- 额外
- 管理
- AI
- 人工智能服务
- 所有类型
- 已经
- Amazon
- API
- 应用
- 批准
- 刊文
- 办公室文员:
- 属性
- 认证
- 可使用
- AWS
- 基础
- 盒子
- 更改
- 云端技术
- 注释
- 配置
- 安慰
- 包含
- 内容
- Contents
- 控制
- 核心
- 成本
- 创建
- 创造
- 电流
- 习俗
- data
- 数据库
- 需求
- 开发商
- 屏 显:
- 文件
- 下载
- enable
- 输入
- 企业
- 例子
- 特征
- 字段
- 姓氏:
- 以下
- 未来
- 越来越
- 高度
- 创新中心
- How To
- HTTPS
- 身分
- 包括
- 包含
- 指数
- 信息
- 可行的洞见
- 整合
- 智能化
- IT
- 键
- 知识
- 语言
- 学习用品
- 学习
- 链接
- 清单
- 机
- 机器学习
- 颠覆性技术
- 经理
- 手动
- 地图
- 地图
- ML
- 更多
- 旅游导航
- 数
- 优惠精选
- 组织
- 己
- 业主
- 政策
- 可能性
- 案例分享
- 校长
- 私立
- 私钥
- 过程
- 国家
- 公钥
- 其余
- 知识库
- 必须
- 资源
- 响应
- 检讨
- 运行
- 搜索
- 安全
- 服务
- 特色服务
- 集
- 设置
- So
- 方案,
- 解决方案
- 一些
- 开始
- 开始
- 启动
- 州/领地
- Status
- 存储
- 策略
- 顺利
- 磁化面
- 任务
- 团队
- test
- 测试
- 基础知识
- 转型
- 开锁
- 使用
- 用户
- 折扣值
- 企业验证
- 卷筒纸
- 而
- 白皮书
- 中
- 加工