亚马逊肯德拉 是一种由机器学习 (ML) 提供支持的高度准确且易于使用的智能搜索服务。 Amazon Kendra 提供了一套数据源连接器来简化您的内容的摄取和索引过程,无论它位于何处。
组织中有价值的数据存储在结构化和非结构化存储库中。 Amazon Kendra 可以将多个结构化和非结构化知识库存储库中的数据汇集在一起,以进行索引和搜索。
Microsoft SharePoint 就是这样一种知识库存储库,我们很高兴地宣布,我们已经更新了适用于 Amazon Kendra 的 SharePoint 连接器以添加更多功能。 在这个新版本 (V2.0) 中,我们添加了对 SharePoint 订阅版的支持以及多种身份验证和同步模式,以根据新的、修改的或删除的内容对内容进行索引。
您现在还可以选择 OAuth 2.0 以使用 SharePoint Online 进行身份验证。 多个同步选项可用于在数据源内容更改时更新索引。 您可以根据用户和组信息过滤搜索结果,以确保您的搜索结果仅根据用户访问权限显示。
在本文中,我们演示了如何使用 Amazon Kendra SharePoint 连接器 V2.0 为来自 SharePoint 的内容编制索引。
解决方案概述
您可以使用 Amazon Kendra 作为中心位置来索引各种数据源提供的内容以进行智能搜索。 在以下部分中,我们将完成创建索引、添加 SharePoint 连接器和测试解决方案的步骤。
先决条件
首先,您需要以下内容:
创建 Amazon Kendra 索引
要创建 Amazon Kendra 索引,请完成以下步骤:
- 在Amazon Kendra控制台上,选择 创建一个索引.
- 针对 索引名称,输入索引的名称(例如,
my-sharepoint-index
). - 输入可选描述。
- 创建一个新角色.
- 针对 角色名称,输入 IAM 角色名称。
- 配置可选的加密设置和标签。
- 下一页.
- 针对 访问控制设置,选择 是的.
- 针对 令牌配置,设定 代币类型 至 JSON 并保留默认值 用户名 和 组别.
- 针对 用户组扩展, 保留默认值。
- 下一页.
- 针对 指定配置, 选择 开发者版,适用于构建概念验证和实验,并选择 创建.
将 SharePoint 数据源添加到您的 Amazon Kendra 索引
实施 Amazon Kendra 的优势之一是您可以使用一组预构建的数据源连接器,例如 亚马逊简单存储服务 (Amazon S3), 亚马逊关系数据库服务 (Amazon RDS),SharePoint Online和Salesforce。
要将 SharePoint 数据源添加到索引,请完成以下步骤:
- 在 Amazon Kendra 控制台上,导航到您创建的索引。
- 资料来源 在导航窗格中。
- 下 SharePoint 连接器 V2.0,选择 添加连接器.
- 针对 资料来源名称,输入名称(例如,
my-sharepoint-data-source
). - 输入可选描述。
- 英语 (en) 预设语言.
- 输入可选标签。
- 下一页.
根据您的 SharePoint 应用程序使用的托管选项,选择适当的托管方法。 连接器配置所需的属性根据您选择的托管方法显示。
- 如果你选择 SharePoint Online,请完成以下步骤:
- 输入 SharePoint Online 存储库的 URL。
- 选择您的身份验证选项(这些身份验证详细信息将由 SharePoint 连接器用于与您的 SharePoint 应用程序集成)。
- 输入 SharePoint Online 应用程序的租户 ID。
- 针对 AWS Secrets Manager 密钥,选择具有 SharePoint Online 应用程序凭据的机密或创建新机密并添加连接详细信息(例如,
AmazonKendra-SharePoint-my-sharepoint-online-secret
).
要了解更多有关 AWS 秘密管理器,请参阅 开始使用 Secrets Manager.
SharePoint 连接器使用 clientId
, clientSecret
, userName
及 password
使用 SharePoint Online 应用程序进行身份验证的信息。 这些详细信息可以访问 应用注册 Azure 门户上的页面(如果 SharePoint Online 应用程序已注册)。
- 如果你选择 SharePoint服务器,请完成以下步骤:
- 选择您的 SharePoint 版本(例如,我们在这篇文章中使用 SharePoint 2019)。
- 输入 SharePoint Server 存储库的站点 URL。
- 针对 SSL 证书位置,输入 SharePoint Server SSL 证书所在的 S3 存储桶文件的路径。
- 如果 SharePoint 服务器需要代理连接,请输入 Web 代理主机名和端口号详细信息。
对于这篇文章,没有使用 Web 代理,因为用于此示例的 SharePoint 应用程序是一个面向公众的应用程序。
-
- 选择访问控制列表 (ACL) 配置的授权选项。
SharePoint 连接器将使用这些身份验证详细信息来与您的 SharePoint 实例集成。
- 针对 AWS Secrets Manager 密钥,选择具有 SharePoint Server 凭据的机密或创建新机密并添加连接详细信息(例如,
AmazonKendra-my-sharepoint-server-secret
).
SharePoint 连接器使用用户名和密码信息对 SharePoint Server 应用程序进行身份验证。 如果您使用域形式为 IDP 的电子邮件 ID 作为 ACL 设置,则还需要 LDAP 服务器端点、搜索库、LDAP 用户名和 LDAP 密码。
为了实现对可搜索和可显示内容的精细控制,SharePoint 连接器 V2.0 中引入了身份爬虫功能。
- 启用身份爬虫并选择 抓取本地组映射 和 抓取广告组映射.
- 针对 虚拟私有云(VPC), 选择可从 SharePoint 连接器访问 SharePoint 应用程序的 VPC。
对于这篇文章,我们选择 无专有网络 因为用于此示例的 SharePoint 应用程序是部署在 亚马逊弹性计算云 (Amazon EC2)实例。
- 选择 创建新角色(推荐) 并提供角色名称,例如
AmazonKendra-sharepoint-v2
. - 下一页.
- 选择您想要包含在索引中的实体。 你可以选择 所有类型 或基于您的用例的特定实体。 对于这篇文章,我们选择 所有类型.
您还可以使用正则表达式包括或排除文档。 您可以定义 Amazon Kendra 用于从索引中排除某些文档或仅包含具有该模式的文档的模式。 有关详细信息,请参阅 SharePoint 配置.
- 选择您的同步模式以在数据源内容更改时更新索引。
您可以通过选择同步和索引所有实体中的所有内容,而不管之前的同步过程如何 全同步,或者只同步新的、修改的或删除的内容,或者只同步新的或修改的内容。 对于这篇文章,我们选择 全同步.
- 选择运行同步计划的频率,例如 按需运行.
- 下一页.
在下一步中,您可以创建字段映射以向文档添加额外的元数据层。 这使您能够通过以下方式提高准确性 手动调整, 过滤, 和分面。
- 查看默认字段映射信息并选择 下一页.
- 最后一步,查看配置详细信息并选择 添加数据源 为 Amazon Kendra 索引创建 SharePoint 连接器数据源。
测试解决方案
现在您已准备好使用 SharePoint 连接器准备和测试 Amazon Kendra 搜索功能。
对于这篇博文,AWS 入门文档已添加到 SharePoint 数据源。 用于这篇文章的示例数据集可以从以下位置下载 AWS_白皮书.zip. 此数据集的 PDF 文档根据文档类型(例如,与 AWS 数据库选项、安全性和 ML 相关的文档)分类到多个目录中。
此外,SharePoint 中的示例数据集目录配置有用户电子邮件 ID 和组详细信息,以便只有具有权限的用户和组才能访问特定目录或单个文件。
为了实现对搜索结果的粒度级控制,当启用身份爬网程序并选择了本地和 AD 组映射选项时,SharePoint 连接器除了内容之外,还会对 SharePoint 数据源中的本地或 Active Directory (AD) 组映射进行爬网. 借助此功能,Amazon Kendra 索引内容可根据用户和组的访问控制权限进行搜索和显示。
要将我们的索引与 SharePoint 内容同步,请完成以下步骤:
- 在 Amazon Kendra 控制台上,导航到您创建的索引。
- 资料来源 在导航窗格中,然后选择 SharePoint 数据源。
- 立即同步 启动从 SharePoint 应用程序索引内容的过程并等待该过程完成。
如果遇到任何同步问题,请参阅 数据源故障排除 获取更多信息.
当同步过程成功时,值 上次同步状态 将设置为 成功——服务正常运行. 来自 SharePoint 应用程序的内容现已编制索引并准备好进行查询。
- 搜索索引内容 (下 数据管理) 在导航窗格中。
- 在搜索字段中输入测试查询,然后按 输入.
测试查询,例如“S3 的耐用性是多少?” 提供以下 Amazon Kendra 建议的答案。 请注意,此查询的结果来自所有索引内容。 这是因为此查询没有用户名或组信息的上下文。
- 要测试访问控制搜索,展开 使用用户名或组测试查询 并选择 应用用户名或组 添加用户名(电子邮件 ID)或群组信息。
使用 Experience Builder 应用程序时,它包含用户上下文,因此您不需要显式添加用户或组 ID。
- 对于本文,仅向数据库专家组提供对 SharePoint 站点中数据库目录的访问权限。
- 输入一个新的测试查询并按下 输入.
在这个例子中,只搜索数据库目录中的内容并显示结果。 这是因为数据库专家组只能访问数据库目录。
恭喜! 您已成功使用 Amazon Kendra 根据从 SharePoint 应用程序索引的内容显示答案和见解。
Amazon Kendra 体验生成器
您无需任何前端代码即可构建和部署 Amazon Kendra 搜索应用程序。 Amazon Kendra Experience Builder 可帮助您通过几次点击构建和部署功能齐全的搜索应用程序,以便您可以立即开始搜索。
请参阅 无需代码即可构建搜索体验 获取更多信息.
清理
为避免产生未来成本,请清理您在此解决方案中创建的资源。 如果您在测试此解决方案时创建了新的 Amazon Kendra 索引,请在不再需要时将其删除。 如果您仅使用适用于 SharePoint 的 Amazon Kendra 连接器添加了新数据源,请在解决方案审核完成后删除该数据源。
请参阅 删除索引和数据源 获取更多信息.
结论
在本文中,我们展示了如何将文档从您的 SharePoint 应用程序提取到您的 Amazon Kendra 索引中。 我们还回顾了新版本的 SharePoint 连接器中引入的一些新功能。
要了解有关适用于 SharePoint 的 Amazon Kendra 连接器的更多信息,请参阅 Microsoft SharePoint 连接器 V2.0.
最后,别忘了查看 有关Amazon Kendra的其他博客文章!
关于作者
乌达亚贾拉迪 是 Amazon Web Services (AWS) 的解决方案架构师,专门协助独立软件供应商 (ISV) 客户。 凭借在云战略、AI/ML 技术和运营方面的专业知识,Udaya 是高管和工程师值得信赖的顾问,就最大限度地发挥云的潜力和推动创新产品开发提供个性化指导。 Udaya 凭借其跨多个业务领域的企业架构师 (EA) 背景,擅长构建可扩展的云解决方案,以满足 ISV 客户的特定需求。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- 使用 PREIPO® 买卖 PRE-IPO 公司的股票。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/announcing-the-updated-microsoft-sharepoint-connector-v2-0-for-amazon-kendra/
- :具有
- :是
- :在哪里
- $UP
- 10
- 100
- 11
- 12
- 14
- 17
- 20
- 2019
- 7
- 9
- a
- 关于
- ACCESS
- 访问
- 精准的
- 横过
- 要积极。
- Ad
- 加
- 添加
- 增加
- 优点
- 顾问
- 后
- AI / ML
- 所有类型
- 已经
- 还
- Amazon
- Amazon EC2
- 亚马逊肯德拉
- 亚马逊RDS
- 亚马逊网络服务
- 亚马逊网络服务(AWS)
- an
- 和
- 宣布
- 宣布
- 答案
- 任何
- 应用
- 出现
- 应用领域
- 适当
- 保健
- AS
- At
- 属性
- 认证
- 认证
- 授权
- 可使用
- 避免
- 远离
- AWS
- Azure
- 背景
- 基地
- 基于
- BE
- 因为
- 博客
- 博客文章
- 都
- 建立
- 建设者
- 建筑物
- 商业
- by
- CAN
- 能力
- 案件
- 中央
- 一定
- 证书
- 更改
- 查
- 云端技术
- 码
- 完成
- 完成
- 计算
- 概念
- 配置
- 地都
- 安慰
- 内容
- Contents
- 上下文
- 控制
- 成本
- 履带
- 创建信息图
- 创建
- 资历
- 合作伙伴
- data
- 数据库
- 数据库
- 默认
- 默认
- 演示
- 部署
- 部署
- 描述
- 详情
- 研发支持
- 目录
- 不同
- 文件
- 域
- 域名
- 别
- 驾驶
- 耐久力
- EA
- 版
- 或
- 邮箱地址
- 启用
- 使
- 加密
- 端点
- 工程师
- 确保
- 输入
- 企业
- 实体
- 甚至
- 例子
- 兴奋
- 管理人员
- 扩大
- 体验
- 专门知识
- 表达式
- 额外
- 特征
- 少数
- 部分
- 文件
- 档
- 过滤
- 以下
- 针对
- 申请
- 频率
- 止
- 充分
- 实用
- 功能
- 未来
- 得到
- 越来越
- Go
- 团队
- 组的
- 指导
- 有
- 帮助
- 高度
- 他的
- 主持人
- 托管
- 创新中心
- How To
- HTML
- HTTP
- HTTPS
- ID
- 身分
- IDS
- if
- 实施
- 改善
- in
- 包括
- 包括
- 独立
- 指数
- 个人
- 信息
- 创新
- 可行的洞见
- 例
- 整合
- 智能化
- 成
- 介绍
- 问题
- IT
- JPG
- 知识
- (姓氏)
- 层
- 学习用品
- 学习
- 离开
- Level
- 借力
- 喜欢
- 清单
- 本地
- 位于
- 圖書分館的位置
- 不再
- 机
- 机器学习
- 经理
- 制图
- 最大化
- 满足
- 元数据
- 方法
- 微软
- ML
- 时尚
- 模式
- 改性
- 更多
- 多
- 姓名
- 导航
- 旅游导航
- 需求
- 需要
- 全新
- 新功能
- 下页
- 没有
- 现在
- 数
- OAuth的
- of
- 提供
- 优惠精选
- on
- 在线
- 仅由
- 操作
- 运营
- 附加选项
- 附加选项
- or
- 组织
- 我们的
- 输出
- 超过
- 页
- 面包
- 部分
- 密码
- 径
- 模式
- 模式
- 权限
- 个性化你的
- 挑
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 门户网站
- 帖子
- 帖子
- 潜力
- 供电
- Prepare
- express
- 以前
- 私立
- 过程
- 产品
- 产品开发
- 证明
- 概念验证
- 提供
- 提供
- 提供
- 代理
- 查询
- 准备
- 建议
- 而不管
- 在相关机构注册的
- 定期
- 有关
- 知识库
- 必须
- 需要
- 资源
- 成果
- 检讨
- 审查
- 右
- 权利
- 角色
- 运行
- Salesforce的
- 样本数据集
- 可扩展性
- 始你
- 搜索
- 搜索
- 秘密
- 部分
- 保安
- 选
- 选择
- 服务
- 服务
- 特色服务
- 集
- 设置
- 设置
- 几个
- 显示
- 如图
- 简易
- 简化
- 网站
- So
- 软件
- 方案,
- 解决方案
- 一些
- 来源
- 来源
- 专业
- 具体的
- SSL
- SSL证书
- 开始
- 开始
- Status
- 步
- 步骤
- 存储
- 存储
- 策略
- 结构化
- 订阅
- 成功
- 顺利
- 这样
- 套房
- SUPPORT
- 磁化面
- 同步
- 量身定制
- 技术
- 承租人
- test
- 测试
- 这
- 那里。
- 因此
- 博曼
- Free Introduction
- 通过
- 至
- 一起
- 信任
- 类型
- 下
- 更新
- 更新
- 网址
- 使用
- 用例
- 用过的
- 用户
- 用户
- 运用
- 折扣值
- 价值观
- 各个
- 供应商
- 版本
- 等待
- we
- 卷筒纸
- Web服务
- ,尤其是
- 这
- 而
- 将
- 也完全不需要
- 工作坊
- 将
- 完全
- 您一站式解决方案
- 和风网
- 压缩