推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。

推出用于 HTML 文档的 Amazon Kendra 表格搜索

亚马逊肯德拉 是一种由机器学习 (ML) 提供支持的智能搜索服务。 Kendra 为您的网站和应用程序重新构想企业搜索,以便您的员工和客户可以轻松找到他们正在寻找的内容,即使这些内容分散在您组织内的多个位置和内容存储库中。

Amazon Kendra 用户现在可以使用 Amazon Kendra 表格搜索从网页上的表格(HTML 表格)中快速找到他们需要的信息。 表格包含结构化格式的有用信息,因此可以通过在行标题和列标题之间建立视觉关联来轻松解释。 借助 Amazon Kendra 表格搜索,您现在可以从与查询相关的单元格或某些行和列中获取特定信息,以及表格预览。

在本文中,我们提供了一个如何使用 Amazon Kendra 表格搜索的示例。

Amazon Kendra 中的表格搜索

假设您有一个 HTML 格式的网页,其中包含一个表格,其中包含 2012 年至 2021 年美国的通货膨胀率和年度变化,如以下屏幕截图所示。

当您搜索“美国通货膨胀率”时,Amazon Kendra 会在预览中显示前三行和最多五列,如以下屏幕截图所示。 然后,您可以查看这篇文章是否包含您正在寻找的相关详细信息,并决定使用此信息或打开链接以获取更多详细信息。 Amazon Kendra 表格搜索还可以处理合并的行。

推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。

让我们再做一次搜索,通过询问“What was the annual change of inflation rate in 2017?”从表中获取具体信息。 如以下屏幕截图所示,Amazon Kendra 表格搜索突出显示包含问题答案的特定单元格。

推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。

现在让我们搜索“哪一年的通货膨胀率最高?”,Amazon Kendra 会搜索表格,对结果进行排序,然后为您提供通货膨胀率最高的年份。

推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。

Amazon Kendra 还可以找到您要查找的列信息的范围。 例如,让我们搜索“2012 年和 2014 年的通货膨胀率”。 Amazon Kendra 在预览中显示 2012 年至 2014 年之间的行和列。

推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。

开始使用 Amazon Kendra 表格搜索

Amazon Kendra 表格搜索默认开启,无需特殊配置即可启用。 对于较新的文档,Amazon Kendra 表格搜索将默认运行。 对于包含表格的现有 HTML 页面,您可以更新文档并同步(如果您只有几个文档),或者联系 AWS Support 。

要在您的内部或外部网页上测试表格搜索,请完成以下步骤:

  1. 创建 指数.
  2. 使用添加数据源 网络爬虫 或下载 HTML 页面并 上传 它到一个 亚马逊简单存储服务 (Amazon S3)存储桶。
  3. 搜索索引内容 选项卡并进行测试。

限制和注意事项

使用此功能时请记住以下几点:

  • 在此版本中,Amazon Kendra 仅支持 HTML 格式的表格或表格标签内的 HTML 表格。 这不包括嵌套表格或其他形式的表格。
  • Amazon Kendra 可以搜索最多 30 列和 60 行的表格,以及最多 500 个表格单元格。 如果您有一个包含更多行数、列数或表格单元格的表格,Amazon Kendra 将不会在该表格内进行搜索。
  • 如果列和行的查询结果的置信度分数非常低,Amazon Kendra 不会显示表格搜索结果。 您可以查看其中的置信度分数 分数属性 使用 QueryResultItem API。

结论

借助 Amazon Kendra 在 Amazon Kendra 中对 HTML 的表格搜索,您现在可以搜索来自各种数据源的非结构化数据和表格形式的结构化数据。 这进一步增强了用户体验,您可以从自然语言查询和表格中获得真实的响应。 带有 Kendra 建议答案的表格预览让您可以快速评估 HTML 文档表格是否包含您要查找的相关信息,从而节省时间。

Amazon Kendra 表格搜索在发布期间在以下 AWS 区域可用:美国东部(弗吉尼亚北部)、美国东部(俄亥俄)、美国西部(俄勒冈)、欧洲(爱尔兰)、亚太地区(悉尼)、亚太地区(新加坡) 、加拿大(中部)和 AWS GovCloud(美国西部)。

要了解有关 Amazon Kendra 的更多信息,请访问 亚马逊肯德拉产品页面.


关于作者

推出针对 HTML 文档 PlatoBlockchain 数据智能的 Amazon Kendra 表格搜索。 垂直搜索。 人工智能。维卡斯·沙阿 是 Amazon Web Services 的企业解决方案架构师。 他是一位技术爱好者,喜欢帮助客户找到应对复杂业务挑战的创新解决方案。 他感兴趣的领域是机器学习、物联网、机器人和存储。 在业余时间,Vikas 喜欢制造机器人、远足和旅行。

时间戳记:

更多来自 AWS机器学习