亚马逊Textract 是一种机器学习 (ML) 服务,可自动从任何文档或图像中提取文本、手写内容和数据。 AnalyzeDocument Signatures 是 Amazon Textract 中的一项功能,可以自动检测任何文档上的签名。 这可以减少对人工审查、自定义代码或 ML 体验的需求。
在本文中,我们将讨论 AnalyzeDocument Signatures 功能的优势以及 AnalyzeDocument Signatures API 如何帮助检测文档中的签名。 我们还介绍了如何通过 Amazon Textract 控制台使用该功能,并提供代码示例以使用 API 并使用 Amazon Textract 响应解析器库处理响应。 最后,我们分享一些使用此功能的最佳实践。
签名功能的好处
我们来自保险、抵押贷款、法律和税务行业的客户面临着处理大量纸质文件的挑战,同时还要遵守需要在文件中签名的监管和合规要求。 在开始处理申请之前,您可能需要确保最终客户提交的特定表格(例如贷款申请或索赔)包含签名。 对于某些文档处理工作流程,您可能需要进一步提取和比较签名以进行验证。
从历史上看,客户通常将文档发送给人工审阅者以检测签名。 使用人工审阅者检测签名往往需要大量时间和资源。 它还可能导致文档处理工作流程效率低下,从而导致周转时间延长和最终用户体验不佳。
AnalyzeDocument Signatures 功能允许您自动检测文档上的手写签名、电子签名和首字母缩写。 这可以帮助您构建自动化的可扩展解决方案,减少对昂贵且耗时的手动处理的依赖。 您不仅可以使用此功能来验证文档是否已签名,还可以使用检测到的签名的位置详细信息来验证表单中的特定字段是否已签名。 您还可以使用位置信息来编辑文档中的个人身份信息 (PII)。
AnalyzeDocument Signatures 如何检测文档中的签名
AnalyzeDocument API 有四种功能类型:表单、表格、查询和签名。 当 Amazon Textract 处理文档时,结果以数组的形式返回 阻止 对象。 签名功能可以单独使用,也可以与其他功能类型结合使用。 当单独使用时,签名功能类型提供一个 JSON 响应,其中包括检测到的签名和文档中的原始文本(单词和行)的位置和置信度分数。 签名功能与其他功能类型(例如表单和表格)相结合可以帮助得出有用的见解。 在该功能与表单和表格一起使用的情况下,响应会将签名显示为键值对或表格单元格的一部分。 例如,以下表单的响应包含键为 贷款人签署 和值作为 Block
目的。
如何使用 Amazon Textract 控制台上的签名功能
在我们开始使用 API 和代码示例之前,让我们回顾一下 Amazon Textract 控制台。 将文档上传到 Amazon Textract 控制台后,选择 签名检测 ,在 配置文件 部分并选择 套用设定.
以下屏幕截图显示了工资单的示例 签名 Amazon Textract 控制台上分析文档 API 的选项卡。
该功能检测并显示签名及其相应的页面和置信度分数。
代码示例
您可以使用签名功能来检测不同类型文件上的签名,例如支票、贷款申请表、索赔表、工资单、抵押文件、银行对账单、租赁协议和合同。 在本节中,我们将讨论其中一些文档,并展示如何调用带有 Signatures 参数的 AnalyzeDocument API 来检测签名。
输入文档可以是字节数组格式,也可以位于 亚马逊简单存储服务 (亚马逊 S3)桶。 对于字节数组格式的文档,您可以使用以下方法将图像字节提交给 Amazon Textract API 操作 bytes
财产。 签名作为一种特征类型由用于同步文档处理的 AnalyzeDocument API 和用于异步处理文档的 StartDocumentAnalysis 支持。
在以下示例中,我们检测就业证明信上的签名。
我们使用以下示例 Python 代码:
让我们分析一下从 AnalyzeDocument API 获得的响应。 以下响应已被修剪为仅显示相关部分。 响应有一个 BlockType
of SIGNATURE
显示置信度得分、块 ID 和边界框详细信息:
我们使用以下代码以表格格式打印 ID 和位置:
以下屏幕截图显示了我们的结果。
更多详细信息和完整代码可在 notebook 上找到 GitHub回购.
对于具有键值格式清晰签名的文档,我们可以使用 Textract 响应解析器 通过搜索键和这些键的对应值来仅提取签名字段:
上述代码返回以下结果:
请注意,为了以这种方式转录签名,签名必须清晰可辨。
使用签名功能的最佳实践
使用此功能时请考虑以下最佳做法:
- 对于实时响应,请使用 AnalyzeDocument API 的同步操作。 对于不需要实时响应的用例,例如批处理,我们建议使用 API 的异步操作。
- 当页面上最多有三个签名时,签名功能效果最佳。 当一个页面上有三个以上的签名时,最好将页面拆分为多个部分并将每个部分分别提供给 API。
- 当分数不符合您要求的阈值时,使用与检测到的签名一起提供的置信度分数来路由文档以供人工审核。 置信度分数不是准确性的度量,而是模型对其预测的置信度的估计。 您应该选择对您的用例最有意义的置信度分数。
总结
在这篇博文中,我们概述了 Amazon Textract 的签名功能,该功能可自动检测文档(如工资单、租赁协议和合同)上的签名。 AnalyzeDocument Signatures 减少了对人工审阅者的需求,并帮助您降低成本、节省时间并构建可扩展的文档处理解决方案。
首先,请登录 Amazon Textract 控制台试用该功能。 要了解有关 Amazon Textract 功能的更多信息,请参阅 亚马逊Textract是, Amazon Textract开发人员指南或 文本资源.
作者简介
马兰钱德拉塞卡兰 是 Amazon Web Services 的高级解决方案架构师,与我们的企业客户合作。 工作之余,他喜欢在得克萨斯州丘陵地区旅行和骑摩托车。
史宾迈克尔拉吉 是 AWS Textract 团队的高级产品经理。 他专注于为 AWS 客户构建基于 AI/ML 的产品。
苏普拉卡什·杜塔 是 Amazon Web Services 的高级解决方案架构师。 他专注于数字化转型战略、应用程序现代化和迁移、数据分析和机器学习。 他是 AWS AI/ML 社区的一员,负责设计智能文档处理解决方案。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图区块链。 Web3 元宇宙智能。 知识放大。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/detect-signatures-on-documents-or-images-using-the-signatures-feature-in-amazon-textract/
- 100
- 7
- a
- 对,能力--
- 关于
- 后
- 协议
- AI / ML
- 允许
- Amazon
- 亚马逊Textract
- 亚马逊网络服务
- 量
- 分析
- 分析
- 和
- API
- 应用领域
- 应用领域
- 排列
- 自动化
- 自动
- 可使用
- AWS
- 银行
- before
- 好处
- 最佳
- 最佳实践
- 阻止
- 吹氣梢
- 盒子
- 建立
- 建筑物
- 呼叫
- 能力
- 案件
- 例
- 一定
- 挑战
- 支票
- 索赔
- 客户
- 客户
- 码
- 组合
- 结合
- 社体的一部分
- 比较
- 完成
- 符合
- 信心
- 安慰
- 包含
- 合同的
- 相应
- 成本
- 国家
- 习俗
- 合作伙伴
- data
- 数据分析
- 设计
- 详情
- 检测
- 检测
- 开发商
- 不同
- 数字
- 数字化改造
- 讨论
- 文件
- 文件
- 别
- 每
- 或
- 电子
- 雇用
- 确保
- 企业
- 评估
- 例子
- 例子
- 体验
- 提取
- 提取物
- 面部彩妆
- 专栏
- 部分
- 字段
- 重点
- 重点
- 以下
- 申请
- 格式
- 形式
- 止
- 进一步
- 通常
- 得到
- Go
- 格
- 高度
- 帮助
- 帮助
- 创新中心
- How To
- HTML
- HTTPS
- 巨大
- 人
- ID
- 图片
- 图片
- 进口
- in
- 包括
- 行业
- 信息
- 输入
- 可行的洞见
- 保险
- 智能化
- 智能文档处理
- IT
- 本身
- JSON
- 键
- 键
- 铅
- 学习用品
- 学习
- 法律咨询
- 贷款人
- 邮件
- 自学资料库
- 线
- 贷款
- 本地
- 位于
- 圖書分館的位置
- 不再
- 机
- 机器学习
- 制作
- 经理
- 手册
- 衡量
- 满足
- 移民
- ML
- 更多
- 抵押
- 最先进的
- 摩托车
- 需求
- 笔记本
- 对象
- 对象
- 优惠精选
- 操作
- 秩序
- 其他名称
- 学校以外
- 简介
- 纸基
- 参数
- 部分
- 特别
- 部分
- 通过
- 亲自
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- Polygon
- 贫困
- 帖子
- 做法
- 预测
- 礼物
- 打印
- 过程
- 过程
- 处理
- 产品
- 产品经理
- 热销产品
- 财产
- 提供
- 提供
- 提供
- 蟒蛇
- 原
- 真实
- 实时的
- 减少
- 减少
- 监管
- 相应
- 信赖
- 要求
- 必须
- 岗位要求
- 资源
- 响应
- 导致
- 成果
- 回报
- 检讨
- 理查德
- 骑
- 路线
- 保存
- 可扩展性
- 搜索
- 搜索
- 部分
- 部分
- 前辈
- 感
- 服务
- 特色服务
- Share
- 应该
- 显示
- 作品
- 签名
- 签
- 显著
- 简易
- 方案,
- 解决方案
- 一些
- 具体的
- 分裂
- 开始
- 开始
- 声明
- 步
- 存储
- 策略
- 提交
- 提交
- 这样
- 支持
- 表
- 税
- 团队
- 德州
- 该座
- 三
- 门槛
- 通过
- 次
- 耗时的
- 时
- 至
- 最佳
- 转型
- 转型策略
- 旅行
- TRP
- 类型
- 使用
- 用例
- 验证
- 折扣值
- 企业验证
- 确认
- 卷
- 卷筒纸
- Web服务
- 是否
- 而
- 中
- 话
- 工作
- 工作流程
- 加工
- 合作
- X
- 完全
- 您一站式解决方案
- 和风网