如果我说一个普通人每周至少发送/接收 10 张发票,我不会夸大其词。 随着数字化程度的不断提高,企业每天都在处理大量发票。 传统上,发票处理一直是一个耗时的手动过程,需要大量资源并且容易出错。
随着人工智能和自然语言处理的出现,发票处理现在可以自动化和简化,从而提高效率和准确性。 GPT 代表“Generative Pre-trained Transformer”,是指由 OpenAI. GPT 模型在大量文本数据上进行了预训练,然后可以针对特定任务进行微调,包括发票处理。
让我们以书店订单的发票处理为例,示例发票如下图所示。 此发票包含有关运输、账单、项目和价格的信息。 想象一下必须手动从数千张发票中收集数据! 幸运的是,我们拥有可以加快这一过程的人工智能工具。
在此博客中,我将引导您完成使用 GPT-4 和 Nanonets 处理发票的步骤。 喝杯咖啡,准备好!
第 1 步:创建一个 Nanonets 帐户并上传图像
第一步是从发票图像中提取文本数据。 OCR(光学字符识别)技术使用模式识别算法来识别图像或扫描文档上的字符并将其转换为文本。 基于云的人工智能 (AI) 平台 Nanonets 为特定任务提供精选的 OCR 工具,包括发票 OCR。 你可以简单地注册 相关信息 并免费访问他们的发票 OCR 工具。
登录并单击发票 OCR 后,您可以找到“上传文件”选项。 Nanonets 非常人性化,允许您从超过 6 个应用程序上传文件。
我在这里上传了阿加莎书店的发票样本。 提取将在几分钟内完成,您将得到如图所示的废弃结果。 在这里,预训练的深度学习模型用于提取实体及其值。
Nanonets 识别的所有文本字段都由单独的框包围。 可以在右侧的“最终结果”选项卡中看到为这些字段提取的值。 这种由 Nanonets 完成的实体提取可以通过使用 GPT-4 得到增强。 Nanonets 还提供了添加或修改字段名称的选项,这增强了客户的定制和用户体验。
希望自动化您的手动 AP 流程? 预订 30 分钟的现场演示,了解 Nanonets 如何帮助您的团队实施端到端 AP自动化.
第 2 步:下载 OCR 文本数据
提取的OCR文本数据可以多种形式下载。 检查下面的 GIF 以查看将发票数据下载到 Excel 或 CSV 文件中的演示。 在 CSV 文件中,所有实体/数据字段名称都存储为列,它们的值在相应的行中。
我们从下载的 CSV 中复制并粘贴数据,并获取 OCR 生成的文本。 这是我从 Nanonets 的发票样本中下载的文本。
可以通过后续步骤使用 Chat GPT3 增强 OCR 生成的文本。
如果我们在 Nanonets 处理的文本之上使用 GPT4 模型,则可以升级实体提取以支持不同的查询。 您可以从以下位置注册一个 Open AI 帐户 相关信息 并访问大型语言模型。 设置帐户后,您将收到一个唯一的 API 密钥。 它用于安全措施,以验证和授权对 OpenAI 服务器的请求。 导入 OpenAI 包并设置 API 密钥值。
以清晰、结构化的方式设计提示是释放大型语言模型力量的秘诀。 为了提取数据字段或实体及其值,我们可以使用以下提示。
#定义你的提示
prompt_text= 这是书店订单发票的OCR生成文本” +ocr_generated_text” + “从提供的OCR文本中提取实体及其值作为键值对,并以key:value的格式输出”
一旦得到提示,就可以将其传递给 OpenAI 的任何预训练模型,并通过“ openai.Completion.create()”函数. 您可以选择几个参数以获得最佳输出。
GPT参数:
- 发动机: 此参数允许您选择特定的预训练大型语言模型 (LLM) 以用于生成文本。 它可以设置为预训练模型或自定义微调模型。 Text Davinci 是一个强大而高效的选择。
- 提示: 这是给予模型开始生成文本的初始文本提示。 在我们的例子中,我们之前定义的“prompt_text”变量。
- 最大令牌数: 表示模型可以为给定提示生成的最大标记数。 您可以通过它来控制生成的文本的长度。
- 温度: 用它来控制生成文本的随机性或创造性程度。 低温值会产生更保守和可预测的输出,而高温值会产生更有创意和多样化的输出。 温度值范围从 0 到 1,1 表示最具创意。
现在您已经熟悉 GPT 参数,让我们编写代码以通过将提示文本与其他参数一起传递来生成输出。
我们得到的输出为:
只需几步即可快速提取实体及其值!
第 4 步:改进数据校正
在任何企业流通的数千张发票中,客户数据的不一致和小错误是不可避免的。 例如,一些客户可能提供了无效的电子邮件格式或联系电话,或者日期可能采用不同的格式。 借助 Nanonets 和 GPT-4,您可以轻松识别这些问题并执行数据更正。 我们可以实施基于规则的验证,以验证正确性和格式,并检查不一致之处。
我提示 GPT 为我们执行日期和电子邮件验证。
prompt_text= “在上面提取的实体数据中,验证日期(DD/MM/YYYY)和电子邮件的格式是否正确?”
LLM 提供了使用正则表达式检查格式的 Python 代码,如下图所示。 在正则表达式中,我们搜索特定模式并匹配它。 提取的实体存储在字典中,并单独定义函数以验证发票的电子邮件和日期。
定义后,可以将任何日期(例如(“发票日期”)、卖家或买家电子邮件 ID 传递给这些函数以获得结果。
GPT 还可以帮助您以快速方便的方式对数据进行更正和更改。 请注意,在我们的发票中,日期是“02/05/2023”。 我给出以下提示将日期转换为“MM/DD/YY”格式。
prompt=” 将提取的实体中的数据格式更改为“MM/DD/YY”。 只保留年份的最后 2 位数字”
在输出中,数据已根据需要进行了更正。 我们可以给出类似的提示来检查联系电话是否有 10 位数字,地址是否采用所需的格式,并检查是否有缺失的数据值。
设置非接触式 AP 工作流程和 简化应付账款流程 片刻之间。 立即预订 30 分钟的现场演示。
第 5 步:检查数据问题
使用 GPT-4 可以轻松识别数据中的任何不一致。 在我们的示例中,您可以检查到期总金额是否与单个项目价格的总和不匹配。 让我们为它提供一个提示。
prompt=”检查发票中的总余额是否与发票中的数量和项目价格一致”
GPT-4 在 Python 中输出一个函数,通过将数量和单个商品价格相乘来计算所有订单的价格总和。 如果总余额与发票上的金额不一致,则会标记并调查特定发票。 这可以帮助企业避免任何错误、差异并验证其财务数据。
如果您有大量发票,您还可以检查多张发票的一致性。 例如,您可以比较多张发票中的买卖双方信息,以确定任何差异或异常情况。
第 6 步:使用 GPT 查询
提取实体后,GPT 也可用于从整个信息中获取特定查询的答案。 例如,如果您想知道有关特定发票编号的运输详细信息,该怎么办?
让我们为它做一个提示:
#定义你的提示
prompt_text=“从实体键值对中提取有关发货的详细信息”
为此提示生成的完成是:
>> 当然! 根据提供的 OCR 数据,我们可以提取发货信息和账单信息为两组,如下所示:
航运信息:
“invoice_number”:“3522”
收货人姓名:Gayathri Natarajan
发货地址:600053 No.22B , Chetpet , Chennai , Tamil Nadu , 印度:Tanaya Pakahale
也可以执行类似的查询以获取卖家详细信息。 以下是从提供的数据中提取的卖家信息:
- 卖家名称:AGATHA BOOK HOUSE
- 卖家地址:No.13 , 2nd avenue , Indiranagar, Bangalore , Karnataka , India , 721302
- 卖家电话:6783456723
在处理多个文档时,我们还可以搜索和筛选总余额超过 5000 卢比的发票,以分析批量订单。 由于 GPT 具有将过去的提示保留在内存中的能力,因此它提供了最佳的易用性。
希望自动化您的手动 AP 流程? 预订 30 分钟的现场演示,了解 Nanonets 如何帮助您的团队实施端到端 AP自动化.
为什么选择 Nanonets + Chat GPT 进行发票处理?
- GPT 可以分析发票上的文本并准确识别和提取相关实体,即使它们以不同格式书写或拼写或措辞有差异。 这有助于减少错误并提高准确性
- 自动化 并扩大企业的数据管道
- 处理大量发票的最有效方法。 显着减少数据输入和处理所需的时间。
- 这些工具提供了灵活性和适应性。 这些工具可以 易于集成 到现有系统中,并且可以定制以满足特定的业务需求
- Nanonets 的发票 OCR 解决方案的优势之一是它能够 从错误中吸取教训。 随着时间的推移,该系统使用机器学习来提高其准确性,使其在处理每张新发票时更加精确。 该平台还允许用户手动查看和更正任何错误,确保提取的数据准确可靠。
虽然有很多优点,但我们也需要了解这种方法的局限性。 在图像/PDF 质量低的情况下,准确性很差。 基于人工智能的工具也会受到训练数据中固有的偏差或错误的影响。
总体而言,利用 GPT 在发票处理中提取实体可以帮助企业简化运营、减少人工工作并提高准确性,从而实现更好的财务管理和决策。
设置非接触式 AP 工作流程和 简化应付账款流程 片刻之间。 立即预订 30 分钟的现场演示。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- EVM财务。 去中心化金融的统一接口。 访问这里。
- 量子传媒集团。 IR/PR 放大。 访问这里。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- Sumber: https://nanonets.com/blog/improving-invoice-processing-accuracy-nanonets-chat-gpt-4/
- :具有
- :是
- :不是
- :在哪里
- $UP
- 1
- 10
- 13
- 5000
- 7
- 72
- a
- 对,能力--
- 关于
- ACCESS
- 账号管理
- 账户
- 应付账款
- 精准的
- 准确
- 横过
- 加
- 地址
- 优点
- 来临
- AI
- 算法
- 所有类型
- 允许
- 沿
- 还
- 量
- 量
- an
- 分析
- 和
- 答案
- 任何
- API
- 应用
- 保健
- 人造的
- 人工智能
- 人工智能(AI)
- AS
- At
- 认证
- 授权
- 自动化
- 自动化
- 大街XNUMX号
- 避免
- 当前余额
- 基于
- BE
- 很
- 作为
- 如下。
- 最佳
- 更好
- 偏见
- 计费
- 博客
- 书
- 箱
- 商业
- 企业
- 买方..
- by
- CAN
- 案件
- 更改
- 更改
- 字符
- 字符识别
- 字符
- ChatGPT
- 查
- 奈
- 选择
- 清除
- 点击
- 码
- 咖啡
- 收集
- 列
- COM的
- 比较
- 完成
- 完成
- 保守的
- 一贯
- CONTACT
- 控制
- 便捷
- 兑换
- 正确
- 更正
- 矫正
- 相应
- 可以
- 创建信息图
- 创意奖学金
- 创造力
- 杯
- 策划
- 习俗
- 顾客
- 客户数据
- 合作伙伴
- 定制
- 定制
- data
- 数据录入
- 日期
- 重要日期
- 天
- 处理
- 决策
- 深
- 深入学习
- 定义
- 定义
- 学位
- 演示
- 期望
- 详情
- 发达
- 不同
- 数字化
- 数字
- 文件
- 不
- 完成
- 下载
- 两
- 每
- 此前
- 缓解
- 使用方便
- 容易
- 效率
- 高效
- 邮箱地址
- 端至端
- 增强
- 增强
- 保证
- 整个
- 实体
- 实体
- 条目
- 故障
- 甚至
- 所有的
- 每天
- 例子
- Excel
- 现有
- 体验
- 表达
- 表达式
- 提取
- 熟悉
- 家庭
- 高效率
- 少数
- 部分
- 字段
- 文件
- 档
- 过滤
- 金融
- 财务数据
- 找到最适合您的地方
- (名字)
- 适合
- 已标记
- 高度灵活
- 如下
- 针对
- 格式
- 形式
- 自由的
- 止
- 功能
- 功能
- 婴儿车
- 生成
- 产生
- 发电
- 生成的
- 得到
- GIF
- 给
- 特定
- 抢
- 组的
- 成长
- 有
- 有
- 帮助
- 帮助
- 相关信息
- 创新中心
- HTTPS
- i
- 生病
- ID
- 确定
- 鉴定
- if
- 图片
- 图片
- 想像
- 实施
- 进口
- 改善
- 改善
- 改善
- in
- 包含
- 增加
- 印度
- 个人
- 信息
- 固有
- 初始
- 房源搜索
- 成
- 发票 ocr
- 发票处理
- 问题
- IT
- 项目
- 它的
- 只是
- 保持
- 键
- 知道
- 语言
- 大
- (姓氏)
- 领导
- 信息
- 学习用品
- 学习
- 最少
- 长度
- 让
- 借力
- 限制
- 生活
- LLM
- 日志
- 占地
- 低
- 机
- 机器学习
- 制成
- 使
- 制作
- 颠覆性技术
- 手册
- 体力劳动
- 手动
- 大规模
- 匹配
- 最多
- 可能..
- 措施
- 内存
- 方法
- 可能
- 未成年人
- 分钟
- 失踪
- 错误
- 模型
- 模型
- 修改
- 更多
- 最先进的
- 多
- 倍增
- 名称
- 自然
- 自然语言处理
- 需求
- 打印车票
- 需要
- 全新
- 下页
- 没有
- 现在
- 数
- 数字
- 获得
- 获得
- OCR
- OCR 解决方案
- ocr 工具
- of
- 优惠精选
- on
- 一旦
- 一
- 仅由
- 打开
- OpenAI
- 运营
- 光学字符识别
- 附加选项
- 附加选项
- or
- 秩序
- 订单
- 其他名称
- 我们的
- 产量
- 超过
- 包
- 对
- 参数
- 参数
- 特别
- 通过
- 通过
- 过去
- 模式
- 演出
- 执行
- 人
- 管道
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 贫困
- 功率
- 强大
- 精确的
- 可预见
- 车资
- 价格
- 过程
- 处理
- 过程
- 处理
- 产生
- 提供
- 提供
- 提供
- 蟒蛇
- 质量
- 数量
- 查询
- 很快
- 随机性
- 接收
- 承认
- 减少
- 减少
- 指
- 定期
- 相应
- 可靠
- 要求
- 资源
- 响应
- 导致
- 成果
- 保留
- 检讨
- 右
- s
- 说
- 鳞片
- 搜索
- 秒
- 秘密
- 保安
- 保安措施
- 看到
- 看到
- 卖家
- 分开
- 服务器
- 集
- 配送服务
- 商城
- 如图
- 签署
- 显著
- 显著
- 类似
- 只是
- 自
- 情况
- 方案,
- 一些
- 具体的
- 速度
- 看台
- 开始
- 步
- 步骤
- 商店
- 存储
- 精简
- 精简
- 结构化
- 主题
- 这样
- SUPPORT
- 系统
- 产品
- 采取
- 任务
- 团队
- 技术
- 比
- 这
- 信息
- 其
- 然后
- 那里。
- 博曼
- 他们
- Free Introduction
- 数千
- 通过
- 次
- 耗时的
- 至
- 令牌
- 也有
- 工具
- 工具
- 最佳
- 合计
- 非接触式
- 传统
- 产品培训
- 变压器
- 二
- 理解
- 独特
- 解锁
- 上传
- us
- 使用
- 用过的
- 用户
- 用户体验
- 用户友好
- 用户
- 使用
- 运用
- 验证
- 验证
- 折扣值
- 价值观
- 确认
- 非常
- 卷
- 想
- 是
- 方法..
- we
- 周
- 什么是
- ,尤其是
- 这
- 而
- 将
- 措辞
- 工作
- 工作流程
- 加工
- 将
- 写
- 书面
- 完全
- 您一站式解决方案
- 和风网