Automatización del procesamiento de facturas con OCR y Deep Learning PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

¿Quieres automatizar el procesamiento de facturas? Echa un vistazo a los preentrenados de Nanonets OCR de facturas or construye tu propio OCR de factura personalizado. Tú también puedes programa una demostración para obtener más información sobre nuestros casos de uso de AP!


Introducción

Durante mucho tiempo, hemos confiado en las facturas en papel para procesar los pagos y mantener las cuentas. La conciliación de facturas generalmente implica que alguien pase horas manualmente revisando varias facturas y anotando cosas en un libro mayor.

Pero, ¿se puede hacer este proceso mejor, de manera más eficiente, con menos desperdicio de papel, mano de obra y tiempo?

Entre los varios inconvenientes de pasar por estos procedimientos de forma manual se encuentran los costos más altos, un mayor requerimiento de mano de obra, una mayor cantidad de tiempo consumido en tareas repetitivas y una mayor huella de carbono.

El proceso de digitalización de una factura se puede dividir en 4 pasos:

  1. Conversión del documento físico en una variante digital: esto se puede hacer a través de
    • escaneo de facturas
    • hacer clic en una imagen a través de una cámara
  2. Extracción de información: esto se puede hacer
    • Humanos: hecho manualmente por revisores que analizarán la factura en busca de errores, leerán el texto y lo ingresarán en un software para su almacenamiento y recuperación futura.
    • Máquinas -
      • Reconocimiento óptico de caracteres: reconoce el texto y los números presentes en los documentos.
      • Extracción de información: una vez que se completa el proceso de OCR, es importante identificar qué fragmento de texto corresponde a qué campo extraído. Si un campo es el total, subtotal, fecha de factura, proveedor, etc.
  3. Volcado de datos: una vez que se ha extraído la información, debe almacenarse en un formato recuperable como
    • Una base de datos
    • Una hoja de Excel
    • Un sistema ERP.

Esta publicación se centrará principalmente en OCR y extracción de información. Antes de sumergirnos en lo que está mal con el estado actual de OCR y la extracción de información en procesamiento de factura, primero veamos por qué deberíamos preocuparnos por la digitalización de facturas en primer lugar.


Soportes de nanorred captura de facturas, gestión de facturas & automatización de facturas en más de 60 idiomas. ¡Construya su propio modelo o solicite una demostración hoy!


¿Por qué digitalizar facturas?

La digitalización de la información tiene varias ventajas que una empresa puede obtener por varios motivos. Las empresas pueden realizar un mejor seguimiento de sus procesos, pueden brindar un mejor servicio al cliente, mejorar la productividad de sus empleados y reducir los costos.

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Estas son algunas de las razones por las que debería considerar la posibilidad de digitalizar las facturas para su propio negocio.

  1. Automatizar procesos
    Con el aprendizaje profundo y el OCR, puede tomar automáticamente estas imágenes de facturas, extraer tablas y texto de ellas, extraer los valores de diferentes campos, hacer correcciones de errores, verificar si los productos coinciden con su inventario aprobado y finalmente procesar la reclamación si todo está bien. Este es un salto masivo de lo que la industria de seguros ha hecho tradicionalmente, pero puede resultar muy beneficioso de todos modos.
  2. Para aumentar la eficiencia
    Al digitalizar las facturas, varios procesos se pueden hacer mucho más rápidos y fluidos. Tomemos, por ejemplo, una cadena de tiendas minoristas que trata con algunos proveedores habituales de productos básicos y procesa los pagos al final de cada mes. Esta tienda puede ahorrar mucho tiempo al automatizar el proceso de gestión de facturas. Los proveedores solo tienen que cargar las facturas en una aplicación o sitio web y pueden obtener comentarios instantáneos sobre si las imágenes tienen una buena resolución, si la imagen es de la factura completa, si la imagen es falsa o fue manipulada digitalmente, etc. tiempo.
  3. Para reducir costos
    La franquicia de las mismas tiendas minoristas ahorra mucho dinero al automatizar la digitalización de facturas mediante OCR y aprendizaje profundo. Una factura que tiene que pasar por las manos de tres revisores para que no haya errores se reduce a uno. La cantidad de facturas procesadas por una computadora es varias veces más rápida de lo que podría hacer un humano. El tiempo incluye verificar si la factura es un fraude, si tiene toda la información, si toda la información es correcta, ingresar todos los datos manualmente en una hoja de cálculo o una base de datos, ejecutar cálculos y finalmente procesar el pago.
  4. Para un mejor almacenamiento
    En caso de disputas, el proveedor puede acceder a la aplicación y revisar todas las facturas que cargó y los resultados del posprocesamiento de cada factura, explicando los productos, sus cantidades, los costos de cada uno, los impuestos y los descuentos. La empresa, que ha automatizado el proceso de introducción de estos datos en una base de datos, ahora también puede recuperar esta información en cualquier momento.
  5. Para aumentar la satisfacción del cliente
    El procesamiento de facturas de manera similar también puede ayudar a las empresas a mejorar su servicio al cliente. ¿Su envío desde una plataforma de comercio electrónico le falta un producto? Comuníquese con ellos, envíeles la factura y explíqueles lo que falta y la empresa leerá automáticamente el recibo, encuentre lo que salió de sus almacenes y le envíe una respuesta diciendo que su producto faltante ya está en camino.
  6. Reducir la huella ecológica
    Haciendo algunos cálculos simples como los que se hacen esta página Nos damos cuenta de que una organización mediana que procesa 50000 facturas al mes termina sacrificando más de 30 árboles al año. Este número va a aumentar la mayoría de las veces debido a la duplicación de facturas. Este mismo volumen de papel también va a requerir 2.5 millones de litros de agua para su fabricación. En ese momento, tomar las medidas necesarias por parte de las organizaciones para reducir su huella ecológica puede ser de gran ayuda para el medio ambiente.

Evolución del proceso de facturación

El proceso de revisión de facturas ha evolucionado mucho con el tiempo. El crecimiento de la tecnología ha hecho que el proceso de procesamiento de facturas pase por tres fases principales.

Fase 1: Revisión manual

Considere un caso de uso en el que una organización está pasando por su proceso de reembolsar a sus proveedores habituales los gastos del mes.

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Se siguen los siguientes pasos para procesar facturas:

  1. Se espera que las personas presenten varias facturas en persona al punto de contacto de la organización en cuestión.
  2. Esta persona, a su vez, remitirá todas las facturas a un revisor que revisará todos los documentos en su totalidad. Esto incluye escribir o ingresar cada detalle en un software como el nombre de la persona que realiza la compra, el nombre de la tienda en la que se compró, la fecha y hora de la compra, los artículos comprados, sus costos, descuentos e impuestos.
  3. La suma total de cada factura calculada, nuevamente manualmente o si el software de entrada de datos está diseñado específicamente para fines contables, utilizando dicho software.
  4. Una factura final /recibo Se realiza con las cifras finales y se procesan los pagos.

Fase 2: Escaneo de facturas y revisión manual

Con la llegada de las técnicas de OCR, se ahorró mucho tiempo automáticamente extraer el texto de una imagen digital de cualquier factura o documento. Aquí es donde se encuentran actualmente la mayoría de las organizaciones que utilizan OCR para cualquier forma de automatización.

Automatización del procesamiento de facturas con OCR y aprendizaje profundo
  1. Las copias digitales de las facturas se obtienen mediante escaneo de facturas o tomar fotografías con una cámara.
  2. La se extrae el texto de estas facturas mediante OCR. Esto puede proporcionar texto digital que facilita un poco la entrada de datos. Pero aún queda mucho trabajo por hacer manualmente.
  3. Los resultados de OCR de cada factura deben analizarse adecuadamente para encontrar los datos relevantes y descartar los datos irrelevantes.
  4. Una vez hecho esto, los datos deben ingresarse en un software que proporciona al revisor una plantilla para facilitar su tarea. Esta plantilla es única para cada caso de uso, organización y, sobre todo, para cada tipo de factura diferente. Si bien el proceso de OCR ayuda al procesamiento de facturas, no resuelve muchas partes tediosas debido a los resultados no estructurados de OCR.
  5. Los datos ingresados ​​se someten a revisión manual para corregir errores. Este proceso lleva algún tiempo, ya que pasa por varios revisores debido al bajo rendimiento de las herramientas de OCR disponibles actualmente.
  6. Finalmente, se realizan los cálculos y los detalles del pago se envían a la división financiera.

¿Cómo digitalizar mejor las facturas?

Mediante el uso de OCR y el aprendizaje profundo, hemos permitido que las máquinas funcionen tan bien y, en algunos casos, incluso mejor que los humanos.

La digitalización de facturas implica varios pasos moderados por humanos:

  1. Imágenes digitales de facturas tomadas y cargadas por el usuario.
  2. Imagen verificada para su posterior procesamiento: buena resolución, todos los datos visibles en la imagen, fechas verificadas, etc.
  3. Imágenes revisadas por fraude.
  4. El texto de estas imágenes se extrae y se pone en el formato correcto.
  5. Datos de texto ingresados ​​en tablas, hojas de cálculo, bases de datos, balances, etc.

Fase 3: Aprendizaje profundo y OCR

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Los enfoques de aprendizaje profundo han avanzado en el problema particular de leer el texto y extraer información estructurada y no estructurada de las imágenes. Al fusionar los métodos de aprendizaje profundo existentes con la tecnología de reconocimiento óptico de caracteres, las empresas y las personas han podido automatizar el proceso de digitalizar documentos y permitió procedimientos de entrada de datos manuales más fáciles, mejor registro y almacenamiento, menores errores y mejores tiempos de respuesta.

Varias herramientas están disponibles en el mercado y la comunidad de código abierto para tales tareas, todas con sus pros y sus contras. Algunos de ellos son Google Vision API, Amazon Rekognition y Microsoft Cognitive Services. Las herramientas de código abierto más utilizadas son Atención-OCR y Tesseract.

Todas estas herramientas se quedan cortas de la misma manera: mala precisión que requiere corrección manual de errores y la necesidad de motores basados ​​en reglas que sigan la extracción de texto para poder utilizar los datos de manera significativa. Hablaremos más sobre estos problemas y más en las próximas secciones.

¿Qué hace que el problema sea interesante?

La Paisaje de OCR consiste principalmente en motores basados ​​en reglas que se basan en gran medida en los resultados de OCR de posprocesamiento al hacer coincidir patrones o definir plantillas específicas en las que los resultados de OCR se ven obligados a encajar. Este enfoque ha tenido cierto éxito, pero requiere una capa de software construida sobre el Motores de OCR, que es una tarea que consume muchos recursos.

Un problema mayor con este enfoque basado en reglas es que esta capa adicional de software debe diseñarse nuevamente cada vez que se trata de una nueva plantilla de factura. Automatizar el proceso de creación de plantillas junto con OCR puede crear un impacto masivo para cualquiera que trabaje con facturas.

Y ese es solo el problema que tenemos en Nanonetas resuelto a resolver.

Un enfoque menos conocido de este problema incluye el uso del aprendizaje automático para aprender la estructura de un documento o una factura en sí, lo que nos permite trabajar con datos, localizar los campos que necesitamos extraer primero como si estuviéramos resolviendo un problema de detección de objetos (y no OCR) y luego sacar el texto. Esto se puede hacer modelando sus redes neuronales de manera que aprenda a identificar y extraer tablas, comprender las columnas y los campos presentes en ellas, qué columnas y campos se encuentran comúnmente en una factura independientemente del formato.

La ventaja de este enfoque es que es posible crear un modelo de aprendizaje automático que se puede generalizar a cualquier tipo de documento o factura y se puede utilizar de forma inmediata sin ninguna personalización. Agregar un ciclo de aprendizaje continuo mediante la recopilación de nuevos datos y el reentrenamiento de modelos periódicamente puede conducir a un gran rendimiento en una gran variedad de datos.


¿Tiene un problema de OCR en mente? ¿Quiere digitalizar facturas, PDF o placas de matrícula? Dirigirse a Nanonetas y crea modelos OCR gratis!


¿Por qué las herramientas actuales de aprendizaje profundo no son suficientes?

Incluso con todos los beneficios procesamiento automatizado de facturas tiene para ofrecer, las industrias no han visto una adopción generalizada de OCR y tecnologías de aprendizaje profundo y hay varias razones para ello.

Tratemos de entender con un ejemplo: una compañía de seguros de salud que se ocupa de recetas y facturas. Automatizar el procesamiento de reclamos en su compañía de seguros al permitir que los usuarios carguen imágenes de facturas tomando fotografías en sus teléfonos o computadoras o escaneo de facturas aumentará la comodidad para los clientes y los atraerá más. Estas imágenes cargadas generalmente pasan por varias rondas de revisión manual donde verifica si las facturas son legítimas si los números se suman, si los productos mencionados en el recibos son válidos para un reclamo de seguro, etc. Pero con la automatización del procesamiento de facturas, estas tareas se pueden realizar en una fracción del tiempo que se tarda en hacerlo manualmente y con una reducción de al menos un 50% en la mano de obra requerida.

Pero existen obstáculos para construir un enfoque de extremo a extremo que funcione según un caso de uso de la industria, que pueda impulsar la automatización al tiempo que se asegura de que los errores no consuman gran parte del presupuesto y también impulsa tasas más altas de incorporación de clientes.

Precisión de la tecnología OCR

Actualmente, las mejores herramientas de OCR disponibles en el mercado no funcionan satisfactoriamente para aplicar estas API a escala para cualquier caso de uso. De acuerdo a esto artículo, Visión de Google, El mejor API de OCR disponible en este momento solo puede proporcionar una precisión del 80%. Las precisiones de otros productos del mercado como Reconocimiento de amazonas y Microsoft Cognitive Services son pésimos. Microsoft se desempeñó con una precisión del 65%, mientras que el reconocimiento de AWS solo se realizó con una precisión del 21%.

Automatización del procesamiento de facturas con OCR y aprendizaje profundo
fuente

Esto se ve agravado por el hecho de que estas API no permiten el entrenamiento personalizado para datos específicos que la empresa usaría con mayor frecuencia. Invertir en software que funciona peor que los humanos en términos de precisión, todavía necesita entrada manual, corrección manual de errores y revisión manual parece una pérdida de tiempo y dinero.

Experiencia en aprendizaje profundo

Los productos de OCR como Google Vision enfrentan varios inconvenientes cuando tienen que lidiar con texto en diferentes orientaciones, diferentes idiomas, texto oscuro o ruidoso. No le permiten utilizar sus datos y crear modelos personalizados, lo que dificulta la integración directa del producto en el flujo de trabajo de una organización. Muchas veces, para solucionar un problema como este, las organizaciones tienen que contratar un equipo de ciencia de datos o aprendizaje automático y crear estas herramientas por sí mismas. Esto requiere tiempo, dinero y esfuerzo.

Después de esto, los científicos de datos deben alinear su conocimiento y experiencia con los objetivos de la empresa y averiguar exactamente qué métricas optimizar para obtener esos resultados. Esto requiere que el científico de datos comprenda una propuesta comercial, la convierta en un problema matemático, comprenda los SLA de la empresa, encuentre los datos correctos, cree modelos de aprendizaje automático, los ajuste para obtener la precisión requerida mientras se asegura de que los casos de error también se manejen con elegancia. .

Obteniendo los datos correctos

Una parte muy importante de la construcción del modelo de aprendizaje automático correcto es encontrar los datos correctos, y simplemente no hay suficientes datos con los que trabajar. Hay conjuntos de datos disponibles para OCR para tareas como el reconocimiento de matrículas o el reconocimiento de escritura a mano, pero estos conjuntos de datos apenas son suficientes para obtener el tipo de precisión que requeriría un procesamiento de reclamos de seguros o una asignación de reembolso de un proveedor.

Estos casos de uso requieren que construyamos nuestros modelos y los capacitemos en el tipo de datos con los que vamos a tratar más a la vez que nos aseguramos de que los errores se minimicen y el conjunto de datos esté equilibrado. Tratar, digamos, recetas de médicos o recibos de los pequeños proveedores requieren que nuestros modelos funcionen bien en documentos de texto digitales y manuscritos.

Recursos computacionales

La tarea de crear una solución de aprendizaje automático interna implica más que simplemente contratar a los mejores ingenieros de aprendizaje automático para diseñar los algoritmos con la mayor precisión. Los requisitos computacionales para crear modelos a partir de datos de imágenes son altos y, por lo general, incluyen GPU en las instalaciones o en la nube. Ejecutar una instancia de GPU K-80 en Google Cloud Platform cuesta alrededor de $ 230 al mes. Estos costos aumentan cuando tiene que entrenar modelos o volver a entrenar modelos antiguos con nuevos datos.

Si el enfoque que elige es construir una solución interna, los costos de construirla deben compensarse con una mayor cantidad de clientes que se registren, una mayor tasa de procesamiento de facturas y una disminución en la cantidad de revisores manuales requeridos.

Adaptación de soluciones a las necesidades de su negocio

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

La construcción de un sistema de pago a proveedores, por ejemplo, requiere que incluyamos varios pasos. Encontrar un flujo de trabajo para las necesidades de su organización no es lo mismo que crear un modelo de aprendizaje automático que le brindará una buena precisión.

Lo que necesita son modelos que puedan:

  1. Entregue al menos precisión a nivel humano
  2. Puede manejar todo tipo de datos
  3. Acomodar el manejo de errores
  4. Incrementar la conveniencia de la supervisión humana.
  5. Brindar transparencia en los pasos del procesamiento de datos.
  6. Compruebe si hay fraude
  7. Permita que los resultados de OCR de posprocesamiento los coloquen en una estructura
  8. Permita asegurarse de que todos los campos obligatorios estén allí y que los valores sean correctos
  9. Permitir el almacenamiento y la base de datos fáciles de estos datos
  10. Permitir automatizar los procedimientos de notificación en función de los resultados

Este es, como habrás adivinado, un procedimiento largo y difícil, a menudo con soluciones no tan sencillas.


Soportes de nanorred captura de facturas & automatización de facturas en más de 60 idiomas. ¡Construya su propio modelo o solicite una demostración hoy!


Introduzca nanonetas

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Con Nanonetas no tiene que preocuparse por encontrar talento para el aprendizaje automático, construir modelos, comprender la infraestructura o implementación en la nube. Todo lo que necesita es un problema comercial para el que necesita soluciones.

GUI fácil de usar basada en la web

Nanonets ofrece una GUI fácil de usar basada en la web que se comunica con su API y le permite crear modelos, entrenarlos en sus datos, obtener métricas importantes como precisión y exactitud y ejecutar inferencias en sus imágenes, todo sin escribir ningún código.

Modelos alojados en la nube

Además de proporcionar varios modelos que se pueden usar directamente para obtener soluciones, los usuarios pueden crear sus modelos alojados en la nube y a los que se puede acceder con una solicitud de API para fines de inferencia. No necesita preocuparse por obtener una instancia de GCP o GPU para capacitación.

Algoritmos de última generación.

Los modelos construidos utilizan algoritmos de vanguardia para obtener los mejores resultados. Estos modelos evolucionan constantemente para mejorar con más y mejores datos y mejor tecnología, mejor diseño de arquitectura y configuraciones de hiperparámetros más robustas.

Extracción de campo

El mayor desafío en la construcción de un producto de digitalización de facturas es dar estructura al texto extraído. Esto es más fácil gracias a nuestra API de OCR que extrae automáticamente todos los campos necesarios con los valores y los coloca en una tabla o en un formato JSON para que pueda acceder y construir fácilmente.

Automatización conducida

En Nanonets creemos que automatizar procesos como la digitalización de facturas puede crear un impacto masivo en su organización en términos de beneficios monetarios, satisfacción del cliente y satisfacción de los empleados. Nanonets se esfuerza por hacer que el aprendizaje automático sea omnipresente y, con ese fin, nuestro objetivo sigue siendo resolver cualquier problema comercial que haya resuelto de una manera que requiera una supervisión y presupuestos humanos mínimos en el futuro.

OCR con nanonetas

La Plataforma Nanorred le permite construir modelos de OCR con facilidad. Puede cargar sus datos, anotarlos, configurar el modelo para entrenar y esperar a obtener predicciones a través de una interfaz de usuario basada en navegador sin escribir una sola línea de código, preocuparse por las GPU o encontrar las arquitecturas adecuadas para sus modelos de aprendizaje profundo.

Actualización: nuestros modelos son aún más precisos. Hemos agregado nuevos campos como número de orden de compra, ID de correo electrónico y extracción de tablas para mejorar aún más su automatización de facturas flujos de trabajo.

Empiece a digitalizar facturas con nanorred - Digitalización con 1 clic:

Automatización del procesamiento de facturas con OCR y aprendizaje profundo

Configurar una demostración

Configure una demostración para conocer cómo Nanonets puede ayudarlo a resolver este problema


‌‌

OTRAS LECTURAS

Actualizar:
‌ Se agregó más material de lectura sobre diferentes enfoques para automatizar el procesamiento de facturas mediante OCR y Deep Learning.

Sello de tiempo:

Mas de IA y aprendizaje automático