Procesamiento inteligente de documentos con servicios de IA de AWS en la industria de seguros: Parte 1

Reeditado por Platón

seguidores: 0

El objetivo del procesamiento inteligente de documentos (IDP) es ayudar a su organización a tomar decisiones más rápidas y precisas mediante la aplicación de IA para procesar su papeleo. Esta serie de dos partes destaca las tecnologías de IA de AWS que las compañías de seguros pueden usar para acelerar sus procesos comerciales. Estas tecnologías de IA se pueden usar en casos de uso de seguros, como reclamos, suscripción, correspondencia con clientes, contratos o manejo de resolución de disputas. Esta serie se centra en un caso de uso de procesamiento de reclamos en la industria de seguros; para obtener más información sobre los conceptos fundamentales de la solución IDP de AWS, consulte el siguiente serie de dos partes.

El procesamiento de reclamos consta de múltiples puntos de control en un flujo de trabajo que se requiere para revisar, verificar la autenticidad y determinar la responsabilidad financiera correcta para adjudicar un reclamo. Las compañías de seguros pasan por estos puntos de control para reclamos antes de la adjudicación de los reclamos. Si un reclamo pasa con éxito por todos estos puntos de control sin problemas, la compañía de seguros lo aprueba y procesa cualquier pago. Sin embargo, pueden requerir información de respaldo adicional para adjudicar un reclamo. Este proceso de procesamiento de reclamos suele ser manual, lo que lo hace costoso, propenso a errores y lento. Los clientes de seguros pueden automatizar este proceso utilizando los servicios de IA de AWS para automatizar la canalización de procesamiento de documentos para el procesamiento de reclamos.

En esta serie de dos partes, lo explicamos cómo puede automatizar y procesar documentos de manera inteligente a escala utilizando los servicios de IA de AWS para un caso de uso de procesamiento de reclamos de seguros.

Procesamiento inteligente de documentos con servicios de inteligencia artificial y análisis de AWS en la industria de seguros

Resumen de la solución

El siguiente diagrama representa cada etapa que normalmente vemos en una canalización de IDP. Recorremos cada una de estas etapas y cómo se conectan con los pasos involucrados en un proceso de solicitud de reclamos, desde que se envía una solicitud hasta que se investiga y se cierra. En esta publicación, cubrimos los detalles técnicos de las etapas de captura, clasificación y extracción de datos. En Parte 2, ampliamos la etapa de extracción de documentos y continuamos con el enriquecimiento, la revisión y la verificación de documentos, y ampliamos la solución para proporcionar análisis y visualizaciones para un caso de uso de fraude de reclamaciones.

El siguiente diagrama de arquitectura muestra los diferentes servicios de AWS utilizados durante las fases de la canalización de IDP según las diferentes etapas de una aplicación de procesamiento de reclamos.

Diagrama de arquitectura IDP

La solución utiliza los siguientes servicios clave:

Amazon Textil es un servicio de aprendizaje automático (ML) que extrae automáticamente texto, escritura a mano y datos de documentos escaneados. Va más allá del simple reconocimiento óptico de caracteres (OCR) para identificar, comprender y extraer datos de formularios y tablas. Amazon Textract utiliza ML para leer y procesar cualquier tipo de documento, extrayendo con precisión texto, escritura a mano, tablas y otros datos sin esfuerzo manual.
Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) que utiliza ML para extraer información del texto. Amazon Comprehend puede detectar entidades como persona, ubicación, fecha, cantidad y más. También puede detectar el idioma dominante, la información de identificación personal (PII) y clasificar los documentos en su clase correspondiente.
IA aumentada de Amazon (Amazon A2I) es un servicio de ML que facilita la creación de los flujos de trabajo necesarios para la revisión humana. Amazon A2I lleva la revisión humana a todos los desarrolladores, eliminando el trabajo pesado no diferenciado asociado con la creación de sistemas de revisión humana o la gestión de grandes cantidades de revisores humanos. Amazon A2I integra ambos con Amazon Textil y Amazon Comprehend para proporcionar la capacidad de introducir revisión o validación humana dentro del flujo de trabajo de IDP.

Requisitos previos

En las siguientes secciones, recorremos los diferentes servicios relacionados con las tres primeras fases de la arquitectura, es decir, las fases de captura, clasificación y extracción de datos.

Consulte nuestra Repositorio GitHub para muestras de código completo junto con las muestras de documentos en el paquete de procesamiento de reclamaciones.

Fase de captura de datos

Las reclamaciones y sus documentos de respaldo pueden llegar a través de varios canales, como fax, correo electrónico, un portal de administración y más. Puede almacenar estos documentos en un almacenamiento altamente escalable y duradero como Servicio de almacenamiento simple de Amazon (Amazon S3). Estos documentos pueden ser de varios tipos, como PDF, JPEG, PNG, TIFF y más. Los documentos pueden venir en varios formatos y diseños, y pueden provenir de diferentes canales al almacén de datos.

Fase de clasificación

En la etapa de clasificación de documentos, podemos combinar Amazon Comprehend con Amazon Textract para convertir texto en contexto de documento para clasificar los documentos que se almacenan en la etapa de captura de datos. Luego podemos usar la clasificación personalizada en Amazon Comprehend para organizar los documentos en clases que definimos en el paquete de procesamiento de reclamos. La clasificación personalizada también es útil para automatizar el proceso de verificación de documentos e identificar cualquier documento que falte en el paquete. Hay dos pasos en la clasificación personalizada, como se muestra en el diagrama de arquitectura:

Extraiga texto usando Amazon Textract de todos los documentos en el almacenamiento de datos para preparar datos de entrenamiento para el clasificador personalizado.
Entrene un modelo de clasificación personalizado de Amazon Comprehend (también llamado documento clasificador) para reconocer las clases de interés en función del contenido del texto.

Paquete de clasificación de documentos de siniestros de seguros

Después de entrenar el modelo de clasificación personalizado de Amazon Comprehend, podemos usar el punto de enlace en tiempo real para clasificar documentos. Amazon Comprehend devuelve todas las clases de documentos con una puntuación de confianza vinculada a cada clase en una matriz de pares clave-valor (Doc_name – Confidence_score). Recomendamos revisar el código de ejemplo de clasificación de documentos detallado en GitHub.

Fase de extracción

En la fase de extracción, extraemos datos de documentos utilizando Amazon Textract y Amazon Comprehend. Para esta publicación, use los siguientes documentos de muestra en el paquete de procesamiento de reclamos: un formulario de reclamo del Centro de Servicios de Medicaid y Medicare (CMS)-1500, licencia de conducir e identificación del seguro, y factura.

Extraer datos de un formulario de reclamo CMS-1500

El formulario CMS-1500 es el formulario de reclamación estándar utilizado por un proveedor o suplidor no institucional para facturar a los proveedores de Medicare.

Es importante procesar el formulario CMS-1500 con precisión, de lo contrario, puede ralentizar el proceso de reclamo o retrasar el pago por parte del transportista. Con el Amazon Textract AnalyzeDocument API, podemos acelerar el proceso de extracción con mayor precisión para extraer texto de los documentos para comprender más información dentro del formulario de reclamo. El siguiente es un documento de muestra de un formulario de reclamo CMS-1500.

Un formulario de reclamación CMS1500

Ahora usamos el AnalyzeDocument API para extraer dos FeatureTypes, FORMS y TABLES, del documento:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Los siguientes resultados se han abreviado para una mejor legibilidad. Para obtener información más detallada, consulte nuestro Repo de GitHub.

El FORMS la extracción se identifica como pares clave-valor.

El TABLES la extracción contiene celdas, celdas combinadas y encabezados de columna dentro de una tabla detectada en el formulario de reclamación.

Extracción de tablas desde formulario CMS1500

Extraer datos de documentos de identidad

Para documentos de identidad como una identificación de seguro, que puede tener diferentes diseños, podemos usar Amazon Textract AnalyzeDocument API. usamos el FeatureType FORMS como la configuración para el AnalyzeDocument API para extraer los pares clave-valor del ID del seguro (ver el siguiente ejemplo):

Ejecute el siguiente código:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Obtenemos los pares clave-valor en la matriz de resultados, como se muestra en la siguiente captura de pantalla.

Para documentos de identificación como una licencia de conducir de EE. UU. o un pasaporte de EE. UU., Amazon Textract brinda soporte especializado para extraer automáticamente términos clave sin necesidad de plantillas o formatos, a diferencia de lo que vimos anteriormente para el ejemplo de identificación de seguro. Con el AnalyzeID API, las empresas pueden extraer información de forma rápida y precisa de los documentos de identidad que tienen diferentes plantillas o formatos. los AnalyzeID La API devuelve dos categorías de tipos de datos:

Pares clave-valor disponibles en la identificación, como fecha de nacimiento, fecha de emisión, número de identificación, clase y restricciones
Campos implícitos en el documento que pueden no tener claves explícitas asociadas, como nombre, dirección y emisor

Usamos la siguiente licencia de conducir estadounidense de muestra de nuestro paquete de procesamiento de reclamos.

Ejecute el siguiente código:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

La siguiente captura de pantalla muestra nuestro resultado.

En la captura de pantalla de resultados, puede observar que se presentan ciertas claves que no estaban en la propia licencia de conducir. Por ejemplo, Veteran no es una clave que se encuentra en la licencia; sin embargo, es un valor-clave rellenado previamente que AnalyzeID soportes, debido a las diferencias encontradas en las licencias entre estados.

Extraer datos de facturas y recibos

Similar a la AnalyzeID API, la AnalyzeExpense La API brinda soporte especializado para facturas y recibos para extraer información relevante, como el nombre del proveedor, el subtotal y los montos totales, y más, de cualquier formato de documentos de factura. No necesita ninguna plantilla o configuración para la extracción. Amazon Textract utiliza ML para comprender el contexto de facturas ambiguas y recibos.

La siguiente es una factura de seguro médico de muestra.

Un ejemplo de factura de seguro.

Usamos la AnalyzeExpense API para ver una lista de campos estandarizados. Los campos que no se reconocen como campos estándar se clasifican como OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Obtenemos la siguiente lista de campos como pares clave-valor (ver captura de pantalla a la izquierda) y la fila completa de elementos de línea individuales comprados (ver captura de pantalla a la derecha) en los resultados.

Procesamiento inteligente de documentos con servicios de IA de AWS en la industria de seguros: Parte 1 Inteligencia de datos PlatoBlockchain. Búsqueda vertical. Ai.

Conclusión

En esta publicación, mostramos los desafíos comunes en el procesamiento de reclamos y cómo podemos usar los servicios de IA de AWS para automatizar una canalización inteligente de procesamiento de documentos para adjudicar automáticamente un reclamo. Vimos cómo clasificar documentos en varias clases de documentos mediante un clasificador personalizado de Amazon Comprehend y cómo usar Amazon Textract para extraer tipos de documentos no estructurados, semiestructurados, estructurados y especializados.

In Parte 2, ampliamos la fase de extracción con Amazon Textract. También usamos entidades predefinidas y entidades personalizadas de Amazon Comprehend para enriquecer los datos y mostrar cómo ampliar la canalización de IDP para integrarse con los servicios de análisis y visualización para un procesamiento posterior.

Recomendamos revisar las secciones de seguridad del extracto de amazon, Amazon comprende, y AmazonA2I documentación y siguiendo las pautas proporcionadas. Para obtener más información sobre el precio de la solución, revise los detalles de precios de extracto de amazon, Amazon Comprehendy AmazonA2I.

Acerca de los autores

Rane Chinmayee es un arquitecto de soluciones especializado en IA/ML en Amazon Web Services. Le apasionan las matemáticas aplicadas y el aprendizaje automático. Se enfoca en diseñar soluciones inteligentes de procesamiento de documentos para clientes de AWS. Fuera del trabajo, le gusta bailar salsa y bachata.

sonali sahu lidera el equipo de Arquitectos de Soluciones de AI/ML de Procesamiento Inteligente de Documentos en Amazon Web Services. Es una apasionada de la tecnología y disfruta trabajar con clientes para resolver problemas complejos utilizando la innovación. Su área principal de enfoque es la inteligencia artificial y el aprendizaje automático para el procesamiento inteligente de documentos.

Tim Condello es Arquitecto Senior de Soluciones Especializado en IA/ML en Amazon Web Services. Su enfoque es el procesamiento del lenguaje natural y la visión por computadora. A Tim le gusta tomar las ideas de los clientes y convertirlas en soluciones escalables.

Sello de tiempo: 3 de noviembre.4 de noviembre.

Sello de tiempo: Apr 3, 2024

Procesamiento inteligente de documentos con servicios de IA de AWS en la industria de seguros: Parte 1

Reeditado por Platón

Resumen de la solución

Requisitos previos

Fase de captura de datos

Fase de clasificación

Fase de extracción

Extraer datos de un formulario de reclamo CMS-1500

Extraer datos de documentos de identidad

Extraer datos de facturas y recibos

Conclusión

Acerca de los autores

Mas de Aprendizaje automático de AWS

Reinventar la experiencia de los datos: utilice la IA generativa y la arquitectura de datos moderna para desbloquear conocimientos | Servicios web de Amazon

“ID + Selfie”: mejora de la verificación de identidad digital mediante AWS

Amazon Rekognition presenta Streaming Video Events para proporcionar alertas en tiempo real sobre transmisiones de video en vivo

Presentamos Amazon CodeWhisperer, el compañero de codificación basado en ML

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta