Traitement intelligent des documents avec les services AWS AI dans le secteur de l'assurance : partie 1

Republié par Platon

Suiveurs: 0

L'objectif du traitement intelligent des documents (IDP) est d'aider votre organisation à prendre des décisions plus rapides et plus précises en appliquant l'IA pour traiter vos documents. Cette série en deux parties met en lumière les technologies AWS AI que les compagnies d'assurance peuvent utiliser pour accélérer leurs processus commerciaux. Ces technologies d'intelligence artificielle peuvent être utilisées dans des cas d'utilisation d'assurance tels que les réclamations, la souscription, la correspondance avec les clients, les contrats ou la gestion des résolutions de litiges. Cette série se concentre sur un cas d'utilisation du traitement des réclamations dans le secteur de l'assurance ; pour plus d'informations sur les concepts fondamentaux de la solution AWS IDP, reportez-vous aux série en deux parties.

Le traitement des réclamations consiste en plusieurs points de contrôle dans un flux de travail qui est nécessaire pour examiner, vérifier l'authenticité et déterminer la responsabilité financière correcte pour statuer sur une réclamation. Les compagnies d'assurance passent par ces points de contrôle pour les réclamations avant l'adjudication des réclamations. Si une réclamation passe avec succès tous ces points de contrôle sans problème, la compagnie d'assurance l'approuve et traite tout paiement. Cependant, ils peuvent avoir besoin d'informations supplémentaires pour statuer sur une réclamation. Ce processus de traitement des réclamations est souvent manuel, ce qui le rend coûteux, sujet aux erreurs et chronophage. Les clients de l'assurance peuvent automatiser ce processus à l'aide des services AWS AI pour automatiser le pipeline de traitement des documents pour le traitement des réclamations.

Dans cette série en deux parties, nous vous expliquons comment vous pouvez automatiser et traiter intelligemment des documents à grande échelle à l'aide des services AWS AI pour un cas d'utilisation de traitement des réclamations d'assurance.

Traitement intelligent des documents avec AWS AI et les services d'analyse dans le secteur de l'assurance

Vue d'ensemble de la solution

Le diagramme suivant représente chaque étape que nous voyons généralement dans un pipeline IDP. Nous passons en revue chacune de ces étapes et comment elles se connectent aux étapes impliquées dans un processus de demande de réclamation, à partir du moment où une demande est soumise, jusqu'à l'enquête et la fermeture de la demande. Dans cet article, nous couvrons les détails techniques des étapes de capture, de classification et d'extraction des données. Dans Partie 2, nous étendons l'étape d'extraction de documents et continuons à documenter l'enrichissement, l'examen et la vérification, et étendons la solution pour fournir des analyses et des visualisations pour un cas d'utilisation de fraude aux réclamations.

Le diagramme d'architecture suivant montre les différents services AWS utilisés pendant les phases du pipeline IDP selon les différentes étapes d'une application de traitement des réclamations.

Schéma d'architecture IDP

La solution utilise les services clés suivants :

Extrait d'Amazon est un service d'apprentissage automatique (ML) qui extrait automatiquement le texte, l'écriture manuscrite et les données des documents numérisés. Il va au-delà de la simple reconnaissance optique de caractères (OCR) pour identifier, comprendre et extraire des données à partir de formulaires et de tableaux. Amazon Textract utilise ML pour lire et traiter tout type de document, en extrayant avec précision du texte, de l'écriture manuscrite, des tableaux et d'autres données sans effort manuel.
Amazon comprendre est un service de traitement du langage naturel (NLP) qui utilise ML pour extraire des informations du texte. Amazon Comprehend peut détecter des entités telles qu'une personne, un lieu, une date, une quantité, etc. Il peut également détecter la langue dominante, les informations d'identification personnelle (PII) et classer les documents dans leur classe appropriée.
IA augmentée d'Amazon (Amazon A2I) est un service ML qui facilite la création des flux de travail nécessaires à l'examen humain. Amazon A2I apporte une révision humaine à tous les développeurs, en supprimant les charges lourdes indifférenciées associées à la construction de systèmes de révision humaine ou à la gestion d'un grand nombre de réviseurs humains. Amazon A2I intègre à la fois avec Extrait d'Amazon ainsi que Amazon comprendre pour fournir la possibilité d'introduire une révision ou une validation humaine dans le flux de travail IDP.

Pré-requis

Dans les sections suivantes, nous passons en revue les différents services liés aux trois premières phases de l'architecture, c'est-à-dire les phases de capture, de classification et d'extraction des données.

Reportez-vous à notre GitHub référentiel pour les échantillons de code complets avec les échantillons de documents dans le paquet de traitement des réclamations.

Phase de saisie des données

Les réclamations et leurs pièces justificatives peuvent passer par différents canaux, tels que le fax, le courrier électronique, un portail d'administration, etc. Vous pouvez stocker ces documents dans un stockage hautement évolutif et durable comme Service de stockage simple Amazon (Amazon S3). Ces documents peuvent être de différents types, tels que PDF, JPEG, PNG, TIFF, etc. Les documents peuvent se présenter sous différents formats et mises en page, et peuvent provenir de différents canaux vers le magasin de données.

Phase de classement

Dans l'étape de classification des documents, nous pouvons combiner Amazon Comprehend avec Amazon Textract pour convertir le texte en contexte de document afin de classer les documents qui sont stockés dans l'étape de capture de données. Nous pouvons ensuite utiliser la classification personnalisée dans Amazon Comprehend pour organiser les documents en classes que nous avons définies dans le paquet de traitement des réclamations. La classification personnalisée est également utile pour automatiser le processus de vérification des documents et identifier les documents manquants dans le paquet. La classification personnalisée comporte deux étapes, comme indiqué dans le diagramme d'architecture :

Extrayez du texte à l'aide d'Amazon Textract à partir de tous les documents du stockage de données afin de préparer les données de formation pour le classificateur personnalisé.
Entraînez un modèle de classification personnalisé Amazon Comprehend (également appelé document classificateur) pour reconnaître les classes d'intérêt en fonction du contenu du texte.

Classification des documents du paquet de réclamations d'assurance

Une fois le modèle de classification personnalisé Amazon Comprehend formé, nous pouvons utiliser le point de terminaison en temps réel pour classer les documents. Amazon Comprehend renvoie toutes les classes de documents avec un score de confiance lié à chaque classe dans un tableau de paires clé-valeur (Doc_name - Confidence_score). Nous vous recommandons de consulter l'exemple de code de classification détaillée des documents sur GitHub.

Phase d'extraction

Dans la phase d'extraction, nous extrayons les données des documents à l'aide d'Amazon Textract et d'Amazon Comprehend. Pour ce poste, utilisez les exemples de documents suivants dans le dossier de traitement des réclamations : un formulaire de réclamation Center of Medicaid and Medicare Services (CMS)-1500, un permis de conduire et une carte d'identité d'assurance, ainsi qu'une facture.

Extraire des données d'un formulaire de réclamation CMS-1500

Le formulaire CMS-1500 est le formulaire de réclamation standard utilisé par un fournisseur ou un fournisseur non institutionnel pour facturer les transporteurs Medicare.

Il est important de traiter le formulaire CMS-1500 avec précision, sinon cela peut ralentir le processus de réclamation ou retarder le paiement par le transporteur. Avec le texte d'Amazon AnalyzeDocument API, nous pouvons accélérer le processus d'extraction avec une plus grande précision pour extraire le texte des documents afin de comprendre davantage d'informations dans le formulaire de réclamation. Voici un exemple de document de formulaire de réclamation CMS-1500.

Un formulaire de réclamation CMS1500

Nous utilisons maintenant le AnalyzeDocument API pour extraire deux FeatureTypes, FORMS ainsi que TABLES, à partir du document :

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Les résultats suivants ont été raccourcis pour une meilleure lisibilité. Pour des informations plus détaillées, consultez notre Repo GitHub.

La FORMS l'extraction est identifiée comme des paires clé-valeur.

La TABLES l'extraction contient des cellules, des cellules fusionnées et des en-têtes de colonne dans un tableau détecté dans le formulaire de réclamation.

Extraction des tables du formulaire CMS1500

Extraire les données des documents d'identité

Pour les documents d'identité comme une carte d'identité d'assurance, qui peuvent avoir différentes mises en page, nous pouvons utiliser Amazon Textract AnalyzeDocument API. Nous utilisons le FeatureType FORMS comme configuration pour le AnalyzeDocument API pour extraire les paires clé-valeur de l'identifiant d'assurance (voir l'exemple suivant) :

Exécutez le code suivant :

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Nous obtenons les paires clé-valeur dans le tableau de résultats, comme illustré dans la capture d'écran suivante.

Pour les documents d'identité comme un permis de conduire américain ou un passeport américain, Amazon Textract fournit un support spécialisé pour extraire automatiquement les termes clés sans avoir besoin de modèles ou de formats, contrairement à ce que nous avons vu précédemment pour l'exemple d'identification d'assurance. Avec le AnalyzeID API, les entreprises peuvent extraire rapidement et avec précision des informations à partir de documents d'identité qui ont différents modèles ou formats. La AnalyzeID L'API renvoie deux catégories de types de données :

Paires clé-valeur disponibles sur l'ID telles que la date de naissance, la date d'émission, le numéro d'identification, la classe et les restrictions
Champs implicites du document qui peuvent ne pas être associés à des clés explicites, telles que le nom, l'adresse et l'émetteur

Nous utilisons l'exemple de permis de conduire américain suivant de notre dossier de traitement des réclamations.

Exécutez le code suivant :

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

La capture d'écran suivante montre notre résultat.

À partir de la capture d'écran des résultats, vous pouvez observer que certaines clés sont présentées qui ne figuraient pas dans le permis de conduire lui-même. Par exemple, Veteran n'est pas une clé présente dans la licence ; cependant, il s'agit d'une clé-valeur préremplie qui AnalyzeID prend en charge, en raison des différences constatées dans les licences entre les États.

Extraire les données des factures et reçus

Semblable à la AnalyzeID API, le AnalyzeExpense L'API fournit un support spécialisé pour les factures et les reçus afin d'extraire des informations pertinentes telles que le nom du fournisseur, les sous-totaux et les montants totaux, etc., à partir de n'importe quel format de documents de facturation. Vous n'avez besoin d'aucun modèle ou configuration pour l'extraction. Amazon Textract utilise ML pour comprendre le contexte des factures ambiguës ainsi que des reçus.

Voici un exemple de facture d'assurance médicale.

Un exemple de facture d'assurance

Nous utilisons les AnalyzeExpense API pour voir une liste de champs standardisés. Les champs qui ne sont pas reconnus comme champs standard sont classés comme OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Nous obtenons la liste suivante de champs sous forme de paires clé-valeur (voir capture d'écran à gauche) et la ligne entière d'éléments de ligne individuels achetés (voir capture d'écran à droite) dans les résultats.

Traitement intelligent des documents avec les services AWS AI dans le secteur de l'assurance : partie 1 PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Conclusion

Dans cet article, nous avons présenté les défis courants liés au traitement des réclamations et comment nous pouvons utiliser les services AWS AI pour automatiser un pipeline de traitement de documents intelligent afin de statuer automatiquement sur une réclamation. Nous avons vu comment classer des documents dans différentes classes de documents à l'aide d'un classificateur personnalisé Amazon Comprehend et comment utiliser Amazon Textract pour extraire des types de documents non structurés, semi-structurés, structurés et spécialisés.

In Partie 2, nous développons la phase d'extraction avec Amazon Textract. Nous utilisons également des entités prédéfinies et des entités personnalisées d'Amazon Comprehend pour enrichir les données et montrons comment étendre le pipeline IDP pour l'intégrer aux services d'analyse et de visualisation pour un traitement ultérieur.

Nous vous recommandons de consulter les sections sur la sécurité du Texte Amazone, Amazon comprendre, ainsi que Amazon A2I documentation et en suivant les directives fournies. Pour en savoir plus sur la tarification de la solution, consultez les détails de tarification de Texte Amazone, Amazon comprendreet Amazon A2I.

À propos des auteurs

Chinmayee Rane est architecte de solutions spécialisées en IA/ML chez Amazon Web Services. Elle est passionnée par les mathématiques appliquées et l'apprentissage automatique. Elle se concentre sur la conception de solutions intelligentes de traitement de documents pour les clients AWS. En dehors du travail, elle aime danser la salsa et la bachata.

Sonali Sahou dirige l'équipe d'architectes de solutions IA/ML pour le traitement intelligent des documents chez Amazon Web Services. Elle est une technophile passionnée et aime travailler avec les clients pour résoudre des problèmes complexes en utilisant l'innovation. Son principal domaine d'intérêt est l'intelligence artificielle et l'apprentissage automatique pour le traitement intelligent des documents.

Tim Condello est architecte principal de solutions spécialisées en IA/ML chez Amazon Web Services. Il se concentre sur le traitement du langage naturel et la vision par ordinateur. Tim aime prendre les idées des clients et les transformer en solutions évolutives.

Horodatage: 3 novembre 20224 novembre 2022

Horodatage: 2 mai 2023

Traitement intelligent des documents avec les services d'AWS AI dans le secteur de l'assurance : 1ère partie

Republié par Platon

Vue d'ensemble de la solution

Pré-requis

Phase de saisie des données

Phase de classement

Phase d'extraction

Extraire des données d'un formulaire de réclamation CMS-1500

Extraire les données des documents d'identité

Extraire les données des factures et reçus

Conclusion

À propos des auteurs

Plus de Apprentissage automatique AWS

Créez des ensembles de données prêts pour l'apprentissage automatique à partir du magasin de fonctionnalités hors ligne Amazon SageMaker à l'aide du kit SDK Python Amazon SageMaker | Services Web Amazon

Le parcours de l'assistant virtuel d'IA générative de PGA TOUR, du concept au développement jusqu'au prototype | Services Web Amazon

Mise en œuvre d'Amazon Forecast dans le secteur de la vente au détail : un parcours du POC à la production

Personnalisez vos recommandations en faisant la promotion d'articles spécifiques à l'aide de règles commerciales avec Amazon Personalize

Présentation du programme de modèles personnalisés du AWS Generative AI Innovation Center pour Anthropic Claude | Services Web Amazon

Accélérez les flux de travail multilingues avec une solution de traduction personnalisable conçue avec Amazon Translate

Modèles d'hébergement de modèles dans SageMaker : meilleures pratiques pour tester et mettre à jour des modèles sur SageMaker

Amazon SageMaker avec TensorBoard : aperçu d'une expérience TensorBoard hébergée

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte