Intelligente Dokumentenverarbeitung mit AWS AI Services in der Versicherungsbranche: Teil 1

Neuauflage von Plato

Verfolger: 0

Das Ziel der intelligenten Dokumentenverarbeitung (IDP) besteht darin, Ihrem Unternehmen zu helfen, schnellere und genauere Entscheidungen zu treffen, indem KI zur Verarbeitung Ihrer Unterlagen eingesetzt wird. Diese zweiteilige Serie beleuchtet die AWS-KI-Technologien, mit denen Versicherungsunternehmen ihre Geschäftsprozesse beschleunigen können. Diese KI-Technologien können in allen Anwendungsfällen von Versicherungen eingesetzt werden, z. B. bei Schadensfällen, Underwriting, Kundenkorrespondenz, Verträgen oder der Bearbeitung von Streitbeilegungen. Diese Reihe konzentriert sich auf einen Anwendungsfall der Schadensabwicklung in der Versicherungsbranche; Weitere Informationen zu den grundlegenden Konzepten der AWS IDP-Lösung finden Sie im Folgenden zweiteilige Serie.

Die Bearbeitung von Ansprüchen besteht aus mehreren Kontrollpunkten in einem Arbeitsablauf, der erforderlich ist, um die Authentizität zu prüfen und zu bestimmen und die korrekte finanzielle Verantwortung für die Entscheidung über einen Anspruch zu bestimmen. Versicherungsunternehmen durchlaufen diese Checkpoints für Ansprüche, bevor über die Ansprüche entschieden wird. Wenn ein Anspruch alle diese Kontrollpunkte ohne Probleme erfolgreich durchläuft, genehmigt die Versicherungsgesellschaft ihn und bearbeitet die Zahlung. Sie benötigen jedoch möglicherweise zusätzliche unterstützende Informationen, um über einen Anspruch zu entscheiden. Dieser Schadenbearbeitungsprozess ist oft manuell, was ihn teuer, fehleranfällig und zeitaufwändig macht. Versicherungskunden können diesen Prozess mithilfe von AWS AI-Services automatisieren, um die Dokumentenverarbeitungspipeline für die Schadensbearbeitung zu automatisieren.

In dieser zweiteiligen Serie zeigen wir Ihnen, wie Sie Dokumente mithilfe von AWS-KI-Services für einen Anwendungsfall zur Bearbeitung von Versicherungsansprüchen in großem Umfang automatisieren und intelligent verarbeiten können.

Intelligente Dokumentenverarbeitung mit AWS AI- und Analytics-Services in der Versicherungsbranche

Lösungsüberblick

Das folgende Diagramm stellt jede Phase dar, die wir normalerweise in einer IDP-Pipeline sehen. Wir gehen durch jede dieser Phasen und wie sie mit den Schritten verbunden sind, die an einem Antragsverfahren beteiligt sind, beginnend mit der Einreichung eines Antrags bis hin zur Untersuchung und zum Abschluss des Antrags. In diesem Beitrag behandeln wir die technischen Details der Datenerfassungs-, Klassifizierungs- und Extraktionsphasen. Im Teil 2, erweitern wir die Phase der Dokumentenextraktion und fahren mit der Anreicherung, Überprüfung und Verifizierung von Dokumenten fort und erweitern die Lösung, um Analysen und Visualisierungen für einen Anwendungsfall des Schadensbetrugs bereitzustellen.

Das folgende Architekturdiagramm zeigt die verschiedenen AWS-Services, die während der Phasen der IDP-Pipeline gemäß den verschiedenen Phasen einer Antragsbearbeitungsanwendung verwendet werden.

IDP-Architekturdiagramm

Die Lösung verwendet die folgenden Schlüsseldienste:

Amazontext ist ein Dienst für maschinelles Lernen (ML), der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Es geht über die einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Amazon Textract verwendet ML, um jede Art von Dokument zu lesen und zu verarbeiten und Text, Handschriften, Tabellen und andere Daten ohne manuellen Aufwand präzise zu extrahieren.
Amazon verstehen ist ein Dienst zur Verarbeitung natürlicher Sprache (NLP), der ML verwendet, um Erkenntnisse aus Text zu extrahieren. Amazon Comprehend kann Entitäten wie Person, Ort, Datum, Menge und mehr erkennen. Es kann auch die vorherrschende Sprache und personenbezogene Daten (PII) erkennen und Dokumente in ihre relevante Klasse einordnen.
Amazon Augmented AI (Amazon A2I) ist ein ML-Dienst, der es einfach macht, die für die menschliche Überprüfung erforderlichen Arbeitsabläufe zu erstellen. Amazon A2I bietet allen Entwicklern eine menschliche Überprüfung und beseitigt die undifferenzierte Schwerstarbeit, die mit dem Aufbau menschlicher Überprüfungssysteme oder der Verwaltung einer großen Anzahl menschlicher Prüfer verbunden ist. Amazon A2I integriert beides mit Amazontext und Amazon verstehen um die Möglichkeit zu bieten, eine menschliche Überprüfung oder Validierung in den IDP-Workflow einzuführen.

Voraussetzungen:

In den folgenden Abschnitten gehen wir durch die verschiedenen Dienste, die sich auf die ersten drei Phasen der Architektur beziehen, dh die Datenerfassungs-, Klassifizierungs- und Extraktionsphase.

Verweisen Sie auf unsere GitHub-Repository für vollständige Codebeispiele zusammen mit den Dokumentbeispielen im Anspruchsbearbeitungspaket.

Datenerfassungsphase

Ansprüche und die dazugehörigen Dokumente können über verschiedene Kanäle wie Fax, E-Mail, ein Admin-Portal und mehr eingehen. Sie können diese Dokumente in einem hochskalierbaren und dauerhaften Speicher wie z Amazon Simple Storage-Service (Amazon S3). Diese Dokumente können unterschiedlicher Art sein, z. B. PDF, JPEG, PNG, TIFF und mehr. Dokumente können in verschiedenen Formaten und Layouts vorliegen und von verschiedenen Kanälen in den Datenspeicher gelangen.

Klassifizierungsphase

In der Dokumentenklassifizierungsphase können wir Amazon Comprehend mit Amazon Textract kombinieren, um Text in Dokumentkontext umzuwandeln, um die Dokumente zu klassifizieren, die in der Datenerfassungsphase gespeichert werden. Wir können dann die benutzerdefinierte Klassifizierung in Amazon Comprehend verwenden, um Dokumente in Klassen zu organisieren, die wir im Anspruchsbearbeitungspaket definiert haben. Die benutzerdefinierte Klassifizierung ist auch hilfreich, um den Dokumentenüberprüfungsprozess zu automatisieren und fehlende Dokumente aus dem Paket zu identifizieren. Es gibt zwei Schritte bei der benutzerdefinierten Klassifizierung, wie im Architekturdiagramm gezeigt:

Extrahieren Sie Text mit Amazon Textract aus allen Dokumenten im Datenspeicher, um Trainingsdaten für den benutzerdefinierten Klassifikator vorzubereiten.
Trainieren Sie ein benutzerdefiniertes Amazon Comprehend-Klassifizierungsmodell (auch als a Dokument Klassifikator), um anhand des Textinhalts die Interessenklassen zu erkennen.

Dokumentenklassifikation von Paketen mit Versicherungsansprüchen

Nachdem das benutzerdefinierte Klassifizierungsmodell von Amazon Comprehend trainiert wurde, können wir den Echtzeit-Endpunkt verwenden, um Dokumente zu klassifizieren. Amazon Comprehend gibt alle Klassen von Dokumenten mit einem Konfidenzwert zurück, der mit jeder Klasse in einem Array von Schlüssel-Wert-Paaren verknüpft ist (Doc_name - Confidence_score). Wir empfehlen, den detaillierten Beispielcode für die Dokumentklassifizierung durchzugehen GitHub.

Extraktionsphase

In der Extraktionsphase extrahieren wir Daten aus Dokumenten mit Amazon Textract und Amazon Comprehend. Verwenden Sie für diese Stelle die folgenden Musterdokumente im Paket zur Schadensbearbeitung: ein Antragsformular des Center of Medicaid and Medicare Services (CMS)-1500, Führerschein, Versicherungsausweis und Rechnung.

Extrahieren Sie Daten aus einem CMS-1500-Antragsformular

Das CMS-1500-Formular ist das Standardantragsformular, das von einem nicht institutionellen Anbieter oder Lieferanten verwendet wird, um Medicare-Träger abzurechnen.

Es ist wichtig, das CMS-1500-Formular genau zu verarbeiten, da es sonst den Anspruchsprozess verlangsamen oder die Zahlung durch den Spediteur verzögern kann. Mit dem Amazon Textract AnalyzeDocument API können wir den Extraktionsprozess mit höherer Genauigkeit beschleunigen, um Text aus Dokumenten zu extrahieren, um weitere Einblicke in das Anspruchsformular zu verstehen. Das Folgende ist ein Musterdokument eines CMS-1500-Antragsformulars.

Ein CMS1500-Antragsformular

Wir verwenden jetzt die AnalyzeDocument API zum Extrahieren von zwei FeatureTypes, FORMS und TABLES, aus dem Dokument:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Die folgenden Ergebnisse wurden zur besseren Lesbarkeit gekürzt. Nähere Informationen finden Sie in unserem GitHub Repo.

Das FORMS Extraktion wird als Schlüssel-Wert-Paare identifiziert.

Das TABLES Die Extraktion enthält Zellen, verbundene Zellen und Spaltenüberschriften innerhalb einer erkannten Tabelle im Anspruchsformular.

Tabellenextraktion aus dem CMS1500-Formular

Extrahieren Sie Daten aus ID-Dokumenten

Für Identitätsdokumente wie einen Versicherungsausweis, die unterschiedliche Layouts haben können, können wir den Amazon Textract verwenden AnalyzeDocument API. Wir benutzen das FeatureType FORMS als Konfiguration für die AnalyzeDocument API zum Extrahieren der Schlüssel-Wert-Paare aus der Versicherungs-ID (siehe folgendes Beispiel):

Führen Sie den folgenden Code aus:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Wir erhalten die Schlüssel-Wert-Paare im Ergebnisarray, wie im folgenden Screenshot gezeigt.

Für ID-Dokumente wie einen US-Führerschein oder einen US-Pass bietet Amazon Textract spezielle Unterstützung, um Schlüsselbegriffe automatisch zu extrahieren, ohne dass Vorlagen oder Formate erforderlich sind, im Gegensatz zu dem, was wir zuvor für das Versicherungs-ID-Beispiel gesehen haben. Mit dem AnalyzeID API können Unternehmen schnell und genau Informationen aus ID-Dokumenten mit unterschiedlichen Vorlagen oder Formaten extrahieren. Das AnalyzeID Die API gibt zwei Kategorien von Datentypen zurück:

Auf dem Ausweis verfügbare Schlüssel-Wert-Paare wie Geburtsdatum, Ausstellungsdatum, Ausweisnummer, Klasse und Einschränkungen
Implizierte Felder im Dokument, denen möglicherweise keine expliziten Schlüssel zugeordnet sind, z. B. Name, Adresse und Aussteller

Wir verwenden das folgende Muster eines US-Führerscheins aus unserem Schadenbearbeitungspaket.

Führen Sie den folgenden Code aus:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Der folgende Screenshot zeigt unser Ergebnis.

Auf dem Ergebnis-Screenshot können Sie beobachten, dass bestimmte Schlüssel angezeigt werden, die nicht im Führerschein selbst enthalten waren. Zum Beispiel, Veteran ist kein Schlüssel, der in der Lizenz gefunden wird; Es handelt sich jedoch um einen vorab ausgefüllten Schlüsselwert AnalyzeID unterstützt, aufgrund der Unterschiede in den Lizenzen zwischen den Staaten.

Extrahieren Sie Daten aus Rechnungen und Quittungen

Ähnlich wie bei der AnalyzeID API, die AnalyzeExpense API bietet spezialisierte Unterstützung für Rechnungen und Quittungen, um relevante Informationen wie Lieferantenname, Zwischensummen und Gesamtbeträge und mehr aus jedem Format von Rechnungsdokumenten zu extrahieren. Sie benötigen keine Vorlage oder Konfiguration für die Extraktion. Amazon Textract verwendet ML, um den Kontext mehrdeutiger Rechnungen und Quittungen zu verstehen.

Das Folgende ist ein Beispiel für eine Krankenversicherungsrechnung.

Muster einer Versicherungsrechnung

Wir nutzen die AnalyzeExpense API, um eine Liste standardisierter Felder anzuzeigen. Felder, die nicht als Standardfelder erkannt werden, werden kategorisiert als OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

In den Ergebnissen erhalten wir die folgende Liste von Feldern als Schlüssel-Wert-Paare (siehe Screenshot links) und die gesamte Zeile der gekauften Einzelposten (siehe Screenshot rechts).

Intelligente Dokumentenverarbeitung mit AWS AI-Services in der Versicherungsbranche: Teil 1 PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Zusammenfassung

In diesem Beitrag haben wir die allgemeinen Herausforderungen bei der Schadensbearbeitung aufgezeigt und gezeigt, wie wir AWS AI-Services verwenden können, um eine intelligente Dokumentenverarbeitungspipeline zu automatisieren, um automatisch über einen Schaden zu entscheiden. Wir haben gesehen, wie Dokumente mithilfe eines benutzerdefinierten Amazon Comprehend-Klassifikators in verschiedene Dokumentklassen klassifiziert werden und wie Amazon Textract verwendet wird, um unstrukturierte, halbstrukturierte, strukturierte und spezialisierte Dokumenttypen zu extrahieren.

In Teil 2erweitern wir die Extraktionsphase mit Amazon Textract. Wir verwenden auch vordefinierte Entitäten und benutzerdefinierte Entitäten von Amazon Comprehend, um die Daten anzureichern, und zeigen, wie die IDP-Pipeline erweitert werden kann, um sie mit Analyse- und Visualisierungsdiensten für die weitere Verarbeitung zu integrieren.

Wir empfehlen, die Sicherheitsabschnitte der zu lesen Amazon Textract, Amazon verstehen, und Amazon A2I Dokumentation und Einhaltung der bereitgestellten Richtlinien. Weitere Informationen zu den Preisen der Lösung finden Sie in den Preisdetails von Amazon Textract, Amazon verstehen und Amazon A2I.

Über die Autoren

Chinmayee Rane ist AI/ML Specialist Solutions Architect bei Amazon Web Services. Sie interessiert sich leidenschaftlich für angewandte Mathematik und maschinelles Lernen. Sie konzentriert sich auf die Entwicklung intelligenter Dokumentenverarbeitungslösungen für AWS-Kunden. Außerhalb der Arbeit tanzt sie gerne Salsa und Bachata.

Sonali Sahu leitet das Team Intelligent Document Processing AI/ML Solutions Architect bei Amazon Web Services. Sie ist leidenschaftlich technikbegeistert und arbeitet gerne mit Kunden zusammen, um komplexe Probleme durch Innovation zu lösen. Ihre Kerngebiete sind künstliche Intelligenz und maschinelles Lernen für die intelligente Dokumentenverarbeitung.

Tim Condell ist Senior AI/ML Specialist Solutions Architect bei Amazon Web Services. Seine Schwerpunkte liegen in der Verarbeitung natürlicher Sprache und Computer Vision. Tim nimmt gerne Kundenideen auf und verwandelt sie in skalierbare Lösungen.

Zeitstempel: 3. November 20224. November 2022

Zeitstempel: 2. Mai 2023

Intelligente Dokumentenverarbeitung mit AWS AI-Services in der Versicherungsbranche: Teil 1

Neuauflage von Plato

Lösungsüberblick

Voraussetzungen:

Datenerfassungsphase

Klassifizierungsphase

Extraktionsphase

Extrahieren Sie Daten aus einem CMS-1500-Antragsformular

Extrahieren Sie Daten aus ID-Dokumenten

Extrahieren Sie Daten aus Rechnungen und Quittungen

Zusammenfassung

Über die Autoren

Mehr von AWS Maschinelles Lernen

Erstellen Sie mit dem Amazon SageMaker Python SDK | für maschinelles Lernen geeignete Datensätze aus dem Offline-Feature-Store von Amazon SageMaker Amazon Web Services

Die Reise des generativen virtuellen KI-Assistenten von PGA TOUR, vom Konzept über die Entwicklung bis zum Prototyp | Amazon Web Services

Implementierung von Amazon Forecast in der Einzelhandelsbranche: Eine Reise vom POC zur Produktion

Passen Sie Ihre Empfehlungen an, indem Sie bestimmte Artikel mithilfe von Geschäftsregeln mit Amazon Personalize bewerben

Vorstellung des benutzerdefinierten Modellprogramms des AWS Generative AI Innovation Center für Anthropic Claude | Amazon Web Services

Beschleunigen Sie mehrsprachige Arbeitsabläufe mit einer anpassbaren Übersetzungslösung, die mit Amazon Translate erstellt wurde

Muster für das Hosten von Modellen in SageMaker: Best Practices beim Testen und Aktualisieren von Modellen in SageMaker

Amazon SageMaker mit TensorBoard: Ein Überblick über ein gehostetes TensorBoard-Erlebnis

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto