Das Ziel der intelligenten Dokumentenverarbeitung (IDP) besteht darin, Ihrem Unternehmen zu helfen, schnellere und genauere Entscheidungen zu treffen, indem KI zur Verarbeitung Ihrer Unterlagen eingesetzt wird. Diese zweiteilige Serie beleuchtet die AWS-KI-Technologien, mit denen Versicherungsunternehmen ihre Geschäftsprozesse beschleunigen können. Diese KI-Technologien können in allen Anwendungsfällen von Versicherungen eingesetzt werden, z. B. bei Schadensfällen, Underwriting, Kundenkorrespondenz, Verträgen oder der Bearbeitung von Streitbeilegungen. Diese Reihe konzentriert sich auf einen Anwendungsfall der Schadensabwicklung in der Versicherungsbranche; Weitere Informationen zu den grundlegenden Konzepten der AWS IDP-Lösung finden Sie im Folgenden zweiteilige Serie.
Die Bearbeitung von Ansprüchen besteht aus mehreren Kontrollpunkten in einem Arbeitsablauf, der erforderlich ist, um die Authentizität zu prüfen und zu bestimmen und die korrekte finanzielle Verantwortung für die Entscheidung über einen Anspruch zu bestimmen. Versicherungsunternehmen durchlaufen diese Checkpoints für Ansprüche, bevor über die Ansprüche entschieden wird. Wenn ein Anspruch alle diese Kontrollpunkte ohne Probleme erfolgreich durchläuft, genehmigt die Versicherungsgesellschaft ihn und bearbeitet die Zahlung. Sie benötigen jedoch möglicherweise zusätzliche unterstützende Informationen, um über einen Anspruch zu entscheiden. Dieser Schadenbearbeitungsprozess ist oft manuell, was ihn teuer, fehleranfällig und zeitaufwändig macht. Versicherungskunden können diesen Prozess mithilfe von AWS AI-Services automatisieren, um die Dokumentenverarbeitungspipeline für die Schadensbearbeitung zu automatisieren.
In dieser zweiteiligen Serie zeigen wir Ihnen, wie Sie Dokumente mithilfe von AWS-KI-Services für einen Anwendungsfall zur Bearbeitung von Versicherungsansprüchen in großem Umfang automatisieren und intelligent verarbeiten können.
Intelligente Dokumentenverarbeitung mit AWS AI- und Analytics-Services in der Versicherungsbranche |
Lösungsüberblick
Das folgende Diagramm stellt jede Phase dar, die wir normalerweise in einer IDP-Pipeline sehen. Wir gehen durch jede dieser Phasen und wie sie mit den Schritten verbunden sind, die an einem Antragsverfahren beteiligt sind, beginnend mit der Einreichung eines Antrags bis hin zur Untersuchung und zum Abschluss des Antrags. In diesem Beitrag behandeln wir die technischen Details der Datenerfassungs-, Klassifizierungs- und Extraktionsphasen. Im Teil 2, erweitern wir die Phase der Dokumentenextraktion und fahren mit der Anreicherung, Überprüfung und Verifizierung von Dokumenten fort und erweitern die Lösung, um Analysen und Visualisierungen für einen Anwendungsfall des Schadensbetrugs bereitzustellen.
Das folgende Architekturdiagramm zeigt die verschiedenen AWS-Services, die während der Phasen der IDP-Pipeline gemäß den verschiedenen Phasen einer Antragsbearbeitungsanwendung verwendet werden.
Die Lösung verwendet die folgenden Schlüsseldienste:
- Amazontext ist ein Dienst für maschinelles Lernen (ML), der automatisch Text, Handschrift und Daten aus gescannten Dokumenten extrahiert. Es geht über die einfache optische Zeichenerkennung (OCR) hinaus, um Daten aus Formularen und Tabellen zu identifizieren, zu verstehen und zu extrahieren. Amazon Textract verwendet ML, um jede Art von Dokument zu lesen und zu verarbeiten und Text, Handschriften, Tabellen und andere Daten ohne manuellen Aufwand präzise zu extrahieren.
- Amazon verstehen ist ein Dienst zur Verarbeitung natürlicher Sprache (NLP), der ML verwendet, um Erkenntnisse aus Text zu extrahieren. Amazon Comprehend kann Entitäten wie Person, Ort, Datum, Menge und mehr erkennen. Es kann auch die vorherrschende Sprache und personenbezogene Daten (PII) erkennen und Dokumente in ihre relevante Klasse einordnen.
- Amazon Augmented AI (Amazon A2I) ist ein ML-Dienst, der es einfach macht, die für die menschliche Überprüfung erforderlichen Arbeitsabläufe zu erstellen. Amazon A2I bietet allen Entwicklern eine menschliche Überprüfung und beseitigt die undifferenzierte Schwerstarbeit, die mit dem Aufbau menschlicher Überprüfungssysteme oder der Verwaltung einer großen Anzahl menschlicher Prüfer verbunden ist. Amazon A2I integriert beides mit Amazontext und Amazon verstehen um die Möglichkeit zu bieten, eine menschliche Überprüfung oder Validierung in den IDP-Workflow einzuführen.
Voraussetzungen:
In den folgenden Abschnitten gehen wir durch die verschiedenen Dienste, die sich auf die ersten drei Phasen der Architektur beziehen, dh die Datenerfassungs-, Klassifizierungs- und Extraktionsphase.
Verweisen Sie auf unsere GitHub-Repository für vollständige Codebeispiele zusammen mit den Dokumentbeispielen im Anspruchsbearbeitungspaket.
Datenerfassungsphase
Ansprüche und die dazugehörigen Dokumente können über verschiedene Kanäle wie Fax, E-Mail, ein Admin-Portal und mehr eingehen. Sie können diese Dokumente in einem hochskalierbaren und dauerhaften Speicher wie z Amazon Simple Storage-Service (Amazon S3). Diese Dokumente können unterschiedlicher Art sein, z. B. PDF, JPEG, PNG, TIFF und mehr. Dokumente können in verschiedenen Formaten und Layouts vorliegen und von verschiedenen Kanälen in den Datenspeicher gelangen.
Klassifizierungsphase
In der Dokumentenklassifizierungsphase können wir Amazon Comprehend mit Amazon Textract kombinieren, um Text in Dokumentkontext umzuwandeln, um die Dokumente zu klassifizieren, die in der Datenerfassungsphase gespeichert werden. Wir können dann die benutzerdefinierte Klassifizierung in Amazon Comprehend verwenden, um Dokumente in Klassen zu organisieren, die wir im Anspruchsbearbeitungspaket definiert haben. Die benutzerdefinierte Klassifizierung ist auch hilfreich, um den Dokumentenüberprüfungsprozess zu automatisieren und fehlende Dokumente aus dem Paket zu identifizieren. Es gibt zwei Schritte bei der benutzerdefinierten Klassifizierung, wie im Architekturdiagramm gezeigt:
- Extrahieren Sie Text mit Amazon Textract aus allen Dokumenten im Datenspeicher, um Trainingsdaten für den benutzerdefinierten Klassifikator vorzubereiten.
- Trainieren Sie ein benutzerdefiniertes Amazon Comprehend-Klassifizierungsmodell (auch als a Dokument Klassifikator), um anhand des Textinhalts die Interessenklassen zu erkennen.
Nachdem das benutzerdefinierte Klassifizierungsmodell von Amazon Comprehend trainiert wurde, können wir den Echtzeit-Endpunkt verwenden, um Dokumente zu klassifizieren. Amazon Comprehend gibt alle Klassen von Dokumenten mit einem Konfidenzwert zurück, der mit jeder Klasse in einem Array von Schlüssel-Wert-Paaren verknüpft ist (Doc_name
- Confidence_score
). Wir empfehlen, den detaillierten Beispielcode für die Dokumentklassifizierung durchzugehen GitHub.
Extraktionsphase
In der Extraktionsphase extrahieren wir Daten aus Dokumenten mit Amazon Textract und Amazon Comprehend. Verwenden Sie für diese Stelle die folgenden Musterdokumente im Paket zur Schadensbearbeitung: ein Antragsformular des Center of Medicaid and Medicare Services (CMS)-1500, Führerschein, Versicherungsausweis und Rechnung.
Extrahieren Sie Daten aus einem CMS-1500-Antragsformular
Das CMS-1500-Formular ist das Standardantragsformular, das von einem nicht institutionellen Anbieter oder Lieferanten verwendet wird, um Medicare-Träger abzurechnen.
Es ist wichtig, das CMS-1500-Formular genau zu verarbeiten, da es sonst den Anspruchsprozess verlangsamen oder die Zahlung durch den Spediteur verzögern kann. Mit dem Amazon Textract AnalyzeDocument
API können wir den Extraktionsprozess mit höherer Genauigkeit beschleunigen, um Text aus Dokumenten zu extrahieren, um weitere Einblicke in das Anspruchsformular zu verstehen. Das Folgende ist ein Musterdokument eines CMS-1500-Antragsformulars.
Wir verwenden jetzt die AnalyzeDocument
API zum Extrahieren von zwei FeatureTypes
, FORMS
und TABLES
, aus dem Dokument:
Die folgenden Ergebnisse wurden zur besseren Lesbarkeit gekürzt. Nähere Informationen finden Sie in unserem GitHub Repo.
Das FORMS
Extraktion wird als Schlüssel-Wert-Paare identifiziert.
Das TABLES
Die Extraktion enthält Zellen, verbundene Zellen und Spaltenüberschriften innerhalb einer erkannten Tabelle im Anspruchsformular.
Extrahieren Sie Daten aus ID-Dokumenten
Für Identitätsdokumente wie einen Versicherungsausweis, die unterschiedliche Layouts haben können, können wir den Amazon Textract verwenden AnalyzeDocument
API. Wir benutzen das FeatureType
FORMS
als Konfiguration für die AnalyzeDocument
API zum Extrahieren der Schlüssel-Wert-Paare aus der Versicherungs-ID (siehe folgendes Beispiel):
Führen Sie den folgenden Code aus:
Wir erhalten die Schlüssel-Wert-Paare im Ergebnisarray, wie im folgenden Screenshot gezeigt.
Für ID-Dokumente wie einen US-Führerschein oder einen US-Pass bietet Amazon Textract spezielle Unterstützung, um Schlüsselbegriffe automatisch zu extrahieren, ohne dass Vorlagen oder Formate erforderlich sind, im Gegensatz zu dem, was wir zuvor für das Versicherungs-ID-Beispiel gesehen haben. Mit dem AnalyzeID
API können Unternehmen schnell und genau Informationen aus ID-Dokumenten mit unterschiedlichen Vorlagen oder Formaten extrahieren. Das AnalyzeID
Die API gibt zwei Kategorien von Datentypen zurück:
- Auf dem Ausweis verfügbare Schlüssel-Wert-Paare wie Geburtsdatum, Ausstellungsdatum, Ausweisnummer, Klasse und Einschränkungen
- Implizierte Felder im Dokument, denen möglicherweise keine expliziten Schlüssel zugeordnet sind, z. B. Name, Adresse und Aussteller
Wir verwenden das folgende Muster eines US-Führerscheins aus unserem Schadenbearbeitungspaket.
Führen Sie den folgenden Code aus:
Der folgende Screenshot zeigt unser Ergebnis.
Auf dem Ergebnis-Screenshot können Sie beobachten, dass bestimmte Schlüssel angezeigt werden, die nicht im Führerschein selbst enthalten waren. Zum Beispiel, Veteran
ist kein Schlüssel, der in der Lizenz gefunden wird; Es handelt sich jedoch um einen vorab ausgefüllten Schlüsselwert AnalyzeID
unterstützt, aufgrund der Unterschiede in den Lizenzen zwischen den Staaten.
Extrahieren Sie Daten aus Rechnungen und Quittungen
Ähnlich wie bei der AnalyzeID
API, die AnalyzeExpense
API bietet spezialisierte Unterstützung für Rechnungen und Quittungen, um relevante Informationen wie Lieferantenname, Zwischensummen und Gesamtbeträge und mehr aus jedem Format von Rechnungsdokumenten zu extrahieren. Sie benötigen keine Vorlage oder Konfiguration für die Extraktion. Amazon Textract verwendet ML, um den Kontext mehrdeutiger Rechnungen und Quittungen zu verstehen.
Das Folgende ist ein Beispiel für eine Krankenversicherungsrechnung.
Wir nutzen die AnalyzeExpense
API, um eine Liste standardisierter Felder anzuzeigen. Felder, die nicht als Standardfelder erkannt werden, werden kategorisiert als OTHER
:
In den Ergebnissen erhalten wir die folgende Liste von Feldern als Schlüssel-Wert-Paare (siehe Screenshot links) und die gesamte Zeile der gekauften Einzelposten (siehe Screenshot rechts).
Zusammenfassung
In diesem Beitrag haben wir die allgemeinen Herausforderungen bei der Schadensbearbeitung aufgezeigt und gezeigt, wie wir AWS AI-Services verwenden können, um eine intelligente Dokumentenverarbeitungspipeline zu automatisieren, um automatisch über einen Schaden zu entscheiden. Wir haben gesehen, wie Dokumente mithilfe eines benutzerdefinierten Amazon Comprehend-Klassifikators in verschiedene Dokumentklassen klassifiziert werden und wie Amazon Textract verwendet wird, um unstrukturierte, halbstrukturierte, strukturierte und spezialisierte Dokumenttypen zu extrahieren.
In Teil 2erweitern wir die Extraktionsphase mit Amazon Textract. Wir verwenden auch vordefinierte Entitäten und benutzerdefinierte Entitäten von Amazon Comprehend, um die Daten anzureichern, und zeigen, wie die IDP-Pipeline erweitert werden kann, um sie mit Analyse- und Visualisierungsdiensten für die weitere Verarbeitung zu integrieren.
Wir empfehlen, die Sicherheitsabschnitte der zu lesen Amazon Textract, Amazon verstehen, und Amazon A2I Dokumentation und Einhaltung der bereitgestellten Richtlinien. Weitere Informationen zu den Preisen der Lösung finden Sie in den Preisdetails von Amazon Textract, Amazon verstehen und Amazon A2I.
Über die Autoren
Chinmayee Rane ist AI/ML Specialist Solutions Architect bei Amazon Web Services. Sie interessiert sich leidenschaftlich für angewandte Mathematik und maschinelles Lernen. Sie konzentriert sich auf die Entwicklung intelligenter Dokumentenverarbeitungslösungen für AWS-Kunden. Außerhalb der Arbeit tanzt sie gerne Salsa und Bachata.
Sonali Sahu leitet das Team Intelligent Document Processing AI/ML Solutions Architect bei Amazon Web Services. Sie ist leidenschaftlich technikbegeistert und arbeitet gerne mit Kunden zusammen, um komplexe Probleme durch Innovation zu lösen. Ihre Kerngebiete sind künstliche Intelligenz und maschinelles Lernen für die intelligente Dokumentenverarbeitung.
Tim Condell ist Senior AI/ML Specialist Solutions Architect bei Amazon Web Services. Seine Schwerpunkte liegen in der Verarbeitung natürlicher Sprache und Computer Vision. Tim nimmt gerne Kundenideen auf und verwandelt sie in skalierbare Lösungen.
- AI
- Kunst
- KI-Kunstgenerator
- KI-Roboter
- Amazon verstehen
- Amazon begreifen medizinische
- Amazon Machine Learning
- Amazontext
- künstliche Intelligenz
- Zertifizierung für künstliche Intelligenz
- Künstliche Intelligenz im Bankwesen
- Roboter mit künstlicher Intelligenz
- Roboter mit künstlicher Intelligenz
- Software für künstliche Intelligenz
- AWS Maschinelles Lernen
- Blockchain
- Blockchain-Konferenz ai
- Einfallsreichtum
- dialogorientierte künstliche Intelligenz
- Krypto-Konferenz ai
- Dalls
- tiefe Lernen
- Google Ai
- Mittel (200)
- Maschinelles Lernen
- Plato
- platon ai
- Datenintelligenz von Plato
- Plato-Spiel
- PlatoData
- Platogaming
- Skala ai
- Syntax
- Zephyrnet