Inteligentne przetwarzanie dokumentów z usługami AWS AI w branży ubezpieczeniowej: część 1

Opublikowane ponownie przez Plato

Obserwuje: 0

Celem inteligentnego przetwarzania dokumentów (IDP) jest pomoc Twojej organizacji w podejmowaniu szybszych i dokładniejszych decyzji poprzez zastosowanie sztucznej inteligencji do przetwarzania dokumentów. Ta dwuczęściowa seria przedstawia technologie AWS AI, które firmy ubezpieczeniowe mogą wykorzystać do przyspieszenia procesów biznesowych. Te technologie sztucznej inteligencji mogą być wykorzystywane we wszystkich przypadkach związanych z ubezpieczeniami, takich jak roszczenia, ubezpieczenia, korespondencja z klientami, umowy lub rozstrzyganie sporów. Ta seria koncentruje się na przypadku użycia przetwarzania roszczeń w branży ubezpieczeniowej; aby uzyskać więcej informacji na temat podstawowych koncepcji rozwiązania AWS IDP, zapoznaj się z poniższymi informacjami dwuczęściowa seria.

Przetwarzanie roszczeń składa się z wielu punktów kontrolnych w przepływie pracy, które są wymagane do przeglądu, weryfikacji autentyczności i określenia prawidłowej odpowiedzialności finansowej w celu rozpatrzenia roszczenia. Firmy ubezpieczeniowe przechodzą przez te punkty kontrolne dla roszczeń przed zasądzeniem roszczeń. Jeśli roszczenie pomyślnie przejdzie przez wszystkie te punkty kontrolne bez problemów, firma ubezpieczeniowa zatwierdza je i przetwarza wszelkie płatności. Mogą jednak wymagać dodatkowych informacji potwierdzających, aby rozstrzygnąć roszczenie. Ten proces przetwarzania roszczeń jest często ręczny, co czyni go kosztownym, podatnym na błędy i czasochłonnym. Klienci ubezpieczeniowi mogą zautomatyzować ten proces za pomocą usług AWS AI, aby zautomatyzować proces przetwarzania dokumentów w celu przetwarzania roszczeń.

W tej dwuczęściowej serii pokażemy Ci, w jaki sposób możesz zautomatyzować i inteligentnie przetwarzać dokumenty na dużą skalę, korzystając z usług AWS AI w przypadku przetwarzania roszczeń ubezpieczeniowych.

Inteligentne przetwarzanie dokumentów z usługami AWS AI i Analytics w branży ubezpieczeniowej

Omówienie rozwiązania

Poniższy diagram przedstawia każdy etap, który zwykle widzimy w potoku IDP. Przechodzimy przez każdy z tych etapów i sposób, w jaki łączą się one z etapami procesu składania wniosku o odszkodowanie, począwszy od złożenia wniosku, aż do zbadania i zamknięcia wniosku. W tym poście omawiamy szczegóły techniczne etapów zbierania, klasyfikacji i ekstrakcji danych. W Część 2, rozszerzamy etap ekstrakcji dokumentów i kontynuujemy wzbogacanie, przeglądanie i weryfikację dokumentów oraz rozszerzamy rozwiązanie o analitykę i wizualizacje dla przypadku użycia wyłudzeń roszczeń.

Poniższy diagram architektury przedstawia różne usługi AWS używane podczas faz potoku IDP zgodnie z różnymi etapami aplikacji do przetwarzania oświadczeń.

Schemat architektury IDP

Rozwiązanie wykorzystuje następujące kluczowe usługi:

Ekstrakt z amazonki to usługa uczenia maszynowego (ML), która automatycznie wyodrębnia tekst, pismo ręczne i dane z zeskanowanych dokumentów. Wykracza poza proste optyczne rozpoznawanie znaków (OCR) w celu identyfikacji, zrozumienia i wyodrębnienia danych z formularzy i tabel. Amazon Texttract wykorzystuje ML do odczytywania i przetwarzania dowolnego rodzaju dokumentów, dokładnie wyodrębniając tekst, pismo odręczne, tabele i inne dane bez ręcznego wysiłku.
Amazon Comprehend to usługa przetwarzania języka naturalnego (NLP), która wykorzystuje ML do wyodrębniania spostrzeżeń z tekstu. Amazon Comprehend może wykrywać takie elementy, jak osoba, lokalizacja, data, ilość i inne. Może również wykrywać dominujący język, informacje umożliwiające identyfikację osób (PII) i klasyfikować dokumenty do odpowiedniej klasy.
Amazon AI Augmented (Amazon A2I) to usługa ML, która ułatwia tworzenie przepływów pracy wymaganych do przeglądu przez człowieka. Amazon A2I zapewnia wszystkim programistom ocenę przez człowieka, eliminując niezróżnicowany ciężar związany z budowaniem systemów oceny przez człowieka lub zarządzaniem dużą liczbą recenzentów przez człowieka. Amazon A2I integruje się zarówno z Ekstrakt z amazonki i Amazon Comprehend aby zapewnić możliwość wprowadzenia przeglądu lub walidacji przez człowieka w ramach przepływu pracy IDP.

Wymagania wstępne

W kolejnych sekcjach omówimy różne usługi związane z pierwszymi trzema fazami architektury, tj. fazami przechwytywania, klasyfikacji i ekstrakcji danych.

Zobacz naszą Repozytorium GitHub dla próbek pełnego kodu wraz z próbkami dokumentów w pakiecie przetwarzania roszczeń.

Faza przechwytywania danych

Roszczenia i towarzyszące im dokumenty mogą przychodzić różnymi kanałami, takimi jak faks, e-mail, portal administracyjny i inne. Możesz przechowywać te dokumenty w wysoce skalowalnym i trwałym magazynie, takim jak Usługa Amazon Simple Storage (Amazonka S3). Mogą to być dokumenty różnych typów, takie jak PDF, JPEG, PNG, TIFF i inne. Dokumenty mogą mieć różne formaty i układy oraz mogą pochodzić z różnych kanałów do magazynu danych.

Faza klasyfikacji

Na etapie klasyfikacji dokumentów możemy połączyć Amazon Comprehend z Amazon Text, aby przekonwertować tekst na kontekst dokumentu, aby sklasyfikować dokumenty przechowywane na etapie przechwytywania danych. Następnie możemy użyć niestandardowej klasyfikacji w Amazon Comprehend, aby uporządkować dokumenty w klasy, które zdefiniowaliśmy w pakiecie przetwarzania roszczeń. Klasyfikacja niestandardowa jest również pomocna w automatyzacji procesu weryfikacji dokumentów i identyfikacji brakujących dokumentów z paczki. Klasyfikacja niestandardowa składa się z dwóch kroków, jak pokazano na diagramie architektury:

Wyodrębnij tekst za pomocą Amazon Text ze wszystkich dokumentów w magazynie danych, aby przygotować dane treningowe dla klasyfikatora niestandardowego.
Wytrenuj niestandardowy model klasyfikacji Amazon Comprehend (zwany także dokument klasyfikator) rozpoznawanie klas zainteresowań na podstawie treści tekstu.

Klasyfikacja dokumentów pakietu szkód ubezpieczeniowych

Po przeszkoleniu niestandardowego modelu klasyfikacji Amazon Comprehend możemy użyć punktu końcowego czasu rzeczywistego do klasyfikacji dokumentów. Amazon Comprehend zwraca wszystkie klasy dokumentów z wynikiem zaufania powiązanym z każdą klasą w tablicy par klucz-wartość (Doc_name - Confidence_score). Zalecamy przejrzenie szczegółowego przykładowego kodu klasyfikacji dokumentu na GitHub.

Faza ekstrakcji

W fazie ekstrakcji wydobywamy dane z dokumentów za pomocą Amazon Text i Amazon Comprehend. W tym poście użyj następujących przykładowych dokumentów w pakiecie obsługi roszczeń: formularz roszczenia Center of Medicaid and Medicare Services (CMS)-1500, prawo jazdy i identyfikator ubezpieczenia oraz faktura.

Wyodrębnij dane z formularza roszczenia CMS-1500

Formularz CMS-1500 jest standardowym formularzem roszczenia używanym przez nieinstytucjonalnego usługodawcę lub dostawcę do wystawiania rachunków przewoźnikom Medicare.

Ważne jest, aby dokładnie przetworzyć formularz CMS-1500, w przeciwnym razie może to spowolnić proces reklamacji lub opóźnić płatność przez przewoźnika. Z tekstem Amazon AnalyzeDocument API, możemy przyspieszyć proces ekstrakcji z większą dokładnością, aby wyodrębnić tekst z dokumentów w celu zrozumienia dalszych informacji w formularzu roszczenia. Poniżej znajduje się przykładowy dokument formularza roszczenia CMS-1500.

Formularz roszczenia CMS1500

Teraz używamy AnalyzeDocument API do wyodrębnienia dwóch FeatureTypes, FORMS i TABLES, z dokumentu:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Poniższe wyniki zostały skrócone dla lepszej czytelności. Aby uzyskać bardziej szczegółowe informacje, zobacz nasze Repozytorium GitHub.

Połączenia FORMS wyodrębnianie jest identyfikowane jako pary klucz-wartość.

Połączenia TABLES wyodrębnianie zawiera komórki, scalone komórki i nagłówki kolumn w wykrytej tabeli w formularzu oświadczenia.

Ekstrakcja tabel z formularza CMS1500

Wyodrębnij dane z dokumentów tożsamości

W przypadku dokumentów tożsamości, takich jak dowód ubezpieczenia, które mogą mieć różne układy, możemy użyć Amazon Text AnalyzeDocument API. Używamy FeatureType FORMS jako konfiguracja dla AnalyzeDocument Interfejs API do wyodrębniania par klucz-wartość z identyfikatora ubezpieczenia (zobacz poniższy przykład):

Uruchom następujący kod:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Otrzymujemy pary klucz-wartość w tablicy wyników, jak pokazano na poniższym zrzucie ekranu.

W przypadku dokumentów tożsamości, takich jak amerykańskie prawo jazdy lub amerykański paszport, Amazon Text zapewnia wyspecjalizowaną obsługę automatycznego wyodrębniania kluczowych terminów bez potrzeby korzystania z szablonów lub formatów, w przeciwieństwie do tego, co widzieliśmy wcześniej w przykładzie identyfikatora ubezpieczenia. Z AnalyzeID API, firmy mogą szybko i dokładnie wyodrębniać informacje z dokumentów tożsamości, które mają różne szablony lub formaty. The AnalyzeID API zwraca dwie kategorie typów danych:

Pary klucz-wartość dostępne w identyfikatorze, takie jak data urodzenia, data wydania, numer identyfikacyjny, klasa i ograniczenia
Niejawne pola w dokumencie, z którymi mogą nie być powiązane jawne klucze, takie jak nazwa, adres i wydawca

Używamy następującego przykładowego amerykańskiego prawa jazdy z naszego pakietu przetwarzania roszczeń.

Uruchom następujący kod:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Poniższy zrzut ekranu pokazuje nasz wynik.

Na zrzucie ekranu z wynikami można zauważyć, że prezentowane są pewne klucze, które nie znajdowały się w samym prawie jazdy. Na przykład, Veteran nie jest kluczem znalezionym w licencji; jednak jest to wstępnie wypełniona para klucz-wartość, która AnalyzeID obsługuje, ze względu na różnice w licencjach między stanami.

Wyodrębnij dane z faktur i paragonów

Podobnego do AnalyzeID API, AnalyzeExpense API zapewnia wyspecjalizowane wsparcie dla faktur i paragonów w celu wyodrębnienia istotnych informacji, takich jak nazwa dostawcy, sumy częściowe i sumy oraz inne z dowolnego formatu dokumentów faktury. Do ekstrakcji nie potrzebujesz żadnego szablonu ani konfiguracji. Amazon Texttract wykorzystuje ML, aby zrozumieć kontekst niejednoznacznych faktur oraz paragonów.

Poniżej znajduje się przykładowa faktura ubezpieczenia medycznego.

Wzór faktury ubezpieczeniowej

Używamy AnalyzeExpense API, aby zobaczyć listę standardowych pól. Pola, które nie są rozpoznawane jako pola standardowe, są klasyfikowane jako OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

W wynikach otrzymujemy następującą listę pól jako pary klucz-wartość (patrz zrzut ekranu po lewej) oraz cały wiersz zakupionych pojedynczych elementów zamówienia (patrz zrzut ekranu po prawej).

Inteligentne przetwarzanie dokumentów z usługami AWS AI w branży ubezpieczeniowej: Część 1 PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Wnioski

W tym poście przedstawiliśmy typowe wyzwania związane z przetwarzaniem roszczeń oraz jak możemy wykorzystać usługi AWS AI do zautomatyzowania inteligentnego potoku przetwarzania dokumentów w celu automatycznego rozstrzygania roszczeń. Zobaczyliśmy, jak klasyfikować dokumenty na różne klasy dokumentów za pomocą niestandardowego klasyfikatora Amazon Comprehend oraz jak używać Amazon Text do wyodrębniania nieustrukturyzowanych, częściowo ustrukturyzowanych, ustrukturyzowanych i wyspecjalizowanych typów dokumentów.

In Część 2, rozszerzamy fazę ekstrakcji o Amazon Texttract. Korzystamy również z predefiniowanych encji Amazon Comprehend i encji niestandardowych, aby wzbogacić dane i pokazać, jak rozszerzyć potok IDP w celu integracji z usługami analitycznymi i wizualizacyjnymi w celu dalszego przetwarzania.

Zalecamy zapoznanie się z sekcjami dotyczącymi bezpieczeństwa w Tekst Amazona, Amazon Zrozum, i Amazonka A2I dokumentacji i postępując zgodnie z dostarczonymi wytycznymi. Aby dowiedzieć się więcej o cenie rozwiązania, przejrzyj szczegóły cen Tekst Amazona, Amazon Comprehend, Amazonka A2I.

O autorach

Chinmayee Rane jest specjalistą ds. rozwiązań AI/ML w Amazon Web Services. Pasjonatka matematyki stosowanej i uczenia maszynowego. Koncentruje się na projektowaniu inteligentnych rozwiązań przetwarzania dokumentów dla klientów AWS. Poza pracą lubi tańczyć salsę i bachatę.

Sonali Sahu kieruje zespołem Intelligent Document Processing AI/ML Solutions Architect w Amazon Web Services. Jest pasjonatką technofilki i lubi pracować z klientami przy rozwiązywaniu złożonych problemów przy użyciu innowacji. Jej głównym obszarem zainteresowania jest sztuczna inteligencja i uczenie maszynowe do inteligentnego przetwarzania dokumentów.

Tima Condello jest starszym architektem rozwiązań AI/ML w Amazon Web Services. Koncentruje się na przetwarzaniu języka naturalnego i wizji komputerowej. Tim lubi czerpać pomysły klientów i przekształcać je w skalowalne rozwiązania.

Znak czasu: Listopad 3, 2022Listopad 4, 2022

Znak czasu: 2 maja 2023 r.

Inteligentne przetwarzanie dokumentów z usługami AWS AI w branży ubezpieczeniowej: Część 1

Opublikowane ponownie przez Plato

Omówienie rozwiązania

Wymagania wstępne

Faza przechwytywania danych

Faza klasyfikacji

Faza ekstrakcji

Wyodrębnij dane z formularza roszczenia CMS-1500

Wyodrębnij dane z dokumentów tożsamości

Wyodrębnij dane z faktur i paragonów

Wnioski

O autorach

Więcej z Uczenie maszynowe AWS

Twórz zestawy danych gotowe do uczenia maszynowego ze sklepu Amazon SageMaker offline Feature Store za pomocą zestawu SDK Amazon SageMaker Python | Usługi sieciowe Amazona

Podróż generatywnego wirtualnego asystenta AI PGA TOUR, od koncepcji, przez rozwój, aż po prototyp | Usługi internetowe Amazona

Wdrażanie Amazon Forecast w branży detalicznej: podróż od POC do produkcji

Dostosuj swoje rekomendacje, promując określone produkty za pomocą reguł biznesowych z Amazon Personalizuj

Przedstawiamy program modeli niestandardowych AWS Generatative AI Innovation Center dla Anthropic Claude | Usługi internetowe Amazona

Przyspiesz wielojęzyczne przepływy pracy dzięki konfigurowalnemu rozwiązaniu tłumaczeniowemu zbudowanemu z Amazon Translate

Model Hosting Patterns w SageMaker: Najlepsze praktyki w testowaniu i aktualizowaniu modeli w SageMaker

Amazon SageMaker z TensorBoard: Omówienie hostowanego środowiska TensorBoard

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto