Intelligent dokumentbehandling med AWS AI-tjänster i försäkringsbranschen: Del 1

Återutgiven av Platon

anhängare: 0

Målet med intelligent dokumentbehandling (IDP) är att hjälpa din organisation att fatta snabbare och mer exakta beslut genom att använda AI för att bearbeta ditt pappersarbete. Denna tvådelade serie belyser AWS AI-tekniker som försäkringsbolag kan använda för att påskynda sina affärsprocesser. Dessa AI-tekniker kan användas i fall av försäkringsanvändning som krav, emissionsgarantier, kundkorrespondens, kontrakt eller hantering av tvistlösningar. Denna serie fokuserar på ett användningsfall för skadebehandling inom försäkringsbranschen; för mer information om de grundläggande koncepten för AWS IDP-lösningen, se följande tvådelade serier.

Behandling av anspråk består av flera kontrollpunkter i ett arbetsflöde som krävs för att granska, verifiera äktheten och fastställa det korrekta ekonomiska ansvaret för att avgöra ett anspråk. Försäkringsbolagen går igenom dessa kontrollpunkter för skador innan prövningen av skadorna. Om en skadeanmälan framgångsrikt går igenom alla dessa kontrollpunkter utan problem, godkänner försäkringsbolaget det och behandlar eventuell betalning. De kan dock kräva ytterligare stödjande information för att avgöra ett krav. Denna process för anspråksbearbetning är ofta manuell, vilket gör den dyr, felbenägen och tidskrävande. Försäkringskunder kan automatisera denna process med hjälp av AWS AI-tjänster för att automatisera dokumenthanteringspipelinen för skadehantering.

I denna tvådelade serie tar vi dig igenom hur du kan automatisera och intelligent bearbeta dokument i stor skala med hjälp av AWS AI-tjänster för ett användningsfall för behandling av försäkringsskador.

Intelligent dokumentbehandling med AWS AI och Analytics-tjänster inom försäkringsbranschen

Lösningsöversikt

Följande diagram representerar varje steg som vi vanligtvis ser i en IDP-pipeline. Vi går igenom vart och ett av dessa stadier och hur de ansluter till stegen som är involverade i en ansökningsprocess, från det att en ansökan skickas in till att undersöka och avsluta ansökan. I det här inlägget täcker vi de tekniska detaljerna för datafångst, klassificering och utvinningsstadier. I del 2, utökar vi dokumentextraheringsstadiet och fortsätter att dokumentera berikning, granskning och verifiering, och utökar lösningen för att tillhandahålla analyser och visualiseringar för ett fall av anspråksbedrägeri.

Följande arkitekturdiagram visar de olika AWS-tjänsterna som används under faserna av IDP-pipelinen enligt olika stadier av en anspråksbehandlingsapplikation.

IDP-arkitekturdiagram

Lösningen använder följande nyckeltjänster:

amazontext är en maskininlärningstjänst (ML) som automatiskt extraherar text, handstil och data från skannade dokument. Det går utöver enkel optisk teckenigenkänning (OCR) för att identifiera, förstå och extrahera data från formulär och tabeller. Amazon Textract använder ML för att läsa och bearbeta alla typer av dokument, extrahera text, handstil, tabeller och annan data korrekt utan manuell ansträngning.
Amazon Comprehend är en NLP-tjänst (natural language processing) som använder ML för att extrahera insikter från text. Amazon Comprehend kan upptäcka enheter som person, plats, datum, kvantitet och mer. Det kan också upptäcka det dominerande språket, personlig identifierbar information (PII) information och klassificera dokument i deras relevanta klass.
Amazon Augmented AI (Amazon A2I) är en ML-tjänst som gör det enkelt att bygga de arbetsflöden som krävs för mänsklig granskning. Amazon A2I ger mänsklig granskning till alla utvecklare, tar bort de odifferentierade tunga lyften som är förknippade med att bygga mänskliga granskningssystem eller hantera ett stort antal mänskliga granskare. Amazon A2I integrerar båda med amazontext och Amazon Comprehend för att ge möjligheten att införa mänsklig granskning eller validering inom IDP-arbetsflödet.

Förutsättningar

I de följande avsnitten går vi igenom de olika tjänsterna som hänför sig till de tre första faserna av arkitekturen, det vill säga datafångst, klassificering och extraktionsfaserna.

Se vår GitHub repository för fullständiga kodexempel tillsammans med dokumentexemplen i anspråksbearbetningspaketet.

Datainsamlingsfas

Anspråk och dess stödjande dokument kan komma via olika kanaler, såsom fax, e-post, en administratörsportal och mer. Du kan lagra dessa dokument i en mycket skalbar och hållbar lagring som Amazon enkel lagringstjänst (Amazon S3). Dessa dokument kan vara av olika typer, såsom PDF, JPEG, PNG, TIFF och mer. Dokument kan komma i olika format och layouter, och kan komma från olika kanaler till datalagret.

Klassificeringsfas

I dokumentklassificeringsstadiet kan vi kombinera Amazon Comprehend med Amazon Textract för att konvertera text till dokumentkontext för att klassificera dokumenten som lagras i datafångststeget. Vi kan sedan använda anpassad klassificering i Amazon Comprehend för att organisera dokument i klasser som vi definierade i anspråksbehandlingspaketet. Anpassad klassificering är också till hjälp för att automatisera dokumentverifieringsprocessen och identifiera eventuella saknade dokument från paketet. Det finns två steg i anpassad klassificering, som visas i arkitekturdiagrammet:

Extrahera text med Amazon Textract från alla dokument i datalagringen för att förbereda träningsdata för den anpassade klassificeraren.
Träna en anpassad klassificeringsmodell för Amazon Comprehend (även kallad en dokumentera klassificerare) för att känna igen intresseklasserna baserat på textinnehållet.

Dokumentklassificering av försäkringsskadepaket

Efter att Amazon Comprehends anpassade klassificeringsmodell har tränats kan vi använda realtidsslutpunkten för att klassificera dokument. Amazon Comprehend returnerar alla klasser av dokument med en konfidenspoäng kopplad till varje klass i en rad nyckel-värdepar (Doc_name - Confidence_score). Vi rekommenderar att du går igenom den detaljerade dokumentklassificeringsexempelkoden på GitHub.

Extraktionsfas

I utvinningsfasen extraherar vi data från dokument med hjälp av Amazon Textract och Amazon Comprehend. För det här inlägget använder du följande exempeldokument i skadehanteringspaketet: ett ansökningsformulär för Center of Medicaid and Medicare Services (CMS)-1500, körkort och försäkrings-ID samt faktura.

Extrahera data från ett CMS-1500-anspråksformulär

CMS-1500-formuläret är standardformuläret som används av en icke-institutionell leverantör eller leverantör för att fakturera Medicare-operatörer.

Det är viktigt att behandla CMS-1500-formuläret korrekt, annars kan det sakta ner anspråksprocessen eller försena betalningen från transportören. Med Amazon Textract AnalyzeDocument API kan vi påskynda extraktionsprocessen med högre noggrannhet för att extrahera text från dokument för att förstå ytterligare insikter i anspråksformuläret. Följande är ett exempel på ett CMS-1500-anspråksformulär.

Ett CMS1500-anspråksformulär

Vi använder nu AnalyzeDocument API för att extrahera två FeatureTypes, FORMS och TABLES, från dokumentet:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Följande resultat har förkortats för bättre läsbarhet. För mer detaljerad information, se vår GitHub -repo.

Smakämnen FORMS extraktion identifieras som nyckel-värdepar.

Smakämnen TABLES extrahering innehåller celler, sammanslagna celler och kolumnrubriker i en upptäckt tabell i anspråksformuläret.

Tabellextraktion från CMS1500-formulär

Extrahera data från ID-handlingar

För identitetshandlingar som ett försäkrings-ID, som kan ha olika layouter, kan vi använda Amazon Textract AnalyzeDocument API. Vi använder FeatureType FORMS som konfigurationen för AnalyzeDocument API för att extrahera nyckel-värdeparen från försäkrings-ID:t (se följande exempel):

Kör följande kod:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Vi får nyckel-värdeparen i resultatmatrisen, som visas i följande skärmdump.

För ID-dokument som ett amerikanskt körkort eller amerikanskt pass ger Amazon Textract specialiserat stöd för att automatiskt extrahera nyckeltermer utan behov av mallar eller format, till skillnad från vad vi såg tidigare för exemplet med försäkrings-ID. Med AnalyzeID API kan företag snabbt och exakt extrahera information från ID-dokument som har olika mallar eller format. De AnalyzeID API returnerar två kategorier av datatyper:

Nyckel-värdepar tillgängliga på ID:t som födelsedatum, utfärdandedatum, ID-nummer, klass och begränsningar
Underförstådda fält på dokumentet som kanske inte har explicita nycklar kopplade till sig, såsom namn, adress och utfärdare

Vi använder följande exempel på amerikanska körkort från vårt reklamationspaket.

Kör följande kod:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Följande skärmdump visar vårt resultat.

Från resultatskärmdumpen kan du observera att vissa nycklar presenteras som inte fanns i själva körkortet. Till exempel, Veteran är inte en nyckel som finns i licensen; men det är ett förifyllt nyckel-värde som AnalyzeID stöder, på grund av de skillnader som finns i licenser mellan stater.

Extrahera data från fakturor och kvitton

Liknande den AnalyzeID API, den AnalyzeExpense API tillhandahåller specialiserat stöd för fakturor och kvitton för att extrahera relevant information som leverantörsnamn, delsummor och totala belopp och mer från alla format av fakturadokument. Du behöver ingen mall eller konfiguration för extraktion. Amazon Textract använder ML för att förstå sammanhanget med tvetydiga fakturor såväl som kvitton.

Följande är ett exempel på en sjukförsäkringsfaktura.

Ett exempel på försäkringsfaktura

Vi använder AnalyzeExpense API för att se en lista över standardiserade fält. Fält som inte känns igen som standardfält kategoriseras som OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Vi får följande lista med fält som nyckel-värdepar (se skärmbild till vänster) och hela raden med individuella inköpta rader (se skärmbild till höger) i resultaten.

Intelligent dokumentbehandling med AWS AI-tjänster inom försäkringsbranschen: Del 1 PlatoBlockchain Data Intelligence. Vertikal sökning. Ai.

Slutsats

I det här inlägget visade vi upp de vanliga utmaningarna i anspråkshantering och hur vi kan använda AWS AI-tjänster för att automatisera en intelligent dokumentbehandlingspipeline för att automatiskt avgöra ett anspråk. Vi såg hur man klassificerar dokument i olika dokumentklasser med hjälp av en anpassad klassificerare från Amazon Comprehend, och hur man använder Amazon Textract för att extrahera ostrukturerade, semistrukturerade, strukturerade och specialiserade dokumenttyper.

In del 2, utökar vi utvinningsfasen med Amazon Textract. Vi använder även Amazon Comprehend fördefinierade entiteter och anpassade entiteter för att berika data och visa hur man utökar IDP-pipelinen för att integreras med analys- och visualiseringstjänster för vidare bearbetning.

Vi rekommenderar att du granskar säkerhetsdelarna i Amazon Textract, Amazon förstår, och Amazon A2I dokumentation och följa de riktlinjer som tillhandahålls. För att lära dig mer om prissättningen av lösningen, granska prisinformationen för Amazon Textract, Amazon Comprehendoch Amazon A2I.

Om författarna

Chinmayee Rane är en AI/ML Specialist Solutions Architect på Amazon Web Services. Hon brinner för tillämpad matematik och maskininlärning. Hon fokuserar på att designa intelligenta dokumentbehandlingslösningar för AWS-kunder. Utanför jobbet tycker hon om att dansa salsa och bachata.

Sonali Sahu leder teamet Intelligent Document Processing AI/ML Solutions Architect på Amazon Web Services. Hon är en passionerad tenofil och tycker om att arbeta med kunder för att lösa komplexa problem med hjälp av innovation. Hennes kärnfokus är artificiell intelligens och maskininlärning för intelligent dokumentbehandling.

Tim Condello är Senior AI/ML Specialist Solutions Architect på Amazon Web Services. Hans fokus är naturlig språkbehandling och datorseende. Tim tycker om att ta kundidéer och omvandla dem till skalbara lösningar.

Tidsstämpel: November 3, 2022November 4, 2022

Tidsstämpel: Maj 2, 2023

Intelligent dokumentbehandling med AWS AI-tjänster inom försäkringsbranschen: Del 1

Återutgiven av Platon

Lösningsöversikt

Förutsättningar

Datainsamlingsfas

Klassificeringsfas

Extraktionsfas

Extrahera data från ett CMS-1500-anspråksformulär

Extrahera data från ID-handlingar

Extrahera data från fakturor och kvitton

Slutsats

Om författarna

Mer från AWS maskininlärning

Bygg datauppsättningar som är klara för maskininlärning från Amazon SageMaker offline Feature Store med Amazon SageMaker Python SDK | Amazon webbtjänster

Resan för PGA TOURs generativa virtuella AI-assistent, från idé till utveckling till prototyp | Amazon webbtjänster

Implementering av Amazon Forecast i detaljhandeln: En resa från POC till produktion

Anpassa dina rekommendationer genom att marknadsföra specifika föremål med hjälp av affärsregler med Amazon Personalize

Vi presenterar AWS Generative AI Innovation Centers anpassade modellprogram för antropisk Claude | Amazon webbtjänster

Accelerera flerspråkiga arbetsflöden med en anpassningsbar översättningslösning byggd med Amazon Translate

Modellvärdsmönster i SageMaker: Bästa metoder för att testa och uppdatera modeller på SageMaker

Amazon SageMaker med TensorBoard: En översikt över en värd TensorBoard-upplevelse

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto