Målet med intelligent dokumentbehandling (IDP) är att hjälpa din organisation att fatta snabbare och mer exakta beslut genom att använda AI för att bearbeta ditt pappersarbete. Denna tvådelade serie belyser AWS AI-tekniker som försäkringsbolag kan använda för att påskynda sina affärsprocesser. Dessa AI-tekniker kan användas i fall av försäkringsanvändning som krav, emissionsgarantier, kundkorrespondens, kontrakt eller hantering av tvistlösningar. Denna serie fokuserar på ett användningsfall för skadebehandling inom försäkringsbranschen; för mer information om de grundläggande koncepten för AWS IDP-lösningen, se följande tvådelade serier.
Behandling av anspråk består av flera kontrollpunkter i ett arbetsflöde som krävs för att granska, verifiera äktheten och fastställa det korrekta ekonomiska ansvaret för att avgöra ett anspråk. Försäkringsbolagen går igenom dessa kontrollpunkter för skador innan prövningen av skadorna. Om en skadeanmälan framgångsrikt går igenom alla dessa kontrollpunkter utan problem, godkänner försäkringsbolaget det och behandlar eventuell betalning. De kan dock kräva ytterligare stödjande information för att avgöra ett krav. Denna process för anspråksbearbetning är ofta manuell, vilket gör den dyr, felbenägen och tidskrävande. Försäkringskunder kan automatisera denna process med hjälp av AWS AI-tjänster för att automatisera dokumenthanteringspipelinen för skadehantering.
I denna tvådelade serie tar vi dig igenom hur du kan automatisera och intelligent bearbeta dokument i stor skala med hjälp av AWS AI-tjänster för ett användningsfall för behandling av försäkringsskador.
Intelligent dokumentbehandling med AWS AI och Analytics-tjänster inom försäkringsbranschen |
Lösningsöversikt
Följande diagram representerar varje steg som vi vanligtvis ser i en IDP-pipeline. Vi går igenom vart och ett av dessa stadier och hur de ansluter till stegen som är involverade i en ansökningsprocess, från det att en ansökan skickas in till att undersöka och avsluta ansökan. I det här inlägget täcker vi de tekniska detaljerna för datafångst, klassificering och utvinningsstadier. I del 2, utökar vi dokumentextraheringsstadiet och fortsätter att dokumentera berikning, granskning och verifiering, och utökar lösningen för att tillhandahålla analyser och visualiseringar för ett fall av anspråksbedrägeri.
Följande arkitekturdiagram visar de olika AWS-tjänsterna som används under faserna av IDP-pipelinen enligt olika stadier av en anspråksbehandlingsapplikation.
Lösningen använder följande nyckeltjänster:
- amazontext är en maskininlärningstjänst (ML) som automatiskt extraherar text, handstil och data från skannade dokument. Det går utöver enkel optisk teckenigenkänning (OCR) för att identifiera, förstå och extrahera data från formulär och tabeller. Amazon Textract använder ML för att läsa och bearbeta alla typer av dokument, extrahera text, handstil, tabeller och annan data korrekt utan manuell ansträngning.
- Amazon Comprehend är en NLP-tjänst (natural language processing) som använder ML för att extrahera insikter från text. Amazon Comprehend kan upptäcka enheter som person, plats, datum, kvantitet och mer. Det kan också upptäcka det dominerande språket, personlig identifierbar information (PII) information och klassificera dokument i deras relevanta klass.
- Amazon Augmented AI (Amazon A2I) är en ML-tjänst som gör det enkelt att bygga de arbetsflöden som krävs för mänsklig granskning. Amazon A2I ger mänsklig granskning till alla utvecklare, tar bort de odifferentierade tunga lyften som är förknippade med att bygga mänskliga granskningssystem eller hantera ett stort antal mänskliga granskare. Amazon A2I integrerar båda med amazontext och Amazon Comprehend för att ge möjligheten att införa mänsklig granskning eller validering inom IDP-arbetsflödet.
Förutsättningar
I de följande avsnitten går vi igenom de olika tjänsterna som hänför sig till de tre första faserna av arkitekturen, det vill säga datafångst, klassificering och extraktionsfaserna.
Se vår GitHub repository för fullständiga kodexempel tillsammans med dokumentexemplen i anspråksbearbetningspaketet.
Datainsamlingsfas
Anspråk och dess stödjande dokument kan komma via olika kanaler, såsom fax, e-post, en administratörsportal och mer. Du kan lagra dessa dokument i en mycket skalbar och hållbar lagring som Amazon enkel lagringstjänst (Amazon S3). Dessa dokument kan vara av olika typer, såsom PDF, JPEG, PNG, TIFF och mer. Dokument kan komma i olika format och layouter, och kan komma från olika kanaler till datalagret.
Klassificeringsfas
I dokumentklassificeringsstadiet kan vi kombinera Amazon Comprehend med Amazon Textract för att konvertera text till dokumentkontext för att klassificera dokumenten som lagras i datafångststeget. Vi kan sedan använda anpassad klassificering i Amazon Comprehend för att organisera dokument i klasser som vi definierade i anspråksbehandlingspaketet. Anpassad klassificering är också till hjälp för att automatisera dokumentverifieringsprocessen och identifiera eventuella saknade dokument från paketet. Det finns två steg i anpassad klassificering, som visas i arkitekturdiagrammet:
- Extrahera text med Amazon Textract från alla dokument i datalagringen för att förbereda träningsdata för den anpassade klassificeraren.
- Träna en anpassad klassificeringsmodell för Amazon Comprehend (även kallad en dokumentera klassificerare) för att känna igen intresseklasserna baserat på textinnehållet.
Efter att Amazon Comprehends anpassade klassificeringsmodell har tränats kan vi använda realtidsslutpunkten för att klassificera dokument. Amazon Comprehend returnerar alla klasser av dokument med en konfidenspoäng kopplad till varje klass i en rad nyckel-värdepar (Doc_name
- Confidence_score
). Vi rekommenderar att du går igenom den detaljerade dokumentklassificeringsexempelkoden på GitHub.
Extraktionsfas
I utvinningsfasen extraherar vi data från dokument med hjälp av Amazon Textract och Amazon Comprehend. För det här inlägget använder du följande exempeldokument i skadehanteringspaketet: ett ansökningsformulär för Center of Medicaid and Medicare Services (CMS)-1500, körkort och försäkrings-ID samt faktura.
Extrahera data från ett CMS-1500-anspråksformulär
CMS-1500-formuläret är standardformuläret som används av en icke-institutionell leverantör eller leverantör för att fakturera Medicare-operatörer.
Det är viktigt att behandla CMS-1500-formuläret korrekt, annars kan det sakta ner anspråksprocessen eller försena betalningen från transportören. Med Amazon Textract AnalyzeDocument
API kan vi påskynda extraktionsprocessen med högre noggrannhet för att extrahera text från dokument för att förstå ytterligare insikter i anspråksformuläret. Följande är ett exempel på ett CMS-1500-anspråksformulär.
Vi använder nu AnalyzeDocument
API för att extrahera två FeatureTypes
, FORMS
och TABLES
, från dokumentet:
Följande resultat har förkortats för bättre läsbarhet. För mer detaljerad information, se vår GitHub -repo.
Smakämnen FORMS
extraktion identifieras som nyckel-värdepar.
Smakämnen TABLES
extrahering innehåller celler, sammanslagna celler och kolumnrubriker i en upptäckt tabell i anspråksformuläret.
Extrahera data från ID-handlingar
För identitetshandlingar som ett försäkrings-ID, som kan ha olika layouter, kan vi använda Amazon Textract AnalyzeDocument
API. Vi använder FeatureType
FORMS
som konfigurationen för AnalyzeDocument
API för att extrahera nyckel-värdeparen från försäkrings-ID:t (se följande exempel):
Kör följande kod:
Vi får nyckel-värdeparen i resultatmatrisen, som visas i följande skärmdump.
För ID-dokument som ett amerikanskt körkort eller amerikanskt pass ger Amazon Textract specialiserat stöd för att automatiskt extrahera nyckeltermer utan behov av mallar eller format, till skillnad från vad vi såg tidigare för exemplet med försäkrings-ID. Med AnalyzeID
API kan företag snabbt och exakt extrahera information från ID-dokument som har olika mallar eller format. De AnalyzeID
API returnerar två kategorier av datatyper:
- Nyckel-värdepar tillgängliga på ID:t som födelsedatum, utfärdandedatum, ID-nummer, klass och begränsningar
- Underförstådda fält på dokumentet som kanske inte har explicita nycklar kopplade till sig, såsom namn, adress och utfärdare
Vi använder följande exempel på amerikanska körkort från vårt reklamationspaket.
Kör följande kod:
Följande skärmdump visar vårt resultat.
Från resultatskärmdumpen kan du observera att vissa nycklar presenteras som inte fanns i själva körkortet. Till exempel, Veteran
är inte en nyckel som finns i licensen; men det är ett förifyllt nyckel-värde som AnalyzeID
stöder, på grund av de skillnader som finns i licenser mellan stater.
Extrahera data från fakturor och kvitton
Liknande den AnalyzeID
API, den AnalyzeExpense
API tillhandahåller specialiserat stöd för fakturor och kvitton för att extrahera relevant information som leverantörsnamn, delsummor och totala belopp och mer från alla format av fakturadokument. Du behöver ingen mall eller konfiguration för extraktion. Amazon Textract använder ML för att förstå sammanhanget med tvetydiga fakturor såväl som kvitton.
Följande är ett exempel på en sjukförsäkringsfaktura.
Vi använder AnalyzeExpense
API för att se en lista över standardiserade fält. Fält som inte känns igen som standardfält kategoriseras som OTHER
:
Vi får följande lista med fält som nyckel-värdepar (se skärmbild till vänster) och hela raden med individuella inköpta rader (se skärmbild till höger) i resultaten.
Slutsats
I det här inlägget visade vi upp de vanliga utmaningarna i anspråkshantering och hur vi kan använda AWS AI-tjänster för att automatisera en intelligent dokumentbehandlingspipeline för att automatiskt avgöra ett anspråk. Vi såg hur man klassificerar dokument i olika dokumentklasser med hjälp av en anpassad klassificerare från Amazon Comprehend, och hur man använder Amazon Textract för att extrahera ostrukturerade, semistrukturerade, strukturerade och specialiserade dokumenttyper.
In del 2, utökar vi utvinningsfasen med Amazon Textract. Vi använder även Amazon Comprehend fördefinierade entiteter och anpassade entiteter för att berika data och visa hur man utökar IDP-pipelinen för att integreras med analys- och visualiseringstjänster för vidare bearbetning.
Vi rekommenderar att du granskar säkerhetsdelarna i Amazon Textract, Amazon förstår, och Amazon A2I dokumentation och följa de riktlinjer som tillhandahålls. För att lära dig mer om prissättningen av lösningen, granska prisinformationen för Amazon Textract, Amazon Comprehendoch Amazon A2I.
Om författarna
Chinmayee Rane är en AI/ML Specialist Solutions Architect på Amazon Web Services. Hon brinner för tillämpad matematik och maskininlärning. Hon fokuserar på att designa intelligenta dokumentbehandlingslösningar för AWS-kunder. Utanför jobbet tycker hon om att dansa salsa och bachata.
Sonali Sahu leder teamet Intelligent Document Processing AI/ML Solutions Architect på Amazon Web Services. Hon är en passionerad tenofil och tycker om att arbeta med kunder för att lösa komplexa problem med hjälp av innovation. Hennes kärnfokus är artificiell intelligens och maskininlärning för intelligent dokumentbehandling.
Tim Condello är Senior AI/ML Specialist Solutions Architect på Amazon Web Services. Hans fokus är naturlig språkbehandling och datorseende. Tim tycker om att ta kundidéer och omvandla dem till skalbara lösningar.
- AI
- ai konst
- ai art generator
- har robot
- Amazon Comprehend
- Amazon Comprehend Medical
- Amazon maskininlärning
- amazontext
- artificiell intelligens
- artificiell intelligenscertifiering
- artificiell intelligens inom bankväsendet
- artificiell intelligens robot
- robotar med artificiell intelligens
- programvara för artificiell intelligens
- AWS maskininlärning
- blockchain
- blockchain konferens ai
- coingenius
- konversationskonstnärlig intelligens
- kryptokonferens ai
- dalls
- djupt lärande
- du har google
- Mellan (200)
- maskininlärning
- plato
- plato ai
- Platon Data Intelligence
- Platon spel
- PlatonData
- platogaming
- skala ai
- syntax
- zephyrnet