Intelligent Document Processing With AWS AI Services In The Insurance Industry: Part 1

Republicat de Platon

Urmaritori: 0

Scopul procesării inteligente a documentelor (IDP) este de a vă ajuta organizația să ia decizii mai rapide și mai precise prin aplicarea AI pentru a vă procesa documentele. Această serie din două părți evidențiază tehnologiile AWS AI pe care companiile de asigurări le pot folosi pentru a-și accelera procesele de afaceri. Aceste tehnologii de inteligență artificială pot fi utilizate în cazuri de utilizare a asigurărilor, cum ar fi daune, subscriere, corespondență cu clienții, contracte sau soluționarea litigiilor. Această serie se concentrează pe un caz de utilizare a procesării daunelor în industria asigurărilor; pentru mai multe informații despre conceptele fundamentale ale soluției AWS IDP, consultați următoarele în două serii.

Procesarea reclamațiilor constă în mai multe puncte de control într-un flux de lucru care este necesar pentru a revizui, a verifica autenticitatea și a determina responsabilitatea financiară corectă pentru a adjudeca o revendicare. Companiile de asigurări trec prin aceste puncte de control pentru daune înainte de adjudecarea daunelor. Dacă o daună trece cu succes prin toate aceste puncte de control fără probleme, compania de asigurări o aprobă și procesează orice plată. Cu toate acestea, aceștia pot necesita informații suplimentare pentru a soluționa o cerere. Acest proces de procesare a reclamațiilor este adesea manual, ceea ce îl face costisitor, predispus la erori și consumator de timp. Clienții de asigurări pot automatiza acest proces folosind serviciile AWS AI pentru a automatiza conducta de procesare a documentelor pentru procesarea daunelor.

În această serie din două părți, vă prezentăm modul în care puteți automatiza și procesa în mod inteligent documentele la scară folosind serviciile AWS AI pentru un caz de utilizare pentru procesarea daunelor de asigurare.

Procesarea inteligentă a documentelor cu servicii AWS AI și Analytics în industria asigurărilor

Prezentare generală a soluțiilor

Următoarea diagramă reprezintă fiecare etapă pe care o vedem de obicei într-o conductă IDP. Parcurgem fiecare dintre aceste etape și modul în care acestea se conectează la pașii implicați într-un proces de cerere de revendicare, începând de la depunerea unei cereri, până la investigarea și închiderea cererii. În această postare, acoperim detaliile tehnice ale etapelor de captare, clasificare și extracție a datelor. În Partea 2, extindem etapa de extragere a documentelor și continuăm să documentăm îmbogățirea, revizuirea și verificarea și extindem soluția pentru a oferi analize și vizualizări pentru un caz de utilizare a fraudei în revendicări.

Următoarea diagramă de arhitectură arată diferitele servicii AWS utilizate în fazele conductei IDP în funcție de diferitele etape ale unei aplicații de procesare a reclamațiilor.

Diagrama arhitecturii IDP

Soluția folosește următoarele servicii cheie:

Text Amazon este un serviciu de învățare automată (ML) care extrage automat text, scris de mână și date din documentele scanate. Depășește simpla recunoaștere optică a caracterelor (OCR) pentru a identifica, înțelege și extrage date din formulare și tabele. Amazon Textract folosește ML pentru a citi și procesa orice tip de document, extragând cu precizie text, scris de mână, tabele și alte date fără efort manual.
Amazon Comprehend este un serviciu de procesare a limbajului natural (NLP) care utilizează ML pentru a extrage informații din text. Amazon Comprehend poate detecta entități precum persoana, locația, data, cantitatea și multe altele. De asemenea, poate detecta limba dominantă, informațiile de identificare personală (PII) și poate clasifica documentele în clasa lor relevantă.
AI augmentată Amazon (Amazon A2I) este un serviciu ML care facilitează construirea fluxurilor de lucru necesare pentru revizuirea umană. Amazon A2I aduce recenzii umane tuturor dezvoltatorilor, eliminând sarcinile grele nediferențiate asociate cu construirea de sisteme de evaluare umană sau gestionarea unui număr mare de recenzori umani. Amazon A2I se integrează cu ambele Text Amazon și Amazon Comprehend pentru a oferi capacitatea de a introduce revizuirea umană sau validarea în fluxul de lucru IDP.

Cerințe preliminare

În secțiunile următoare, vom parcurge diferitele servicii legate de primele trei faze ale arhitecturii, adică fazele de captare, clasificare și extracție a datelor.

Consultați-ne GitHub depozit pentru mostre complete de cod împreună cu mostrele de document din pachetul de procesare a revendicărilor.

Faza de captare a datelor

Reclamațiile și documentele sale justificative pot veni prin diverse canale, cum ar fi fax, e-mail, un portal de administrare și multe altele. Puteți stoca aceste documente într-un spațiu de stocare extrem de scalabil și durabil, cum ar fi Serviciul Amazon de stocare simplă (Amazon S3). Aceste documente pot fi de diferite tipuri, cum ar fi PDF, JPEG, PNG, TIFF și multe altele. Documentele pot veni în diferite formate și machete și pot veni de la diferite canale către depozitul de date.

Faza de clasificare

În etapa de clasificare a documentelor, putem combina Amazon Comprehend cu Amazon Texttract pentru a converti textul în context de document pentru a clasifica documentele care sunt stocate în etapa de captare a datelor. Apoi putem folosi clasificarea personalizată în Amazon Comprehend pentru a organiza documentele în clase pe care le-am definit în pachetul de procesare a revendicărilor. Clasificarea personalizată este de asemenea utilă pentru automatizarea procesului de verificare a documentelor și identificarea oricăror documente lipsă din pachet. Există doi pași în clasificarea personalizată, așa cum se arată în diagrama arhitecturii:

Extrageți text folosind Amazon Texttract din toate documentele din stocarea de date pentru a pregăti datele de antrenament pentru clasificatorul personalizat.
Antrenați un model de clasificare personalizat Amazon Comprehend (numit și a document clasifica) să recunoască clasele de interes pe baza conținutului textului.

Clasificarea documentelor pachetului de daune de asigurare

După ce modelul de clasificare personalizat Amazon Comprehend este antrenat, putem folosi punctul final în timp real pentru a clasifica documentele. Amazon Comprehend returnează toate clasele de documente cu un scor de încredere legat de fiecare clasă într-o serie de perechi cheie-valoare (Doc_name - Confidence_score). Vă recomandăm să parcurgeți codul de exemplu de clasificare detaliată a documentelor GitHub.

Faza de extracție

În faza de extracție, extragem date din documente folosind Amazon Texttract și Amazon Comprehend. Pentru această postare, utilizați următoarele documente eșantion în pachetul de procesare a cererilor de despăgubire: un formular de reclamație Center of Medicaid and Medicare Services (CMS)-1500, permis de conducere și ID de asigurare și factură.

Extrageți date dintr-un formular de revendicare CMS-1500

Formularul CMS-1500 este formularul de cerere standard utilizat de un furnizor sau furnizor non-instituțional pentru a factura transportatorilor Medicare.

Este important să procesați formularul CMS-1500 cu acuratețe, altfel poate încetini procesul de revendicare sau poate întârzia plata de către transportator. Cu Amazon Text AnalyzeDocument API, putem accelera procesul de extragere cu o precizie mai mare pentru a extrage text din documente pentru a înțelege mai multe informații din formularul de revendicare. Următorul este un exemplu de document al unui formular de revendicare CMS-1500.

Un formular de revendicare CMS1500

Acum folosim AnalyzeDocument API pentru a extrage două FeatureTypes, FORMS și TABLES, din document:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Următoarele rezultate au fost scurtate pentru o mai bună lizibilitate. Pentru informații mai detaliate, consultați Repo GitHub.

FORMS extragerea este identificată ca perechi cheie-valoare.

TABLES extracția conține celule, celule îmbinate și anteturi de coloană într-un tabel detectat în formularul de revendicare.

Extragerea tabelelor din formularul CMS1500

Extrageți date din documentele de identitate

Pentru documente de identitate, cum ar fi un ID de asigurare, care poate avea diferite aspecte, putem folosi Amazon Text AnalyzeDocument API. Noi folosim FeatureType FORMS ca configurație pentru AnalyzeDocument API pentru a extrage perechile cheie-valoare din ID-ul asigurării (consultați următorul exemplu):

Rulați următorul cod:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Obținem perechile cheie-valoare în tabloul de rezultate, așa cum se arată în următoarea captură de ecran.

Pentru documentele de identitate, cum ar fi un permis de conducere din SUA sau un pașaport din SUA, Amazon Texttract oferă asistență specializată pentru extragerea automată a termenilor cheie fără a fi nevoie de șabloane sau formate, spre deosebire de ceea ce am văzut mai devreme pentru exemplul de identificare a asigurării. Cu AnalyzeID API, companiile pot extrage rapid și precis informații din documentele de identitate care au diferite șabloane sau formate. The AnalyzeID API returnează două categorii de tipuri de date:

Perechi cheie-valoare disponibile pe ID, cum ar fi data nașterii, data emiterii, numărul ID, clasa și restricțiile
Câmpuri implicite din document care pot să nu aibă chei explicite asociate, cum ar fi numele, adresa și emitentul

Folosim următorul exemplu de permis de conducere din SUA din pachetul nostru de procesare a reclamațiilor.

Rulați următorul cod:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Următoarea captură de ecran arată rezultatul nostru.

Din captura de ecran cu rezultate, puteți observa că sunt prezentate anumite chei care nu se aflau în permisul de conducere în sine. De exemplu, Veteran nu este o cheie găsită în licență; cu toate acestea, este o cheie-valoare pre-populată care AnalyzeID suporturi, datorită diferențelor constatate în licențe între state.

Extrageți date din facturi și chitanțe

În mod similar cu AnalyzeID API, the AnalyzeExpense API oferă suport specializat pentru facturi și chitanțe pentru a extrage informații relevante, cum ar fi numele furnizorului, sumele subtotale și totale și multe altele din orice format de documente de factură. Nu aveți nevoie de niciun șablon sau configurație pentru extragere. Amazon Texttract folosește ML pentru a înțelege contextul facturilor ambigue, precum și al chitanțelor.

Mai jos este un exemplu de factură de asigurare medicală.

O mostră de factură de asigurare

Noi folosim AnalyzeExpense API pentru a vedea o listă de câmpuri standardizate. Câmpurile care nu sunt recunoscute ca câmpuri standard sunt clasificate ca OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Obținem următoarea listă de câmpuri ca perechi cheie-valoare (vezi captura de ecran din stânga) și întregul rând de elemente rând individuale achiziționate (vezi captura de ecran din dreapta) în rezultate.

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Concluzie

În această postare, am prezentat provocările comune în procesarea cererilor și modul în care putem folosi serviciile AWS AI pentru a automatiza o conductă inteligentă de procesare a documentelor pentru a soluționa automat o cerere. Am văzut cum să clasificăm documentele în diferite clase de documente folosind un clasificator personalizat Amazon Comprehend și cum să folosim Amazon Texttract pentru a extrage tipuri de documente nestructurate, semi-structurate, structurate și specializate.

In Partea 2, extindem faza de extracție cu Amazon Texttract. De asemenea, folosim entități predefinite Amazon Comprehend și entități personalizate pentru a îmbogăți datele și arătăm cum să extindem conducta IDP pentru a se integra cu serviciile de analiză și vizualizare pentru procesare ulterioară.

Vă recomandăm să examinați secțiunile de securitate ale Text Amazon, Amazon Comprehend, și Amazon A2I documentație și respectând îndrumările furnizate. Pentru a afla mai multe despre prețul soluției, consultați detaliile de preț ale Text Amazon, Amazon Comprehend, și Amazon A2I.

Despre Autori

Chinmayee Rane este arhitect specializat în soluții AI/ML la Amazon Web Services. Este pasionată de matematică aplicată și învățare automată. Ea se concentrează pe proiectarea de soluții inteligente de procesare a documentelor pentru clienții AWS. În afara serviciului, îi place dansul salsa și bachata.

Sonali Sahu conduce echipa Intelligent Document Processing AI/ML Solutions Architect la Amazon Web Services. Este o tehnofilă pasionată și îi place să lucreze cu clienții pentru a rezolva probleme complexe folosind inovația. Domeniul ei principal de atenție este inteligența artificială și învățarea automată pentru procesarea inteligentă a documentelor.

Tim Condello este arhitect senior în soluții de specialitate AI/ML la Amazon Web Services. Accentul său este procesarea limbajului natural și viziunea computerizată. Lui Tim îi place să preia ideile clienților și să le transforme în soluții scalabile.

Timestamp-ul: Noiembrie 3, 2022Noiembrie 4, 2022

Timestamp-ul: 2 Mai, 2023

Procesarea inteligentă a documentelor cu serviciile AWS AI în industria asigurărilor: partea 1

Republicat de Platon

Prezentare generală a soluțiilor

Cerințe preliminare

Faza de captare a datelor

Faza de clasificare

Faza de extracție

Extrageți date dintr-un formular de revendicare CMS-1500

Extrageți date din documentele de identitate

Extrageți date din facturi și chitanțe

Concluzie

Despre Autori

Mai mult de la Învățare automată AWS

Creați seturi de date pregătite pentru învățarea automată din Amazon SageMaker Offline Feature Store utilizând Amazon SageMaker Python SDK | Amazon Web Services

Călătoria asistentului virtual AI generativ al PGA TOUR, de la concept la dezvoltare până la prototip | Amazon Web Services

Implementarea Amazon Forecast în industria de retail: o călătorie de la POC la producție

Personalizați-vă recomandările prin promovarea anumitor articole folosind regulile de afaceri cu Amazon Personalize

Vă prezentăm programul model personalizat al AWS Generative AI Innovation Center pentru Anthropic Claude | Amazon Web Services

Accelerați fluxurile de lucru multilingve cu o soluție de traducere personalizabilă construită cu Amazon Translate

Modele de găzduire a modelelor în SageMaker: cele mai bune practici în testarea și actualizarea modelelor pe SageMaker

Amazon SageMaker cu TensorBoard: O prezentare generală a experienței TensorBoard găzduite

Despre noi

Căutare verticală și Ai

Platformă

Rămâneți conectat

Cont