Arukas dokumenditöötlus AWS-i tehisintellekti teenustega kindlustustööstuses: 1. osa

Taasavaldanud Platon

järgijaid: 0

Intelligentse dokumenditöötluse (IDP) eesmärk on aidata teie organisatsioonil teha kiiremaid ja täpsemaid otsuseid, rakendades teie paberitöö töötlemiseks tehisintellekti. See kaheosaline seeria tõstab esile AWS AI tehnoloogiad, mida kindlustusseltsid saavad kasutada oma äriprotsesside kiirendamiseks. Neid tehisintellekti tehnoloogiaid saab kasutada kindlustusjuhtumite puhul, nagu nõuded, kindlustusandmine, klientide kirjavahetus, lepingud või vaidluste lahendamise lahendamine. See seeria keskendub nõuete töötlemise kasutamise juhtumile kindlustussektoris; AWS IDP lahenduse põhikontseptsioonide kohta lisateabe saamiseks vaadake järgmist kaheosaline sari.

Nõuete töötlemine koosneb mitmest töövoo kontrollpunktist, mis on vajalikud nõude ülevaatamiseks, autentsuse kontrollimiseks ja õige rahalise vastutuse kindlaksmääramiseks. Kindlustusseltsid läbivad need nõuete kontrollpunktid enne nõuete lahendamist. Kui nõue läbib kõik need kontrollpunktid probleemideta, kiidab kindlustusselts selle heaks ja töötleb kõik maksed. Siiski võivad nad nõuda nõude lahendamiseks täiendavat tõendavat teavet. See nõuete töötlemise protsess on sageli käsitsi, mis muudab selle kulukaks, veaohtlikuks ja aeganõudvaks. Kindlustuskliendid saavad seda protsessi automatiseerida, kasutades AWS AI teenuseid, et automatiseerida nõuete töötlemise dokumentide töötlemise torujuhe.

Selles kaheosalises seerias tutvustame teile, kuidas saate kindlustusnõuete töötlemisel kasutatavate juhtumite puhul AWS AI teenuste abil dokumente ulatuslikult automatiseerida ja arukalt töödelda.

Arukas dokumenditöötlus AWS AI ja Analyticsi teenustega kindlustussektoris

Lahenduse ülevaade

Järgmine diagramm kujutab iga etappi, mida tavaliselt IDP-konveieris näeme. Vaatame läbi kõik need etapid ja kuidas need on seotud nõuete taotlemise protsessi etappidega, alustades taotluse esitamisest kuni taotluse uurimise ja sulgemiseni. Selles postituses käsitleme andmete kogumise, klassifitseerimise ja ekstraheerimise etappide tehnilisi üksikasju. sisse Osa 2, laiendame dokumentide väljavõtmise etappi ja jätkame dokumentide rikastamist, ülevaatamist ja kontrollimist ning laiendame lahendust, et pakkuda nõuete pettuse kasutamise juhtumite jaoks analüüsi ja visualiseerimisi.

Järgmine arhitektuuriskeem näitab IDP-konveieri faasides kasutatavaid erinevaid AWS-teenuseid vastavalt nõuete töötlemise rakenduse erinevatele etappidele.

IDP arhitektuuri diagramm

Lahendus kasutab järgmisi võtmeteenuseid:

Amazoni tekst on masinõppe (ML) teenus, mis eraldab skannitud dokumentidest automaatselt teksti, käsitsikirja ja andmed. Vormide ja tabelite andmete tuvastamine, mõistmine ja eraldamine läheb kaugemale lihtsast optilisest märgituvastusest (OCR). Amazon Textract kasutab ML-i mis tahes tüüpi dokumentide lugemiseks ja töötlemiseks, ekstraheerides teksti, käsitsikirja, tabelid ja muud andmed täpselt ilma käsitsi tehtud pingutusteta.
Amazoni mõistmine on loomuliku keele töötlemise (NLP) teenus, mis kasutab tekstist ülevaate saamiseks ML-i. Amazon Comprehend suudab tuvastada selliseid üksusi nagu isik, asukoht, kuupäev, kogus ja palju muud. Samuti suudab see tuvastada domineeriva keele, isikut tuvastava teabe (PII) teabe ja liigitada dokumendid vastavasse klassi.
Amazoni laiendatud AI (Amazon A2I) on ML-teenus, mis muudab inimese ülevaatamiseks vajalike töövoogude loomise lihtsaks. Amazon A2I toob kõigi arendajateni inimülevaate, kõrvaldades eristamata rasked raskused, mis on seotud inimeste ülevaatussüsteemide ehitamise või suure hulga inimülevaatajate haldamisega. Amazon A2I integreerib mõlemad Amazoni tekst ja Amazoni mõistmine et võimaldada inimese läbivaatamist või valideerimist IDP töövoos.

Eeldused

Järgmistes osades käsitleme erinevaid teenuseid, mis on seotud arhitektuuri esimese kolme faasiga, st andmete kogumise, klassifitseerimise ja ekstraheerimise etapiga.

Vaadake meie GitHubi hoidla täielike koodinäidiste jaoks koos nõuete töötlemise paketi dokumendinäidistega.

Andmete kogumise faas

Nõuded ja seda tõendavad dokumendid võivad tulla erinevate kanalite kaudu, nagu faks, e-kiri, administraatoriportaal ja palju muud. Saate neid dokumente salvestada hästi skaleeritavas ja vastupidavas salvestusruumis, näiteks Amazoni lihtne salvestusteenus (Amazon S3). Need dokumendid võivad olla erinevat tüüpi, näiteks PDF, JPEG, PNG, TIFF ja palju muud. Dokumendid võivad olla erinevas vormingus ja paigutuses ning need võivad tulla andmesalve erinevatest kanalitest.

Klassifikatsiooni faas

Dokumendi klassifitseerimise etapis saame ühendada Amazon Comprehendi Amazon Textractiga, et teisendada tekst dokumendi kontekstiks, et klassifitseerida andmete kogumise etapis salvestatud dokumendid. Seejärel saame kasutada kohandatud klassifikatsiooni rakenduses Amazon Comprehend, et korraldada dokumente klassidesse, mille määratlesime nõuete töötlemise paketis. Kohandatud klassifikatsioon on abiks ka dokumentide kontrollimise protsessi automatiseerimiseks ja paketist puuduvate dokumentide tuvastamiseks. Kohandatud klassifikatsioonis on kaks etappi, nagu on näidatud arhitektuuriskeemil:

Treeningute andmete ettevalmistamiseks kohandatud klassifikaatori jaoks eemaldage kõigist andmesalvestuses olevatest dokumentidest tekst Amazon Textracti abil.
Treenige Amazon Comprehendi kohandatud klassifitseerimismudelit (nimetatakse ka a dokument klassifikaator) huvipakkuvate klasside äratundmiseks teksti sisu põhjal.

Kindlustusnõuete paketi dokumendi klassifikatsioon

Pärast Amazon Comprehendi kohandatud klassifitseerimismudeli väljaõpetamist saame dokumentide klassifitseerimiseks kasutada reaalajas lõpp-punkti. Amazon Comprehend tagastab kõik dokumendiklassid usaldusskooriga, mis on seotud iga klassiga võtme-väärtuste paaride massiivina (Doc_name - Confidence_score). Soovitame tutvuda üksikasjaliku dokumendi klassifikatsiooni näidiskoodiga GitHub.

Ekstraheerimise faas

Väljavõttefaasis eraldame dokumentidest andmed Amazon Textracti ja Amazon Comprehendi abil. Selle postituse jaoks kasutage nõuete töötlemise paketis järgmisi näidisdokumente: Medicaidi ja Medicare Services (CMS)-1500 nõudevorm, juhiluba ja kindlustus-ID ning arve.

Andmete väljavõte nõudevormist CMS-1500

CMS-1500 vorm on standardne nõudevorm, mida kasutab mitteinstitutsiooniline teenusepakkuja või tarnija Medicare'i vedajatele arvete esitamiseks.

Oluline on vormi CMS-1500 täpselt töödelda, vastasel juhul võib see aeglustada nõuete menetlemist või vedaja makset. Amazoni tekstiga AnalyzeDocument API, saame ekstraheerimisprotsessi kiirendada suurema täpsusega, et eraldada dokumentidest teksti, et mõista nõudevormi täiendavaid teadmisi. Järgmine on CMS-1500 nõudevormi näidisdokument.

Nõudevorm CMS1500

Nüüd kasutame AnalyzeDocument API kahe ekstraheerimiseks FeatureTypes, FORMS ja TABLES, dokumendist:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Järgmised tulemused on parema loetavuse huvides lühendatud. Täpsema teabe saamiseks vaadake meie GitHubi repo.

. FORMS ekstraheerimine identifitseeritakse võtme-väärtuse paaridena.

. TABLES ekstrakt sisaldab lahtreid, ühendatud lahtreid ja veerupäiseid nõudevormi tuvastatud tabelis.

Tabelite ekstraheerimine vormist CMS1500

Andmete väljavõte isikut tõendavatest dokumentidest

Isikut tõendavate dokumentide (nt kindlustus-ID) jaoks, millel võib olla erinev paigutus, saame kasutada Amazon Textracti AnalyzeDocument API. Me kasutame FeatureType FORMS konfiguratsioonina AnalyzeDocument API võtme-väärtuste paaride eraldamiseks kindlustus-ID-st (vt järgmist näidist):

Käivitage järgmine kood:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Me saame võtme-väärtuse paarid tulemuste massiivi, nagu on näidatud järgmisel ekraanipildil.

ID-dokumentide puhul, nagu USA juhiluba või USA pass, pakub Amazon Textract spetsiaalset tuge võtmeterminite automaatseks ekstraheerimiseks, ilma et oleks vaja malle või vorminguid, erinevalt sellest, mida nägime varem kindlustuse ID näite puhul. Koos AnalyzeID API, ettevõtted saavad kiiresti ja täpselt hankida teavet ID-dokumentidest, millel on erinevad mallid või vormingud. The AnalyzeID API tagastab kahte andmetüüpide kategooriat:

ID-l saadaolevad võtme-väärtuste paarid, nagu sünnikuupäev, väljaandmise kuupäev, ID-number, klass ja piirangud
Dokumendi kaudsed väljad, millega ei pruugi olla seotud selgesõnalisi võtmeid, nagu nimi, aadress ja väljaandja

Kasutame oma nõuete töötlemise paketist järgmist USA juhiloa näidist.

Käivitage järgmine kood:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Järgmine ekraanipilt näitab meie tulemust.

Tulemuste ekraanipildilt näete, et kuvatakse teatud võtmed, mida juhiloal endal polnud. Näiteks, Veteran ei ole litsentsist leitud võtit; see on aga eeltäidetud võtmeväärtus AnalyzeID toetab osariikidevaheliste litsentside erinevuste tõttu.

Andmete väljavõte arvetest ja kviitungitest

Sarnaselt AnalyzeID API, AnalyzeExpense API pakub spetsiaalset tuge arvetele ja kviitungitele, et hankida mis tahes vormingus arvedokumentidest asjakohast teavet, nagu hankija nimi, vahesumma ja kogusumma ning palju muud. Te ei vaja ekstraheerimiseks ühtegi malli ega konfiguratsiooni. Amazon Textract kasutab ML-i, et mõista ebaselgete arvete ja kviitungite konteksti.

Alljärgnev on ravikindlustuse arve näidis.

Kindlustusarve näidis

Me kasutame AnalyzeExpense API, et näha standardiseeritud väljade loendit. Väljad, mida ei tunnistata standardväljadeks, liigitatakse järgmiselt OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Saame järgmise väljade loendi võtme-väärtuse paaridena (vt vasakul olevat ekraanipilti) ja tulemustes terve rea üksikute ostetud reaüksuste (vt paremal olevat ekraanipilti).

Arukas dokumenditöötlus AWS AI teenustega kindlustussektoris: 1. osa PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Järeldus

Selles postituses tutvustasime levinumaid väljakutseid nõuete töötlemisel ja seda, kuidas saame kasutada AWS-i AI teenuseid intelligentse dokumenditöötluse torujuhtme automatiseerimiseks nõude automaatseks lahendamiseks. Nägime, kuidas klassifitseerida dokumente erinevatesse dokumendiklassidesse, kasutades kohandatud klassifikaatorit Amazon Comprehend, ja kuidas kasutada Amazon Textracti struktureerimata, poolstruktureeritud, struktureeritud ja spetsiaalsete dokumenditüüpide eraldamiseks.

In Osa 2, laiendame ekstraheerimisfaasi Amazon Textractiga. Samuti kasutame andmete rikastamiseks Amazon Comprehendi eelmääratletud üksusi ja kohandatud üksusi ning näitame, kuidas IDP-konveieri laiendada, et integreeruda edasiseks töötlemiseks analüüsi- ja visualiseerimisteenustega.

Soovitame tutvuda turvalisuse jaotistega Amazoni tekst, Amazon Comprehend, ja Amazon A2I dokumentatsiooni ja järgides antud juhiseid. Lahenduse hinnakujunduse kohta lisateabe saamiseks vaadake üle hinnakujunduse üksikasjad Amazoni tekst, Amazoni mõistmineja Amazon A2I.

Autoritest

Chinmayee Rane on AI/ML spetsialistilahenduste arhitekt ettevõttes Amazon Web Services. Ta on kirglik rakendusmatemaatika ja masinõppe vastu. Ta keskendub intelligentsete dokumenditöötluslahenduste kavandamisele AWS-i klientidele. Väljaspool tööd naudib ta salsat ja bachata tantsu.

Sonali Sahu juhib Amazon Web Servicesi intelligentse dokumenditöötluse AI/ML Solutions Architect meeskonda. Ta on kirglik tehnofiil ja naudib koostööd klientidega, et lahendada keerulisi probleeme uuenduste abil. Tema põhivaldkonnaks on tehisintellekt ja masinõpe intelligentseks dokumenditöötluseks.

Tim Condello on AI/ML-lahenduste vanemarhitekt ettevõttes Amazon Web Services. Tema fookuses on loomulik keeletöötlus ja arvutinägemine. Tim naudib klientide ideede võtmist ja nende skaleeritavateks lahendusteks muutmist.

Ajatempel: November 3, 2022November 4, 2022

Ajatempel: Võib 2 2023

Arukas dokumenditöötlus AWS AI teenustega kindlustussektoris: 1. osa

Taasavaldanud Platon

Lahenduse ülevaade

Eeldused

Andmete kogumise faas

Klassifikatsiooni faas

Ekstraheerimise faas

Andmete väljavõte nõudevormist CMS-1500

Andmete väljavõte isikut tõendavatest dokumentidest

Andmete väljavõte arvetest ja kviitungitest

Järeldus

Autoritest

Veel alates AWS-i masinõpe

Looge Amazon SageMakeri võrguühenduseta funktsioonipoest masinõppeks valmis andmekogusid, kasutades Amazon SageMaker Python SDK-d | Amazoni veebiteenused

PGA TOURi generatiivse AI virtuaalse assistendi teekond kontseptsioonist arenduseni prototüübini | Amazoni veebiteenused

Amazon Forecasti rakendamine jaekaubanduses: teekond POC-st tootmiseni

Kohandage oma soovitusi, reklaamides Amazon Personalize'iga ärireegleid kasutades konkreetseid üksusi

Tutvustame AWS Generative AI Innovation Centeri kohandatud mudelprogrammi antropilisele Claude'ile | Amazoni veebiteenused

Kiirendage mitmekeelseid töövooge Amazon Translate'i abil loodud kohandatava tõlkelahendusega

Mudelite hostimise mustrid SageMakeris: SageMakeri mudelite testimise ja värskendamise parimad tavad

Amazon SageMaker koos TensorBoardiga: ülevaade hostitud TensorBoardi kogemusest

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto