Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Inteligentna obdelava dokumentov s storitvami AWS AI v zavarovalništvu: 1. del

Cilj inteligentne obdelave dokumentov (IDP) je pomagati vaši organizaciji sprejemati hitrejše in natančnejše odločitve z uporabo umetne inteligence za obdelavo vaše dokumentacije. Ta dvodelna serija poudarja tehnologije umetne inteligence AWS, ki jih lahko zavarovalnice uporabijo za pospešitev svojih poslovnih procesov. Te tehnologije umetne inteligence je mogoče uporabiti v primerih uporabe zavarovanja, kot so zahtevki, sklepanje zavarovanj, korespondenca s strankami, pogodbe ali reševanje sporov. Ta serija se osredotoča na primer uporabe obdelave zahtevkov v zavarovalništvu; za več informacij o temeljnih konceptih rešitve AWS IDP glejte naslednje serija iz dveh delov.

Obdelava zahtevkov je sestavljena iz več kontrolnih točk v delovnem toku, ki je potreben za pregled, preverjanje pristnosti in določitev pravilne finančne odgovornosti za razsojanje zahtevka. Zavarovalnice gredo skozi te kontrolne točke za odškodninske zahtevke, preden odločijo o zahtevkih. Če zahtevek uspešno prestane vse te kontrolne točke brez težav, ga zavarovalnica odobri in obdela vsa plačila. Vendar pa lahko zahtevajo dodatne podporne informacije za razsodbo o zahtevku. Ta postopek obdelave zahtevkov je pogosto ročni, zaradi česar je drag, nagnjen k napakam in dolgotrajen. Zavarovalniške stranke lahko ta postopek avtomatizirajo s storitvami AWS AI za avtomatizacijo cevovoda za obdelavo dokumentov za obdelavo zahtevkov.

V tej dvodelni seriji vas popeljemo skozi to, kako lahko avtomatizirate in inteligentno obdelate dokumente v velikem obsegu z uporabo storitev AI AWS za primer uporabe za obdelavo zavarovalnih zahtevkov.

Inteligentna obdelava dokumentov z AWS AI in storitvami Analytics v zavarovalništvu

Pregled rešitev

Naslednji diagram predstavlja vsako stopnjo, ki jo običajno vidimo v cevovodu IDP. Sprehodimo se skozi vsako od teh stopenj in kako se povezujejo s koraki, ki so vključeni v postopek prijave zahtevkov, od trenutka, ko je prijava oddana, do preiskave in zaključka prijave. V tej objavi obravnavamo tehnične podrobnosti stopenj zajemanja, razvrščanja in ekstrakcije podatkov. notri Del 2, razširimo fazo ekstrakcije dokumentov in nadaljujemo z obogatitvijo dokumentov, pregledovanjem in preverjanjem ter razširimo rešitev za zagotavljanje analitike in vizualizacij za primer uporabe goljufije terjatev.

Naslednji diagram arhitekture prikazuje različne storitve AWS, ki se uporabljajo med fazami cevovoda IDP glede na različne stopnje aplikacije za obdelavo zahtevkov.

Diagram arhitekture IDP

Rešitev uporablja naslednje ključne storitve:

  • Amazonovo besedilo je storitev strojnega učenja (ML), ki samodejno izvleče besedilo, rokopis in podatke iz skeniranih dokumentov. Presega preprosto optično prepoznavanje znakov (OCR) za prepoznavanje, razumevanje in ekstrahiranje podatkov iz obrazcev in tabel. Amazon Texttract uporablja ML za branje in obdelavo vseh vrst dokumentov, pri čemer natančno ekstrahira besedilo, rokopis, tabele in druge podatke brez ročnega napora.
  • Amazonsko razumevanje je storitev za obdelavo naravnega jezika (NLP), ki uporablja ML za pridobivanje vpogledov iz besedila. Amazon Comprehend lahko zazna entitete, kot so oseba, lokacija, datum, količina in drugo. Prav tako lahko zazna prevladujoč jezik, informacije o osebnih podatkih (PII) in razvrsti dokumente v njihov ustrezni razred.
  • Amazon, razširjeni AI (Amazon A2I) je storitev ML, ki olajša gradnjo delovnih tokov, potrebnih za človeški pregled. Amazon A2I prinaša človeški pregled vsem razvijalcem, s čimer odstrani nediferencirano težko delo, povezano z gradnjo sistemov človeškega pregleda ali upravljanjem velikega števila človeških pregledovalcev. Amazon A2I združuje oboje z Amazonovo besedilo in Amazonsko razumevanje zagotoviti možnost uvedbe človeškega pregleda ali validacije v potek dela IDP.

Predpogoji

V naslednjih razdelkih se sprehodimo skozi različne storitve, ki se nanašajo na prve tri faze arhitekture, tj. faze zajemanja, razvrščanja in ekstrakcije podatkov.

Glejte naše GitHub repozitorij za celotne vzorce kode skupaj z vzorci dokumentov v paketu za obdelavo zahtevkov.

Faza zajema podatkov

Zahtevki in spremljajoči dokumenti lahko pridejo prek različnih kanalov, kot so faks, e-pošta, skrbniški portal itd. Te dokumente lahko shranite v visoko razširljivo in trajno shrambo, kot je Preprosta storitev shranjevanja Amazon (Amazon S3). Ti dokumenti so lahko različnih vrst, kot so PDF, JPEG, PNG, TIFF itd. Dokumenti so lahko v različnih formatih in postavitvah ter lahko prihajajo iz različnih kanalov v shrambo podatkov.

Faza razvrščanja

V fazi razvrščanja dokumentov lahko združimo Amazon Comprehend z Amazon Texttract za pretvorbo besedila v kontekst dokumenta za razvrščanje dokumentov, ki so shranjeni v fazi zajemanja podatkov. Nato lahko uporabimo klasifikacijo po meri v Amazon Comprehend za organiziranje dokumentov v razrede, ki smo jih definirali v paketu za obdelavo zahtevkov. Razvrščanje po meri je prav tako koristno za avtomatizacijo postopka preverjanja dokumentov in prepoznavanje morebitnih manjkajočih dokumentov v paketu. Pri razvrščanju po meri sta dva koraka, kot je prikazano v diagramu arhitekture:

  1. Ekstrahirajte besedilo z uporabo Amazon Texttract iz vseh dokumentov v shrambi podatkov, da pripravite podatke za usposabljanje za klasifikator po meri.
  2. Usposobite model klasifikacije po meri Amazon Comprehend (imenovan tudi a dokument klasifikator) za prepoznavanje interesnih razredov glede na vsebino besedila.

Razvrstitev dokumenta paketa zavarovalnih zahtevkov

Ko je model klasifikacije po meri Amazon Comprehend usposobljen, lahko uporabimo končno točko v realnem času za klasifikacijo dokumentov. Amazon Comprehend vrne vse razrede dokumentov z rezultatom zaupanja, povezanim z vsakim razredom v nizu parov ključ-vrednost (Doc_name - Confidence_score). Priporočamo, da si ogledate vzorčno kodo podrobne klasifikacije dokumentov GitHub.

Faza ekstrakcije

V fazi ekstrakcije podatke ekstrahiramo iz dokumentov s pomočjo Amazon Texttract in Amazon Comprehend. Za to objavo uporabite naslednje vzorčne dokumente v paketu za obdelavo zahtevkov: Center of Medicaid and Medicare Services (CMS)-1500 obrazec za zahtevek, vozniško dovoljenje in ID zavarovanja ter račun.

Izvlecite podatke iz obrazca zahtevka CMS-1500

Obrazec CMS-1500 je standardni obrazec zahtevka, ki ga uporablja neinstitucionalni ponudnik ali dobavitelj za zaračunavanje prevoznikom Medicare.

Pomembno je, da obrazec CMS-1500 obdelate natančno, sicer lahko upočasni postopek zahtevkov ali zakasni plačilo s strani prevoznika. Z Amazonskim besedilom AnalyzeDocument API, lahko pospešimo postopek ekstrakcije z večjo natančnostjo, da izvlečemo besedilo iz dokumentov, da bi razumeli nadaljnje vpoglede v obrazec zahtevka. Sledi vzorec dokumenta obrazca zahtevka CMS-1500.

Obrazec za zahtevek CMS1500

Zdaj uporabljamo AnalyzeDocument API za ekstrahiranje dveh FeatureTypes, FORMS in TABLES, iz dokumenta:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Naslednji rezultati so bili zaradi boljše berljivosti skrajšani. Za podrobnejše informacije si oglejte našo Repo za GitHub.

O FORMS ekstrakcija je identificirana kot pari ključ-vrednost.

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

O TABLES ekstrakcija vsebuje celice, spojene celice in glave stolpcev znotraj zaznane tabele v obrazcu zahtevka.

Izvleček tabel iz obrazca CMS1500

Izvlecite podatke iz osebnih dokumentov

Za osebne dokumente, kot je izkaznica zavarovanja, ki imajo lahko različne postavitve, lahko uporabimo Amazon Texttract AnalyzeDocument API. Uporabljamo FeatureType FORMS kot konfiguracija za AnalyzeDocument API za ekstrahiranje parov ključ-vrednost iz ID-ja zavarovanja (glejte naslednji vzorec):

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Zaženite naslednjo kodo:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

V nizu rezultatov dobimo pare ključ-vrednost, kot je prikazano na naslednjem posnetku zaslona.

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Za osebne dokumente, kot je ameriško vozniško dovoljenje ali ameriški potni list, Amazon Texttract zagotavlja specializirano podporo za samodejno ekstrahiranje ključnih izrazov brez potrebe po predlogah ali formatih, za razliko od tistega, kar smo videli prej pri primeru ID-ja zavarovanja. z AnalyzeID API, lahko podjetja hitro in natančno izvlečejo informacije iz osebnih dokumentov, ki imajo različne predloge ali formate. The AnalyzeID API vrne dve kategoriji tipov podatkov:

  • Pari ključ-vrednost, ki so na voljo v ID-ju, kot so datum rojstva, datum izdaje, številka ID-ja, razred in omejitve
  • Implicitna polja v dokumentu, ki morda nimajo povezanih eksplicitnih ključev, kot so ime, naslov in izdajatelj

Uporabljamo naslednji vzorec vozniškega dovoljenja ZDA iz našega paketa za obdelavo zahtevkov.

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Zaženite naslednjo kodo:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Naslednji posnetek zaslona prikazuje naš rezultat.

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Iz posnetka zaslona z rezultati lahko opazite, da so predstavljeni nekateri ključi, ki jih ni bilo v samem vozniškem dovoljenju. na primer Veteran ni ključ v licenci; vendar je to vnaprej izpolnjen ključ-vrednost, ki AnalyzeID podpira, zaradi razlik v licencah med državami.

Izvlecite podatke iz računov in potrdil

Podoben AnalyzeID API, AnalyzeExpense API nudi specializirano podporo za račune in potrdila za pridobivanje ustreznih informacij, kot so ime prodajalca, vmesni seštevek in skupni zneski ter drugo, iz katere koli oblike dokumentov z računi. Za ekstrakcijo ne potrebujete nobene predloge ali konfiguracije. Amazon Texttract uporablja ML za razumevanje konteksta dvoumnih računov in potrdil.

Sledi vzorec računa zdravstvenega zavarovanja.

Vzorec računa za zavarovanje

Mi uporabljamo AnalyzeExpense API za ogled seznama standardiziranih polj. Polja, ki niso prepoznana kot standardna polja, so kategorizirana kot OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

V rezultatih dobimo naslednji seznam polj kot pare ključ-vrednost (glejte posnetek zaslona na levi) in celotno vrstico posameznih kupljenih elementov vrstice (glejte posnetek zaslona na desni).

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai. Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

zaključek

V tej objavi smo predstavili pogoste izzive pri obdelavi zahtevkov in kako lahko uporabimo storitve umetne inteligence AWS za avtomatizacijo cevovoda za inteligentno obdelavo dokumentov za samodejno odločanje o zahtevku. Videli smo, kako razvrstiti dokumente v različne razrede dokumentov z uporabo klasifikatorja po meri Amazon Comprehend in kako uporabiti Amazon Texttract za ekstrahiranje nestrukturiranih, polstrukturiranih, strukturiranih in specializiranih vrst dokumentov.

In Del 2, razširimo fazo ekstrakcije z Amazon Texttract. Uporabljamo tudi vnaprej določene entitete Amazon Comprehend in entitete po meri za obogatitev podatkov in pokažemo, kako razširiti cevovod IDP za integracijo s storitvami analitike in vizualizacije za nadaljnjo obdelavo.

Priporočamo, da pregledate varnostne razdelke Amazonovo besedilo, Amazon Comprehend, in Amazon A2I dokumentacijo in upoštevanje navedenih smernic. Če želite izvedeti več o cenah rešitve, si oglejte podrobnosti o cenah Amazonovo besedilo, Amazonsko razumevanjein Amazon A2I.


O avtorjih

Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.Chinmayee Rane je specialist za rešitve AI/ML pri Amazon Web Services. Navdušena je nad uporabno matematiko in strojnim učenjem. Osredotoča se na oblikovanje inteligentnih rešitev za obdelavo dokumentov za stranke AWS. Zunaj službe uživa v plesu salse in bachate.


Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.
Sonali Sahu vodi skupino arhitektov rešitev Intelligent Document Processing AI/ML Solutions pri Amazon Web Services. Je strastna tehnofilka in uživa v delu s strankami pri reševanju kompleksnih problemov z uporabo inovacij. Njeno osrednje področje je umetna inteligenca in strojno učenje za inteligentno obdelavo dokumentov.


Intelligent document processing with AWS AI services in the insurance industry: Part 1 PlatoBlockchain Data Intelligence. Vertical Search. Ai.
Tim Condello je višji strokovnjak za rešitve AI/ML pri Amazon Web Services. Njegov fokus je obdelava naravnega jezika in računalniški vid. Tim uživa v sprejemanju idej strank in njihovem spreminjanju v prilagodljive rešitve.

Časovni žig:

Več od Strojno učenje AWS