Cilj inteligentne obdelave dokumentov (IDP) je pomagati vaši organizaciji sprejemati hitrejše in natančnejše odločitve z uporabo umetne inteligence za obdelavo vaše dokumentacije. Ta dvodelna serija poudarja tehnologije umetne inteligence AWS, ki jih lahko zavarovalnice uporabijo za pospešitev svojih poslovnih procesov. Te tehnologije umetne inteligence je mogoče uporabiti v primerih uporabe zavarovanja, kot so zahtevki, sklepanje zavarovanj, korespondenca s strankami, pogodbe ali reševanje sporov. Ta serija se osredotoča na primer uporabe obdelave zahtevkov v zavarovalništvu; za več informacij o temeljnih konceptih rešitve AWS IDP glejte naslednje serija iz dveh delov.
Obdelava zahtevkov je sestavljena iz več kontrolnih točk v delovnem toku, ki je potreben za pregled, preverjanje pristnosti in določitev pravilne finančne odgovornosti za razsojanje zahtevka. Zavarovalnice gredo skozi te kontrolne točke za odškodninske zahtevke, preden odločijo o zahtevkih. Če zahtevek uspešno prestane vse te kontrolne točke brez težav, ga zavarovalnica odobri in obdela vsa plačila. Vendar pa lahko zahtevajo dodatne podporne informacije za razsodbo o zahtevku. Ta postopek obdelave zahtevkov je pogosto ročni, zaradi česar je drag, nagnjen k napakam in dolgotrajen. Zavarovalniške stranke lahko ta postopek avtomatizirajo s storitvami AWS AI za avtomatizacijo cevovoda za obdelavo dokumentov za obdelavo zahtevkov.
V tej dvodelni seriji vas popeljemo skozi to, kako lahko avtomatizirate in inteligentno obdelate dokumente v velikem obsegu z uporabo storitev AI AWS za primer uporabe za obdelavo zavarovalnih zahtevkov.
Inteligentna obdelava dokumentov z AWS AI in storitvami Analytics v zavarovalništvu |
Pregled rešitev
Naslednji diagram predstavlja vsako stopnjo, ki jo običajno vidimo v cevovodu IDP. Sprehodimo se skozi vsako od teh stopenj in kako se povezujejo s koraki, ki so vključeni v postopek prijave zahtevkov, od trenutka, ko je prijava oddana, do preiskave in zaključka prijave. V tej objavi obravnavamo tehnične podrobnosti stopenj zajemanja, razvrščanja in ekstrakcije podatkov. notri Del 2, razširimo fazo ekstrakcije dokumentov in nadaljujemo z obogatitvijo dokumentov, pregledovanjem in preverjanjem ter razširimo rešitev za zagotavljanje analitike in vizualizacij za primer uporabe goljufije terjatev.
Naslednji diagram arhitekture prikazuje različne storitve AWS, ki se uporabljajo med fazami cevovoda IDP glede na različne stopnje aplikacije za obdelavo zahtevkov.
Rešitev uporablja naslednje ključne storitve:
- Amazonovo besedilo je storitev strojnega učenja (ML), ki samodejno izvleče besedilo, rokopis in podatke iz skeniranih dokumentov. Presega preprosto optično prepoznavanje znakov (OCR) za prepoznavanje, razumevanje in ekstrahiranje podatkov iz obrazcev in tabel. Amazon Texttract uporablja ML za branje in obdelavo vseh vrst dokumentov, pri čemer natančno ekstrahira besedilo, rokopis, tabele in druge podatke brez ročnega napora.
- Amazonsko razumevanje je storitev za obdelavo naravnega jezika (NLP), ki uporablja ML za pridobivanje vpogledov iz besedila. Amazon Comprehend lahko zazna entitete, kot so oseba, lokacija, datum, količina in drugo. Prav tako lahko zazna prevladujoč jezik, informacije o osebnih podatkih (PII) in razvrsti dokumente v njihov ustrezni razred.
- Amazon, razširjeni AI (Amazon A2I) je storitev ML, ki olajša gradnjo delovnih tokov, potrebnih za človeški pregled. Amazon A2I prinaša človeški pregled vsem razvijalcem, s čimer odstrani nediferencirano težko delo, povezano z gradnjo sistemov človeškega pregleda ali upravljanjem velikega števila človeških pregledovalcev. Amazon A2I združuje oboje z Amazonovo besedilo in Amazonsko razumevanje zagotoviti možnost uvedbe človeškega pregleda ali validacije v potek dela IDP.
Predpogoji
V naslednjih razdelkih se sprehodimo skozi različne storitve, ki se nanašajo na prve tri faze arhitekture, tj. faze zajemanja, razvrščanja in ekstrakcije podatkov.
Glejte naše GitHub repozitorij za celotne vzorce kode skupaj z vzorci dokumentov v paketu za obdelavo zahtevkov.
Faza zajema podatkov
Zahtevki in spremljajoči dokumenti lahko pridejo prek različnih kanalov, kot so faks, e-pošta, skrbniški portal itd. Te dokumente lahko shranite v visoko razširljivo in trajno shrambo, kot je Preprosta storitev shranjevanja Amazon (Amazon S3). Ti dokumenti so lahko različnih vrst, kot so PDF, JPEG, PNG, TIFF itd. Dokumenti so lahko v različnih formatih in postavitvah ter lahko prihajajo iz različnih kanalov v shrambo podatkov.
Faza razvrščanja
V fazi razvrščanja dokumentov lahko združimo Amazon Comprehend z Amazon Texttract za pretvorbo besedila v kontekst dokumenta za razvrščanje dokumentov, ki so shranjeni v fazi zajemanja podatkov. Nato lahko uporabimo klasifikacijo po meri v Amazon Comprehend za organiziranje dokumentov v razrede, ki smo jih definirali v paketu za obdelavo zahtevkov. Razvrščanje po meri je prav tako koristno za avtomatizacijo postopka preverjanja dokumentov in prepoznavanje morebitnih manjkajočih dokumentov v paketu. Pri razvrščanju po meri sta dva koraka, kot je prikazano v diagramu arhitekture:
- Ekstrahirajte besedilo z uporabo Amazon Texttract iz vseh dokumentov v shrambi podatkov, da pripravite podatke za usposabljanje za klasifikator po meri.
- Usposobite model klasifikacije po meri Amazon Comprehend (imenovan tudi a dokument klasifikator) za prepoznavanje interesnih razredov glede na vsebino besedila.
Ko je model klasifikacije po meri Amazon Comprehend usposobljen, lahko uporabimo končno točko v realnem času za klasifikacijo dokumentov. Amazon Comprehend vrne vse razrede dokumentov z rezultatom zaupanja, povezanim z vsakim razredom v nizu parov ključ-vrednost (Doc_name
- Confidence_score
). Priporočamo, da si ogledate vzorčno kodo podrobne klasifikacije dokumentov GitHub.
Faza ekstrakcije
V fazi ekstrakcije podatke ekstrahiramo iz dokumentov s pomočjo Amazon Texttract in Amazon Comprehend. Za to objavo uporabite naslednje vzorčne dokumente v paketu za obdelavo zahtevkov: Center of Medicaid and Medicare Services (CMS)-1500 obrazec za zahtevek, vozniško dovoljenje in ID zavarovanja ter račun.
Izvlecite podatke iz obrazca zahtevka CMS-1500
Obrazec CMS-1500 je standardni obrazec zahtevka, ki ga uporablja neinstitucionalni ponudnik ali dobavitelj za zaračunavanje prevoznikom Medicare.
Pomembno je, da obrazec CMS-1500 obdelate natančno, sicer lahko upočasni postopek zahtevkov ali zakasni plačilo s strani prevoznika. Z Amazonskim besedilom AnalyzeDocument
API, lahko pospešimo postopek ekstrakcije z večjo natančnostjo, da izvlečemo besedilo iz dokumentov, da bi razumeli nadaljnje vpoglede v obrazec zahtevka. Sledi vzorec dokumenta obrazca zahtevka CMS-1500.
Zdaj uporabljamo AnalyzeDocument
API za ekstrahiranje dveh FeatureTypes
, FORMS
in TABLES
, iz dokumenta:
Naslednji rezultati so bili zaradi boljše berljivosti skrajšani. Za podrobnejše informacije si oglejte našo Repo za GitHub.
O FORMS
ekstrakcija je identificirana kot pari ključ-vrednost.
O TABLES
ekstrakcija vsebuje celice, spojene celice in glave stolpcev znotraj zaznane tabele v obrazcu zahtevka.
Izvlecite podatke iz osebnih dokumentov
Za osebne dokumente, kot je izkaznica zavarovanja, ki imajo lahko različne postavitve, lahko uporabimo Amazon Texttract AnalyzeDocument
API. Uporabljamo FeatureType
FORMS
kot konfiguracija za AnalyzeDocument
API za ekstrahiranje parov ključ-vrednost iz ID-ja zavarovanja (glejte naslednji vzorec):
Zaženite naslednjo kodo:
V nizu rezultatov dobimo pare ključ-vrednost, kot je prikazano na naslednjem posnetku zaslona.
Za osebne dokumente, kot je ameriško vozniško dovoljenje ali ameriški potni list, Amazon Texttract zagotavlja specializirano podporo za samodejno ekstrahiranje ključnih izrazov brez potrebe po predlogah ali formatih, za razliko od tistega, kar smo videli prej pri primeru ID-ja zavarovanja. z AnalyzeID
API, lahko podjetja hitro in natančno izvlečejo informacije iz osebnih dokumentov, ki imajo različne predloge ali formate. The AnalyzeID
API vrne dve kategoriji tipov podatkov:
- Pari ključ-vrednost, ki so na voljo v ID-ju, kot so datum rojstva, datum izdaje, številka ID-ja, razred in omejitve
- Implicitna polja v dokumentu, ki morda nimajo povezanih eksplicitnih ključev, kot so ime, naslov in izdajatelj
Uporabljamo naslednji vzorec vozniškega dovoljenja ZDA iz našega paketa za obdelavo zahtevkov.
Zaženite naslednjo kodo:
Naslednji posnetek zaslona prikazuje naš rezultat.
Iz posnetka zaslona z rezultati lahko opazite, da so predstavljeni nekateri ključi, ki jih ni bilo v samem vozniškem dovoljenju. na primer Veteran
ni ključ v licenci; vendar je to vnaprej izpolnjen ključ-vrednost, ki AnalyzeID
podpira, zaradi razlik v licencah med državami.
Izvlecite podatke iz računov in potrdil
Podoben AnalyzeID
API, AnalyzeExpense
API nudi specializirano podporo za račune in potrdila za pridobivanje ustreznih informacij, kot so ime prodajalca, vmesni seštevek in skupni zneski ter drugo, iz katere koli oblike dokumentov z računi. Za ekstrakcijo ne potrebujete nobene predloge ali konfiguracije. Amazon Texttract uporablja ML za razumevanje konteksta dvoumnih računov in potrdil.
Sledi vzorec računa zdravstvenega zavarovanja.
Mi uporabljamo AnalyzeExpense
API za ogled seznama standardiziranih polj. Polja, ki niso prepoznana kot standardna polja, so kategorizirana kot OTHER
:
V rezultatih dobimo naslednji seznam polj kot pare ključ-vrednost (glejte posnetek zaslona na levi) in celotno vrstico posameznih kupljenih elementov vrstice (glejte posnetek zaslona na desni).
zaključek
V tej objavi smo predstavili pogoste izzive pri obdelavi zahtevkov in kako lahko uporabimo storitve umetne inteligence AWS za avtomatizacijo cevovoda za inteligentno obdelavo dokumentov za samodejno odločanje o zahtevku. Videli smo, kako razvrstiti dokumente v različne razrede dokumentov z uporabo klasifikatorja po meri Amazon Comprehend in kako uporabiti Amazon Texttract za ekstrahiranje nestrukturiranih, polstrukturiranih, strukturiranih in specializiranih vrst dokumentov.
In Del 2, razširimo fazo ekstrakcije z Amazon Texttract. Uporabljamo tudi vnaprej določene entitete Amazon Comprehend in entitete po meri za obogatitev podatkov in pokažemo, kako razširiti cevovod IDP za integracijo s storitvami analitike in vizualizacije za nadaljnjo obdelavo.
Priporočamo, da pregledate varnostne razdelke Amazonovo besedilo, Amazon Comprehend, in Amazon A2I dokumentacijo in upoštevanje navedenih smernic. Če želite izvedeti več o cenah rešitve, si oglejte podrobnosti o cenah Amazonovo besedilo, Amazonsko razumevanjein Amazon A2I.
O avtorjih
Chinmayee Rane je specialist za rešitve AI/ML pri Amazon Web Services. Navdušena je nad uporabno matematiko in strojnim učenjem. Osredotoča se na oblikovanje inteligentnih rešitev za obdelavo dokumentov za stranke AWS. Zunaj službe uživa v plesu salse in bachate.
Sonali Sahu vodi skupino arhitektov rešitev Intelligent Document Processing AI/ML Solutions pri Amazon Web Services. Je strastna tehnofilka in uživa v delu s strankami pri reševanju kompleksnih problemov z uporabo inovacij. Njeno osrednje področje je umetna inteligenca in strojno učenje za inteligentno obdelavo dokumentov.
Tim Condello je višji strokovnjak za rešitve AI/ML pri Amazon Web Services. Njegov fokus je obdelava naravnega jezika in računalniški vid. Tim uživa v sprejemanju idej strank in njihovem spreminjanju v prilagodljive rešitve.
- AI
- ai art
- ai art generator
- imajo robota
- Amazonsko razumevanje
- Amazon Comprehend Medical
- Strojno učenje Amazon
- Amazonovo besedilo
- Umetna inteligenca
- certificiranje umetne inteligence
- umetna inteligenca v bančništvu
- robot z umetno inteligenco
- roboti z umetno inteligenco
- programska oprema za umetno inteligenco
- Strojno učenje AWS
- blockchain
- blockchain konferenca ai
- coingenius
- pogovorna umetna inteligenca
- kripto konferenca ai
- dall's
- globoko učenje
- Srednje (200)
- strojno učenje
- platon
- platon ai
- Platonova podatkovna inteligenca
- Igra Platon
- PlatoData
- platogaming
- lestvica ai
- sintaksa
- zefirnet