Intelligent Document Processing With AWS AI Services In The Insurance Industry: Part 1

Újra kiadta Platón

Követő: 0

Az intelligens dokumentumfeldolgozás (IDP) célja, hogy segítse szervezetét gyorsabb és pontosabb döntések meghozatalában azáltal, hogy mesterséges intelligenciát alkalmaz a papírmunka feldolgozására. Ez a kétrészes sorozat az AWS AI-technológiákat emeli ki, amelyeket a biztosítótársaságok használhatnak üzleti folyamataik felgyorsítására. Ezek a mesterséges intelligencia-technológiák biztosítási felhasználási esetekben használhatók, például kárigények, biztosítási szerződések, ügyfél-levelezés, szerződések vagy vitarendezések kezelése során. Ez a sorozat a biztosítási ágazat kárfeldolgozó felhasználási esetére összpontosít; Az AWS IDP-megoldás alapelveivel kapcsolatos további információkért tekintse meg a következőket két részből álló sorozat.

A követelések feldolgozása több ellenőrzőpontból áll egy munkafolyamatban, amelyek a kereset elbírálásához szükségesek a felülvizsgálathoz, a hitelesség ellenőrzéséhez és a megfelelő pénzügyi felelősség meghatározásához. A biztosítótársaságok a kárigények elbírálása előtt átmennek ezeken az ellenőrző pontokon. Ha egy kárigény probléma nélkül átmegy ezeken az ellenőrzési pontokon, a biztosítótársaság jóváhagyja azt, és feldolgozza a kifizetéseket. A követelés elbírálásához azonban további alátámasztó információkra is szükségük lehet. Ez a követelésfeldolgozási folyamat gyakran manuális, így költséges, hibás és időigényes. A biztosítási ügyfelek automatizálhatják ezt a folyamatot az AWS AI-szolgáltatások segítségével, hogy automatizálják a dokumentumfeldolgozási folyamatot a káresemények feldolgozásához.

Ebben a kétrészes sorozatban végigvezetjük, hogyan automatizálhat és intelligensen dolgozhat fel dokumentumokat nagyarányúan az AWS AI-szolgáltatások segítségével egy biztosítási kárfeldolgozó használati esethez.

Intelligens dokumentumfeldolgozás AWS AI és Analytics szolgáltatásokkal a biztosítási ágazatban

Megoldás áttekintése

A következő diagram bemutatja az összes olyan szakaszt, amelyet általában egy IDP-folyamatban látunk. Végigjárjuk ezeket a szakaszokat, és azt, hogy ezek hogyan kapcsolódnak a kárigénylési folyamat lépéseihez, a kérelem benyújtásától kezdve a kérelem kivizsgálásáig és lezárásáig. Ebben a bejegyzésben az adatrögzítési, osztályozási és kinyerési szakaszok technikai részleteivel foglalkozunk. Ban ben rész 2, kibővítjük a dokumentumkinyerési szakaszt, és folytatjuk a dokumentumok gazdagítását, áttekintését és ellenőrzését, valamint kiterjesztjük a megoldást elemzések és vizualizációk biztosítására a követelésekkel kapcsolatos csalási esetekhez.

A következő architektúra diagram az IDP-folyamat fázisaiban használt különböző AWS-szolgáltatásokat mutatja be, a követelésfeldolgozó alkalmazás különböző szakaszai szerint.

IDP architektúra diagram

A megoldás a következő kulcsszolgáltatásokat használja:

Amazon szöveg egy gépi tanulási (ML) szolgáltatás, amely automatikusan kivonja a szöveget, a kézírást és az adatokat a beolvasott dokumentumokból. Ez túlmutat az egyszerű optikai karakterfelismerésen (OCR) az adatok azonosításában, megértésében és az űrlapokból és táblázatokból történő kinyerésében. Az Amazon Textract az ML-t használja bármilyen típusú dokumentum olvasására és feldolgozására, kézi erőfeszítés nélkül, pontosan kivonja a szöveget, a kézírást, a táblázatokat és egyéb adatokat.
Amazon Comprehend egy természetes nyelvi feldolgozó (NLP) szolgáltatás, amely az ML-t használja a szövegből való betekintésre. Az Amazon Comprehend képes észlelni az olyan entitásokat, mint a személy, hely, dátum, mennyiség stb. Ezenkívül képes észlelni a domináns nyelvet, a személyazonosításra alkalmas információkat (PII), és besorolni a dokumentumokat a megfelelő osztályba.
Amazon kiterjesztett AI (Amazon A2I) egy ML szolgáltatás, amely megkönnyíti az emberi ellenőrzéshez szükséges munkafolyamatok felépítését. Az Amazon A2I minden fejlesztő számára elérhetővé teszi az emberi felülvizsgálatot, megszüntetve az emberi felülvizsgálati rendszerek kiépítésével vagy a nagyszámú emberi felülvizsgáló kezelésével járó megkülönböztethetetlen nehézségeket. Az Amazon A2I mindkettővel integrálja Amazon szöveg és a Amazon Comprehend hogy lehetővé tegyük emberi felülvizsgálat vagy érvényesítés bevezetését az IDP munkafolyamatán belül.

Előfeltételek

A következő részekben az architektúra első három fázisához, azaz az adatrögzítési, osztályozási és kinyerési fázishoz kapcsolódó különböző szolgáltatásokat járjuk végig.

Lásd a mi GitHub tárház teljes kódmintákhoz, valamint a követelésfeldolgozási csomag dokumentummintáihoz.

Adatrögzítési fázis

A követelések és az azokat alátámasztó dokumentumok különféle csatornákon keresztül érkezhetnek, például faxon, e-mailen, adminisztrátori portálon stb. Ezeket a dokumentumokat egy rendkívül méretezhető és tartós tárolóban tárolhatja, mint pl Amazon egyszerű tárolási szolgáltatás (Amazon S3). Ezek a dokumentumok különféle típusúak lehetnek, például PDF, JPEG, PNG, TIFF stb. A dokumentumok többféle formátumban és elrendezésben érkezhetnek, és különböző csatornákról érkezhetnek az adattárba.

Osztályozási fázis

A dokumentumosztályozási szakaszban az Amazon Comprehend és az Amazon Textract kombinálásával a szöveget dokumentumkontextussá alakíthatjuk, így osztályozhatjuk az adatrögzítési szakaszban tárolt dokumentumokat. Ezután egyéni besorolást használhatunk az Amazon Comprehendben a dokumentumok osztályokba rendezéséhez, amelyeket a követelésfeldolgozási csomagban határoztunk meg. Az egyéni besorolás a dokumentum-ellenőrzési folyamat automatizálásában és a csomagból hiányzó dokumentumok azonosításában is hasznos. Az egyéni besorolás két lépésből áll, amint az az architektúra diagramon látható:

Kivonja a szöveget az Amazon Textract segítségével az adattárolóban lévő összes dokumentumból, hogy előkészítse a képzési adatokat az egyéni osztályozóhoz.
Tanítson meg egy Amazon Comprehend egyéni osztályozási modellt (más néven a dokumentum osztályozó) felismerni az érdeklődési osztályokat a szövegtartalom alapján.

A biztosítási kárigénycsomag dokumentumosztályozása

Az Amazon Comprehend egyéni osztályozási modell betanítása után a valós idejű végpontot használhatjuk dokumentumok osztályozására. Az Amazon Comprehend az összes dokumentumosztályt megbízhatósági pontszámmal adja vissza az egyes osztályokhoz kulcs-érték párok tömbjében (Doc_name - Confidence_score). Javasoljuk, hogy nézze át a dokumentum-besorolás részletes mintakódját GitHub.

Extrakciós fázis

A kinyerési fázisban az Amazon Textract és az Amazon Comprehend segítségével kinyerjük az adatokat a dokumentumokból. Ehhez a bejegyzéshez használja a következő mintadokumentumokat a követelésfeldolgozási csomagban: a Center of Medicaid and Medicare Services (CMS)-1500 igénylőlap, jogosítvány és biztosítási azonosító, valamint számla.

Adatok kinyerése egy CMS-1500 igénylőlapról

A CMS-1500 űrlap a nem intézményi szolgáltatók vagy beszállítók által a Medicare fuvarozók számlázásához használt szabványos igénylőlap.

Fontos a CMS-1500 űrlap pontos feldolgozása, ellenkező esetben lelassíthatja a kárigénylési folyamatot, vagy késleltetheti a fuvarozó fizetését. Az Amazon Textracttal AnalyzeDocument API-val nagyobb pontossággal felgyorsíthatjuk a kinyerési folyamatot, hogy szöveget kinyerhessünk a dokumentumokból, hogy megértsük a követelésűrlapon belüli további információkat. Az alábbiakban a CMS-1500 igénylőlap mintadokumentuma látható.

A CMS1500 igénylőlap

Most használjuk a AnalyzeDocument API kettő kinyeréséhez FeatureTypes, FORMS és a TABLES, a dokumentumból:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Az alábbi eredményeket lerövidítettük a jobb olvashatóság érdekében. További részletekért tekintse meg oldalunkat GitHub repó.

A FORMS a kivonás kulcs-érték párként van azonosítva.

A TABLES A kivonat cellákat, egyesített cellákat és oszlopfejléceket tartalmaz a keresetűrlap észlelt táblázatában.

Táblázatok kinyerése a CMS1500 űrlapból

Adatok kinyerése az igazolványokból

A személyazonosító okmányokhoz, például a biztosítási azonosítóhoz, amelyek különböző elrendezésűek lehetnek, használhatjuk az Amazon Textractot AnalyzeDocument API. Használjuk a FeatureType FORMS mint a konfiguráció a AnalyzeDocument API a kulcs-érték párok biztosítási azonosítóból való kinyeréséhez (lásd a következő mintát):

Futtassa a következő kódot:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

A kulcs-érték párokat az eredménytömbben kapjuk meg, amint az a következő képernyőképen látható.

Az olyan személyazonosító okmányok esetében, mint az egyesült államokbeli jogosítvány vagy az egyesült államokbeli útlevél, az Amazon Textract speciális támogatást nyújt a kulcskifejezések automatikus kibontásához, sablonok vagy formátumok nélkül, ellentétben azzal, amit korábban a biztosítási azonosító példánál láttunk. A ... val AnalyzeID API segítségével a vállalkozások gyorsan és pontosan kinyerhetnek információkat a különböző sablonokkal vagy formátumú azonosító dokumentumokból. A AnalyzeID Az API két adattípus-kategóriát ad vissza:

Az azonosítóban elérhető kulcs-érték párok, például születési dátum, kiadási dátum, azonosítószám, osztály és korlátozások
burkolt mezők a dokumentumon, amelyekhez esetleg nem tartoznak kifejezett kulcsok, például név, cím és kibocsátó

A követelésfeldolgozó csomagunkból a következő amerikai jogosítványmintát használjuk.

Futtassa a következő kódot:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Az alábbi képernyőképen az eredményünk látható.

Az eredmények képernyőképen megfigyelheti, hogy bizonyos kulcsok jelennek meg, amelyek nem szerepeltek magában a vezetői engedélyben. Például, Veteran nem az engedélyben található kulcs; ez azonban egy előre kitöltött kulcsérték AnalyzeID támogatja, az államok közötti licencekben található különbségek miatt.

Adatok kinyerése számlákból és nyugtákból

Hasonló a AnalyzeID API, a AnalyzeExpense Az API speciális támogatást nyújt a számlákhoz és a nyugtákhoz, hogy bármilyen formátumú számladokumentumból kinyerhessen olyan releváns információkat, mint a szállító neve, részösszeg és végösszeg stb. A kibontáshoz nincs szükség sablonra vagy konfigurációra. Az Amazon Textract az ML-t használja a kétértelmű számlák és nyugták kontextusának megértéséhez.

Az alábbiakban egy egészségügyi biztosítási számla minta látható.

A biztosítási számla mintája

Az általunk használt AnalyzeExpense API-t a szabványosított mezők listájának megtekintéséhez. Azokat a mezőket, amelyeket nem ismer fel szabványos mezőként, a rendszer a következő kategóriába sorolja be OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

A következő mezők listáját kapjuk kulcs-érték párként (lásd a bal oldali képernyőképet), és az egyes megvásárolt sorok teljes sorát (lásd a jobb oldali képernyőképet).

Intelligens dokumentumfeldolgozás AWS AI szolgáltatásokkal a biztosítási ágazatban: 1. rész PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Következtetés

Ebben a bejegyzésben bemutattuk a követelésfeldolgozás gyakori kihívásait, és bemutattuk, hogyan használhatjuk az AWS AI-szolgáltatásokat egy intelligens dokumentumfeldolgozó folyamat automatizálására a követelések automatikus elbírálásához. Láttuk, hogyan lehet dokumentumokat osztályozni különféle dokumentumosztályokba egy Amazon Comprehend egyéni osztályozó segítségével, és hogyan lehet az Amazon Textract segítségével kivonni strukturálatlan, félig strukturált, strukturált és speciális dokumentumtípusokat.

In rész 2, kiterjesztjük a kitermelési fázist az Amazon Textracttal. Az Amazon Comprehend előre definiált entitásokat és egyéni entitásokat is használjuk az adatok gazdagításához, és bemutatjuk, hogyan lehet kiterjeszteni az IDP folyamatot, hogy integrálódjon az analitikai és vizualizációs szolgáltatásokkal a további feldolgozás érdekében.

Javasoljuk, hogy tekintse át a biztonsági részeket Amazon Texttract, Amazon Comprehend, és a Amazon A2I dokumentációt, és kövesse a megadott irányelveket. Ha többet szeretne megtudni a megoldás áráról, tekintse át az árképzés részleteit Amazon Texttract, Amazon Comprehendés Amazon A2I.

A szerzőkről

Chinmayee Rane AI/ML Specialist Solutions Architect az Amazon Web Servicesnél. Szenvedélye az alkalmazott matematika és a gépi tanulás. Arra összpontosít, hogy intelligens dokumentumfeldolgozási megoldásokat tervezzen az AWS-ügyfelek számára. Munkán kívül szeret salsát és bachatát táncolni.

Sonali Sahu az Amazon Web Services Intelligens Dokumentumfeldolgozó AI/ML Solutions Architect csapatának vezetője. Szenvedélyes technofil, és szívesen dolgozik az ügyfelekkel, hogy komplex problémákat oldjon meg az innováció segítségével. Fő területe a mesterséges intelligencia és a gépi tanulás az intelligens dokumentumfeldolgozáshoz.

Tim Condello az Amazon Web Services vezető AI/ML-megoldások specialistája. Fókuszában a természetes nyelvi feldolgozás és a számítógépes látás áll. Tim élvezi az ügyfelek ötleteit, és skálázható megoldásokká alakítja azokat.

Időbélyeg: November 3, 2022November 4, 2022

Időbélyeg: May 2, 2023

Intelligens dokumentumfeldolgozás AWS AI szolgáltatásokkal a biztosítási ágazatban: 1. rész

Újra kiadta Platón

Megoldás áttekintése

Előfeltételek

Adatrögzítési fázis

Osztályozási fázis

Extrakciós fázis

Adatok kinyerése egy CMS-1500 igénylőlapról

Adatok kinyerése az igazolványokból

Adatok kinyerése számlákból és nyugtákból

Következtetés

A szerzőkről

Még több AWS gépi tanulás

Készítsen gépi tanulásra kész adatkészleteket az Amazon SageMaker offline Feature Store-ból az Amazon SageMaker Python SDK használatával | Amazon webszolgáltatások

A PGA TOUR generatív AI virtuális asszisztensének útja a koncepciótól a fejlesztésen át a prototípusig | Amazon webszolgáltatások

Az Amazon Forecast megvalósítása a kiskereskedelmi ágazatban: Utazás a POC-tól a gyártásig

Szabja személyre ajánlásait úgy, hogy bizonyos tételeket reklámoz az Amazon Personalize üzleti szabályaival

Bemutatjuk az AWS Generatív AI Innovációs Központ egyéni modellprogramját antropikus Claude számára | Amazon webszolgáltatások

Gyorsítsa fel a többnyelvű munkafolyamatokat az Amazon Translate szolgáltatással épített, testreszabható fordítási megoldással

Modelltárhely-minták a SageMakerben: A modellek tesztelésének és frissítésének legjobb gyakorlatai a SageMakerben

Amazon SageMaker TensorBoarddal: Áttekintés a hosztolt TensorBoard élményről

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók