बीमा उद्योग में एडब्ल्यूएस एआई सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

बुद्धिमान दस्तावेज़ प्रसंस्करण (आईडीपी) का लक्ष्य आपके संगठन को आपकी कागजी कार्रवाई को संसाधित करने के लिए एआई को लागू करके तेजी से और अधिक सटीक निर्णय लेने में मदद करना है। यह दो-भाग श्रृंखला एडब्ल्यूएस एआई प्रौद्योगिकियों पर प्रकाश डालती है जिनका उपयोग बीमा कंपनियां अपनी व्यावसायिक प्रक्रियाओं को गति देने के लिए कर सकती हैं। इन एआई तकनीकों का उपयोग बीमा उपयोग के मामलों में किया जा सकता है जैसे कि दावे, हामीदारी, ग्राहक पत्राचार, अनुबंध, या विवाद समाधान। यह श्रृंखला बीमा उद्योग में दावों के प्रसंस्करण के उपयोग के मामले पर केंद्रित है; AWS IDP समाधान की मूलभूत अवधारणाओं के बारे में अधिक जानकारी के लिए, निम्नलिखित देखें दो-भाग श्रृंखला.

दावा प्रसंस्करण में वर्कफ़्लो में कई चेकपॉइंट होते हैं जिनकी समीक्षा करने, प्रामाणिकता सत्यापित करने और किसी दावे का न्याय करने के लिए सही वित्तीय जिम्मेदारी निर्धारित करने की आवश्यकता होती है। बीमा कंपनियां दावों के न्यायनिर्णयन से पहले दावों के लिए इन चौकियों से गुजरती हैं। यदि कोई दावा बिना किसी समस्या के इन सभी चौकियों से सफलतापूर्वक गुजरता है, तो बीमा कंपनी इसे अनुमोदित करती है और किसी भी भुगतान की प्रक्रिया करती है। हालांकि, उन्हें किसी दावे का न्यायनिर्णयन करने के लिए अतिरिक्त सहायक जानकारी की आवश्यकता हो सकती है। यह दावा करता है कि प्रसंस्करण प्रक्रिया अक्सर मैनुअल होती है, जिससे यह महंगी, त्रुटि-प्रवण और समय लेने वाली हो जाती है। बीमा ग्राहक दावा प्रसंस्करण के लिए दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग करके इस प्रक्रिया को स्वचालित कर सकते हैं।

इस दो-भाग की श्रृंखला में, हम आपको बताते हैं कि आप बीमा दावों के प्रसंस्करण के उपयोग के मामले के लिए AWS AI सेवाओं का उपयोग करके दस्तावेजों को कैसे स्वचालित और बुद्धिमानी से संसाधित कर सकते हैं।

बीमा उद्योग में एडब्ल्यूएस एआई और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण

समाधान अवलोकन

निम्नलिखित आरेख प्रत्येक चरण का प्रतिनिधित्व करता है जिसे हम आम तौर पर एक आईडीपी पाइपलाइन में देखते हैं। हम इन चरणों में से प्रत्येक के माध्यम से चलते हैं और वे दावा आवेदन प्रक्रिया में शामिल चरणों से कैसे जुड़ते हैं, जब से आवेदन जमा किया जाता है, आवेदन की जांच और बंद करने के लिए। इस पोस्ट में, हम डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों के तकनीकी विवरण को कवर करते हैं। में भाग 2, हम दस्तावेज़ निष्कर्षण चरण का विस्तार करते हैं और दस्तावेज़ संवर्धन, समीक्षा और सत्यापन जारी रखते हैं, और दावा धोखाधड़ी उपयोग मामले के लिए विश्लेषण और विज़ुअलाइज़ेशन प्रदान करने के लिए समाधान का विस्तार करते हैं।

निम्नलिखित आर्किटेक्चर आरेख एक दावा प्रसंस्करण आवेदन के विभिन्न चरणों के अनुसार आईडीपी पाइपलाइन के चरणों के दौरान उपयोग की जाने वाली विभिन्न एडब्ल्यूएस सेवाओं को दिखाता है।

आईडीपी वास्तुकला आरेख

समाधान निम्नलिखित प्रमुख सेवाओं का उपयोग करता है:

अमेज़न टेक्सट्रेक एक मशीन लर्निंग (एमएल) सेवा है जो स्कैन किए गए दस्तावेज़ों से स्वचालित रूप से टेक्स्ट, हस्तलेखन और डेटा निकालती है। यह फॉर्म और टेबल से डेटा को पहचानने, समझने और निकालने के लिए सरल ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) से आगे निकल जाता है। अमेज़ॅन टेक्स्टट्रैक्ट किसी भी प्रकार के दस्तावेज़ को पढ़ने और संसाधित करने के लिए एमएल का उपयोग करता है, बिना किसी मैन्युअल प्रयास के टेक्स्ट, हस्तलेखन, टेबल और अन्य डेटा को सटीक रूप से निकालता है।
Amazon Comprehend एक प्राकृतिक भाषा प्रसंस्करण (एनएलपी) सेवा है जो पाठ से अंतर्दृष्टि निकालने के लिए एमएल का उपयोग करती है। अमेज़ॅन कॉम्प्रिहेंड व्यक्ति, स्थान, तिथि, मात्रा, और बहुत कुछ जैसी संस्थाओं का पता लगा सकता है। यह प्रमुख भाषा, व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई) जानकारी का भी पता लगा सकता है और दस्तावेजों को उनके संबंधित वर्ग में वर्गीकृत कर सकता है।
अमेज़न संवर्धित ऐ (अमेज़ॅन ए2आई) एक एमएल सेवा है जो मानव समीक्षा के लिए आवश्यक कार्यप्रवाह बनाना आसान बनाती है। Amazon A2I मानव समीक्षा प्रणाली के निर्माण या बड़ी संख्या में मानव समीक्षकों के प्रबंधन से जुड़े अविभाज्य भारी भारोत्तोलन को हटाकर, सभी डेवलपर्स के लिए मानव समीक्षा लाता है। Amazon A2I दोनों को एकीकृत करता है अमेज़न टेक्सट्रेक और Amazon Comprehend IDP वर्कफ़्लो के भीतर मानव समीक्षा या सत्यापन शुरू करने की क्षमता प्रदान करने के लिए।

.. पूर्वापेक्षाएँ

निम्नलिखित अनुभागों में, हम आर्किटेक्चर के पहले तीन चरणों, यानी डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों से संबंधित विभिन्न सेवाओं के माध्यम से चलते हैं।

हमारा संदर्भ लें गिटहब भंडार दावा प्रसंस्करण पैकेट में दस्तावेज़ नमूनों के साथ पूर्ण कोड नमूने के लिए।

डेटा कैप्चर चरण

दावे और इसके सहायक दस्तावेज विभिन्न चैनलों, जैसे फैक्स, ईमेल, एक व्यवस्थापक पोर्टल, आदि के माध्यम से आ सकते हैं। आप इन दस्तावेज़ों को अत्यधिक स्केलेबल और टिकाऊ स्टोरेज में स्टोर कर सकते हैं जैसे अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। ये दस्तावेज़ विभिन्न प्रकार के हो सकते हैं, जैसे PDF, JPEG, PNG, TIFF, और बहुत कुछ। दस्तावेज़ विभिन्न स्वरूपों और लेआउट में आ सकते हैं, और विभिन्न चैनलों से डेटा स्टोर में आ सकते हैं।

वर्गीकरण चरण

दस्तावेज़ वर्गीकरण चरण में, हम डेटा कैप्चर चरण में संग्रहीत दस्तावेज़ों को वर्गीकृत करने के लिए टेक्स्ट को दस्तावेज़ संदर्भ में परिवर्तित करने के लिए अमेज़ॅन टेक्सट्रेक्ट के साथ अमेज़ॅन कॉम्प्रिहेंड को जोड़ सकते हैं। फिर हम अमेज़ॅन कॉम्प्रिहेंड में कस्टम वर्गीकरण का उपयोग दस्तावेजों को उन वर्गों में व्यवस्थित करने के लिए कर सकते हैं जिन्हें हमने दावा प्रसंस्करण पैकेट में परिभाषित किया है। दस्तावेज़ सत्यापन प्रक्रिया को स्वचालित करने और पैकेट से किसी भी लापता दस्तावेज़ की पहचान करने के लिए कस्टम वर्गीकरण भी सहायक है। कस्टम वर्गीकरण में दो चरण होते हैं, जैसा कि आर्किटेक्चर आरेख में दिखाया गया है:

कस्टम क्लासिफायरियर के लिए प्रशिक्षण डेटा तैयार करने के लिए डेटा स्टोरेज में सभी दस्तावेज़ों से Amazon Textract का उपयोग करके टेक्स्ट निकालें।
अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करें (जिसे a . भी कहा जाता है) दस्तावेज़ वर्गीकृत) पाठ्य सामग्री के आधार पर रुचि के वर्गों को पहचानना।

बीमा दावों के पैकेट का दस्तावेज़ वर्गीकरण

अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करने के बाद, हम दस्तावेज़ों को वर्गीकृत करने के लिए रीयल-टाइम एंडपॉइंट का उपयोग कर सकते हैं। अमेज़ॅन कॉम्प्रिहेंड सभी वर्गों के दस्तावेज़ों को कुंजी-मूल्य जोड़े की एक सरणी में प्रत्येक वर्ग से जुड़े आत्मविश्वास स्कोर के साथ लौटाता है (Doc_name - Confidence_score) हम अनुशंसा करते हैं कि विस्तृत दस्तावेज़ वर्गीकरण नमूना कोड देखें GitHub.

निष्कर्षण चरण

निष्कर्षण चरण में, हम Amazon Textract और Amazon Comprehend का उपयोग करके दस्तावेज़ों से डेटा निकालते हैं। इस पोस्ट के लिए, दावा प्रसंस्करण पैकेट में निम्नलिखित नमूना दस्तावेजों का उपयोग करें: एक सेंटर ऑफ मेडिकेड एंड मेडिकेयर सर्विसेज (सीएमएस) -1500 दावा फॉर्म, चालक का लाइसेंस और बीमा आईडी, और चालान।

CMS-1500 दावा प्रपत्र से डेटा निकालें

CMS-1500 फॉर्म एक गैर-संस्थागत प्रदाता या आपूर्तिकर्ता द्वारा मेडिकेयर कैरियर्स को बिल करने के लिए उपयोग किया जाने वाला मानक दावा फॉर्म है।

CMS-1500 फ़ॉर्म को सटीक रूप से संसाधित करना महत्वपूर्ण है, अन्यथा यह दावों की प्रक्रिया को धीमा कर सकता है या वाहक द्वारा भुगतान में देरी कर सकता है। अमेज़ॅन टेक्सट्रैक्ट के साथ AnalyzeDocument एपीआई, हम दावा फॉर्म के भीतर और अंतर्दृष्टि को समझने के लिए दस्तावेजों से टेक्स्ट निकालने के लिए निष्कर्षण प्रक्रिया को उच्च सटीकता के साथ तेज कर सकते हैं। CMS-1500 क्लेम फॉर्म का नमूना दस्तावेज निम्नलिखित है।

एक CMS1500 दावा प्रपत्र

अब हम का उपयोग करते हैं AnalyzeDocument एपीआई दो निकालने के लिए FeatureTypes, FORMS और TABLES, दस्तावेज़ से:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

बेहतर पठनीयता के लिए निम्नलिखित परिणामों को छोटा कर दिया गया है। अधिक विस्तृत जानकारी के लिए, हमारे देखें गिटहब रेपो।

RSI FORMS निष्कर्षण को कुंजी-मूल्य जोड़े के रूप में पहचाना जाता है।

RSI TABLES निष्कर्षण में दावा प्रपत्र में ज्ञात तालिका के भीतर सेल, मर्ज किए गए सेल और कॉलम हेडर शामिल हैं।

CMS1500 फॉर्म से टेबल्स निष्कर्षण

आईडी दस्तावेज़ों से डेटा निकालें

बीमा आईडी जैसे पहचान दस्तावेजों के लिए, जिनके अलग-अलग लेआउट हो सकते हैं, हम Amazon Textract का उपयोग कर सकते हैं AnalyzeDocument एपीआई। हम उपयोग करते हैं FeatureType FORMS के लिए विन्यास के रूप में AnalyzeDocument एपीआई बीमा आईडी से कुंजी-मूल्य जोड़े निकालने के लिए (निम्न नमूना देखें):

निम्नलिखित कोड चलाएँ:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

हमें परिणाम सरणी में कुंजी-मान जोड़े मिलते हैं, जैसा कि निम्न स्क्रीनशॉट में दिखाया गया है।

यूएस ड्राइवर लाइसेंस या यूएस पासपोर्ट जैसे आईडी दस्तावेज़ों के लिए, अमेज़ॅन टेक्स्टट्रैक्ट टेम्प्लेट या प्रारूपों की आवश्यकता के बिना मुख्य शर्तों को स्वचालित रूप से निकालने के लिए विशेष सहायता प्रदान करता है, जैसा कि हमने पहले बीमा आईडी उदाहरण के लिए देखा था। साथ AnalyzeID एपीआई, व्यवसाय अलग-अलग टेम्प्लेट या प्रारूप वाले आईडी दस्तावेज़ों से जानकारी जल्दी और सटीक रूप से निकाल सकते हैं। AnalyzeID एपीआई डेटा प्रकारों की दो श्रेणियां लौटाता है:

आईडी पर उपलब्ध की-वैल्यू पेयर जैसे जन्म तिथि, जारी करने की तिथि, आईडी नंबर, वर्ग और प्रतिबंध
दस्तावेज़ पर निहित फ़ील्ड जिनमें उनके साथ स्पष्ट कुंजियाँ नहीं हो सकती हैं, जैसे नाम, पता और जारीकर्ता

हम अपने दावे प्रसंस्करण पैकेट से निम्नलिखित नमूना यूएस ड्राइवर लाइसेंस का उपयोग करते हैं।

निम्नलिखित कोड चलाएँ:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

निम्नलिखित स्क्रीनशॉट हमारा परिणाम दिखाता है।

परिणाम स्क्रीनशॉट से, आप देख सकते हैं कि कुछ कुंजियाँ प्रस्तुत की गई हैं जो स्वयं ड्राइवर के लाइसेंस में नहीं थीं। उदाहरण के लिए, Veteran लाइसेंस में मिली कुंजी नहीं है; हालांकि, यह एक पूर्व-आबादी की-मान है कि AnalyzeID राज्यों के बीच लाइसेंस में पाए गए अंतर के कारण समर्थन करता है।

चालान और प्राप्तियों से डेटा निकालें

के समान AnalyzeID एपीआई, AnalyzeExpense एपीआई इनवॉइस और रसीदों के लिए विशेष सहायता प्रदान करता है ताकि प्रासंगिक जानकारी जैसे विक्रेता का नाम, उप-योग और कुल राशि, और अधिक चालान दस्तावेजों के किसी भी प्रारूप से निकाला जा सके। निष्कर्षण के लिए आपको किसी टेम्पलेट या कॉन्फ़िगरेशन की आवश्यकता नहीं है। Amazon Textract अस्पष्ट इनवॉइस और रसीदों के संदर्भ को समझने के लिए ML का उपयोग करता है।

निम्नलिखित एक नमूना चिकित्सा बीमा चालान है।

बीमा चालान का एक नमूना

हम उपयोग AnalyzeExpense मानकीकृत क्षेत्रों की सूची देखने के लिए एपीआई। वे फ़ील्ड जिन्हें मानक फ़ील्ड के रूप में पहचाना नहीं जाता है, उन्हें इस प्रकार वर्गीकृत किया जाता है OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

हमें परिणामों में की-वैल्यू पेयर (बाईं ओर स्क्रीनशॉट देखें) और खरीदे गए अलग-अलग लाइन आइटम की पूरी पंक्ति (दाईं ओर स्क्रीनशॉट देखें) के रूप में फ़ील्ड की निम्नलिखित सूची मिलती है।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

निष्कर्ष

इस पोस्ट में, हमने दावा प्रसंस्करण में आम चुनौतियों का प्रदर्शन किया, और हम एक दावे को स्वचालित रूप से तय करने के लिए एक बुद्धिमान दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग कैसे कर सकते हैं। हमने देखा कि अमेज़ॅन कॉम्प्रिहेंड कस्टम क्लासिफायर का उपयोग करके दस्तावेज़ों को विभिन्न दस्तावेज़ वर्गों में कैसे वर्गीकृत किया जाता है, और असंरचित, अर्ध-संरचित, संरचित और विशेष दस्तावेज़ प्रकारों को निकालने के लिए अमेज़ॅन टेक्सट्रैक्ट का उपयोग कैसे किया जाता है।

In भाग 2, हम Amazon Textract के साथ निष्कर्षण चरण पर विस्तार करते हैं। हम डेटा को समृद्ध करने के लिए अमेज़ॅन कॉम्प्रिहेंड पूर्व-निर्धारित संस्थाओं और कस्टम संस्थाओं का भी उपयोग करते हैं, और यह दिखाते हैं कि आगे की प्रक्रिया के लिए एनालिटिक्स और विज़ुअलाइज़ेशन सेवाओं के साथ एकीकृत करने के लिए आईडीपी पाइपलाइन का विस्तार कैसे किया जाए।

हम अनुशंसा करते हैं कि के सुरक्षा अनुभागों की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, अमेज़न समझ, और अमेज़न A2I दस्तावेज़ीकरण और प्रदान किए गए दिशानिर्देशों का पालन करना। समाधान के मूल्य निर्धारण के बारे में अधिक जानने के लिए, के मूल्य निर्धारण विवरण की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, Amazon Comprehend, तथा अमेज़न A2I.

लेखक के बारे में

चिन्मयी राणे Amazon वेब सर्विसेज में AI/ML स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह अनुप्रयुक्त गणित और मशीन लर्निंग के बारे में भावुक है। वह AWS ग्राहकों के लिए बुद्धिमान दस्तावेज़ प्रसंस्करण समाधान तैयार करने पर ध्यान केंद्रित करती है। काम के अलावा, वह सालसा और बचाटा नृत्य का आनंद लेती है।

सोनाली साहू अमेज़ॅन वेब सर्विसेज में इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग एआई / एमएल सॉल्यूशंस आर्किटेक्ट टीम का नेतृत्व कर रहा है। वह एक भावुक टेक्नोफाइल है और नवाचार का उपयोग करके जटिल समस्याओं को हल करने के लिए ग्राहकों के साथ काम करना पसंद करती है। उनका मुख्य फोकस आर्टिफिशियल इंटेलिजेंस और इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग के लिए मशीन लर्निंग है।

टिम कोंडेलो Amazon Web Services में वरिष्ठ AI/ML विशेषज्ञ समाधान वास्तुकार हैं। उनका ध्यान प्राकृतिक भाषा प्रसंस्करण और कंप्यूटर दृष्टि है। टिम को ग्राहकों के विचारों को लेने और उन्हें स्केलेबल समाधानों में बदलने में मज़ा आता है।

समय टिकट: नवम्बर 3/2022नवम्बर 4/2022

समय टिकट: 2 मई 2023

बीमा उद्योग में एडब्ल्यूएस एआई सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1

प्लेटो द्वारा पुनर्प्रकाशित

समाधान अवलोकन

.. पूर्वापेक्षाएँ

डेटा कैप्चर चरण

वर्गीकरण चरण

निष्कर्षण चरण

CMS-1500 दावा प्रपत्र से डेटा निकालें

आईडी दस्तावेज़ों से डेटा निकालें

चालान और प्राप्तियों से डेटा निकालें

निष्कर्ष

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

Amazon SageMaker Python SDK का उपयोग करके Amazon SageMaker ऑफ़लाइन फ़ीचर स्टोर से मशीन सीखने के लिए तैयार डेटासेट बनाएँ | अमेज़न वेब सेवाएँ

पीजीए टूर के जेनेरिक एआई वर्चुअल असिस्टेंट की अवधारणा से विकास और प्रोटोटाइप तक की यात्रा | अमेज़न वेब सेवाएँ

खुदरा उद्योग में अमेज़ॅन के पूर्वानुमान को लागू करना: पीओसी से उत्पादन तक की यात्रा

Amazon Personalize के साथ व्यावसायिक नियमों का उपयोग करके विशिष्ट आइटम का प्रचार करके अपनी अनुशंसाओं को कस्टमाइज़ करें

अमेज़ॅन अनुवाद के साथ निर्मित एक अनुकूलन योग्य अनुवाद समाधान के साथ बहुभाषी कार्यप्रवाह में तेजी लाएं

SageMaker में मॉडल होस्टिंग पैटर्न: SageMaker पर मॉडलों के परीक्षण और अद्यतन करने में सर्वोत्तम अभ्यास

Amazon SageMaker with TensorBoard: होस्टेड TensorBoard अनुभव का अवलोकन

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा