बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

बीमा उद्योग में एडब्ल्यूएस एआई सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1

बुद्धिमान दस्तावेज़ प्रसंस्करण (आईडीपी) का लक्ष्य आपके संगठन को आपकी कागजी कार्रवाई को संसाधित करने के लिए एआई को लागू करके तेजी से और अधिक सटीक निर्णय लेने में मदद करना है। यह दो-भाग श्रृंखला एडब्ल्यूएस एआई प्रौद्योगिकियों पर प्रकाश डालती है जिनका उपयोग बीमा कंपनियां अपनी व्यावसायिक प्रक्रियाओं को गति देने के लिए कर सकती हैं। इन एआई तकनीकों का उपयोग बीमा उपयोग के मामलों में किया जा सकता है जैसे कि दावे, हामीदारी, ग्राहक पत्राचार, अनुबंध, या विवाद समाधान। यह श्रृंखला बीमा उद्योग में दावों के प्रसंस्करण के उपयोग के मामले पर केंद्रित है; AWS IDP समाधान की मूलभूत अवधारणाओं के बारे में अधिक जानकारी के लिए, निम्नलिखित देखें दो-भाग श्रृंखला.

दावा प्रसंस्करण में वर्कफ़्लो में कई चेकपॉइंट होते हैं जिनकी समीक्षा करने, प्रामाणिकता सत्यापित करने और किसी दावे का न्याय करने के लिए सही वित्तीय जिम्मेदारी निर्धारित करने की आवश्यकता होती है। बीमा कंपनियां दावों के न्यायनिर्णयन से पहले दावों के लिए इन चौकियों से गुजरती हैं। यदि कोई दावा बिना किसी समस्या के इन सभी चौकियों से सफलतापूर्वक गुजरता है, तो बीमा कंपनी इसे अनुमोदित करती है और किसी भी भुगतान की प्रक्रिया करती है। हालांकि, उन्हें किसी दावे का न्यायनिर्णयन करने के लिए अतिरिक्त सहायक जानकारी की आवश्यकता हो सकती है। यह दावा करता है कि प्रसंस्करण प्रक्रिया अक्सर मैनुअल होती है, जिससे यह महंगी, त्रुटि-प्रवण और समय लेने वाली हो जाती है। बीमा ग्राहक दावा प्रसंस्करण के लिए दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग करके इस प्रक्रिया को स्वचालित कर सकते हैं।

इस दो-भाग की श्रृंखला में, हम आपको बताते हैं कि आप बीमा दावों के प्रसंस्करण के उपयोग के मामले के लिए AWS AI सेवाओं का उपयोग करके दस्तावेजों को कैसे स्वचालित और बुद्धिमानी से संसाधित कर सकते हैं।

बीमा उद्योग में एडब्ल्यूएस एआई और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण

समाधान अवलोकन

निम्नलिखित आरेख प्रत्येक चरण का प्रतिनिधित्व करता है जिसे हम आम तौर पर एक आईडीपी पाइपलाइन में देखते हैं। हम इन चरणों में से प्रत्येक के माध्यम से चलते हैं और वे दावा आवेदन प्रक्रिया में शामिल चरणों से कैसे जुड़ते हैं, जब से आवेदन जमा किया जाता है, आवेदन की जांच और बंद करने के लिए। इस पोस्ट में, हम डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों के तकनीकी विवरण को कवर करते हैं। में भाग 2, हम दस्तावेज़ निष्कर्षण चरण का विस्तार करते हैं और दस्तावेज़ संवर्धन, समीक्षा और सत्यापन जारी रखते हैं, और दावा धोखाधड़ी उपयोग मामले के लिए विश्लेषण और विज़ुअलाइज़ेशन प्रदान करने के लिए समाधान का विस्तार करते हैं।

निम्नलिखित आर्किटेक्चर आरेख एक दावा प्रसंस्करण आवेदन के विभिन्न चरणों के अनुसार आईडीपी पाइपलाइन के चरणों के दौरान उपयोग की जाने वाली विभिन्न एडब्ल्यूएस सेवाओं को दिखाता है।

आईडीपी वास्तुकला आरेख

समाधान निम्नलिखित प्रमुख सेवाओं का उपयोग करता है:

  • अमेज़न टेक्सट्रेक एक मशीन लर्निंग (एमएल) सेवा है जो स्कैन किए गए दस्तावेज़ों से स्वचालित रूप से टेक्स्ट, हस्तलेखन और डेटा निकालती है। यह फॉर्म और टेबल से डेटा को पहचानने, समझने और निकालने के लिए सरल ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) से आगे निकल जाता है। अमेज़ॅन टेक्स्टट्रैक्ट किसी भी प्रकार के दस्तावेज़ को पढ़ने और संसाधित करने के लिए एमएल का उपयोग करता है, बिना किसी मैन्युअल प्रयास के टेक्स्ट, हस्तलेखन, टेबल और अन्य डेटा को सटीक रूप से निकालता है।
  • Amazon Comprehend एक प्राकृतिक भाषा प्रसंस्करण (एनएलपी) सेवा है जो पाठ से अंतर्दृष्टि निकालने के लिए एमएल का उपयोग करती है। अमेज़ॅन कॉम्प्रिहेंड व्यक्ति, स्थान, तिथि, मात्रा, और बहुत कुछ जैसी संस्थाओं का पता लगा सकता है। यह प्रमुख भाषा, व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई) जानकारी का भी पता लगा सकता है और दस्तावेजों को उनके संबंधित वर्ग में वर्गीकृत कर सकता है।
  • अमेज़न संवर्धित ऐ (अमेज़ॅन ए2आई) एक एमएल सेवा है जो मानव समीक्षा के लिए आवश्यक कार्यप्रवाह बनाना आसान बनाती है। Amazon A2I मानव समीक्षा प्रणाली के निर्माण या बड़ी संख्या में मानव समीक्षकों के प्रबंधन से जुड़े अविभाज्य भारी भारोत्तोलन को हटाकर, सभी डेवलपर्स के लिए मानव समीक्षा लाता है। Amazon A2I दोनों को एकीकृत करता है अमेज़न टेक्सट्रेक और Amazon Comprehend IDP वर्कफ़्लो के भीतर मानव समीक्षा या सत्यापन शुरू करने की क्षमता प्रदान करने के लिए।

.. पूर्वापेक्षाएँ

निम्नलिखित अनुभागों में, हम आर्किटेक्चर के पहले तीन चरणों, यानी डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों से संबंधित विभिन्न सेवाओं के माध्यम से चलते हैं।

हमारा संदर्भ लें गिटहब भंडार दावा प्रसंस्करण पैकेट में दस्तावेज़ नमूनों के साथ पूर्ण कोड नमूने के लिए।

डेटा कैप्चर चरण

दावे और इसके सहायक दस्तावेज विभिन्न चैनलों, जैसे फैक्स, ईमेल, एक व्यवस्थापक पोर्टल, आदि के माध्यम से आ सकते हैं। आप इन दस्तावेज़ों को अत्यधिक स्केलेबल और टिकाऊ स्टोरेज में स्टोर कर सकते हैं जैसे अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। ये दस्तावेज़ विभिन्न प्रकार के हो सकते हैं, जैसे PDF, JPEG, PNG, TIFF, और बहुत कुछ। दस्तावेज़ विभिन्न स्वरूपों और लेआउट में आ सकते हैं, और विभिन्न चैनलों से डेटा स्टोर में आ सकते हैं।

वर्गीकरण चरण

दस्तावेज़ वर्गीकरण चरण में, हम डेटा कैप्चर चरण में संग्रहीत दस्तावेज़ों को वर्गीकृत करने के लिए टेक्स्ट को दस्तावेज़ संदर्भ में परिवर्तित करने के लिए अमेज़ॅन टेक्सट्रेक्ट के साथ अमेज़ॅन कॉम्प्रिहेंड को जोड़ सकते हैं। फिर हम अमेज़ॅन कॉम्प्रिहेंड में कस्टम वर्गीकरण का उपयोग दस्तावेजों को उन वर्गों में व्यवस्थित करने के लिए कर सकते हैं जिन्हें हमने दावा प्रसंस्करण पैकेट में परिभाषित किया है। दस्तावेज़ सत्यापन प्रक्रिया को स्वचालित करने और पैकेट से किसी भी लापता दस्तावेज़ की पहचान करने के लिए कस्टम वर्गीकरण भी सहायक है। कस्टम वर्गीकरण में दो चरण होते हैं, जैसा कि आर्किटेक्चर आरेख में दिखाया गया है:

  1. कस्टम क्लासिफायरियर के लिए प्रशिक्षण डेटा तैयार करने के लिए डेटा स्टोरेज में सभी दस्तावेज़ों से Amazon Textract का उपयोग करके टेक्स्ट निकालें।
  2. अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करें (जिसे a . भी कहा जाता है) दस्तावेज़ वर्गीकृत) पाठ्य सामग्री के आधार पर रुचि के वर्गों को पहचानना।

बीमा दावों के पैकेट का दस्तावेज़ वर्गीकरण

अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करने के बाद, हम दस्तावेज़ों को वर्गीकृत करने के लिए रीयल-टाइम एंडपॉइंट का उपयोग कर सकते हैं। अमेज़ॅन कॉम्प्रिहेंड सभी वर्गों के दस्तावेज़ों को कुंजी-मूल्य जोड़े की एक सरणी में प्रत्येक वर्ग से जुड़े आत्मविश्वास स्कोर के साथ लौटाता है (Doc_name - Confidence_score) हम अनुशंसा करते हैं कि विस्तृत दस्तावेज़ वर्गीकरण नमूना कोड देखें GitHub.

निष्कर्षण चरण

निष्कर्षण चरण में, हम Amazon Textract और Amazon Comprehend का उपयोग करके दस्तावेज़ों से डेटा निकालते हैं। इस पोस्ट के लिए, दावा प्रसंस्करण पैकेट में निम्नलिखित नमूना दस्तावेजों का उपयोग करें: एक सेंटर ऑफ मेडिकेड एंड मेडिकेयर सर्विसेज (सीएमएस) -1500 दावा फॉर्म, चालक का लाइसेंस और बीमा आईडी, और चालान।

CMS-1500 दावा प्रपत्र से डेटा निकालें

CMS-1500 फॉर्म एक गैर-संस्थागत प्रदाता या आपूर्तिकर्ता द्वारा मेडिकेयर कैरियर्स को बिल करने के लिए उपयोग किया जाने वाला मानक दावा फॉर्म है।

CMS-1500 फ़ॉर्म को सटीक रूप से संसाधित करना महत्वपूर्ण है, अन्यथा यह दावों की प्रक्रिया को धीमा कर सकता है या वाहक द्वारा भुगतान में देरी कर सकता है। अमेज़ॅन टेक्सट्रैक्ट के साथ AnalyzeDocument एपीआई, हम दावा फॉर्म के भीतर और अंतर्दृष्टि को समझने के लिए दस्तावेजों से टेक्स्ट निकालने के लिए निष्कर्षण प्रक्रिया को उच्च सटीकता के साथ तेज कर सकते हैं। CMS-1500 क्लेम फॉर्म का नमूना दस्तावेज निम्नलिखित है।

एक CMS1500 दावा प्रपत्र

अब हम का उपयोग करते हैं AnalyzeDocument एपीआई दो निकालने के लिए FeatureTypes, FORMS और TABLES, दस्तावेज़ से:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

बेहतर पठनीयता के लिए निम्नलिखित परिणामों को छोटा कर दिया गया है। अधिक विस्तृत जानकारी के लिए, हमारे देखें गिटहब रेपो।

RSI FORMS निष्कर्षण को कुंजी-मूल्य जोड़े के रूप में पहचाना जाता है।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

RSI TABLES निष्कर्षण में दावा प्रपत्र में ज्ञात तालिका के भीतर सेल, मर्ज किए गए सेल और कॉलम हेडर शामिल हैं।

CMS1500 फॉर्म से टेबल्स निष्कर्षण

आईडी दस्तावेज़ों से डेटा निकालें

बीमा आईडी जैसे पहचान दस्तावेजों के लिए, जिनके अलग-अलग लेआउट हो सकते हैं, हम Amazon Textract का उपयोग कर सकते हैं AnalyzeDocument एपीआई। हम उपयोग करते हैं FeatureType FORMS के लिए विन्यास के रूप में AnalyzeDocument एपीआई बीमा आईडी से कुंजी-मूल्य जोड़े निकालने के लिए (निम्न नमूना देखें):

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

निम्नलिखित कोड चलाएँ:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

हमें परिणाम सरणी में कुंजी-मान जोड़े मिलते हैं, जैसा कि निम्न स्क्रीनशॉट में दिखाया गया है।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

यूएस ड्राइवर लाइसेंस या यूएस पासपोर्ट जैसे आईडी दस्तावेज़ों के लिए, अमेज़ॅन टेक्स्टट्रैक्ट टेम्प्लेट या प्रारूपों की आवश्यकता के बिना मुख्य शर्तों को स्वचालित रूप से निकालने के लिए विशेष सहायता प्रदान करता है, जैसा कि हमने पहले बीमा आईडी उदाहरण के लिए देखा था। साथ AnalyzeID एपीआई, व्यवसाय अलग-अलग टेम्प्लेट या प्रारूप वाले आईडी दस्तावेज़ों से जानकारी जल्दी और सटीक रूप से निकाल सकते हैं। AnalyzeID एपीआई डेटा प्रकारों की दो श्रेणियां लौटाता है:

  • आईडी पर उपलब्ध की-वैल्यू पेयर जैसे जन्म तिथि, जारी करने की तिथि, आईडी नंबर, वर्ग और प्रतिबंध
  • दस्तावेज़ पर निहित फ़ील्ड जिनमें उनके साथ स्पष्ट कुंजियाँ नहीं हो सकती हैं, जैसे नाम, पता और जारीकर्ता

हम अपने दावे प्रसंस्करण पैकेट से निम्नलिखित नमूना यूएस ड्राइवर लाइसेंस का उपयोग करते हैं।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

निम्नलिखित कोड चलाएँ:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

निम्नलिखित स्क्रीनशॉट हमारा परिणाम दिखाता है।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

परिणाम स्क्रीनशॉट से, आप देख सकते हैं कि कुछ कुंजियाँ प्रस्तुत की गई हैं जो स्वयं ड्राइवर के लाइसेंस में नहीं थीं। उदाहरण के लिए, Veteran लाइसेंस में मिली कुंजी नहीं है; हालांकि, यह एक पूर्व-आबादी की-मान है कि AnalyzeID राज्यों के बीच लाइसेंस में पाए गए अंतर के कारण समर्थन करता है।

चालान और प्राप्तियों से डेटा निकालें

के समान AnalyzeID एपीआई, AnalyzeExpense एपीआई इनवॉइस और रसीदों के लिए विशेष सहायता प्रदान करता है ताकि प्रासंगिक जानकारी जैसे विक्रेता का नाम, उप-योग और कुल राशि, और अधिक चालान दस्तावेजों के किसी भी प्रारूप से निकाला जा सके। निष्कर्षण के लिए आपको किसी टेम्पलेट या कॉन्फ़िगरेशन की आवश्यकता नहीं है। Amazon Textract अस्पष्ट इनवॉइस और रसीदों के संदर्भ को समझने के लिए ML का उपयोग करता है।

निम्नलिखित एक नमूना चिकित्सा बीमा चालान है।

बीमा चालान का एक नमूना

हम उपयोग AnalyzeExpense मानकीकृत क्षेत्रों की सूची देखने के लिए एपीआई। वे फ़ील्ड जिन्हें मानक फ़ील्ड के रूप में पहचाना नहीं जाता है, उन्हें इस प्रकार वर्गीकृत किया जाता है OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

हमें परिणामों में की-वैल्यू पेयर (बाईं ओर स्क्रीनशॉट देखें) और खरीदे गए अलग-अलग लाइन आइटम की पूरी पंक्ति (दाईं ओर स्क्रीनशॉट देखें) के रूप में फ़ील्ड की निम्नलिखित सूची मिलती है।

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ. बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

निष्कर्ष

इस पोस्ट में, हमने दावा प्रसंस्करण में आम चुनौतियों का प्रदर्शन किया, और हम एक दावे को स्वचालित रूप से तय करने के लिए एक बुद्धिमान दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग कैसे कर सकते हैं। हमने देखा कि अमेज़ॅन कॉम्प्रिहेंड कस्टम क्लासिफायर का उपयोग करके दस्तावेज़ों को विभिन्न दस्तावेज़ वर्गों में कैसे वर्गीकृत किया जाता है, और असंरचित, अर्ध-संरचित, संरचित और विशेष दस्तावेज़ प्रकारों को निकालने के लिए अमेज़ॅन टेक्सट्रैक्ट का उपयोग कैसे किया जाता है।

In भाग 2, हम Amazon Textract के साथ निष्कर्षण चरण पर विस्तार करते हैं। हम डेटा को समृद्ध करने के लिए अमेज़ॅन कॉम्प्रिहेंड पूर्व-निर्धारित संस्थाओं और कस्टम संस्थाओं का भी उपयोग करते हैं, और यह दिखाते हैं कि आगे की प्रक्रिया के लिए एनालिटिक्स और विज़ुअलाइज़ेशन सेवाओं के साथ एकीकृत करने के लिए आईडीपी पाइपलाइन का विस्तार कैसे किया जाए।

हम अनुशंसा करते हैं कि के सुरक्षा अनुभागों की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, अमेज़न समझ, और अमेज़न A2I दस्तावेज़ीकरण और प्रदान किए गए दिशानिर्देशों का पालन करना। समाधान के मूल्य निर्धारण के बारे में अधिक जानने के लिए, के मूल्य निर्धारण विवरण की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, Amazon Comprehend, तथा अमेज़न A2I.


लेखक के बारे में

बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.चिन्मयी राणे Amazon वेब सर्विसेज में AI/ML स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह अनुप्रयुक्त गणित और मशीन लर्निंग के बारे में भावुक है। वह AWS ग्राहकों के लिए बुद्धिमान दस्तावेज़ प्रसंस्करण समाधान तैयार करने पर ध्यान केंद्रित करती है। काम के अलावा, वह सालसा और बचाटा नृत्य का आनंद लेती है।


बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.
सोनाली साहू अमेज़ॅन वेब सर्विसेज में इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग एआई / एमएल सॉल्यूशंस आर्किटेक्ट टीम का नेतृत्व कर रहा है। वह एक भावुक टेक्नोफाइल है और नवाचार का उपयोग करके जटिल समस्याओं को हल करने के लिए ग्राहकों के साथ काम करना पसंद करती है। उनका मुख्य फोकस आर्टिफिशियल इंटेलिजेंस और इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग के लिए मशीन लर्निंग है।


बीमा उद्योग में AWS AI सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 1 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.
टिम कोंडेलो Amazon Web Services में वरिष्ठ AI/ML विशेषज्ञ समाधान वास्तुकार हैं। उनका ध्यान प्राकृतिक भाषा प्रसंस्करण और कंप्यूटर दृष्टि है। टिम को ग्राहकों के विचारों को लेने और उन्हें स्केलेबल समाधानों में बदलने में मज़ा आता है।

समय टिकट:

से अधिक AWS मशीन लर्निंग