बुद्धिमान दस्तावेज़ प्रसंस्करण (आईडीपी) का लक्ष्य आपके संगठन को आपकी कागजी कार्रवाई को संसाधित करने के लिए एआई को लागू करके तेजी से और अधिक सटीक निर्णय लेने में मदद करना है। यह दो-भाग श्रृंखला एडब्ल्यूएस एआई प्रौद्योगिकियों पर प्रकाश डालती है जिनका उपयोग बीमा कंपनियां अपनी व्यावसायिक प्रक्रियाओं को गति देने के लिए कर सकती हैं। इन एआई तकनीकों का उपयोग बीमा उपयोग के मामलों में किया जा सकता है जैसे कि दावे, हामीदारी, ग्राहक पत्राचार, अनुबंध, या विवाद समाधान। यह श्रृंखला बीमा उद्योग में दावों के प्रसंस्करण के उपयोग के मामले पर केंद्रित है; AWS IDP समाधान की मूलभूत अवधारणाओं के बारे में अधिक जानकारी के लिए, निम्नलिखित देखें दो-भाग श्रृंखला.
दावा प्रसंस्करण में वर्कफ़्लो में कई चेकपॉइंट होते हैं जिनकी समीक्षा करने, प्रामाणिकता सत्यापित करने और किसी दावे का न्याय करने के लिए सही वित्तीय जिम्मेदारी निर्धारित करने की आवश्यकता होती है। बीमा कंपनियां दावों के न्यायनिर्णयन से पहले दावों के लिए इन चौकियों से गुजरती हैं। यदि कोई दावा बिना किसी समस्या के इन सभी चौकियों से सफलतापूर्वक गुजरता है, तो बीमा कंपनी इसे अनुमोदित करती है और किसी भी भुगतान की प्रक्रिया करती है। हालांकि, उन्हें किसी दावे का न्यायनिर्णयन करने के लिए अतिरिक्त सहायक जानकारी की आवश्यकता हो सकती है। यह दावा करता है कि प्रसंस्करण प्रक्रिया अक्सर मैनुअल होती है, जिससे यह महंगी, त्रुटि-प्रवण और समय लेने वाली हो जाती है। बीमा ग्राहक दावा प्रसंस्करण के लिए दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग करके इस प्रक्रिया को स्वचालित कर सकते हैं।
इस दो-भाग की श्रृंखला में, हम आपको बताते हैं कि आप बीमा दावों के प्रसंस्करण के उपयोग के मामले के लिए AWS AI सेवाओं का उपयोग करके दस्तावेजों को कैसे स्वचालित और बुद्धिमानी से संसाधित कर सकते हैं।
बीमा उद्योग में एडब्ल्यूएस एआई और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण |
समाधान अवलोकन
निम्नलिखित आरेख प्रत्येक चरण का प्रतिनिधित्व करता है जिसे हम आम तौर पर एक आईडीपी पाइपलाइन में देखते हैं। हम इन चरणों में से प्रत्येक के माध्यम से चलते हैं और वे दावा आवेदन प्रक्रिया में शामिल चरणों से कैसे जुड़ते हैं, जब से आवेदन जमा किया जाता है, आवेदन की जांच और बंद करने के लिए। इस पोस्ट में, हम डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों के तकनीकी विवरण को कवर करते हैं। में भाग 2, हम दस्तावेज़ निष्कर्षण चरण का विस्तार करते हैं और दस्तावेज़ संवर्धन, समीक्षा और सत्यापन जारी रखते हैं, और दावा धोखाधड़ी उपयोग मामले के लिए विश्लेषण और विज़ुअलाइज़ेशन प्रदान करने के लिए समाधान का विस्तार करते हैं।
निम्नलिखित आर्किटेक्चर आरेख एक दावा प्रसंस्करण आवेदन के विभिन्न चरणों के अनुसार आईडीपी पाइपलाइन के चरणों के दौरान उपयोग की जाने वाली विभिन्न एडब्ल्यूएस सेवाओं को दिखाता है।
समाधान निम्नलिखित प्रमुख सेवाओं का उपयोग करता है:
- अमेज़न टेक्सट्रेक एक मशीन लर्निंग (एमएल) सेवा है जो स्कैन किए गए दस्तावेज़ों से स्वचालित रूप से टेक्स्ट, हस्तलेखन और डेटा निकालती है। यह फॉर्म और टेबल से डेटा को पहचानने, समझने और निकालने के लिए सरल ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) से आगे निकल जाता है। अमेज़ॅन टेक्स्टट्रैक्ट किसी भी प्रकार के दस्तावेज़ को पढ़ने और संसाधित करने के लिए एमएल का उपयोग करता है, बिना किसी मैन्युअल प्रयास के टेक्स्ट, हस्तलेखन, टेबल और अन्य डेटा को सटीक रूप से निकालता है।
- Amazon Comprehend एक प्राकृतिक भाषा प्रसंस्करण (एनएलपी) सेवा है जो पाठ से अंतर्दृष्टि निकालने के लिए एमएल का उपयोग करती है। अमेज़ॅन कॉम्प्रिहेंड व्यक्ति, स्थान, तिथि, मात्रा, और बहुत कुछ जैसी संस्थाओं का पता लगा सकता है। यह प्रमुख भाषा, व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई) जानकारी का भी पता लगा सकता है और दस्तावेजों को उनके संबंधित वर्ग में वर्गीकृत कर सकता है।
- अमेज़न संवर्धित ऐ (अमेज़ॅन ए2आई) एक एमएल सेवा है जो मानव समीक्षा के लिए आवश्यक कार्यप्रवाह बनाना आसान बनाती है। Amazon A2I मानव समीक्षा प्रणाली के निर्माण या बड़ी संख्या में मानव समीक्षकों के प्रबंधन से जुड़े अविभाज्य भारी भारोत्तोलन को हटाकर, सभी डेवलपर्स के लिए मानव समीक्षा लाता है। Amazon A2I दोनों को एकीकृत करता है अमेज़न टेक्सट्रेक और Amazon Comprehend IDP वर्कफ़्लो के भीतर मानव समीक्षा या सत्यापन शुरू करने की क्षमता प्रदान करने के लिए।
.. पूर्वापेक्षाएँ
निम्नलिखित अनुभागों में, हम आर्किटेक्चर के पहले तीन चरणों, यानी डेटा कैप्चर, वर्गीकरण और निष्कर्षण चरणों से संबंधित विभिन्न सेवाओं के माध्यम से चलते हैं।
हमारा संदर्भ लें गिटहब भंडार दावा प्रसंस्करण पैकेट में दस्तावेज़ नमूनों के साथ पूर्ण कोड नमूने के लिए।
डेटा कैप्चर चरण
दावे और इसके सहायक दस्तावेज विभिन्न चैनलों, जैसे फैक्स, ईमेल, एक व्यवस्थापक पोर्टल, आदि के माध्यम से आ सकते हैं। आप इन दस्तावेज़ों को अत्यधिक स्केलेबल और टिकाऊ स्टोरेज में स्टोर कर सकते हैं जैसे अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। ये दस्तावेज़ विभिन्न प्रकार के हो सकते हैं, जैसे PDF, JPEG, PNG, TIFF, और बहुत कुछ। दस्तावेज़ विभिन्न स्वरूपों और लेआउट में आ सकते हैं, और विभिन्न चैनलों से डेटा स्टोर में आ सकते हैं।
वर्गीकरण चरण
दस्तावेज़ वर्गीकरण चरण में, हम डेटा कैप्चर चरण में संग्रहीत दस्तावेज़ों को वर्गीकृत करने के लिए टेक्स्ट को दस्तावेज़ संदर्भ में परिवर्तित करने के लिए अमेज़ॅन टेक्सट्रेक्ट के साथ अमेज़ॅन कॉम्प्रिहेंड को जोड़ सकते हैं। फिर हम अमेज़ॅन कॉम्प्रिहेंड में कस्टम वर्गीकरण का उपयोग दस्तावेजों को उन वर्गों में व्यवस्थित करने के लिए कर सकते हैं जिन्हें हमने दावा प्रसंस्करण पैकेट में परिभाषित किया है। दस्तावेज़ सत्यापन प्रक्रिया को स्वचालित करने और पैकेट से किसी भी लापता दस्तावेज़ की पहचान करने के लिए कस्टम वर्गीकरण भी सहायक है। कस्टम वर्गीकरण में दो चरण होते हैं, जैसा कि आर्किटेक्चर आरेख में दिखाया गया है:
- कस्टम क्लासिफायरियर के लिए प्रशिक्षण डेटा तैयार करने के लिए डेटा स्टोरेज में सभी दस्तावेज़ों से Amazon Textract का उपयोग करके टेक्स्ट निकालें।
- अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करें (जिसे a . भी कहा जाता है) दस्तावेज़ वर्गीकृत) पाठ्य सामग्री के आधार पर रुचि के वर्गों को पहचानना।
अमेज़ॅन कॉम्प्रिहेंड कस्टम वर्गीकरण मॉडल को प्रशिक्षित करने के बाद, हम दस्तावेज़ों को वर्गीकृत करने के लिए रीयल-टाइम एंडपॉइंट का उपयोग कर सकते हैं। अमेज़ॅन कॉम्प्रिहेंड सभी वर्गों के दस्तावेज़ों को कुंजी-मूल्य जोड़े की एक सरणी में प्रत्येक वर्ग से जुड़े आत्मविश्वास स्कोर के साथ लौटाता है (Doc_name
- Confidence_score
) हम अनुशंसा करते हैं कि विस्तृत दस्तावेज़ वर्गीकरण नमूना कोड देखें GitHub.
निष्कर्षण चरण
निष्कर्षण चरण में, हम Amazon Textract और Amazon Comprehend का उपयोग करके दस्तावेज़ों से डेटा निकालते हैं। इस पोस्ट के लिए, दावा प्रसंस्करण पैकेट में निम्नलिखित नमूना दस्तावेजों का उपयोग करें: एक सेंटर ऑफ मेडिकेड एंड मेडिकेयर सर्विसेज (सीएमएस) -1500 दावा फॉर्म, चालक का लाइसेंस और बीमा आईडी, और चालान।
CMS-1500 दावा प्रपत्र से डेटा निकालें
CMS-1500 फॉर्म एक गैर-संस्थागत प्रदाता या आपूर्तिकर्ता द्वारा मेडिकेयर कैरियर्स को बिल करने के लिए उपयोग किया जाने वाला मानक दावा फॉर्म है।
CMS-1500 फ़ॉर्म को सटीक रूप से संसाधित करना महत्वपूर्ण है, अन्यथा यह दावों की प्रक्रिया को धीमा कर सकता है या वाहक द्वारा भुगतान में देरी कर सकता है। अमेज़ॅन टेक्सट्रैक्ट के साथ AnalyzeDocument
एपीआई, हम दावा फॉर्म के भीतर और अंतर्दृष्टि को समझने के लिए दस्तावेजों से टेक्स्ट निकालने के लिए निष्कर्षण प्रक्रिया को उच्च सटीकता के साथ तेज कर सकते हैं। CMS-1500 क्लेम फॉर्म का नमूना दस्तावेज निम्नलिखित है।
अब हम का उपयोग करते हैं AnalyzeDocument
एपीआई दो निकालने के लिए FeatureTypes
, FORMS
और TABLES
, दस्तावेज़ से:
बेहतर पठनीयता के लिए निम्नलिखित परिणामों को छोटा कर दिया गया है। अधिक विस्तृत जानकारी के लिए, हमारे देखें गिटहब रेपो।
RSI FORMS
निष्कर्षण को कुंजी-मूल्य जोड़े के रूप में पहचाना जाता है।
RSI TABLES
निष्कर्षण में दावा प्रपत्र में ज्ञात तालिका के भीतर सेल, मर्ज किए गए सेल और कॉलम हेडर शामिल हैं।
आईडी दस्तावेज़ों से डेटा निकालें
बीमा आईडी जैसे पहचान दस्तावेजों के लिए, जिनके अलग-अलग लेआउट हो सकते हैं, हम Amazon Textract का उपयोग कर सकते हैं AnalyzeDocument
एपीआई। हम उपयोग करते हैं FeatureType
FORMS
के लिए विन्यास के रूप में AnalyzeDocument
एपीआई बीमा आईडी से कुंजी-मूल्य जोड़े निकालने के लिए (निम्न नमूना देखें):
निम्नलिखित कोड चलाएँ:
हमें परिणाम सरणी में कुंजी-मान जोड़े मिलते हैं, जैसा कि निम्न स्क्रीनशॉट में दिखाया गया है।
यूएस ड्राइवर लाइसेंस या यूएस पासपोर्ट जैसे आईडी दस्तावेज़ों के लिए, अमेज़ॅन टेक्स्टट्रैक्ट टेम्प्लेट या प्रारूपों की आवश्यकता के बिना मुख्य शर्तों को स्वचालित रूप से निकालने के लिए विशेष सहायता प्रदान करता है, जैसा कि हमने पहले बीमा आईडी उदाहरण के लिए देखा था। साथ AnalyzeID
एपीआई, व्यवसाय अलग-अलग टेम्प्लेट या प्रारूप वाले आईडी दस्तावेज़ों से जानकारी जल्दी और सटीक रूप से निकाल सकते हैं। AnalyzeID
एपीआई डेटा प्रकारों की दो श्रेणियां लौटाता है:
- आईडी पर उपलब्ध की-वैल्यू पेयर जैसे जन्म तिथि, जारी करने की तिथि, आईडी नंबर, वर्ग और प्रतिबंध
- दस्तावेज़ पर निहित फ़ील्ड जिनमें उनके साथ स्पष्ट कुंजियाँ नहीं हो सकती हैं, जैसे नाम, पता और जारीकर्ता
हम अपने दावे प्रसंस्करण पैकेट से निम्नलिखित नमूना यूएस ड्राइवर लाइसेंस का उपयोग करते हैं।
निम्नलिखित कोड चलाएँ:
निम्नलिखित स्क्रीनशॉट हमारा परिणाम दिखाता है।
परिणाम स्क्रीनशॉट से, आप देख सकते हैं कि कुछ कुंजियाँ प्रस्तुत की गई हैं जो स्वयं ड्राइवर के लाइसेंस में नहीं थीं। उदाहरण के लिए, Veteran
लाइसेंस में मिली कुंजी नहीं है; हालांकि, यह एक पूर्व-आबादी की-मान है कि AnalyzeID
राज्यों के बीच लाइसेंस में पाए गए अंतर के कारण समर्थन करता है।
चालान और प्राप्तियों से डेटा निकालें
के समान AnalyzeID
एपीआई, AnalyzeExpense
एपीआई इनवॉइस और रसीदों के लिए विशेष सहायता प्रदान करता है ताकि प्रासंगिक जानकारी जैसे विक्रेता का नाम, उप-योग और कुल राशि, और अधिक चालान दस्तावेजों के किसी भी प्रारूप से निकाला जा सके। निष्कर्षण के लिए आपको किसी टेम्पलेट या कॉन्फ़िगरेशन की आवश्यकता नहीं है। Amazon Textract अस्पष्ट इनवॉइस और रसीदों के संदर्भ को समझने के लिए ML का उपयोग करता है।
निम्नलिखित एक नमूना चिकित्सा बीमा चालान है।
हम उपयोग AnalyzeExpense
मानकीकृत क्षेत्रों की सूची देखने के लिए एपीआई। वे फ़ील्ड जिन्हें मानक फ़ील्ड के रूप में पहचाना नहीं जाता है, उन्हें इस प्रकार वर्गीकृत किया जाता है OTHER
:
हमें परिणामों में की-वैल्यू पेयर (बाईं ओर स्क्रीनशॉट देखें) और खरीदे गए अलग-अलग लाइन आइटम की पूरी पंक्ति (दाईं ओर स्क्रीनशॉट देखें) के रूप में फ़ील्ड की निम्नलिखित सूची मिलती है।
निष्कर्ष
इस पोस्ट में, हमने दावा प्रसंस्करण में आम चुनौतियों का प्रदर्शन किया, और हम एक दावे को स्वचालित रूप से तय करने के लिए एक बुद्धिमान दस्तावेज़ प्रसंस्करण पाइपलाइन को स्वचालित करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग कैसे कर सकते हैं। हमने देखा कि अमेज़ॅन कॉम्प्रिहेंड कस्टम क्लासिफायर का उपयोग करके दस्तावेज़ों को विभिन्न दस्तावेज़ वर्गों में कैसे वर्गीकृत किया जाता है, और असंरचित, अर्ध-संरचित, संरचित और विशेष दस्तावेज़ प्रकारों को निकालने के लिए अमेज़ॅन टेक्सट्रैक्ट का उपयोग कैसे किया जाता है।
In भाग 2, हम Amazon Textract के साथ निष्कर्षण चरण पर विस्तार करते हैं। हम डेटा को समृद्ध करने के लिए अमेज़ॅन कॉम्प्रिहेंड पूर्व-निर्धारित संस्थाओं और कस्टम संस्थाओं का भी उपयोग करते हैं, और यह दिखाते हैं कि आगे की प्रक्रिया के लिए एनालिटिक्स और विज़ुअलाइज़ेशन सेवाओं के साथ एकीकृत करने के लिए आईडीपी पाइपलाइन का विस्तार कैसे किया जाए।
हम अनुशंसा करते हैं कि के सुरक्षा अनुभागों की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, अमेज़न समझ, और अमेज़न A2I दस्तावेज़ीकरण और प्रदान किए गए दिशानिर्देशों का पालन करना। समाधान के मूल्य निर्धारण के बारे में अधिक जानने के लिए, के मूल्य निर्धारण विवरण की समीक्षा करें अमेज़ॅन टेक्सट्रैक्ट, Amazon Comprehend, तथा अमेज़न A2I.
लेखक के बारे में
चिन्मयी राणे Amazon वेब सर्विसेज में AI/ML स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह अनुप्रयुक्त गणित और मशीन लर्निंग के बारे में भावुक है। वह AWS ग्राहकों के लिए बुद्धिमान दस्तावेज़ प्रसंस्करण समाधान तैयार करने पर ध्यान केंद्रित करती है। काम के अलावा, वह सालसा और बचाटा नृत्य का आनंद लेती है।
सोनाली साहू अमेज़ॅन वेब सर्विसेज में इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग एआई / एमएल सॉल्यूशंस आर्किटेक्ट टीम का नेतृत्व कर रहा है। वह एक भावुक टेक्नोफाइल है और नवाचार का उपयोग करके जटिल समस्याओं को हल करने के लिए ग्राहकों के साथ काम करना पसंद करती है। उनका मुख्य फोकस आर्टिफिशियल इंटेलिजेंस और इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग के लिए मशीन लर्निंग है।
टिम कोंडेलो Amazon Web Services में वरिष्ठ AI/ML विशेषज्ञ समाधान वास्तुकार हैं। उनका ध्यान प्राकृतिक भाषा प्रसंस्करण और कंप्यूटर दृष्टि है। टिम को ग्राहकों के विचारों को लेने और उन्हें स्केलेबल समाधानों में बदलने में मज़ा आता है।
- AI
- ai कला
- ऐ कला जनरेटर
- ऐ रोबोट
- Amazon Comprehend
- अमेज़न कॉम्प्रिहेंड मेडिकल
- अमेज़ॅन मशीन लर्निंग
- अमेज़न टेक्सट्रेक
- कृत्रिम बुद्धिमत्ता
- कृत्रिम बुद्धिमत्ता प्रमाणन
- बैंकिंग में आर्टिफिशियल इंटेलिजेंस
- आर्टिफिशियल इंटेलिजेंस रोबोट
- आर्टिफिशियल इंटेलिजेंस रोबोट
- कृत्रिम बुद्धि सॉफ्टवेयर
- AWS मशीन लर्निंग
- blockchain
- ब्लॉकचेन सम्मेलन एआई
- कॉइनजीनियस
- संवादी कृत्रिम बुद्धिमत्ता
- क्रिप्टो सम्मेलन एआई
- दल-ए
- ध्यान लगा के पढ़ना या सीखना
- इसे गूगल करें
- इंटरमीडिएट (200)
- यंत्र अधिगम
- प्लेटो
- प्लेटो एआई
- प्लेटो डेटा इंटेलिजेंस
- प्लेटो गेम
- प्लेटोडाटा
- प्लेटोगेमिंग
- स्केल एआई
- वाक्यविन्यास
- जेफिरनेट