बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

बीमा उद्योग में एडब्ल्यूएस एआई और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2

In भाग 1 इस श्रृंखला में, हमने बुद्धिमान दस्तावेज़ प्रसंस्करण (आईडीपी) पर चर्चा की, और कैसे आईडीपी बीमा उद्योग में दावों के प्रसंस्करण उपयोग के मामलों में तेजी ला सकता है। हमने चर्चा की कि हम सहायक दस्तावेजों के साथ दावों के दस्तावेजों को सटीक रूप से वर्गीकृत करने के लिए एडब्ल्यूएस एआई सेवाओं का उपयोग कैसे कर सकते हैं। हमने यह भी चर्चा की कि बीमा दावों के पैकेज में विभिन्न प्रकार के दस्तावेज़ों को कैसे निकाला जाए, जैसे कि फॉर्म, टेबल, या विशेष दस्तावेज़ जैसे चालान, रसीदें, या आईडी दस्तावेज़। हमने विरासती दस्तावेज़ प्रक्रियाओं में चुनौतियों पर ध्यान दिया, जो समय लेने वाली, त्रुटि-प्रवण, महंगी और बड़े पैमाने पर संसाधित करने में कठिन है, और आप अपनी IDP पाइपलाइन को लागू करने में मदद करने के लिए AWS AI सेवाओं का उपयोग कैसे कर सकते हैं।

इस पोस्ट में, हम आपको दस्तावेज़ निष्कर्षण, पूछताछ और संवर्धन के लिए उन्नत आईडीपी सुविधाओं के बारे में बताते हैं। हम यह भी देखते हैं कि AWS एनालिटिक्स और विज़ुअलाइज़ेशन सेवाओं का उपयोग करके जानकारी प्राप्त करने के लिए दावा डेटा से निकाली गई संरचित जानकारी का और उपयोग कैसे करें। हम इस बात पर प्रकाश डालते हैं कि कैसे IDP से निकाला गया संरचित डेटा AWS एनालिटिक्स सेवाओं का उपयोग करके कपटपूर्ण दावों के विरुद्ध मदद कर सकता है।

समाधान अवलोकन

निम्नलिखित आरेख चरणों को दिखाता है यदि IDP AWS AI सेवाओं का उपयोग करता है। भाग 1 में, हमने IDP वर्कफ़्लो के पहले तीन चरणों पर चर्चा की। इस पोस्ट में, हम निष्कर्षण चरण और शेष चरणों पर विस्तार करते हैं, जिसमें AWS एनालिटिक्स सेवाओं के साथ IDP को एकीकृत करना शामिल है।

हम इन विश्लेषण सेवाओं का उपयोग आगे की अंतर्दृष्टि और विज़ुअलाइज़ेशन के लिए करते हैं, और IDP से संरचित, सामान्यीकृत डेटा का उपयोग करके कपटपूर्ण दावों का पता लगाने के लिए करते हैं। निम्नलिखित आरेख समाधान वास्तुकला को दर्शाता है।

आईडीपी वास्तुकला आरेख

इस पोस्ट में हम जिन चरणों की चर्चा करते हैं, वे निम्नलिखित प्रमुख सेवाओं का उपयोग करते हैं:

  • अमेज़न कॉम्प्रिहेंड मेडिकल एक एचआईपीएए-योग्य प्राकृतिक भाषा प्रसंस्करण (एनएलपी) सेवा है जो मशीन लर्निंग (एमएल) मॉडल का उपयोग करती है जिन्हें चिकित्सकीय पाठ से स्वास्थ्य डेटा को समझने और निकालने के लिए पूर्व-प्रशिक्षित किया गया है, जैसे नुस्खे, प्रक्रियाएं, या निदान।
  • एडब्ल्यूएस गोंद एडब्ल्यूएस एनालिटिक्स सेवाओं के ढेर का एक हिस्सा है, और एक सर्वर रहित डेटा एकीकरण सेवा है जो एनालिटिक्स, एमएल और एप्लिकेशन डेवलपमेंट के लिए डेटा को खोजना, तैयार करना और संयोजित करना आसान बनाता है।
  • अमेज़न रेडशिफ्ट Analytics स्टैक में एक अन्य सेवा है। Amazon Redshift क्लाउड में पूरी तरह से प्रबंधित, पेटाबाइट-स्केल डेटा वेयरहाउस सेवा है।

.. पूर्वापेक्षाएँ

आरंभ करने से पहले, देखें भाग 1 आईडीपी के साथ बीमा उपयोग के मामले के उच्च स्तरीय अवलोकन के लिए और डेटा कैप्चर और वर्गीकरण चरणों के विवरण के लिए।

कोड नमूने के बारे में अधिक जानकारी के लिए, हमारे देखें गिटहब रेपो।

निष्कर्षण चरण

भाग 1 में, हमने देखा कि दस्तावेज़ों से प्रपत्र और तालिकाओं जैसी जानकारी निकालने के लिए Amazon Textract API का उपयोग कैसे करें, और चालान और पहचान दस्तावेज़ों का विश्लेषण कैसे करें। इस पोस्ट में, हम कस्टम उपयोग के मामलों के लिए विशिष्ट डिफ़ॉल्ट और कस्टम संस्थाओं को निकालने के लिए अमेज़ॅन कॉम्प्रिहेंड के साथ निष्कर्षण चरण को बढ़ाते हैं।

बीमा वाहक अक्सर बीमा दावों के आवेदनों में घने पाठ में आते हैं, ऐसे रोगी का निर्वहन सारांश पत्र (निम्न उदाहरण छवि देखें)। इस प्रकार के दस्तावेजों से जहां कोई निश्चित संरचना नहीं है, स्वचालित रूप से जानकारी निकालना मुश्किल हो सकता है। इसे संबोधित करने के लिए, हम दस्तावेज़ से प्रमुख व्यावसायिक जानकारी निकालने के लिए निम्नलिखित विधियों का उपयोग कर सकते हैं:

निर्वहन सारांश नमूना

Amazon Comprehend DetectEntities API के साथ डिफ़ॉल्ट निकाय निकालें

हम नमूना मेडिकल ट्रांसक्रिप्शन दस्तावेज़ पर निम्नलिखित कोड चलाते हैं:

comprehend = boto3.client('comprehend') 

response = comprehend.detect_entities( Text=text, LanguageCode='en')

#print enitities from the response JSON

for entity in response['Entities']:
    print(f'{entity["Type"]} : {entity["Text"]}')

निम्न स्क्रीनशॉट इनपुट टेक्स्ट में पहचाने गए निकायों का संग्रह दिखाता है। इस पोस्ट के प्रयोजनों के लिए आउटपुट को छोटा कर दिया गया है। को देखें गीथहब रेपो संस्थाओं की विस्तृत सूची के लिए।

बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

अमेज़ॅन कॉम्प्रिहेंड कस्टम एंटिटी रिकग्निशन के साथ कस्टम निकाय निकालें

से प्रतिक्रिया DetectEntities एपीआई में डिफ़ॉल्ट इकाइयां शामिल हैं। हालांकि, हम विशिष्ट इकाई मूल्यों को जानने में रुचि रखते हैं, जैसे कि रोगी का नाम (डिफ़ॉल्ट इकाई द्वारा दर्शाया गया .) PERSON), या रोगी की आईडी (डिफ़ॉल्ट इकाई द्वारा चिह्नित) OTHER) इन कस्टम निकायों को पहचानने के लिए, हम एक Amazon Comprehend कस्टम निकाय पहचानकर्ता मॉडल को प्रशिक्षित करते हैं। हम अनुशंसा करते हैं कि कस्टम निकाय पहचान मॉडल को प्रशिक्षित और परिनियोजित करने के बारे में व्यापक चरणों का पालन करें गिटहब रेपो।

कस्टम मॉडल को परिनियोजित करने के बाद, हम सहायक फ़ंक्शन का उपयोग कर सकते हैं get_entities() जैसे कस्टम संस्थाओं को पुनः प्राप्त करने के लिए PATIENT_NAME और PATIENT_D एपीआई प्रतिक्रिया से:

def get_entities(text):
try:
    #detect entities
    entities_custom = comprehend.detect_entities(LanguageCode="en",
                      Text=text, EndpointArn=ER_ENDPOINT_ARN) 
    df_custom = pd.DataFrame(entities_custom["Entities"], columns = ['Text',  
                'Type', 'Score'])
    df_custom = df_custom.drop_duplicates(subset=['Text']).reset_index()
    return df_custom
except Exception as e:
    print(e)

# call the get_entities() function 
response = get_entities(text) 
#print the response from the get_entities() function
print(response)

निम्नलिखित स्क्रीनशॉट हमारे परिणाम दिखाता है।

बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

संवर्धन चरण

दस्तावेज़ संवर्धन चरण में, हम मूल्यवान अंतर्दृष्टि प्राप्त करने के लिए स्वास्थ्य संबंधी दस्तावेजों पर संवर्धन कार्य करते हैं। हम निम्नलिखित प्रकार के संवर्धन को देखते हैं:

  • डोमेन-विशिष्ट भाषा निकालें - हम ICD-10-CM, RxNorm, और SNOMED CT जैसे चिकित्सा-विशिष्ट ऑन्कोलॉजी निकालने के लिए Amazon Comprehend Medical का उपयोग करते हैं
  • संवेदनशील जानकारी को संशोधित करें - हम व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई), और संरक्षित स्वास्थ्य जानकारी (पीएचआई) सुधार के लिए अमेज़ॅन कॉम्प्रिहेंड मेडिकल को संशोधित करने के लिए अमेज़ॅन कॉम्प्रिहेंड का उपयोग करते हैं।

असंरचित चिकित्सा पाठ से चिकित्सा जानकारी निकालें

चिकित्सा प्रदाताओं के नोट्स और नैदानिक ​​परीक्षण रिपोर्ट जैसे दस्तावेज़ों में सघन चिकित्सा पाठ शामिल है। बीमा दावा वाहकों को इस घने पाठ से निकाली गई स्वास्थ्य जानकारी के बीच संबंधों की पहचान करने और उन्हें ICD-10-CM, RxNorm, और SNOMED CT कोड जैसे चिकित्सा ऑन्कोलॉजी से जोड़ने की आवश्यकता है। दावा प्रसंस्करण में तेजी लाने और सरल बनाने के लिए बीमा कंपनियों के लिए दावा कैप्चर, सत्यापन और अनुमोदन वर्कफ़्लो को स्वचालित करने में यह बहुत मूल्यवान है। आइए देखें कि हम Amazon Comprehend Medical का उपयोग कैसे कर सकते हैं InferICD10CM संस्थाओं के रूप में संभावित चिकित्सा स्थितियों का पता लगाने और उन्हें उनके कोड से जोड़ने के लिए एपीआई:

cm_json_data = comprehend_med.infer_icd10_cm(Text=text)

print("nMedical codingn========")

for entity in cm_json_data["Entities"]:
      for icd in entity["ICD10CMConcepts"]:
           description = icd['Description']
           code = icd["Code"]
           print(f'{description}: {code}')

इनपुट टेक्स्ट के लिए, जिसे हम Amazon Textract से पास कर सकते हैं DetectDocumentText एपीआई, InferICD10CM एपीआई निम्नलिखित आउटपुट देता है (आउटपुट को संक्षिप्तता के लिए संक्षिप्त किया गया है)।

असंरचित चिकित्सा पाठ से चिकित्सा जानकारी निकालें

इसी तरह, हम Amazon Comprehend Medical का उपयोग कर सकते हैं InferRxNorm दवाओं की पहचान करने के लिए एपीआई और InferSNOMEDCT स्वास्थ्य संबंधी बीमा दस्तावेजों के भीतर चिकित्सा संस्थाओं का पता लगाने के लिए एपीआई।

PII और PHI रिडक्शन करें

बीमा दावों के पैकेज में बहुत अधिक गोपनीयता अनुपालन और विनियमों की आवश्यकता होती है क्योंकि उनमें PII और PHI दोनों डेटा होते हैं। बीमा वाहक पॉलिसी नंबर या रोगी के नाम जैसी जानकारी को संशोधित करके अनुपालन जोखिम को कम कर सकते हैं।

आइए एक मरीज के डिस्चार्ज सारांश का एक उदाहरण देखें। हम अमेज़ॅन कॉम्प्रिहेंड का उपयोग करते हैं DetectPiiEntities एपीआई दस्तावेज़ के भीतर पीआईआई संस्थाओं का पता लगाने और इन संस्थाओं को संशोधित करके रोगी की गोपनीयता की रक्षा करने के लिए:

resp = call_textract(input_document = f's3://{data_bucket}/idp/textract/dr-note-sample.png')
text = get_string(textract_json=resp, output_type=[Textract_Pretty_Print.LINES])

# call Amazon Comprehend Detect PII Entities API
entity_resp = comprehend.detect_pii_entities(Text=text, LanguageCode="en") 

pii = []
for entity in entity_resp['Entities']:
      pii_entity={}
      pii_entity['Type'] = entity['Type']
      pii_entity['Text'] = text[entity['BeginOffset']:entity['EndOffset']]
      pii.append(pii_entity)
print(pii)

हमें निम्नलिखित PII इकाइयाँ प्रतिक्रिया में मिलती हैं detect_pii_entities() एपीआई:

Dett_pii_entities() API से प्रतिक्रिया

फिर हम दस्तावेज़ से निकायों की बाउंडिंग बॉक्स ज्यामिति का उपयोग करके दस्तावेज़ों से पता लगाए गए PII निकायों को फिर से संपादित कर सकते हैं। उसके लिए, हम एक हेल्पर टूल का उपयोग करते हैं जिसे कहा जाता है amazon-textract-overlayer. अधिक जानकारी के लिए देखें टेक्स्टट्रैक्ट-ओवरलेयर. निम्नलिखित स्क्रीनशॉट में संशोधन से पहले और बाद में किसी दस्तावेज़ की तुलना की जाती है।

बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

अमेज़ॅन कॉम्प्रिहेंड के समान DetectPiiEntities एपीआई, हम भी उपयोग कर सकते हैं DetectPHI जांच किए जा रहे नैदानिक ​​पाठ में पीएचआई डेटा का पता लगाने के लिए एपीआई। अधिक जानकारी के लिए देखें पीएचआई का पता लगाएं।

समीक्षा और सत्यापन चरण

दस्तावेज़ समीक्षा और सत्यापन चरण में, अब हम सत्यापित कर सकते हैं कि दावा पैकेज व्यवसाय की आवश्यकताओं को पूरा करता है या नहीं, क्योंकि हमारे पास पैकेज में दस्तावेजों से पहले के चरणों से एकत्र की गई सभी जानकारी है। हम लूप में एक मानव को पेश करके ऐसा कर सकते हैं जो सभी क्षेत्रों की समीक्षा और सत्यापन कर सकता है या डाउनस्ट्रीम अनुप्रयोगों को पैकेज भेजने से पहले कम डॉलर के दावों के लिए एक ऑटो-स्वीकृति प्रक्रिया कर सकता है। हम प्रयोग कर सकते हैं अमेज़न संवर्धित ऐ (अमेज़ॅन ए2आई) बीमा दावों के प्रसंस्करण के लिए मानव समीक्षा प्रक्रिया को स्वचालित करने के लिए।

बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

अब जब हमारे पास आईडीपी के लिए एआई सेवाओं का उपयोग करके दावा प्रसंस्करण से निकाले गए और सामान्यीकृत सभी आवश्यक डेटा हैं, तो हम अतिरिक्त उपयोग के मामलों को हल करने और आगे के विश्लेषण और विज़ुअलाइज़ेशन प्रदान करने के लिए एडब्ल्यूएस एनालिटिक्स सेवाओं जैसे एडब्ल्यूएस ग्लू और अमेज़ॅन रेडशिफ्ट के साथ एकीकृत करने के लिए समाधान का विस्तार कर सकते हैं।

कपटपूर्ण बीमा दावों का पता लगाएं

इस पोस्ट में, हम एक सर्वर रहित आर्किटेक्चर को लागू करते हैं जहां निकाले और संसाधित डेटा को डेटा लेक में संग्रहीत किया जाता है और इसका उपयोग एमएल का उपयोग करके धोखाधड़ी वाले बीमा दावों का पता लगाने के लिए किया जाता है। हम उपयोग करते हैं अमेज़न सरल भंडारण सेवा (अमेज़ॅन S3) संसाधित डेटा को संग्रहीत करने के लिए। हम तब उपयोग कर सकते हैं एडब्ल्यूएस गोंद or अमेज़ॅन ईएमआर डेटा को शुद्ध करने और अतिरिक्त फ़ील्ड जोड़ने के लिए इसे रिपोर्टिंग और एमएल के लिए उपभोज्य बनाने के लिए। उसके बाद, हम उपयोग करते हैं अमेज़ॅन रेडशिफ्ट एमएल धोखाधड़ी का पता लगाने वाले एमएल मॉडल का निर्माण करने के लिए। अंत में, हम रिपोर्ट का निर्माण करते हैं अमेज़न क्विकसाइट डेटा में अंतर्दृष्टि प्राप्त करने के लिए।

Amazon Redshift बाहरी स्कीमा सेटअप करें

इस उदाहरण के प्रयोजन के लिए, हमने बनाया है a नमूना डेटासेट ETL (एक्सट्रेक्ट, ट्रांसफॉर्म और लोड) प्रक्रिया के आउटपुट का अनुकरण करता है, और मेटाडेटा कैटलॉग के रूप में AWS ग्लू डेटा कैटलॉग का उपयोग करता है। सबसे पहले, हम नाम का एक डेटाबेस बनाते हैं idp_demo डेटा कैटलॉग में और Amazon Redshift में एक बाहरी स्कीमा कहा जाता है idp_insurance_demo (निम्नलिखित कोड देखें)। हम एक का उपयोग करते हैं AWS पहचान और अभिगम प्रबंधन (IAM) Amazon Redshift क्लस्टर को Amazon S3 और . तक पहुंचने की अनुमति देने की भूमिका अमेज़न SageMaker. इस IAM भूमिका को कम से कम विशेषाधिकार के साथ कैसे सेट किया जाए, इस बारे में अधिक जानकारी के लिए देखें Amazon Redshift ML व्यवस्थापन के लिए क्लस्टर और कॉन्फ़िगर सेटअप.

CREATE EXTERNAL SCHEMA idp_insurance_demo
FROM DATA CATALOG
DATABASE 'idp_demo' 
IAM_ROLE '<<>>'
CREATE EXTERNAL DATABASE IF NOT EXISTS;

अमेज़ॅन रेडशिफ्ट बाहरी तालिका बनाएं

अगला कदम अमेज़ॅन रेडशिफ्ट में एक बाहरी तालिका बनाना है जो एस 3 स्थान को संदर्भित करता है जहां फ़ाइल स्थित है। इस मामले में, हमारी फ़ाइल अल्पविराम से अलग की गई टेक्स्ट फ़ाइल है। हम फ़ाइल से हेडर पंक्ति को भी छोड़ना चाहते हैं, जिसे तालिका गुण अनुभाग में कॉन्फ़िगर किया जा सकता है। निम्नलिखित कोड देखें:

create external table idp_insurance_demo.claims(id INTEGER,
date_of_service date,
patients_address_city VARCHAR,
patients_address_state VARCHAR,
patients_address_zip VARCHAR,
patient_status VARCHAR,
insured_address_state VARCHAR,
insured_address_zip VARCHAR,
insured_date_of_birth date,
insurance_plan_name VARCHAR,
total_charges DECIMAL(14,4),
fraud VARCHAR,
duplicate varchar,
invalid_claim VARCHAR
)
row format delimited
fields terminated by ','
stored as textfile
location '<<>>'
table properties ( 'skip.header.line.count'='1');

प्रशिक्षण और परीक्षण डेटासेट बनाएं

बाहरी तालिका बनाने के बाद, हम अपने डेटासेट को प्रशिक्षण सेट और परीक्षण सेट में विभाजित करके एमएल के लिए तैयार करते हैं। हम एक नई बाहरी तालिका बनाते हैं जिसे कहा जाता है claim_train, जिसमें दावा तालिका से आईडी <= 85000 के साथ सभी रिकॉर्ड शामिल हैं। यह वह प्रशिक्षण सेट है जिस पर हम अपने एमएल मॉडल को प्रशिक्षित करते हैं।

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_train
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/train'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id <= 850000

हम एक और बाहरी तालिका बनाते हैं जिसे कहा जाता है claim_test जिसमें आईडी>85000 के साथ सभी रिकॉर्ड शामिल हैं, जो परीक्षण सेट है, जिस पर हम एमएल मॉडल का परीक्षण करते हैं:

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_test
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/test'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id > 850000

Amazon Redshift ML के साथ एक ML मॉडल बनाएं

अब हम का उपयोग करके मॉडल बनाते हैं मॉडल बनाएं कमांड (निम्न कोड देखें)। हम से संबंधित कॉलम का चयन करते हैं claims_train तालिका जो एक धोखाधड़ी लेनदेन निर्धारित कर सकती है। इस मॉडल का लक्ष्य के मूल्य की भविष्यवाणी करना है fraud कॉलम; इसलिए, fraud भविष्यवाणी लक्ष्य के रूप में जोड़ा जाता है। मॉडल को प्रशिक्षित करने के बाद, यह नाम का एक फ़ंक्शन बनाता है insurance_fraud_model. इस फ़ंक्शन का उपयोग अनुमान के लिए किया जाता है, जबकि SQL कथनों के मूल्य की भविष्यवाणी करने के लिए चलाते हैं fraud नए रिकॉर्ड के लिए कॉलम।

CREATE MODEL idp_insurance_demo.insurance_fraud_model
FROM (SELECT 
total_charges ,
fraud ,
duplicate,
invalid_claim
FROM idp_insurance_demo.claims_train
)
TARGET fraud
FUNCTION insurance_fraud_model
IAM_ROLE '<<>>'
SETTINGS (
S3_BUCKET '<<>>'
);

एमएल मॉडल मेट्रिक्स का मूल्यांकन करें

मॉडल बनाने के बाद, हम मॉडल की सटीकता की जांच करने के लिए क्वेरी चला सकते हैं। हम उपयोग करते हैं insurance_fraud_model के मूल्य की भविष्यवाणी करने के लिए कार्य fraud नए रिकॉर्ड के लिए कॉलम। पर निम्न क्वेरी चलाएँ claims_test एक भ्रम मैट्रिक्स बनाने के लिए तालिका:

SELECT 
fraud,
idp_insurance_demo.insurance_fraud_model (total_charges ,duplicate,invalid_claim ) as fraud_calculcated,
count(1)
FROM idp_insurance_demo.claims_test
GROUP BY fraud , fraud_calculcated;

एमएल मॉडल का उपयोग करके धोखाधड़ी का पता लगाएं

नया मॉडल बनाने के बाद, जैसे ही नए दावों का डेटा डेटा वेयरहाउस या डेटा लेक में डाला जाता है, हम इसका उपयोग कर सकते हैं insurance_fraud_model धोखाधड़ी लेनदेन की गणना करने के लिए कार्य। हम पहले नए डेटा को एक अस्थायी तालिका में लोड करके ऐसा करते हैं। तब हम का उपयोग करते हैं insurance_fraud_model गणना करने के लिए कार्य fraud प्रत्येक नए लेनदेन के लिए ध्वज और ध्वज के साथ डेटा को अंतिम तालिका में डालें, जो इस मामले में है claims तालिका.

दावों के आंकड़ों की कल्पना करें

जब डेटा Amazon Redshift में उपलब्ध होता है, तो हम QuickSight का उपयोग करके विज़ुअलाइज़ेशन बना सकते हैं। फिर हम QuickSight डैशबोर्ड को व्यावसायिक उपयोगकर्ताओं और विश्लेषकों के साथ साझा कर सकते हैं। QuickSight डैशबोर्ड बनाने के लिए, आपको सबसे पहले QuickSight में Amazon Redshift डेटासेट बनाना होगा। निर्देशों के लिए, देखें डेटाबेस से डेटासेट बनाना.

डेटासेट बनाने के बाद, आप डेटासेट का उपयोग करके QuickSight में एक नया विश्लेषण बना सकते हैं। हमारे द्वारा बनाई गई कुछ नमूना रिपोर्टें निम्नलिखित हैं:

  • द्वारा समूहीकृत राज्य द्वारा दावों की कुल संख्या fraud खेत - यह चार्ट हमें किसी विशेष राज्य में लेनदेन की कुल संख्या की तुलना में धोखाधड़ी वाले लेनदेन का अनुपात दिखाता है।
  • दावों के कुल डॉलर मूल्य का योग, द्वारा समूहीकृत fraud खेत - यह चार्ट हमें किसी विशेष राज्य में लेनदेन की कुल डॉलर राशि की तुलना में धोखाधड़ी वाले लेनदेन की डॉलर राशि का अनुपात दिखाता है।
  • द्वारा समूहीकृत प्रति बीमा कंपनी लेनदेन की कुल संख्या fraud खेत - यह चार्ट हमें दिखाता है कि प्रत्येक बीमा कंपनी के लिए कितने दावे दायर किए गए और उनमें से कितने फर्जी हैं।

• प्रति बीमा कंपनी लेनदेन की कुल संख्या, धोखाधड़ी क्षेत्र द्वारा समूहीकृत

  • यूएस मानचित्र पर प्रदर्शित राज्य द्वारा कपटपूर्ण लेनदेन का कुल योग - यह चार्ट केवल धोखाधड़ी वाले लेनदेन दिखाता है और मानचित्र पर राज्य द्वारा उन लेनदेन के लिए कुल शुल्क प्रदर्शित करता है। नीले रंग का गहरा शेड उच्च कुल शुल्क दर्शाता है। हम रुझानों को बेहतर ढंग से समझने के लिए उस राज्य के भीतर शहर और शहर के साथ ज़िप कोड का विश्लेषण कर सकते हैं।

बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.

क्लीन अप

अपने एडब्ल्यूएस खाते पर भविष्य के शुल्कों को रोकने के लिए, निर्देशों का पालन करके सेटअप में आपके द्वारा प्रावधान किए गए संसाधनों को हटा दें सफाई अनुभाग हमारे रेपो में।

निष्कर्ष

इस दो-भाग की श्रृंखला में, हमने देखा कि कैसे कम या बिना एमएल अनुभव के एक एंड-टू-एंड आईडीपी पाइपलाइन का निर्माण किया जाता है। हमने बीमा उद्योग में दावों के प्रसंस्करण के उपयोग के मामले का पता लगाया और कैसे आईडीपी इस उपयोग के मामले को स्वचालित करने में मदद कर सकता है, जैसे कि Amazon Textract, Amazon Comprehend, Amazon Comprehend Medical, और Amazon A2I जैसी सेवाओं का उपयोग करना। भाग 1 में, हमने दिखाया कि दस्तावेज़ निष्कर्षण के लिए AWS AI सेवाओं का उपयोग कैसे करें। भाग 2 में, हमने निष्कर्षण चरण को बढ़ाया और डेटा संवर्धन किया। अंत में, हमने आगे के विश्लेषण के लिए IDP से निकाले गए संरचित डेटा का विस्तार किया, और AWS एनालिटिक्स सेवाओं का उपयोग करके कपटपूर्ण दावों का पता लगाने के लिए विज़ुअलाइज़ेशन बनाया।

हम अनुशंसा करते हैं कि के सुरक्षा अनुभागों की समीक्षा करें अमेज़न टेक्सट्रेक, Amazon Comprehend, तथा अमेज़न A2I दस्तावेज़ीकरण और प्रदान किए गए दिशानिर्देशों का पालन करना। समाधान के मूल्य निर्धारण के बारे में अधिक जानने के लिए, के मूल्य निर्धारण विवरण की समीक्षा करें अमेज़न टेक्सट्रेक, Amazon Comprehend, तथा अमेज़न A2I.


लेखक के बारे में

लेखकचिन्मयी राणे Amazon वेब सर्विसेज में AI/ML स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह अनुप्रयुक्त गणित और मशीन लर्निंग के बारे में भावुक है। वह AWS ग्राहकों के लिए बुद्धिमान दस्तावेज़ प्रसंस्करण समाधान तैयार करने पर ध्यान केंद्रित करती है। काम के अलावा, वह सालसा और बचाटा नृत्य का आनंद लेती है।


बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.
उदय नारायणन
एडब्ल्यूएस में एक विश्लेषिकी विशेषज्ञ समाधान वास्तुकार है। उन्हें ग्राहकों को जटिल व्यावसायिक चुनौतियों का नवोन्मेषी समाधान खोजने में मदद करने में आनंद आता है। उनके फोकस के मुख्य क्षेत्र डेटा एनालिटिक्स, बिग डेटा सिस्टम और मशीन लर्निंग हैं। अपने खाली समय में, उन्हें खेल खेलना, टीवी शो देखना और यात्रा करना पसंद है।


बीमा उद्योग में AWS AI और एनालिटिक्स सेवाओं के साथ बुद्धिमान दस्तावेज़ प्रसंस्करण: भाग 2 प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.
सोनाली साहू
अमेज़ॅन वेब सर्विसेज में इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग एआई / एमएल सॉल्यूशंस आर्किटेक्ट टीम का नेतृत्व कर रहा है। वह एक भावुक टेक्नोफाइल है और नवाचार का उपयोग करके जटिल समस्याओं को हल करने के लिए ग्राहकों के साथ काम करना पसंद करती है। उनका मुख्य फोकस आर्टिफिशियल इंटेलिजेंस और इंटेलिजेंट डॉक्यूमेंट प्रोसेसिंग के लिए मशीन लर्निंग है।

समय टिकट:

से अधिक AWS मशीन लर्निंग

अमेज़ॅन सेजमेकर कैनवास भावना विश्लेषण और टेक्स्ट विश्लेषण मॉडल का उपयोग करके उत्पाद समीक्षाओं से अंतर्दृष्टि प्राप्त करने के लिए नो-कोड मशीन लर्निंग का उपयोग करें | अमेज़न वेब सेवाएँ

स्रोत नोड: 1899999
समय टिकट: अक्टूबर 9, 2023