বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2

In পার্ট 1 এই সিরিজের, আমরা ইন্টেলিজেন্ট ডকুমেন্ট প্রসেসিং (IDP) নিয়ে আলোচনা করেছি, এবং কিভাবে IDP বীমা শিল্পে দাবি প্রক্রিয়াকরণ ব্যবহারের ক্ষেত্রে ত্বরান্বিত করতে পারে। আমরা আলোচনা করেছি কিভাবে আমরা AWS AI পরিষেবাগুলিকে সমর্থনকারী নথিগুলির সাথে দাবির নথিগুলিকে সঠিকভাবে শ্রেণীবদ্ধ করতে ব্যবহার করতে পারি৷ আমরা কীভাবে একটি বীমা দাবির প্যাকেজে বিভিন্ন ধরণের নথি যেমন ফর্ম, টেবিল, বা বিশেষায়িত নথি যেমন চালান, রসিদ বা আইডি ডকুমেন্টগুলি বের করতে হয় তা নিয়েও আলোচনা করেছি। আমরা লিগ্যাসি ডকুমেন্ট প্রক্রিয়ার চ্যালেঞ্জগুলি দেখেছি, যা সময়সাপেক্ষ, ত্রুটি-প্রবণ, ব্যয়বহুল এবং স্কেলে প্রক্রিয়া করা কঠিন এবং কীভাবে আপনি আপনার IDP পাইপলাইন বাস্তবায়নে সহায়তা করতে AWS AI পরিষেবাগুলি ব্যবহার করতে পারেন৷

এই পোস্টে, আমরা ডকুমেন্ট নিষ্কাশন, অনুসন্ধান এবং সমৃদ্ধকরণের জন্য উন্নত IDP বৈশিষ্ট্যগুলির মাধ্যমে আপনাকে নিয়ে চলেছি। এডব্লিউএস অ্যানালিটিক্স এবং ভিজ্যুয়ালাইজেশন পরিষেবাগুলি ব্যবহার করে অন্তর্দৃষ্টি পেতে দাবির ডেটা থেকে নিষ্কাশিত কাঠামোগত তথ্য কীভাবে আরও ব্যবহার করা যায় তাও আমরা দেখছি। কিভাবে IDP থেকে বের করা কাঠামোগত ডেটা AWS অ্যানালিটিক্স পরিষেবাগুলি ব্যবহার করে প্রতারণামূলক দাবির বিরুদ্ধে সাহায্য করতে পারে তা আমরা হাইলাইট করি।

সমাধান ওভারভিউ

যদি IDP AWS AI পরিষেবাগুলি ব্যবহার করে তাহলে নিম্নলিখিত চিত্রটি পর্যায়গুলিকে চিত্রিত করে৷ পার্ট 1-এ, আমরা IDP কর্মপ্রবাহের প্রথম তিনটি পর্যায় নিয়ে আলোচনা করেছি। এই পোস্টে, আমরা নিষ্কাশন পদক্ষেপ এবং অবশিষ্ট পর্যায়গুলি সম্প্রসারিত করি, যার মধ্যে AWS অ্যানালিটিক্স পরিষেবাগুলির সাথে IDP একীভূত করা অন্তর্ভুক্ত৷

আমরা আরও অন্তর্দৃষ্টি এবং ভিজ্যুয়ালাইজেশনের জন্য এই বিশ্লেষণ পরিষেবাগুলি ব্যবহার করি এবং IDP থেকে স্ট্রাকচার্ড, স্বাভাবিক ডেটা ব্যবহার করে প্রতারণামূলক দাবি সনাক্ত করতে। নিম্নলিখিত চিত্রটি সমাধানের আর্কিটেকচারকে চিত্রিত করে।

IDP আর্কিটেকচার ডায়াগ্রাম

এই পোস্টে আমরা যে পর্যায়গুলি নিয়ে আলোচনা করেছি তা নিম্নলিখিত মূল পরিষেবাগুলি ব্যবহার করে:

  • অ্যামাজন সমঝোতা মেডিকেল একটি HIPAA-যোগ্য ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং (NLP) পরিষেবা যা মেশিন লার্নিং (ML) মডেলগুলি ব্যবহার করে যেগুলিকে প্রেসক্রিপশন, পদ্ধতি বা রোগ নির্ণয়ের মতো মেডিকেল পাঠ্য থেকে স্বাস্থ্য ডেটা বোঝা এবং বের করার জন্য প্রাক-প্রশিক্ষিত করা হয়েছে।
  • এডাব্লুএস আঠালো AWS অ্যানালিটিক্স পরিষেবা স্ট্যাকের একটি অংশ, এবং এটি একটি সার্ভারহীন ডেটা ইন্টিগ্রেশন পরিষেবা যা বিশ্লেষণ, ML এবং অ্যাপ্লিকেশন ডেভেলপমেন্টের জন্য ডেটা আবিষ্কার, প্রস্তুত এবং একত্রিত করা সহজ করে তোলে৷
  • আমাজন রেডশিফ্ট অ্যানালিটিক্স স্ট্যাকের আরেকটি পরিষেবা। Amazon Redshift হল ক্লাউডে একটি সম্পূর্ণরূপে পরিচালিত, পেটাবাইট-স্কেল ডেটা গুদাম পরিষেবা৷

পূর্বশর্ত

আপনি শুরু করার আগে, পড়ুন পার্ট 1 আইডিপি সহ বীমা ব্যবহারের ক্ষেত্রে একটি উচ্চ-স্তরের ওভারভিউ এবং ডেটা ক্যাপচার এবং শ্রেণীবিভাগের ধাপগুলি সম্পর্কে বিশদ বিবরণের জন্য।

কোড নমুনা সংক্রান্ত আরও তথ্যের জন্য, আমাদের পড়ুন GitHub রেপো।

নিষ্কাশন পর্ব

পার্ট 1-এ, আমরা দেখেছি কিভাবে Amazon Textract APIs ব্যবহার করে নথি থেকে ফর্ম এবং টেবিলের মতো তথ্য বের করতে হয় এবং কীভাবে চালান এবং পরিচয় নথি বিশ্লেষণ করতে হয়। এই পোস্টে, আমরা কাস্টম ব্যবহারের ক্ষেত্রে নির্দিষ্ট ডিফল্ট এবং কাস্টম সত্তাগুলি নিষ্কাশন করতে Amazon Comprehend-এর সাথে নিষ্কাশন পর্বটি উন্নত করি।

বীমা বাহক প্রায়ই বীমা দাবির আবেদনে ঘন টেক্সট জুড়ে আসে, যেমন একটি রোগীর স্রাব সারাংশ চিঠি (নিচের উদাহরণ চিত্র দেখুন)। এই ধরনের নথি থেকে স্বয়ংক্রিয়ভাবে তথ্য বের করা কঠিন হতে পারে যেখানে কোনো নির্দিষ্ট কাঠামো নেই। এটি মোকাবেলা করার জন্য, আমরা নথি থেকে মূল ব্যবসার তথ্য বের করতে নিম্নলিখিত পদ্ধতিগুলি ব্যবহার করতে পারি:

স্রাব সারাংশ নমুনা

Amazon Comprehend DetectEntities API-এর সাহায্যে ডিফল্ট সত্তা বের করুন

আমরা নমুনা মেডিকেল ট্রান্সক্রিপশন নথিতে নিম্নলিখিত কোডটি চালাই:

comprehend = boto3.client('comprehend') 

response = comprehend.detect_entities( Text=text, LanguageCode='en')

#print enitities from the response JSON

for entity in response['Entities']:
    print(f'{entity["Type"]} : {entity["Text"]}')

নিম্নলিখিত স্ক্রিনশট ইনপুট পাঠ্যে চিহ্নিত সত্তাগুলির একটি সংগ্রহ দেখায়৷ এই পোস্টের উদ্দেশ্যে আউটপুট ছোট করা হয়েছে। পড়ুন গিটহুব রেপো সত্তার বিস্তারিত তালিকার জন্য।

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

আমাজন কম্প্রিহেন্ড কাস্টম সত্তা স্বীকৃতি সহ কাস্টম সত্ত্বা বের করুন

থেকে প্রতিক্রিয়া DetectEntities এপিআই ডিফল্ট সত্তা অন্তর্ভুক্ত করে। যাইহোক, আমরা নির্দিষ্ট সত্তার মানগুলি জানতে আগ্রহী, যেমন রোগীর নাম (ডিফল্ট সত্তা দ্বারা চিহ্নিত PERSON), অথবা রোগীর আইডি (ডিফল্ট সত্তা দ্বারা চিহ্নিত করা হয় OTHER) এই কাস্টম সত্তা চিনতে, আমরা একটি Amazon Comprehend কাস্টম সত্তা শনাক্তকারী মডেলকে প্রশিক্ষণ দিই। আমরা একটি কাস্টম সত্তা শনাক্তকরণ মডেলকে প্রশিক্ষণ এবং স্থাপন করার জন্য ব্যাপক পদক্ষেপগুলি অনুসরণ করার পরামর্শ দিই GitHub রেপো।

আমরা কাস্টম মডেল স্থাপন করার পরে, আমরা সাহায্যকারী ফাংশন ব্যবহার করতে পারি get_entities() যেমন কাস্টম সত্তা পুনরুদ্ধার করতে PATIENT_NAME এবং PATIENT_D API প্রতিক্রিয়া থেকে:

def get_entities(text):
try:
    #detect entities
    entities_custom = comprehend.detect_entities(LanguageCode="en",
                      Text=text, EndpointArn=ER_ENDPOINT_ARN) 
    df_custom = pd.DataFrame(entities_custom["Entities"], columns = ['Text',  
                'Type', 'Score'])
    df_custom = df_custom.drop_duplicates(subset=['Text']).reset_index()
    return df_custom
except Exception as e:
    print(e)

# call the get_entities() function 
response = get_entities(text) 
#print the response from the get_entities() function
print(response)

নিম্নলিখিত স্ক্রিনশট আমাদের ফলাফল দেখায়.

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

সমৃদ্ধি পর্যায়

নথি সমৃদ্ধকরণ পর্যায়ে, আমরা মূল্যবান অন্তর্দৃষ্টি আঁকতে স্বাস্থ্যসেবা-সম্পর্কিত নথিতে সমৃদ্ধকরণ কার্য সম্পাদন করি। আমরা নিম্নলিখিত ধরণের সমৃদ্ধি দেখি:

  • ডোমেন-নির্দিষ্ট ভাষা বের করুন – ICD-10-CM, RxNorm, এবং SNOMED CT-এর মতো চিকিৎসা-নির্দিষ্ট অনটোলজিগুলি বের করতে আমরা Amazon Comprehend Medical ব্যবহার করি
  • সংবেদনশীল তথ্য সংশোধন করুন - আমরা ব্যক্তিগতভাবে শনাক্তকরণযোগ্য তথ্য (PII) সংশোধন করতে Amazon Comprehend ব্যবহার করি এবং সুরক্ষিত স্বাস্থ্য তথ্য (PHI) সংশোধনের জন্য Amazon Comprehend মেডিকেল ব্যবহার করি

অসংগঠিত চিকিৎসা পাঠ্য থেকে চিকিৎসা তথ্য বের করুন

মেডিকেল প্রোভাইডারদের নোট এবং ক্লিনিকাল ট্রায়াল রিপোর্টের মতো নথিতে ঘন মেডিকেল টেক্সট অন্তর্ভুক্ত থাকে। ইন্স্যুরেন্স দাবি করে যে বাহকদের এই ঘন টেক্সট থেকে আহরিত স্বাস্থ্য তথ্যের মধ্যে সম্পর্ক সনাক্ত করতে হবে এবং সেগুলিকে ICD-10-CM, RxNorm, এবং SNOMED CT কোডের মতো মেডিকেল অনটোলজিগুলির সাথে লিঙ্ক করতে হবে। দাবি প্রক্রিয়াকরণকে ত্বরান্বিত এবং সহজতর করার জন্য বীমা কোম্পানিগুলির জন্য দাবি ক্যাপচার, বৈধতা এবং অনুমোদনের কার্যপ্রবাহ স্বয়ংক্রিয় করার ক্ষেত্রে এটি অত্যন্ত মূল্যবান। আসুন আমরা কিভাবে Amazon Comprehend Medical ব্যবহার করতে পারি তা দেখি InferICD10CM এপিআই সত্তা হিসাবে সম্ভাব্য চিকিৎসা পরিস্থিতি সনাক্ত করতে এবং তাদের কোডের সাথে লিঙ্ক করতে:

cm_json_data = comprehend_med.infer_icd10_cm(Text=text)

print("nMedical codingn========")

for entity in cm_json_data["Entities"]:
      for icd in entity["ICD10CMConcepts"]:
           description = icd['Description']
           code = icd["Code"]
           print(f'{description}: {code}')

ইনপুট পাঠ্যের জন্য, যা আমরা অ্যামাজন টেক্সট্র্যাক্ট থেকে পাস করতে পারি DetectDocumentText API, the InferICD10CM API নিম্নলিখিত আউটপুট প্রদান করে (আউটপুটটি সংক্ষিপ্ততার জন্য সংক্ষিপ্ত করা হয়েছে)।

অসংগঠিত চিকিৎসা পাঠ্য থেকে চিকিৎসা তথ্য বের করুন

একইভাবে, আমরা Amazon Comprehend Medical ব্যবহার করতে পারি InferRxNorm ঔষধ সনাক্ত করতে API এবং InferSNOMEDCT স্বাস্থ্যসেবা-সম্পর্কিত বীমা নথির মধ্যে চিকিৎসা সত্তা সনাক্ত করতে API।

PII এবং PHI রিডাকশন সম্পাদন করুন

বীমা দাবির প্যাকেজগুলির জন্য প্রচুর গোপনীয়তা সম্মতি এবং প্রবিধানের প্রয়োজন হয় কারণ এতে PII এবং PHI ডেটা উভয়ই থাকে। বীমা বাহক পলিসি নম্বর বা রোগীর নামের মতো তথ্য সংশোধন করে কমপ্লায়েন্স ঝুঁকি কমাতে পারে।

আসুন রোগীর স্রাবের সারাংশের একটি উদাহরণ দেখি। আমরা Amazon Comprehend ব্যবহার করি DetectPiiEntities নথির মধ্যে PII সত্তা সনাক্ত করতে API এবং এই সত্তাগুলিকে সংশোধন করে রোগীর গোপনীয়তা রক্ষা করতে:

resp = call_textract(input_document = f's3://{data_bucket}/idp/textract/dr-note-sample.png')
text = get_string(textract_json=resp, output_type=[Textract_Pretty_Print.LINES])

# call Amazon Comprehend Detect PII Entities API
entity_resp = comprehend.detect_pii_entities(Text=text, LanguageCode="en") 

pii = []
for entity in entity_resp['Entities']:
      pii_entity={}
      pii_entity['Type'] = entity['Type']
      pii_entity['Text'] = text[entity['BeginOffset']:entity['EndOffset']]
      pii.append(pii_entity)
print(pii)

আমরা থেকে প্রতিক্রিয়া নিম্নলিখিত PII সত্তা পেতে detect_pii_entities() API:

detect_pii_entities() API থেকে প্রতিক্রিয়া

তারপরে আমরা নথি থেকে সত্তার বাউন্ডিং বক্স জ্যামিতি ব্যবহার করে নথি থেকে সনাক্ত করা PII সত্তাগুলিকে সংশোধন করতে পারি৷ এর জন্য, আমরা একটি সহায়ক টুল ব্যবহার করি যার নাম amazon-textract-overlayer. আরো তথ্যের জন্য, পড়ুন টেক্সট্র্যাক্ট-ওভারলেয়ার. নিম্নলিখিত স্ক্রিনশটগুলি সংশোধন করার আগে এবং পরে একটি নথির তুলনা করে৷

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

অ্যামাজন বোঝার অনুরূপ DetectPiiEntities API, আমরাও ব্যবহার করতে পারি DetectPHI ক্লিনিকাল টেক্সট পরীক্ষা করা হচ্ছে PHI ডেটা সনাক্ত করতে API। আরো তথ্যের জন্য, পড়ুন PHI সনাক্ত করুন।

পর্যালোচনা এবং বৈধতা পর্যায়

নথি পর্যালোচনা এবং বৈধতা পর্যায়ে, দাবি প্যাকেজটি ব্যবসার প্রয়োজনীয়তা পূরণ করে কিনা তা আমরা এখন যাচাই করতে পারি, কারণ আমাদের কাছে প্যাকেজের নথিগুলি থেকে আগের ধাপগুলি থেকে সংগৃহীত সমস্ত তথ্য রয়েছে৷ আমরা লুপে এমন একজন মানুষকে পরিচয় করিয়ে দিয়ে এটি করতে পারি যেটি সমস্ত ক্ষেত্র পর্যালোচনা এবং যাচাই করতে পারে বা ডাউনস্ট্রিম অ্যাপ্লিকেশনগুলিতে প্যাকেজ পাঠানোর আগে কম ডলারের দাবির জন্য একটি স্বয়ংক্রিয়-অনুমোদন প্রক্রিয়া। আমরা ব্যবহার করতে পারি অ্যামাজন অগমেন্টেড এআই (Amazon A2I) বীমা দাবি প্রক্রিয়াকরণের জন্য মানব পর্যালোচনা প্রক্রিয়া স্বয়ংক্রিয় করতে।

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

এখন যেহেতু আমাদের কাছে IDP-এর জন্য AI পরিষেবাগুলি ব্যবহার করে দাবি প্রক্রিয়াকরণ থেকে সমস্ত প্রয়োজনীয় ডেটা নিষ্কাশন এবং স্বাভাবিক করা হয়েছে, আমরা অতিরিক্ত ব্যবহারের ক্ষেত্রে সমাধান করতে এবং আরও বিশ্লেষণ এবং ভিজ্যুয়ালাইজেশন প্রদান করতে AWS অ্যানালিটিক্স পরিষেবা যেমন AWS Glue এবং Amazon Redshift-এর সাথে একীভূত করার সমাধান প্রসারিত করতে পারি।

জালিয়াতি বীমা দাবি সনাক্ত করুন

এই পোস্টে, আমরা একটি সার্ভারহীন আর্কিটেকচার প্রয়োগ করি যেখানে নিষ্কাশিত এবং প্রক্রিয়াকৃত ডেটা একটি ডেটা লেকে সংরক্ষণ করা হয় এবং এমএল ব্যবহার করে প্রতারণামূলক বীমা দাবি সনাক্ত করতে ব্যবহৃত হয়। আমরা ব্যাবহার করি আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3) প্রসেসড ডাটা সংরক্ষণ করতে। আমরা তারপর ব্যবহার করতে পারেন এডাব্লুএস আঠালো or আমাজন ইএমআর ডেটা পরিষ্কার করতে এবং অতিরিক্ত ক্ষেত্র যোগ করতে এটি রিপোর্টিং এবং এমএল এর জন্য ব্যবহারযোগ্য করে তোলে। এর পরে, আমরা ব্যবহার করি আমাজন রেডশিফ্ট এমএল একটি জালিয়াতি সনাক্তকরণ এমএল মডেল তৈরি করতে। অবশেষে, আমরা ব্যবহার করে প্রতিবেদন তৈরি করি অ্যামাজন কুইকসাইট তথ্যের অন্তর্দৃষ্টি পেতে।

অ্যামাজন রেডশিফ্ট বাহ্যিক স্কিমা সেটআপ করুন

এই উদাহরণের উদ্দেশ্যে, আমরা একটি তৈরি করেছি নমুনা ডেটাসেট একটি ETL (এক্সট্রাক্ট, ট্রান্সফর্ম এবং লোড) প্রক্রিয়ার আউটপুট অনুকরণ করে এবং মেটাডেটা ক্যাটালগ হিসাবে AWS Glue Data Catalog ব্যবহার করে। প্রথমত, আমরা নামের একটি ডাটাবেস তৈরি করি idp_demo ডেটা ক্যাটালগে এবং অ্যামাজন রেডশিফ্টের একটি বহিরাগত স্কিমা বলা হয় idp_insurance_demo (নিম্নলিখিত কোড দেখুন)। আমরা একটি ব্যবহার এডাব্লুএস আইডেন্টিটি এবং অ্যাক্সেস ম্যানেজমেন্ট (IAM) অ্যামাজন রেডশিফ্ট ক্লাস্টারকে অ্যামাজন S3 অ্যাক্সেস করার অনুমতি প্রদানের ভূমিকা এবং আমাজন সেজমেকার. ন্যূনতম বিশেষাধিকারের সাথে এই IAM ভূমিকা কীভাবে সেট আপ করবেন সে সম্পর্কে আরও তথ্যের জন্য, পড়ুন Amazon Redshift ML প্রশাসনের জন্য ক্লাস্টার এবং কনফিগার সেটআপ.

CREATE EXTERNAL SCHEMA idp_insurance_demo
FROM DATA CATALOG
DATABASE 'idp_demo' 
IAM_ROLE '<<>>'
CREATE EXTERNAL DATABASE IF NOT EXISTS;

Amazon Redshift বাহ্যিক টেবিল তৈরি করুন

পরবর্তী ধাপ হল অ্যামাজন রেডশিফ্টে একটি বাহ্যিক টেবিল তৈরি করা যেখানে ফাইলটি অবস্থিত S3 অবস্থান উল্লেখ করে। এই ক্ষেত্রে, আমাদের ফাইলটি একটি কমা দ্বারা পৃথক করা পাঠ্য ফাইল। আমরা ফাইল থেকে হেডার সারিটি এড়িয়ে যেতে চাই, যা টেবিলের বৈশিষ্ট্য বিভাগে কনফিগার করা যেতে পারে। নিম্নলিখিত কোড দেখুন:

create external table idp_insurance_demo.claims(id INTEGER,
date_of_service date,
patients_address_city VARCHAR,
patients_address_state VARCHAR,
patients_address_zip VARCHAR,
patient_status VARCHAR,
insured_address_state VARCHAR,
insured_address_zip VARCHAR,
insured_date_of_birth date,
insurance_plan_name VARCHAR,
total_charges DECIMAL(14,4),
fraud VARCHAR,
duplicate varchar,
invalid_claim VARCHAR
)
row format delimited
fields terminated by ','
stored as textfile
location '<<>>'
table properties ( 'skip.header.line.count'='1');

প্রশিক্ষণ এবং পরীক্ষার ডেটাসেট তৈরি করুন

আমরা বাহ্যিক টেবিল তৈরি করার পরে, আমরা প্রশিক্ষণ সেট এবং পরীক্ষা সেটে বিভক্ত করে ML এর জন্য আমাদের ডেটাসেট প্রস্তুত করি। আমরা নামক একটি নতুন বাহ্যিক টেবিল তৈরি করি claim_train, যা দাবি সারণী থেকে <= 85000 ID সহ সমস্ত রেকর্ড নিয়ে গঠিত। এটি সেই প্রশিক্ষণ সেট যা আমরা আমাদের এমএল মডেলকে প্রশিক্ষণ দিই।

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_train
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/train'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id <= 850000

আমরা নামক আরেকটি বাহ্যিক টেবিল তৈরি করি claim_test যেটিতে আইডি >85000 সহ সমস্ত রেকর্ড রয়েছে সেই টেস্ট সেট যা আমরা ML মডেল পরীক্ষা করি:

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_test
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/test'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id > 850000

Amazon Redshift ML দিয়ে একটি ML মডেল তৈরি করুন

এখন আমরা ব্যবহার করে মডেল তৈরি মডেল তৈরি করুন কমান্ড (নিম্নলিখিত কোড দেখুন)। আমরা থেকে প্রাসঙ্গিক কলাম নির্বাচন করুন claims_train টেবিল যা একটি জালিয়াতি লেনদেন নির্ধারণ করতে পারে। এই মডেলের লক্ষ্য হল এর মান ভবিষ্যদ্বাণী করা fraud কলাম; অতএব, fraud ভবিষ্যদ্বাণী লক্ষ্য হিসাবে যোগ করা হয়. মডেল প্রশিক্ষিত হওয়ার পরে, এটি নামে একটি ফাংশন তৈরি করে insurance_fraud_model. এসকিউএল স্টেটমেন্ট চালানোর সময় অনুমানের জন্য এই ফাংশনটি ব্যবহার করা হয় fraud নতুন রেকর্ডের জন্য কলাম।

CREATE MODEL idp_insurance_demo.insurance_fraud_model
FROM (SELECT 
total_charges ,
fraud ,
duplicate,
invalid_claim
FROM idp_insurance_demo.claims_train
)
TARGET fraud
FUNCTION insurance_fraud_model
IAM_ROLE '<<>>'
SETTINGS (
S3_BUCKET '<<>>'
);

ML মডেল মেট্রিক্স মূল্যায়ন

আমরা মডেল তৈরি করার পরে, আমরা মডেলের যথার্থতা পরীক্ষা করতে প্রশ্ন চালাতে পারি। আমরা ব্যবহার করি insurance_fraud_model এর মান অনুমান করার ফাংশন fraud নতুন রেকর্ডের জন্য কলাম। নিম্নলিখিত ক্যোয়ারী চালান claims_test একটি বিভ্রান্তি ম্যাট্রিক্স তৈরি করতে টেবিল:

SELECT 
fraud,
idp_insurance_demo.insurance_fraud_model (total_charges ,duplicate,invalid_claim ) as fraud_calculcated,
count(1)
FROM idp_insurance_demo.claims_test
GROUP BY fraud , fraud_calculcated;

এমএল মডেল ব্যবহার করে জালিয়াতি সনাক্ত করুন

আমরা নতুন মডেল তৈরি করার পরে, যেমন নতুন দাবি ডেটা ডেটা গুদাম বা ডেটা লেকে ঢোকানো হয়, আমরা ব্যবহার করতে পারি insurance_fraud_model প্রতারণামূলক লেনদেন গণনা করার ফাংশন। আমরা প্রথমে একটি অস্থায়ী টেবিলে নতুন ডেটা লোড করে এটি করি। তারপর আমরা ব্যবহার insurance_fraud_model গণনা করার ফাংশন fraud প্রতিটি নতুন লেনদেনের জন্য পতাকা এবং চূড়ান্ত টেবিলে পতাকার সাথে ডেটা সন্নিবেশ করান, যা এই ক্ষেত্রে claims টেবিল।

দাবি তথ্য কল্পনা করুন

যখন ডেটা Amazon Redshift-এ উপলব্ধ থাকে, তখন আমরা QuickSight ব্যবহার করে ভিজ্যুয়ালাইজেশন তৈরি করতে পারি। তারপরে আমরা ব্যবসায়িক ব্যবহারকারী এবং বিশ্লেষকদের সাথে QuickSight ড্যাশবোর্ডগুলি ভাগ করতে পারি৷ QuickSight ড্যাশবোর্ড তৈরি করতে, আপনাকে প্রথমে QuickSight-এ একটি Amazon Redshift ডেটাসেট তৈরি করতে হবে। নির্দেশাবলীর জন্য, পড়ুন একটি ডাটাবেস থেকে একটি ডেটাসেট তৈরি করা.

আপনি ডেটাসেট তৈরি করার পরে, আপনি ডেটাসেট ব্যবহার করে QuickSight-এ একটি নতুন বিশ্লেষণ তৈরি করতে পারেন। নীচে আমরা তৈরি করা কিছু নমুনা প্রতিবেদন রয়েছে:

  • রাজ্য দ্বারা গোষ্ঠীভুক্ত দাবির মোট সংখ্যা fraud ক্ষেত্র – এই চার্ট আমাদের একটি নির্দিষ্ট রাজ্যে মোট লেনদেনের সংখ্যার তুলনায় প্রতারণামূলক লেনদেনের অনুপাত দেখায়।
  • দাবির মোট ডলার মূল্যের সমষ্টি, দ্বারা গোষ্ঠীবদ্ধ fraud ক্ষেত্র – এই চার্ট আমাদের একটি নির্দিষ্ট রাজ্যে মোট ডলারের পরিমাণের লেনদেনের তুলনায় জালিয়াতিপূর্ণ লেনদেনের ডলারের পরিমাণের অনুপাত দেখায়।
  • প্রতি বীমা কোম্পানির মোট লেনদেনের সংখ্যা, দ্বারা গোষ্ঠীবদ্ধ fraud ক্ষেত্র – এই চার্টটি আমাদের দেখায় যে প্রতিটি বীমা কোম্পানির জন্য কতটি দাবি দাখিল করা হয়েছে এবং তাদের মধ্যে কতগুলি প্রতারণামূলক।

• প্রতি বীমা কোম্পানির মোট লেনদেনের সংখ্যা, জালিয়াতির ক্ষেত্রের দ্বারা গোষ্ঠীবদ্ধ

  • একটি মার্কিন মানচিত্রে প্রদর্শিত রাজ্য দ্বারা প্রতারণামূলক লেনদেনের মোট যোগফল৷ - এই চার্টটি শুধু প্রতারণামূলক লেনদেনগুলি দেখায় এবং মানচিত্রে রাজ্য অনুসারে সেই লেনদেনের জন্য মোট চার্জ প্রদর্শন করে৷ নীলের গাঢ় ছায়া উচ্চতর মোট চার্জ নির্দেশ করে। প্রবণতাগুলি আরও ভালভাবে বোঝার জন্য আমরা সেই রাজ্যের মধ্যে শহর এবং শহরের সাথে জিপ কোডগুলিকে আরও বিশ্লেষণ করতে পারি।

বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.

পরিষ্কার কর

আপনার AWS অ্যাকাউন্টে ভবিষ্যত চার্জ রোধ করতে, আপনি সেটআপে যে সংস্থানগুলি প্রদান করেছেন সেগুলি মুছুন পরিচ্ছন্নতা বিভাগ আমাদের রেপোতে।

উপসংহার

এই দুই-অংশের সিরিজে, আমরা দেখেছি কিভাবে সামান্য বা কোন ML অভিজ্ঞতা ছাড়াই একটি এন্ড-টু-এন্ড IDP পাইপলাইন তৈরি করা যায়। আমরা বীমা শিল্পে একটি দাবি প্রক্রিয়াকরণ ব্যবহারের ক্ষেত্রে অনুসন্ধান করেছি এবং কীভাবে IDP এই ব্যবহারের ক্ষেত্রেকে স্বয়ংক্রিয়ভাবে সাহায্য করতে পারে যেমন Amazon Textract, Amazon Comprehend, Amazon Comprehend Medical, এবং Amazon A2I এর মতো পরিষেবাগুলি ব্যবহার করে৷ পার্ট 1-এ, আমরা নথি নিষ্কাশনের জন্য AWS AI পরিষেবাগুলি কীভাবে ব্যবহার করতে হয় তা প্রদর্শন করেছি৷ পার্ট 2-এ, আমরা নিষ্কাশন পর্ব প্রসারিত করেছি এবং ডেটা সমৃদ্ধকরণ করেছি। অবশেষে, আমরা আরও বিশ্লেষণের জন্য IDP থেকে আহরিত কাঠামোগত ডেটা প্রসারিত করেছি এবং AWS অ্যানালিটিক্স পরিষেবাগুলি ব্যবহার করে প্রতারণামূলক দাবি সনাক্ত করতে ভিজ্যুয়ালাইজেশন তৈরি করেছি।

আমরা এর সুরক্ষা বিভাগগুলি পর্যালোচনা করার পরামর্শ দিই৷ অ্যামাজন টেক্সট্র্যাক, অ্যামাজন সমঝোতা, এবং আমাজন A2I ডকুমেন্টেশন এবং প্রদত্ত নির্দেশিকা অনুসরণ। সমাধানের মূল্য সম্পর্কে আরও জানতে, এর মূল্যের বিবরণ পর্যালোচনা করুন অ্যামাজন টেক্সট্র্যাক, অ্যামাজন সমঝোতা, এবং আমাজন A2I.


লেখক সম্পর্কে

লেখকচিন্ময়ী রানে অ্যামাজন ওয়েব সার্ভিসেসের একজন এআই/এমএল বিশেষজ্ঞ সলিউশন আর্কিটেক্ট। তিনি ফলিত গণিত এবং মেশিন লার্নিং সম্পর্কে উত্সাহী। তিনি AWS গ্রাহকদের জন্য বুদ্ধিমান ডকুমেন্ট প্রসেসিং সমাধান ডিজাইন করার উপর ফোকাস করেন। কাজের বাইরে, তিনি সালসা এবং বাছাটা নাচ উপভোগ করেন।


বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.
উদয় নারায়ণন
AWS-এর একজন অ্যানালিটিক্স বিশেষজ্ঞ সলিউশন আর্কিটেক্ট। তিনি গ্রাহকদের জটিল ব্যবসায়িক চ্যালেঞ্জের উদ্ভাবনী সমাধান খুঁজে পেতে সাহায্য করেন। তার ফোকাসের মূল ক্ষেত্রগুলি হল ডেটা বিশ্লেষণ, বড় ডেটা সিস্টেম এবং মেশিন লার্নিং। তার অবসর সময়ে, তিনি খেলাধুলা, টিভি শো দেখা এবং ভ্রমণ উপভোগ করেন।


বীমা শিল্পে AWS AI এবং Analytics পরিষেবাগুলির সাথে বুদ্ধিমান নথি প্রক্রিয়াকরণ: পার্ট 2 PlatoBlockchain ডেটা ইন্টেলিজেন্স৷ উল্লম্ব অনুসন্ধান. আ.
সোনালী সাহু
আমাজন ওয়েব সার্ভিসে ইন্টেলিজেন্ট ডকুমেন্ট প্রসেসিং এআই/এমএল সলিউশন আর্কিটেক্ট দলের নেতৃত্ব দিচ্ছে। তিনি একজন উত্সাহী টেকনোফাইল এবং উদ্ভাবন ব্যবহার করে জটিল সমস্যা সমাধানের জন্য গ্রাহকদের সাথে কাজ করা উপভোগ করেন। তার ফোকাসের মূল ক্ষেত্র হল কৃত্রিম বুদ্ধিমত্তা এবং বুদ্ধিমান নথি প্রক্রিয়াকরণের জন্য মেশিন লার্নিং।

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং

Amazon SageMaker ক্যানভাস অনুভূতি বিশ্লেষণ এবং পাঠ্য বিশ্লেষণ মডেল ব্যবহার করে পণ্য পর্যালোচনা থেকে অন্তর্দৃষ্টি পেতে নো-কোড মেশিন লার্নিং ব্যবহার করুন | আমাজন ওয়েব সার্ভিসেস

উত্স নোড: 1899999
সময় স্ট্যাম্প: অক্টোবর 9, 2023

অ্যামাজন সেজমেকার প্রশিক্ষণে পাইটর্চ লাইটনিং এবং নেটিভ পাইটর্চ ডিডিপি চালান, অ্যামাজন অনুসন্ধান বৈশিষ্ট্যযুক্ত

উত্স নোড: 1629117
সময় স্ট্যাম্প: আগস্ট 18, 2022