انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2

In حصہ 1 اس سلسلے میں، ہم نے انٹیلجنٹ ڈاکومنٹ پروسیسنگ (IDP) پر تبادلہ خیال کیا، اور کس طرح IDP انشورنس انڈسٹری میں کلیمز پروسیسنگ کے استعمال کے معاملات کو تیز کر سکتا ہے۔ ہم نے اس بات پر تبادلہ خیال کیا کہ ہم کس طرح AWS AI خدمات کو معاون دستاویزات کے ساتھ دعووں کی دستاویزات کو درست طریقے سے درجہ بندی کرنے کے لیے استعمال کر سکتے ہیں۔ ہم نے اس بات پر بھی تبادلہ خیال کیا کہ انشورنس کلیمز پیکج میں مختلف قسم کے دستاویزات کو کیسے نکالا جائے، جیسے کہ فارم، ٹیبل، یا خصوصی دستاویزات جیسے رسیدیں، رسیدیں، یا شناختی دستاویزات۔ ہم نے میراثی دستاویز کے عمل میں درپیش چیلنجوں کا جائزہ لیا، جو وقت طلب، غلطی کا شکار، مہنگا اور پیمانے پر کارروائی کرنا مشکل ہے، اور آپ اپنی IDP پائپ لائن کو لاگو کرنے میں مدد کے لیے AWS AI سروسز کا استعمال کیسے کر سکتے ہیں۔

اس پوسٹ میں، ہم آپ کو دستاویز نکالنے، استفسار کرنے اور افزودگی کے لیے جدید IDP خصوصیات کے بارے میں بتاتے ہیں۔ ہم یہ بھی دیکھتے ہیں کہ AWS Analytics اور ویژولائزیشن سروسز کا استعمال کرتے ہوئے بصیرت حاصل کرنے کے لیے دعووں کے ڈیٹا سے نکالی گئی ساختی معلومات کو مزید کیسے استعمال کیا جائے۔ ہم اس بات پر روشنی ڈالتے ہیں کہ کس طرح IDP سے نکالا گیا ڈھانچہ شدہ ڈیٹا AWS Analytics خدمات کا استعمال کرتے ہوئے دھوکہ دہی کے دعووں کے خلاف مدد کر سکتا ہے۔

حل جائزہ

اگر IDP AWS AI خدمات استعمال کر رہا ہے تو درج ذیل خاکہ ان مراحل کی وضاحت کرتا ہے۔ حصہ 1 میں، ہم نے IDP ورک فلو کے پہلے تین مراحل پر تبادلہ خیال کیا۔ اس پوسٹ میں، ہم نکالنے کے مرحلے اور بقیہ مراحل کو بڑھاتے ہیں، جس میں IDP کو AWS Analytics خدمات کے ساتھ ضم کرنا شامل ہے۔

ہم ان تجزیاتی خدمات کو مزید بصیرت اور تصورات کے لیے استعمال کرتے ہیں، اور IDP سے منظم، نارمل ڈیٹا کا استعمال کرتے ہوئے دھوکہ دہی کے دعووں کا پتہ لگانے کے لیے۔ مندرجہ ذیل خاکہ حل کے فن تعمیر کی وضاحت کرتا ہے۔

IDP فن تعمیر کا خاکہ

اس پوسٹ میں جن مراحل پر ہم بحث کرتے ہیں وہ درج ذیل کلیدی خدمات کا استعمال کرتے ہیں:

  • ایمیزون کمپریہنڈ میڈیکل ایک HIPAA- اہل قدرتی زبان کی پروسیسنگ (NLP) سروس ہے جو مشین لرننگ (ML) ماڈلز کا استعمال کرتی ہے جو طبی متن سے صحت کے ڈیٹا کو سمجھنے اور نکالنے کے لیے پہلے سے تربیت یافتہ ہیں، جیسے کہ نسخے، طریقہ کار، یا تشخیص۔
  • AWS گلو AWS Analytics سروسز اسٹیک کا ایک حصہ ہے، اور ایک سرور لیس ڈیٹا انٹیگریشن سروس ہے جو تجزیات، ML، اور ایپلیکیشن ڈیولپمنٹ کے لیے ڈیٹا کو دریافت کرنا، تیار کرنا اور یکجا کرنا آسان بناتی ہے۔
  • ایمیزون ریڈ شفٹ تجزیات کے اسٹیک میں ایک اور خدمت ہے۔ Amazon Redshift کلاؤڈ میں ایک مکمل طور پر منظم، پیٹا بائٹ پیمانے پر ڈیٹا ویئر ہاؤس سروس ہے۔

شرائط

شروع کرنے سے پہلے، رجوع کریں۔ حصہ 1 IDP کے ساتھ انشورنس کے استعمال کے کیس کے اعلیٰ سطحی جائزہ اور ڈیٹا کیپچر اور درجہ بندی کے مراحل کے بارے میں تفصیلات کے لیے۔

کوڈ کے نمونوں کے بارے میں مزید معلومات کے لیے، ہمارا حوالہ دیں۔ گٹ ہب ریپو۔

نکالنے کا مرحلہ

حصہ 1 میں، ہم نے دیکھا کہ Amazon Textract APIs کو دستاویزات سے فارم اور ٹیبلز جیسی معلومات نکالنے کے لیے کیسے استعمال کیا جائے، اور انوائسز اور شناختی دستاویزات کا تجزیہ کیسے کیا جائے۔ اس پوسٹ میں، ہم اپنی مرضی کے استعمال کے معاملات کے لیے مخصوص ڈیفالٹ اور اپنی مرضی کے اداروں کو نکالنے کے لیے Amazon Comprehend کے ساتھ نکالنے کے مرحلے کو بڑھاتے ہیں۔

انشورنس کیریئرز اکثر بیمہ کے دعووں کی درخواستوں میں گھنے متن میں آتے ہیں، اس طرح کے مریض کے ڈسچارج سمری لیٹر (مندرجہ ذیل مثال کی تصویر دیکھیں)۔ اس قسم کی دستاویزات سے خود بخود معلومات نکالنا مشکل ہو سکتا ہے جہاں کوئی واضح ڈھانچہ نہ ہو۔ اس سے نمٹنے کے لیے، ہم دستاویز سے اہم کاروباری معلومات نکالنے کے لیے درج ذیل طریقے استعمال کر سکتے ہیں:

اخراج کا خلاصہ نمونہ

Amazon Comprehend DetectEntities API کے ساتھ پہلے سے طے شدہ اداروں کو نکالیں۔

ہم نمونہ میڈیکل ٹرانسکرپشن دستاویز پر درج ذیل کوڈ چلاتے ہیں:

comprehend = boto3.client('comprehend') 

response = comprehend.detect_entities( Text=text, LanguageCode='en')

#print enitities from the response JSON

for entity in response['Entities']:
    print(f'{entity["Type"]} : {entity["Text"]}')

درج ذیل اسکرین شاٹ ان پٹ ٹیکسٹ میں شناخت شدہ اداروں کا مجموعہ دکھاتا ہے۔ اس پوسٹ کے مقاصد کے لیے آؤٹ پٹ کو مختصر کر دیا گیا ہے۔ سے رجوع کریں۔ GitHub repo اداروں کی تفصیلی فہرست کے لیے۔

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

Amazon Comprehend کسٹم ہستی کی شناخت کے ساتھ حسب ضرورت ہستیوں کو نکالیں۔

کی طرف سے ردعمل DetectEntities API میں پہلے سے طے شدہ ادارے شامل ہیں۔ تاہم، ہم مخصوص ہستی کی قدروں کو جاننے میں دلچسپی رکھتے ہیں، جیسے کہ مریض کا نام (پہلے سے طے شدہ ہستی سے ظاہر ہوتا ہے PERSON)، یا مریض کی ID (پہلے سے طے شدہ ہستی سے ظاہر ہوتا ہے۔ OTHER)۔ ان حسب ضرورت ہستیوں کو پہچاننے کے لیے، ہم ایک Amazon Comprehend کسٹم ہستی کی شناخت کرنے والے ماڈل کو تربیت دیتے ہیں۔ ہم اس بارے میں جامع اقدامات پر عمل کرنے کی تجویز کرتے ہیں کہ کس طرح کسٹم ہستی کی شناخت کے ماڈل کو تربیت اور تعینات کیا جائے۔ گٹ ہب ریپو۔

اپنی مرضی کے مطابق ماڈل کو تعینات کرنے کے بعد، ہم مددگار فنکشن استعمال کر سکتے ہیں۔ get_entities() جیسے حسب ضرورت اداروں کو بازیافت کرنے کے لیے PATIENT_NAME اور PATIENT_D API کے جواب سے:

def get_entities(text):
try:
    #detect entities
    entities_custom = comprehend.detect_entities(LanguageCode="en",
                      Text=text, EndpointArn=ER_ENDPOINT_ARN) 
    df_custom = pd.DataFrame(entities_custom["Entities"], columns = ['Text',  
                'Type', 'Score'])
    df_custom = df_custom.drop_duplicates(subset=['Text']).reset_index()
    return df_custom
except Exception as e:
    print(e)

# call the get_entities() function 
response = get_entities(text) 
#print the response from the get_entities() function
print(response)

درج ذیل اسکرین شاٹ ہمارے نتائج کو ظاہر کرتا ہے۔

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

افزودگی کا مرحلہ

دستاویز کی افزودگی کے مرحلے میں، ہم قابل قدر بصیرت حاصل کرنے کے لیے صحت کی دیکھ بھال سے متعلق دستاویزات پر افزودگی کے افعال انجام دیتے ہیں۔ ہم افزودگی کی درج ذیل اقسام کو دیکھتے ہیں:

  • ڈومین کے لیے مخصوص زبان نکالیں۔ - ہم ICD-10-CM، RxNorm، اور SNOMED CT جیسے طبی مخصوص آنٹولوجیز کو نکالنے کے لیے Amazon Comprehend Medical کا استعمال کرتے ہیں۔
  • حساس معلومات کی اصلاح کریں۔ - ہم ذاتی طور پر قابل شناخت معلومات (PII) کو دوبارہ ترتیب دینے کے لیے Amazon Comprehend کا استعمال کرتے ہیں، اور Amazon Comprehend میڈیکل برائے محفوظ شدہ صحت کی معلومات (PHI) کی اصلاح کے لیے استعمال کرتے ہیں۔

غیر ساختہ طبی متن سے طبی معلومات نکالیں۔

طبی فراہم کنندگان کے نوٹس اور کلینیکل ٹرائل رپورٹس جیسی دستاویزات میں گھنے طبی متن شامل ہیں۔ انشورنس کا دعویٰ ہے کہ کیریئرز کو اس گھنے متن سے نکالی گئی صحت سے متعلق معلومات کے درمیان تعلق کی نشاندہی کرنے کی ضرورت ہے اور انہیں ICD-10-CM، RxNorm، اور SNOMED CT کوڈز جیسے میڈیکل آنٹولوجی سے جوڑنا ہوگا۔ دعوی کی کارروائی کو تیز کرنے اور آسان بنانے کے لیے انشورنس کمپنیوں کے لیے دعوے کی گرفتاری، توثیق، اور منظوری کے ورک فلو کو خودکار بنانے میں یہ بہت قیمتی ہے۔ آئیے دیکھتے ہیں کہ ہم ایمیزون کمپری ہینڈ میڈیکل کو کس طرح استعمال کر سکتے ہیں۔ InferICD10CM API ممکنہ طبی حالات کا بطور ہستیوں کا پتہ لگانے اور انہیں اپنے کوڈز سے لنک کرنے کے لیے:

cm_json_data = comprehend_med.infer_icd10_cm(Text=text)

print("nMedical codingn========")

for entity in cm_json_data["Entities"]:
      for icd in entity["ICD10CMConcepts"]:
           description = icd['Description']
           code = icd["Code"]
           print(f'{description}: {code}')

ان پٹ ٹیکسٹ کے لیے، جسے ہم Amazon Textract سے پاس کر سکتے ہیں۔ DetectDocumentText API، InferICD10CM API مندرجہ ذیل آؤٹ پٹ کو لوٹاتا ہے (آؤٹ پٹ کو اختصار کے لیے مختص کیا گیا ہے)۔

غیر ساختہ طبی متن سے طبی معلومات نکالیں۔

اسی طرح، ہم Amazon Comprehend میڈیکل استعمال کر سکتے ہیں۔ InferRxNorm ادویات کی شناخت کے لیے API اور InferSNOMEDCT صحت کی دیکھ بھال سے متعلق انشورنس دستاویزات میں طبی اداروں کا پتہ لگانے کے لیے API۔

پی آئی آئی اور پی ایچ آئی ریڈیکشن انجام دیں۔

انشورنس کلیمز پیکجز پرائیویسی کی بہت زیادہ تعمیل اور ضوابط کی ضرورت ہوتی ہے کیونکہ ان میں PII اور PHI دونوں ڈیٹا ہوتے ہیں۔ انشورنس کیریئرز پالیسی نمبرز یا مریض کا نام جیسی معلومات میں ترمیم کرکے تعمیل کے خطرے کو کم کرسکتے ہیں۔

آئیے مریض کے خارج ہونے والے خلاصے کی ایک مثال دیکھیں۔ ہم Amazon Comprehend استعمال کرتے ہیں۔ DetectPiiEntities API دستاویز کے اندر PII ہستیوں کا پتہ لگانے اور ان اداروں کو دوبارہ ترتیب دے کر مریض کی رازداری کی حفاظت کے لیے:

resp = call_textract(input_document = f's3://{data_bucket}/idp/textract/dr-note-sample.png')
text = get_string(textract_json=resp, output_type=[Textract_Pretty_Print.LINES])

# call Amazon Comprehend Detect PII Entities API
entity_resp = comprehend.detect_pii_entities(Text=text, LanguageCode="en") 

pii = []
for entity in entity_resp['Entities']:
      pii_entity={}
      pii_entity['Type'] = entity['Type']
      pii_entity['Text'] = text[entity['BeginOffset']:entity['EndOffset']]
      pii.append(pii_entity)
print(pii)

ہمیں مندرجہ ذیل PII اداروں سے جواب ملتا ہے۔ detect_pii_entities() API:

detect_pii_entities() API سے جواب

اس کے بعد ہم دستاویز میں موجود اداروں کے باؤنڈنگ باکس جیومیٹری کو استعمال کرکے دستاویزات سے پتہ چلنے والے PII اداروں کو دوبارہ ترتیب دے سکتے ہیں۔ اس کے لیے، ہم ایک مددگار ٹول استعمال کرتے ہیں جسے کہتے ہیں۔ amazon-textract-overlayer. مزید معلومات کے لیے رجوع کریں۔ ٹیکسٹریکٹ اوور لیئر. درج ذیل اسکرین شاٹس ترمیم سے پہلے اور بعد میں کسی دستاویز کا موازنہ کرتے ہیں۔

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عیانشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

ایمیزون کمپری ہینڈ کی طرح DetectPiiEntities API، ہم بھی استعمال کر سکتے ہیں DetectPHI جانچے جانے والے کلینیکل ٹیکسٹ میں PHI ڈیٹا کا پتہ لگانے کے لیے API۔ مزید معلومات کے لیے رجوع کریں۔ PHI کا پتہ لگائیں۔

جائزہ اور توثیق کا مرحلہ

دستاویز کے جائزے اور توثیق کے مرحلے میں، اب ہم تصدیق کر سکتے ہیں کہ آیا کلیم پیکج کاروبار کی ضروریات کو پورا کرتا ہے، کیونکہ ہمارے پاس پہلے مراحل سے پیکج میں موجود دستاویزات سے جمع کی گئی تمام معلومات موجود ہیں۔ ہم لوپ میں ایک انسان کو متعارف کروا کر ایسا کر سکتے ہیں جو تمام فیلڈز کا جائزہ لے سکتا ہے اور اس کی توثیق کر سکتا ہے یا پیکیج کو ڈاؤن اسٹریم ایپلی کیشنز پر بھیجنے سے پہلے کم ڈالر کے دعووں کے لیے صرف ایک خودکار منظوری کا عمل۔ ہم استعمال کر سکتے ہیں۔ Amazon Augmented AI (ایمیزون A2I) انشورنس کلیمز پروسیسنگ کے لیے انسانی جائزے کے عمل کو خودکار کرنے کے لیے۔

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

اب جب کہ ہمارے پاس IDP کے لیے AI سروسز کا استعمال کرتے ہوئے کلیمز پروسیسنگ سے تمام مطلوبہ ڈیٹا نکالا اور معمول بنا لیا گیا ہے، ہم اضافی استعمال کے معاملات کو حل کرنے اور مزید تجزیات اور تصورات فراہم کرنے کے لیے AWS Analytics سروسز جیسے AWS Glue اور Amazon Redshift کے ساتھ ضم کرنے کے حل کو بڑھا سکتے ہیں۔

دھوکہ دہی والے انشورنس دعووں کا پتہ لگائیں۔

اس پوسٹ میں، ہم ایک سرور لیس فن تعمیر کو نافذ کرتے ہیں جہاں نکالا اور پروسیس شدہ ڈیٹا ڈیٹا لیک میں محفوظ کیا جاتا ہے اور ML کا استعمال کرتے ہوئے دھوکہ دہی والے انشورنس دعووں کا پتہ لگانے کے لیے استعمال کیا جاتا ہے۔ ہم استعمال کرتے ہیں ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) پروسیس شدہ ڈیٹا کو ذخیرہ کرنے کے لیے۔ پھر ہم استعمال کر سکتے ہیں۔ AWS گلو or ایمیزون ای ایم آر ڈیٹا کو صاف کرنے اور رپورٹنگ اور ایم ایل کے لیے قابل استعمال بنانے کے لیے اضافی فیلڈز شامل کرنے کے لیے۔ اس کے بعد، ہم استعمال کرتے ہیں ایمیزون ریڈ شفٹ ایم ایل دھوکہ دہی کا پتہ لگانے والا ML ماڈل بنانا۔ آخر میں، ہم استعمال کرتے ہوئے رپورٹیں بناتے ہیں۔ ایمیزون کوئیک سائٹ ڈیٹا میں بصیرت حاصل کرنے کے لیے۔

Amazon Redshift بیرونی اسکیما سیٹ اپ کریں۔

اس مثال کے مقصد کے لیے، ہم نے بنایا ہے۔ نمونہ ڈیٹاسیٹ ایک ETL (ایکسٹریکٹ، ٹرانسفارم، اور لوڈ) کے عمل کے آؤٹ پٹ کی تقلید کرتا ہے، اور AWS Glue Data Catalog کو میٹا ڈیٹا کیٹلاگ کے طور پر استعمال کرتا ہے۔ سب سے پہلے، ہم نام کا ڈیٹا بیس بناتے ہیں۔ idp_demo ڈیٹا کیٹلاگ میں اور ایمیزون ریڈ شفٹ میں ایک بیرونی اسکیما کہا جاتا ہے۔ idp_insurance_demo (مندرجہ ذیل کوڈ دیکھیں)۔ ہم ایک استعمال کرتے ہیں AWS شناخت اور رسائی کا انتظام (IAM) کا کردار Amazon Redshift کلسٹر کو Amazon S3 تک رسائی کی اجازت دینے کے لیے اور ایمیزون سیج میکر. اس IAM رول کو کم سے کم استحقاق کے ساتھ کیسے ترتیب دیا جائے اس بارے میں مزید معلومات کے لیے، رجوع کریں۔ Amazon Redshift ML انتظامیہ کے لیے کلسٹر اور کنفیگر سیٹ اپ.

CREATE EXTERNAL SCHEMA idp_insurance_demo
FROM DATA CATALOG
DATABASE 'idp_demo' 
IAM_ROLE '<<>>'
CREATE EXTERNAL DATABASE IF NOT EXISTS;

ایمیزون ریڈ شفٹ بیرونی ٹیبل بنائیں

اگلا مرحلہ ایمیزون ریڈ شفٹ میں ایک بیرونی ٹیبل بنانا ہے جس میں S3 مقام کا حوالہ دیا جائے جہاں فائل واقع ہے۔ اس صورت میں، ہماری فائل کوما سے الگ کردہ ٹیکسٹ فائل ہے۔ ہم فائل سے ہیڈر قطار کو بھی چھوڑنا چاہتے ہیں، جسے ٹیبل پراپرٹیز سیکشن میں کنفیگر کیا جا سکتا ہے۔ درج ذیل کوڈ دیکھیں:

create external table idp_insurance_demo.claims(id INTEGER,
date_of_service date,
patients_address_city VARCHAR,
patients_address_state VARCHAR,
patients_address_zip VARCHAR,
patient_status VARCHAR,
insured_address_state VARCHAR,
insured_address_zip VARCHAR,
insured_date_of_birth date,
insurance_plan_name VARCHAR,
total_charges DECIMAL(14,4),
fraud VARCHAR,
duplicate varchar,
invalid_claim VARCHAR
)
row format delimited
fields terminated by ','
stored as textfile
location '<<>>'
table properties ( 'skip.header.line.count'='1');

تربیت اور ٹیسٹ ڈیٹاسیٹ بنائیں

بیرونی جدول بنانے کے بعد، ہم اپنے ڈیٹاسیٹ کو ML کے لیے ٹریننگ سیٹ اور ٹیسٹ سیٹ میں تقسیم کرکے تیار کرتے ہیں۔ ہم ایک نئی بیرونی ٹیبل بناتے ہیں جسے کہتے ہیں۔ claim_train، جو دعووں کی میز سے ID <= 85000 کے ساتھ تمام ریکارڈز پر مشتمل ہے۔ یہ وہ ٹریننگ سیٹ ہے جس پر ہم اپنے ایم ایل ماڈل کو تربیت دیتے ہیں۔

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_train
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/train'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id <= 850000

ہم ایک اور بیرونی ٹیبل بناتے ہیں جسے کہتے ہیں۔ claim_test جس میں ID >85000 کے ساتھ تمام ریکارڈز پر مشتمل ٹیسٹ سیٹ ہے جس پر ہم ML ماڈل کی جانچ کرتے ہیں:

CREATE EXTERNAL TABLE
idp_insurance_demo.claims_test
row format delimited
fields terminated by ','
stored as textfile
location '<<>>/test'
table properties ( 'skip.header.line.count'='1')
AS select * from idp_insurance_demo.claims where id > 850000

Amazon Redshift ML کے ساتھ ایک ML ماڈل بنائیں

اب ہم استعمال کرکے ماڈل بناتے ہیں۔ ماڈل بنائیں کمانڈ (مندرجہ ذیل کوڈ دیکھیں)۔ ہم سے متعلقہ کالم منتخب کرتے ہیں۔ claims_train ٹیبل جو دھوکہ دہی کے لین دین کا تعین کر سکتا ہے۔ اس ماڈل کا مقصد کی قدر کی پیشن گوئی کرنا ہے۔ fraud کالم لہذا، fraud پیشین گوئی کے ہدف کے طور پر شامل کیا گیا ہے۔ ماڈل کی تربیت کے بعد، یہ ایک فنکشن بناتا ہے۔ insurance_fraud_model. اس فنکشن کو ایس کیو ایل سٹیٹمنٹس چلاتے ہوئے اندازہ لگانے کے لیے استعمال کیا جاتا ہے تاکہ کی قدر کا اندازہ لگایا جا سکے۔ fraud نئے ریکارڈ کے لیے کالم۔

CREATE MODEL idp_insurance_demo.insurance_fraud_model
FROM (SELECT 
total_charges ,
fraud ,
duplicate,
invalid_claim
FROM idp_insurance_demo.claims_train
)
TARGET fraud
FUNCTION insurance_fraud_model
IAM_ROLE '<<>>'
SETTINGS (
S3_BUCKET '<<>>'
);

ML ماڈل میٹرکس کا اندازہ کریں۔

ماڈل بنانے کے بعد، ہم ماڈل کی درستگی کو جانچنے کے لیے سوالات چلا سکتے ہیں۔ ہم استعمال کرتے ہیں insurance_fraud_model کی قدر کا اندازہ لگانے کے لیے فنکشن fraud نئے ریکارڈ کے لیے کالم۔ پر درج ذیل استفسار کو چلائیں۔ claims_test کنفیوژن میٹرکس بنانے کے لیے جدول:

SELECT 
fraud,
idp_insurance_demo.insurance_fraud_model (total_charges ,duplicate,invalid_claim ) as fraud_calculcated,
count(1)
FROM idp_insurance_demo.claims_test
GROUP BY fraud , fraud_calculcated;

ایم ایل ماڈل کا استعمال کرتے ہوئے دھوکہ دہی کا پتہ لگائیں۔

نیا ماڈل بنانے کے بعد، جیسا کہ نئے دعووں کے ڈیٹا کو ڈیٹا گودام یا ڈیٹا لیک میں داخل کیا جاتا ہے، ہم استعمال کر سکتے ہیں insurance_fraud_model دھوکہ دہی کے لین دین کا حساب لگانے کا فنکشن۔ ہم یہ کام پہلے نئے ڈیٹا کو ایک عارضی ٹیبل میں لوڈ کرکے کرتے ہیں۔ پھر ہم استعمال کرتے ہیں insurance_fraud_model کا حساب لگانے کے لیے فنکشن fraud ہر نئے لین دین کے لیے جھنڈا لگائیں اور جھنڈے کے ساتھ ڈیٹا کو حتمی ٹیبل میں داخل کریں، جو کہ اس صورت میں claims میز.

دعوے کے اعداد و شمار کا تصور کریں۔

جب ڈیٹا Amazon Redshift میں دستیاب ہوتا ہے، تو ہم QuickSight کا استعمال کرتے ہوئے تصورات بنا سکتے ہیں۔ اس کے بعد ہم کاروباری صارفین اور تجزیہ کاروں کے ساتھ QuickSight ڈیش بورڈز کا اشتراک کر سکتے ہیں۔ QuickSight ڈیش بورڈ بنانے کے لیے، آپ کو پہلے QuickSight میں Amazon Redshift ڈیٹاسیٹ بنانا ہوگا۔ ہدایات کے لیے، رجوع کریں۔ ڈیٹا بیس سے ڈیٹاسیٹ بنانا.

ڈیٹا سیٹ بنانے کے بعد، آپ ڈیٹا سیٹ کا استعمال کرتے ہوئے QuickSight میں ایک نیا تجزیہ بنا سکتے ہیں۔ ذیل میں کچھ نمونہ رپورٹس ہیں جو ہم نے بنائی ہیں:

  • ریاست کے لحاظ سے دعووں کی کل تعداد، گروپ کے لحاظ سے fraud میدان - یہ چارٹ ہمیں کسی خاص ریاست میں لین دین کی کل تعداد کے مقابلے میں جعلی لین دین کا تناسب دکھاتا ہے۔
  • دعووں کی کل ڈالر کی قیمت کا مجموعہ، کے لحاظ سے گروپ کردہ fraud میدان - یہ چارٹ ہمیں کسی خاص ریاست میں لین دین کی کل ڈالر کی رقم کے مقابلے میں دھوکہ دہی کے لین دین کی ڈالر کی رقم کا تناسب دکھاتا ہے۔
  • فی بیمہ کمپنی کے لین دین کی کل تعداد، جس کے ذریعے گروپ کیا گیا ہے۔ fraud میدان - یہ چارٹ ہمیں دکھاتا ہے کہ ہر انشورنس کمپنی کے لیے کتنے دعوے دائر کیے گئے اور ان میں سے کتنے دھوکہ دہی پر مبنی ہیں۔

• فراڈ فیلڈ کے لحاظ سے گروپ کردہ فی بیمہ کمپنی کے لین دین کی کل تعداد

  • ریاست کی طرف سے دھوکہ دہی کے لین دین کی کل رقم جو امریکی نقشے پر ظاہر ہوتی ہے۔ - یہ چارٹ صرف جعلی لین دین کو دکھاتا ہے اور نقشے پر ریاست کے لحاظ سے ان لین دین کے کل چارجز دکھاتا ہے۔ نیلے رنگ کا گہرا سایہ زیادہ کل چارجز کی نشاندہی کرتا ہے۔ رجحانات کو بہتر طور پر سمجھنے کے لیے ہم اس ریاست کے اندر شہر کے لحاظ سے اور شہر کے ساتھ زپ کوڈز کا مزید تجزیہ کر سکتے ہیں۔

انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی

صاف کرو

اپنے AWS اکاؤنٹ پر مستقبل کے چارجز کو روکنے کے لیے، ان وسائل کو حذف کریں جو آپ نے سیٹ اپ میں فراہم کیے ہیں صفائی کا سیکشن ہمارے ریپو میں.

نتیجہ

اس دو حصوں کی سیریز میں، ہم نے دیکھا کہ ML کے بہت کم یا بغیر کسی تجربے کے آخر سے آخر تک IDP پائپ لائن کیسے بنائی جاتی ہے۔ ہم نے انشورنس انڈسٹری میں کلیمز پروسیسنگ کے استعمال کے کیس کی کھوج کی اور کس طرح IDP Amazon Textract، Amazon Comprehend، Amazon Comprehend Medical، اور Amazon A2I جیسی خدمات کا استعمال کرتے ہوئے اس استعمال کے کیس کو خودکار بنانے میں مدد کر سکتا ہے۔ حصہ 1 میں، ہم نے دکھایا کہ دستاویز نکالنے کے لیے AWS AI خدمات کیسے استعمال کی جائیں۔ حصہ 2 میں، ہم نے نکالنے کے مرحلے کو بڑھایا اور ڈیٹا کی افزودگی کا مظاہرہ کیا۔ آخر میں، ہم نے مزید تجزیات کے لیے IDP سے نکالے گئے سٹرکچرڈ ڈیٹا کو بڑھایا، اور AWS Analytics سروسز کا استعمال کرتے ہوئے دھوکہ دہی کے دعووں کا پتہ لگانے کے لیے ویژولائزیشنز بنائے۔

ہم تجویز کرتے ہیں کہ کے سیکورٹی سیکشنز کا جائزہ لیں۔ ایمیزون ٹیکسٹ, ایمیزون کی تعریف، اور ایمیزون A2I دستاویزات اور فراہم کردہ رہنما خطوط پر عمل کریں۔ حل کی قیمتوں کے بارے میں مزید جاننے کے لیے، کی قیمتوں کی تفصیلات کا جائزہ لیں۔ ایمیزون ٹیکسٹ, ایمیزون کی تعریف، اور ایمیزون A2I.


مصنفین کے بارے میں

مصنفچنمئی رانے ایمیزون ویب سروسز میں ایک AI/ML ماہر حل آرکیٹیکٹ ہے۔ وہ لاگو ریاضی اور مشین لرننگ کے بارے میں پرجوش ہے۔ وہ AWS صارفین کے لیے ذہین دستاویز پروسیسنگ سلوشن ڈیزائن کرنے پر توجہ مرکوز کرتی ہے۔ کام سے باہر، وہ سالسا اور بچتا ڈانس سے لطف اندوز ہوتی ہے۔


انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
ادے نارائنن
AWS میں تجزیات کے ماہر حل آرکیٹیکٹ ہیں۔ وہ گاہکوں کو پیچیدہ کاروباری چیلنجوں کے لیے جدید حل تلاش کرنے میں مدد کرتا ہے۔ اس کی توجہ کے بنیادی شعبے ڈیٹا اینالیٹکس، بڑے ڈیٹا سسٹمز اور مشین لرننگ ہیں۔ اپنے فارغ وقت میں، وہ کھیل کھیلنے، ٹی وی شوز دیکھنے اور سفر کرنے سے لطف اندوز ہوتے ہیں۔


انشورنس انڈسٹری میں AWS AI اور تجزیاتی خدمات کے ساتھ ذہین دستاویز پراسیسنگ: حصہ 2 PlatoBlockchain ڈیٹا انٹیلی جنس۔ عمودی تلاش۔ عی
سونالی ساہو
ایمیزون ویب سروسز میں انٹیلجنٹ ڈاکومنٹ پروسیسنگ AI/ML سلوشنز آرکیٹیکٹ ٹیم کی قیادت کر رہا ہے۔ وہ ایک پرجوش ٹیکنوفائل ہے اور اختراع کا استعمال کرتے ہوئے پیچیدہ مسائل کو حل کرنے کے لیے صارفین کے ساتھ کام کرنے سے لطف اندوز ہوتی ہے۔ اس کی توجہ کا بنیادی شعبہ مصنوعی ذہانت اور ذہین دستاویز کی پروسیسنگ کے لیے مشین لرننگ ہے۔

ٹائم اسٹیمپ:

سے زیادہ AWS مشین لرننگ