การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1

เป้าหมายของการประมวลผลเอกสารอัจฉริยะ (IDP) คือการช่วยให้องค์กรของคุณตัดสินใจได้เร็วและแม่นยำยิ่งขึ้นโดยใช้ AI ในการประมวลผลเอกสารของคุณ ซีรีส์สองส่วนนี้เน้นย้ำถึงเทคโนโลยี AI ของ AWS ที่บริษัทประกันภัยสามารถใช้เพื่อเร่งกระบวนการทางธุรกิจของตนได้ เทคโนโลยี AI เหล่านี้สามารถนำมาใช้ในกรณีการใช้งานประกันภัยต่างๆ เช่น การเรียกร้อง การรับประกันภัย การติดต่อลูกค้า สัญญา หรือการจัดการข้อโต้แย้ง ชุดนี้มุ่งเน้นไปที่กรณีการใช้งานการประมวลผลการเคลมในอุตสาหกรรมประกันภัย สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวคิดพื้นฐานของโซลูชัน AWS IDP โปรดดูข้อมูลต่อไปนี้ ซีรีย์สองส่วน.

การประมวลผลการเรียกร้องประกอบด้วยจุดตรวจสอบหลายจุดในเวิร์กโฟลว์ที่จำเป็นในการตรวจสอบ ตรวจสอบความถูกต้อง และกำหนดความรับผิดชอบทางการเงินที่ถูกต้องเพื่อตัดสินการเรียกร้อง บริษัทประกันภัยจะผ่านจุดตรวจเหล่านี้เพื่อเรียกร้องค่าสินไหมทดแทนก่อนตัดสินการเรียกร้องค่าสินไหมทดแทน หากการเคลมสำเร็จผ่านจุดตรวจเหล่านี้โดยไม่มีปัญหาใดๆ บริษัทประกันภัยจะอนุมัติและดำเนินการชำระเงินใดๆ อย่างไรก็ตาม พวกเขาอาจต้องการข้อมูลสนับสนุนเพิ่มเติมเพื่อตัดสินการเรียกร้อง กระบวนการเรียกร้องค่าสินไหมทดแทนนี้มักจะดำเนินการด้วยตนเอง ทำให้มีค่าใช้จ่ายสูง เกิดข้อผิดพลาดได้ง่าย และใช้เวลานาน ลูกค้าประกันภัยสามารถทำให้กระบวนการนี้เป็นไปโดยอัตโนมัติโดยใช้บริการ AWS AI เพื่อทำให้ไปป์ไลน์การประมวลผลเอกสารสำหรับการประมวลผลการเคลมเป็นไปโดยอัตโนมัติ

ในชุดข้อมูลสองส่วนนี้ เราจะอธิบายวิธีดำเนินการเอกสารตามขนาดโดยอัตโนมัติและชาญฉลาดโดยใช้บริการ AI ของ AWS สำหรับกรณีการใช้งานการประมวลผลการเคลมประกัน

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI และ Analytics ในอุตสาหกรรมประกันภัย

ภาพรวมโซลูชัน

ไดอะแกรมต่อไปนี้แสดงถึงแต่ละขั้นตอนที่เรามักจะเห็นในไปป์ไลน์ IDP เราอธิบายแต่ละขั้นตอนเหล่านี้และวิธีที่พวกเขาเชื่อมต่อกับขั้นตอนที่เกี่ยวข้องในกระบวนการยื่นคำร้อง เริ่มจากเวลาที่ส่งใบสมัคร ไปจนถึงการตรวจสอบและปิดใบสมัคร ในโพสต์นี้ เราจะกล่าวถึงรายละเอียดทางเทคนิคของขั้นตอนการเก็บข้อมูล การจัดประเภท และการแยกข้อมูล ใน 2 หมายเลขเราขยายขั้นตอนการแยกเอกสารและดำเนินการจัดทำเอกสารเพิ่มเติม ตรวจสอบและยืนยัน และขยายโซลูชันเพื่อให้การวิเคราะห์และการแสดงภาพสำหรับกรณีการใช้งานการอ้างสิทธิ์การฉ้อโกง

แผนภาพสถาปัตยกรรมต่อไปนี้แสดงบริการต่างๆ ของ AWS ที่ใช้ในระหว่างขั้นตอนของไปป์ไลน์ IDP ตามขั้นตอนต่างๆ ของแอปพลิเคชันประมวลผลการเคลม

แผนภาพสถาปัตยกรรม IDP

โซลูชันใช้บริการหลักต่อไปนี้:

  • Amazon Text คือบริการแมชชีนเลิร์นนิง (ML) ที่แยกข้อความ ลายมือ และข้อมูลจากเอกสารที่สแกนโดยอัตโนมัติ นอกเหนือไปจากการรู้จำอักขระด้วยแสง (OCR) อย่างง่ายในการระบุ ทำความเข้าใจ และดึงข้อมูลจากแบบฟอร์มและตาราง Amazon Texttract ใช้ ML เพื่ออ่านและประมวลผลเอกสารประเภทใดก็ได้ แยกข้อความ ลายมือ ตาราง และข้อมูลอื่นๆ ได้อย่างแม่นยำโดยไม่ต้องใช้ความพยายามด้วยตนเอง
  • เข้าใจ Amazon เป็นบริการประมวลผลภาษาธรรมชาติ (NLP) ที่ใช้ ML เพื่อดึงข้อมูลเชิงลึกจากข้อความ Amazon Comprehend สามารถตรวจจับเอนทิตีต่างๆ เช่น บุคคล สถานที่ วันที่ ปริมาณ และอื่นๆ นอกจากนี้ยังสามารถตรวจจับภาษาที่โดดเด่น ข้อมูลข้อมูลส่วนบุคคลที่สามารถระบุตัวตนได้ (PII) และจัดประเภทเอกสารเป็นหมวดหมู่ที่เกี่ยวข้อง
  • อเมซอน เสริม AI (Amazon A2I) เป็นบริการ ML ที่ทำให้ง่ายต่อการสร้างเวิร์กโฟลว์ที่จำเป็นสำหรับการตรวจทานโดยเจ้าหน้าที่ Amazon A2I นำการตรวจสอบโดยเจ้าหน้าที่มาสู่นักพัฒนาทุกคน ขจัดภาระงานหนักที่ไม่แตกต่างซึ่งเกี่ยวข้องกับการสร้างระบบการตรวจสอบโดยเจ้าหน้าที่หรือการจัดการผู้ตรวจสอบที่เป็นมนุษย์จำนวนมาก Amazon A2I รวมเข้ากับ Amazon Text และ เข้าใจ Amazon เพื่อให้ความสามารถในการแนะนำการตรวจสอบโดยเจ้าหน้าที่หรือการตรวจสอบภายในเวิร์กโฟลว์ IDP

เบื้องต้น

ในส่วนต่อไปนี้ เราจะอธิบายเกี่ยวกับบริการต่างๆ ที่เกี่ยวข้องกับสามเฟสแรกของสถาปัตยกรรม กล่าวคือ ขั้นตอนการเก็บข้อมูล การจัดประเภท และการแยกข้อมูล

โปรดดูที่ พื้นที่เก็บข้อมูล GitHub สำหรับตัวอย่างโค้ดแบบเต็มพร้อมกับตัวอย่างเอกสารในแพ็กเก็ตการประมวลผลการเคลม

ขั้นตอนการเก็บข้อมูล

การอ้างสิทธิ์และเอกสารสนับสนุนสามารถมาผ่านช่องทางต่างๆ เช่น โทรสาร อีเมล พอร์ทัลผู้ดูแลระบบ และอื่นๆ คุณสามารถจัดเก็บเอกสารเหล่านี้ในที่เก็บข้อมูลที่ปรับขนาดได้สูงและทนทานเช่น บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน เอส3). เอกสารเหล่านี้มีได้หลายประเภท เช่น PDF, JPEG, PNG, TIFF และอื่นๆ เอกสารสามารถมาในรูปแบบและเลย์เอาต์ที่หลากหลาย และสามารถมาจากช่องทางต่างๆ ไปยังที่เก็บข้อมูลได้

ขั้นตอนการจำแนกประเภท

ในขั้นตอนการจัดประเภทเอกสาร เราสามารถรวม Amazon Comprehend กับ Amazon Texttract เพื่อแปลงข้อความเป็นบริบทของเอกสารเพื่อจัดประเภทเอกสารที่จัดเก็บไว้ในขั้นตอนการเก็บข้อมูลได้ จากนั้น เราสามารถใช้การจัดประเภทแบบกำหนดเองใน Amazon Comprehend เพื่อจัดระเบียบเอกสารเป็นคลาสที่เรากำหนดไว้ในแพ็กเก็ตการประมวลผลการเคลม การจัดประเภทแบบกำหนดเองยังมีประโยชน์สำหรับกระบวนการตรวจสอบเอกสารโดยอัตโนมัติและระบุเอกสารที่ขาดหายไปจากแพ็กเก็ต การจัดประเภทแบบกำหนดเองมีสองขั้นตอน ดังแสดงในแผนภาพสถาปัตยกรรม:

  1. แยกข้อความโดยใช้ Amazon Texttract จากเอกสารทั้งหมดในที่จัดเก็บข้อมูลเพื่อเตรียมข้อมูลการฝึกอบรมสำหรับตัวแยกประเภทที่กำหนดเอง
  2. ฝึกโมเดลการจัดหมวดหมู่แบบกำหนดเองของ Amazon Comprehend (เรียกอีกอย่างว่าa เอกสาร จำแนก) เพื่อจำแนกชั้นเรียนที่น่าสนใจตามเนื้อหาข้อความ

การจัดประเภทเอกสารแพ็กเก็ตเคลมประกัน

หลังจากที่ฝึกโมเดลการจัดประเภทแบบกำหนดเองของ Amazon Comprehend แล้ว เราก็สามารถใช้ปลายทางแบบเรียลไทม์เพื่อจัดประเภทเอกสารได้ Amazon Comprehend ส่งคืนเอกสารทุกคลาสด้วยคะแนนความเชื่อมั่นที่เชื่อมโยงกับแต่ละคลาสในอาร์เรย์ของคู่คีย์-ค่า (Doc_name - Confidence_score). เราแนะนำให้อ่านโค้ดตัวอย่างการจัดประเภทเอกสารโดยละเอียดที่ GitHub.

ขั้นตอนการสกัด

ในขั้นตอนการแยก เราดึงข้อมูลจากเอกสารโดยใช้ Amazon Text และ Amazon Comprehend สำหรับโพสต์นี้ ให้ใช้เอกสารตัวอย่างต่อไปนี้ในแพ็กเก็ตการประมวลผลการเคลม: แบบฟอร์มการเคลม Center of Medicaid and Medicare Services (CMS)-1500 ใบขับขี่และบัตรประจำตัวประกัน และใบแจ้งหนี้

ดึงข้อมูลจากแบบฟอร์มการเรียกร้อง CMS-1500

แบบฟอร์ม CMS-1500 เป็นแบบฟอร์มการเรียกร้องมาตรฐานที่ใช้โดยผู้ให้บริการหรือซัพพลายเออร์ที่ไม่ใช่สถาบันเพื่อเรียกเก็บเงินผู้ให้บริการ Medicare

การประมวลผลแบบฟอร์ม CMS-1500 อย่างถูกต้องเป็นสิ่งสำคัญ มิฉะนั้น อาจทำให้กระบวนการเรียกร้องค่าสินไหมทดแทนช้าลง หรือการชำระเงินโดยผู้ให้บริการขนส่งล่าช้า ด้วยสารสกัดอเมซอน AnalyzeDocument API เราสามารถเร่งกระบวนการสกัดด้วยความแม่นยำที่สูงขึ้นในการดึงข้อความจากเอกสารเพื่อให้เข้าใจข้อมูลเชิงลึกเพิ่มเติมภายในแบบฟอร์มการเรียกร้อง ต่อไปนี้เป็นตัวอย่างเอกสารของแบบฟอร์มการเรียกร้อง CMS-1500

แบบฟอร์มเรียกร้องค่าสินไหมทดแทน CMS1500

ตอนนี้เราใช้ AnalyzeDocument API เพื่อแยกสอง FeatureTypes, FORMS และ TABLES, จากเอกสาร:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

ผลลัพธ์ต่อไปนี้สั้นลงเพื่อให้อ่านง่ายขึ้น สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ที่เก็บ GitHub

พื้นที่ FORMS การดึงข้อมูลถูกระบุเป็นคู่คีย์-ค่า

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

พื้นที่ TABLES การแยกประกอบด้วยเซลล์ เซลล์ที่ผสาน และส่วนหัวของคอลัมน์ภายในตารางที่ตรวจพบในแบบฟอร์มการอ้างสิทธิ์

การแยกตารางจากแบบฟอร์ม CMS1500

ดึงข้อมูลจากเอกสารประจำตัว

สำหรับเอกสารระบุตัวตน เช่น ID ประกัน ซึ่งสามารถมีเลย์เอาต์ต่างกันได้ เราสามารถใช้ Amazon Text AnalyzeDocument เอพีไอ เราใช้ FeatureType FORMS เป็นการกำหนดค่าสำหรับ AnalyzeDocument API เพื่อแยกคู่คีย์-ค่าจาก ID ประกัน (ดูตัวอย่างต่อไปนี้):

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เรียกใช้รหัสต่อไปนี้:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

เราได้รับคู่คีย์-ค่าในอาร์เรย์ผลลัพธ์ ดังที่แสดงในภาพหน้าจอต่อไปนี้

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สำหรับเอกสารประจำตัว เช่น ใบขับขี่สหรัฐฯ หรือหนังสือเดินทางของสหรัฐอเมริกา Amazon Texttract ให้การสนับสนุนพิเศษในการดึงข้อมูลคำสำคัญโดยอัตโนมัติโดยไม่ต้องใช้เทมเพลตหรือรูปแบบ ซึ่งแตกต่างจากที่เราเห็นก่อนหน้านี้สำหรับตัวอย่าง ID ประกัน กับ AnalyzeID API ธุรกิจสามารถดึงข้อมูลจากเอกสารประจำตัวที่มีแม่แบบหรือรูปแบบที่แตกต่างกันได้อย่างรวดเร็วและแม่นยำ ดิ AnalyzeID API ส่งคืนประเภทข้อมูลสองประเภท:

  • คู่คีย์-ค่าที่มีอยู่ใน ID เช่น วันเดือนปีเกิด วันที่ออก หมายเลข ID คลาส และข้อจำกัด
  • ฟิลด์โดยนัยในเอกสารที่อาจไม่มีคีย์ที่ชัดเจนที่เกี่ยวข้อง เช่น ชื่อ ที่อยู่ และผู้ออก

เราใช้ตัวอย่างใบขับขี่ของสหรัฐอเมริกาต่อไปนี้จากแพ็กเก็ตการประมวลผลการเรียกร้องของเรา

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

เรียกใช้รหัสต่อไปนี้:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

ภาพหน้าจอต่อไปนี้แสดงผลของเรา

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

จากภาพหน้าจอของผลลัพธ์ คุณสามารถสังเกตได้ว่ามีการแสดงคีย์บางตัวที่ไม่ได้อยู่ในใบขับขี่ ตัวอย่างเช่น, Veteran ไม่ใช่คีย์ที่พบในใบอนุญาต อย่างไรก็ตาม เป็นคีย์-ค่าที่เติมไว้ล่วงหน้าที่ AnalyzeID รองรับเนื่องจากความแตกต่างที่พบในใบอนุญาตระหว่างรัฐ

ดึงข้อมูลจากใบแจ้งหนี้และใบเสร็จรับเงิน

คล้ายกับ AnalyzeID API, การ AnalyzeExpense API ให้การสนับสนุนเฉพาะสำหรับใบแจ้งหนี้และใบเสร็จรับเงินเพื่อดึงข้อมูลที่เกี่ยวข้อง เช่น ชื่อผู้ขาย ยอดรวมย่อยและจำนวนเงินทั้งหมด และอื่นๆ จากรูปแบบเอกสารใบแจ้งหนี้ใดๆ คุณไม่จำเป็นต้องมีเทมเพลตหรือการกำหนดค่าใดๆ สำหรับการดึงข้อมูล Amazon Texttract ใช้ ML เพื่อทำความเข้าใจบริบทของใบแจ้งหนี้ที่คลุมเครือและใบเสร็จ

ต่อไปนี้เป็นตัวอย่างใบกำกับการประกันสุขภาพ

ตัวอย่างใบประกัน

เราใช้ AnalyzeExpense API เพื่อดูรายการช่องมาตรฐาน ฟิลด์ที่ไม่รู้จักเป็นฟิลด์มาตรฐานจะถูกจัดประเภทเป็น OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

เราได้รับรายการฟิลด์ต่อไปนี้เป็นคู่คีย์-ค่า (ดูภาพหน้าจอทางด้านซ้าย) และแถวทั้งหมดของรายการโฆษณาแต่ละรายการที่ซื้อ (ดูภาพหน้าจอทางด้านขวา) ในผลลัพธ์

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI. การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สรุป

ในโพสต์นี้ เราแสดงความท้าทายทั่วไปในการประมวลผลการเคลม และวิธีที่เราสามารถใช้บริการ AWS AI เพื่อทำให้ไปป์ไลน์การประมวลผลเอกสารอัจฉริยะเป็นอัตโนมัติเพื่อตัดสินการอ้างสิทธิ์โดยอัตโนมัติ เราเห็นวิธีการจัดประเภทเอกสารเป็นคลาสเอกสารต่างๆ โดยใช้ตัวแยกประเภทแบบกำหนดเองของ Amazon Comprehend และวิธีใช้ Amazon Texttract เพื่อแยกประเภทเอกสารที่ไม่มีโครงสร้าง กึ่งโครงสร้าง มีโครงสร้าง และเฉพาะทาง

In 2 หมายเลขเราขยายขั้นตอนการแยกด้วย Amazon Text เรายังใช้เอนทิตีที่กำหนดไว้ล่วงหน้าของ Amazon Comprehend และเอนทิตีแบบกำหนดเองเพื่อเพิ่มข้อมูล และแสดงวิธีขยายไปป์ไลน์ IDP เพื่อผสานรวมกับบริการการวิเคราะห์และการแสดงภาพเพื่อการประมวลผลต่อไป

เราขอแนะนำให้ตรวจสอบส่วนความปลอดภัยของ ข้อความอเมซอน, อเมซอนเข้าใจ, และ อเมซอน A2I เอกสารและปฏิบัติตามแนวทางที่ให้ไว้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับราคาของโซลูชัน ให้ตรวจสอบรายละเอียดราคาของ ข้อความอเมซอน, เข้าใจ Amazonและ อเมซอน A2I.


เกี่ยวกับผู้เขียน

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.ชินมยีระเนะ เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญ AI/ML ที่ Amazon Web Services เธอหลงใหลเกี่ยวกับคณิตศาสตร์ประยุกต์และการเรียนรู้ของเครื่อง เธอมุ่งเน้นที่การออกแบบโซลูชันการประมวลผลเอกสารอัจฉริยะสำหรับลูกค้า AWS นอกงาน เธอชอบเต้นซัลซ่าและบาคาต้า


การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.
โซนาลี ซาฮู เป็นผู้นำทีมสถาปนิกโซลูชัน AI/ML Solutions ของการประมวลผลเอกสารอัจฉริยะที่ Amazon Web Services เธอเป็นคนที่หลงใหลในเทคโนโลยีและชอบที่จะทำงานร่วมกับลูกค้าในการแก้ปัญหาที่ซับซ้อนโดยใช้นวัตกรรม จุดสนใจหลักของเธอคือปัญญาประดิษฐ์และการเรียนรู้ของเครื่องสำหรับการประมวลผลเอกสารอัจฉริยะ


การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.
ทิม คอนเดลโล เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML อาวุโสที่ Amazon Web Services จุดเน้นของเขาคือการประมวลผลภาษาธรรมชาติและการมองเห็นด้วยคอมพิวเตอร์ Tim สนุกกับการนำความคิดของลูกค้ามาเปลี่ยนให้เป็นโซลูชันที่ปรับขนาดได้

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS