การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1

เผยแพร่ซ้ำโดยเพลโต

ผู้ติดตาม: 0

เป้าหมายของการประมวลผลเอกสารอัจฉริยะ (IDP) คือการช่วยให้องค์กรของคุณตัดสินใจได้เร็วและแม่นยำยิ่งขึ้นโดยใช้ AI ในการประมวลผลเอกสารของคุณ ซีรีส์สองส่วนนี้เน้นย้ำถึงเทคโนโลยี AI ของ AWS ที่บริษัทประกันภัยสามารถใช้เพื่อเร่งกระบวนการทางธุรกิจของตนได้ เทคโนโลยี AI เหล่านี้สามารถนำมาใช้ในกรณีการใช้งานประกันภัยต่างๆ เช่น การเรียกร้อง การรับประกันภัย การติดต่อลูกค้า สัญญา หรือการจัดการข้อโต้แย้ง ชุดนี้มุ่งเน้นไปที่กรณีการใช้งานการประมวลผลการเคลมในอุตสาหกรรมประกันภัย สำหรับข้อมูลเพิ่มเติมเกี่ยวกับแนวคิดพื้นฐานของโซลูชัน AWS IDP โปรดดูข้อมูลต่อไปนี้ ซีรีย์สองส่วน.

การประมวลผลการเรียกร้องประกอบด้วยจุดตรวจสอบหลายจุดในเวิร์กโฟลว์ที่จำเป็นในการตรวจสอบ ตรวจสอบความถูกต้อง และกำหนดความรับผิดชอบทางการเงินที่ถูกต้องเพื่อตัดสินการเรียกร้อง บริษัทประกันภัยจะผ่านจุดตรวจเหล่านี้เพื่อเรียกร้องค่าสินไหมทดแทนก่อนตัดสินการเรียกร้องค่าสินไหมทดแทน หากการเคลมสำเร็จผ่านจุดตรวจเหล่านี้โดยไม่มีปัญหาใดๆ บริษัทประกันภัยจะอนุมัติและดำเนินการชำระเงินใดๆ อย่างไรก็ตาม พวกเขาอาจต้องการข้อมูลสนับสนุนเพิ่มเติมเพื่อตัดสินการเรียกร้อง กระบวนการเรียกร้องค่าสินไหมทดแทนนี้มักจะดำเนินการด้วยตนเอง ทำให้มีค่าใช้จ่ายสูง เกิดข้อผิดพลาดได้ง่าย และใช้เวลานาน ลูกค้าประกันภัยสามารถทำให้กระบวนการนี้เป็นไปโดยอัตโนมัติโดยใช้บริการ AWS AI เพื่อทำให้ไปป์ไลน์การประมวลผลเอกสารสำหรับการประมวลผลการเคลมเป็นไปโดยอัตโนมัติ

ในชุดข้อมูลสองส่วนนี้ เราจะอธิบายวิธีดำเนินการเอกสารตามขนาดโดยอัตโนมัติและชาญฉลาดโดยใช้บริการ AI ของ AWS สำหรับกรณีการใช้งานการประมวลผลการเคลมประกัน

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI และ Analytics ในอุตสาหกรรมประกันภัย

ภาพรวมโซลูชัน

ไดอะแกรมต่อไปนี้แสดงถึงแต่ละขั้นตอนที่เรามักจะเห็นในไปป์ไลน์ IDP เราอธิบายแต่ละขั้นตอนเหล่านี้และวิธีที่พวกเขาเชื่อมต่อกับขั้นตอนที่เกี่ยวข้องในกระบวนการยื่นคำร้อง เริ่มจากเวลาที่ส่งใบสมัคร ไปจนถึงการตรวจสอบและปิดใบสมัคร ในโพสต์นี้ เราจะกล่าวถึงรายละเอียดทางเทคนิคของขั้นตอนการเก็บข้อมูล การจัดประเภท และการแยกข้อมูล ใน 2 หมายเลขเราขยายขั้นตอนการแยกเอกสารและดำเนินการจัดทำเอกสารเพิ่มเติม ตรวจสอบและยืนยัน และขยายโซลูชันเพื่อให้การวิเคราะห์และการแสดงภาพสำหรับกรณีการใช้งานการอ้างสิทธิ์การฉ้อโกง

แผนภาพสถาปัตยกรรมต่อไปนี้แสดงบริการต่างๆ ของ AWS ที่ใช้ในระหว่างขั้นตอนของไปป์ไลน์ IDP ตามขั้นตอนต่างๆ ของแอปพลิเคชันประมวลผลการเคลม

แผนภาพสถาปัตยกรรม IDP

โซลูชันใช้บริการหลักต่อไปนี้:

Amazon Text คือบริการแมชชีนเลิร์นนิง (ML) ที่แยกข้อความ ลายมือ และข้อมูลจากเอกสารที่สแกนโดยอัตโนมัติ นอกเหนือไปจากการรู้จำอักขระด้วยแสง (OCR) อย่างง่ายในการระบุ ทำความเข้าใจ และดึงข้อมูลจากแบบฟอร์มและตาราง Amazon Texttract ใช้ ML เพื่ออ่านและประมวลผลเอกสารประเภทใดก็ได้ แยกข้อความ ลายมือ ตาราง และข้อมูลอื่นๆ ได้อย่างแม่นยำโดยไม่ต้องใช้ความพยายามด้วยตนเอง
เข้าใจ Amazon เป็นบริการประมวลผลภาษาธรรมชาติ (NLP) ที่ใช้ ML เพื่อดึงข้อมูลเชิงลึกจากข้อความ Amazon Comprehend สามารถตรวจจับเอนทิตีต่างๆ เช่น บุคคล สถานที่ วันที่ ปริมาณ และอื่นๆ นอกจากนี้ยังสามารถตรวจจับภาษาที่โดดเด่น ข้อมูลข้อมูลส่วนบุคคลที่สามารถระบุตัวตนได้ (PII) และจัดประเภทเอกสารเป็นหมวดหมู่ที่เกี่ยวข้อง
อเมซอน เสริม AI (Amazon A2I) เป็นบริการ ML ที่ทำให้ง่ายต่อการสร้างเวิร์กโฟลว์ที่จำเป็นสำหรับการตรวจทานโดยเจ้าหน้าที่ Amazon A2I นำการตรวจสอบโดยเจ้าหน้าที่มาสู่นักพัฒนาทุกคน ขจัดภาระงานหนักที่ไม่แตกต่างซึ่งเกี่ยวข้องกับการสร้างระบบการตรวจสอบโดยเจ้าหน้าที่หรือการจัดการผู้ตรวจสอบที่เป็นมนุษย์จำนวนมาก Amazon A2I รวมเข้ากับ Amazon Text และ เข้าใจ Amazon เพื่อให้ความสามารถในการแนะนำการตรวจสอบโดยเจ้าหน้าที่หรือการตรวจสอบภายในเวิร์กโฟลว์ IDP

เบื้องต้น

ในส่วนต่อไปนี้ เราจะอธิบายเกี่ยวกับบริการต่างๆ ที่เกี่ยวข้องกับสามเฟสแรกของสถาปัตยกรรม กล่าวคือ ขั้นตอนการเก็บข้อมูล การจัดประเภท และการแยกข้อมูล

โปรดดูที่ พื้นที่เก็บข้อมูล GitHub สำหรับตัวอย่างโค้ดแบบเต็มพร้อมกับตัวอย่างเอกสารในแพ็กเก็ตการประมวลผลการเคลม

ขั้นตอนการเก็บข้อมูล

การอ้างสิทธิ์และเอกสารสนับสนุนสามารถมาผ่านช่องทางต่างๆ เช่น โทรสาร อีเมล พอร์ทัลผู้ดูแลระบบ และอื่นๆ คุณสามารถจัดเก็บเอกสารเหล่านี้ในที่เก็บข้อมูลที่ปรับขนาดได้สูงและทนทานเช่น บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (อเมซอน เอส3). เอกสารเหล่านี้มีได้หลายประเภท เช่น PDF, JPEG, PNG, TIFF และอื่นๆ เอกสารสามารถมาในรูปแบบและเลย์เอาต์ที่หลากหลาย และสามารถมาจากช่องทางต่างๆ ไปยังที่เก็บข้อมูลได้

ขั้นตอนการจำแนกประเภท

ในขั้นตอนการจัดประเภทเอกสาร เราสามารถรวม Amazon Comprehend กับ Amazon Texttract เพื่อแปลงข้อความเป็นบริบทของเอกสารเพื่อจัดประเภทเอกสารที่จัดเก็บไว้ในขั้นตอนการเก็บข้อมูลได้ จากนั้น เราสามารถใช้การจัดประเภทแบบกำหนดเองใน Amazon Comprehend เพื่อจัดระเบียบเอกสารเป็นคลาสที่เรากำหนดไว้ในแพ็กเก็ตการประมวลผลการเคลม การจัดประเภทแบบกำหนดเองยังมีประโยชน์สำหรับกระบวนการตรวจสอบเอกสารโดยอัตโนมัติและระบุเอกสารที่ขาดหายไปจากแพ็กเก็ต การจัดประเภทแบบกำหนดเองมีสองขั้นตอน ดังแสดงในแผนภาพสถาปัตยกรรม:

แยกข้อความโดยใช้ Amazon Texttract จากเอกสารทั้งหมดในที่จัดเก็บข้อมูลเพื่อเตรียมข้อมูลการฝึกอบรมสำหรับตัวแยกประเภทที่กำหนดเอง
ฝึกโมเดลการจัดหมวดหมู่แบบกำหนดเองของ Amazon Comprehend (เรียกอีกอย่างว่าa เอกสาร จำแนก) เพื่อจำแนกชั้นเรียนที่น่าสนใจตามเนื้อหาข้อความ

การจัดประเภทเอกสารแพ็กเก็ตเคลมประกัน

หลังจากที่ฝึกโมเดลการจัดประเภทแบบกำหนดเองของ Amazon Comprehend แล้ว เราก็สามารถใช้ปลายทางแบบเรียลไทม์เพื่อจัดประเภทเอกสารได้ Amazon Comprehend ส่งคืนเอกสารทุกคลาสด้วยคะแนนความเชื่อมั่นที่เชื่อมโยงกับแต่ละคลาสในอาร์เรย์ของคู่คีย์-ค่า (Doc_name - Confidence_score). เราแนะนำให้อ่านโค้ดตัวอย่างการจัดประเภทเอกสารโดยละเอียดที่ GitHub.

ขั้นตอนการสกัด

ในขั้นตอนการแยก เราดึงข้อมูลจากเอกสารโดยใช้ Amazon Text และ Amazon Comprehend สำหรับโพสต์นี้ ให้ใช้เอกสารตัวอย่างต่อไปนี้ในแพ็กเก็ตการประมวลผลการเคลม: แบบฟอร์มการเคลม Center of Medicaid and Medicare Services (CMS)-1500 ใบขับขี่และบัตรประจำตัวประกัน และใบแจ้งหนี้

ดึงข้อมูลจากแบบฟอร์มการเรียกร้อง CMS-1500

แบบฟอร์ม CMS-1500 เป็นแบบฟอร์มการเรียกร้องมาตรฐานที่ใช้โดยผู้ให้บริการหรือซัพพลายเออร์ที่ไม่ใช่สถาบันเพื่อเรียกเก็บเงินผู้ให้บริการ Medicare

การประมวลผลแบบฟอร์ม CMS-1500 อย่างถูกต้องเป็นสิ่งสำคัญ มิฉะนั้น อาจทำให้กระบวนการเรียกร้องค่าสินไหมทดแทนช้าลง หรือการชำระเงินโดยผู้ให้บริการขนส่งล่าช้า ด้วยสารสกัดอเมซอน AnalyzeDocument API เราสามารถเร่งกระบวนการสกัดด้วยความแม่นยำที่สูงขึ้นในการดึงข้อความจากเอกสารเพื่อให้เข้าใจข้อมูลเชิงลึกเพิ่มเติมภายในแบบฟอร์มการเรียกร้อง ต่อไปนี้เป็นตัวอย่างเอกสารของแบบฟอร์มการเรียกร้อง CMS-1500

แบบฟอร์มเรียกร้องค่าสินไหมทดแทน CMS1500

ตอนนี้เราใช้ AnalyzeDocument API เพื่อแยกสอง FeatureTypes, FORMS และ TABLES, จากเอกสาร:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

ผลลัพธ์ต่อไปนี้สั้นลงเพื่อให้อ่านง่ายขึ้น สำหรับข้อมูลเพิ่มเติม โปรดดูที่ ที่เก็บ GitHub

พื้นที่ FORMS การดึงข้อมูลถูกระบุเป็นคู่คีย์-ค่า

พื้นที่ TABLES การแยกประกอบด้วยเซลล์ เซลล์ที่ผสาน และส่วนหัวของคอลัมน์ภายในตารางที่ตรวจพบในแบบฟอร์มการอ้างสิทธิ์

การแยกตารางจากแบบฟอร์ม CMS1500

ดึงข้อมูลจากเอกสารประจำตัว

สำหรับเอกสารระบุตัวตน เช่น ID ประกัน ซึ่งสามารถมีเลย์เอาต์ต่างกันได้ เราสามารถใช้ Amazon Text AnalyzeDocument เอพีไอ เราใช้ FeatureType FORMS เป็นการกำหนดค่าสำหรับ AnalyzeDocument API เพื่อแยกคู่คีย์-ค่าจาก ID ประกัน (ดูตัวอย่างต่อไปนี้):

เรียกใช้รหัสต่อไปนี้:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

เราได้รับคู่คีย์-ค่าในอาร์เรย์ผลลัพธ์ ดังที่แสดงในภาพหน้าจอต่อไปนี้

สำหรับเอกสารประจำตัว เช่น ใบขับขี่สหรัฐฯ หรือหนังสือเดินทางของสหรัฐอเมริกา Amazon Texttract ให้การสนับสนุนพิเศษในการดึงข้อมูลคำสำคัญโดยอัตโนมัติโดยไม่ต้องใช้เทมเพลตหรือรูปแบบ ซึ่งแตกต่างจากที่เราเห็นก่อนหน้านี้สำหรับตัวอย่าง ID ประกัน กับ AnalyzeID API ธุรกิจสามารถดึงข้อมูลจากเอกสารประจำตัวที่มีแม่แบบหรือรูปแบบที่แตกต่างกันได้อย่างรวดเร็วและแม่นยำ ดิ AnalyzeID API ส่งคืนประเภทข้อมูลสองประเภท:

คู่คีย์-ค่าที่มีอยู่ใน ID เช่น วันเดือนปีเกิด วันที่ออก หมายเลข ID คลาส และข้อจำกัด
ฟิลด์โดยนัยในเอกสารที่อาจไม่มีคีย์ที่ชัดเจนที่เกี่ยวข้อง เช่น ชื่อ ที่อยู่ และผู้ออก

เราใช้ตัวอย่างใบขับขี่ของสหรัฐอเมริกาต่อไปนี้จากแพ็กเก็ตการประมวลผลการเรียกร้องของเรา

เรียกใช้รหัสต่อไปนี้:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

ภาพหน้าจอต่อไปนี้แสดงผลของเรา

จากภาพหน้าจอของผลลัพธ์ คุณสามารถสังเกตได้ว่ามีการแสดงคีย์บางตัวที่ไม่ได้อยู่ในใบขับขี่ ตัวอย่างเช่น, Veteran ไม่ใช่คีย์ที่พบในใบอนุญาต อย่างไรก็ตาม เป็นคีย์-ค่าที่เติมไว้ล่วงหน้าที่ AnalyzeID รองรับเนื่องจากความแตกต่างที่พบในใบอนุญาตระหว่างรัฐ

ดึงข้อมูลจากใบแจ้งหนี้และใบเสร็จรับเงิน

คล้ายกับ AnalyzeID API, การ AnalyzeExpense API ให้การสนับสนุนเฉพาะสำหรับใบแจ้งหนี้และใบเสร็จรับเงินเพื่อดึงข้อมูลที่เกี่ยวข้อง เช่น ชื่อผู้ขาย ยอดรวมย่อยและจำนวนเงินทั้งหมด และอื่นๆ จากรูปแบบเอกสารใบแจ้งหนี้ใดๆ คุณไม่จำเป็นต้องมีเทมเพลตหรือการกำหนดค่าใดๆ สำหรับการดึงข้อมูล Amazon Texttract ใช้ ML เพื่อทำความเข้าใจบริบทของใบแจ้งหนี้ที่คลุมเครือและใบเสร็จ

ต่อไปนี้เป็นตัวอย่างใบกำกับการประกันสุขภาพ

ตัวอย่างใบประกัน

เราใช้ AnalyzeExpense API เพื่อดูรายการช่องมาตรฐาน ฟิลด์ที่ไม่รู้จักเป็นฟิลด์มาตรฐานจะถูกจัดประเภทเป็น OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

เราได้รับรายการฟิลด์ต่อไปนี้เป็นคู่คีย์-ค่า (ดูภาพหน้าจอทางด้านซ้าย) และแถวทั้งหมดของรายการโฆษณาแต่ละรายการที่ซื้อ (ดูภาพหน้าจอทางด้านขวา) ในผลลัพธ์

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1 PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

สรุป

ในโพสต์นี้ เราแสดงความท้าทายทั่วไปในการประมวลผลการเคลม และวิธีที่เราสามารถใช้บริการ AWS AI เพื่อทำให้ไปป์ไลน์การประมวลผลเอกสารอัจฉริยะเป็นอัตโนมัติเพื่อตัดสินการอ้างสิทธิ์โดยอัตโนมัติ เราเห็นวิธีการจัดประเภทเอกสารเป็นคลาสเอกสารต่างๆ โดยใช้ตัวแยกประเภทแบบกำหนดเองของ Amazon Comprehend และวิธีใช้ Amazon Texttract เพื่อแยกประเภทเอกสารที่ไม่มีโครงสร้าง กึ่งโครงสร้าง มีโครงสร้าง และเฉพาะทาง

In 2 หมายเลขเราขยายขั้นตอนการแยกด้วย Amazon Text เรายังใช้เอนทิตีที่กำหนดไว้ล่วงหน้าของ Amazon Comprehend และเอนทิตีแบบกำหนดเองเพื่อเพิ่มข้อมูล และแสดงวิธีขยายไปป์ไลน์ IDP เพื่อผสานรวมกับบริการการวิเคราะห์และการแสดงภาพเพื่อการประมวลผลต่อไป

เราขอแนะนำให้ตรวจสอบส่วนความปลอดภัยของ ข้อความอเมซอน, อเมซอนเข้าใจ, และ อเมซอน A2I เอกสารและปฏิบัติตามแนวทางที่ให้ไว้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับราคาของโซลูชัน ให้ตรวจสอบรายละเอียดราคาของ ข้อความอเมซอน, เข้าใจ Amazonและ อเมซอน A2I.

เกี่ยวกับผู้เขียน

ชินมยีระเนะ เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญ AI/ML ที่ Amazon Web Services เธอหลงใหลเกี่ยวกับคณิตศาสตร์ประยุกต์และการเรียนรู้ของเครื่อง เธอมุ่งเน้นที่การออกแบบโซลูชันการประมวลผลเอกสารอัจฉริยะสำหรับลูกค้า AWS นอกงาน เธอชอบเต้นซัลซ่าและบาคาต้า

โซนาลี ซาฮู เป็นผู้นำทีมสถาปนิกโซลูชัน AI/ML Solutions ของการประมวลผลเอกสารอัจฉริยะที่ Amazon Web Services เธอเป็นคนที่หลงใหลในเทคโนโลยีและชอบที่จะทำงานร่วมกับลูกค้าในการแก้ปัญหาที่ซับซ้อนโดยใช้นวัตกรรม จุดสนใจหลักของเธอคือปัญญาประดิษฐ์และการเรียนรู้ของเครื่องสำหรับการประมวลผลเอกสารอัจฉริยะ

ทิม คอนเดลโล เป็นสถาปนิกโซลูชันผู้เชี่ยวชาญด้าน AI/ML อาวุโสที่ Amazon Web Services จุดเน้นของเขาคือการประมวลผลภาษาธรรมชาติและการมองเห็นด้วยคอมพิวเตอร์ Tim สนุกกับการนำความคิดของลูกค้ามาเปลี่ยนให้เป็นโซลูชันที่ปรับขนาดได้

ประทับเวลา: November 3, 2022November 4, 2022

ประทับเวลา: May 2, 2023

การประมวลผลเอกสารอัจฉริยะด้วยบริการ AWS AI ในอุตสาหกรรมประกันภัย: ตอนที่ 1

เผยแพร่ซ้ำโดยเพลโต

ภาพรวมโซลูชัน

เบื้องต้น

ขั้นตอนการเก็บข้อมูล

ขั้นตอนการจำแนกประเภท

ขั้นตอนการสกัด

ดึงข้อมูลจากแบบฟอร์มการเรียกร้อง CMS-1500

ดึงข้อมูลจากเอกสารประจำตัว

ดึงข้อมูลจากใบแจ้งหนี้และใบเสร็จรับเงิน

สรุป

เกี่ยวกับผู้เขียน

เพิ่มเติมจาก AWS Machine Learning AWS

การเดินทางของผู้ช่วยเสมือน AI เจนเนอเรชั่นของ PGA TOUR จากแนวคิดสู่การพัฒนาไปจนถึงต้นแบบ | อเมซอนเว็บเซอร์วิส

การใช้ Amazon Forecast ในอุตสาหกรรมค้าปลีก: การเดินทางจาก POC สู่การผลิต

ปรับแต่งคำแนะนำของคุณด้วยการโปรโมตรายการเฉพาะโดยใช้กฎเกณฑ์ทางธุรกิจด้วย Amazon Personalize

ขอแนะนำโปรแกรมโมเดลแบบกำหนดเองของ AWS Generative AI Innovation Center สำหรับ Claude Anthropic อเมซอนเว็บเซอร์วิส

เร่งขั้นตอนการทำงานหลายภาษาด้วยโซลูชันการแปลที่ปรับแต่งได้ซึ่งสร้างด้วย Amazon Translate

รูปแบบการโฮสต์โมเดลใน SageMaker: แนวทางปฏิบัติที่ดีที่สุดในการทดสอบและอัปเดตโมเดลบน SageMaker

Amazon SageMaker พร้อม TensorBoard: ภาพรวมของประสบการณ์ TensorBoard ที่โฮสต์

เกี่ยวกับเรา

การค้นหาแนวตั้ง & Ai

ระบบปฏิบัติการ

การติดต่อ

ลงชื่อเข้าใช้