Xử lý tài liệu thông minh với dịch vụ AI của AWS trong ngành bảo hiểm: Phần 1

Được xuất bản lại bởi Plato

Người theo dõi: 0

Mục tiêu của xử lý tài liệu thông minh (IDP) là giúp tổ chức của bạn đưa ra quyết định nhanh hơn và chính xác hơn bằng cách áp dụng AI để xử lý thủ tục giấy tờ của bạn. Loạt bài gồm hai phần này nêu bật các công nghệ AI của AWS mà các công ty bảo hiểm có thể sử dụng để tăng tốc quy trình kinh doanh của họ. Những công nghệ AI này có thể được sử dụng trong các trường hợp sử dụng bảo hiểm như yêu cầu bồi thường, bảo lãnh phát hành, thư từ khách hàng, hợp đồng hoặc giải quyết tranh chấp. Loạt bài này tập trung vào trường hợp sử dụng xử lý yêu cầu bồi thường trong ngành bảo hiểm; để biết thêm thông tin về các khái niệm cơ bản của giải pháp AWS IDP, hãy tham khảo phần sau loạt hai phần.

Quá trình xử lý yêu cầu bồi thường bao gồm nhiều điểm kiểm tra trong quy trình làm việc cần thiết để xem xét, xác minh tính xác thực và xác định trách nhiệm tài chính chính xác để phân xử yêu cầu bồi thường. Các công ty bảo hiểm sẽ đi qua các điểm kiểm tra này để tìm các yêu cầu bồi thường trước khi xét xử các yêu cầu bồi thường. Nếu yêu cầu bồi thường vượt qua tất cả các điểm kiểm tra này thành công mà không gặp vấn đề gì, công ty bảo hiểm sẽ phê duyệt yêu cầu đó và xử lý mọi khoản thanh toán. Tuy nhiên, họ có thể yêu cầu thông tin hỗ trợ bổ sung để xét xử yêu cầu bồi thường. Quá trình xử lý khiếu nại này thường thủ công, gây tốn kém, dễ xảy ra lỗi và tốn thời gian. Khách hàng bảo hiểm có thể tự động hóa quy trình này bằng cách sử dụng dịch vụ AWS AI để tự động hóa quy trình xử lý tài liệu nhằm xử lý yêu cầu bồi thường.

Trong loạt bài gồm hai phần này, chúng tôi sẽ hướng dẫn bạn cách tự động hóa và xử lý tài liệu một cách thông minh trên quy mô lớn bằng cách sử dụng dịch vụ AWS AI cho trường hợp sử dụng xử lý yêu cầu bảo hiểm.

Xử lý tài liệu thông minh với dịch vụ AWS AI và Analytics trong ngành bảo hiểm

Tổng quan về giải pháp

Sơ đồ sau đây thể hiện từng giai đoạn mà chúng ta thường thấy trong quy trình IDP. Chúng tôi sẽ hướng dẫn từng giai đoạn này và cách chúng kết nối với các bước liên quan đến quy trình đăng ký yêu cầu bồi thường, bắt đầu từ khi gửi đơn đăng ký cho đến việc điều tra và đóng đơn đăng ký. Trong bài đăng này, chúng tôi đề cập đến các chi tiết kỹ thuật của các giai đoạn thu thập, phân loại và trích xuất dữ liệu. TRONG Phần 2, chúng tôi mở rộng giai đoạn trích xuất tài liệu và tiếp tục bổ sung, đánh giá và xác minh tài liệu, đồng thời mở rộng giải pháp để cung cấp phân tích và trực quan hóa cho trường hợp sử dụng gian lận khiếu nại.

Sơ đồ kiến trúc sau đây hiển thị các dịch vụ AWS khác nhau được sử dụng trong các giai đoạn của quy trình IDP theo các giai đoạn khác nhau của ứng dụng xử lý khiếu nại.

Sơ đồ kiến trúc IDP

Giải pháp sử dụng các dịch vụ chính sau:

Văn bản Amazon là dịch vụ máy học (ML) tự động trích xuất văn bản, chữ viết tay và dữ liệu từ các tài liệu được quét. Nó vượt xa nhận dạng ký tự quang học (OCR) đơn giản để xác định, hiểu và trích xuất dữ liệu từ các biểu mẫu và bảng. Amazon Textract sử dụng ML để đọc và xử lý mọi loại tài liệu, trích xuất chính xác văn bản, chữ viết tay, bảng và dữ liệu khác mà không cần nỗ lực thủ công.
Amazon hiểu là dịch vụ xử lý ngôn ngữ tự nhiên (NLP) sử dụng ML để trích xuất thông tin chi tiết từ văn bản. Amazon Comprehend có thể phát hiện các thực thể như người, vị trí, ngày tháng, số lượng, v.v. Nó cũng có thể phát hiện ngôn ngữ chính, thông tin nhận dạng cá nhân (PII) và phân loại tài liệu vào loại liên quan.
AI tăng cường của Amazon (Amazon A2I) là dịch vụ ML giúp dễ dàng xây dựng các quy trình làm việc cần thiết để con người đánh giá. Amazon A2I mang đến hoạt động đánh giá của con người cho tất cả các nhà phát triển, loại bỏ gánh nặng không phân biệt liên quan đến việc xây dựng hệ thống đánh giá con người hoặc quản lý số lượng lớn người đánh giá con người. Amazon A2I tích hợp cả hai với Văn bản Amazon và Amazon hiểu để cung cấp khả năng đưa ra đánh giá hoặc xác nhận của con người trong quy trình làm việc của IDP.

Điều kiện tiên quyết

Trong các phần sau, chúng ta sẽ tìm hiểu các dịch vụ khác nhau liên quan đến ba giai đoạn đầu tiên của kiến trúc, tức là các giai đoạn thu thập, phân loại và trích xuất dữ liệu.

Tham khảo Kho GitHub đối với các mẫu mã đầy đủ cùng với các mẫu tài liệu trong gói xử lý yêu cầu bồi thường.

Giai đoạn thu thập dữ liệu

Các khiếu nại và tài liệu hỗ trợ có thể được gửi qua nhiều kênh khác nhau, chẳng hạn như fax, email, cổng quản trị, v.v. Bạn có thể lưu trữ những tài liệu này trong một kho lưu trữ bền và có khả năng mở rộng cao như Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3). Các tài liệu này có thể có nhiều loại khác nhau, chẳng hạn như PDF, JPEG, PNG, TIFF, v.v. Tài liệu có thể có nhiều định dạng và bố cục khác nhau và có thể đến từ các kênh khác nhau đến kho lưu trữ dữ liệu.

Giai đoạn phân loại

Ở giai đoạn phân loại tài liệu, chúng ta có thể kết hợp Amazon Comprehend với Amazon Textract để chuyển đổi văn bản sang ngữ cảnh tài liệu nhằm phân loại các tài liệu được lưu trữ trong giai đoạn thu thập dữ liệu. Sau đó, chúng tôi có thể sử dụng phân loại tùy chỉnh trong Amazon Comprehend để sắp xếp tài liệu thành các lớp mà chúng tôi đã xác định trong gói xử lý khiếu nại. Phân loại tùy chỉnh cũng hữu ích để tự động hóa quy trình xác minh tài liệu và xác định mọi tài liệu bị thiếu trong gói. Có hai bước trong phân loại tùy chỉnh, như được hiển thị trong sơ đồ kiến trúc:

Trích xuất văn bản bằng Amazon Textract từ tất cả tài liệu trong kho lưu trữ dữ liệu để chuẩn bị dữ liệu huấn luyện cho trình phân loại tùy chỉnh.
Huấn luyện mô hình phân loại tùy chỉnh Amazon Comprehend (còn gọi là mô hình tài liệu phân loại) để nhận biết các lớp quan tâm dựa trên nội dung văn bản.

Phân loại tài liệu gói yêu cầu bồi thường bảo hiểm

Sau khi huấn luyện mô hình phân loại tùy chỉnh Amazon Comprehend, chúng tôi có thể sử dụng điểm cuối theo thời gian thực để phân loại tài liệu. Amazon Comprehend trả về tất cả các lớp tài liệu có điểm tin cậy được liên kết với từng lớp trong một mảng các cặp khóa-giá trị (Doc_name – Confidence_score). Chúng tôi khuyên bạn nên xem qua mã mẫu phân loại tài liệu chi tiết trên GitHub.

Giai đoạn khai thác

Trong giai đoạn trích xuất, chúng tôi trích xuất dữ liệu từ các tài liệu bằng Amazon Textract và Amazon Comprehend. Đối với bài đăng này, hãy sử dụng các tài liệu mẫu sau trong gói xử lý yêu cầu bồi thường: biểu mẫu yêu cầu bồi thường của Trung tâm Dịch vụ Medicaid và Medicare (CMS) -1500, giấy phép lái xe và ID bảo hiểm cũng như hóa đơn.

Trích xuất dữ liệu từ mẫu yêu cầu CMS-1500

Biểu mẫu CMS-1500 là biểu mẫu yêu cầu tiêu chuẩn được nhà cung cấp hoặc nhà cung cấp phi tổ chức sử dụng để lập hóa đơn cho các nhà cung cấp dịch vụ Medicare.

Điều quan trọng là phải xử lý biểu mẫu CMS-1500 một cách chính xác, nếu không việc này có thể làm chậm quá trình yêu cầu bồi thường hoặc trì hoãn việc thanh toán của nhà cung cấp dịch vụ. Với văn bản Amazon AnalyzeDocument API, chúng tôi có thể tăng tốc quá trình trích xuất với độ chính xác cao hơn để trích xuất văn bản từ tài liệu nhằm hiểu rõ hơn về biểu mẫu yêu cầu. Sau đây là tài liệu mẫu của mẫu yêu cầu CMS-1500.

Mẫu yêu cầu CMS1500

Bây giờ chúng tôi sử dụng AnalyzeDocument API để trích xuất hai FeatureTypes, FORMS và TABLES, từ tài liệu:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Các kết quả sau đây đã được rút ngắn để dễ đọc hơn. Để biết thêm thông tin chi tiết, xem của chúng tôi Kho lưu trữ GitHub.

Sản phẩm FORMS trích xuất được xác định là cặp khóa-giá trị.

Sản phẩm TABLES trích xuất chứa các ô, ô đã hợp nhất và tiêu đề cột trong bảng được phát hiện trong biểu mẫu xác nhận quyền sở hữu.

Trích xuất bảng từ mẫu CMS1500

Trích xuất dữ liệu từ tài liệu ID

Đối với các tài liệu nhận dạng như ID bảo hiểm, có thể có bố cục khác nhau, chúng ta có thể sử dụng Amazon Textract AnalyzeDocument API. Chúng tôi sử dụng FeatureType FORMS như cấu hình cho AnalyzeDocument API để trích xuất các cặp khóa-giá trị từ ID bảo hiểm (xem mẫu sau):

Chạy mã sau:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Chúng tôi nhận được các cặp khóa-giá trị trong mảng kết quả, như trong ảnh chụp màn hình sau.

Đối với các tài liệu ID như giấy phép lái xe Hoa Kỳ hoặc hộ chiếu Hoa Kỳ, Amazon Textract cung cấp hỗ trợ chuyên biệt để tự động trích xuất các thuật ngữ chính mà không cần mẫu hoặc định dạng, không giống như những gì chúng ta đã thấy trước đó trong ví dụ về ID bảo hiểm. Với AnalyzeID API, doanh nghiệp có thể trích xuất thông tin nhanh chóng và chính xác từ các tài liệu ID có mẫu hoặc định dạng khác nhau. Các AnalyzeID API trả về hai loại kiểu dữ liệu:

Các cặp khóa-giá trị có sẵn trên ID như ngày sinh, ngày cấp, số ID, hạng và các hạn chế
Các trường ngầm định trên tài liệu có thể không có khóa rõ ràng được liên kết với chúng, chẳng hạn như tên, địa chỉ và nhà phát hành

Chúng tôi sử dụng mẫu giấy phép lái xe Hoa Kỳ sau đây từ gói xử lý yêu cầu bồi thường của chúng tôi.

Chạy mã sau:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Ảnh chụp màn hình sau đây cho thấy kết quả của chúng tôi.

Từ ảnh chụp màn hình kết quả, bạn có thể nhận thấy rằng một số chìa khóa nhất định được hiển thị không có trong giấy phép lái xe. Ví dụ, Veteran không phải là khóa được tìm thấy trong giấy phép; tuy nhiên, đó là khóa-giá trị được điền trước AnalyzeID hỗ trợ, do sự khác biệt về giấy phép giữa các tiểu bang.

Trích xuất dữ liệu từ hóa đơn, biên lai

Tương tự như AnalyzeID API, AnalyzeExpense API cung cấp hỗ trợ chuyên biệt cho hóa đơn và biên lai để trích xuất thông tin liên quan như tên nhà cung cấp, tổng số tiền và tổng số tiền, v.v. từ bất kỳ định dạng nào của tài liệu hóa đơn. Bạn không cần bất kỳ mẫu hoặc cấu hình nào để trích xuất. Amazon Textract sử dụng ML để hiểu bối cảnh của hóa đơn cũng như biên lai không rõ ràng.

Sau đây là mẫu hóa đơn bảo hiểm y tế.

Mẫu hóa đơn bảo hiểm

Chúng tôi sử dụng AnalyzeExpense API để xem danh sách các trường được tiêu chuẩn hóa. Các trường không được công nhận là trường tiêu chuẩn sẽ được phân loại là OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Chúng tôi nhận được danh sách các trường sau đây dưới dạng cặp khóa-giá trị (xem ảnh chụp màn hình ở bên trái) và toàn bộ hàng mục hàng riêng lẻ đã mua (xem ảnh chụp màn hình ở bên phải) trong kết quả.

Xử lý tài liệu thông minh với các dịch vụ AI của AWS trong ngành bảo hiểm: Phần 1 Trí tuệ dữ liệu PlatoBlockchain. Tìm kiếm dọc. Ái.

Kết luận

Trong bài đăng này, chúng tôi đã giới thiệu những thách thức thường gặp trong quá trình xử lý khiếu nại và cách chúng tôi có thể sử dụng dịch vụ AWS AI để tự động hóa quy trình xử lý tài liệu thông minh nhằm tự động phân xử khiếu nại. Chúng ta đã biết cách phân loại tài liệu thành nhiều lớp tài liệu khác nhau bằng trình phân loại tùy chỉnh Amazon Comprehend và cách sử dụng Amazon Textract để trích xuất các loại tài liệu phi cấu trúc, bán cấu trúc, có cấu trúc và chuyên biệt.

In Phần 2, chúng tôi mở rộng giai đoạn trích xuất bằng Amazon Textract. Chúng tôi cũng sử dụng các thực thể được xác định trước và thực thể tùy chỉnh của Amazon Comprehend để làm phong phú dữ liệu và chỉ ra cách mở rộng quy trình IDP để tích hợp với các dịch vụ phân tích và trực quan hóa để xử lý thêm.

Chúng tôi khuyên bạn nên xem lại các phần bảo mật của Văn bản Amazon, Amazon hiểu, và amazon A2I tài liệu và làm theo hướng dẫn được cung cấp. Để tìm hiểu thêm về giá của giải pháp, hãy xem lại chi tiết về giá của Văn bản Amazon, Amazon hiểuvà amazon A2I.

Về các tác giả

Chinmayee Rane là một Kiến trúc sư Giải pháp Chuyên gia về AI / ML tại Amazon Web Services. Cô ấy đam mê toán học ứng dụng và máy học. Cô tập trung vào việc thiết kế các giải pháp xử lý tài liệu thông minh cho khách hàng AWS. Ngoài giờ làm việc, cô thích khiêu vũ salsa và bachata.

Sonali Sahu đang lãnh đạo nhóm Kiến trúc sư giải pháp AI/ML xử lý tài liệu thông minh tại Amazon Web Services. Cô ấy là một người đam mê công nghệ và thích làm việc với khách hàng để giải quyết các vấn đề phức tạp bằng cách sử dụng sự đổi mới. Lĩnh vực trọng tâm cốt lõi của cô là trí tuệ nhân tạo và học máy để xử lý tài liệu thông minh.

Tim Condello là Kiến trúc sư giải pháp chuyên gia AI/ML cấp cao tại Amazon Web Services. Trọng tâm của ông là xử lý ngôn ngữ tự nhiên và thị giác máy tính. Tim thích lấy ý tưởng của khách hàng và biến chúng thành các giải pháp có thể mở rộng.

Dấu thời gian: Tháng Mười Một 3, 2022Tháng Mười Một 4, 2022

Dấu thời gian: Tháng Tư 3, 2024

Xử lý tài liệu thông minh với dịch vụ AWS AI trong ngành bảo hiểm: Phần 1

Được xuất bản lại bởi Plato

Tổng quan về giải pháp

Điều kiện tiên quyết

Giai đoạn thu thập dữ liệu

Giai đoạn phân loại

Giai đoạn khai thác

Trích xuất dữ liệu từ mẫu yêu cầu CMS-1500

Trích xuất dữ liệu từ tài liệu ID

Trích xuất dữ liệu từ hóa đơn, biên lai

Kết luận

Về các tác giả

Thêm từ Học máy AWS

Đổi mới trải nghiệm dữ liệu: Sử dụng trí tuệ nhân tạo tổng quát và kiến trúc dữ liệu hiện đại để khám phá những hiểu biết sâu sắc | Dịch vụ web của Amazon

“ID + Selfie” – Cải thiện việc xác minh danh tính kỹ thuật số bằng AWS

Amazon Rekognition giới thiệu Sự kiện phát trực tuyến video để cung cấp cảnh báo thời gian thực về các luồng video trực tiếp

Giới thiệu Amazon CodeWhisperer, người bạn đồng hành mã hóa hỗ trợ ML

Về chúng tôi

Tìm kiếm dọc & Ai

Nền tảng

NHẬN THÔNG TIN

Tài khoản