Pemrosesan Dokumen Cerdas Dengan Layanan AI AWS Di Industri Asuransi: Bagian 1

Diterbitkan Ulang Oleh Plato

Followers: 0

Tujuan pemrosesan dokumen cerdas (IDP) adalah membantu organisasi Anda membuat keputusan yang lebih cepat dan akurat dengan menerapkan AI untuk memproses dokumen Anda. Seri dua bagian ini menyoroti teknologi AI AWS yang dapat digunakan perusahaan asuransi untuk mempercepat proses bisnis mereka. Teknologi AI ini dapat digunakan di seluruh kasus penggunaan asuransi seperti klaim, penjaminan emisi, korespondensi pelanggan, kontrak, atau penanganan penyelesaian perselisihan. Seri ini berfokus pada kasus penggunaan pemrosesan klaim di industri asuransi; untuk informasi selengkapnya tentang konsep dasar solusi AWS IDP, lihat berikut ini seri dua bagian.

Pemrosesan klaim terdiri dari beberapa pos pemeriksaan dalam alur kerja yang diperlukan untuk meninjau, memverifikasi keaslian, dan menentukan tanggung jawab keuangan yang benar untuk mengadili klaim. Perusahaan asuransi melewati pos pemeriksaan ini untuk klaim sebelum ajudikasi klaim. Jika klaim berhasil melewati semua pos pemeriksaan ini tanpa masalah, perusahaan asuransi menyetujuinya dan memproses pembayaran apa pun. Namun, mereka mungkin memerlukan informasi pendukung tambahan untuk mengadili klaim. Proses pemrosesan klaim ini seringkali manual, sehingga mahal, rawan kesalahan, dan memakan waktu. Pelanggan asuransi dapat mengotomatiskan proses ini menggunakan layanan AWS AI untuk mengotomatiskan alur pemrosesan dokumen untuk pemrosesan klaim.

Dalam seri dua bagian ini, kami akan memandu Anda tentang bagaimana Anda dapat mengotomatisasi dan memproses dokumen secara cerdas dalam skala besar menggunakan layanan AWS AI untuk kasus penggunaan pemrosesan klaim asuransi.

Pemrosesan dokumen cerdas dengan layanan AWS AI dan Analytics di industri asuransi

Ikhtisar solusi

Diagram berikut mewakili setiap tahap yang biasanya kita lihat dalam pipeline IDP. Kami menelusuri setiap tahapan ini dan bagaimana mereka terhubung ke langkah-langkah yang terlibat dalam proses aplikasi klaim, mulai dari saat aplikasi diajukan, hingga menyelidiki dan menutup aplikasi. Dalam posting ini, kami membahas detail teknis dari tahap pengambilan data, klasifikasi, dan ekstraksi. Di bagian 2, kami memperluas tahap ekstraksi dokumen dan melanjutkan pengayaan dokumen, peninjauan dan verifikasi, dan memperluas solusi untuk menyediakan analitik dan visualisasi untuk kasus penggunaan penipuan klaim.

Diagram arsitektur berikut menunjukkan berbagai layanan AWS yang digunakan selama fase pipeline IDP sesuai dengan berbagai tahapan aplikasi pemrosesan klaim.

Diagram arsitektur IDP

Solusinya menggunakan layanan utama berikut:

Teks Amazon adalah layanan pembelajaran mesin (ML) yang secara otomatis mengekstrak teks, tulisan tangan, dan data dari dokumen yang dipindai. Ini melampaui pengenalan karakter optik sederhana (OCR) untuk mengidentifikasi, memahami, dan mengekstrak data dari formulir dan tabel. Amazon Textract menggunakan ML untuk membaca dan memproses semua jenis dokumen, mengekstrak teks, tulisan tangan, tabel, dan data lainnya secara akurat tanpa upaya manual.
Amazon Comprehend adalah layanan pemrosesan bahasa alami (NLP) yang menggunakan ML untuk mengekstrak wawasan dari teks. Amazon Comprehend dapat mendeteksi entitas seperti orang, lokasi, tanggal, kuantitas, dan lainnya. Itu juga dapat mendeteksi bahasa yang dominan, informasi informasi identitas pribadi (PII), dan mengklasifikasikan dokumen ke dalam kelas yang relevan.
Amazon Augmented AI (Amazon A2I) adalah layanan ML yang memudahkan pembuatan alur kerja yang diperlukan untuk peninjauan manusia. Amazon A2I menghadirkan tinjauan manusia ke semua pengembang, menghilangkan beban berat yang tidak dapat dibedakan terkait dengan membangun sistem tinjauan manusia atau mengelola sejumlah besar pengulas manusia. Amazon A2I mengintegrasikan keduanya dengan Teks Amazon dan Amazon Comprehend untuk memberikan kemampuan untuk memperkenalkan tinjauan manusia atau validasi dalam alur kerja IDP.

Prasyarat

Pada bagian berikut, kita berjalan melalui layanan yang berbeda yang berkaitan dengan tiga fase pertama dari arsitektur, yaitu fase pengambilan data, klasifikasi dan ekstraksi.

Lihat ke kami Repositori GitHub untuk contoh kode lengkap beserta contoh dokumen dalam paket pemrosesan klaim.

Fase pengambilan data

Klaim dan dokumen pendukungnya dapat datang melalui berbagai saluran, seperti faks, email, portal admin, dan lainnya. Anda dapat menyimpan dokumen-dokumen ini dalam penyimpanan yang sangat skalabel dan tahan lama seperti Layanan Penyimpanan Sederhana Amazon (Amazon S3). Dokumen-dokumen ini bisa dari berbagai jenis, seperti PDF, JPEG, PNG, TIFF, dan banyak lagi. Dokumen dapat datang dalam berbagai format dan tata letak, dan dapat berasal dari saluran yang berbeda ke penyimpanan data.

Fase klasifikasi

Pada tahap klasifikasi dokumen, kita dapat menggabungkan Amazon Comprehend dengan Amazon Textract untuk mengonversi teks ke konteks dokumen untuk mengklasifikasikan dokumen yang disimpan dalam tahap pengambilan data. Kami kemudian dapat menggunakan klasifikasi khusus di Amazon Comprehend untuk mengatur dokumen ke dalam kelas yang kami definisikan dalam paket pemrosesan klaim. Klasifikasi khusus juga berguna untuk mengotomatisasi proses verifikasi dokumen dan mengidentifikasi dokumen yang hilang dari paket. Ada dua langkah dalam klasifikasi kustom, seperti yang ditunjukkan pada diagram arsitektur:

Ekstrak teks menggunakan Amazon Textract dari semua dokumen dalam penyimpanan data untuk menyiapkan data pelatihan untuk pengklasifikasi kustom.
Latih model klasifikasi kustom Amazon Comprehend (juga disebut a dokumen penggolong) untuk mengenali kelas minat berdasarkan konten teks.

Klasifikasi dokumen paket klaim asuransi

Setelah model klasifikasi kustom Amazon Comprehend dilatih, kita dapat menggunakan titik akhir waktu nyata untuk mengklasifikasikan dokumen. Amazon Comprehend mengembalikan semua kelas dokumen dengan skor keyakinan yang ditautkan ke setiap kelas dalam larik pasangan nilai kunci (Doc_name - Confidence_score). Kami merekomendasikan untuk membaca kode sampel klasifikasi dokumen terperinci di GitHub.

Fase ekstraksi

Pada fase ekstraksi, kami mengekstrak data dari dokumen menggunakan Amazon Textract dan Amazon Comprehend. Untuk posting ini, gunakan contoh dokumen berikut dalam paket pemrosesan klaim: formulir klaim Center of Medicaid and Medicare Services (CMS)-1500, SIM dan ID asuransi, dan faktur.

Ekstrak data dari formulir klaim CMS-1500

Formulir CMS-1500 adalah formulir klaim standar yang digunakan oleh penyedia atau pemasok non-lembaga untuk menagih operator Medicare.

Sangat penting untuk memproses formulir CMS-1500 secara akurat, jika tidak maka dapat memperlambat proses klaim atau menunda pembayaran oleh operator. Dengan Amazon Textract AnalyzeDocument API, kami dapat mempercepat proses ekstraksi dengan akurasi yang lebih tinggi untuk mengekstrak teks dari dokumen untuk memahami wawasan lebih lanjut dalam formulir klaim. Berikut ini adalah contoh dokumen formulir klaim CMS-1500.

Formulir Klaim CMS1500

Kami sekarang menggunakan AnalyzeDocument API untuk mengekstrak dua FeatureTypes, FORMS dan TABLES, dari dokumen:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

Hasil berikut telah dipersingkat untuk keterbacaan yang lebih baik. Untuk informasi lebih rinci, lihat kami Repo GitHub.

Grafik FORMS ekstraksi diidentifikasi sebagai pasangan nilai kunci.

Grafik TABLES ekstraksi berisi sel, sel gabungan, dan header kolom dalam tabel yang terdeteksi dalam formulir klaim.

Ekstraksi tabel dari formulir CMS1500

Ekstrak data dari dokumen ID

Untuk dokumen identitas seperti ID asuransi, yang dapat memiliki tata letak yang berbeda, kita dapat menggunakan Amazon Textract AnalyzeDocument API. Kami menggunakan FeatureType FORMS sebagai konfigurasi untuk AnalyzeDocument API untuk mengekstrak pasangan nilai kunci dari ID asuransi (lihat contoh berikut):

Jalankan kode berikut:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

Kami mendapatkan pasangan nilai kunci dalam larik hasil, seperti yang ditunjukkan pada tangkapan layar berikut.

Untuk dokumen ID seperti SIM AS atau paspor AS, Amazon Textract menyediakan dukungan khusus untuk mengekstrak istilah kunci secara otomatis tanpa memerlukan template atau format, tidak seperti yang kita lihat sebelumnya untuk contoh ID asuransi. Dengan AnalyzeID API, bisnis dapat dengan cepat dan akurat mengekstrak informasi dari dokumen ID yang memiliki template atau format yang berbeda. Itu AnalyzeID API mengembalikan dua kategori tipe data:

Pasangan nilai kunci yang tersedia di ID seperti tanggal lahir, tanggal penerbitan, nomor ID, kelas, dan batasan
Bidang tersirat pada dokumen yang mungkin tidak memiliki kunci eksplisit yang terkait dengannya, seperti nama, alamat, dan penerbit

Kami menggunakan contoh SIM AS berikut dari paket pemrosesan klaim kami.

Jalankan kode berikut:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

Tangkapan layar berikut menunjukkan hasil kami.

Dari tangkapan layar hasil, Anda dapat mengamati bahwa kunci tertentu disajikan yang tidak ada dalam SIM itu sendiri. Sebagai contoh, Veteran bukan kunci yang ditemukan dalam lisensi; namun, ini adalah nilai kunci yang telah diisi sebelumnya yang AnalyzeID mendukung, karena perbedaan yang ditemukan dalam lisensi antar negara.

Ekstrak data dari faktur dan tanda terima

Serupa dengan AnalyzeID API, AnalyzeExpense API menyediakan dukungan khusus untuk faktur dan tanda terima untuk mengekstrak informasi yang relevan seperti nama vendor, jumlah subtotal dan total, dan lainnya dari format dokumen faktur apa pun. Anda tidak memerlukan template atau konfigurasi apa pun untuk ekstraksi. Amazon Textract menggunakan ML untuk memahami konteks faktur yang tidak jelas serta tanda terima.

Berikut ini adalah contoh faktur asuransi kesehatan.

Contoh faktur asuransi

Kami menggunakan AnalyzeExpense API untuk melihat daftar bidang standar. Bidang yang tidak dikenali sebagai bidang standar dikategorikan sebagai OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

Kami mendapatkan daftar bidang berikut sebagai pasangan nilai kunci (lihat tangkapan layar di sebelah kiri) dan seluruh baris item baris individual yang dibeli (lihat tangkapan layar di sebelah kanan) dalam hasil.

Pemrosesan dokumen cerdas dengan layanan AWS AI di industri asuransi: Bagian 1 PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Kesimpulan

Dalam postingan ini, kami menunjukkan tantangan umum dalam pemrosesan klaim, dan bagaimana kami dapat menggunakan layanan AWS AI untuk mengotomatiskan alur pemrosesan dokumen cerdas untuk secara otomatis mengadili klaim. Kami melihat cara mengklasifikasikan dokumen ke dalam berbagai kelas dokumen menggunakan pengklasifikasi kustom Amazon Comprehend, dan cara menggunakan Amazon Textract untuk mengekstrak jenis dokumen tidak terstruktur, semi terstruktur, terstruktur, dan khusus.

In bagian 2, kami memperluas fase ekstraksi dengan Amazon Textract. Kami juga menggunakan entitas yang telah ditentukan sebelumnya dan entitas kustom Amazon Comprehend untuk memperkaya data, dan menunjukkan cara memperluas pipeline IDP untuk berintegrasi dengan layanan analitik dan visualisasi untuk pemrosesan lebih lanjut.

Kami merekomendasikan untuk meninjau bagian keamanan dari Teks Amazon, Amazon Pahami, dan Amazon A2I dokumentasi dan mengikuti pedoman yang diberikan. Untuk mempelajari lebih lanjut tentang harga solusi, tinjau detail harga dari Teks Amazon, Amazon Comprehend, dan Amazon A2I.

Tentang Penulis

Chinmayee Rane adalah Arsitek Solusi Spesialis AI/ML di Amazon Web Services. Dia bersemangat tentang matematika terapan dan pembelajaran mesin. Dia berfokus pada perancangan solusi pemrosesan dokumen cerdas untuk pelanggan AWS. Di luar pekerjaan, dia menikmati tarian salsa dan bachata.

Sonali Sahu memimpin tim Intelligent Document Processing AI/ML Solutions Architect di Amazon Web Services. Dia adalah seorang technophile yang bersemangat dan senang bekerja dengan pelanggan untuk memecahkan masalah kompleks menggunakan inovasi. Area fokus utamanya adalah kecerdasan buatan dan pembelajaran mesin untuk pemrosesan dokumen cerdas.

Tim Condello adalah Arsitek Solusi Spesialis AI/ML Senior di Amazon Web Services. Fokusnya adalah pemrosesan bahasa alami dan visi komputer. Tim senang menerima ide pelanggan dan mengubahnya menjadi solusi yang terukur.

Stempel Waktu: November 3, 2022November 4, 2022

Stempel Waktu: April 3, 2024

Pemrosesan dokumen cerdas dengan layanan AWS AI di industri asuransi: Bagian 1

Diterbitkan Ulang Oleh Plato

Ikhtisar solusi

Prasyarat

Fase pengambilan data

Fase klasifikasi

Fase ekstraksi

Ekstrak data dari formulir klaim CMS-1500

Ekstrak data dari dokumen ID

Ekstrak data dari faktur dan tanda terima

Kesimpulan

Tentang Penulis

Lebih dari Pembelajaran Mesin AWS

Menciptakan kembali pengalaman data: Gunakan AI generatif dan arsitektur data modern untuk membuka wawasan | Layanan Web Amazon

“ID + Selfie” – Meningkatkan verifikasi identitas digital menggunakan AWS

Amazon Rekognition memperkenalkan Acara Video Streaming untuk memberikan peringatan real-time pada streaming video langsung

Memperkenalkan Amazon CodeWhisperer, pendamping pengkodean yang didukung ML

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun