پردازش هوشمند اسناد با خدمات AWS AI در صنعت بیمه: قسمت 1

بازنشر افلاطون

دنبال: 0

هدف از پردازش هوشمند اسناد (IDP) کمک به سازمان شما برای تصمیم گیری سریعتر و دقیق تر با استفاده از هوش مصنوعی برای پردازش مدارک شما است. این مجموعه دو قسمتی فناوری‌های هوش مصنوعی AWS را که شرکت‌های بیمه می‌توانند برای سرعت بخشیدن به فرآیندهای تجاری خود استفاده کنند، برجسته می‌کند. این فناوری‌های هوش مصنوعی می‌توانند در موارد استفاده از بیمه مانند ادعاها، تعهدنامه، مکاتبات مشتری، قراردادها یا رسیدگی به حل اختلافات استفاده شوند. این مجموعه بر روی یک مورد استفاده پردازش خسارت در صنعت بیمه تمرکز دارد. برای اطلاعات بیشتر در مورد مفاهیم اساسی راه حل AWS IDP، به موارد زیر مراجعه کنید دو بخش سری.

پردازش ادعاها شامل چندین نقطه بازرسی در یک گردش کاری است که برای بررسی، تأیید صحت و تعیین مسئولیت مالی صحیح برای رسیدگی به یک ادعا مورد نیاز است. شرکت های بیمه قبل از رسیدگی به مطالبات از این پست های بازرسی برای دریافت خسارت می گذرند. اگر ادعایی با موفقیت از تمام این ایست های بازرسی بدون مشکل عبور کند، شرکت بیمه آن را تایید می کند و هرگونه پرداخت را پردازش می کند. با این حال، آنها ممکن است برای قضاوت در مورد یک ادعا به اطلاعات پشتیبانی اضافی نیاز داشته باشند. این فرآیند پردازش ادعاها اغلب دستی است و آن را گران، مستعد خطا و وقت گیر می کند. مشتریان بیمه می توانند این فرآیند را با استفاده از خدمات هوش مصنوعی AWS برای خودکارسازی خط لوله پردازش اسناد برای پردازش ادعاها خودکار کنند.

در این مجموعه دو قسمتی، ما شما را با نحوه خودکارسازی و پردازش هوشمندانه اسناد در مقیاس با استفاده از خدمات هوش مصنوعی AWS برای پرونده استفاده از رسیدگی به دعاوی بیمه آشنا می‌کنیم.

پردازش هوشمند اسناد با خدمات AWS AI و Analytics در صنعت بیمه

بررسی اجمالی راه حل

نمودار زیر نشان دهنده هر مرحله ای است که معمولاً در خط لوله IDP می بینیم. ما از طریق هر یک از این مراحل و نحوه اتصال آنها به مراحل مربوط به فرآیند درخواست ادعا، از زمان ارسال درخواست تا بررسی و بستن برنامه، آشنا می شویم. در این پست به جزئیات فنی مراحل جمع‌آوری، طبقه‌بندی و استخراج داده‌ها می‌پردازیم. که در قسمت 2، ما مرحله استخراج سند را گسترش می دهیم و به غنی سازی، بررسی و تأیید اسناد ادامه می دهیم و راه حل را برای ارائه تجزیه و تحلیل و تجسم برای یک مورد استفاده از کلاهبرداری از ادعاها گسترش می دهیم.

نمودار معماری زیر خدمات مختلف AWS مورد استفاده در طول فازهای خط لوله IDP را با توجه به مراحل مختلف برنامه پردازش ادعا نشان می دهد.

نمودار معماری IDP

راه حل از خدمات کلیدی زیر استفاده می کند:

متن آمازون یک سرویس یادگیری ماشینی (ML) است که به طور خودکار متن، دست خط و داده ها را از اسناد اسکن شده استخراج می کند. برای شناسایی، درک و استخراج داده ها از فرم ها و جداول فراتر از تشخیص ساده کاراکتر نوری (OCR) است. متن آمازون از ML برای خواندن و پردازش هر نوع سند، استخراج دقیق متن، دست خط، جداول و سایر داده ها بدون هیچ تلاش دستی استفاده می کند.
درک آمازون یک سرویس پردازش زبان طبیعی (NLP) است که از ML برای استخراج بینش از متن استفاده می کند. Amazon Comprehend می تواند موجودیت هایی مانند شخص، مکان، تاریخ، کمیت و موارد دیگر را شناسایی کند. همچنین می‌تواند زبان غالب، اطلاعات اطلاعات شناسایی شخصی (PII) را شناسایی کند و اسناد را در کلاس مربوطه طبقه‌بندی کند.
هوش مصنوعی آمازون افزوده شده است (Amazon A2I) یک سرویس ML است که ساخت جریان های کاری مورد نیاز برای بررسی انسانی را آسان می کند. Amazon A2I بررسی انسانی را برای همه توسعه‌دهندگان به ارمغان می‌آورد و کارهای سنگین غیرمتمایز مرتبط با ساختن سیستم‌های بازبینی انسانی یا مدیریت تعداد زیادی از بازبین‌های انسانی را حذف می‌کند. Amazon A2I هر دو را با هم ادغام می کند متن آمازون و درک آمازون برای ارائه توانایی معرفی بررسی یا اعتبارسنجی انسانی در گردش کار IDP.

پیش نیازها

در بخش‌های بعدی، خدمات مختلف مربوط به سه فاز اول معماری، یعنی مراحل جمع‌آوری، طبقه‌بندی و استخراج داده‌ها را مرور می‌کنیم.

به ما مراجعه کنید مخزن GitHub برای نمونه کد کامل به همراه نمونه سند در بسته پردازش ادعاها.

مرحله جمع آوری داده ها

ادعاها و اسناد پشتیبان آن می توانند از طریق کانال های مختلفی مانند فکس، ایمیل، پورتال مدیریت و غیره ارائه شوند. شما می توانید این اسناد را در یک فضای ذخیره سازی بسیار مقیاس پذیر و بادوام ذخیره کنید سرویس ذخیره سازی ساده آمازون (Amazon S3). این اسناد می توانند انواع مختلفی داشته باشند، مانند PDF، JPEG، PNG، TIFF و غیره. اسناد می‌توانند در قالب‌ها و طرح‌بندی‌های مختلفی ارائه شوند و می‌توانند از کانال‌های مختلف به فروشگاه داده بیایند.

مرحله طبقه بندی

در مرحله طبقه‌بندی اسناد، می‌توانیم Amazon Comprehend را با Amazon Txtract ترکیب کنیم تا متن را به متن سند تبدیل کنیم تا اسنادی را که در مرحله جمع‌آوری داده ذخیره می‌شوند طبقه‌بندی کنیم. سپس می‌توانیم از طبقه‌بندی سفارشی در Amazon Comprehend برای سازماندهی اسناد در کلاس‌هایی که در بسته پردازش ادعاها تعریف کرده‌ایم استفاده کنیم. طبقه بندی سفارشی همچنین برای خودکار کردن فرآیند تأیید سند و شناسایی هرگونه اسناد مفقود شده از بسته مفید است. همانطور که در نمودار معماری نشان داده شده است، در طبقه بندی سفارشی دو مرحله وجود دارد:

متن را با استفاده از Amazon Txtract از تمام اسناد موجود در ذخیره سازی داده استخراج کنید تا داده های آموزشی برای طبقه بندی کننده سفارشی آماده شود.
آموزش یک مدل طبقه بندی سفارشی آمازون Comprehend (که به آن a سند طبقه بندی) برای تشخیص طبقات مورد علاقه بر اساس محتوای متن.

طبقه بندی اسناد بسته خسارت بیمه

پس از آموزش مدل طبقه‌بندی سفارشی Amazon Comprehend، می‌توانیم از نقطه پایانی بلادرنگ برای طبقه‌بندی اسناد استفاده کنیم. Amazon Comprehend تمام کلاس‌های اسناد را با امتیاز اطمینان مرتبط با هر کلاس در آرایه‌ای از جفت‌های کلید-مقدار برمی‌گرداند (Doc_name - Confidence_score). توصیه می‌کنیم کد نمونه طبقه‌بندی اسناد دقیق را مرور کنید GitHub.

فاز استخراج

در مرحله استخراج، با استفاده از Amazon Textract و Amazon Comprehend داده ها را از اسناد استخراج می کنیم. برای این پست، از نمونه اسناد زیر در بسته رسیدگی به خسارت استفاده کنید: فرم درخواست مرکز خدمات مدیکر و مدیکر (CMS) - 1500، گواهینامه رانندگی و شناسه بیمه، و فاکتور.

داده ها را از فرم ادعای CMS-1500 استخراج کنید

فرم CMS-1500 فرم استاندارد ادعایی است که توسط یک ارائه دهنده یا تامین کننده غیر سازمانی برای صدور صورتحساب به شرکت های حامل مدیکر استفاده می شود.

پردازش دقیق فرم CMS-1500 بسیار مهم است، در غیر این صورت می تواند روند ادعاها را کند کند یا پرداخت توسط شرکت مخابراتی را به تاخیر بیندازد. با متن آمازون AnalyzeDocument API، ما می‌توانیم فرآیند استخراج را با دقت بالاتری برای استخراج متن از اسناد به منظور درک اطلاعات بیشتر در فرم ادعا، تسریع کنیم. سند زیر نمونه فرم درخواست CMS-1500 است.

فرم درخواست CMS1500

ما اکنون از AnalyzeDocument API برای استخراج دو FeatureTypes, FORMS و TABLES، از سند:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

نتایج زیر برای خوانایی بهتر کوتاه شده است. برای اطلاعات بیشتر، ما را ببینید مخزن GitHub.

La FORMS استخراج به عنوان جفت کلید-مقدار شناسایی می شود.

La TABLES استخراج شامل سلول‌ها، سلول‌های ادغام‌شده و سرصفحه‌های ستون در یک جدول شناسایی‌شده در فرم ادعا است.

استخراج جداول از فرم CMS1500

استخراج اطلاعات از اسناد شناسایی

برای مدارک هویتی مانند شناسه بیمه که می‌تواند طرح‌بندی متفاوتی داشته باشد، می‌توانیم از متن آمازون استفاده کنیم AnalyzeDocument API. ما استفاده می کنیم FeatureType FORMS به عنوان پیکربندی برای AnalyzeDocument API برای استخراج جفت‌های کلید-مقدار از شناسه بیمه (نمونه زیر را ببینید):

کد زیر را اجرا کنید:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

همانطور که در تصویر زیر نشان داده شده است، جفت های کلید-مقدار را در آرایه نتیجه دریافت می کنیم.

برای اسناد شناسایی مانند گواهینامه رانندگی ایالات متحده یا پاسپورت ایالات متحده، Amazon Texttract پشتیبانی تخصصی را برای استخراج خودکار عبارات کلیدی بدون نیاز به قالب یا قالب ارائه می کند، برخلاف آنچه قبلاً برای مثال شناسه بیمه دیدیم. با AnalyzeID API، کسب‌وکارها می‌توانند به سرعت و با دقت اطلاعات را از اسناد شناسایی که دارای قالب‌ها یا قالب‌های مختلف هستند استخراج کنند. را AnalyzeID API دو دسته از انواع داده را برمی گرداند:

جفت‌های کلید-مقدار موجود در شناسه مانند تاریخ تولد، تاریخ صدور، شماره شناسه، کلاس و محدودیت‌ها
فیلدهای ضمنی در سند که ممکن است دارای کلیدهای صریح مرتبط با آنها نباشد، مانند نام، آدرس، و صادرکننده

ما از نمونه گواهینامه رانندگی ایالات متحده زیر از بسته رسیدگی به ادعاهای خود استفاده می کنیم.

کد زیر را اجرا کنید:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

تصویر زیر نتیجه ما را نشان می دهد.

از اسکرین شات نتایج، می توانید مشاهده کنید که کلیدهای خاصی ارائه شده است که در خود گواهینامه رانندگی وجود ندارد. مثلا، Veteran کلید یافت شده در مجوز نیست. با این حال، این یک مقدار کلید از پیش پر شده است که AnalyzeID به دلیل تفاوت های موجود در مجوزها بین ایالت ها، پشتیبانی می کند.

استخراج داده ها از فاکتورها و رسیدها

شبیه به AnalyzeID API، AnalyzeExpense API پشتیبانی تخصصی از فاکتورها و رسیدها را برای استخراج اطلاعات مرتبط مانند نام فروشنده، مجموع کل و مبالغ کل و موارد دیگر از هر قالبی از اسناد فاکتور فراهم می کند. برای استخراج به هیچ قالب یا پیکربندی نیاز ندارید. Amazon Textract از ML برای درک زمینه فاکتورهای مبهم و همچنین رسیدها استفاده می کند.

نمونه فاکتور بیمه درمانی در زیر آمده است.

نمونه فاکتور بیمه

ما با استفاده از AnalyzeExpense API برای دیدن لیستی از فیلدهای استاندارد. فیلدهایی که به عنوان فیلدهای استاندارد شناخته نمی شوند، به عنوان دسته بندی می شوند OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

ما لیست زیر از فیلدها را به عنوان جفت کلید-مقدار (نگاه کنید به تصویر در سمت چپ) و کل ردیف از آیتم های خط خریداری شده (نگاه کنید به تصویر در سمت راست) در نتایج دریافت می کنیم.

پردازش هوشمند اسناد با خدمات هوش مصنوعی AWS در صنعت بیمه: قسمت 1 هوش داده پلاتو بلاک چین. جستجوی عمودی Ai.

نتیجه

در این پست، چالش‌های رایج در پردازش ادعاها و اینکه چگونه می‌توانیم از خدمات هوش مصنوعی AWS برای خودکارسازی خط لوله پردازش اسناد هوشمند برای قضاوت خودکار یک ادعا استفاده کنیم، نشان دادیم. ما دیدیم که چگونه با استفاده از طبقه‌بندی‌کننده سفارشی Amazon Comprehend، اسناد را به کلاس‌های اسناد مختلف طبقه‌بندی کنیم، و چگونه از Amazon Textract برای استخراج انواع اسناد بدون ساختار، نیمه ساختاریافته، ساختاریافته و تخصصی استفاده کنیم.

In قسمت 2، ما مرحله استخراج را با آمازون تکست گسترش می دهیم. ما همچنین از نهادهای از پیش تعریف شده Amazon Comprehend و نهادهای سفارشی برای غنی‌سازی داده‌ها استفاده می‌کنیم و نشان می‌دهیم که چگونه خط لوله IDP را برای ادغام با خدمات تجزیه و تحلیل و تجسم برای پردازش بیشتر گسترش دهیم.

توصیه می کنیم بخش های امنیتی را مرور کنید متن آمازون، آمازون درک، و آمازون A2I مستندات و پیروی از دستورالعمل های ارائه شده. برای کسب اطلاعات بیشتر در مورد قیمت راه حل، جزئیات قیمت گذاری را بررسی کنید متن آمازون، درک آمازونو آمازون A2I.

درباره نویسنده

چینمائی رین یک معمار راه حل های تخصصی AI/ML در خدمات وب آمازون است. او علاقه زیادی به ریاضیات کاربردی و یادگیری ماشین دارد. او بر روی طراحی راه حل های پردازش اسناد هوشمند برای مشتریان AWS تمرکز دارد. خارج از محل کار، او از رقص سالسا و باچاتا لذت می برد.

سونالی سهو تیم معمار راه حل های AI/ML پردازش اسناد هوشمند را در خدمات وب آمازون رهبری می کند. او یک فن دوست پرشور است و از کار با مشتریان برای حل مشکلات پیچیده با استفاده از نوآوری لذت می برد. حوزه اصلی تمرکز او هوش مصنوعی و یادگیری ماشین برای پردازش هوشمند اسناد است.

تیم کوندلو یک معمار ارشد راه حل های تخصصی AI/ML در خدمات وب آمازون است. تمرکز او پردازش زبان طبیعی و بینایی کامپیوتری است. تیم از گرفتن ایده های مشتری و تبدیل آنها به راه حل های مقیاس پذیر لذت می برد.

تمبر زمان: نوامبر 3، 2022نوامبر 4، 2022

تمبر زمان: ژوئیه 5، 2023

پردازش هوشمند اسناد با خدمات هوش مصنوعی AWS در صنعت بیمه: قسمت 1

بازنشر افلاطون

بررسی اجمالی راه حل

پیش نیازها

مرحله جمع آوری داده ها

مرحله طبقه بندی

فاز استخراج

داده ها را از فرم ادعای CMS-1500 استخراج کنید

استخراج اطلاعات از اسناد شناسایی

استخراج داده ها از فاکتورها و رسیدها

نتیجه

درباره نویسنده

بیشتر از آموزش ماشین AWS

بینایی کامپیوتر با استفاده از مجموعه داده های مصنوعی با برچسب های سفارشی شناسایی آمازون و Dassault Systèmes 3DEXCITE

اعلام سازنده گفتگوی بصری برای آمازون لکس

پیش‌بینی ریزش با استفاده از چندوجهی بودن متن و ویژگی‌های جدولی با Amazon SageMaker Jumpstart

تصمیم گیری هوشمند را با Amazon SageMaker Canvas و Amazon QuickSight فعال کنید

با استفاده از Amazon Bedrock اسکریپت های IaC برنامه های کاربردی سفارشی و سازگار برای AWS Landing Zone ایجاد کنید | خدمات وب آمازون

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب