هدف از پردازش هوشمند اسناد (IDP) کمک به سازمان شما برای تصمیم گیری سریعتر و دقیق تر با استفاده از هوش مصنوعی برای پردازش مدارک شما است. این مجموعه دو قسمتی فناوریهای هوش مصنوعی AWS را که شرکتهای بیمه میتوانند برای سرعت بخشیدن به فرآیندهای تجاری خود استفاده کنند، برجسته میکند. این فناوریهای هوش مصنوعی میتوانند در موارد استفاده از بیمه مانند ادعاها، تعهدنامه، مکاتبات مشتری، قراردادها یا رسیدگی به حل اختلافات استفاده شوند. این مجموعه بر روی یک مورد استفاده پردازش خسارت در صنعت بیمه تمرکز دارد. برای اطلاعات بیشتر در مورد مفاهیم اساسی راه حل AWS IDP، به موارد زیر مراجعه کنید دو بخش سری.
پردازش ادعاها شامل چندین نقطه بازرسی در یک گردش کاری است که برای بررسی، تأیید صحت و تعیین مسئولیت مالی صحیح برای رسیدگی به یک ادعا مورد نیاز است. شرکت های بیمه قبل از رسیدگی به مطالبات از این پست های بازرسی برای دریافت خسارت می گذرند. اگر ادعایی با موفقیت از تمام این ایست های بازرسی بدون مشکل عبور کند، شرکت بیمه آن را تایید می کند و هرگونه پرداخت را پردازش می کند. با این حال، آنها ممکن است برای قضاوت در مورد یک ادعا به اطلاعات پشتیبانی اضافی نیاز داشته باشند. این فرآیند پردازش ادعاها اغلب دستی است و آن را گران، مستعد خطا و وقت گیر می کند. مشتریان بیمه می توانند این فرآیند را با استفاده از خدمات هوش مصنوعی AWS برای خودکارسازی خط لوله پردازش اسناد برای پردازش ادعاها خودکار کنند.
در این مجموعه دو قسمتی، ما شما را با نحوه خودکارسازی و پردازش هوشمندانه اسناد در مقیاس با استفاده از خدمات هوش مصنوعی AWS برای پرونده استفاده از رسیدگی به دعاوی بیمه آشنا میکنیم.
پردازش هوشمند اسناد با خدمات AWS AI و Analytics در صنعت بیمه |
بررسی اجمالی راه حل
نمودار زیر نشان دهنده هر مرحله ای است که معمولاً در خط لوله IDP می بینیم. ما از طریق هر یک از این مراحل و نحوه اتصال آنها به مراحل مربوط به فرآیند درخواست ادعا، از زمان ارسال درخواست تا بررسی و بستن برنامه، آشنا می شویم. در این پست به جزئیات فنی مراحل جمعآوری، طبقهبندی و استخراج دادهها میپردازیم. که در قسمت 2، ما مرحله استخراج سند را گسترش می دهیم و به غنی سازی، بررسی و تأیید اسناد ادامه می دهیم و راه حل را برای ارائه تجزیه و تحلیل و تجسم برای یک مورد استفاده از کلاهبرداری از ادعاها گسترش می دهیم.
نمودار معماری زیر خدمات مختلف AWS مورد استفاده در طول فازهای خط لوله IDP را با توجه به مراحل مختلف برنامه پردازش ادعا نشان می دهد.
راه حل از خدمات کلیدی زیر استفاده می کند:
- متن آمازون یک سرویس یادگیری ماشینی (ML) است که به طور خودکار متن، دست خط و داده ها را از اسناد اسکن شده استخراج می کند. برای شناسایی، درک و استخراج داده ها از فرم ها و جداول فراتر از تشخیص ساده کاراکتر نوری (OCR) است. متن آمازون از ML برای خواندن و پردازش هر نوع سند، استخراج دقیق متن، دست خط، جداول و سایر داده ها بدون هیچ تلاش دستی استفاده می کند.
- درک آمازون یک سرویس پردازش زبان طبیعی (NLP) است که از ML برای استخراج بینش از متن استفاده می کند. Amazon Comprehend می تواند موجودیت هایی مانند شخص، مکان، تاریخ، کمیت و موارد دیگر را شناسایی کند. همچنین میتواند زبان غالب، اطلاعات اطلاعات شناسایی شخصی (PII) را شناسایی کند و اسناد را در کلاس مربوطه طبقهبندی کند.
- هوش مصنوعی آمازون افزوده شده است (Amazon A2I) یک سرویس ML است که ساخت جریان های کاری مورد نیاز برای بررسی انسانی را آسان می کند. Amazon A2I بررسی انسانی را برای همه توسعهدهندگان به ارمغان میآورد و کارهای سنگین غیرمتمایز مرتبط با ساختن سیستمهای بازبینی انسانی یا مدیریت تعداد زیادی از بازبینهای انسانی را حذف میکند. Amazon A2I هر دو را با هم ادغام می کند متن آمازون و درک آمازون برای ارائه توانایی معرفی بررسی یا اعتبارسنجی انسانی در گردش کار IDP.
پیش نیازها
در بخشهای بعدی، خدمات مختلف مربوط به سه فاز اول معماری، یعنی مراحل جمعآوری، طبقهبندی و استخراج دادهها را مرور میکنیم.
به ما مراجعه کنید مخزن GitHub برای نمونه کد کامل به همراه نمونه سند در بسته پردازش ادعاها.
مرحله جمع آوری داده ها
ادعاها و اسناد پشتیبان آن می توانند از طریق کانال های مختلفی مانند فکس، ایمیل، پورتال مدیریت و غیره ارائه شوند. شما می توانید این اسناد را در یک فضای ذخیره سازی بسیار مقیاس پذیر و بادوام ذخیره کنید سرویس ذخیره سازی ساده آمازون (Amazon S3). این اسناد می توانند انواع مختلفی داشته باشند، مانند PDF، JPEG، PNG، TIFF و غیره. اسناد میتوانند در قالبها و طرحبندیهای مختلفی ارائه شوند و میتوانند از کانالهای مختلف به فروشگاه داده بیایند.
مرحله طبقه بندی
در مرحله طبقهبندی اسناد، میتوانیم Amazon Comprehend را با Amazon Txtract ترکیب کنیم تا متن را به متن سند تبدیل کنیم تا اسنادی را که در مرحله جمعآوری داده ذخیره میشوند طبقهبندی کنیم. سپس میتوانیم از طبقهبندی سفارشی در Amazon Comprehend برای سازماندهی اسناد در کلاسهایی که در بسته پردازش ادعاها تعریف کردهایم استفاده کنیم. طبقه بندی سفارشی همچنین برای خودکار کردن فرآیند تأیید سند و شناسایی هرگونه اسناد مفقود شده از بسته مفید است. همانطور که در نمودار معماری نشان داده شده است، در طبقه بندی سفارشی دو مرحله وجود دارد:
- متن را با استفاده از Amazon Txtract از تمام اسناد موجود در ذخیره سازی داده استخراج کنید تا داده های آموزشی برای طبقه بندی کننده سفارشی آماده شود.
- آموزش یک مدل طبقه بندی سفارشی آمازون Comprehend (که به آن a سند طبقه بندی) برای تشخیص طبقات مورد علاقه بر اساس محتوای متن.
پس از آموزش مدل طبقهبندی سفارشی Amazon Comprehend، میتوانیم از نقطه پایانی بلادرنگ برای طبقهبندی اسناد استفاده کنیم. Amazon Comprehend تمام کلاسهای اسناد را با امتیاز اطمینان مرتبط با هر کلاس در آرایهای از جفتهای کلید-مقدار برمیگرداند (Doc_name
- Confidence_score
). توصیه میکنیم کد نمونه طبقهبندی اسناد دقیق را مرور کنید GitHub.
فاز استخراج
در مرحله استخراج، با استفاده از Amazon Textract و Amazon Comprehend داده ها را از اسناد استخراج می کنیم. برای این پست، از نمونه اسناد زیر در بسته رسیدگی به خسارت استفاده کنید: فرم درخواست مرکز خدمات مدیکر و مدیکر (CMS) - 1500، گواهینامه رانندگی و شناسه بیمه، و فاکتور.
داده ها را از فرم ادعای CMS-1500 استخراج کنید
فرم CMS-1500 فرم استاندارد ادعایی است که توسط یک ارائه دهنده یا تامین کننده غیر سازمانی برای صدور صورتحساب به شرکت های حامل مدیکر استفاده می شود.
پردازش دقیق فرم CMS-1500 بسیار مهم است، در غیر این صورت می تواند روند ادعاها را کند کند یا پرداخت توسط شرکت مخابراتی را به تاخیر بیندازد. با متن آمازون AnalyzeDocument
API، ما میتوانیم فرآیند استخراج را با دقت بالاتری برای استخراج متن از اسناد به منظور درک اطلاعات بیشتر در فرم ادعا، تسریع کنیم. سند زیر نمونه فرم درخواست CMS-1500 است.
ما اکنون از AnalyzeDocument
API برای استخراج دو FeatureTypes
, FORMS
و TABLES
، از سند:
نتایج زیر برای خوانایی بهتر کوتاه شده است. برای اطلاعات بیشتر، ما را ببینید مخزن GitHub.
La FORMS
استخراج به عنوان جفت کلید-مقدار شناسایی می شود.
La TABLES
استخراج شامل سلولها، سلولهای ادغامشده و سرصفحههای ستون در یک جدول شناساییشده در فرم ادعا است.
استخراج اطلاعات از اسناد شناسایی
برای مدارک هویتی مانند شناسه بیمه که میتواند طرحبندی متفاوتی داشته باشد، میتوانیم از متن آمازون استفاده کنیم AnalyzeDocument
API. ما استفاده می کنیم FeatureType
FORMS
به عنوان پیکربندی برای AnalyzeDocument
API برای استخراج جفتهای کلید-مقدار از شناسه بیمه (نمونه زیر را ببینید):
کد زیر را اجرا کنید:
همانطور که در تصویر زیر نشان داده شده است، جفت های کلید-مقدار را در آرایه نتیجه دریافت می کنیم.
برای اسناد شناسایی مانند گواهینامه رانندگی ایالات متحده یا پاسپورت ایالات متحده، Amazon Texttract پشتیبانی تخصصی را برای استخراج خودکار عبارات کلیدی بدون نیاز به قالب یا قالب ارائه می کند، برخلاف آنچه قبلاً برای مثال شناسه بیمه دیدیم. با AnalyzeID
API، کسبوکارها میتوانند به سرعت و با دقت اطلاعات را از اسناد شناسایی که دارای قالبها یا قالبهای مختلف هستند استخراج کنند. را AnalyzeID
API دو دسته از انواع داده را برمی گرداند:
- جفتهای کلید-مقدار موجود در شناسه مانند تاریخ تولد، تاریخ صدور، شماره شناسه، کلاس و محدودیتها
- فیلدهای ضمنی در سند که ممکن است دارای کلیدهای صریح مرتبط با آنها نباشد، مانند نام، آدرس، و صادرکننده
ما از نمونه گواهینامه رانندگی ایالات متحده زیر از بسته رسیدگی به ادعاهای خود استفاده می کنیم.
کد زیر را اجرا کنید:
تصویر زیر نتیجه ما را نشان می دهد.
از اسکرین شات نتایج، می توانید مشاهده کنید که کلیدهای خاصی ارائه شده است که در خود گواهینامه رانندگی وجود ندارد. مثلا، Veteran
کلید یافت شده در مجوز نیست. با این حال، این یک مقدار کلید از پیش پر شده است که AnalyzeID
به دلیل تفاوت های موجود در مجوزها بین ایالت ها، پشتیبانی می کند.
استخراج داده ها از فاکتورها و رسیدها
شبیه به AnalyzeID
API، AnalyzeExpense
API پشتیبانی تخصصی از فاکتورها و رسیدها را برای استخراج اطلاعات مرتبط مانند نام فروشنده، مجموع کل و مبالغ کل و موارد دیگر از هر قالبی از اسناد فاکتور فراهم می کند. برای استخراج به هیچ قالب یا پیکربندی نیاز ندارید. Amazon Textract از ML برای درک زمینه فاکتورهای مبهم و همچنین رسیدها استفاده می کند.
نمونه فاکتور بیمه درمانی در زیر آمده است.
ما با استفاده از AnalyzeExpense
API برای دیدن لیستی از فیلدهای استاندارد. فیلدهایی که به عنوان فیلدهای استاندارد شناخته نمی شوند، به عنوان دسته بندی می شوند OTHER
:
ما لیست زیر از فیلدها را به عنوان جفت کلید-مقدار (نگاه کنید به تصویر در سمت چپ) و کل ردیف از آیتم های خط خریداری شده (نگاه کنید به تصویر در سمت راست) در نتایج دریافت می کنیم.
نتیجه
در این پست، چالشهای رایج در پردازش ادعاها و اینکه چگونه میتوانیم از خدمات هوش مصنوعی AWS برای خودکارسازی خط لوله پردازش اسناد هوشمند برای قضاوت خودکار یک ادعا استفاده کنیم، نشان دادیم. ما دیدیم که چگونه با استفاده از طبقهبندیکننده سفارشی Amazon Comprehend، اسناد را به کلاسهای اسناد مختلف طبقهبندی کنیم، و چگونه از Amazon Textract برای استخراج انواع اسناد بدون ساختار، نیمه ساختاریافته، ساختاریافته و تخصصی استفاده کنیم.
In قسمت 2، ما مرحله استخراج را با آمازون تکست گسترش می دهیم. ما همچنین از نهادهای از پیش تعریف شده Amazon Comprehend و نهادهای سفارشی برای غنیسازی دادهها استفاده میکنیم و نشان میدهیم که چگونه خط لوله IDP را برای ادغام با خدمات تجزیه و تحلیل و تجسم برای پردازش بیشتر گسترش دهیم.
توصیه می کنیم بخش های امنیتی را مرور کنید متن آمازون، آمازون درک، و آمازون A2I مستندات و پیروی از دستورالعمل های ارائه شده. برای کسب اطلاعات بیشتر در مورد قیمت راه حل، جزئیات قیمت گذاری را بررسی کنید متن آمازون، درک آمازونو آمازون A2I.
درباره نویسنده
چینمائی رین یک معمار راه حل های تخصصی AI/ML در خدمات وب آمازون است. او علاقه زیادی به ریاضیات کاربردی و یادگیری ماشین دارد. او بر روی طراحی راه حل های پردازش اسناد هوشمند برای مشتریان AWS تمرکز دارد. خارج از محل کار، او از رقص سالسا و باچاتا لذت می برد.
سونالی سهو تیم معمار راه حل های AI/ML پردازش اسناد هوشمند را در خدمات وب آمازون رهبری می کند. او یک فن دوست پرشور است و از کار با مشتریان برای حل مشکلات پیچیده با استفاده از نوآوری لذت می برد. حوزه اصلی تمرکز او هوش مصنوعی و یادگیری ماشین برای پردازش هوشمند اسناد است.
تیم کوندلو یک معمار ارشد راه حل های تخصصی AI/ML در خدمات وب آمازون است. تمرکز او پردازش زبان طبیعی و بینایی کامپیوتری است. تیم از گرفتن ایده های مشتری و تبدیل آنها به راه حل های مقیاس پذیر لذت می برد.
- AI
- آی هنر
- مولد هنر ai
- ربات ai
- درک آمازون
- آمازون Comprehend Medical
- آموزش ماشین آمازون
- متن آمازون
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- آموزش ماشین AWS
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- متوسط (200)
- فراگیری ماشین
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- زفیرنت