معالجة المستندات بذكاء باستخدام خدمات AWS AI في صناعة التأمين: الجزء 1

أعاد نشره أفلاطون

المتابعون: 0

الهدف من المعالجة الذكية للوثائق (IDP) هو مساعدة مؤسستك على اتخاذ قرارات أسرع وأكثر دقة من خلال تطبيق الذكاء الاصطناعي لمعالجة أوراقك. تسلط هذه السلسلة المكونة من جزأين الضوء على تقنيات AWS AI التي يمكن لشركات التأمين استخدامها لتسريع عمليات أعمالها. يمكن استخدام تقنيات الذكاء الاصطناعي هذه في حالات استخدام التأمين مثل المطالبات أو الاكتتاب أو مراسلات العملاء أو العقود أو التعامل مع حل النزاعات. تركز هذه السلسلة على حالة استخدام معالجة المطالبات في صناعة التأمين ؛ لمزيد من المعلومات حول المفاهيم الأساسية لحل AWS IDP ، يرجى الرجوع إلى ما يلي سلسلة من جزأين.

تتكون معالجة المطالبات من نقاط فحص متعددة في سير عمل مطلوب للمراجعة والتحقق من صحتها وتحديد المسؤولية المالية الصحيحة للفصل في مطالبة. تمر شركات التأمين عبر نقاط التفتيش هذه للمطالبات قبل الفصل في المطالبات. إذا مرت مطالبة بنجاح عبر جميع نقاط التفتيش هذه دون مشاكل ، فإن شركة التأمين توافق عليها وتعالج أي مدفوعات. ومع ذلك ، قد يحتاجون إلى معلومات داعمة إضافية للفصل في المطالبة. غالبًا ما تكون عملية معالجة المطالبات هذه يدوية ، مما يجعلها باهظة الثمن وعرضة للخطأ وتستغرق وقتًا طويلاً. يمكن لعملاء التأمين أتمتة هذه العملية باستخدام خدمات AWS AI لأتمتة خط معالجة المستندات لمعالجة المطالبات.

في هذه السلسلة المكونة من جزأين ، نطلعك على كيفية أتمتة المستندات ومعالجتها بذكاء على نطاق واسع باستخدام خدمات AWS AI لحالة استخدام معالجة مطالبات التأمين.

معالجة المستندات بذكاء باستخدام خدمات AWS AI والتحليلات في صناعة التأمين

حل نظرة عامة

يمثل الرسم البياني التالي كل مرحلة نراها عادةً في خط أنابيب IDP. نسير عبر كل مرحلة من هذه المراحل وكيفية ارتباطها بالخطوات المتضمنة في عملية تقديم المطالبات ، بدءًا من وقت تقديم الطلب وحتى التحقيق وإغلاق التطبيق. في هذا المنشور ، نغطي التفاصيل الفنية لمراحل التقاط البيانات وتصنيفها واستخراجها. في جزء 2، نقوم بتوسيع مرحلة استخراج المستندات ونستمر في توثيق الإثراء والمراجعة والتحقق وتوسيع الحل لتوفير التحليلات والتصورات لحالة استخدام الاحتيال في المطالبات.

يُظهر مخطط البنية التالي خدمات AWS المختلفة المستخدمة خلال مراحل خط أنابيب IDP وفقًا لمراحل مختلفة من تطبيق معالجة المطالبات.

مخطط معمارية IDP

يستخدم الحل الخدمات الرئيسية التالية:

أمازون تيكستراك هي خدمة تعلم آلي (ML) تستخرج النص والكتابة اليدوية والبيانات تلقائيًا من المستندات الممسوحة ضوئيًا. يتجاوز التعرف الضوئي على الحروف (OCR) للتعرف على البيانات وفهمها واستخراجها من النماذج والجداول. تستخدم Amazon Textract تعلم الآلة لقراءة أي نوع من المستندات ومعالجتها ، واستخراج النص والكتابة اليدوية والجداول والبيانات الأخرى بدقة دون بذل أي جهد يدوي.
فهم الأمازون هي خدمة معالجة اللغة الطبيعية (NLP) التي تستخدم ML لاستخراج الرؤى من النص. يمكن لـ Amazon Comprehend اكتشاف الكيانات مثل الشخص والموقع والتاريخ والكمية والمزيد. يمكنه أيضًا اكتشاف اللغة السائدة ومعلومات التعريف الشخصية (PII) وتصنيف المستندات في فئتها ذات الصلة.
أمازون المعزز بالذكاء الاصطناعي (Amazon A2I) هي خدمة تعلّم آلي تسهّل إنشاء مهام سير العمل المطلوبة للمراجعة البشرية. تجلب Amazon A2I المراجعة البشرية لجميع المطورين ، وتزيل الرفع الثقيل غير المتمايز المرتبط ببناء أنظمة المراجعة البشرية أو إدارة أعداد كبيرة من المراجعين البشريين. يتكامل Amazon A2I مع كليهما أمازون تيكستراك و فهم الأمازون لتوفير القدرة على تقديم المراجعة البشرية أو التحقق من صحة داخل سير عمل IDP.

المتطلبات الأساسية المسبقة

في الأقسام التالية ، نتصفح الخدمات المختلفة المتعلقة بالمراحل الثلاث الأولى من العمارة ، أي مراحل التقاط البيانات وتصنيفها واستخراجها.

الرجوع إلى موقعنا مستودع جيثب للحصول على عينات التعليمات البرمجية الكاملة مع عينات المستندات في حزمة معالجة المطالبات.

مرحلة التقاط البيانات

يمكن أن تأتي المطالبات ووثائقها الداعمة من خلال قنوات مختلفة ، مثل الفاكس والبريد الإلكتروني وبوابة الإدارة والمزيد. يمكنك تخزين هذه المستندات في مساحة تخزين عالية التحمل وقابلة للتطوير مثل خدمة تخزين أمازون البسيطة (أمازون S3). يمكن أن تكون هذه المستندات من أنواع مختلفة ، مثل PDF و JPEG و PNG و TIFF والمزيد. يمكن أن تأتي المستندات بتنسيقات وتخطيطات مختلفة ، ويمكن أن تأتي من قنوات مختلفة إلى مخزن البيانات.

مرحلة التصنيف

في مرحلة تصنيف المستندات ، يمكننا دمج Amazon Comprehend مع Amazon Textract لتحويل النص إلى سياق المستند لتصنيف المستندات المخزنة في مرحلة التقاط البيانات. يمكننا بعد ذلك استخدام التصنيف المخصص في Amazon Comprehend لتنظيم المستندات في فئات حددناها في حزمة معالجة المطالبات. التصنيف المخصص مفيد أيضًا في أتمتة عملية التحقق من المستندات وتحديد أي مستندات مفقودة من الحزمة. هناك خطوتان في التصنيف المخصص ، كما هو موضح في الرسم التخطيطي للهندسة المعمارية:

استخرج النص باستخدام Amazon Textract من جميع المستندات في تخزين البيانات لإعداد بيانات التدريب للمصنف المخصص.
تدريب نموذج تصنيف مخصص من Amazon Comprehend (يسمى أيضًا ملف وثيقة صنف) للتعرف على فئات الاهتمام بناءً على محتوى النص.

تصنيف المستندات لحزمة مطالبات التأمين

بعد تدريب نموذج التصنيف المخصص لخدمة Amazon Comprehend ، يمكننا استخدام نقطة النهاية في الوقت الفعلي لتصنيف المستندات. يُرجع Amazon Comprehend جميع فئات المستندات بدرجة ثقة مرتبطة بكل فئة في مجموعة من أزواج القيمة الرئيسية (Doc_name - Confidence_score). نوصي بالاطلاع على نموذج كود تصنيف الوثيقة التفصيلي على GitHub جيثب:.

مرحلة الاستخراج

في مرحلة الاستخراج ، نقوم باستخراج البيانات من المستندات باستخدام Amazon Textract و Amazon Comprehend. بالنسبة إلى هذا المنشور ، استخدم المستندات النموذجية التالية في حزمة معالجة المطالبات: نموذج مطالبة مركز خدمات Medicaid and Medicare (CMS) -1500 ورخصة القيادة ومعرف التأمين والفاتورة.

استخراج البيانات من نموذج مطالبة CMS-1500

نموذج CMS-1500 هو نموذج المطالبة القياسي الذي يستخدمه مزود أو مورد غير مؤسسي لفواتير شركات الرعاية الطبية.

من المهم معالجة نموذج CMS-1500 بدقة ، وإلا فقد يؤدي ذلك إلى إبطاء عملية المطالبات أو تأخير الدفع من قِبل شركة النقل. مع Amazon Textract AnalyzeDocument API ، يمكننا تسريع عملية الاستخراج بدقة أعلى لاستخراج النص من المستندات من أجل فهم المزيد من الأفكار داخل نموذج المطالبة. فيما يلي نموذج لمستند مطالبة CMS-1500.

نموذج مطالبة CMS1500

نحن الآن نستخدم ملف AnalyzeDocument API لاستخراج اثنين FeatureTypes, FORMS و TABLES، من المستند:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

تم تقصير النتائج التالية من أجل قراءة أفضل. لمزيد من المعلومات التفصيلية ، راجع موقعنا GitHub الريبو.

• FORMS يتم تحديد الاستخراج على أنه أزواج ذات قيمة رئيسية.

• TABLES يحتوي الاستخراج على خلايا وخلايا مدمجة ورؤوس أعمدة داخل جدول تم اكتشافه في نموذج المطالبة.

استخلاص الجداول من نموذج CMS1500

استخراج البيانات من وثائق الهوية

بالنسبة لوثائق الهوية مثل معرف التأمين ، والتي يمكن أن يكون لها تخطيطات مختلفة ، يمكننا استخدام Amazon Textract AnalyzeDocument API. نحن نستخدم ال FeatureType FORMS كتكوين لـ AnalyzeDocument API لاستخراج أزواج القيمة الرئيسية من معرف التأمين (انظر النموذج التالي):

قم بتشغيل الكود التالي:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

نحصل على أزواج المفتاح والقيمة في مصفوفة النتائج ، كما هو موضح في لقطة الشاشة التالية.

بالنسبة لوثائق الهوية مثل رخصة القيادة الأمريكية أو جواز السفر الأمريكي ، توفر Amazon Textract دعمًا متخصصًا لاستخراج المصطلحات الأساسية تلقائيًا دون الحاجة إلى قوالب أو تنسيقات ، على عكس ما رأيناه سابقًا في مثال معرف التأمين. مع ال AnalyzeID API ، يمكن للشركات استخراج المعلومات بسرعة وبدقة من مستندات الهوية التي تحتوي على قوالب أو تنسيقات مختلفة. ال AnalyzeID تقوم API بإرجاع فئتين من أنواع البيانات:

تتوفر أزواج القيمة الرئيسية في المعرّف مثل تاريخ الميلاد وتاريخ الإصدار ورقم المعرّف والفئة والقيود
الحقول المضمنة في المستند التي قد لا تحتوي على مفاتيح صريحة مقترنة بها ، مثل الاسم والعنوان والمصدر

نستخدم نموذج رخصة القيادة الأمريكية التالي من حزمة معالجة المطالبات الخاصة بنا.

قم بتشغيل الكود التالي:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

تظهر لقطة الشاشة التالية نتيجتنا.

من لقطة شاشة النتائج ، يمكنك ملاحظة أنه تم تقديم مفاتيح معينة لم تكن موجودة في رخصة القيادة نفسها. فمثلا، Veteran ليس مفتاحًا موجودًا في الترخيص ؛ ومع ذلك ، فهي قيمة مفتاح مملوءة مسبقًا AnalyzeID يدعم ، بسبب الاختلافات الموجودة في التراخيص بين الدول.

استخراج البيانات من الفواتير والإيصالات

وعلى غرار AnalyzeID API ، و AnalyzeExpense يوفر API دعمًا متخصصًا للفواتير والإيصالات لاستخراج المعلومات ذات الصلة مثل اسم البائع والإجمالي الفرعي والمبالغ الإجمالية والمزيد من أي تنسيق لمستندات الفاتورة. لا تحتاج إلى أي قالب أو تكوين للاستخراج. تستخدم Amazon Textract التعلم الآلي لفهم سياق الفواتير والإيصالات الغامضة.

فيما يلي نموذج لفاتورة التأمين الطبي.

عينة من فاتورة التأمين

نستخدم AnalyzeExpense API لرؤية قائمة الحقول القياسية. الحقول التي لم يتم التعرف عليها كحقول قياسية يتم تصنيفها على أنها OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

نحصل على قائمة الحقول التالية كأزواج ذات قيمة مفتاح (انظر لقطة الشاشة على اليسار) والصف الكامل للعناصر الفردية المشتراة (انظر لقطة الشاشة على اليمين) في النتائج.

معالجة المستندات الذكية باستخدام خدمات AWS AI في صناعة التأمين: الجزء 1 PlatoBlockchain Data Intelligence. البحث العمودي. عاي.

وفي الختام

في هذا المنشور ، استعرضنا التحديات الشائعة في معالجة المطالبات ، وكيف يمكننا استخدام خدمات AWS AI لأتمتة خط أنابيب ذكي لمعالجة المستندات للفصل في مطالبة تلقائيًا. لقد رأينا كيفية تصنيف المستندات إلى فئات مستندات متنوعة باستخدام مصنف Amazon Comprehend المخصص ، وكيفية استخدام Amazon Textract لاستخراج أنواع المستندات غير المهيكلة وشبه المهيكلة والمنظمة والمتخصصة.

In جزء 2، نتوسع في مرحلة الاستخراج باستخدام Amazon Textract. نستخدم أيضًا كيانات Amazon Comprehend المحددة مسبقًا والكيانات المخصصة لإثراء البيانات وإظهار كيفية توسيع خط أنابيب IDP للتكامل مع خدمات التحليلات والتصور لمزيد من المعالجة.

نوصي بمراجعة أقسام الأمان الخاصة بـ أمازون تكستراكت ، Amazon Comprehend ، و أمازون A2I الوثائق واتباع الإرشادات المقدمة. لمعرفة المزيد حول تسعير الحل ، راجع تفاصيل التسعير الخاصة بـ أمازون تكستراكت ، فهم الأمازونو أمازون A2I.

حول المؤلف

تشينماي راني هو مهندس حلول متخصص في AI / ML في Amazon Web Services. إنها شغوفة بالرياضيات التطبيقية والتعلم الآلي. تركز على تصميم حلول معالجة المستندات الذكية لعملاء AWS. خارج العمل ، تستمتع برقص السالسا والباشاتا.

سونالي ساهو يقود فريق مهندس حلول الذكاء الاصطناعي / ML في معالجة المستندات الذكية في Amazon Web Services. إنها شغوفة بالتكنولوجيا وتستمتع بالعمل مع العملاء لحل المشكلات المعقدة باستخدام الابتكار. مجال تركيزها الأساسي هو الذكاء الاصطناعي والتعلم الآلي لمعالجة المستندات بذكاء.

تيم كونديلو هو مهندس حلول متخصص في الذكاء الاصطناعي / التعلم الآلي في Amazon Web Services. ينصب تركيزه على معالجة اللغة الطبيعية ورؤية الكمبيوتر. يستمتع تيم بأخذ أفكار العملاء وتحويلها إلى حلول قابلة للتطوير.

الطابع الزمني: 3 نوفمبر، 20224 نوفمبر، 2022

الطابع الزمني: يوليو 5، 2023

معالجة المستندات بذكاء باستخدام خدمات AWS AI في صناعة التأمين: الجزء 1

أعاد نشره أفلاطون

حل نظرة عامة

المتطلبات الأساسية المسبقة

مرحلة التقاط البيانات

مرحلة التصنيف

مرحلة الاستخراج

استخراج البيانات من نموذج مطالبة CMS-1500

استخراج البيانات من وثائق الهوية

استخراج البيانات من الفواتير والإيصالات

وفي الختام

حول المؤلف

اكثر من التعلم الآلي من AWS

رؤية الكمبيوتر باستخدام مجموعات البيانات الاصطناعية مع Amazon Rekognition Custom Labels و Dassault Systèmes 3DEXCITE

الإعلان عن منشئ المحادثة المرئية لـ Amazon Lex

التنبؤ بالتخبط باستخدام الوسائط المتعددة للنص والميزات الجدولية مع Amazon SageMaker Jumpstart

قم بتمكين اتخاذ القرار الذكي باستخدام Amazon SageMaker Canvas و Amazon QuickSight

قم بإنشاء نصوص IaC للتطبيقات المخصصة والمتوافقة لمنطقة AWS Landing Zone باستخدام Amazon Bedrock | خدمات الويب الأمازون

من نحن

البحث العمودي و Ai

الانطلاق

ابق على تواصل

حسابي