עיבוד מסמכים חכם עם שירותי AI של AWS בענף הביטוח: חלק 1

הועלה מחדש על ידי אפלטון

עוקב: 0

המטרה של עיבוד מסמכים חכם (IDP) היא לעזור לארגון שלך לקבל החלטות מהירות ומדויקות יותר על ידי יישום AI לעיבוד הניירת שלך. סדרה זו בת שני חלקים מדגישה את טכנולוגיות ה-AI של AWS שחברות הביטוח יכולות להשתמש בהן כדי להאיץ את התהליכים העסקיים שלהן. ניתן להשתמש בטכנולוגיות בינה מלאכותית אלו בכל מקרי שימוש בביטוח כגון תביעות, חיתום, תכתובת לקוחות, חוזים או טיפול בפתרון סכסוכים. סדרה זו מתמקדת במקרה של שימוש בתביעות בענף הביטוח; למידע נוסף על המושגים הבסיסיים של פתרון AWS IDP, עיין בסעיף הבא שני חלקים סדרה.

עיבוד תביעות מורכב מנקודות ביקורת מרובות בזרימת עבודה שנדרשת כדי לבדוק, לאמת את האותנטיות ולקבוע את האחריות הפיננסית הנכונה לדון בתביעה. חברות הביטוח עוברות במחסומים אלו לתביעות לפני מתן פסק דין בתביעות. אם תביעה עוברת בהצלחה את כל המחסומים הללו ללא בעיות, חברת הביטוח מאשרת זאת ומטפלת בכל תשלום. עם זאת, הם עשויים לדרוש מידע תומך נוסף כדי לדון בתביעה. תהליך עיבוד התביעות הזה הוא לרוב ידני, מה שהופך אותו ליקר, מועד לשגיאות וגוזל זמן. לקוחות ביטוח יכולים להפוך תהליך זה לאוטומטי באמצעות שירותי AWS AI כדי להפוך את צינור עיבוד המסמכים לאוטומטי לעיבוד תביעות.

בסדרה בת שני חלקים זו, אנו מעבירים אותך דרך האוטומטיות ולעבד בצורה חכמה מסמכים בקנה מידה באמצעות שירותי AI של AWS למקרה שימוש בעיבוד תביעות ביטוח.

עיבוד מסמכים חכם עם שירותי AWS AI ו-Analytics בענף הביטוח

סקירת פתרונות

התרשים הבא מייצג כל שלב שאנו רואים בדרך כלל בצינור IDP. אנו עוברים על כל אחד מהשלבים הללו וכיצד הם מתחברים לשלבים הכרוכים בתהליך הגשת תביעות, החל מהגשת הבקשה ועד לחקירה וסגירת הבקשה. בפוסט זה, אנו מכסים את הפרטים הטכניים של שלבי לכידת הנתונים, הסיווג והחילוץ. ב חלק 2, אנו מרחיבים את שלב חילוץ המסמכים וממשיכים לתעד העשרה, סקירה ואימות, ומרחיבים את הפתרון כדי לספק ניתוחים והדמיות למקרה שימוש בהונאה בתביעות.

דיאגרמת הארכיטקטורה הבאה מציגה את שירותי ה-AWS השונים המשמשים במהלך שלבי צינור ה-IDP בהתאם לשלבים שונים של יישום עיבוד תביעות.

דיאגרמת ארכיטקטורת IDP

הפתרון משתמש בשירותי המפתח הבאים:

טקסטורה באמזון הוא שירות למידת מכונה (ML) המחלץ אוטומטית טקסט, כתב יד ונתונים ממסמכים סרוקים. זה חורג מזיהוי תווים אופטי פשוט (OCR) לזהות, להבין ולחלץ נתונים מטפסים וטבלאות. Amazon Textract משתמשת ב-ML כדי לקרוא ולעבד כל סוג של מסמך, תוך חילוץ מדויק של טקסט, כתב יד, טבלאות ונתונים אחרים ללא מאמץ ידני.
אמזון להתבונן הוא שירות עיבוד שפה טבעית (NLP) המשתמש ב-ML כדי לחלץ תובנות מטקסט. Amazon Comprehend יכולה לזהות ישויות כמו אדם, מיקום, תאריך, כמות ועוד. זה יכול גם לזהות את השפה השלטת, מידע אישי מזהה (PII), ולסווג מסמכים לכיתה הרלוונטית שלהם.
אמזון AI מוגדל (Amazon A2I) הוא שירות ML שמקל על בניית זרימות העבודה הנדרשות לסקירה אנושית. Amazon A2I מביאה סקירה אנושית לכל המפתחים, מסירה את ההרמה הכבדה הבלתי מובחנת הקשורה לבניית מערכות ביקורת אנושיות או ניהול מספר רב של סוקרים אנושיים. Amazon A2I משלב את שניהם עם טקסטורה באמזון ו אמזון להתבונן לספק את היכולת להציג סקירה אנושית או אימות בתוך זרימת העבודה של IDP.

תנאים מוקדמים

בסעיפים הבאים, נעבור על השירותים השונים הקשורים לשלושת השלבים הראשונים של הארכיטקטורה, כלומר, שלבי לכידת הנתונים, הסיווג והחילוץ.

עיין שלנו מאגר GitHub לדוגמאות קוד מלאות יחד עם דוגמאות המסמכים בחבילת עיבוד התביעות.

שלב לכידת נתונים

תביעות והמסמכים התומכים שלה יכולים להגיע בערוצים שונים, כגון פקס, מייל, פורטל ניהול ועוד. אתה יכול לאחסן מסמכים אלה באחסון מדרגי ועמיד במיוחד כמו שירות אחסון פשוט של אמזון (אמזון S3). מסמכים אלו יכולים להיות מסוגים שונים כמו PDF, JPEG, PNG, TIFF ועוד. מסמכים יכולים להגיע בפורמטים ובפריסות שונות, ויכולים להגיע מערוצים שונים למאגר הנתונים.

שלב המיון

בשלב סיווג המסמכים, נוכל לשלב את Amazon Comprehend עם Amazon Textract כדי להמיר טקסט להקשר של מסמך כדי לסווג את המסמכים המאוחסנים בשלב לכידת הנתונים. לאחר מכן נוכל להשתמש בסיווג מותאם אישית ב- Amazon Comprehend כדי לארגן מסמכים במחלקות שהגדרנו בחבילת עיבוד התביעות. סיווג מותאם אישית מועיל גם לאוטומציה של תהליך אימות המסמכים וזיהוי כל המסמכים החסרים מהחבילה. ישנם שני שלבים בסיווג מותאם אישית, כפי שמוצג בתרשים הארכיטקטורה:

חלץ טקסט באמצעות Amazon Textract מכל המסמכים באחסון הנתונים כדי להכין נתוני אימון למסווג המותאם אישית.
אימון מודל סיווג מותאם אישית של Amazon Comprehend (נקרא גם a מסמך מסווג) לזהות את מחלקות העניין בהתבסס על תוכן הטקסט.

סיווג מסמכים של חבילת תביעות ביטוח

לאחר הכשרה של מודל הסיווג המותאם אישית של Amazon Comprehend, נוכל להשתמש בנקודת הקצה בזמן אמת כדי לסווג מסמכים. Amazon Comprehend מחזירה את כל מחלקות המסמכים עם ציון ביטחון המקושר לכל מחלקה במערך של צמדי מפתח-ערך (Doc_name - Confidence_score). אנו ממליצים לעבור על קוד לדוגמה סיווג המסמכים המפורט ב- GitHub.

שלב המיצוי

בשלב החילוץ, אנו שואבים נתונים ממסמכים באמצעות Amazon Textract ו- Amazon Comprehend. עבור פוסט זה, השתמש במסמכים לדוגמה הבאים בחבילת עיבוד התביעות: טופס תביעה של מרכז שירותים ושירותי Medicare (CMS)-1500, רישיון נהיגה ומזהה ביטוח וחשבונית.

חלץ נתונים מטופס תביעה של CMS-1500

טופס CMS-1500 הוא טופס התביעה הסטנדרטי המשמש ספק או ספק לא מוסדי לחיוב ספקי Medicare.

חשוב לעבד את טופס CMS-1500 בצורה מדויקת, אחרת זה עלול להאט את תהליך התביעות או לעכב את התשלום על ידי הספק. עם Amazon Textract AnalyzeDocument API, נוכל להאיץ את תהליך החילוץ עם דיוק גבוה יותר כדי לחלץ טקסט ממסמכים כדי להבין תובנות נוספות בתוך טופס התביעה. להלן מסמך לדוגמה של טופס תביעה מסוג CMS-1500.

טופס תביעה מסוג CMS1500

כעת אנו משתמשים ב- AnalyzeDocument API לחילוץ שניים FeatureTypes, FORMS ו TABLES, מתוך המסמך:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

התוצאות הבאות קוצרו לקריאות טובה יותר. למידע מפורט יותר, ראה שלנו ריפו GitHub.

אל האני FORMS מיצוי מזוהה כצמדי מפתח-ערך.

אל האני TABLES חילוץ מכיל תאים, תאים ממוזגים וכותרות עמודות בתוך טבלה שזוהתה בטופס התביעה.

חילוץ טבלאות מטופס CMS1500

חילוץ נתונים ממסמכי תעודת זהות

עבור מסמכי זהות כמו מזהה ביטוח, שיכולים להיות בעלי פריסות שונות, נוכל להשתמש ב-Amazon Textract AnalyzeDocument ממשק API. אנו משתמשים ב- FeatureType FORMS בתור התצורה עבור AnalyzeDocument API לחילוץ צמדי מפתח-ערך ממזהה הביטוח (ראה את הדוגמה הבאה):

הפעל את הקוד הבא:

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

אנו מקבלים את צמדי המפתח-ערך במערך התוצאות, כפי שמוצג בצילום המסך הבא.

עבור מסמכי תעודה מזהה כמו רישיון נהיגה אמריקאי או דרכון אמריקאי, Amazon Textract מספקת תמיכה מיוחדת לחילוץ אוטומטי של מונחי מפתח ללא צורך בתבניות או פורמטים, בניגוד למה שראינו קודם בדוגמה של מזהה הביטוח. עם ה AnalyzeID API, עסקים יכולים לחלץ מידע במהירות ובדייקנות ממסמכי זיהוי בעלי תבניות או פורמטים שונים. ה AnalyzeID API מחזיר שתי קטגוריות של סוגי נתונים:

צמדי מפתח-ערך זמינים בתעודת הזהות כגון תאריך לידה, תאריך הנפקה, מספר תעודת זהות, כיתה והגבלות
שדות מרומזים במסמך שאולי לא משויכים אליהם מפתחות מפורשים, כגון שם, כתובת ומנפיק

אנו משתמשים ברישיון הנהיגה האמריקאי לדוגמה הבא מתוך חבילת עיבוד התביעות שלנו.

הפעל את הקוד הבא:

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

צילום המסך הבא מציג את התוצאה שלנו.

מצילום המסך של התוצאות, ניתן לראות שמוצגים מפתחות מסוימים שלא היו ברישיון הנהיגה עצמו. לדוגמה, Veteran אינו מפתח שנמצא ברישיון; עם זאת, זהו ערך מפתח מאוכלס מראש AnalyzeID תומך, בשל ההבדלים שנמצאו ברישיונות בין מדינות.

חילוץ נתונים מחשבוניות וקבלות

בדומה ל AnalyzeID API, ה AnalyzeExpense API מספק תמיכה מיוחדת עבור חשבוניות וקבלות כדי לחלץ מידע רלוונטי כגון שם הספק, סכומים ביניים וסכומים, ועוד מכל פורמט של מסמכי חשבונית. אתה לא צריך שום תבנית או תצורה לחילוץ. Amazon Textract משתמשת ב-ML כדי להבין את ההקשר של חשבוניות מעורפלות כמו גם קבלות.

להלן דוגמה לחשבונית ביטוח רפואי.

דוגמה של חשבונית ביטוח

אנו משתמשים AnalyzeExpense API כדי לראות רשימה של שדות סטנדרטיים. שדות שאינם מוכרים כשדות סטנדרטיים מסווגים כ OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

אנו מקבלים את רשימת השדות הבאה כצמדי מפתח-ערך (ראה צילום מסך משמאל) ואת כל השורה של פריטי שורה בודדים שנרכשו (ראה צילום מסך מימין) בתוצאות.

עיבוד מסמכים חכם עם שירותי AI של AWS בתעשיית הביטוח: חלק 1 PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

סיכום

בפוסט זה, הצגנו את האתגרים הנפוצים בעיבוד תביעות, וכיצד אנו יכולים להשתמש בשירותי AI של AWS כדי להפוך צינור אינטליגנטי לעיבוד מסמכים כדי לדון באופן אוטומטי בתביעה. ראינו כיצד לסווג מסמכים למחלקות מסמכים שונות באמצעות מסווג מותאם אישית של Amazon Comprehend, וכיצד להשתמש ב-Amazon Textract כדי לחלץ סוגי מסמכים לא מובנים, מובנים למחצה, מובנים ומיוחדים.

In חלק 2, אנו מרחיבים את שלב החילוץ עם Amazon Textract. אנו משתמשים גם בישויות מוגדרות מראש של Amazon Comprehend ובישויות מותאמות אישית כדי להעשיר את הנתונים, ולהראות כיצד להרחיב את צינור ה-IDP כדי להשתלב בשירותי ניתוח והדמיה לעיבוד נוסף.

אנו ממליצים לסקור את סעיפי האבטחה של Amazon Textract, Amazon Comprehend, ו אמזון A2I תיעוד וביצוע ההנחיות שסופקו. למידע נוסף על התמחור של הפתרון, עיין בפרטי התמחור של Amazon Textract, אמזון להתבונן, ו אמזון A2I.

על הכותבים

צ'ינמיי ראן הוא אדריכל פתרונות AI/ML מומחה בשירותי האינטרנט של אמזון. היא נלהבת למתמטיקה שימושית ולמידת מכונה. היא מתמקדת בעיצוב פתרונות עיבוד מסמכים חכמים עבור לקוחות AWS. מחוץ לעבודה, היא נהנית לרקוד סלסה ובאצ'טה.

סונאלי סהו מובילה את צוות האדריכלים Intelligent Document Processing AI/ML Solutions ב- Amazon Web Services. היא טכנופילית נלהבת ונהנית לעבוד עם לקוחות כדי לפתור בעיות מורכבות באמצעות חדשנות. תחום הליבה שלה הוא בינה מלאכותית ולמידת מכונה לעיבוד מסמכים חכם.

טים קונדלו הוא ארכיטקט פתרונות מומחה בינה מלאכותית/ML בכיר בשירותי האינטרנט של אמזון. המיקוד שלו הוא עיבוד שפה טבעית וראייה ממוחשבת. טים נהנה לקחת רעיונות של לקוחות ולהפוך אותם לפתרונות הניתנים להרחבה.

בול זמן: 3 בנובמבר 20224 בנובמבר 2022

בול זמן: יולי 5, 2023

עיבוד מסמכים חכם עם שירותי AI של AWS בתעשיית הביטוח: חלק 1

הועלה מחדש על ידי אפלטון

סקירת פתרונות

תנאים מוקדמים

שלב לכידת נתונים

שלב המיון

שלב המיצוי

חלץ נתונים מטופס תביעה של CMS-1500

חילוץ נתונים ממסמכי תעודת זהות

חילוץ נתונים מחשבוניות וקבלות

סיכום

על הכותבים

עוד מ למידת מכונות AWS

ראייה ממוחשבת באמצעות מערכי נתונים סינתטיים עם התוויות מותאמות אישית של Amazon Rekognition ו-Dassault Systems 3DEXCITE

הכרזה על Visual Conversation Builder עבור אמזון לקס

חיזוי נטישה באמצעות רב-מודאליות של טקסט ותכונות טבלאות עם Amazon SageMaker Jumpstart

אפשר קבלת החלטות חכמה עם Amazon SageMaker Canvas ו-Amazon QuickSight

צור סקריפטים מותאמים אישית של יישום IaC עבור AWS Landing Zone באמצעות Amazon Bedrock | שירותי האינטרנט של אמזון

אודות

חיפוש אנכי ו- Ai

פלטפורמה

שמור על קשר

חֶשְׁבּוֹן