התאם אישית כללים עסקיים לעיבוד מסמכים חכם עם סקירה אנושית והדמיית BI של PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

התאם אישית כללים עסקיים לעיבוד מסמכים חכם עם סקירה אנושית והדמיית BI

כמות עצומה של מסמכים עסקיים מעובדים מדי יום בתעשיות. רבים מהמסמכים הללו הם מבוססי נייר, נסרקים לתוך המערכת שלך כתמונות, או בפורמט לא מובנה כמו PDF. כל חברה רשאית להחיל כללים ייחודיים הקשורים לרקע העסקי שלה בעת עיבוד מסמכים אלה. איך להוציא מידע בצורה מדויקת ולעבד אותו בצורה גמישה היא אתגר שחברות רבות מתמודדות איתו.

Amazon Intelligent Document Processing (IDP) מאפשר לך לנצל את היתרונות של טכנולוגיית למידת מכונה (ML) המובילה בתעשייה ללא ניסיון קודם ב-ML. פוסט זה מציג פתרון הכלול ב- סדנת IDP של אמזון מציג כיצד לעבד מסמכים כדי לשרת כללים עסקיים גמישים באמצעות שירותי בינה מלאכותית של אמזון. אתה יכול להשתמש שלב אחר שלב הבא מחברת צדק להשלמת המעבדה.

טקסטורה באמזון עוזר לך לחלץ בקלות טקסט ממסמכים שונים, ו אמזון AI מוגדל (Amazon A2I) מאפשר לך ליישם סקירה אנושית של תחזיות ML. תבנית ברירת המחדל של Amazon A2I מאפשרת לך לבנות צינור סקירה אנושי המבוסס על כללים, כגון כאשר ציון בטחון החילוץ נמוך מסף מוגדר מראש או חסרים מפתחות נדרשים. אבל בסביבת ייצור, אתה צריך את צינור עיבוד המסמכים כדי לתמוך בכללים עסקיים גמישים, כגון אימות פורמט המחרוזת, אימות סוג וטווח הנתונים ואימות שדות בין מסמכים. פוסט זה מראה כיצד אתה יכול להשתמש ב- Amazon Textract וב- Amazon A2I כדי להתאים אישית צינור עיבוד מסמכים גנרי התומך בכללים עסקיים גמישים.

סקירת פתרונות

עבור הפתרון לדוגמה שלנו, אנו משתמשים ב- טופס מס 990, טופס מס הכנסה בארה"ב (Internal Revenue Service) המספק לציבור מידע פיננסי על ארגון ללא מטרות רווח. עבור דוגמה זו, אנו מכסים רק את היגיון החילוץ עבור חלק מהשדות בעמוד הראשון של הטופס. תוכל למצוא מסמכים לדוגמה נוספים ב- אתר מס הכנסה.

התרשים הבא ממחיש את צינור ה-IDP התומך בכללים עסקיים מותאמים אישית עם סקירה אנושית.

הארכיטקטורה מורכבת משלושה שלבים לוגיים:

  • הפקה – חלץ נתונים מטופס מס 990 (אנו משתמשים בעמוד 1 כדוגמה).
  • בדיקת מערכות - החל כללים עסקיים גמישים עם סקירת אנושי במעגל.
    • אמת את הנתונים שחולצו בהתאם לכללים עסקיים, כגון אימות אורך שדה מזהה.
    • שלח את המסמך לאמזון A2I כדי שאדם יוכל לעיין בו אם כללים עסקיים נכשלים.
    • סוקרים משתמשים בממשק המשתמש של Amazon A2I (אתר הניתן להתאמה אישית) כדי לאמת את תוצאת החילוץ.
  • הדמיית BI - אנו משתמשים אמזון קוויקסייט לבנות לוח מחוונים של בינה עסקית (BI) המציג את תובנות התהליך.

התאמה אישית של כללים עסקיים

אתה יכול להגדיר כלל עסקי גנרי בפורמט JSON הבא. בקוד לדוגמה, אנו מגדירים שלושה כללים:

  • הכלל הראשון הוא עבור שדה זיהוי המעסיק. הכלל נכשל אם ציון האמון של Amazon Textract נמוך מ-99%. עבור הפוסט הזה, הגדרנו את סף ציון הביטחון הגבוה, שיישבר לפי העיצוב. אתה יכול להתאים את הסף לערך סביר יותר כדי להפחית מאמץ אנושי מיותר בסביבה אמיתית, כגון 90%.
  • הכלל השני הוא עבור שדה DLN (המזהה הייחודי של טופס המס), שנדרש עבור הלוגיקה של העיבוד במורד הזרם. כלל זה נכשל אם השדה DLN חסר או שיש לו ערך ריק.
  • הכלל השלישי הוא גם עבור שדה DLN אך עם סוג תנאי אחר: LengthCheck. הכלל נשבר אם אורך ה-DLN אינו 16 תווים.

הקוד הבא מציג את הכללים העסקיים שלנו בפורמט JSON:

rules = [
    {
        "description": "Employee Id confidence score should greater than 99",
        "field_name": "d.employer_id",
        "field_name_regex": None, # support Regex: "_confidence$",
        "condition_category": "Confidence",
        "condition_type": "ConfidenceThreshold",
        "condition_setting": "99",
    },
    {
        "description": "dln is required",
        "field_name": "dln",
        "condition_category": "Required",
        "condition_type": "Required",
        "condition_setting": None,
    },
    {
        "description": "dln length should be 16",
        "field_name": "dln",
        "condition_category": "LengthCheck",
        "condition_type": "ValueRegex",
        "condition_setting": "^[0-9a-zA-Z]{16}$",
    }
]

אתה יכול להרחיב את הפתרון על ידי הוספת כללים עסקיים נוספים בעקבות אותו מבנה.

חלץ טקסט באמצעות שאילתת Amazon Textract

בפתרון לדוגמה, אנו קוראים ל-Amazon Textract analyse_document API שאלה תכונה לחילוץ שדות על ידי שאילת שאלות ספציפיות. אינך צריך לדעת את מבנה הנתונים במסמך (טבלה, טופס, שדה מרומז, נתונים מקוננים) או לדאוג לגבי וריאציות בין גרסאות ופורמטים של מסמכים. שאילתות משתמשות בשילוב של רמזים חזותיים, מרחביים ושפה כדי לחלץ את המידע שאתה מחפש בדיוק גבוה.

כדי לחלץ ערך עבור שדה ה-DLN, תוכל לשלוח בקשה עם שאלות בשפות טבעיות, כגון "מהו ה-DLN?" Amazon Textract מחזירה את הטקסט, הביטחון ומטא נתונים אחרים אם היא מוצאת מידע מתאים על התמונה או המסמך. להלן דוגמה לבקשת שאילתה של Amazon Textract:

textract.analyze_document(
        Document={'S3Object': {'Bucket': data_bucket, 'Name': s3_key}},
        FeatureTypes=["QUERIES"],
        QueriesConfig={
                'Queries': [
                    {
                        'Text': 'What is the DLN?',
                       'Alias': 'The DLN number - unique identifier of the form'
                    }
               ]
        }
)

הגדר את מודל הנתונים

הפתרון לדוגמה בונה את הנתונים בפורמט מובנה כדי לשרת את הערכת הכלל העסקי הגנרי. כדי לשמור על ערכים שחולצו, אתה יכול להגדיר מודל נתונים עבור כל עמוד מסמך. התמונה הבאה מראה כיצד הטקסט בעמוד 1 ממפה לשדות JSON.מודל נתונים מותאם אישית

כל שדה מייצג טקסט, תיבת סימון או תא טבלה/טופס של מסמך בעמוד. אובייקט JSON נראה כמו הקוד הבא:

{
    "dln": {
        "value": "93493319020929",
        "confidence": 0.9765, 
        "block": {} 
    },
    "omb_no": {
        "value": "1545-0047",
        "confidence": 0.9435,
        "block": {}
    },
    ...
}

אתה יכול למצוא את ההגדרה המפורטת של מבנה JSON ב- GitHub ריפו.

להעריך את הנתונים מול הכללים העסקיים

הפתרון לדוגמה מגיע עם מחלקה Condition - מנוע חוקים גנרי שלוקח את הנתונים המחולצים (כפי שהוגדרו במודל הנתונים) ואת הכללים (כפי שהוגדרו בכללים העסקיים המותאמים אישית). הוא מחזיר שתי רשימות עם תנאים כושלים ומרוצים. אנחנו יכולים להשתמש בתוצאה כדי להחליט אם עלינו לשלוח את המסמך לאמזון A2I לבדיקה אנושית.

קוד המקור של מחלקה Condition נמצא בדוגמה GitHub ריפו. הוא תומך בלוגיקת אימות בסיסית, כגון אימות אורך, טווח ערכים וסף ציון ביטחון של מחרוזת. אתה יכול לשנות את הקוד כדי לתמוך בסוגי תנאים נוספים ולוגיקת אימות מורכבת.

צור ממשק משתמש אינטרנט מותאם אישית של Amazon A2I

Amazon A2I מאפשר לך להתאים אישית את ממשק המשתמש האינטרנטי של המבקר על ידי הגדרת א תבנית משימות עובדים. התבנית היא דף אינטרנט סטטי ב-HTML ו-JavaScript. אתה יכול להעביר נתונים לדף המבקר המותאם באמצעות ה נוזל תחביר.

בפתרון לדוגמה, ה תבנית ממשק משתמש מותאמת אישית של Amazon A2I מציג את הדף בצד שמאל ואת תנאי הכשל בצד ימין. סוקרים יכולים להשתמש בו כדי לתקן את ערך החילוץ ולהוסיף את הערותיהם.

צילום המסך הבא מציג את ממשק המשתמש המותאם אישית של Amazon A2I. הוא מציג את מסמך התמונה המקורי משמאל ואת התנאים הכושלים הבאים מימין:

  • מספרי ה-DLN צריכים להיות באורך 16 תווים. ל-DLN בפועל יש 15 תווים.
  • ציון הביטחון של employer_id נמוך מ-99%. ציון הביטחון בפועל הוא בסביבות 98%.

הבודקים יכולים לאמת תוצאות אלו באופן ידני ולהוסיף הערות ב- שנה סיבה תיבות טקסט.ממשק משתמש מותאם אישית של סקירת A2I

למידע נוסף על שילוב אמזון A2I בכל זרימת עבודה מותאמת אישית של ML, עיין במעל 60 תבניות עובדים שנבנו מראש ברטפו GitHub ו- השתמש ב- AI Augmented AI עם סוגי משימות מותאמות אישית.

עבד את הפלט של Amazon A2I

לאחר שהסוקר משתמש בממשק המשתמש המותאם של אמזון A2I מאמת את התוצאה ובוחר חפש, Amazon A2I מאחסנת קובץ JSON בתיקייה S3 bucket. קובץ JSON כולל את המידע הבא על רמת השורש:

  • הגדרת הזרימה של Amazon A2I ARN ושם הלולאה האנושית
  • תשובות אנושיות (הקלט של המבקר נאסף על ידי ממשק המשתמש המותאם אישית של Amazon A2I)
  • קלט תוכן (הנתונים המקוריים שנשלחו לאמזון A2I בעת הפעלת משימת הלולאה האנושית)

להלן JSON לדוגמה שנוצר על ידי Amazon A2I:

{
  "flowDefinitionArn": "arn:aws:sagemaker:us-east-1:711334203977:flow-definition/a2i-custom-ui-demo-workflow",
  "humanAnswers": [
    {
      "acceptanceTime": "2022-08-23T15:23:53.488Z",
      "answerContent": {
        "Change Reason 1": "Missing X at the end.",
        "True Value 1": "93493319020929X",
        "True Value 2": "04-3018996"
      },
      "submissionTime": "2022-08-23T15:24:47.991Z",
      "timeSpentInSeconds": 54.503,
      "workerId": "94de99f1bc6324b8",
      "workerMetadata": {
        "identityData": {
          "identityProviderType": "Cognito",
          "issuer": "https://cognito-idp.us-east-1.amazonaws.com/us-east-1_URd6f6sie",
          "sub": "cef8d484-c640-44ea-8369-570cdc132d2d"
        }
      }
    }
  ],
  "humanLoopName": "custom-loop-9b4e67ff-2c9f-40f9-aae5-0e26316c905c",
  "inputContent": {...} # the original input send to A2I when starting the human review task
}

אתה יכול ליישם לוגיקה של חילוץ, טרנספורמציה וטעינה (ETL) כדי לנתח מידע מפלט JSON של Amazon A2I ולאחסן אותו בקובץ או במסד נתונים. הפתרון לדוגמה מגיע עם א קובץ CSV עם נתונים מעובדים. אתה יכול להשתמש בו כדי לבנות לוח מחוונים של BI על ידי ביצוע ההוראות בסעיף הבא.

צור לוח מחוונים באמזון QuickSight

הפתרון לדוגמה כולל שלב דיווח עם לוח מחוונים להדמיה המוגש על ידי Amazon QuickSight. לוח המחוונים של BI מציג מדדי מפתח כגון מספר המסמכים שעובדו באופן אוטומטי או ידני, השדות הפופולריים ביותר שדרשו סקירה אנושית ותובנות אחרות. לוח המחוונים הזה יכול לעזור לך לקבל פיקוח על צינור עיבוד המסמכים ולנתח את הסיבות הנפוצות הגורמות לסקירה אנושית. אתה יכול לייעל את זרימת העבודה על ידי צמצום נוסף של קלט אנושי.

לוח המחוונים לדוגמה כולל מדדים בסיסיים. אתה יכול להרחיב את הפתרון באמצעות Amazon QuickSight כדי להציג תובנות נוספות על הנתונים.לוח מחוונים של BI

הרחב את הפתרון כדי לתמוך בעוד מסמכים וכללים עסקיים

כדי להרחיב את הפתרון לתמיכה בדפי מסמכים נוספים עם כללים עסקיים מתאימים, עליך לבצע את השינויים הבאים:

  • צור מודל נתונים עבור הדף החדש במבנה JSON המייצג את כל הערכים שברצונך לחלץ מהעמודים. עיין ב הגדר את מודל הנתונים סעיף לפורמט מפורט.
  • השתמש ב- Amazon Textract כדי לחלץ טקסט מהמסמך ולאכלס ערכים למודל הנתונים.
  • הוסף כללים עסקיים המתאימים לדף בפורמט JSON. עיין ב התאמה אישית של כללים עסקיים סעיף לפורמט המפורט.

ממשק המשתמש המותאם אישית של Amazon A2I בפתרון הוא גנרי, שאינו מצריך שינוי כדי לתמוך בכללים עסקיים חדשים.

סיכום

לעיבוד מסמכים חכם יש ביקוש גבוה, וחברות זקוקות לצינור מותאם אישית כדי לתמוך בהיגיון העסקי הייחודי שלהן. Amazon A2I מציעה גם תבנית מובנית המשולבת עם Amazon Textract כדי ליישם את מקרי השימוש שלך בסקירה אנושית. זה גם מאפשר לך להתאים אישית את דף הבודקים כדי לשרת דרישות גמישות.

פוסט זה הדריך אותך דרך פתרון התייחסות באמצעות Amazon Textract ו- Amazon A2I לבניית צינור IDP התומך בכללים עסקיים גמישים. אתה יכול לנסות את זה באמצעות מחברת צדק במאגר הסדנה של GitHub IDP.


על המחברים

התאם אישית כללים עסקיים לעיבוד מסמכים חכם עם סקירה אנושית והדמיית BI של PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.לאנה ג'אנג הוא Sr. Solutions Architect בצוות שירותי AI של AWS WWSO עם מומחיות ב-AI ו-ML לעיבוד מסמכים חכם ומתווך תוכן. היא נלהבת לקדם שירותי AI של AWS ולעזור ללקוחות לשנות את הפתרונות העסקיים שלהם.

התאם אישית כללים עסקיים לעיבוד מסמכים חכם עם סקירה אנושית והדמיית BI של PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
סונאלי סהו מובילה את צוות אדריכלי פתרונות AI/ML Intelligent Document Processing ב- Amazon Web Services. היא טכנופילית נלהבת ונהנית לעבוד עם לקוחות כדי לפתור בעיות מורכבות באמצעות חדשנות. תחום הליבה שלה הם בינה מלאכותית ולמידת מכונה לעיבוד מסמכים חכם.

בול זמן:

עוד מ למידת מכונות AWS