בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | שירותי האינטרנט של אמזון

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | שירותי האינטרנט של אמזון

כאשר ללקוח יש ייצור מוכן עיבוד מסמכים חכם עומס עבודה (IDP), לעתים קרובות אנו מקבלים בקשות לסקירה מאורגנת היטב. כדי לבנות פתרון ארגוני, משאבי מפתחים, עלות, זמן וחווית משתמש צריכים להיות מאוזנים כדי להשיג את התוצאה העסקית הרצויה. ה מסגרת ארכיטקטורה של AWS מספק דרך שיטתית לארגונים ללמוד שיטות עבודה מומלצות תפעוליות וארכיטקטוניות לתכנון ותפעול עומסי עבודה אמינים, מאובטחים, יעילים, חסכוניים וברי קיימא בענן.

IDP Well-Architected Custom Lens עוקבת אחר ה-AWS Well-Architected Framework, סוקרת את הפתרון עם שישה עמודי תווך עם מידת הפירוט של מקרה שימוש ספציפי של AI או למידת מכונה (ML), ומספקת הנחיות להתמודדות עם אתגרים נפוצים. העדשה המותאמת אישית של IDP הבנויה היטב ב- כלי ארכיטקט היטב מכיל שאלות לגבי כל אחד מעמודי התווך. על ידי מענה על שאלות אלו, תוכל לזהות סיכונים פוטנציאליים ולפתור אותם על ידי ביצוע תוכנית השיפור שלך.

פוסט זה מתמקד ב עמוד התווך של יעילות ביצועים של עומס העבודה של IDP. אנו צוללים עמוק לתוך תכנון ויישום הפתרון כדי לייעל את התפוקה, השהייה והביצועים הכוללים. אנו מתחילים בדיון בכמה אינדיקטורים נפוצים שכדאי לערוך סקירה ארכיטקטית היטב, ונציג את הגישות הבסיסיות עם עקרונות עיצוב. לאחר מכן אנו עוברים על כל אזור מיקוד מנקודת מבט טכנית.

כדי לעקוב אחרי הפוסט הזה, כדאי להכיר את הפוסטים הקודמים בסדרה זו (חלק 1 ו חלק 2) וההנחיות ב הדרכה לעיבוד מסמכים חכם ב-AWS. משאבים אלה מציגים שירותי AWS נפוצים לעומסי עבודה של IDP וזרימות עבודה מוצעות. עם הידע הזה, אתה מוכן עכשיו ללמוד עוד על ייצור עומס העבודה שלך.

אינדיקטורים נפוצים

להלן אינדיקטורים נפוצים שעליכם לערוך סקירת מסגרת ערוכה היטב עבור עמודת יעילות הביצועים:

  • חביון גבוה - כאשר זמן ההשהיה של זיהוי תווים אופטי (OCR), זיהוי ישויות או זרימת העבודה מקצה לקצה נמשך זמן רב יותר מהמדד הקודם שלך, זה עשוי להיות אינדיקציה לכך שתכנון הארכיטקטורה אינו מכסה בדיקות עומס או טיפול בשגיאות.
  • מצערת תכופה - ייתכן שתחווה מצערת על ידי שירותי AWS כמו טקסטורה באמזון בשל מגבלות בקשות. המשמעות היא שיש להתאים את הארכיטקטורה על ידי סקירת זרימת העבודה של הארכיטקטורה, יישום סינכרוני וא-סינכרוני, חישוב טרנזקציות לשנייה (TPS) ועוד.
  • קשיים באיתור באגים – כאשר יש כשל בתהליך המסמך, ייתכן שאין לך דרך יעילה לזהות היכן ממוקמת השגיאה בזרימת העבודה, לאיזה שירות היא קשורה ומדוע התרחשה הכשל. משמעות הדבר היא שהמערכת חסרה ראות לתוך יומנים וכשלים. שקול לבדוק מחדש את עיצוב הרישום של נתוני הטלמטריה ולהוסיף תשתית כקוד (IaC), כגון צינורות לעיבוד מסמכים, לפתרון.
אינדיקטורים תיאור פער אדריכלי
חביון גבוה זמן האחזור של OCR, זיהוי ישויות או זרימת עבודה מקצה לקצה חורג מנקודת המידה הקודמת
  • בדיקות בדיקה
  • טיפול בשגיאה
מצערת תכופה חסימה על ידי שירותי AWS כמו Amazon Textract עקב מגבלות בקשות
  • סנכרון מול אסינכרון
  • חישוב TPS
קשה לנפות באגים אין חשיפה למיקום, סיבה וסיבה לכשלים בעיבוד מסמכים
  • עיצוב רישום
  • צינורות לעיבוד מסמכים

עקרונות עיצוב

בפוסט זה, אנו דנים בשלושה עקרונות עיצוב: האצלת משימות AI מורכבות, ארכיטקטורות IaC וארכיטקטורות ללא שרת. כאשר אתה נתקל בהתלבטות בין שני יישומים, אתה יכול לבדוק מחדש את עקרונות העיצוב עם סדרי העדיפויות העסקיים של הארגון שלך כדי שתוכל לקבל החלטות ביעילות.

  • האצלת משימות AI מורכבות - אתה יכול לאפשר אימוץ AI מהיר יותר בארגון שלך על ידי הורדת מחזור החיים של פיתוח מודל ML לשירותים מנוהלים וניצול הפיתוח והתשתית של המודלים שמספקת AWS. במקום לדרוש צוותי מדעי הנתונים ו-IT שלך לבנות ולתחזק מודלים של AI, אתה יכול להשתמש בשירותי AI מאומנים מראש שיכולים להפוך משימות עבורך לאוטומטיות. זה מאפשר לצוותים שלך להתמקד בעבודה בעלת ערך גבוה יותר שמבדיל את העסק שלך, בעוד שספק הענן מטפל במורכבות של הדרכה, פריסה והרחבה של מודלים של AI.
  • ארכיטקטורות IaC - בעת הפעלת פתרון IDP, הפתרון כולל שירותי AI מרובים לביצוע זרימת העבודה מקצה לקצה באופן כרונולוגי. אתה יכול לתכנן את הפתרון עם צינורות זרימת עבודה באמצעות פונקציות שלב AWS כדי לשפר את סבילות התקלות, עיבוד מקביל, נראות ומדרגיות. יתרונות אלה יכולים לאפשר לך לייעל את השימוש והעלות של שירותי AI הבסיסיים.
  • ללא שרת ארכיטקטורות - IDP הוא לעתים קרובות פתרון מונחה אירועים, המופעל על ידי העלאות משתמשים או עבודות מתוזמנות. ניתן להרחיב את הפתרון בצורה אופקית על ידי הגדלת תעריפי השיחות עבור שירותי הבינה המלאכותית, AWS למבדה, ושירותים אחרים המעורבים. גישה ללא שרת מספקת מדרגיות ללא הקצאת משאבים יתר, ומונעת הוצאות מיותרות. הניטור מאחורי העיצוב ללא שרת מסייע באיתור בעיות ביצועים.
איור 1. התועלת בעת יישום עקרונות עיצוב. לפי המחבר.

איור 1. התועלת בעת יישום עקרונות עיצוב.

בהתחשב בשלושת עקרונות העיצוב הללו, ארגונים יכולים להקים בסיס יעיל לאימוץ AI/ML בפלטפורמות ענן. על ידי האצלת מורכבות, הטמעת תשתית עמידה ותכנון לפי קנה מידה, ארגונים יכולים לייעל את פתרונות ה-AI/ML שלהם.

בסעיפים הבאים, אנו דנים כיצד להתמודד עם אתגרים נפוצים בכל הקשור לתחומי מיקוד טכניים.

אזורי מיקוד

כאשר בוחנים את יעילות הביצועים, אנו בוחנים את הפתרון מחמישה תחומי מיקוד: עיצוב ארכיטקטורה, ניהול נתונים, טיפול בשגיאות, ניטור מערכת וניטור מודלים. עם אזורי מיקוד אלה, אתה יכול לערוך סקירת ארכיטקטורה מהיבטים שונים כדי לשפר את היעילות, יכולת הצפייה והמדרגיות של שלושת המרכיבים של פרויקט AI/ML, נתונים, מודל או יעד עסקי.

תכנון אדריכלות

על ידי מעבר על השאלות באזור מיקוד זה, תסקור את זרימת העבודה הקיימת כדי לראות אם היא פועלת לפי שיטות עבודה מומלצות. זרימת העבודה המוצעת מספקת דפוס משותף שארגונים יכולים לעקוב אחריו ומונעת עלויות ניסוי וטעייה.

מבוסס על ה הארכיטקטורה המוצעת, זרימת העבודה עוקבת אחר ששת השלבים של לכידת נתונים, סיווג, מיצוי, העשרה, סקירה ואימות וצריכה. באינדיקטורים הנפוצים שדיברנו עליהם קודם לכן, שניים מתוך שלושה מגיעים מבעיות עיצוב אדריכלות. הסיבה לכך היא שכאשר אתה מתחיל פרויקט בגישה מאולתרת, אתה עלול להיתקל במגבלות הפרויקט כאשר אתה מנסה ליישר את התשתית שלך לפתרון שלך. עם סקירת עיצוב האדריכלות, ניתן לנתק את העיצוב המאולתר כשלבים, וניתן להעריך מחדש ולסדר כל אחד מהם מחדש.

אתה יכול לחסוך זמן, כסף ועבודה על ידי יישום סיווגים בזרימת העבודה שלך, ומסמכים עוברים ליישומים וממשקי API במורד הזרם על סמך סוג המסמך. זה משפר את יכולת הצפייה של תהליך המסמך והופך את הפתרון לפשוט לתחזוקה בעת הוספת סוגי מסמכים חדשים.

ניהול נתונים

הביצועים של פתרון IDP כוללים חביון, תפוקה וחווית משתמש מקצה לקצה. אופן ניהול המסמך והמידע שחולץ שלו בפתרון הוא המפתח לעקביות נתונים, אבטחה ופרטיות. בנוסף, הפתרון חייב להתמודד עם נפחי נתונים גבוהים עם חביון נמוך ותפוקה גבוהה.

כשאתה עובר על השאלות של אזור מיקוד זה, תבדוק את זרימת העבודה של המסמך. זה כולל קליטת נתונים, עיבוד מקדים של נתונים, המרת מסמכים לסוגי מסמכים המקובלים על ידי Amazon Textract, טיפול בזרמי מסמכים נכנסים, ניתוב מסמכים לפי סוג, ויישום מדיניות בקרת גישה ושמירה.

לדוגמה, על ידי אחסון מסמך בשלבים המעובדים השונים, ניתן להפוך את העיבוד לשלב הקודם במידת הצורך. מחזור חיי הנתונים מבטיח את המהימנות והתאימות לעומס העבודה. על ידי שימוש ב מחשבון מכסות שירות אמזון Textract (ראה את צילום המסך הבא), תכונות אסינכרוניות ב- Amazon Textract, Lambda, Step Functions, שירות תורים פשוט של אמזון (Amazon SQS), ו שירות התראה פשוט של אמזון (Amazon SNS), ארגונים יכולים להפוך משימות עיבוד מסמכים לאוטומטיות ולהתאים אותן לצורכי עומס עבודה ספציפיים.

איור 2. מחשבון מכסות שירות Amazon Textract. לפי המחבר.

איור 2. מחשבון מכסות שירות Amazon Textract.

שגיאה בטיפול

טיפול תקיף בשגיאות הוא קריטי למעקב אחר מצב תהליך המסמך, והוא מספק לצוות התפעול זמן להגיב לכל התנהגויות חריגות, כגון נפחי מסמכים בלתי צפויים, סוגי מסמכים חדשים או בעיות לא מתוכננות אחרות משירותי צד שלישי. מנקודת המבט של הארגון, טיפול נכון בשגיאות יכול לשפר את זמן הפעולה והביצועים של המערכת.

אתה יכול לחלק את הטיפול בשגיאות לשני היבטים מרכזיים:

  • תצורת שירות AWS - אתה יכול ליישם לוגיקת ניסיון חוזר עם גיבוי אקספוננציאלי כדי לטפל בשגיאות חולפות כמו מצערת. כאשר אתה מתחיל לעבד על ידי קריאה לפעולת Start* אסינכרונית, כגון StartDocumentTextDetection, אתה יכול לציין שסטטוס ההשלמה של הבקשה מפורסם לנושא SNS ב- NotificationChannel תְצוּרָה. זה עוזר לך להימנע ממגבלות מצערת על קריאות API עקב סקר את ממשקי ה-API של Get*. אתה יכול גם ליישם אזעקות ב אמזון CloudWatch ומפעילים להתריע כאשר מתרחשים עליות שגיאה חריגות.
  • שיפור דוח שגיאה – זה כולל הודעות מפורטות עם רמת פירוט מתאימה לפי סוג שגיאה ותיאורים של תגובות לטיפול בשגיאות. עם ההגדרה הנכונה לטיפול בשגיאות, מערכות יכולות להיות גמישות יותר על ידי הטמעת דפוסים נפוצים כמו ניסיון חוזר אוטומטי של שגיאות לסירוגין, שימוש במפסקים לטיפול בכשלים מדורגים ושירותי ניטור כדי לקבל תובנות לגבי שגיאות. זה מאפשר לפתרון לאזן בין מגבלות ניסיון חוזר ומונע לולאות מעגל בלתי נגמרות.

ניטור מודל

הביצועים של מודלים של ML מנוטרים להתדרדרות לאורך זמן. ככל שהנתונים ותנאי המערכת משתנים, מתבצע מעקב אחר מדדי הביצועים והיעילות של המודל כדי להבטיח ביצוע הדרכה מחדש בעת הצורך.

מודל ה-ML בזרימת עבודה של IDP יכול להיות מודל OCR, מודל זיהוי ישויות או מודל סיווג. המודל יכול להגיע משירות AI של AWS, מודל קוד פתוח אמזון SageMaker, סלע אמזון, או שירותים אחרים של צד שלישי. עליך להבין את המגבלות ומקרי השימוש של כל שירות על מנת לזהות דרכים לשפר את המודל עם משוב אנושי ולשפר את ביצועי השירות לאורך זמן.

גישה נפוצה היא שימוש ביומני שירות כדי להבין רמות שונות של דיוק. יומנים אלה יכולים לעזור לצוות מדעי הנתונים לזהות ולהבין כל צורך בהכשרת מודלים מחדש. הארגון שלך יכול לבחור את מנגנון ההכשרה מחדש - זה יכול להיות רבעוני, חודשי או מבוסס על מדדים מדעיים, כגון כאשר הדיוק יורד מתחת לסף נתון.

מטרת הניטור היא לא רק איתור בעיות, אלא סגירת מעגל כדי לשכלל מודלים באופן מתמיד ולשמור על ביצועי פתרון ה-IDP ככל שהסביבה החיצונית מתפתחת.

ניטור מערכת

לאחר פריסת פתרון IDP בייצור, חשוב לעקוב אחר מדדי מפתח וביצועי אוטומציה כדי לזהות אזורים לשיפור. המדדים צריכים לכלול מדדים עסקיים ומדדים טכניים. זה מאפשר לחברה להעריך את ביצועי המערכת, לזהות בעיות ולבצע שיפורים במודלים, כללים וזרימות עבודה לאורך זמן כדי להגדיל את קצב האוטומציה כדי להבין את ההשפעה התפעולית.

בצד העסקי, מדדים כמו דיוק חילוץ עבור תחומים חשובים, קצב אוטומציה כולל המציין את אחוז המסמכים שעובדו ללא התערבות אנושית וזמן עיבוד ממוצע למסמך הם בעלי חשיבות עליונה. מדדים עסקיים אלו עוזרים לכמת את חווית משתמש הקצה ואת הרווחים ביעילות התפעולית.

מדדים טכניים, כולל שיעורי שגיאות וחריגים המתרחשים לאורך זרימת העבודה, חיוניים למעקב מנקודת מבט הנדסית. המדדים הטכניים יכולים גם לנטר בכל רמה מקצה לקצה ולספק מבט מקיף על עומס עבודה מורכב. אתה יכול לחלק את המדדים לרמות שונות, כגון רמת פתרון, רמת זרימת עבודה מקצה לקצה, רמת סוג מסמך, רמת מסמך, רמת זיהוי ישויות ורמת OCR.

כעת, לאחר שבדקת את כל השאלות בעמוד זה, אתה יכול להעריך את עמודי התווך האחרים ולפתח תוכנית שיפור לעומס העבודה ב-IDP שלך.

סיכום

בפוסט זה, דנו באינדיקטורים נפוצים שאולי תצטרכו כדי לבצע סקירת מסגרת ארכיטקטית עבור עמודת יעילות הביצועים עבור עומס העבודה שלך ב-IDP. לאחר מכן עברנו על עקרונות העיצוב כדי לספק סקירה ברמה גבוהה ולדון במטרת הפתרון. על ידי ביצוע הצעות אלה בהתייחס לעדשה המותאמת אישית של IDP נבנה היטב ועל ידי סקירת השאלות לפי אזור מיקוד, כעת אמורה להיות לך תוכנית לשיפור הפרויקט.


על הכותבים

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מיה צ'אנג הוא אדריכל פתרונות ML מומחה עבור שירותי האינטרנט של אמזון. היא עובדת עם לקוחות ב-EMEA ומשתפת שיטות עבודה מומלצות להפעלת עומסי עבודה של AI/ML בענן עם הרקע שלה במתמטיקה יישומית, מדעי המחשב ו-AI/ML. היא מתמקדת בעומסי עבודה ספציפיים ל-NLP, וחולקת את ניסיונה כדוברת ועידה ומחברת ספרים. בזמנה הפנוי היא נהנית מטיולים, משחקי לוח ומבשלת קפה.

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.בריג'ש פאטי הוא ארכיטקט פתרונות ארגוניים ב-AWS. המיקוד העיקרי שלו הוא לעזור ללקוחות ארגוניים לאמץ טכנולוגיות ענן לעומסי העבודה שלהם. יש לו רקע בפיתוח אפליקציות וארכיטקטורה ארגונית ועבד עם לקוחות מענפים שונים כגון ספורט, פיננסים, אנרגיה ושירותים מקצועיים. תחומי העניין שלו כוללים ארכיטקטורות ללא שרת ו-AI/ML.

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.רואי קרדוסו הוא ארכיטקט פתרונות שותף בחברת Amazon Web Services (AWS). הוא מתמקד ב-AI/ML ו-IoT. הוא עובד עם AWS Partners ותומך בהם בפיתוח פתרונות ב-AWS. כשהוא לא עובד, הוא נהנה לרכוב על אופניים, לטייל וללמוד דברים חדשים.

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.טים קונדלו הוא ארכיטקט פתרונות מומחה לבינה מלאכותית (AI) ולמידת מכונה (ML) בכיר בשירותי האינטרנט של אמזון (AWS). המיקוד שלו הוא עיבוד שפה טבעית וראייה ממוחשבת. טים נהנה לקחת רעיונות של לקוחות ולהפוך אותם לפתרונות הניתנים להרחבה.

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.שרי דינג הוא ארכיטקט פתרונות מומחה לבינה מלאכותית (AI) ולמידת מכונה (ML) בכיר בשירותי האינטרנט של אמזון (AWS). יש לה ניסיון רב בלמידת מכונה עם תואר דוקטור במדעי המחשב. היא עובדת בעיקר עם לקוחות במגזר הציבורי על אתגרים עסקיים שונים הקשורים ל-AI/ML, ועוזרת להם להאיץ את מסע למידת המכונה שלהם בענן AWS. כשהיא לא עוזרת ללקוחות, היא נהנית מפעילויות חוצות.

בנו פתרונות IDP מעוצבים היטב עם עדשה מותאמת אישית - חלק 4: יעילות ביצועים | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.סוין וואנג הוא אדריכל פתרונות AI/ML מומחה ב-AWS. יש לה רקע השכלה בין-תחומי בלמידת מכונה, שירות מידע פיננסי וכלכלה, יחד עם שנים של ניסיון בבניית יישומי Data Science ו-Machine Learning שפתרו בעיות עסקיות בעולם האמיתי. היא נהנית לעזור ללקוחות לזהות את השאלות העסקיות הנכונות ולבנות את פתרונות AI/ML הנכונים. בזמנה הפנוי היא אוהבת לשיר ולבשל.

בול זמן:

עוד מ למידת מכונות AWS