טיפים לשיפור מודל התוויות המותאמות אישית של אמזון

הועלה מחדש על ידי אפלטון

עוקב: 0

בפוסט זה, אנו דנים בשיטות עבודה מומלצות לשיפור הביצועים של דגמי הראייה הממוחשבת שלך תוויות מותאמות אישית של Amazon Rekognition. Rekognition Custom Labels הוא שירות מנוהל במלואו לבניית מודלים מותאמים אישית של ראייה ממוחשבת עבור מקרי שימוש בסיווג תמונות וזיהוי אובייקטים. תוויות מותאמות אישית של הכרה מבוססת על הדגמים שהוכשרו מראש אמזון, שכבר הוכשרו על עשרות מיליוני תמונות בקטגוריות רבות. במקום אלפי תמונות, אתה יכול להתחיל עם סט קטן של תמונות אימון (כמה מאות או פחות) הספציפיות למקרה השימוש שלך. זיהוי תוויות מותאמות אישית מרחיק את המורכבות הכרוכה בבניית מודל מותאם אישית. הוא בודק אוטומטית את נתוני האימון, בוחר את אלגוריתמי ה-ML הנכונים, בוחר את סוג המופע, מאמן מספר מודלים מועמדים עם הגדרות היפרפרמטרים שונות ומוציא את המודל המאומן הטוב ביותר. זיהוי תוויות מותאמות אישית מספק גם ממשק קל לשימוש מה- קונסולת הניהול של AWS לניהול כל זרימת העבודה של ML, כולל תיוג תמונות, אימון המודל, פריסת המודל והצגה של תוצאות הבדיקה.

יש מקרים שבהם הדיוק של הדגם אינו הטוב ביותר, ואין לך הרבה אפשרויות להתאים את פרמטרי התצורה של הדגם. מאחורי הקלעים ישנם מספר גורמים הממלאים תפקיד מפתח בבניית מודל בעל ביצועים גבוהים, כגון:

זווית תמונה
רזולוציית תמונה
יחס רוחב-גובה של תמונה
חשיפה לאור
בהירות וחיות של הרקע
ניגודיות צבעים
גודל נתונים לדוגמה

להלן השלבים הכלליים שיש לבצע כדי להכשיר מודל של זיהוי תוויות מותאמות אישית בדרגת ייצור:

סקירת טקסונומיה – זה מגדיר את רשימת התכונות/פריטים שברצונך לזהות בתמונה.
אסוף נתונים רלוונטיים - זהו השלב החשוב ביותר, שבו אתה צריך לאסוף תמונות רלוונטיות שצריכות להיות דומות למה שהיית רואה בסביבת הפקה. זה יכול לכלול תמונות של אובייקטים עם רקע, תאורה או זוויות מצלמה שונות. לאחר מכן אתה יוצר מערכי הדרכה ובדיקה על ידי פיצול התמונות שנאספו. עליך לכלול רק תמונות מהעולם האמיתי כחלק ממערך הנתונים של הבדיקה, ולא לכלול תמונות שנוצרו באופן סינתטי. ביאורים לנתונים שאספתם הם קריטיים לביצועי המודל. ודא שהתיבות התוחמות צמודות סביב האובייקטים והתוויות מדויקות. אנו דנים בכמה טיפים שתוכל לשקול בעת בניית מערך נתונים מתאים בהמשך הפוסט הזה.
סקור מדדי הכשרה - השתמש במערך הנתונים הקודמים כדי לאמן מודל ולסקור את מדדי האימון עבור ציון F1, דיוק וזכירה. נדון בפירוט כיצד לנתח את מדדי האימון בהמשך הפוסט הזה.
הערך את המודל המאומן - השתמש בסט של תמונות בלתי נראות (לא משמשות לאימון המודל) עם תוויות ידועות כדי להעריך את התחזיות. שלב זה תמיד צריך להתבצע כדי לוודא שהדגם מתפקד כמצופה בסביבת ייצור.
אימון מחדש (אופציונלי) - באופן כללי, אימון כל מודל למידת מכונה הוא תהליך איטרטיבי להשגת התוצאות הרצויות, מודל ראייה ממוחשבת אינו שונה. סקור את התוצאות בשלב 4, כדי לראות אם יש להוסיף תמונות נוספות לנתוני האימון וחזור על השלבים 3 - 5 לעיל.

בפוסט זה, אנו מתמקדים בשיטות העבודה המומלצות סביב איסוף נתונים רלוונטיים (שלב 2) והערכת המדדים המיומנים שלך (שלב 3) כדי לשפר את ביצועי המודל שלך.

אסוף נתונים רלוונטיים

זהו השלב הקריטי ביותר בהכשרת מודל של זיהוי תוויות מותאמות אישית בדרגת ייצור. באופן ספציפי, ישנם שני מערכי נתונים: הדרכה ובדיקות. נתוני אימון משמשים להכשרת המודל, ואתה צריך להשקיע את המאמץ בבניית מערך אימונים מתאים. מודלים של תוויות מותאמות אישית של זיהוי מותאמים עבורם ציון F1 במערך הנתונים של הבדיקה כדי לבחור את המודל המדויק ביותר עבור הפרויקט שלך. לכן, חיוני לאצור מערך בדיקות שדומה לעולם האמיתי.

מספר תמונות

אנו ממליצים להחזיק לפחות 15-20 תמונות לכל תווית. קבלת תמונות נוספות עם יותר וריאציות המשקפות את מקרה השימוש שלך ישפר את ביצועי הדגם.

מערך נתונים מאוזן

באופן אידיאלי, כל תווית במערך הנתונים צריכה לכלול מספר דומה של דוגמאות. לא אמור להיות פער עצום במספר התמונות לכל תווית. לדוגמה, מערך נתונים שבו המספר הגבוה ביותר של תמונות עבור תווית הוא 1,000 לעומת 50 תמונות עבור תווית אחרת, דומה למערך נתונים לא מאוזן. אנו ממליצים להימנע מתרחישים עם יחס הפוך של 1:50 בין התווית עם מספר התמונות הנמוך ביותר לעומת התווית עם מספר התמונות הגבוה ביותר.

סוגים שונים של תמונות

כלול תמונות במערך ההדרכה והבדיקה הדומה למה שתשתמש בעולם האמיתי. לדוגמה, אם אתה רוצה לסווג תמונות של חדרי מגורים לעומת חדרי שינה, עליך לכלול תמונות ריקות ומרוהטות של שני החדרים.

להלן תמונה לדוגמה של סלון מרוהט.

לעומת זאת, להלן דוגמה לסלון לא מרוהט.

להלן תמונה לדוגמה של חדר שינה מרוהט.

להלן תמונה לדוגמה של חדר שינה לא מרוהט.

רקע משתנה

כלול תמונות עם רקע שונה. תמונות עם הקשר טבעי יכולות לספק תוצאות טובות יותר מאשר רקע רגיל.

להלן תמונה לדוגמה של החצר הקדמית של בית.

להלן תמונה לדוגמה של החצר הקדמית של בית אחר עם רקע שונה.

תנאי תאורה משתנים

כלול תמונות עם תאורה משתנה כך שתכסה את תנאי התאורה השונים המתרחשים במהלך ההסקה (לדוגמה, עם ובלי פלאש). אתה יכול גם לכלול תמונות עם רוויה, גוון ובהירות משתנים.

להלן תמונה לדוגמה של פרח באור רגיל.

לעומת זאת, התמונה הבאה היא של אותו פרח באור בהיר.

זוויות משתנות

כלול תמונות שצולמו מזוויות שונות של האובייקט. זה עוזר למודל ללמוד מאפיינים שונים של האובייקטים.

התמונות הבאות הן של אותו חדר שינה מזוויות שונות.

טיפים לשיפור דגם ה-Amazon Rekognition Custom Labels PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

יכולים להיות מקרים שבהם לא ניתן לרכוש תמונות מסוגים שונים. בתרחישים אלה, ניתן ליצור תמונות סינתטיות כחלק ממערך הנתונים של ההדרכה. למידע נוסף על טכניקות נפוצות להגדלת תמונה, עיין ב הגדלת נתונים.

הוסף תוויות שליליות

עבור סיווג תמונה, הוספת תוויות שליליות יכולה לעזור להגביר את דיוק המודל. לדוגמה, אתה יכול להוסיף תווית שלילית, שאינה תואמת לאף אחת מהתוויות הנדרשות. התמונה הבאה מייצגת את התוויות השונות המשמשות לזיהוי פרחים שגדלו במלואם.

הוספת התווית השלילית not_fully_grown עוזר למודל ללמוד מאפיינים שאינם חלק מה- fully_grown תווית.

טיפול בלבול תווית

נתח את התוצאות במערך הנתונים של הבדיקה כדי לזהות את כל הדפוסים שהחמיצו במערך ההדרכה או הבדיקה. לפעמים קל לזהות דפוסים כאלה על ידי בדיקה ויזואלית של התמונות. בתמונה הבאה, הדגם מתקשה לפתור בין תווית חצר אחורית לעומת תווית פטיו.

בתרחיש זה, הוספת תמונות נוספות לתוויות אלו במערך הנתונים וגם הגדרה מחדש של התוויות כך שכל תווית תהיה שונה יכולה לעזור להגביר את הדיוק של המודל.

הגדלת נתונים

בתוך תוויות מותאמות אישית של Rekognition, אנו מבצעים הגדלות שונות של נתונים לאימון מודלים, כולל חיתוך אקראי של התמונה, ריצוד צבע, רעשי גאוס אקראיים ועוד. בהתבסס על מקרי השימוש הספציפיים שלך, זה עשוי להיות מועיל גם להוסיף הגדלות נתונים מפורשות יותר לנתוני האימון שלך. לדוגמה, אם אתה מעוניין לזהות בעלי חיים גם בתמונות צבע וגם בשחור-לבן, תוכל להשיג דיוק טוב יותר על ידי הוספת גרסאות שחור-לבן וצבע של אותן תמונות לנתוני האימון.

אנו לא ממליצים על הגדלות בנתוני הבדיקה, אלא אם ההגדלות משקפות את מקרי השימוש בייצור שלך.

סקור מדדי הכשרה

ציון F1, דיוק, ריקול וסף משוער הם מדדים שנוצרים כפלט של הכשרת מודל באמצעות תוויות מותאמות אישית של זיהוי. המודלים מותאמים לציון ה-F1 הטוב ביותר על סמך מערך הנתונים של הבדיקה שסופק. הסף המשוער נוצר גם על סמך מערך הנתונים של הבדיקה. אתה יכול להתאים את הסף בהתאם לדרישת העסק שלך מבחינת דיוק או ריקול.

מכיוון שספי ההנחה נקבעים על מערך הבדיקה, ערכת בדיקה מתאימה צריכה לשקף את מקרה השימוש בייצור בעולם האמיתי. אם מערך הנתונים של הבדיקה אינו מייצג את מקרה השימוש, ייתכן שתראה ציוני F1 גבוהים באופן מלאכותי וביצועי מודל גרועים בתמונות שלך בעולם האמיתי.

מדדים אלה מועילים בעת ביצוע הערכה ראשונית של המודל. עבור מערכת בדרגת ייצור, אנו ממליצים להעריך את המודל מול מערך נתונים חיצוני (500-1,000 תמונות בלתי נראות) המייצג את העולם האמיתי. זה עוזר להעריך את ביצועי המודל במערכת ייצור וגם לזהות דפוסים חסרים ולתקן אותם על ידי אימון מחדש של המודל. אם אתה רואה חוסר התאמה בין ציוני F1 להערכה חיצונית, אנו מציעים לך לבדוק אם נתוני המבחן שלך משקפים את מקרה השימוש בעולם האמיתי.

סיכום

בפוסט זה, הדרכנו אותך דרך השיטות המומלצות לשיפור מודלים של זיהוי תוויות מותאמות אישית. אנו ממליצים לך ללמוד עוד על זיהוי תוויות מותאמות אישית ונסה זאת עבור מערכי הנתונים הספציפיים לעסק שלך.

על המחברים

עמית גופטה הוא אדריכל בכיר בשירותי AI ב-AWS. הוא נלהב לאפשר ללקוחות פתרונות למידת מכונה מתוכננים היטב בקנה מידה.

Yogesh Chaturvedi הוא אדריכל פתרונות ב-AWS עם התמקדות בראייה ממוחשבת. הוא עובד עם לקוחות כדי להתמודד עם האתגרים העסקיים שלהם באמצעות טכנולוגיות ענן. מחוץ לעבודה, הוא נהנה לטייל, לטייל ולצפות בספורט.

האו יאנג הוא מדען יישומי בכיר בצוות התוויות המותאמות אישית של Amazon Rekognition. תחומי המחקר העיקריים שלו הם זיהוי אובייקטים ולמידה עם הערות מוגבלות. מחוץ לעבודות, האו נהנה לצפות בסרטים, צילום ופעילויות חוצות.

פשמין מיסטרי הוא מנהל מוצר בכיר עבור אמזון זיהוי תוויות מותאמות אישית. מחוץ לעבודה, פשמין נהנה מטיולים הרפתקנים, צילום ובילוי עם משפחתו.

בול זמן: ספטמבר 9, 2022ספטמבר 10, 2022

בול זמן: יוני 15, 2022

טיפים לשיפור מודל התוויות המותאמות אישית של Amazon Rekognition

הועלה מחדש על ידי אפלטון

אסוף נתונים רלוונטיים

מספר תמונות

מערך נתונים מאוזן

סוגים שונים של תמונות

רקע משתנה

תנאי תאורה משתנים

זוויות משתנות

הוסף תוויות שליליות

טיפול בלבול תווית

הגדלת נתונים

סקור מדדי הכשרה

סיכום

על המחברים

עוד מ למידת מכונות AWS

מדדים להערכת ניהול תוכן ב-Amazon Rekognition ושירותי ניהול תוכן אחרים

הכרזה על Visual Conversation Builder עבור אמזון לקס

זיהוי חריגות עם Amazon SageMaker Edge Manager באמצעות AWS IoT Greengrass V2

הפעל כוונון דגמים אוטומטי עם Amazon SageMaker JumpStart

כיצד SIGNAL IDUNA מבצעת פרויקטים של למידת מכונה ב-AWS

Accenture יוצרת פתרון ליצירת מסמכים רגולטוריים באמצעות שירותי AI גנרטיביים של AWS | שירותי האינטרנט של אמזון

קידוד מאפייני טקסט רב-לשוניים באמזון נפטון כדי להכשיר מודלים חזויים

צמצם למינימום את השפעת הייצור של עדכוני מודל ML עם בדיקות הצללים של Amazon SageMaker

התאם אישית את ההגיות באמצעות אמזון פולי

אודות

חיפוש אנכי ו- Ai

פלטפורמה

שמור על קשר

חֶשְׁבּוֹן