בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart

סיווג תמונה הוא טכניקת למידת מכונה מבוססת ראייה ממוחשבת (ML) המאפשרת לך לסווג תמונות. כמה דוגמאות ידועות לסיווג תמונות כוללות סיווג ספרות בכתב יד, סיווג תמונות רפואיות וזיהוי פנים. סיווג תמונה הוא טכניקה שימושית עם מספר יישומים עסקיים, אך בניית מודל סיווג תמונה טוב אינה טריוויאלית.

מספר שיקולים יכולים לשחק תפקיד בעת הערכת מודל ML. מעבר לדיוק המודל, מדדים פוטנציאליים אחרים בעלי חשיבות הם זמן אימון מודל וזמן מסקנות. לאור האופי האיטרטיבי של פיתוח מודל ML, זמני אימון מהירים יותר מאפשרים למדעני נתונים לבדוק במהירות השערות שונות. הסקת מסקנות מהירה יותר יכולה להיות קריטית ביישומים בזמן אמת.

אמזון SageMaker JumpStart מספק כוונון עדין ופריסה בלחיצה אחת של מגוון רחב של מודלים מאומנים מראש על פני משימות ML פופולריות, כמו גם מבחר פתרונות מקצה לקצה הפותרים בעיות עסקיות נפוצות. תכונות אלו מסירות את ההרמה הכבדה מכל שלב בתהליך ה-ML, מה שמקל על פיתוח מודלים באיכות גבוהה ומצמצם את זמן הפריסה. ממשקי API של JumpStart מאפשרים לך לפרוס ולכוונן באופן תכנותי מבחר עצום של מודלים מאומנים מראש הנתמכים על ידי JumpStart על מערכי הנתונים שלך.

אתה יכול לאמן ולכוון בהדרגה את דגמי ה-ML המוצעים ב-JumpStart לפני הפריסה. בזמן כתיבת שורות אלה, 87 דגמי סיווג תמונות מבוססי למידה עמוקה זמינים ב-JumpStart.

אבל איזה דגם ייתן לך את התוצאות הטובות ביותר? בפוסט זה, אנו מציגים מתודולוגיה להרצת מודלים מרובים בקלות ולהשוות את התפוקות שלהם בשלושה מימדים של עניין: דיוק מודל, זמן אימון וזמן מסקנות.

סקירת פתרונות

JumpStart מאפשר לך לאמן, לכוון ולפרוס דגמים ממסוף JumpStart באמצעות ממשק המשתמש שלו או עם ה-API שלו. בפוסט זה, אנו משתמשים במסלול ה-API, ומציגים מחברת עם סקריפטים עוזרים שונים. אתה יכול להפעיל מחברת זו ולקבל תוצאות להשוואה קלה של מודלים אלה זה מול זה, ולאחר מכן לבחור דגם המתאים ביותר לצרכי העסק שלך מבחינת דיוק המודל, זמן ההדרכה וזמן ההסקה.

השמיים מערך נתונים ציבורי המשמש בפוסט זה מורכב מכמעט 55,000 תמונות של עלי צמחים חולים ובריאים שנאספו בתנאים מבוקרים, עם תוויות כיתה שנעות בין 0-38. מערך נתונים זה מחולק למערכי נתונים של רכבות ואימות, עם כ-44,000 בהדרכה ו-11,000 תמונות באימות. להלן מספר תמונות לדוגמה.

לתרגיל זה, בחרנו מודלים משתי מסגרות - PyTorch ו- TensorFlow - כפי שמציע JumpStart. 15 האלגוריתמים הבאים של המודל מכסים מגוון רחב של ארכיטקטורות רשתות עצביות פופולריות ממסגרות אלה:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

אנחנו משתמשים במודל tensorflow-ic-imagenet-inception-v3-classification-4-FT כבסיס שאליו משווים תוצאות ממודלים אחרים. דגם בסיס זה נבחר באופן שרירותי.

הקוד המשמש להפעלת השוואה זו זמין ב- דוגמאות AWS ל- GitHub repo.

תוצאות

בחלק זה, אנו מציגים את התוצאות מ-15 הריצות הללו. עבור כל הריצות הללו, ההיפרפרמטרים ששימשו היו עידנים = 5, קצב למידה = 0.001, גודל אצווה = 16.

דיוק המודל, זמן האימון וזמן ההסקה מהמודל tensorflow-ic-imagenet-inception-v3-classification-4-FT נלקחו כבסיס, והתוצאות מכל המודלים האחרים מוצגות ביחס למודל הבסיס הזה. הכוונה שלנו כאן היא לא להראות איזה דגם הוא הטוב ביותר אלא להראות כיצד, באמצעות ה-API של JumpStart, אתה יכול להשוות תוצאות מדגמים שונים ולאחר מכן לבחור דגם המתאים ביותר למקרה השימוש שלך.

צילום המסך הבא מדגיש את הדגם הבסיסי שכנגדו הושוו כל הדגמים האחרים.

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

העלילה הבאה מציגה תצוגה מפורטת של דיוק יחסי לעומת זמן אימון יחסי. דגמי PyTorch מקודדים בצבע אדום ודגמי TensorFlow בכחול.

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

נראה שלדגמים המודגשים באליפסה ירוקה בעלילה הקודמת יש שילוב טוב של דיוק יחסי וזמן אימון יחסי נמוך. הטבלה הבאה מספקת פרטים נוספים על שלושת הדגמים הללו.

שם דגם דיוק יחסי זמן אימון יחסי
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.74
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.74
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.16

העלילה הבאה משווה דיוק יחסי לעומת זמן מסקנות יחסי. דגמי PyTorch מקודדים בצבע אדום ודגמי TensorFlow בכחול.

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

הטבלה הבאה מספקת פרטים על שלושת הדגמים באליפסה הירוקה.

שם דגם דיוק יחסי זמן מסקנות יחסי
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT 1.01 0.94
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT 1.02 0.90
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT 1.04 1.43

שתי העלילות מדגימות בבירור שאלגוריתמי מודל מסוימים פעלו טוב יותר מאחרים בשלושת המימדים שנבחרו. הגמישות המוצעת באמצעות תרגיל זה יכולה לעזור לך לבחור את האלגוריתם הנכון, ועל ידי שימוש במחברת המצורפת, תוכל להפעיל בקלות סוג זה של ניסוי בכל אחד מ-87 הדגמים הזמינים.

סיכום

בפוסט זה, הראינו כיצד להשתמש ב-JumpStart כדי לבנות מודלים של סיווג תמונות בעלות ביצועים גבוהים על מימדים מרובים של עניין, כגון דיוק המודל, זמן אימון והשהייה של מסקנות. סיפקנו גם את הקוד להפעלת התרגיל הזה על מערך הנתונים שלך; אתה יכול לבחור דגמים מעניינים מתוך 87 הדגמים הזמינים כעת לסיווג תמונה במרכז הדגמים של JumpStart. אנו ממליצים לך לנסות את זה עוד היום.

לפרטים נוספים על JumpStart, עיין ב SageMaker JumpStart.


על הכותבים

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ד"ר ראג'ו פנמאצ'ה הוא אדריכל פתרונות AI/ML מומחה בפלטפורמות AI ב-AWS. הוא קיבל את הדוקטורט שלו מאוניברסיטת סטנפורד. הוא עובד בצמוד על חבילת השירותים הנמוכה/ללא קוד ב- SageMaker, המסייעת ללקוחות לבנות ולפרוס בקלות מודלים ופתרונות למידת מכונה. כשהוא לא עוזר ללקוחות, הוא אוהב לנסוע למקומות חדשים.

בנה מודלים של סיווג תמונות עם ביצועים גבוהים באמצעות Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ד"ר אשיש חתן הוא מדען יישומי בכיר עם אלגוריתמים מובנים של Amazon SageMaker ועוזר בפיתוח אלגוריתמים של למידת מכונה. הוא קיבל את הדוקטורט שלו מאוניברסיטת אילינוי אורבנה-שמפיין. הוא חוקר פעיל בלמידת מכונה והסקה סטטיסטית, ופרסם מאמרים רבים בכנסים NeurIPS, ICML, ICLR, JMLR, ACL ו-EMNLP.

בול זמן:

עוד מ למידת מכונות AWS