בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | שירותי האינטרנט של אמזון

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | שירותי האינטרנט של אמזון

אמזון SageMaker Canvas הוא סביבת עבודה ללא קוד המאפשרת לאנליסטים ולמדעני נתונים אזרחיים ליצור תחזיות מדויקות של למידת מכונה (ML) עבור הצרכים העסקיים שלהם. החל מהיום, SageMaker Canvas תומך בתצורות בניית מודל מתקדמות כגון בחירת שיטת אימון (אופטימיזציה של אנסמבל או היפרפרמטר) ואלגוריתמים, התאמה אישית של יחס פיצול נתוני האימון והאימות, והגדרת מגבלות על איטרציות autoML וזמן ריצת העבודה, ובכך לאפשר למשתמשים להתאים אישית תצורות בניית מודל ללא צורך לכתוב שורת קוד אחת. גמישות זו יכולה לספק פיתוח מודלים חזקים ותובנה יותר. בעלי עניין לא טכניים יכולים להשתמש בתכונות ללא קוד עם הגדרות ברירת מחדל, בעוד שמדעני נתונים אזרחיים יכולים להתנסות באלגוריתמים וטכניקות ML שונות, לעזור להם להבין אילו שיטות עובדות הכי טוב עבור הנתונים שלהם ולבצע אופטימיזציה כדי להבטיח את איכות המודל וביצועיו.

בנוסף לתצורות בניית דגמים, SageMaker Canvas מספקת כעת גם לוח מודלים. לוח המובילים מאפשר לך להשוות מדדי ביצועים מרכזיים (לדוגמה, דיוק, דיוק, זכירה וציון F1) עבור תצורות מודלים שונים כדי לזהות את המודל הטוב ביותר עבור הנתונים שלך, ובכך לשפר את השקיפות בבניית המודל ולעזור לך לקבל החלטות מושכלות בנושא בחירת הדגם. אתה יכול גם להציג את כל זרימת העבודה של בניית המודל, כולל שלבי עיבוד מקדים מוצעים, אלגוריתמים וטווחי היפרפרמטרים במחברת. כדי לגשת לפונקציות הללו, צא והיכנס שוב ל- SageMaker Canvas ובחר הגדר דגם בעת בניית דגמים.

בפוסט זה, אנו מדריכים אותך בתהליך השימוש בתצורות בניית המודל המתקדם החדש של SageMaker Canvas כדי להתחיל אימון אופטימיזציה של אנסמבל ו-Hyperparameter (HPO).

סקירת פתרונות

בסעיף זה, אנו מראים לך הוראות שלב אחר שלב עבור תצורות בניית המודל המתקדם החדש של SageMaker Canvas כדי ליזום אימון אופטימיזציה של אנסמבל ו-Hyperparameter (HPO) כדי לנתח את מערך הנתונים שלנו, לבנות מודלים באיכות גבוהה של ML ולראות את טבלת המובילים של המודל. להחליט איזה דגם לפרסם להסקת מסקנות. SageMaker Canvas יכול לבחור אוטומטית את שיטת האימון בהתבסס על גודל הנתונים, או שאתה יכול לבחור אותה באופן ידני. הבחירות הן:

  • יַחַד: משתמש ב- AutoGluon ספרייה כדי להכשיר מספר דגמי בסיס. כדי למצוא את השילוב הטוב ביותר עבור מערך הנתונים שלך, מצב אנסמבל מריץ 10 ניסויים עם הגדרות שונות של מודל ומטא פרמטרים. לאחר מכן הוא משלב את המודלים הללו תוך שימוש בשיטת אנסמבל הערימה כדי ליצור מודל חיזוי אופטימלי. במצב אנסמבל, SageMaker Canvas תומך בסוגים הבאים של אלגוריתמים של למידת מכונה:
    • GBM קל: מסגרת אופטימלית המשתמשת באלגוריתמים מבוססי עצים עם הגברת שיפוע. אלגוריתם זה משתמש בעצים שגדלים לרוחב ולא לעומק והוא מותאם מאוד למהירות.
    • CatBoost: מסגרת המשתמשת באלגוריתמים מבוססי עץ עם הגברת שיפוע. מותאם לטיפול במשתנים קטגוריים.
    • XGBoost: מסגרת המשתמשת באלגוריתמים מבוססי עץ עם הגברת שיפוע שצומחת לעומק ולא לרוחב.
    • יער אקראי: אלגוריתם מבוסס עץ המשתמש במספר עצי החלטה על תת-דגימות אקראיות של הנתונים עם החלפה. העצים מפוצלים לצמתים אופטימליים בכל רמה. ההחלטות של כל עץ נמדדות יחד כדי למנוע התאמת יתר ולשפר את התחזיות.
    • עצים נוספים: אלגוריתם מבוסס עץ המשתמש במספר עצי החלטה במערך הנתונים כולו. העצים מפוצלים באופן אקראי בכל רמה. ההחלטות של כל עץ הן ממוצעות כדי למנוע התאמת יתר וכדי לשפר את התחזיות. עצים נוספים מוסיפים מידה של אקראית בהשוואה לאלגוריתם היער האקראי.
    • מודלים ליניאריים: מסגרת המשתמשת במשוואה ליניארית למודל של הקשר בין שני משתנים בנתונים נצפים.
    • לפיד רשת עצבית: מודל רשת עצבית שמיושם באמצעות Pytorch.
    • רשת עצבית fast.ai: מודל רשת עצבית שמיושם באמצעות fast.ai.
  • אופטימיזציה של היפרפרמטרים (HPO): SageMaker Canvas מוצא את הגרסה הטובה ביותר של מודל על ידי כוונון היפרפרמטרים באמצעות אופטימיזציה בייסיאנית או אופטימיזציה של ריבוי נאמנות בזמן הפעלת עבודות אימון במערך הנתונים שלך. מצב HPO בוחר את האלגוריתמים הרלוונטיים ביותר למערך הנתונים שלך ובוחר את טווח ההיפרפרמטרים הטוב ביותר כדי לכוונן את המודלים שלך. כדי לכוון את הדגמים שלך, מצב HPO מפעיל עד 100 ניסויים (ברירת מחדל) כדי למצוא את הגדרות ההיפרפרמטרים האופטימליים בטווח הנבחר. אם גודל מערך הנתונים שלך קטן מ-100 מגה-בייט, SageMaker Canvas משתמש באופטימיזציה בייסיאנית. SageMaker Canvas בוחר באופטימיזציה של ריבוי נאמנות אם מערך הנתונים שלך גדול מ-100 MB. באופטימיזציה של ריבוי נאמנות, מדדים נפלטים באופן רציף ממיכלי ההדרכה. ניסוי עם ביצועים גרועים מול מדד יעד נבחר מופסק מוקדם. לניסוי שמתפקד טוב מוקצים יותר משאבים. במצב HPO, SageMaker Canvas תומך בסוגים הבאים של אלגוריתמי למידת מכונה:
  • לומד לינארי: אלגוריתם למידה מפוקח שיכול לפתור בעיות סיווג או רגרסיה.
  • XGBoost: אלגוריתם למידה מפוקח שמנסה לחזות במדויק משתנה יעד על ידי שילוב של אנסמבל של אומדנים ממערך של מודלים פשוטים וחלשים יותר.
  • אלגוריתם למידה עמוקה: תפיסת רב שכבתית (MLP) ורשת עצבית מלאכותית בהזנה קדימה. אלגוריתם זה יכול לטפל בנתונים שאינם ניתנים להפרדה ליניארית.
  • אוטומטי: SageMaker Canvas בוחר אוטומטית במצב אנסמבל או מצב HPO בהתבסס על גודל הנתונים שלך. אם מערך הנתונים שלך גדול מ-100 MB, SageMaker Canvas בוחר ב-HPO. אחרת, הוא בוחר במצב אנסמבל.

תנאים מוקדמים

עבור פוסט זה, עליך להשלים את התנאים המוקדמים הבאים:

  1. יש חשבון AWS.
  2. הגדר את SageMaker Canvas. לִרְאוֹת תנאים מוקדמים להגדרת Amazon SageMaker Canvas.
  3. הורד את הקלאסיקה מערך טיטאניק למחשב המקומי שלך.

צור מודל

אנו מדריכים אותך באמצעות מערך הנתונים של Titanic ו- SageMaker Canvas כדי ליצור מודל שחוזה אילו נוסעים שרדו את הספינה הטרופה של Titanic. זוהי בעיית סיווג בינארי. אנו מתמקדים ביצירת ניסוי Canvas באמצעות מצב אימון האנסמבל ומשווים את התוצאות של ציון F1 וזמן הריצה הכולל עם ניסוי SageMaker Canvas המשתמש במצב אימון HPO (100 ניסויים).

שם העמודה תיאור
Passengerid מספר זיהוי
שרד הישרדות
Pclass מחלקת כרטיסים
שם שם נוסע
מִין מִין
גיל גיל בשנים
Sibsp מספר אחים או בני זוג על סיפון הטיטאניק
לְיַבֵּשׁ מספר הורים או ילדים על סיפון הטיטאניק
כרטיס מספר כרטיס
דמי נסיעה יריד נוסעים
תָא מספר תא
סומן נמל ההפלגה

השמיים מערך טיטאניק יש 890 שורות ו-12 עמודות. הוא מכיל מידע דמוגרפי על הנוסעים (גיל, מין, מחלקת כרטיסים וכן הלאה) ועמודת היעד שרדו (כן/לא).

  1. התחל בייבוא ​​מערך הנתונים לתוך SageMaker Canvas. תן שם למערך הנתונים כביר.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. בחר את מערך הנתונים של Titanic ובחר צור דגם חדש. הזן שם עבור הדגם, בחר ניתוח חזוי כסוג הבעיה, ובחר צור.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. תַחַת בחר עמודה לניבוי, להשתמש ב עמודת יעד נפתח כדי לבחור שרד. עמודת היעד שרד היא סוג נתונים בינארי עם ערכים של 0 (לא שרד) ו-1 (שרד).

הגדר והפעל את המודל

בניסוי הראשון, אתה מגדיר את SageMaker Canvas להפעיל אימון אנסמבל על מערך הנתונים עם דיוק כמדד המטרה שלך. ציון דיוק גבוה יותר מצביע על כך שהמודל עושה תחזיות נכונות יותר, בעוד שציון דיוק נמוך יותר מצביע על כך שהמודל עושה יותר שגיאות. דיוק עובד היטב עבור מערכי נתונים מאוזנים. לאימון אנסמבל, בחר ב-XGBoost, Random Forest, CatBoost ו-Linear Models בתור האלגוריתמים שלך. השאר את פיצול הנתונים על ברירת המחדל 80/20 לצורך הדרכה ואימות. ולבסוף, הגדר את עבודת ההדרכה לפעול למשך זמן ריצה מקסימלי של שעה.

  1. התחל בבחירה הגדר דגם.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. זה מעלה חלון מודאלי עבור הגדר דגם. לבחור מתקדם מחלונית הניווט.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. התחל להגדיר את הדגם שלך על ידי בחירה מדד אובייקטיבי. עבור ניסוי זה, בחר דיוק. ציון הדיוק אומר לך באיזו תדירות תחזיות המודל נכונות בסך הכל.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. בחר שיטת אימון ואלגוריתמים ובחר יחד. שיטות אנסמבל בלמידת מכונה כוללות יצירת מודלים מרובים ולאחר מכן שילובם כדי לייצר תוצאות משופרות. טכניקה זו משמשת להגברת דיוק החיזוי על ידי ניצול היתרונות של אלגוריתמים שונים. ידוע ששיטות אנסמבל מייצרות פתרונות מדויקים יותר ממה שדגם בודד יעשה, כפי שהוכח בתחרויות שונות של למידת מכונה ויישומים בעולם האמיתי.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. בחר את האלגוריתמים השונים לשימוש עבור האנסמבל. עבור ניסוי זה, בחר XGBoost, לינארי, CatBoost, ו יער אקראי. נקה את כל שאר האלגוריתמים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  6. בחר פיצול נתונים מחלונית הניווט. עבור ניסוי זה, השאר את חלוקת ההדרכה והאימות המוגדרת כברירת מחדל כ-80/20. האיטרציה הבאה של הניסוי משתמשת בפיצול אחר כדי לראות אם הוא מביא לביצועי מודל טובים יותר.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  7. בחר מקסימום מועמדים וזמן ריצה מחלונית הניווט והגדר את זמן ריצה מקסימלי של עבודה עד שעה אחת ובחר שמור.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  8. בחרו מבנה סטנדרטי כדי להתחיל את הבנייה.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בשלב זה, SageMaker Canvas מפעיל את הדרכת המודל על סמך התצורה שסיפקת. מכיוון שציינת זמן ריצה מקסימלי עבור עבודת ההדרכה של שעה אחת, ל- SageMaker Canvas ייקח עד שעה לבצע את עבודת ההדרכה.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

סקור את התוצאות

עם השלמת עבודת ההדרכה, SageMaker Canvas מחזיר אותך אוטומטית לתצוגת ניתוח ומציג את תוצאות המדדים האובייקטיביים שהגדרת עבור ניסוי האימון במודל. במקרה זה, אתה רואה שדיוק הדגם הוא 86.034 אחוז.

  1. בחר בלחצן החץ לכווץ שליד דגם leaderboard לסקור את נתוני ביצועי המודל.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. בחר מניה לשונית כדי לצלול עמוק יותר לתוך תובנות דיוק המודל. הדגם המאומן מדווח שהוא יכול לחזות נכון את הנוסעים שלא שרדו ב-89.72 אחוז מהמקרים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. בחר מדדים מתקדמים לשונית להערכת פרטי ביצועי מודל נוספים. התחל בבחירה טבלת מדדים לסקור פרטים של מדדים כגון F1, דיוק, להיזכר, ו AUC.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. SageMaker Canvas גם עוזר לדמיין את מטריצת בלבול עבור הדגם המאומן.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. ומדמיינת את עקומת זכירה מדויקת. AUPRC של 0.86 מאותת על דיוק סיווג גבוה, וזה טוב.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  6. בחרו דגם leaderboard כדי להשוות מדדי ביצועים מרכזיים (כגון דיוק, דיוק, זכירה וציון F1) עבור מודלים שונים שהוערכו על ידי SageMaker Canvas כדי לקבוע את המודל הטוב ביותר עבור הנתונים, בהתבסס על התצורה שהגדרת עבור ניסוי זה. דגם ברירת המחדל עם הביצועים הטובים ביותר מודגש עם דגם ברירת מחדל תווית בלוח המוביל של הדגם.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  7. אתה יכול להשתמש בתפריט ההקשר שבצד כדי לצלול עמוק יותר לתוך הפרטים של כל אחד מהדגמים או להפוך דגם לדגם ברירת המחדל. בחר צפה בפרטי הדגם על הדגם השני ב-Leaderboard כדי לראות פרטים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  8. SageMaker Canvas משנה את התצוגה כדי להציג פרטים של מועמד הדגם שנבחר. בעוד שפרטים של דגם ברירת המחדל כבר זמינים, לתצוגת פירוט הדגם החלופי לוקח 10-15 דקות לצבוע את הפרטים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צור דגם שני

כעת, לאחר שבניתם, הרצתם וסקרתם מודל, בואו נבנה מודל שני לשם השוואה.

  1. חזור לתצוגת מודל ברירת המחדל על ידי בחירה X בפינה העליונה. עכשיו, בחר הוסף גרסה כדי ליצור גרסה חדשה של הדגם.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. בחר את מערך הנתונים של Titanic שיצרת בתחילה, ולאחר מכן בחר בחר מערך נתונים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

SageMaker Canvas טוען אוטומטית את הדגם כשעמודת היעד כבר נבחרה. בניסוי השני הזה, אתה עובר לאימון HPO כדי לראות אם הוא מניב תוצאות טובות יותר עבור מערך הנתונים. עבור מודל זה, אתה שומר על אותם מדדים אובייקטיביים (דיוק) להשוואה עם הניסוי הראשון ומשתמש באלגוריתם XGBoost לאימון HPO. אתה משנה את חלוקת הנתונים להדרכה ואימות ל-70/30 ומגדיר את המועמדים המקסימליים וערכי זמן הריצה עבור עבודת HPO ל-20 מועמדים וזמן ריצה מקסימלי של עבודה כשעה.

הגדר והפעל את המודל

  1. התחל את הניסוי השני על ידי בחירה הגדר דגם כדי להגדיר את פרטי ההדרכה של הדגם שלך.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. ב הגדר דגם חלון, בחר מדד אובייקטיבי מחלונית הניווט. בשביל ה מדד אובייקטיבי, השתמש בתפריט הנפתח כדי לבחור דיוק, זה מאפשר לך לראות ולהשוות את כל פלטי הגרסה זה לצד זה.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. בחר שיטת אימון ואלגוריתמים. לבחור אופטימיזציה של היפר-פרמטרים לשיטת האימון. לאחר מכן, גלול מטה כדי לבחור את האלגוריתמים.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. בחר XGBoost עבור האלגוריתם. XGBoost מספק הגברת עץ מקבילה הפותרת בעיות רבות במדעי הנתונים במהירות ובדייקנות, ומציעה מגוון גדול של היפרפרמטרים שניתן לכוונן כדי לשפר ולנצל את מלוא היתרונות של מודל XGBoost.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. בחר פיצול נתונים. עבור מודל זה, הגדר את חלוקת נתוני ההדרכה והאימות ל-70/30.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  6. בחר מקסימום מועמדים וזמן ריצה והגדר את הערכים עבור עבודת HPO ל-20 עבור ה מקסימום מועמדים ושעה אחת עבור זמן ריצה מקסימלי של עבודה. בחר שמור כדי לסיים את הגדרת הדגם השני.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  7. כעת לאחר שהגדרת את הדגם השני, בחר מבנה סטנדרטי ליזום הדרכה.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

SageMaker Canvas משתמש בתצורה כדי להתחיל את עבודת HPO. כמו העבודה הראשונה, עבודת ההדרכה הזו תימשך עד שעה.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

סקור את התוצאות

כאשר עבודת ההדרכה של HPO הושלמה (או שזמן הריצה המקסימלי יפוג), SageMaker Canvas מציג את הפלט של עבודת ההדרכה בהתבסס על מודל ברירת המחדל ומציג את ציון הדיוק של המודל.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

  1. בחרו דגם leaderboard לצפייה ברשימת כל 20 הדגמים המועמדים ממסלול ההדרכה של HPO. המודל הטוב ביותר, המבוסס על המטרה למצוא את הדיוק הטוב ביותר, מסומן כברירת מחדל.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בעוד הדיוק של ה ברירת מחדל הדגם הוא הטוב ביותר, לדגם אחר מהעבודה של HPO יש שטח גבוה יותר מתחת לציון עקומת ROC (AUC). ציון AUC משמש להערכת הביצועים של מודל סיווג בינארי. AUC גבוה יותר מצביע על כך שהמודל טוב יותר בהבחנה בין שתי המחלקות, כאשר 1 הוא ציון מושלם ו-0.5 מצביע על ניחוש אקראי.

  1. השתמש בתפריט ההקשר כדי להפוך את המודל עם ה-AUC הגבוה יותר למודל ברירת המחדל. בחר בתפריט ההקשר של אותו דגם ובחר שנה לדגם ברירת המחדל אפשרות בתפריט השורה כפי שמוצג באיור 31 שלאחר מכן.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

ל- SageMaker Canvas לוקח כמה דקות לשנות את הדגם הנבחר לדגם ברירת המחדל החדש עבור גרסה 2 של הניסוי ולהעביר אותו לראש רשימת הדגמים.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

השוו בין הדגמים

בשלב זה, יש לך שתי גרסאות של הדגם שלך ואתה יכול לראות אותן זו לצד זו על ידי מעבר אל הדוגמניות שלי ב- SageMaker Canvas.

  1. בחר חזה הישרדות על הטיטאניק כדי לראות את גרסאות הדגם הזמינות.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  2. ישנן שתי גרסאות והביצועים שלהן מוצגים בפורמט טבלה להשוואה זו לצד זו.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. אתה יכול לראות שלגרסה 1 של המודל (שהוכשרה באמצעות אלגוריתמים של אנסמבל) יש דיוק טוב יותר. כעת תוכל להשתמש ב- SageMaker Canvas כדי ליצור מחברת SageMaker - עם קוד, הערות והוראות - כדי להתאים אישית את AutoGluon ניסויים והפעל את זרימת העבודה של SageMaker Canvas מבלי לכתוב שורת קוד אחת. אתה יכול ליצור את המחברת של SageMaker על ידי בחירה בתפריט ההקשר ובחירה הצג מחברת.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. המחברת של SageMaker מופיעה בחלון מוקפץ. המחברת עוזרת לך לבדוק ולשנות את הפרמטרים המוצעים על ידי SageMaker Canvas. אתה יכול לבחור באופן אינטראקטיבי אחת מהקונפיגורציות המוצעות על ידי SageMaker Canvas, לשנות אותה ולהפעיל עבודת עיבוד כדי להכשיר מודלים המבוססים על התצורה שנבחרה בסביבת SageMaker Studio.
    בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

הסקה

כעת לאחר שזיהית את הדגם הטוב ביותר, תוכל להשתמש בתפריט ההקשר כדי לפרוס אותו לנקודת קצה להסקת מסקנות בזמן אמת.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

או השתמש בתפריט ההקשר כדי להפעיל את מודל ה-ML שלך בייצור על ידי רישום מודל למידת מכונה (ML) לרישום המודלים של SageMaker.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

ניקוי

כדי להימנע מחיובים עתידיים, מחק את המשאבים שיצרת תוך כדי מעקב אחר פוסט זה. SageMaker Canvas מחייב אותך למשך ההפעלה, ואנו ממליצים לצאת מ- SageMaker Canvas כאשר אינך משתמש בו.

לִרְאוֹת יציאה מאמזון SageMaker Canvas לקבלת פרטים נוספים.

סיכום

SageMaker Canvas הוא כלי רב עוצמה המהווה דמוקרטיזציה של למידת מכונה, ומספק גם מחזיקי עניין לא טכניים וגם למדעני נתונים אזרחיים. התכונות החדשות שהוצגו, כולל תצורות בניית דגמים מתקדמות וטבלת המובילים של הדגם, מעלה את הגמישות והשקיפות של הפלטפורמה. זה מאפשר לך להתאים את מודל למידת המכונה שלך לצרכים עסקיים ספציפיים מבלי להתעמק בקוד. היכולת להתאים אישית שיטות אימון, אלגוריתמים, פיצול נתונים ופרמטרים אחרים מעצימה אותך להתנסות בטכניקות ML שונות, מטפחת הבנה עמוקה יותר של ביצועי המודל.

הצגת לוח המובילים של המודל היא שיפור משמעותי, המספקת סקירה ברורה של מדדי ביצועים מרכזיים עבור תצורות שונות. שקיפות זו מאפשרת למשתמשים לקבל החלטות מושכלות לגבי בחירות מודל ואופטימיזציות. על ידי הצגת כל זרימת העבודה של בניית המודל, כולל שלבי עיבוד מקדים מוצעים, אלגוריתמים וטווחי היפרפרמטרים במחברת, SageMaker Canvas מאפשר הבנה מקיפה של תהליך פיתוח המודל.

כדי להתחיל את מסע ה-ML עם קוד נמוך/ללא קוד, ראה אמזון SageMaker Canvas.

תודה מיוחדת לכל מי שתרם להשקה:

אשה דוטה, אד צ'ונג, מקס קונדרשוב, אלן ג'ונסון, רידים רסטוגי, רנגה רדי פאלרה, רווצ'ן וון, רואונג טיאן, סנדיפן מאנה, רנו רוזרה, ויקאש גארג, ראמש סקאראן וגונג'אן גארג.


על הכותבים

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ג'נישה אנאנד הוא מנהל מוצר בכיר בצוות SageMaker Low/No Code ML, הכולל את SageMaker Canvas ו- SageMaker Autopilot. היא נהנית מקפה, להישאר פעילה ולבלות עם משפחתה.

בנה והעריך מודלים של למידת מכונה עם תצורות מתקדמות באמצעות לוח המודלים של SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.אינדי סווני הוא מוביל בכיר בפתרונות לקוחות עם שירותי האינטרנט של אמזון. אינדי פועלת תמיד לאחור מבעיות לקוחות, ומייעץ למנהלי לקוחות ארגוניים של AWS דרך מסע הטרנספורמציה הייחודי שלהם בענן. יש לו למעלה מ-25 שנות ניסיון בסיוע לארגונים ארגוניים לאמץ טכנולוגיות מתפתחות ופתרונות עסקיים. אינדי הוא מומחה לתחום עומק עם קהילת השדה הטכני של AWS לבינה מלאכותית ולמידת מכונה (AI/ML), עם התמחות ב-AI גנרטיבי ופתרונות SageMaker עם קוד נמוך/ללא קוד (LCNC).

בול זמן:

עוד מ למידת מכונות AWS