האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | שירותי האינטרנט של אמזון

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | שירותי האינטרנט של אמזון

אמזון SageMaker Canvas הוא ממשק חזותי המאפשר לאנליסטים עסקיים ליצור חיזויים מדויקים של למידת מכונה (ML) בעצמם, מבלי לדרוש ניסיון ב-ML או צורך לכתוב שורת קוד אחת. ממשק המשתמש האינטואיטיבי של SageMaker Canvas מאפשר לאנליסטים עסקיים לגלוש ולגשת למקורות נתונים שונים בענן או במקום, להכין ולחקור את הנתונים, לבנות ולהכשיר מודלים של ML, וליצור תחזיות מדויקות בתוך סביבת עבודה אחת.

SageMaker Canvas מאפשר לאנליסטים להשתמש בעומסי עבודה שונים של נתונים כדי להשיג את התוצאות העסקיות הרצויות עם דיוק וביצועים גבוהים. דרישות המחשוב, האחסון והזיכרון ליצירת תחזיות מדויקות מופשטות ממשתמש הקצה, ומאפשרות לו להתמקד בבעיה העסקית שיש לפתור. מוקדם יותר השנה, אנחנו הודיע אופטימיזציות של ביצועים המבוססות על משוב מלקוחות כדי לספק זמני אימון מודלים מהירים ומדויקים יותר עם SageMaker Canvas.

בפוסט זה, אנו מראים כיצד SageMaker Canvas יכולה כעת לעבד נתונים, לאמן מודלים וליצור תחזיות במהירות וביעילות מוגברת עבור גדלי נתונים שונים.

תנאים מוקדמים

אם תרצו לעקוב, השלם את התנאים המוקדמים הבאים:

  1. יש חשבון AWS.
  2. הגדר את SageMaker Canvas. להנחיות, עיין ב תנאים מוקדמים להגדרת Amazon SageMaker Canvas.
  3. הורד את שני מערכי הנתונים הבאים למחשב המקומי שלך. הראשון הוא ה מערך נתונים של טיול מוניות צהוב של NYC; השני הוא ה נתוני התנהגות מסחר אלקטרוני על קמעונאות אירועים הקשורים למוצרים ולמשתמשים.

שני מערכי הנתונים נמצאים תחת רישיון Attribution 4.0 International (CC BY 4.0). והם חופשיים לשתף ולהתאים.

שיפורים בעיבוד נתונים

עם אופטימיזציות ביצועים בסיסיות, הזמן לייבא נתונים לתוך SageMaker Canvas השתפר ביותר מ-70%. כעת תוכל לייבא מערכי נתונים של עד 2 GB תוך כ-50 שניות ועד 5 GB תוך כ-65 שניות.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

לאחר ייבוא ​​נתונים, אנליסטים עסקיים בדרך כלל מאמתים את הנתונים כדי לוודא שלא נמצאו בעיות במערך הנתונים. בדיקות אימות לדוגמה יכולות להיות להבטיח שעמודות מכילות את סוג הנתונים הנכון, לראות אם טווחי הערכים תואמים את הציפיות, לוודא שיש ייחודיות בערכים היכן שניתן, ואחרים.

אימות הנתונים מהיר יותר כעת. בבדיקות שלנו, כל האימותים ארכו 50 שניות עבור מערך הנתונים של המוניות שגודלו עולה על 5 GB, שיפור של פי 10 במהירות.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

שיפורי אימון במודל

אופטימיזציות הביצועים הקשורות לאימון מודל ML ב- SageMaker Canvas מאפשרות לך כעת לאמן מודלים מבלי להיתקל בכשלים פוטנציאליים בבקשות מחוץ לזיכרון.

צילום המסך הבא מציג את התוצאות של ריצת בנייה מוצלחת באמצעות מערך נתונים גדול את ההשפעה של total_amount תכונה במשתנה היעד.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

שיפורים במסקנות

לבסוף, שיפורים בהסקת SageMaker Canvas השיגו הפחתה של פי 3.5 בצריכת זיכרון במקרה של מערכי נתונים גדולים יותר בבדיקה הפנימית שלנו.

סיכום

בפוסט זה ראינו שיפורים שונים עם SageMaker Canvas בייבוא, אימות, הדרכה והסקת מסקנות. ראינו עלייה ביכולת שלה לייבא מערכי נתונים גדולים ב-70%. ראינו שיפור של פי 10 באימות הנתונים, והפחתה של פי 3.5 בצריכת הזיכרון. שיפורים אלו מאפשרים לך לעבוד טוב יותר עם מערכי נתונים גדולים ולצמצם זמן בעת ​​בניית מודלים של ML עם SageMaker Canvas.

אנו ממליצים לך לחוות את השיפורים בעצמך. נשמח לקבל את המשוב שלך מכיוון שאנו עובדים ללא הרף על אופטימיזציית ביצועים כדי לשפר את חווית המשתמש.


על המחברים

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.פיטר צ'ונג הוא אדריכל פתרונות עבור AWS, ונלהב לעזור ללקוחות לחשוף תובנות מהנתונים שלהם. הוא בנה פתרונות שיעזרו לארגונים לקבל החלטות מונעות נתונים הן במגזר הציבורי והן במגזר הפרטי. הוא מחזיק בכל אישורי AWS וכן בשתי אישורי GCP. הוא נהנה מקפה, מבישול, להישאר פעיל ולבלות עם משפחתו.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.טים סונג הוא מהנדס פיתוח תוכנה ב-AWS SageMaker, עם 10+ שנות ניסיון כמפתח תוכנה, יועץ ומוביל טכנולוגיה, הוא הוכיח יכולת לספק מוצרים ניתנים להרחבה ואמינים ולפתור בעיות מורכבות. בזמנו הפנוי הוא נהנה מהטבע, ריצה בחוץ, טיולים וכו'.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.הריהראן סורש הוא אדריכל פתרונות בכיר ב-AWS. הוא נלהב מבסיסי נתונים, למידת מכונה ועיצוב פתרונות חדשניים. לפני שהצטרף ל-AWS, הריהראן היה ארכיטקט מוצר, מומחה ליישום בנקאות ליבה ומפתח, ועבד עם ארגוני BFSI במשך יותר מ-11 שנים. מחוץ לטכנולוגיה, הוא נהנה מצנחי רחיפה ורכיבה על אופניים.

האץ את התוצאות העסקיות עם שיפורי ביצועים של 70% לעיבוד נתונים, הדרכה והסקת מסקנות עם Amazon SageMaker Canvas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.מאיה היילה הוא אדריכל פתרונות בשירותי האינטרנט של אמזון המבוסס באזור וושינגטון הבירה. בתפקיד זה, היא עוזרת ללקוחות במגזר הציבורי להשיג את יעדי המשימה שלהם עם פתרונות מתוכננים היטב ב-AWS. יש לה ניסיון של 5 שנים החל משירותי בריאות ללא מטרות רווח, מדיה ובידור וקמעונאות. התשוקה שלה היא מינוף אינטליגנציה (AI) ולמידת מכונה (ML) כדי לעזור ללקוחות במגזר הציבורי להשיג את היעדים העסקיים והטכניים שלהם.

בול זמן:

עוד מ למידת מכונות AWS