ככל שלמידת מכונה (ML) הופכת נפוצה יותר ויותר במגוון רחב של תעשיות, ארגונים מוצאים את הצורך להכשיר ולשרת מספר רב של דגמי ML כדי לענות על הצרכים המגוונים של הלקוחות שלהם. עבור ספקי תוכנה כשירות (SaaS) בפרט, היכולת להכשיר ולשרת אלפי דגמים ביעילות ובעלות אפקטיבית היא חיונית לשמירה על תחרותיות בשוק המתפתח במהירות.
הדרכה והגשה של אלפי דגמים דורשת תשתית חזקה וניתנת להרחבה, וזה המקום אמזון SageMaker יכול לעזור. SageMaker היא פלטפורמה מנוהלת במלואה המאפשרת למפתחים ומדעני נתונים לבנות, לאמן ולפרוס מודלים של ML במהירות, תוך שהיא מציעה גם את היתרונות החיסכון בעלויות של שימוש בתשתית ענן AWS.
בפוסט זה, אנו חוקרים כיצד אתה יכול להשתמש בתכונות של SageMaker, כולל עיבוד אמזון SageMaker, משרות הכשרה של SageMaker ונקודות קצה מרובה מודלים של SageMaker (MME), להכשיר ולשרת אלפי דגמים בצורה חסכונית. כדי להתחיל עם הפתרון המתואר, אתה יכול לעיין במחברת המצורפת על GitHub.
מקרה שימוש: חיזוי אנרגיה
עבור פוסט זה, אנו נוטלים על עצמם את התפקיד של חברת ISV שעוזרת ללקוחות שלהם להיות ברי קיימא על ידי מעקב אחר צריכת האנרגיה שלהם ומתן תחזיות. לחברה שלנו יש 1,000 לקוחות שרוצים להבין טוב יותר את צריכת האנרגיה שלהם ולקבל החלטות מושכלות לגבי איך לצמצם את ההשפעה הסביבתית שלהם. לשם כך, אנו משתמשים במערך נתונים סינתטי ומאמנים מודל ML המבוסס עליו נביא לכל לקוח לבצע תחזיות צריכת אנרגיה. עם SageMaker, אנו יכולים להכשיר ולשרת ביעילות את 1,000 הדגמים הללו, ולספק ללקוחותינו תובנות מדויקות ומעשיות לגבי צריכת האנרגיה שלהם.
ישנן שלוש תכונות במערך הנתונים שנוצר:
- מספר לקוח – זהו מזהה מספר שלם עבור כל לקוח, הנע בין 0–999.
- חותם – זהו ערך תאריך/שעה המציין את השעה שבה נמדדה צריכת האנרגיה. חותמות הזמן נוצרות באופן אקראי בין תאריכי ההתחלה והסיום המצוינים בקוד.
- צְרִיכָה – זהו ערך צף המציין את צריכת האנרגיה, הנמדדת ביחידה שרירותית כלשהי. ערכי הצריכה נוצרים באקראי בין 0-1,000 עם עונתיות סינוסואידית.
סקירת פתרונות
כדי לאמן ולשרת ביעילות אלפי דגמי ML, אנו יכולים להשתמש בתכונות הבאות של SageMaker:
- עיבוד SageMaker – SageMaker Processing הוא שירות הכנת נתונים מנוהל במלואו המאפשר לך לבצע משימות עיבוד נתונים והערכת מודלים על נתוני הקלט שלך. אתה יכול להשתמש ב- SageMaker Processing כדי להפוך נתונים גולמיים לפורמט הדרוש להדרכה והסקת מסקנות, כמו גם להפעיל הערכות אצווה ומקוונות של המודלים שלך.
- משרות הדרכה של SageMaker - אתה יכול להשתמש בעבודות אימון של SageMaker כדי להכשיר מודלים על מגוון אלגוריתמים וסוגי נתוני קלט, ולציין את משאבי המחשוב הדרושים להדרכה.
- MME של SageMaker - נקודות קצה מרובות מודלים מאפשרות לך לארח מודלים מרובים בנקודת קצה אחת, מה שמקל על הגשת תחזיות ממספר מודלים באמצעות API אחד. SageMaker MMEs יכולים לחסוך זמן ומשאבים על ידי הפחתת מספר נקודות הקצה הדרושים לשרת תחזיות ממספר מודלים. MMEs תומכים באירוח של דגמים מגובי CPU ו-GPU כאחד. שימו לב שבתרחיש שלנו, אנו משתמשים ב-1,000 דגמים, אך זו אינה מגבלה של השירות עצמו.
התרשים הבא ממחיש את ארכיטקטורת הפתרונות.
זרימת העבודה כוללת את השלבים הבאים:
- אנו משתמשים ב-SageMaker Processing כדי לעבד נתונים מראש וליצור קובץ CSV בודד לכל לקוח ולאחסן אותו שירות אחסון פשוט של אמזון (אמזון S3).
- עבודת ההדרכה של SageMaker מוגדרת לקרוא את הפלט של עבודת SageMaker Processing ולהפיץ אותה באופן סיבובי למופעי ההדרכה. שימו לב שניתן להשיג זאת גם עם צינורות SageMaker של אמזון.
- חפצי הדגם מאוחסנים באמזון S3 על ידי עבודת ההדרכה, ומוגשים ישירות מה- SageMaker MME.
קנה מידה של הכשרה לאלפי דגמים
קנה המידה של ההכשרה של אלפי דגמים אפשרי באמצעות distribution
פרמטר של קלט הדרכה מחלקה ב-SageMaker Python SDK, המאפשרת לך לציין כיצד הנתונים מחולקים על פני מספר מופעי אימון עבור עבודת הדרכה. יש שלוש אפשרויות עבור distribution
פָּרָמֶטֶר: FullyReplicated
, ShardedByS3Key
, ו ShardedByRecord
. ה ShardedByS3Key
אפשרות פירושה שנתוני האימון מחולקים על ידי מפתח אובייקט S3, כאשר כל מופע אימון מקבל תת-קבוצה ייחודית של הנתונים, תוך הימנעות שכפול. לאחר העתקת הנתונים על ידי SageMaker למכולות ההדרכה, נוכל לקרוא את מבנה התיקיות והקבצים כדי להכשיר דגם ייחודי לכל קובץ לקוח. להלן קטע קוד לדוגמה:
כל עבודת הכשרה של SageMaker מאחסנת את הדגם שנשמר ב- /opt/ml/model
תיקייה של מיכל ההדרכה לפני ארכיון ב-a model.tar.gz
קובץ, ולאחר מכן מעלה אותו לאמזון S3 עם סיום עבודת ההדרכה. משתמשי כוח יכולים גם להפוך תהליך זה לאוטומטי עם SageMaker Pipelines. כאשר מאחסנים מספר דגמים באמצעות אותה עבודת הדרכה, SageMaker יוצר יחיד model.tar.gz
קובץ המכיל את כל הדגמים המיומנים. זה אומר שכדי לשרת את המודל, נצטרך לפרק את הארכיון תחילה. כדי להימנע מכך, אנו משתמשים מחסומים כדי לשמור את המצב של דגמים בודדים. SageMaker מספק את הפונקציונליות להעתיק נקודות ביקורת שנוצרו במהלך עבודת ההדרכה לאמזון S3. כאן, יש לשמור את המחסומים במיקום מוגדר מראש, כאשר ברירת המחדל היא /opt/ml/checkpoints
. ניתן להשתמש בנקודות ביקורת אלו לחידוש האימונים ברגע מאוחר יותר או כמודל לפריסה בנקודת קצה. לסיכום ברמה גבוהה של האופן שבו פלטפורמת ההדרכה של SageMaker מנהלת נתיבי אחסון עבור מערכי נתונים, חפצי מודל, נקודות ביקורת ופלטים בין אחסון בענן AWS ועבודות הדרכה ב- SageMaker, עיין ב- אמזון SageMaker תיקיות אחסון הדרכה עבור מערכי נתונים, מחסומים, חפצי מודל ופלטים.
הקוד הבא משתמש בקוד פיקטיבי model.save()
פונקציה בתוך train.py
סקריפט המכיל את היגיון האימון:
קנה מידה של מסקנות לאלפי דגמים עם MME של SageMaker
SageMaker MMEs מאפשרים לך לשרת מספר דגמים בו-זמנית על ידי יצירת תצורת נקודת קצה הכוללת רשימה של כל המודלים לשרת, ולאחר מכן יצירת נקודת קצה באמצעות תצורת נקודת קצה זו. אין צורך לפרוס מחדש את נקודת הקצה בכל פעם שאתה מוסיף מודל חדש מכיוון שנקודת הקצה תשרת אוטומטית את כל הדגמים המאוחסנים בנתיבי S3 שצוינו. זה מושג עם שרת רב מודל (MMS), מסגרת קוד פתוח לשרת דגמי ML שניתן להתקין בקונטיינרים כדי לספק את הקצה הקדמי שממלא את הדרישות עבור ממשקי ה-API החדשים של מיכלי MME. בנוסף, אתה יכול להשתמש בשרתים אחרים, כולל לפידרבס ו טריטון. ניתן להתקין MMS במיכל המותאם אישית שלך באמצעות ערכת הכלים של SageMaker Inference. למידע נוסף על איך להגדיר את Dockerfile שלך לכלול MMS ולהשתמש בו כדי לשרת את הדגמים שלך, עיין ב בנה מיכל משלך עבור נקודות קצה מרובות של SageMaker.
קטע הקוד הבא מראה כיצד ליצור MME באמצעות SageMaker Python SDK:
כאשר ה-MME פעיל, אנו יכולים להפעיל אותו כדי ליצור תחזיות. ניתן לבצע הפעלות בכל SDK של AWS וכן עם SageMaker Python SDK, כפי שמוצג בקטע הקוד הבא:
בעת קריאה לדגם, הדגם נטען בתחילה מאמזון S3 במופע, מה שעלול לגרום להתחלה קרה בעת קריאה לדגם חדש. דגמים בשימוש תכוף מאוחסנים במטמון בזיכרון ובדיסק כדי לספק הסקת השהייה נמוכה.
סיכום
SageMaker היא פלטפורמה חזקה וחסכונית להדרכה והגשה של אלפי דגמי ML. התכונות שלו, כולל SageMaker Processing, משרות הדרכה ו-MMEs, מאפשרות לארגונים להכשיר ולשרת ביעילות אלפי דגמים בקנה מידה, תוך שהם גם נהנים מהיתרונות החיסכון בעלויות של שימוש בתשתית ענן AWS. למידע נוסף על אופן השימוש ב- SageMaker להדרכה והגשה של אלפי דגמים, עיין ב עיבוד נתונים, אימון דגם עם Amazon SageMaker ו ארח מספר דגמים במיכל אחד מאחורי נקודת קצה אחת.
על הכותבים
דויד גליטלי הוא אדריכל פתרונות מומחה עבור AI/ML באזור EMEA. הוא מבוסס בבריסל ועובד בשיתוף פעולה הדוק עם לקוחות ברחבי בנלוקס. הוא מפתח מאז שהיה צעיר מאוד, התחיל לקוד בגיל 7. הוא התחיל ללמוד AI/ML באוניברסיטה, ומאז התאהב בזה.
מאוריט דה גרוט הוא ארכיטקט פתרונות ב- Amazon Web Services, שבסיסה באמסטרדם. הוא אוהב לעבוד על נושאים הקשורים ללמידה במכונה ויש לו נטייה לסטארטאפים. בזמנו הפנוי הוא אוהב לעשות סקי ולשחק סקווש.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. רכב / רכבים חשמליים, פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- BlockOffsets. מודרניזציה של בעלות על קיזוז סביבתי. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/scale-training-and-inference-of-thousands-of-ml-models-with-amazon-sagemaker/
- :יש ל
- :הוא
- :לֹא
- :איפה
- 000
- 000 לקוחות
- 1
- 10
- 100
- 12
- 15%
- 20
- 7
- a
- יכולת
- אודות
- מדויק
- הושג
- לרוחב
- להוסיף
- תוספת
- יתרונות
- לאחר
- גיל
- AI / ML
- אלגוריתמים
- תעשיות
- להתיר
- מאפשר
- כְּבָר
- גם
- אמזון בעברית
- אמזון SageMaker
- אמזון שירותי אינטרנט
- אמסטרדם
- an
- ו
- כל
- API
- ממשקי API
- ארכיטקטורה
- ארכיון
- ARE
- טענה
- AS
- לְהַנִיחַ
- At
- אוטומטי
- באופן אוטומטי
- לְהִמָנַע
- הימנעות
- AWS
- מבוסס
- BE
- כי
- להיות
- הופך להיות
- היה
- לפני
- מאחור
- להיות
- מרוויח
- הטבות
- מוטב
- בֵּין
- שניהם
- בריסל
- לִבנוֹת
- אבל
- by
- קוראים
- CAN
- מקרה
- בכיתה
- מקרוב
- ענן
- תשתית ענן
- אחסון ענן
- קוד
- קר
- חברה
- תחרותי
- השלמה
- לחשב
- תְצוּרָה
- מוגדר
- צְרִיכָה
- מכולה
- מכולות
- עלות תועלת
- לִיצוֹר
- נוצר
- יוצר
- יוצרים
- מכריע
- מנהג
- לקוח
- לקוחות
- נתונים
- הכנת נתונים
- עיבוד נתונים
- מערכי נתונים
- תאריכים
- החלטות
- בְּרִירַת מֶחדָל
- לְהַגדִיר
- הגדרה
- לפרוס
- מְתוּאָר
- מפתח
- מפתחים
- ישירות
- מציג
- לְהָפִיץ
- מופץ
- שונה
- do
- עשה
- בְּמַהֲלָך
- כל אחד
- קל
- יעילות
- EMEA
- לאפשר
- מאפשר
- סוף
- נקודת קצה
- אנרגיה
- צריכת אנרגיה
- סביבתי
- הערכה
- הערכות
- כל
- מתפתח
- דוגמה
- לחקור
- נָפוּל
- אופנה
- תכונות
- שלח
- קבצים
- מציאת
- ראשון
- לָצוּף
- הבא
- בעד
- לסטארטאפים
- תחזיות
- פוּרמָט
- מסגרת
- בתדירות גבוהה
- החל מ-
- חזית
- חזיתי
- לגמרי
- פונקציה
- פונקציונלי
- ליצור
- נוצר
- לקבל
- GitHub
- he
- לעזור
- עוזר
- כאן
- ברמה גבוהה
- שֶׁלוֹ
- המארח
- אירוח
- איך
- איך
- HTML
- http
- HTTPS
- מזהה
- מדגים
- פְּגִיעָה
- לייבא
- in
- לכלול
- כולל
- כולל
- יותר ויותר
- מצביע על
- בנפרד
- תעשיות
- הודעה
- תשתית
- בהתחלה
- קלט
- תשומות
- בתוך
- תובנות
- מותקן
- למשל
- אל תוך
- IT
- שֶׁלָה
- עצמו
- עבודה
- מקומות תעסוקה
- jpg
- ג'סון
- מפתח
- גָדוֹל
- מאוחר יותר
- לִלמוֹד
- למידה
- אוהב
- הגבלה
- רשימה
- לחיות
- באופן מקומי
- מיקום
- הגיון
- אהבה
- מכונה
- למידת מכונה
- לעשות
- עושה
- הצליח
- מצליח
- שוק
- אומר
- אומר
- לִפְגוֹשׁ
- זכרון
- ML
- מודל
- מודלים
- רֶגַע
- יותר
- מספר
- שם
- צורך
- נחוץ
- צרכי
- חדש
- לא
- מחברה
- מספר
- מספרים
- אובייקט
- of
- הצעה
- on
- ONE
- באינטרנט
- קוד פתוח
- אפשרות
- אפשרויות
- or
- להזמין
- ארגונים
- OS
- אחר
- שלנו
- החברה שלנו
- הַחוּצָה
- תפוקה
- שֶׁלוֹ
- פרמטר
- מסוים
- לעבור
- נתיב
- עבור
- לְבַצֵעַ
- תקופה
- תמונה
- פלטפורמה
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- משחק
- אפשרי
- הודעה
- כּוֹחַ
- חזק
- התחזיות
- חיזוי
- הכנה
- נפוץ
- תהליך
- תהליך
- לספק
- ספקים
- מספק
- מתן
- פיתון
- מהירות
- נוצר באופן אקראי
- רכס
- טִוּוּחַ
- מהר
- חי
- חומר עיוני
- זמן אמת
- קבלה
- להפחית
- הפחתה
- באזור
- דרישות
- דורש
- משאבים
- תוצאה
- קורות חיים
- חָסוֹן
- תפקיד
- הפעלה
- SaaS
- בעל חכמים
- צינורות SageMaker
- אותו
- שמור
- להרחבה
- סולם
- תרחיש
- מדענים
- Sdk
- לשרת
- שרתים
- שרות
- שירותים
- הגשה
- סט
- מגולף
- הראה
- הופעות
- פָּשׁוּט
- since
- יחיד
- קטע
- תוכנה
- תוכנה כשירות
- פִּתָרוֹן
- פתרונות
- כמה
- מומחה
- מפורט
- התחלה
- החל
- החל
- חברות סטארט
- מדינה
- צעדים
- אחסון
- חנות
- מאוחסן
- חנויות
- אחסון
- מִבְנֶה
- סיכום
- תמיכה
- בר קיימא
- סינטטי
- יעד
- משימות
- זֶה
- השמיים
- המדינה
- שֶׁלָהֶם
- אז
- שם.
- אלה
- זֶה
- אלפים
- שְׁלוֹשָׁה
- בכל
- זמן
- ל
- נושאים
- מעקב
- רכבת
- מְאוּמָן
- הדרכה
- לשנות
- סוגים
- להבין
- ייחודי
- יחידה
- אוניברסיטה
- על
- נוֹהָג
- להשתמש
- מְשׁוּמָשׁ
- משתמשים
- שימושים
- באמצעות
- ערך
- ערכים
- מגוון
- מאוד
- באמצעות
- W
- רוצה
- היה
- דֶרֶך..
- we
- אינטרנט
- שירותי אינטרנט
- טוֹב
- מתי
- אשר
- בזמן
- מי
- רָחָב
- טווח רחב
- יצטרך
- עם
- בתוך
- תיק עבודות
- זרימת עבודה
- עובד
- היה
- אתה
- צעיר
- זפירנט