בין אם אתה מקצה משאבים בצורה יעילה יותר עבור תעבורת אינטרנט, תחזית דרישת מטופלים לצרכי כוח אדם, או צופה מכירות של מוצרי חברה, חיזוי הוא כלי חיוני בעסקים רבים. מקרה שימוש אחד מסוים, המכונה חיזוי התחלה קרה, בונה תחזיות לסדרת זמן שיש בה מעט נתונים היסטוריים קיימים או ללא נתונים היסטוריים קיימים, כגון מוצר חדש שזה עתה נכנס לשוק בענף הקמעונאות. שיטות חיזוי סדרות זמן מסורתיות כגון ממוצע נע משולב אוטומטי (ARIMA) או החלקה מעריכית (ES) מסתמכות במידה רבה על סדרות זמן היסטוריות של כל מוצר בנפרד, ולכן אינן יעילות עבור חיזוי התחלה קרה.
בפוסט זה, אנו מדגימים כיצד לבנות מנוע חיזוי התחלה קרה באמצעות AutoGluon AutoML לחיזוי סדרות זמן, חבילת Python בקוד פתוח לאוטומטיות של למידת מכונה (ML) בנתוני תמונה, טקסט, טבלאות וסדרות זמן. AutoGluon מספקת צינור למידת מכונה אוטומטית (AutoML) מקצה לקצה למפתחי ML מתחילים ועד מנוסים, מה שהופך אותו לפתרון האוטומטי המלא המדויק והקל לשימוש. אנחנו משתמשים בחינם Amazon SageMaker Studio Lab שירות להפגנה זו.
מבוא לסדרת הזמן של AutoGluon
AutoGluon היא ספריית קוד פתוח מובילה עבור AutoML עבור טקסט, תמונה ונתונים טבלאיים, המאפשרת לך לייצר מודלים מדויקים ביותר מנתונים גולמיים עם שורת קוד אחת בלבד. לאחרונה, הצוות עבד להרחיב את היכולות הללו לנתוני סדרות זמן, ופיתח מודול חיזוי אוטומטי הזמין לציבור ב GitHub. ה autogluon.forecasting
המודול מעבד אוטומטית נתונים גולמיים של סדרות זמן לפורמט המתאים, ולאחר מכן מאמן ומכוון מודלים שונים של למידה עמוקה מתקדמים כדי לייצר תחזיות מדויקות. בפוסט זה, אנו מדגימים כיצד להשתמש autogluon.forecasting
ולהחיל אותו על משימות חיזוי של התחלה קרה.
סקירת פתרונות
מכיוון ש-AutoGluon היא חבילת Python בקוד פתוח, אתה יכול ליישם את הפתרון הזה באופן מקומי במחשב הנייד שלך או ב-Amazon SageMaker Studio Lab. אנו עוברים על השלבים הבאים:
- הגדר את AutoGluon עבור Amazon SageMaker Studio Lab.
- הכן את מערך הנתונים.
- הגדר פרמטרי אימון באמצעות AutoGluon.
- הרכבת מנוע חיזוי התחלה קרה לחיזוי סדרות זמן.
- דמיין תחזיות של התחלה קרה.
הנחת המפתח של חיזוי התחלה קרה היא שלפריטים בעלי מאפיינים דומים צריכים להיות מסלולי סדרת זמן דומים, וזה מה שמאפשר לחיזוי התחלה קרה לבצע תחזיות על פריטים ללא נתונים היסטוריים, כפי שמודגם באיור הבא.
בהליכה שלנו, אנו משתמשים במערך נתונים סינתטי המבוסס על צריכת חשמל, המורכב מסדרת הזמן השעתית עבור 370 פריטים, כל אחד עם item_id
בין 0-369. בתוך מערך הנתונים הסינטטי הזה, כל אחד item_id
משויך גם לתכונה סטטית (תכונה שאינה משתנה עם הזמן). אנו מאמנים א DeepAR מודל באמצעות AutoGluon כדי ללמוד את ההתנהגות האופיינית של פריטים דומים, ולהעביר התנהגות כזו כדי ליצור תחזיות על פריטים חדשים (item_id
370–373) שאין להם נתונים היסטוריים של סדרות זמן. למרות שאנו מדגימים את גישת חיזוי ההתחלה הקרה עם תכונה סטטית אחת בלבד, בפועל, תכונות סטטיות אינפורמטיביות ואיכותיות הן המפתח לתחזית טובה להתחלה קרה.
התרשים הבא מספק סקירה כללית ברמה גבוהה של הפתרון שלנו. קוד הקוד הפתוח זמין ב- GitHub ריפו.
תנאים מוקדמים
לפריצת דרך זו, יהיו עליכם התנאים המוקדמים הבאים:
- An חשבון Amazon SageMaker Studio Lab
- GitHub גישה לחשבון
היכנס לחשבון Amazon SageMaker Studio Lab שלך והגדר את הסביבה באמצעות הטרמינל:
הוראות אלה אמורות לעבוד גם מהמחשב הנייד שלך אם אין לך גישה למעבדת אמזון SageMaker Studio (אנו ממליצים קודם להתקין את Anaconda במחשב הנייד שלך).
כאשר הסביבה הוירטואלית מוגדרת במלואה, הפעל את המחברת AutoGluon-cold-start-demo.ipynb
ובחר את הסביבה המותאמת אישית .conda-autogluon:Python
גַרעִין.
הכן את סדרת זמן היעד ואת מטא הנתונים של הפריטים
הורד את מערכי הנתונים הבאים למופע המחברת שלך אם הם לא כלולים, ושמור אותם תחת הספרייה data/
. אתה יכול למצוא מערכי נתונים אלה אצלנו GitHub ריפו:
- Test.csv.gz
- coldStartTargetData.csv
- itemMetaData.csv
הפעל את הקטע הבא כדי לטעון את מערך הנתונים של סדרת זמן היעד לתוך הליבה:
סדרת זמן של AutoGluon דורשת שתכונות סטטיות יהיו מיוצגות בפורמט מספרי. ניתן להשיג זאת באמצעות יישום LabelEncoder()
על התכונה הסטטית שלנו type
, שבו אנו מקודדים A=0, B=1, C=2, D=3 (ראה את הקוד הבא). כברירת מחדל, AutoGluon מסיק שהתכונה הסטטית היא סידורית או קטגורית. אתה יכול גם להחליף את זה על ידי המרת עמודת התכונה הסטטית להיות סוג נתוני האובייקט/מחרוזת עבור תכונות קטגוריות, או סוג נתונים של מספר שלם/צף עבור תכונות סידוריות.
הגדר והתחל אימון מודל AutoGluon
אנחנו צריכים לפרט save_path = ‘autogluon-coldstart-demo’
כשם תיקיית חפץ הדגם (ראה את הקוד הבא). אנחנו גם קבענו את שלנו eval_metric
as ממוצע טעות באחוזים מוחלטים, או ‘MAPE’
בקיצור, איפה שהגדרנו prediction_length
כמו 24 שעות. אם לא צוין, AutoGluon כברירת מחדל מייצרת תחזיות הסתברותיות וקובעת אותן באמצעות אובדן כמות משוקלל. אנחנו מסתכלים רק על דגם DeepAR בהדגמה שלנו, מכיוון שאנו יודעים שאלגוריתם DeepAR מאפשר חיזוי התחלה קרה לפי תכנון. אנחנו מגדירים את אחד מפרמטרי ההיפרפרמטרים של DeepAR באופן שרירותי ומעבירים את ההיפרפרמטר הזה ל- ForecastingPredictor().fit()
שִׂיחָה. זה מאפשר ל-AutoGluon להסתכל רק על הדגם שצוין. לרשימה מלאה של היפרפרמטרים הניתנים לשינוי, עיין ב חבילת gluonts.model.deepar.
משך האימון 30-45 דקות. אתה יכול לקבל את סיכום הדגם על ידי קריאה לפונקציה הבאה:
תחזית על פריט ההתחלה הקרה
כעת אנו מוכנים להפיק תחזיות עבור פריט ההתחלה הקרה. אנו ממליצים להחזיק לפחות חמש שורות לכל אחת item_id
. לכן, עבור item_id
שיש לו פחות מחמש תצפיות, אנו ממלאים ב-NaNs. בהדגמה שלנו, שניהם item_id
ל-370 ול-372 יש אפס תצפית, בעיית התחלה קרה טהורה, בעוד שלשניים האחרים יש חמישה ערכי יעד.
טען במערך הנתונים של סדרת הזמן של יעד התחלה קרה עם הקוד הבא:
אנו מזינים את סדרת הזמן של יעד ההתחלה הקרה למודל AutoGluon שלנו, יחד עם מערך הנתונים המטא של הפריט עבור ההתחלה הקרה item_id
:
דמיינו את התחזיות
אנו יכולים ליצור פונקציית תכנון כדי ליצור הדמיה על חיזוי ההתחלה הקרה, כפי שמוצג בגרף הבא.
לנקות את
כדי לייעל את השימוש במשאבים, שקול להפסיק את זמן הריצה ב-Amazon SageMaker Studio Lab לאחר שתחקור את המחברת במלואה.
סיכום
בפוסט זה, הראינו כיצד לבנות מנוע חיזוי התחלה קרה באמצעות AutoGluon AutoML עבור נתוני סדרות זמן במעבדת אמזון SageMaker Studio. לאלו מכם שתוהים מה ההבדל ביניהם תחזית אמזון ו-AutoGluon (סדרות זמן), Amazon Forecast הוא שירות מנוהל ונתמך במלואו המשתמש בלמידה חישובית (ML) כדי ליצור תחזיות מדויקות ביותר מבלי לדרוש ניסיון קודם ב-ML. בעוד AutoGluon הוא פרויקט בקוד פתוח שנתמך על ידי הקהילה עם תרומות המחקר האחרונות. עברנו על דוגמה מקצה לקצה כדי להדגים למה AutoGluon עבור סדרות זמן מסוגלת, וסיפקנו מערך נתונים ומקרה שימוש.
AutoGluon לנתוני סדרות זמן היא חבילת Python בקוד פתוח, ואנו מקווים שהפוסט הזה, יחד עם דוגמה הקוד שלנו, ייתן לך פתרון פשוט להתמודדות עם בעיות חיזוי של התחלה קרה מאתגרת. אתה יכול לגשת לכל הדוגמה שלנו GitHub ריפו. נסה את זה, וספר לנו מה אתה חושב!
על הכותבים
איוון קוי הוא מדען נתונים עם שירותי AWS Professional, שם הוא מסייע ללקוחות לבנות ולפרוס פתרונות באמצעות למידת מכונה ב- AWS. הוא עבד עם לקוחות בתעשיות מגוונות, כולל תוכנות, פיננסים, תרופות, ובריאות. בזמנו הפנוי הוא נהנה לקרוא, לבלות עם משפחתו ולמקסם את תיק המניות שלו.
יונאס מולר הוא מדען יישומי בכיר בקבוצת מחקר וחינוך בינה מלאכותית ב-AWS, שם הוא מפתח אלגוריתמים חדשים לשיפור למידה עמוקה ופיתוח למידת מכונה אוטומטית. לפני שהצטרף ל-AWS לדמוקרטיזציה של ML, הוא השלים את הדוקטורט שלו במעבדת מדעי המחשב והבינה המלאכותית של MIT. בזמנו הפנוי הוא נהנה לחקור הרים וחיק הטבע.
Wenming Ye הוא מנהל מוצר מחקר ב-AWS AI. הוא נלהב לעזור לחוקרים וללקוחות ארגוניים להגדיל במהירות את החידושים שלהם באמצעות קוד פתוח וטכנולוגיית למידת מכונה מתקדמת. ל-Wenming ניסיון מו"פ מגוון מ-Microsoft Research, צוות ההנדסה של SQL וסטארטאפים מצליחים.
- "
- 100
- 9
- אודות
- מוּחלָט
- גישה
- חֶשְׁבּוֹן
- מדויק
- הושג
- לרוחב
- AI
- ai מחקר
- אַלגוֹרִיתְם
- אלגוריתמים
- מאפשר
- למרות
- אמזון בעברית
- מריחה
- גישה
- מלאכותי
- בינה מלאכותית
- אוטומטי
- זמין
- מְמוּצָע
- AWS
- לִבנוֹת
- בונה
- עסקים
- שיחה
- יכול לקבל
- יכולות
- CD
- שינוי
- לתשלום
- קוד
- טור
- קהילה
- של החברה
- מדעי מחשב
- צְרִיכָה
- לקוחות
- נתונים
- מדען נתונים
- דרישה
- לפרוס
- עיצוב
- לפתח
- מפותח
- מפתחים
- לא
- חינוך
- אפקטיבי
- חשמל
- הנדסה
- נכנס
- מִפְעָל
- סביבה
- חיוני
- דוגמה
- ניסיון
- מנוסה
- להאריך
- משפחה
- מאפיין
- תכונות
- תרשים
- לממן
- ראשון
- הבא
- פוּרמָט
- חופשי
- מלא
- פונקציה
- עתיד
- ליצור
- Git
- טוב
- קְבוּצָה
- יש
- בריאות
- עוזר
- מאוד
- היסטורי
- איך
- איך
- HTTPS
- תמונה
- ליישם
- לשפר
- כלול
- כולל
- בנפרד
- תעשיות
- תעשייה
- משולב
- מוֹדִיעִין
- IT
- מפתח
- ידוע
- מחשב נייד
- האחרון
- לשגר
- מוביל
- לִלמוֹד
- למידה
- סִפְרִיָה
- קו
- רשימה
- קְצָת
- לִטעוֹן
- מכונה
- למידת מכונה
- עשייה
- מנהל
- שוק
- meta
- מיקרוסופט
- MIT
- ML
- מודל
- מודלים
- רוב
- נע
- מוצר חדש
- מחברה
- קוד קוד פתוח
- אחר
- בחוץ
- אחוזים
- התרופות
- תיק עבודות
- התחזיות
- בעיה
- בעיות
- תהליכים
- לייצר
- המוצר
- מוצרים
- מקצועי
- פּרוֹיֶקט
- מספק
- R & D
- חי
- קריאה
- להמליץ
- מחקר
- משאב
- משאבים
- קמעוני
- מכירות
- סולם
- דרוג
- מדע
- מַדְעָן
- סדרה
- שרות
- שירותים
- סט
- קצר
- דומה
- תוכנה
- פתרונות
- הוצאה
- התחלה
- חברות סטארט
- מניות
- סטודיו
- מוצלח
- נתמך
- יעד
- משימות
- נבחרת
- טכנולוגיה
- מסוף
- דרך
- זמן
- יַחַד
- מסורתי
- תְנוּעָה
- הדרכה
- רכבות
- us
- להשתמש
- וירטואלי
- ראיה
- אינטרנט
- מה
- מי
- בתוך
- לְלֹא
- תיק עבודות
- עבד
- עובד
- אפס