חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

חיזוי קל ומדויק עם AutoGluon-TimeSeries

AutoGluon-TimeSeries היא התוספת האחרונה ל-AutoGluon, שעוזרת לך לבנות בקלות מודלים עוצמתיים לחיזוי סדרות זמן עם שלוש שורות קוד בלבד.

חיזוי סדרות זמן היא משימה נפוצה במגוון רחב של תעשיות כמו גם בתחומים מדעיים. גישה לתחזיות אמינות עבור היצע, ביקוש או קיבולת היא חיונית לתכנון עבור עסקים. עם זאת, חיזוי סדרות זמן הוא בעיה קשה, במיוחד כאשר זמינות אלפי סדרות זמן שעלולות להיות קשורות, כגון מכירות בקטלוג גדול במסחר אלקטרוני, או קיבולת במאות אתרים תפעוליים.

שיטות חיזוי סטטיסטיות פשוטות או מבוססות שיפוט הן לרוב כבר קווי בסיס חזקים שקשה לשפר עם שיטות למידת מכונה (ML) חדשניות. יתר על כן, היישומים של ההתקדמות האחרונה ב-ML לחיזוי מגוונים, עם מעט שיטות כגון DeepAR [1] או Transformers Temporal Fusion [2] המתהווים כבחירות פופולריות. עם זאת, קשה לאמן, לכוונן ולפרוס שיטות אלו בייצור, הדורשות ידע מומחה ב-ML וניתוח סדרות זמן.

AutoML הוא נושא שצומח במהירות בתוך ML, המתמקד באוטומציה של משימות נפוצות בצינורות ML, כולל עיבוד מקדים של תכונות, בחירת דגמים, כוונון דגמים, הרכבה ופריסה. AutoGluon-TimeSeries היא התוספת האחרונה ל AutoGluon, אחד מפתרונות AutoML המובילים בקוד פתוח, ומתבסס על המסגרת העוצמתית של AutoGluon עבור AutoML במשימות חיזוי. AutoGluon-TimeSeries תוכננה לבנות מערכות חיזוי חזקות עם שלוש שורות קוד בלבד, מה שמקל על האתגרים של עיבוד מוקדם של תכונות, בחירת דגמים, כוונון מודל וקלות פריסה.

עם קריאה פשוטה ל-AutoGluon-TimeSeries's TimeSeriesPredictor, AutoGluon עוקב אחר סדר עדיפות אינטואיטיבי בהתאמת מודלים: החל מקווי בסיס נאיביים פשוטים ומעבר לרשת עצבית גלובלית רבת עוצמה ושיטות מבוססות עצים מוגברות, הכל במסגרת תקציב הזמן שצוין על ידי המשתמש. כאשר סדרות זמן קשורות (משתנים משתנים בזמן או משתנים אקסוגניים) או מטא-נתונים של פריטים (תכונות סטטיות) זמינות, AutoGluon-TimeSeries משקפת אותם בתחזית. הספרייה גם מנצלת אופטימיזציה בייסיאנית לכוונון היפרפרמטרים, ומגיעה לתצורת המודל הטובה ביותר על ידי כוונון מודלים מורכבים. לבסוף, AutoGluon-TimeSeries משלבת את מיטב השיטות הסטטיסטיות והמבוססות על ML במכלול מודלים המותאם לבעיה שעל הפרק.

בפוסט זה, אנו מציגים את קלות השימוש של AutoGluon-TimeSeries בבנייה מהירה של חזאי רב עוצמה.

התחל עם AutoGluon-TimeSeries

כדי להתחיל, אתה צריך להתקין את AutoGluon, אשר נעשה בקלות עם pip על מעטפת UNIX:

pip install "autogluon>=0.6"

AutoGluon-TimeSeries מציגה את TimeSeriesDataFrame מחלקה לעבודה עם מערכי נתונים הכוללים מספר סדרות זמן קשורות (נקרא לפעמים מערך נתונים של פאנל). ניתן ליצור מסגרות נתונים אלה ממה שנקרא מסגרות נתונים בפורמט ארוך, שיש להן מזהי סדרות זמן וחותמות זמן מסודרות בשורות. להלן דוגמה אחת כזו, שנלקחה מתחרות M4 [3]. הנה ה item_id העמודה מציינת את המזהה הייחודי של סדרת זמן בודדת, כגון מזהה המוצר עבור נתוני מכירות יומיים של מספר מוצרים. ה target העמודה היא ערך הריבית ש-AutoGluon-TimeSeries תלמד לחזות. weekend הוא משתנה נוספת משתנה בזמן שיצרנו כדי לסמן אם התצפית הייתה בסוף השבוע או לא.

אנחנו יכולים בקלות לייצר חדש TimeSeriesDataFrame ממערך נתונים זה באמצעות ה- from_data_frame בַּנַאִי. ראה את הקוד הבא של Python:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

לנתוני סדרות זמן מסוימים יש תכונות שאינן משתנות בזמן (תכונות סטטיות או מטא-נתונים של פריט) שניתן להשתמש בהן באימון מודל חיזוי. לדוגמה, מערך הנתונים של M4 כולל משתנה קטגוריה עבור כל סדרת זמן. ניתן להוסיף את אלה ל- TimeSeriesDataFrame על ידי הגדרת ה- static_features משתנה עם מסגרת נתונים חדשה.

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

השתמש בקוד הבא:

df.static_features = raw_static_features

אימון TimeSeriesPredictor

לבסוף, אנחנו יכולים להתקשר ל- TimeSeriesPredictor כדי להתאים למגוון רחב של מודלים של חיזוי לבניית מערכת חיזוי מדויקת. ראה את הקוד הבא:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

כאן, אנו מציינים כי TimeSeriesPredictor צריך לייצר מודלים כדי לחזות את שבעת פרקי הזמן הבאים ולשפוט את המודלים הטובים ביותר על ידי שימוש בשגיאה ממוצעת בקנה מידה מוחלט (MASE). יתר על כן, אנו מציינים שהמשתנה המשתנה בזמן weekend זמין במערך הנתונים. כעת נוכל להתאים את אובייקט המנבא על TimeSeriesDataFrame הופק קודם לכן:

predictor.fit(df, presets="medium_quality", time_limit=1800)

מלבד אספקת נתוני האימון, אנו מבקשים מהמנבא להשתמש “medium_quality” הגדרות קבועות מראש. AutoGluon-TimeSeries מגיעה עם מספר הגדרות קבועות מראש לבחירת תת-קבוצות של דגמים שיש לקחת בחשבון וכמה זמן להשקיע בכוונון שלהם, ניהול ההחלפה בין מהירות אימון לדיוק. מלבד קביעות מוגדרות מראש, משתמשים מנוסים יותר יכולים להשתמש ב-a hyperparameters ארגומנט לציון מדויק של מודלים של רכיבים ואיזה היפרפרמטרים להגדיר עליהם. אנו מציינים גם מגבלת זמן של 1,800 שניות, שלאחריה המנבא מפסיק להתאמן.

מתחת למכסה המנוע, AutoGluon-TimeSeries מאמן דגמים רבים ככל האפשר במסגרת הזמן שצוין, החל מקווי בסיס נאיביים אך עוצמתיים ופועל לקראת חזאים מורכבים יותר המבוססים על עצים מוגברים ומודלים של רשתות עצביות. על ידי התקשרות predictor.leaderboard(), נוכל לראות רשימה של כל הדגמים שהוא אימן ואת ציוני הדיוק וזמני האימון עבור כל אחד מהם. שים לב שכל מודל של AutoGluon-TimeSeries מדווח על השגיאות שלו בפורמט "גבוה יותר זה טוב יותר", כלומר רוב מדדי השגיאות בחיזוי מוכפלים ב-1 כאשר מדווחים. ראה את הדוגמה הבאה:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

תחזית עם TimeSeriesPredictor

לבסוף, אנו יכולים להשתמש במנבא כדי לחזות את כל סדרות הזמן ב-a TimeSeriesDataFrame, 7 ימים לעתיד. שימו לב שמכיוון שהשתמשנו במשתנים משתנים בזמן שיש להניח שהם יהיו ידועים בעתיד, יש לציין גם אותם בזמן החיזוי. ראה את הקוד הבא:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

כברירת מחדל, AutoGluon-TimeSeries מספקת גם תחזיות נקודתיות וגם תחזיות הסתברותיות (כמותיות) של ערך היעד. תחזיות הסתברותיות חיוניות במשימות תכנון רבות, וניתן להשתמש בהן כדי לחשב מרווחים בצורה גמישה, המאפשרת משימות במורד הזרם כגון תכנון מלאי וקיבולת.

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

להלן עלילת תחזית לדוגמה המדגימה תחזיות נקודות ומרווחי חיזוי.

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

סיכום

AutoGluon-TimeSeries נותנת לחזאים ולמדעני נתונים דרך מהירה וקלה לבנות מודלים חזקים של חיזוי. בנוסף לכמה מהתכונות הנפוצות של הספרייה המוצגות בפוסט זה, AutoGluon-TimeSeries מציגה שורה של דרכים להגדיר תחזיות עבור משתמשים מתקדמים. גם קל לאמן, לפרוס ולהגיש מנבאים בקנה מידה אמזון SageMaker, באמצעות AutoGluon למידה עמוקה מכולות.

לפרטים נוספים על שימוש ב-AutoGluon, דוגמאות, מדריכים, כמו גם משימות אחרות שמתמודדות עם AutoGluon כמו למידה על נתונים טבלאיים או מולטי-מודאליים, בקר בכתובת AutoGluon. כדי להתחיל להשתמש ב-AutoGluon-TimeSeries, בדוק את שלנו הדרכה להתחלה מהירה או שלנו הדרכה מעמיקה למבט מעמיק יותר על כל התכונות שהספרייה מציעה. עקוב אחר AutoGluon טויטר, ולכוכב אותנו GitHub כדי לקבל מידע על העדכונים האחרונים.

עבור חיזוי בקנה מידה עם מחשוב וזרימות עבודה ייעודיות, תמיכה ברמת הארגון, יכולת הסבר תחזיות ועוד, בדוק גם תחזית אמזון.

הפניות

[1] סלינס, דייוויד, ולנטין פלונקרט, יאן גסטהאוס וטים ינושובסקי. "DeepAR: חיזוי הסתברותי עם רשתות חוזרות אוטו-רגרסיביות." כתב העת הבינלאומי לחיזוי 36. 3 (2020): 1181-1191.

[2] לים, בריאן, סרקן או אריק, ניקולס לוף ותומס פפיסטר. "Temporal Fusion Transformers לחיזוי סדרות זמן מרובות אופקים הניתנים לפירוש." כתב העת הבינלאומי לחיזוי 37.4 (2021): 1748-1764.

[3] מקרידאקיס, ספירוס, אוונגלוס ספיליוטיס, ואסיליוס אסימאקופולוס. "תחרות M4: 100,000 סדרות זמן ו-61 שיטות חיזוי." כתב העת הבינלאומי לחיזוי 36.1 (2020): 54-74.


על המחברים

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.קאנר טורקמן הוא מדען יישומי בשירותי האינטרנט של Amazon, שם הוא עובד על בעיות בצומת של למידת מכונה וחיזוי, בנוסף לפיתוח AutoGluon-TimeSeries. לפני שהצטרף ל-AWS, הוא עבד בתעשיית הייעוץ הניהולי כמדען נתונים, שירת את תעשיות השירותים הפיננסיים והטלקומוניקציה בפרויקטים ברחבי העולם. תחומי המחקר האישיים של Caner משתרעים על מגוון נושאים, כולל חיזוי, הסקה סיבתית ו-AutoML.

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.אולכסנדר שצ'ור הוא מדען יישומי בחברת Amazon Web Services, שם הוא עובד על חיזוי סדרות זמן ב-AutoGluon-TimeSeries. לפני שהצטרף ל-AWS, הוא השלים דוקטורט בלמידת מכונה באוניברסיטה הטכנית של מינכן, גרמניה, ועסק במחקר על מודלים הסתברותיים לנתוני אירועים. תחומי המחקר שלו כוללים למידת מכונה עבור נתונים זמניים ומידול גנרטיבי.

חיזוי קל ומדויק עם AutoGluon-TimeSeries PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ניק אריקסון הוא מדען יישומי בכיר בשירותי האינטרנט של אמזון. הוא השיג את התואר השני שלו במדעי המחשב והנדסה מאוניברסיטת מינסוטה ערים תאומות. הוא המחבר והמפתח הראשי של מסגרת הקוד הפתוח AutoML AutoGluon. החל כערכת כלים ML לתחרות אישית בשנת 2018, ניק הרחיב ללא הרף את היכולות של AutoGluon והצטרף לאמזון AI בשנת 2019 כדי לפתוח את הפרויקט בקוד פתוח ולעבוד במשרה מלאה על קידום הטכנולוגיה המתקדמת ב-AutoML.

בול זמן:

עוד מ למידת מכונות AWS