AutoGluon-TimeSeries היא התוספת האחרונה ל-AutoGluon, שעוזרת לך לבנות בקלות מודלים עוצמתיים לחיזוי סדרות זמן עם שלוש שורות קוד בלבד.
חיזוי סדרות זמן היא משימה נפוצה במגוון רחב של תעשיות כמו גם בתחומים מדעיים. גישה לתחזיות אמינות עבור היצע, ביקוש או קיבולת היא חיונית לתכנון עבור עסקים. עם זאת, חיזוי סדרות זמן הוא בעיה קשה, במיוחד כאשר זמינות אלפי סדרות זמן שעלולות להיות קשורות, כגון מכירות בקטלוג גדול במסחר אלקטרוני, או קיבולת במאות אתרים תפעוליים.
שיטות חיזוי סטטיסטיות פשוטות או מבוססות שיפוט הן לרוב כבר קווי בסיס חזקים שקשה לשפר עם שיטות למידת מכונה (ML) חדשניות. יתר על כן, היישומים של ההתקדמות האחרונה ב-ML לחיזוי מגוונים, עם מעט שיטות כגון DeepAR [1] או Transformers Temporal Fusion [2] המתהווים כבחירות פופולריות. עם זאת, קשה לאמן, לכוונן ולפרוס שיטות אלו בייצור, הדורשות ידע מומחה ב-ML וניתוח סדרות זמן.
AutoML הוא נושא שצומח במהירות בתוך ML, המתמקד באוטומציה של משימות נפוצות בצינורות ML, כולל עיבוד מקדים של תכונות, בחירת דגמים, כוונון דגמים, הרכבה ופריסה. AutoGluon-TimeSeries היא התוספת האחרונה ל AutoGluon, אחד מפתרונות AutoML המובילים בקוד פתוח, ומתבסס על המסגרת העוצמתית של AutoGluon עבור AutoML במשימות חיזוי. AutoGluon-TimeSeries תוכננה לבנות מערכות חיזוי חזקות עם שלוש שורות קוד בלבד, מה שמקל על האתגרים של עיבוד מוקדם של תכונות, בחירת דגמים, כוונון מודל וקלות פריסה.
עם קריאה פשוטה ל-AutoGluon-TimeSeries's TimeSeriesPredictor
, AutoGluon עוקב אחר סדר עדיפות אינטואיטיבי בהתאמת מודלים: החל מקווי בסיס נאיביים פשוטים ומעבר לרשת עצבית גלובלית רבת עוצמה ושיטות מבוססות עצים מוגברות, הכל במסגרת תקציב הזמן שצוין על ידי המשתמש. כאשר סדרות זמן קשורות (משתנים משתנים בזמן או משתנים אקסוגניים) או מטא-נתונים של פריטים (תכונות סטטיות) זמינות, AutoGluon-TimeSeries משקפת אותם בתחזית. הספרייה גם מנצלת אופטימיזציה בייסיאנית לכוונון היפרפרמטרים, ומגיעה לתצורת המודל הטובה ביותר על ידי כוונון מודלים מורכבים. לבסוף, AutoGluon-TimeSeries משלבת את מיטב השיטות הסטטיסטיות והמבוססות על ML במכלול מודלים המותאם לבעיה שעל הפרק.
בפוסט זה, אנו מציגים את קלות השימוש של AutoGluon-TimeSeries בבנייה מהירה של חזאי רב עוצמה.
התחל עם AutoGluon-TimeSeries
כדי להתחיל, אתה צריך להתקין את AutoGluon, אשר נעשה בקלות עם pip על מעטפת UNIX:
AutoGluon-TimeSeries מציגה את TimeSeriesDataFrame
מחלקה לעבודה עם מערכי נתונים הכוללים מספר סדרות זמן קשורות (נקרא לפעמים מערך נתונים של פאנל). ניתן ליצור מסגרות נתונים אלה ממה שנקרא מסגרות נתונים בפורמט ארוך, שיש להן מזהי סדרות זמן וחותמות זמן מסודרות בשורות. להלן דוגמה אחת כזו, שנלקחה מתחרות M4 [3]. הנה ה item_id
העמודה מציינת את המזהה הייחודי של סדרת זמן בודדת, כגון מזהה המוצר עבור נתוני מכירות יומיים של מספר מוצרים. ה target
העמודה היא ערך הריבית ש-AutoGluon-TimeSeries תלמד לחזות. weekend
הוא משתנה נוספת משתנה בזמן שיצרנו כדי לסמן אם התצפית הייתה בסוף השבוע או לא.
אנחנו יכולים בקלות לייצר חדש TimeSeriesDataFrame
ממערך נתונים זה באמצעות ה- from_data_frame
בַּנַאִי. ראה את הקוד הבא של Python:
לנתוני סדרות זמן מסוימים יש תכונות שאינן משתנות בזמן (תכונות סטטיות או מטא-נתונים של פריט) שניתן להשתמש בהן באימון מודל חיזוי. לדוגמה, מערך הנתונים של M4 כולל משתנה קטגוריה עבור כל סדרת זמן. ניתן להוסיף את אלה ל- TimeSeriesDataFrame
על ידי הגדרת ה- static_features
משתנה עם מסגרת נתונים חדשה.
השתמש בקוד הבא:
אימון TimeSeriesPredictor
לבסוף, אנחנו יכולים להתקשר ל- TimeSeriesPredictor
כדי להתאים למגוון רחב של מודלים של חיזוי לבניית מערכת חיזוי מדויקת. ראה את הקוד הבא:
כאן, אנו מציינים כי TimeSeriesPredictor
צריך לייצר מודלים כדי לחזות את שבעת פרקי הזמן הבאים ולשפוט את המודלים הטובים ביותר על ידי שימוש בשגיאה ממוצעת בקנה מידה מוחלט (MASE). יתר על כן, אנו מציינים שהמשתנה המשתנה בזמן weekend
זמין במערך הנתונים. כעת נוכל להתאים את אובייקט המנבא על TimeSeriesDataFrame
הופק קודם לכן:
מלבד אספקת נתוני האימון, אנו מבקשים מהמנבא להשתמש “medium_quality”
הגדרות קבועות מראש. AutoGluon-TimeSeries מגיעה עם מספר הגדרות קבועות מראש לבחירת תת-קבוצות של דגמים שיש לקחת בחשבון וכמה זמן להשקיע בכוונון שלהם, ניהול ההחלפה בין מהירות אימון לדיוק. מלבד קביעות מוגדרות מראש, משתמשים מנוסים יותר יכולים להשתמש ב-a hyperparameters
ארגומנט לציון מדויק של מודלים של רכיבים ואיזה היפרפרמטרים להגדיר עליהם. אנו מציינים גם מגבלת זמן של 1,800 שניות, שלאחריה המנבא מפסיק להתאמן.
מתחת למכסה המנוע, AutoGluon-TimeSeries מאמן דגמים רבים ככל האפשר במסגרת הזמן שצוין, החל מקווי בסיס נאיביים אך עוצמתיים ופועל לקראת חזאים מורכבים יותר המבוססים על עצים מוגברים ומודלים של רשתות עצביות. על ידי התקשרות predictor.leaderboard()
, נוכל לראות רשימה של כל הדגמים שהוא אימן ואת ציוני הדיוק וזמני האימון עבור כל אחד מהם. שים לב שכל מודל של AutoGluon-TimeSeries מדווח על השגיאות שלו בפורמט "גבוה יותר זה טוב יותר", כלומר רוב מדדי השגיאות בחיזוי מוכפלים ב-1 כאשר מדווחים. ראה את הדוגמה הבאה:
תחזית עם TimeSeriesPredictor
לבסוף, אנו יכולים להשתמש במנבא כדי לחזות את כל סדרות הזמן ב-a TimeSeriesDataFrame
, 7 ימים לעתיד. שימו לב שמכיוון שהשתמשנו במשתנים משתנים בזמן שיש להניח שהם יהיו ידועים בעתיד, יש לציין גם אותם בזמן החיזוי. ראה את הקוד הבא:
כברירת מחדל, AutoGluon-TimeSeries מספקת גם תחזיות נקודתיות וגם תחזיות הסתברותיות (כמותיות) של ערך היעד. תחזיות הסתברותיות חיוניות במשימות תכנון רבות, וניתן להשתמש בהן כדי לחשב מרווחים בצורה גמישה, המאפשרת משימות במורד הזרם כגון תכנון מלאי וקיבולת.
להלן עלילת תחזית לדוגמה המדגימה תחזיות נקודות ומרווחי חיזוי.
סיכום
AutoGluon-TimeSeries נותנת לחזאים ולמדעני נתונים דרך מהירה וקלה לבנות מודלים חזקים של חיזוי. בנוסף לכמה מהתכונות הנפוצות של הספרייה המוצגות בפוסט זה, AutoGluon-TimeSeries מציגה שורה של דרכים להגדיר תחזיות עבור משתמשים מתקדמים. גם קל לאמן, לפרוס ולהגיש מנבאים בקנה מידה אמזון SageMaker, באמצעות AutoGluon למידה עמוקה מכולות.
לפרטים נוספים על שימוש ב-AutoGluon, דוגמאות, מדריכים, כמו גם משימות אחרות שמתמודדות עם AutoGluon כמו למידה על נתונים טבלאיים או מולטי-מודאליים, בקר בכתובת AutoGluon. כדי להתחיל להשתמש ב-AutoGluon-TimeSeries, בדוק את שלנו הדרכה להתחלה מהירה או שלנו הדרכה מעמיקה למבט מעמיק יותר על כל התכונות שהספרייה מציעה. עקוב אחר AutoGluon טויטר, ולכוכב אותנו GitHub כדי לקבל מידע על העדכונים האחרונים.
עבור חיזוי בקנה מידה עם מחשוב וזרימות עבודה ייעודיות, תמיכה ברמת הארגון, יכולת הסבר תחזיות ועוד, בדוק גם תחזית אמזון.
הפניות
[1] סלינס, דייוויד, ולנטין פלונקרט, יאן גסטהאוס וטים ינושובסקי. "DeepAR: חיזוי הסתברותי עם רשתות חוזרות אוטו-רגרסיביות." כתב העת הבינלאומי לחיזוי 36. 3 (2020): 1181-1191.
[2] לים, בריאן, סרקן או אריק, ניקולס לוף ותומס פפיסטר. "Temporal Fusion Transformers לחיזוי סדרות זמן מרובות אופקים הניתנים לפירוש." כתב העת הבינלאומי לחיזוי 37.4 (2021): 1748-1764.
[3] מקרידאקיס, ספירוס, אוונגלוס ספיליוטיס, ואסיליוס אסימאקופולוס. "תחרות M4: 100,000 סדרות זמן ו-61 שיטות חיזוי." כתב העת הבינלאומי לחיזוי 36.1 (2020): 54-74.
על המחברים
קאנר טורקמן הוא מדען יישומי בשירותי האינטרנט של Amazon, שם הוא עובד על בעיות בצומת של למידת מכונה וחיזוי, בנוסף לפיתוח AutoGluon-TimeSeries. לפני שהצטרף ל-AWS, הוא עבד בתעשיית הייעוץ הניהולי כמדען נתונים, שירת את תעשיות השירותים הפיננסיים והטלקומוניקציה בפרויקטים ברחבי העולם. תחומי המחקר האישיים של Caner משתרעים על מגוון נושאים, כולל חיזוי, הסקה סיבתית ו-AutoML.
אולכסנדר שצ'ור הוא מדען יישומי בחברת Amazon Web Services, שם הוא עובד על חיזוי סדרות זמן ב-AutoGluon-TimeSeries. לפני שהצטרף ל-AWS, הוא השלים דוקטורט בלמידת מכונה באוניברסיטה הטכנית של מינכן, גרמניה, ועסק במחקר על מודלים הסתברותיים לנתוני אירועים. תחומי המחקר שלו כוללים למידת מכונה עבור נתונים זמניים ומידול גנרטיבי.
ניק אריקסון הוא מדען יישומי בכיר בשירותי האינטרנט של אמזון. הוא השיג את התואר השני שלו במדעי המחשב והנדסה מאוניברסיטת מינסוטה ערים תאומות. הוא המחבר והמפתח הראשי של מסגרת הקוד הפתוח AutoML AutoGluon. החל כערכת כלים ML לתחרות אישית בשנת 2018, ניק הרחיב ללא הרף את היכולות של AutoGluon והצטרף לאמזון AI בשנת 2019 כדי לפתוח את הפרויקט בקוד פתוח ולעבוד במשרה מלאה על קידום הטכנולוגיה המתקדמת ב-AutoML.
- AI
- איי אמנות
- מחולל אמנות ai
- איי רובוט
- בינה מלאכותית
- הסמכת בינה מלאכותית
- בינה מלאכותית בבנקאות
- רובוט בינה מלאכותית
- רובוטים של בינה מלאכותית
- תוכנת בינה מלאכותית
- למידת מכונות AWS
- blockchain
- blockchain conference ai
- קוינגניוס
- בינה מלאכותית של שיחה
- קריפטו כנס ai
- של דאל
- למידה עמוקה
- גלון
- גוגל איי
- בינוני (200)
- למידת מכונה
- אפלטון
- plato ai
- מודיעין אפלטון
- משחק אפלטון
- אפלטון נתונים
- פלטוגיימינג
- סולם ai
- תחביר
- זפירנט