AutoGluon-TimeSeries के साथ आसान और सटीक पूर्वानुमान

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

AutoGluon-TimeSeries, AutoGluon का नवीनतम जोड़ है, जो आपको कोड की तीन पंक्तियों के साथ शक्तिशाली समय श्रृंखला पूर्वानुमान मॉडल बनाने में आसानी से मदद करता है।

समय श्रृंखला पूर्वानुमान उद्योगों की एक विस्तृत श्रृंखला के साथ-साथ वैज्ञानिक डोमेन में एक सामान्य कार्य है। व्यवसायों के लिए योजना बनाने के लिए आपूर्ति, मांग या क्षमता के लिए विश्वसनीय पूर्वानुमानों तक पहुंच होना महत्वपूर्ण है। हालांकि, समय श्रृंखला पूर्वानुमान एक कठिन समस्या है, खासकर जब संभावित रूप से संबंधित हजारों समय श्रृंखला उपलब्ध हैं, जैसे ई-कॉमर्स में एक बड़ी सूची में बिक्री, या सैकड़ों परिचालन साइटों पर क्षमता।

सरल सांख्यिकीय या निर्णय-आधारित पूर्वानुमान पद्धतियाँ अक्सर पहले से ही मजबूत आधार रेखाएँ होती हैं जिन्हें उपन्यास मशीन लर्निंग (एमएल) विधियों के साथ सुधारना मुश्किल होता है। इसके अलावा, पूर्वानुमान के लिए एमएल में हाल के अग्रिमों के अनुप्रयोग विविध हैं, जैसे कि कुछ तरीके दीपहार [1] या टेम्पोरल फ्यूजन ट्रांसफॉर्मर [2] लोकप्रिय विकल्पों के रूप में उभर रहे हैं। हालांकि, इन तरीकों को प्रशिक्षित करना, ट्यून करना और उत्पादन में तैनात करना मुश्किल है, एमएल और समय श्रृंखला विश्लेषण के विशेषज्ञ ज्ञान की आवश्यकता होती है।

एमएल के भीतर ऑटोएमएल एक तेजी से बढ़ता हुआ विषय है, जो एमएल पाइपलाइनों में सामान्य कार्यों को स्वचालित करने पर ध्यान केंद्रित करता है, जिसमें फीचर प्रीप्रोसेसिंग, मॉडल चयन, मॉडल ट्यूनिंग, एन्सेम्बलिंग और परिनियोजन शामिल हैं। AutoGluon-TimeSeries इसका नवीनतम जोड़ है ऑटोग्लून, प्रमुख ओपन-सोर्स AutoML समाधानों में से एक है, और पूर्वानुमान कार्यों में AutoML के लिए AutoGluon के शक्तिशाली ढांचे पर बनाता है। AutoGluon-TimeSeries को कोड की कम से कम तीन पंक्तियों के साथ शक्तिशाली पूर्वानुमान प्रणाली बनाने के लिए डिज़ाइन किया गया था, जो फीचर प्रीप्रोसेसिंग, मॉडल चयन, मॉडल ट्यूनिंग और परिनियोजन में आसानी की चुनौतियों को कम करता है।

AutoGluon-TimeSeries के लिए एक साधारण कॉल के साथ TimeSeriesPredictor, AutoGluon फिटिंग मॉडल में प्राथमिकता के एक सहज क्रम का पालन करता है: सरल सरल आधार रेखाओं से शुरू होकर शक्तिशाली वैश्विक तंत्रिका नेटवर्क और उन्नत वृक्ष-आधारित विधियों की ओर बढ़ना, सभी उपयोगकर्ता द्वारा निर्दिष्ट समय बजट के भीतर। जब संबंधित समय श्रृंखला (समय-भिन्न सहसंयोजक या बहिर्जात चर) या आइटम मेटाडेटा (स्थैतिक विशेषताएं) उपलब्ध होते हैं, तो AutoGluon-TimeSeries उन्हें पूर्वानुमान में शामिल करता है। लाइब्रेरी हाइपरपरमीटर ट्यूनिंग के लिए बायेसियन ऑप्टिमाइज़ेशन में भी टैप करती है, जटिल मॉडल को ट्यून करके सर्वश्रेष्ठ मॉडल कॉन्फ़िगरेशन तक पहुंचती है। अंत में, AutoGluon-TimeSeries हाथ में समस्या के लिए अनुकूलित एक मॉडल पहनावा में सर्वश्रेष्ठ सांख्यिकीय और एमएल-आधारित विधियों को जोड़ती है।

इस पोस्ट में, हम AutoGluon-TimeSeries की आसानी से एक शक्तिशाली फोरकास्टर बनाने में आसानी का प्रदर्शन करते हैं।

AutoGluon-TimeSeries के साथ आरंभ करें

शुरू करने के लिए, आपको AutoGluon को स्थापित करने की आवश्यकता है, जो आसानी से UNIX शेल पर पाइप के साथ किया जाता है:

pip install "autogluon>=0.6"

AutoGluon-TimeSeries पेश करता है TimeSeriesDataFrame डेटासेट के साथ काम करने के लिए कक्षा जिसमें एकाधिक संबंधित समय श्रृंखला शामिल होती है (कभी-कभी पैनल डेटासेट कहा जाता है)। इन डेटा फ़्रेमों को तथाकथित लंबे प्रारूप वाले डेटा फ़्रेमों से बनाया जा सकता है, जिसमें समय श्रृंखला आईडी और टाइमस्टैम्प पंक्तियों में व्यवस्थित होते हैं। निम्नलिखित एक ऐसा डेटा उदाहरण है, जिसे M4 प्रतियोगिता [3] से लिया गया है। यहां ही item_id कॉलम एकल समय श्रृंखला के विशिष्ट पहचानकर्ता को निर्दिष्ट करता है, जैसे कि कई उत्पादों के दैनिक बिक्री डेटा के लिए उत्पाद आईडी। target कॉलम रुचि का वह मूल्य है जिसका AutoGluon-TimeSeries पूर्वानुमान लगाना सीखेगा। weekend एक अतिरिक्त समय-भिन्न सहसंयोजक है जिसे हमने यह चिह्नित करने के लिए बनाया है कि अवलोकन सप्ताहांत पर था या नहीं।

हम आसानी से एक नया उत्पादन कर सकते हैं TimeSeriesDataFrame इस डेटासेट से का उपयोग कर from_data_frame निर्माता। निम्नलिखित पायथन कोड देखें:

df = TimeSeriesDataFrame.from_data_frame(raw_data_frame)

कुछ समय श्रृंखला डेटा में गैर-समय-भिन्न विशेषताएं (स्थैतिक विशेषताएं या आइटम मेटाडेटा) होती हैं जिनका उपयोग पूर्वानुमान मॉडल के प्रशिक्षण में किया जा सकता है। उदाहरण के लिए, M4 डेटासेट में प्रत्येक समय श्रृंखला के लिए एक श्रेणी चर होता है। इनमें जोड़ा जा सकता है TimeSeriesDataFrame सेटिंग करके static_features एक नए डेटा फ्रेम के साथ चर।

निम्नलिखित कोड का प्रयोग करें:

df.static_features = raw_static_features

TimeSeriesPredictor को प्रशिक्षित करें

अंत में, हम कॉल कर सकते हैं TimeSeriesPredictor एक सटीक पूर्वानुमान प्रणाली बनाने के लिए पूर्वानुमान मॉडल की एक विस्तृत श्रृंखला को फिट करने के लिए। निम्नलिखित कोड देखें:

predictor = TimeSeriesPredictor(
    prediction_length=7,
    eval_metric="MASE",
    known_covariates_names=["weekend"],
)

यहाँ, हम निर्दिष्ट करते हैं कि TimeSeriesPredictor अगले सात समय अवधियों का पूर्वानुमान लगाने के लिए मॉडल तैयार करने चाहिए और माध्य पूर्ण स्केल्ड त्रुटि का उपयोग करके सर्वश्रेष्ठ मॉडल का न्याय करना चाहिए (मास). इसके अलावा, हम इंगित करते हैं कि समय-भिन्न सहसंयोजक weekend डेटासेट में उपलब्ध है। अब हम प्रेडिक्टर ऑब्जेक्ट को पर फिट कर सकते हैं TimeSeriesDataFrame पहले निर्मित:

predictor.fit(df, presets="medium_quality", time_limit=1800)

प्रशिक्षण डेटा प्रदान करने के अलावा, हम भविष्यवक्ता को उपयोग करने के लिए कहते हैं “medium_quality” प्रीसेट। AutoGluon-TimeSeries विचार करने के लिए मॉडल के सबसेट का चयन करने के लिए कई प्रीसेट के साथ आता है और प्रशिक्षण गति बनाम सटीकता के बीच व्यापार-बंद का प्रबंधन करने के लिए उन्हें कितना समय देना है। प्रीसेट के अलावा, अधिक अनुभवी उपयोगकर्ता उपयोग कर सकते हैं hyperparameters घटक मॉडल को सटीक रूप से निर्दिष्ट करने के लिए तर्क और उन पर कौन से हाइपरपैरामीटर सेट करने हैं। हम 1,800 सेकंड की समय सीमा भी निर्दिष्ट करते हैं, जिसके बाद भविष्यवक्ता प्रशिक्षण बंद कर देता है।

हुड के तहत, AutoGluon-TimeSeries निर्दिष्ट समय सीमा के भीतर अधिक से अधिक मॉडलों को प्रशिक्षित करती है, जो सहज लेकिन शक्तिशाली बेसलाइन से शुरू होती है और बढ़े हुए पेड़ों और तंत्रिका नेटवर्क मॉडल के आधार पर अधिक जटिल पूर्वानुमान लगाने वालों की ओर काम करती है। फोन करके predictor.leaderboard(), हम उन सभी मॉडलों की सूची देख सकते हैं जिन्हें उसने प्रशिक्षित किया है और प्रत्येक के लिए सटीकता स्कोर और प्रशिक्षण समय। ध्यान दें कि प्रत्येक AutoGluon-TimeSeries मॉडल अपनी त्रुटियों को "उच्चतर बेहतर है" प्रारूप में रिपोर्ट करता है, जिसका अर्थ है कि रिपोर्ट किए जाने पर अधिकांश पूर्वानुमान त्रुटि उपायों को -1 से गुणा किया जाता है। निम्न उदाहरण देखें:

              model  score_val  pred_time_val  fit_time_marginal  fit_order
0  WeightedEnsemble  -0.612510      15.406334          48.428711          8
1  AutoGluonTabular  -0.654924       1.068694         104.208688          6
2            DeepAR  -0.673366       6.731659        1065.956648          7
3     SeasonalNaive  -1.035286       0.410615           0.000742          2
4               ETS  -1.073640       5.832542           0.000584          3
5             Theta  -1.107362       1.773439           0.000614          4
6             ARIMA  -3.006273       2.483140           0.000625          5
7             Naive  -3.427339      29.532215           0.000577          1

TimeSeriesPredictor के साथ पूर्वानुमान

अंत में, हम एक में सभी समय श्रृंखला की भविष्यवाणी करने के लिए भविष्यवक्ता का उपयोग कर सकते हैं TimeSeriesDataFrame, भविष्य में 7 दिन। ध्यान दें कि क्योंकि हमने समय-भिन्न सहसंयोजकों का उपयोग किया है जिन्हें भविष्य में ज्ञात माना जाता है, इन्हें भविष्यवाणी के समय भी निर्दिष्ट किया जाना चाहिए। निम्नलिखित कोड देखें:

predictions = predictor.predict(
	df,
	known_covariates=future_known_covariates
)

डिफ़ॉल्ट रूप से, AutoGluon-TimeSeries लक्ष्य मूल्य के बिंदु पूर्वानुमान और संभाव्य (मात्रात्मक) पूर्वानुमान दोनों प्रदान करता है। कई नियोजन कार्यों में संभाव्य पूर्वानुमान आवश्यक हैं, और उनका उपयोग लचीले ढंग से अंतराल की गणना करने के लिए किया जा सकता है, जिससे इन्वेंट्री और क्षमता नियोजन जैसे डाउनस्ट्रीम कार्यों को सक्षम किया जा सकता है।

निम्नलिखित एक नमूना पूर्वानुमान प्लॉट है जो बिंदु पूर्वानुमान और भविष्यवाणी अंतराल प्रदर्शित करता है।

निष्कर्ष

AutoGluon-TimeSeries पूर्वानुमानकर्ताओं और डेटा वैज्ञानिकों को शक्तिशाली पूर्वानुमान मॉडल बनाने का एक त्वरित और आसान तरीका प्रदान करता है। इस पोस्ट में प्रदर्शित लाइब्रेरी की कुछ सामान्य रूप से उपयोग की जाने वाली विशेषताओं के अलावा, AutoGluon-TimeSeries में उन्नत उपयोगकर्ताओं के लिए पूर्वानुमानों को कॉन्फ़िगर करने के तरीकों का एक सेट है। भविष्यवक्ताओं को प्रशिक्षित करना, तैनात करना और बड़े पैमाने पर सेवा देना भी आसान है अमेज़न SageMaker, AutoGluon डीप लर्निंग का उपयोग करना कंटेनर.

AutoGluon का उपयोग करने के बारे में अधिक जानकारी के लिए, उदाहरण, ट्यूटोरियल, साथ ही अन्य कार्य AutoGluon से निपटते हैं जैसे कि सारणीबद्ध या मल्टीमॉडल डेटा पर सीखना, यहाँ जाएँ ऑटोग्लून. AutoGluon-TimeSeries का उपयोग शुरू करने के लिए, हमारा देखें त्वरित प्रारंभ ट्यूटोरियल या हमारे गहन ट्यूटोरियल पुस्तकालय द्वारा प्रदान की जाने वाली सभी सुविधाओं में गहराई से देखने के लिए। AutoGluon को फॉलो करें ट्विटर, और हमें तारांकित करें GitHub नवीनतम अपडेट के बारे में सूचित करने के लिए।

समर्पित कंप्यूट और वर्कफ्लो के साथ बड़े पैमाने पर पूर्वानुमान के लिए, उद्यम-स्तर का समर्थन, पूर्वानुमान व्याख्यात्मकता और अधिक, यह भी देखें अमेज़न का पूर्वानुमान.

संदर्भ

[1] सेलिनास, डेविड, वैलेन्टिन फ्लंकर्ट, जान गैस्टहॉस और टिम जानुशोव्स्की। "दीपार: ऑटोरेग्रेसिव आवर्तक नेटवर्क के साथ संभाव्य पूर्वानुमान।" इंटरनेशनल जर्नल ऑफ फोरकास्टिंग 36. 3 (2020): 1181-1191।

[2] लिम, ब्रायन, सेर्कन ओ एरिक, निकोलस लोएफ़ और टॉमस फ़िस्टर। "व्याख्यात्मक बहु-क्षितिज समय श्रृंखला पूर्वानुमान के लिए टेम्पोरल फ्यूजन ट्रांसफॉर्मर।" इंटरनेशनल जर्नल ऑफ फोरकास्टिंग 37.4 (2021): 1748-1764।

[3] माक्रिडाकिस, स्पाइरोस, इवेंजेलोस स्पिलियोटिस और वासिलियोस असिमकोपोलोस। "M4 प्रतियोगिता: 100,000 समय श्रृंखला और 61 पूर्वानुमान विधियों।" इंटरनेशनल जर्नल ऑफ फोरकास्टिंग 36.1 (2020): 54-74।

लेखक के बारे में

कनेर तुर्कमेन Amazon Web Services में एक एप्लाइड साइंटिस्ट हैं, जहां वे AutoGluon-TimeSeries को विकसित करने के अलावा, मशीन लर्निंग और फोरकास्टिंग के इंटरसेक्शन पर समस्याओं पर काम करते हैं। AWS में शामिल होने से पहले, उन्होंने डेटा वैज्ञानिक के रूप में प्रबंधन परामर्श उद्योग में काम किया, दुनिया भर में परियोजनाओं पर वित्तीय सेवाओं और दूरसंचार उद्योगों की सेवा की। कैनर के व्यक्तिगत अनुसंधान हितों में पूर्वानुमान, कारण संबंधी अनुमान और AutoML सहित कई विषय शामिल हैं।

ऑलेक्ज़ेंडर शचुर Amazon Web Services में एप्लाइड साइंटिस्ट हैं, जहां वे AutoGluon-TimeSeries में टाइम सीरीज़ फोरकास्टिंग पर काम करते हैं। AWS में शामिल होने से पहले, उन्होंने म्यूनिख, जर्मनी के तकनीकी विश्वविद्यालय में मशीन लर्निंग में पीएचडी पूरी की, और इवेंट डेटा के लिए संभावित मॉडल पर शोध किया। उनके अनुसंधान के हितों में अस्थायी डेटा और जनरेटिव मॉडलिंग के लिए मशीन लर्निंग शामिल है।

निक एरिकसन Amazon Web Services में सीनियर एप्लाइड साइंटिस्ट हैं। उन्होंने यूनिवर्सिटी ऑफ़ मिनेसोटा ट्विन सिटीज़ से कंप्यूटर साइंस और इंजीनियरिंग में मास्टर डिग्री प्राप्त की। वह ओपन-सोर्स AutoML फ्रेमवर्क AutoGluon के सह-लेखक और प्रमुख डेवलपर हैं। 2018 में एक व्यक्तिगत प्रतियोगिता एमएल टूलकिट के रूप में शुरू करते हुए, निक ने ऑटोग्लूऑन की क्षमताओं का लगातार विस्तार किया और 2019 में अमेज़ॅन एआई में शामिल हो गए ताकि परियोजना को ओपन-सोर्स किया जा सके और ऑटोएमएल में अत्याधुनिक को आगे बढ़ाने पर पूर्णकालिक काम किया जा सके।

समय टिकट: नवम्बर 18/2022नवम्बर 18/2022

समय टिकट: 2 मई 2022

AutoGluon-TimeSeries के साथ आसान और सटीक पूर्वानुमान

प्लेटो द्वारा पुनर्प्रकाशित

AutoGluon-TimeSeries के साथ आरंभ करें

TimeSeriesPredictor को प्रशिक्षित करें

TimeSeriesPredictor के साथ पूर्वानुमान

निष्कर्ष

संदर्भ

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

Amazon Lex के लिए विजुअल कन्वर्सेशन बिल्डर की घोषणा

पीजीए टूर के जेनेरिक एआई वर्चुअल असिस्टेंट की अवधारणा से विकास और प्रोटोटाइप तक की यात्रा | अमेज़न वेब सेवाएँ

अमेज़ॅन सेजमेकर पाइपलाइनों और अमेज़ॅन सेजमेकर एसडीके के लिए नई सुविधाएँ

Amazon SageMaker पर बिना किसी कोड के जोखिम प्रबंधन मशीन लर्निंग वर्कफ़्लो बनाएं

Intuitivo AWS Inferentia और PyTorch का उपयोग करके AI/ML लागत पर बचत करते हुए उच्च थ्रूपुट प्राप्त करता है | अमेज़न वेब सेवाएँ

अमेज़ॅन लेक्स | में नई जेनरेटिव एआई सुविधाओं के साथ अपने स्वयं-सेवा सहायकों को उन्नत करें अमेज़न वेब सेवाएँ

अमेज़ॅन एआई सेवाओं का उपयोग करके स्वचालित दस्तावेज़-से-वाक् रूपांतरण के साथ अपनी सामग्री पहुंच बढ़ाएं

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा