चाहे आप वेब ट्रैफ़िक के लिए अधिक कुशलता से संसाधनों का आवंटन कर रहे हों, स्टाफ़ की ज़रूरतों के लिए मरीज़ की माँग का पूर्वानुमान लगा रहे हों, या किसी कंपनी के उत्पादों की बिक्री का अनुमान लगा रहे हों, कई व्यवसायों में पूर्वानुमान लगाना एक आवश्यक उपकरण है। एक विशेष उपयोग के मामले, के रूप में जाना जाता है ठंड शुरू होने का अनुमान, एक समय श्रृंखला के लिए पूर्वानुमान बनाता है जिसमें बहुत कम या कोई मौजूदा ऐतिहासिक डेटा नहीं है, जैसे कि एक नया उत्पाद जो अभी-अभी खुदरा उद्योग में बाजार में प्रवेश किया है। ऑटोरेग्रेसिव इंटीग्रेटेड मूविंग एवरेज (ARIMA) या एक्सपोनेंशियल स्मूथिंग (ES) जैसी पारंपरिक टाइम सीरीज़ फोरकास्टिंग मेथड्स प्रत्येक व्यक्तिगत उत्पाद की ऐतिहासिक टाइम सीरीज़ पर बहुत अधिक निर्भर करती हैं, और इसलिए कोल्ड स्टार्ट फोरकास्टिंग के लिए प्रभावी नहीं हैं।
इस पोस्ट में, हम प्रदर्शित करते हैं कि कैसे एक कोल्ड स्टार्ट फोरकास्टिंग इंजन का उपयोग करके बनाया जाए समय श्रृंखला पूर्वानुमान के लिए AutoGluon AutoML, छवि, पाठ, सारणीबद्ध और समय श्रृंखला डेटा पर मशीन लर्निंग (एमएल) को स्वचालित करने के लिए एक ओपन-सोर्स पायथन पैकेज। AutoGluon अनुभवी एमएल डेवलपर्स के लिए शुरुआती लोगों के लिए एक एंड-टू-एंड स्वचालित मशीन लर्निंग (ऑटोएमएल) पाइपलाइन प्रदान करता है, जिससे यह सबसे सटीक और उपयोग में आसान पूरी तरह से स्वचालित समाधान बन जाता है। हम मुफ्त का उपयोग करते हैं अमेज़ॅन सेजमेकर स्टूडियो लैब इस प्रदर्शन के लिए सेवा.
AutoGluon समय श्रृंखला का परिचय
ऑटोग्लून टेक्स्ट, छवि और सारणीबद्ध डेटा के लिए AutoML के लिए एक प्रमुख ओपन-सोर्स लाइब्रेरी है, जो आपको कोड की केवल एक पंक्ति के साथ कच्चे डेटा से अत्यधिक सटीक मॉडल बनाने की अनुमति देती है। हाल ही में, टीम इन क्षमताओं को समय श्रृंखला डेटा तक विस्तारित करने के लिए काम कर रही है, और एक स्वचालित पूर्वानुमान मॉड्यूल विकसित किया है जो सार्वजनिक रूप से उपलब्ध है GitHub। autogluon.forecasting
मॉड्यूल स्वचालित रूप से कच्चे समय श्रृंखला डेटा को उपयुक्त प्रारूप में संसाधित करता है, और फिर सटीक पूर्वानुमान उत्पन्न करने के लिए विभिन्न अत्याधुनिक गहन शिक्षण मॉडल को प्रशिक्षित और ट्यून करता है। इस पोस्ट में, हम प्रदर्शित करते हैं कि कैसे उपयोग करें autogluon.forecasting
और इसे कोल्ड स्टार्ट फोरकास्टिंग कार्यों पर लागू करें।
समाधान अवलोकन
क्योंकि AutoGluon एक ओपन-सोर्स पायथन पैकेज है, आप इस समाधान को लागू कर सकते हैं स्थानीय स्तर पर अपने लैपटॉप पर या अमेज़न सेजमेकर स्टूडियो लैब पर। हम निम्नलिखित चरणों से गुजरते हैं:
- Amazon SageMaker Studio Lab के लिए AutoGluon सेट करें।
- डेटासेट तैयार करें।
- AutoGluon का उपयोग करके प्रशिक्षण मापदंडों को परिभाषित करें।
- टाइम सीरीज़ फोरकास्टिंग के लिए कोल्ड स्टार्ट फोरकास्टिंग इंजन को प्रशिक्षित करें।
- कोल्ड स्टार्ट फोरकास्टिंग प्रेडिक्शन को विज़ुअलाइज़ करें।
कोल्ड स्टार्ट फोरकास्टिंग की मुख्य धारणा यह है कि समान विशेषताओं वाले आइटम में समान टाइम सीरीज़ ट्रैजेक्टोरियां होनी चाहिए, जो कि कोल्ड स्टार्ट फोरकास्टिंग को ऐतिहासिक डेटा के बिना आइटम पर भविष्यवाणी करने की अनुमति देती है, जैसा कि निम्नलिखित आंकड़े में दिखाया गया है।
हमारे पूर्वाभ्यास में, हम बिजली की खपत के आधार पर एक सिंथेटिक डेटासेट का उपयोग करते हैं, जिसमें 370 वस्तुओं के लिए प्रति घंटा समय श्रृंखला होती है, प्रत्येक में एक item_id
0–369 से। इस सिंथेटिक डेटासेट के भीतर, प्रत्येक item_id
एक स्थिर विशेषता से भी जुड़ा है (एक विशेषता जो समय के साथ नहीं बदलती है)। हम a . को प्रशिक्षित करते हैं दीपहार समान वस्तुओं के विशिष्ट व्यवहार को सीखने के लिए AutoGluon का उपयोग करने वाला मॉडल, और नए आइटम पर भविष्यवाणियां करने के लिए ऐसे व्यवहार को स्थानांतरित करना (item_id
370–373) जिनके पास ऐतिहासिक समय श्रृंखला डेटा नहीं है। यद्यपि हम केवल एक स्थिर विशेषता के साथ कोल्ड स्टार्ट फोरकास्टिंग दृष्टिकोण का प्रदर्शन कर रहे हैं, व्यवहार में, सूचनात्मक और उच्च-गुणवत्ता वाली स्थिर विशेषताएं एक अच्छे कोल्ड स्टार्ट पूर्वानुमान की कुंजी है।
निम्नलिखित आरेख हमारे समाधान का एक उच्च-स्तरीय अवलोकन प्रदान करता है। ओपन-सोर्स कोड पर उपलब्ध है गीथहब रेपो.
.. पूर्वापेक्षाएँ
इस पूर्वाभ्यास के लिए, आपके पास निम्नलिखित शर्तें होनी चाहिए:
- An अमेज़ॅन सेजमेकर स्टूडियो लैब खाता
- GitHub खाता पहुंच
अपने Amazon SageMaker Studio Lab खाते में लॉग इन करें और टर्मिनल का उपयोग करके परिवेश सेट करें:
यदि आपके पास Amazon SageMaker Studio Lab तक पहुंच नहीं है, तो ये निर्देश आपके लैपटॉप से भी काम करने चाहिए (हम अनुशंसा करते हैं कि आप पहले अपने लैपटॉप पर एनाकोंडा स्थापित करें)।
जब आपके पास वर्चुअल वातावरण पूरी तरह से सेट हो जाए, तो नोटबुक लॉन्च करें AutoGluon-cold-start-demo.ipynb
और कस्टम वातावरण का चयन करें .conda-autogluon:Python
गिरी।
लक्ष्य समय श्रृंखला और आइटम मेटा डेटासेट तैयार करें
निम्नलिखित डेटासेट को अपनी नोटबुक इंस्टेंस में डाउनलोड करें यदि वे शामिल नहीं हैं, और उन्हें निर्देशिका के अंतर्गत सहेजें data/
. आप इन डेटासेट को हमारे . पर पा सकते हैं गीथहब रेपो:
- टेस्ट.csv.gz
- ColdStartTargetData.csv
- आइटममेटाडेटा.सीएसवी
लक्ष्य समय श्रृंखला डेटासेट को कर्नेल में लोड करने के लिए निम्न स्निपेट चलाएँ:
AutoGluon समय श्रृंखला को संख्यात्मक प्रारूप में प्रदर्शित करने के लिए स्थिर सुविधाओं की आवश्यकता होती है। यह आवेदन करने के माध्यम से प्राप्त किया जा सकता है LabelEncoder()
हमारी स्थिर सुविधा पर type
, जहां हम ए = 0, बी = 1, सी = 2, डी = 3 को एन्कोड करते हैं (निम्न कोड देखें)। डिफ़ॉल्ट रूप से, AutoGluon स्थिर सुविधा को या तो क्रमिक या श्रेणीबद्ध होने का अनुमान लगाता है। आप स्थिर फीचर कॉलम को श्रेणीबद्ध सुविधाओं के लिए ऑब्जेक्ट/स्ट्रिंग डेटा प्रकार, या सामान्य सुविधाओं के लिए पूर्णांक/फ्लोट डेटा प्रकार के रूप में परिवर्तित करके इसे ओवरराइट भी कर सकते हैं।
AutoGluon मॉडल प्रशिक्षण सेट अप करें और प्रारंभ करें
हमें निर्दिष्ट करने की आवश्यकता है save_path = ‘autogluon-coldstart-demo’
मॉडल विरूपण साक्ष्य फ़ोल्डर नाम के रूप में (निम्न कोड देखें)। हमने अपना भी सेट किया है eval_metric
as माध्य निरपेक्ष प्रतिशत त्रुटिया, ‘MAPE’
संक्षेप में, जहां हमने परिभाषित किया है prediction_length
24 घंटे के रूप में। यदि निर्दिष्ट नहीं है, तो AutoGluon डिफ़ॉल्ट रूप से संभाव्य पूर्वानुमान उत्पन्न करता है और उन्हें के माध्यम से स्कोर करता है भारित मात्रात्मक हानि. हम केवल को देखते हैं दीपर मॉडल हमारे डेमो में, क्योंकि हम जानते हैं कि दीपार एल्गोरिदम डिजाइन द्वारा ठंड शुरू करने की भविष्यवाणी की अनुमति देता है। हम दीपार हाइपरपैरामीटर में से एक को मनमाने ढंग से सेट करते हैं और उस हाइपरपैरामीटर को पास करते हैं ForecastingPredictor().fit()
बुलाना। यह AutoGluon को केवल निर्दिष्ट मॉडल में देखने की अनुमति देता है। ट्यून करने योग्य हाइपरपैरामीटर की पूरी सूची के लिए, देखें Gluonts.model.दीपर पैकेज.
प्रशिक्षण में 30-45 मिनट लगते हैं। आप निम्न फ़ंक्शन को कॉल करके मॉडल सारांश प्राप्त कर सकते हैं:
कोल्ड स्टार्ट आइटम पर पूर्वानुमान
अब हम कोल्ड स्टार्ट आइटम के लिए पूर्वानुमान तैयार करने के लिए तैयार हैं। हम अनुशंसा करते हैं कि प्रत्येक के लिए कम से कम पाँच पंक्तियाँ हों item_id
. इसलिए, के लिए item_id
जिसमें पांच से कम अवलोकन हैं, हम NaN से भरते हैं। हमारे डेमो में, दोनों item_id
370 और 372 में शून्य अवलोकन है, एक शुद्ध कोल्ड स्टार्ट समस्या है, जबकि अन्य दो में पांच लक्ष्य मान हैं।
निम्न कोड के साथ कोल्ड स्टार्ट लक्ष्य समय श्रृंखला डेटासेट में लोड करें:
हम अपने AutoGluon मॉडल में कोल्ड स्टार्ट टारगेट टाइम सीरीज़ को कोल्ड स्टार्ट के लिए आइटम मेटा डेटासेट के साथ फीड करते हैं item_id
:
भविष्यवाणियों की कल्पना करें
हम कोल्ड स्टार्ट फोरकास्टिंग पर एक विज़ुअलाइज़ेशन उत्पन्न करने के लिए एक प्लॉटिंग फ़ंक्शन बना सकते हैं, जैसा कि निम्नलिखित ग्राफ में दिखाया गया है।
क्लीन अप
संसाधन उपयोग को अनुकूलित करने के लिए, नोटबुक को पूरी तरह से एक्सप्लोर करने के बाद Amazon SageMaker Studio Lab पर रनटाइम को रोकने पर विचार करें।
निष्कर्ष
इस पोस्ट में, हमने दिखाया कि Amazon SageMaker Studio Lab पर टाइम सीरीज़ डेटा के लिए AutoGluon AutoML का उपयोग करके कोल्ड स्टार्ट फोरकास्टिंग इंजन कैसे बनाया जाता है। आप में से उन लोगों के लिए जो अंतर के बारे में सोच रहे हैं अमेज़न का पूर्वानुमान और ऑटोग्लुऑन (समय श्रृंखला), अमेज़ॅन पूर्वानुमान एक पूरी तरह से प्रबंधित और समर्थित सेवा है जो बिना किसी पूर्व एमएल अनुभव की आवश्यकता के अत्यधिक सटीक पूर्वानुमान उत्पन्न करने के लिए मशीन लर्निंग (एमएल) का उपयोग करती है। जबकि AutoGluon एक ओपन-सोर्स प्रोजेक्ट है जो नवीनतम शोध योगदानों के साथ समुदाय समर्थित है। समय श्रृंखला के लिए AutoGluon क्या करने में सक्षम है, यह प्रदर्शित करने के लिए हम एक एंड-टू-एंड उदाहरण के माध्यम से चले गए, और एक डेटासेट और उपयोग केस प्रदान किया।
टाइम सीरीज़ डेटा के लिए ऑटोग्लुऑन एक ओपन-सोर्स पायथन पैकेज है, और हम आशा करते हैं कि यह पोस्ट, हमारे कोड उदाहरण के साथ, आपको चुनौतीपूर्ण कोल्ड स्टार्ट फोरकास्टिंग समस्याओं से निपटने के लिए एक सीधा समाधान देता है। आप हमारे पूरे उदाहरण तक पहुंच सकते हैं गीथहब रेपो. इसे आज़माएं, और हमें बताएं कि आप क्या सोचते हैं!
लेखक के बारे में
इवान कुई एडब्ल्यूएस प्रोफेशनल सर्विसेज के साथ डेटा साइंटिस्ट हैं, जहां वे ग्राहकों को एडब्ल्यूएस पर मशीन लर्निंग का उपयोग करके समाधान बनाने और तैनात करने में मदद करते हैं। उन्होंने सॉफ्टवेयर, फाइनेंस, फार्मास्युटिकल और हेल्थकेयर सहित विभिन्न उद्योगों में ग्राहकों के साथ काम किया है। अपने खाली समय में, उन्हें पढ़ना, अपने परिवार के साथ समय बिताना और अपने स्टॉक पोर्टफोलियो को अधिकतम करना पसंद है।
जोनास मुलर एडब्ल्यूएस में एआई रिसर्च एंड एजुकेशन ग्रुप में सीनियर एप्लाइड साइंटिस्ट हैं, जहां उन्होंने डीप लर्निंग को बेहतर बनाने और ऑटोमेटेड मशीन लर्निंग को विकसित करने के लिए नए एल्गोरिदम विकसित किए हैं। एमएल को लोकतांत्रिक बनाने के लिए एडब्ल्यूएस में शामिल होने से पहले, उन्होंने एमआईटी कंप्यूटर साइंस और आर्टिफिशियल इंटेलिजेंस लैब में पीएचडी पूरी की। अपने खाली समय में, उन्हें पहाड़ों और बाहर घूमने में मज़ा आता है।
वेनमिंग ये AWS AI में रिसर्च प्रोडक्ट मैनेजर हैं। उन्हें ओपन-सोर्स और अत्याधुनिक मशीन लर्निंग टेक्नोलॉजी के माध्यम से शोधकर्ताओं और उद्यम ग्राहकों को अपने नवाचारों को तेजी से बढ़ाने में मदद करने का शौक है। वेनमिंग के पास माइक्रोसॉफ्ट रिसर्च, एसक्यूएल इंजीनियरिंग टीम और सफल स्टार्टअप से विविध आर एंड डी अनुभव है।
- कॉइनस्मार्ट। यूरोप का सर्वश्रेष्ठ बिटकॉइन और क्रिप्टो एक्सचेंज।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। नि: शुल्क प्रवेश।
- क्रिप्टोहॉक। Altcoin रडार। मुफ्त परीक्षण।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/build-a-cold-start-time-series-forecasting-engine-using-autogluon/
- "
- 100
- 9
- About
- पूर्ण
- पहुँच
- लेखा
- सही
- हासिल
- के पार
- AI
- ai शोध
- कलन विधि
- एल्गोरिदम
- की अनुमति दे
- हालांकि
- वीरांगना
- लागू
- दृष्टिकोण
- कृत्रिम
- कृत्रिम बुद्धिमत्ता
- स्वचालित
- उपलब्ध
- औसत
- एडब्ल्यूएस
- निर्माण
- बनाता है
- व्यवसायों
- कॉल
- पा सकते हैं
- क्षमताओं
- CD
- परिवर्तन
- चेक आउट
- कोड
- स्तंभ
- समुदाय
- कंपनी का है
- कम्प्यूटर साइंस
- खपत
- ग्राहक
- तिथि
- आँकड़े वाला वैज्ञानिक
- मांग
- तैनात
- डिज़ाइन
- विकसित करना
- विकसित
- डेवलपर्स
- नहीं करता है
- शिक्षा
- प्रभावी
- बिजली
- अभियांत्रिकी
- घुसा
- उद्यम
- वातावरण
- आवश्यक
- उदाहरण
- अनुभव
- अनुभवी
- विस्तार
- परिवार
- Feature
- विशेषताएं
- आकृति
- वित्त
- प्रथम
- निम्नलिखित
- प्रारूप
- मुक्त
- पूर्ण
- समारोह
- भविष्य
- उत्पन्न
- जाना
- अच्छा
- समूह
- होने
- स्वास्थ्य सेवा
- मदद करता है
- अत्यधिक
- ऐतिहासिक
- कैसे
- How To
- HTTPS
- की छवि
- लागू करने के
- में सुधार
- शामिल
- सहित
- व्यक्ति
- उद्योगों
- उद्योग
- एकीकृत
- बुद्धि
- IT
- कुंजी
- जानने वाला
- लैपटॉप
- ताज़ा
- लांच
- प्रमुख
- जानें
- सीख रहा हूँ
- पुस्तकालय
- लाइन
- सूची
- थोड़ा
- भार
- मशीन
- यंत्र अधिगम
- निर्माण
- प्रबंधक
- बाजार
- मेटा
- माइक्रोसॉफ्ट
- एमआईटी
- ML
- आदर्श
- मॉडल
- अधिकांश
- चलती
- नया उत्पाद
- नोटबुक
- ओपन-सोर्स कोड
- अन्य
- सड़क पर
- प्रतिशतता
- फार्मास्युटिकल
- संविभाग
- भविष्यवाणियों
- मुसीबत
- समस्याओं
- प्रक्रियाओं
- उत्पादन
- एस्ट्रो मॉल
- उत्पाद
- पेशेवर
- परियोजना
- प्रदान करता है
- अनुसंधान और विकास
- कच्चा
- पढ़ना
- की सिफारिश
- अनुसंधान
- संसाधन
- उपयुक्त संसाधन चुनें
- खुदरा
- विक्रय
- स्केल
- स्केलिंग
- विज्ञान
- वैज्ञानिक
- कई
- सेवा
- सेवाएँ
- सेट
- कम
- समान
- सॉफ्टवेयर
- समाधान ढूंढे
- खर्च
- प्रारंभ
- स्टार्टअप
- स्टॉक
- स्टूडियो
- सफल
- समर्थित
- लक्ष्य
- कार्य
- टीम
- टेक्नोलॉजी
- अंतिम
- यहाँ
- पहर
- एक साथ
- परंपरागत
- यातायात
- प्रशिक्षण
- गाड़ियों
- us
- उपयोग
- वास्तविक
- दृश्य
- वेब
- क्या
- कौन
- अंदर
- बिना
- काम
- काम किया
- काम कर रहे
- शून्य