खुदरा उद्योग में अमेज़ॅन पूर्वानुमान को लागू करना: पीओसी से उत्पादन तक की यात्रा

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

अमेज़न का पूर्वानुमान एक पूरी तरह से प्रबंधित सेवा है जो अत्यधिक सटीक समय-श्रृंखला पूर्वानुमान देने के लिए सांख्यिकीय और मशीन लर्निंग (एमएल) एल्गोरिदम का उपयोग करती है। हाल ही में, अमेज़ॅन पूर्वानुमान के आधार पर, हमने अपने एक खुदरा ग्राहक को 8 सप्ताह के भीतर सटीक मांग पूर्वानुमान प्राप्त करने में मदद की। समाधान ने मैनुअल पूर्वानुमान में 10% की औसत से सुधार किया वैप मीट्रिक। इससे मासिक 16 श्रम घंटों की सीधी बचत होती है। इसके अलावा, हमने अनुमान लगाया कि वस्तुओं की सही संख्या को पूरा करने से बिक्री में 11.8% तक की वृद्धि हो सकती है। इस पोस्ट में, हम वर्कफ़्लो और महत्वपूर्ण तत्वों को लागू करने के लिए प्रस्तुत करते हैं - अवधारणा के प्रमाण (पीओसी) से लेकर उत्पादन तक - अमेज़ॅन पूर्वानुमान के साथ एक मांग पूर्वानुमान प्रणाली, जो खुदरा उद्योग में चुनौतियों पर केंद्रित है।

खुदरा उद्योग में मांग के पूर्वानुमान की पृष्ठभूमि और वर्तमान चुनौतियाँ

मांग के पूर्वानुमान का लक्ष्य ऐतिहासिक डेटा से भविष्य की मांग का अनुमान लगाना और पुनःपूर्ति और क्षमता आवंटन को स्टोर करने में मदद करना है। मांग पूर्वानुमान के साथ, खुदरा विक्रेता मांग को पूरा करने के लिए अपने नेटवर्क में प्रत्येक स्थान पर सही मात्रा में वस्तु-सूची रखने में सक्षम होते हैं। इसलिए, एक सटीक पूर्वानुमान प्रणाली विभिन्न व्यावसायिक कार्यों में व्यापक लाभ प्रदान कर सकती है, जैसे:

बेहतर उत्पाद उपलब्धता से बिक्री बढ़ाना और इंटर-स्टोर ट्रांसफर वेस्ट के प्रयास को कम करना
क्षमता उपयोग में सुधार के लिए और अधिक विश्वसनीय अंतर्दृष्टि प्रदान करना और क्षमता प्रावधान में बाधाओं से सक्रिय रूप से बचना
इन्वेंट्री और उत्पादन लागत को कम करना और इन्वेंट्री टर्नओवर में सुधार करना
एक समग्र बेहतर ग्राहक अनुभव प्रस्तुत करना

जब अच्छी गुणवत्ता वाले डेटा की एक बड़ी मात्रा मौजूद होती है, तो एमएल तकनीक महान मूल्य प्रदर्शित करती है। आज, अधिकांश खुदरा विक्रेताओं के लिए अनुभव-आधारित पुनःपूर्ति प्रबंधन या मांग पूर्वानुमान अभी भी मुख्यधारा है। ग्राहक अनुभव को बेहतर बनाने के लक्ष्य के साथ, अधिक से अधिक खुदरा विक्रेता अनुभव-आधारित मांग पूर्वानुमान प्रणालियों को एमएल-आधारित पूर्वानुमानों के साथ बदलने के इच्छुक हैं। हालांकि, एमएल-आधारित मांग पूर्वानुमान प्रणाली को उत्पादन में लागू करते समय खुदरा विक्रेताओं को कई चुनौतियों का सामना करना पड़ता है। हम विभिन्न चुनौतियों को तीन श्रेणियों में सारांशित करते हैं: डेटा चुनौतियाँ, एमएल चुनौतियाँ और परिचालन चुनौतियाँ।

डेटा चुनौतियां

सटीक एमएल-आधारित भविष्यवाणियों को चलाने के लिए स्वच्छ, गुणवत्तापूर्ण डेटा की एक बड़ी मात्रा एक महत्वपूर्ण आवश्यकता है। गुणवत्ता डेटा, जिसमें ऐतिहासिक बिक्री और बिक्री से संबंधित डेटा (जैसे इन्वेंट्री, आइटम मूल्य निर्धारण और प्रचार) शामिल हैं, को एकत्र और समेकित करने की आवश्यकता है। कई संसाधनों से डेटा की विविधता के लिए डेटा साइलो को एकजुट करने के लिए एक आधुनिक डेटा प्लेटफॉर्म की आवश्यकता होती है। इसके अलावा, लगातार और ठीक-ठाक मांग पूर्वानुमानों के लिए समयबद्ध तरीके से डेटा तक पहुंच आवश्यक है।

एमएल चुनौतियों

उन्नत एमएल एल्गोरिदम विकसित करने के लिए विशेषज्ञता की आवश्यकता होती है। सही समस्या के लिए सही एल्गोरिदम को लागू करने के लिए गहन डोमेन ज्ञान और एमएल क्षमता दोनों की आवश्यकता होती है। इसके अलावा, बड़े उपलब्ध डेटासेट से सीखने के लिए एक स्केलेबल एमएल इंफ्रास्ट्रक्चर की आवश्यकता होती है। इसके अलावा, उत्पादन में एमएल एल्गोरिदम को बनाए रखने के लिए मॉडल की गिरावट के मूल कारण का विश्लेषण करने और मॉडल को सही ढंग से पुनः प्रशिक्षित करने के लिए एमएल दक्षताओं की आवश्यकता होती है।

व्यावहारिक व्यावसायिक समस्याओं को हल करने के लिए, सटीक पूर्वानुमान तैयार करना कहानी का केवल एक हिस्सा है। निर्णयकर्ताओं को विभिन्न मात्राओं पर संभाव्य पूर्वानुमानों की आवश्यकता होती है, जो महत्वपूर्ण ग्राहक अनुभव बनाम वित्तीय परिणाम व्यापार-बंद निर्णय लेते हैं। उन्हें हितधारकों को भविष्यवाणियों की व्याख्या करने की भी आवश्यकता है, और यह जांचने के लिए क्या-क्या विश्लेषण करता है कि विभिन्न परिदृश्य पूर्वानुमान परिणामों को कैसे प्रभावित कर सकते हैं।

संचालन संबंधी चुनौतियाँ

लागत प्रभावी पूर्वानुमान प्रणाली को बनाए रखने के परिचालन प्रयास को कम करना तीसरी प्रमुख चुनौती है। मांग पूर्वानुमान के एक सामान्य परिदृश्य में, प्रत्येक स्थान पर प्रत्येक वस्तु का अपना पूर्वानुमान होता है। एक प्रणाली की आवश्यकता है जो किसी भी समय सैकड़ों हजारों पूर्वानुमानों का प्रबंधन कर सके। इसके अलावा, व्यापार के अंतिम उपयोगकर्ताओं को मौजूदा आपूर्ति श्रृंखला प्रबंधन प्लेटफार्मों जैसे मौजूदा डाउनस्ट्रीम सिस्टम में एकीकृत होने के लिए पूर्वानुमान प्रणाली की आवश्यकता होती है, ताकि वे मौजूदा उपकरणों और प्रक्रियाओं को संशोधित किए बिना एमएल-आधारित सिस्टम का उपयोग कर सकें।

ये चुनौतियाँ विशेष रूप से तीव्र होती हैं जब व्यवसाय बड़ा, गतिशील और विकसित होता है। इन चुनौतियों का समाधान करने के लिए, हम एक ग्राहक सफलता की कहानी साझा करते हैं जो संभावित व्यावसायिक लाभ को शीघ्रता से मान्य करने के प्रयासों को कम करती है। यह अमेज़ॅन पूर्वानुमान के साथ प्रोटोटाइप के माध्यम से प्राप्त किया जाता है - एक पूरी तरह से प्रबंधित सेवा जो अंतर्निहित बुनियादी ढांचे के संसाधनों और एल्गोरिदम को प्रबंधित करने की आवश्यकता के बिना सटीक पूर्वानुमान परिणाम प्रदान करती है।

अमेज़ॅन पूर्वानुमान के साथ एमएल-आधारित पूर्वानुमान प्रणाली के लिए रैपिड प्रोटोटाइपिंग

अपने अनुभव के आधार पर, हम अक्सर देखते हैं कि खुदरा ग्राहक अपने बिक्री डेटा पर अवधारणा का प्रमाण शुरू करने के इच्छुक हैं। मॉडल ट्यूनिंग प्रक्रिया के माध्यम से पुनरावृति करने के लिए डेटा जटिलता और उपलब्ध संसाधनों के आधार पर, यह तेजी से प्रोटोटाइप के लिए कुछ दिनों से लेकर कुछ हफ्तों तक किया जा सकता है। प्रोटोटाइपिंग के दौरान, हम प्रक्रिया को प्रभावी ढंग से प्रबंधित करने के लिए स्प्रिंट का उपयोग करने और POC को डेटा अन्वेषण, पुनरावृत्त सुधार और स्वचालन चरणों में अलग करने का सुझाव देते हैं।

डाटा अन्वेषण

डेटा एक्सप्लोरेशन में अक्सर ऐतिहासिक बिक्री डेटासेट और उपलब्ध डेटा स्रोतों से परिचित होने के लिए डेटा वैज्ञानिकों या व्यावसायिक खुफिया विश्लेषकों के साथ गहन चर्चा शामिल होती है, जो संभावित रूप से पूर्वानुमान परिणामों को प्रभावित कर सकते हैं, जैसे इन्वेंट्री और ऐतिहासिक प्रचार कार्यक्रम। परियोजना के प्रारंभिक चरण में डेटा वेयरहाउस से लक्ष्य डेटासेट के रूप में, बिक्री डेटा को समेकित करने के लिए सबसे कुशल तरीकों में से एक है। यह इस तथ्य पर आधारित है कि पूर्वानुमान के परिणाम अक्सर लक्ष्य डेटासेट पैटर्न पर हावी होते हैं। डेटा वेयरहाउस अक्सर दिन-प्रतिदिन के व्यावसायिक डेटा को संग्रहीत करते हैं, और थोड़े समय के भीतर एक संपूर्ण समझ कठिन और समय लेने वाली होती है। हमारा सुझाव लक्ष्य डेटासेट बनाने पर ध्यान देना है और यह सुनिश्चित करना है कि यह डेटासेट सही है। ये डेटा एक्सप्लोरेशन और बेसलाइन परिणाम अक्सर कुछ दिनों के भीतर प्राप्त किए जा सकते हैं, और यह निर्धारित कर सकता है कि लक्ष्य डेटा का सटीक पूर्वानुमान लगाया जा सकता है या नहीं। हम बाद में इस पोस्ट में डेटा पूर्वानुमान पर चर्चा करते हैं।

यात्रा

हमारे पास आधारभूत परिणाम आने के बाद, हम यह देखने के लिए अधिक संबंधित डेटा जोड़ना जारी रख सकते हैं कि ये सटीकता को कैसे प्रभावित कर सकते हैं। यह अक्सर अतिरिक्त डेटासेट में गहन गोता लगाने के माध्यम से किया जाता है; अधिक जानकारी के लिए, देखें संबंधित समय श्रृंखला डेटासेट का उपयोग करना और आइटम मेटाडेटा डेटासेट का उपयोग करना.

कुछ मामलों में, डेटासेट के समान व्यवहार वाले मॉडल को प्रशिक्षित करके या डेटासेट से विरल डेटा को हटाकर अमेज़ॅन पूर्वानुमान में सटीकता में सुधार करना संभव हो सकता है। इस पुनरावृत्त सुधार चरण के दौरान, चुनौतीपूर्ण हिस्सा - सभी एमएल परियोजनाओं के लिए सच है - यह है कि वर्तमान पुनरावृत्ति पिछले पुनरावृत्ति के प्रमुख निष्कर्षों और अंतर्दृष्टि पर निर्भर करती है, इसलिए कठोर विश्लेषण और रिपोर्टिंग सफलता की कुंजी है।

विश्लेषण मात्रात्मक और अनुभवजन्य रूप से किया जा सकता है। मात्रात्मक पहलू बैकटेस्टिंग के दौरान मूल्यांकन को संदर्भित करता है और सटीकता मीट्रिक की तुलना करता है, जैसे वैप. अनुभवजन्य पहलू भविष्यवाणी वक्र और वास्तविक लक्ष्य डेटा को देखने और संभावित कारकों को शामिल करने के लिए डोमेन ज्ञान का उपयोग करने के लिए संदर्भित करता है। ये विश्लेषण आपको पूर्वानुमानित परिणामों और लक्ष्य डेटा के बीच के अंतर को पाटने के लिए तेज़ी से पुनरावृति करने में मदद करते हैं। इसके अलावा, एक साप्ताहिक रिपोर्ट के माध्यम से ऐसे परिणाम प्रस्तुत करना अक्सर व्यवसाय के अंतिम उपयोगकर्ताओं को विश्वास प्रदान कर सकता है।

स्वचालन

अंतिम चरण में अक्सर POC की उत्पादन प्रक्रिया और स्वचालन की चर्चा शामिल होती है। क्योंकि एमएल परियोजना कुल परियोजना अवधि से विवश है, हमारे पास हर संभावना का पता लगाने के लिए पर्याप्त समय नहीं हो सकता है। इसलिए, परियोजना के दौरान निष्कर्षों के दौरान संभावित क्षेत्र का संकेत देना अक्सर विश्वास अर्जित कर सकता है। इसके अलावा, स्वचालन व्यवसाय के अंतिम उपयोगकर्ताओं को लंबी अवधि के लिए पूर्वानुमान का मूल्यांकन करने में मदद कर सकता है, क्योंकि वे अद्यतन डेटा के साथ पूर्वानुमान उत्पन्न करने के लिए मौजूदा भविष्यवक्ता का उपयोग कर सकते हैं।

तकनीकी और व्यावसायिक दोनों दृष्टिकोणों से, उत्पन्न परिणामों के साथ सफलता के मानदंड का मूल्यांकन किया जा सकता है। मूल्यांकन अवधि के दौरान, हम निम्नलिखित के लिए संभावित लाभों का अनुमान लगा सकते हैं:

पूर्वानुमान सटीकता बढ़ाना (तकनीकी) - वास्तविक बिक्री डेटा के संबंध में भविष्यवाणी सटीकता की गणना करें, और मैन्युअल पूर्वानुमान सहित मौजूदा पूर्वानुमान प्रणाली के साथ तुलना करें
अपशिष्ट को कम करना (व्यवसाय) - कचरे को कम करने के लिए ओवर-फोरकास्टिंग को कम करें
इन-स्टॉक दरों में सुधार (व्यवसाय) - इन-स्टॉक दरों में सुधार के लिए अंडर-फोरकास्टिंग कम करें
सकल लाभ (व्यवसाय) की वृद्धि का अनुमान लगाना - सकल लाभ बढ़ाने के लिए अपव्यय कम करें और स्टॉक दरों में सुधार करें

हम निम्नलिखित आरेख में विकास कार्यप्रवाह को सारांशित करते हैं।

निम्नलिखित अनुभागों में, हम कार्यान्वयन के दौरान ध्यान में रखे जाने वाले महत्वपूर्ण तत्वों पर चर्चा करते हैं।

पूर्वानुमान प्रणाली विकसित करने के लिए चरण-दर-चरण कार्यप्रवाह

लक्ष्य डेटासेट पीढ़ी

पहला कदम पूर्वानुमान के लिए लक्ष्य डेटासेट तैयार करना है। खुदरा उद्योग में, यह खुदरा वस्तुओं (एसकेयू) के लिए ऐतिहासिक समय श्रृंखला की मांग और बिक्री डेटा को संदर्भित करता है। डेटासेट तैयार करते समय, एक महत्वपूर्ण पहलू ग्रैन्युलैरिटी है। हमें व्यावसायिक आवश्यकताओं और तकनीकी आवश्यकताओं दोनों से डेटा ग्रैन्युलैरिटी पर विचार करना चाहिए।

व्यवसाय परिभाषित करता है कि उत्पादन प्रणाली में पूर्वानुमान का परिणाम कैसे होता है:

क्षितिज - समय चरणों की संख्या का पूर्वानुमान लगाया जा रहा है। यह अंतर्निहित व्यावसायिक समस्या पर निर्भर करता है। यदि हम प्रत्येक सप्ताह स्टॉक स्तर को फिर से भरना चाहते हैं, तो साप्ताहिक पूर्वानुमान या दैनिक पूर्वानुमान उचित लगता है।
पठन स्तर - आपके पूर्वानुमानों की ग्रैन्युलैरिटी: समय आवृत्ति जैसे दैनिक या साप्ताहिक, विभिन्न स्टोर स्थान और एक ही आइटम के विभिन्न आकार। अंत में, भविष्यवाणी दैनिक डेटा बिंदुओं के साथ प्रत्येक स्टोर SKU का संयोजन हो सकती है।

यद्यपि पूर्वोक्त पूर्वानुमान क्षितिज और ग्रैन्युलैरिटी को व्यवसाय की आवश्यकता को प्राथमिकता देने के लिए परिभाषित किया जाना चाहिए, हमें आवश्यकताओं और व्यवहार्यता के बीच समझौता करने की आवश्यकता हो सकती है। फुटवियर व्यवसाय को एक उदाहरण के रूप में लें। यदि हम प्रत्येक स्टोर स्तर पर प्रत्येक जूते के आकार की बिक्री की भविष्यवाणी करना चाहते हैं, तो डेटा जल्द ही विरल हो जाता है और पैटर्न को खोजना मुश्किल हो जाता है। हालाँकि, स्टॉक को फिर से भरने के लिए, हमें इस ग्रैन्युलैरिटी का अनुमान लगाने की आवश्यकता है। ऐसा करने के लिए, वैकल्पिक समाधानों के लिए विभिन्न जूतों के आकारों के बीच अनुपात का अनुमान लगाने और इस अनुपात का उपयोग करके सूक्ष्म परिणामों की गणना करने की आवश्यकता हो सकती है।

हमें अक्सर व्यवसाय की आवश्यकता और डेटा पैटर्न को संतुलित करने की आवश्यकता होती है जिसे सीखा जा सकता है और पूर्वानुमान के लिए उपयोग किया जा सकता है। डेटा पैटर्न की मात्रात्मक योग्यता प्रदान करने के लिए, हम डेटा पूर्वानुमान का उपयोग करने का प्रस्ताव करते हैं।

डेटा पूर्वानुमान और डेटा पैटर्न वर्गीकरण

मुख्य अंतर्दृष्टि में से एक जिसे हम लक्ष्य डेटासेट से एकत्र कर सकते हैं, वह गुणवत्ता पूर्वानुमानों का उत्पादन करने की क्षमता है। एमएल परियोजना के बहुत प्रारंभिक चरण में इसका विश्लेषण किया जा सकता है। पूर्वानुमान तब चमकता है जब डेटा मौसमी, रुझान और चक्रीय पैटर्न दिखाता है।

पूर्वानुमान का निर्धारण करने के लिए, दो प्रमुख गुणांक हैं: मांग समय में परिवर्तनशीलता और मांग मात्रा में परिवर्तनशीलता। मांग समय में परिवर्तनशीलता का अर्थ है मांग के दो उदाहरणों के बीच का अंतराल, और यह समय में मांग की नियमितता को मापता है। मांग मात्रा में परिवर्तनशीलता का अर्थ है मात्राओं में भिन्नता। निम्नलिखित आंकड़ा कुछ अलग पैटर्न दिखाता है। पूर्वानुमान सटीकता दृढ़ता से उत्पाद पूर्वानुमान क्षमता पर निर्भर करती है। अधिक जानकारी के लिए, देखें मांग वर्गीकरण: पूर्वानुमान योग्यता क्यों मायने रखती है.

खुदरा उद्योग में अमेज़ॅन पूर्वानुमान को लागू करना: पीओसी से उत्पादन प्लेटोब्लॉकचेन डेटा इंटेलिजेंस तक की यात्रा। लंबवत खोज. ऐ. यह ध्यान देने योग्य है कि यह पूर्वानुमान विश्लेषण प्रत्येक ठीक-दाने वाली वस्तु के लिए है (उदाहरण के लिए, SKU-स्टोर-रंग-आकार)। यह काफी सामान्य है कि एक मांग पूर्वानुमान उत्पादन प्रणाली में, अलग-अलग आइटम अलग-अलग पैटर्न का पालन करते हैं। इसलिए, अलग-अलग डेटा पैटर्न के बाद आइटम को अलग करना महत्वपूर्ण है। एक विशिष्ट उदाहरण तेजी से चलने वाली और धीमी गति से चलने वाली वस्तुएं हैं; एक और उदाहरण सघन और विरल डेटा होगा। इसके अलावा, एक महीन दाने वाली वस्तु में एक ढेलेदार पैटर्न उत्पन्न करने की अधिक संभावना होती है। उदाहरण के लिए, एक कपड़े की दुकान में, एक लोकप्रिय वस्तु की बिक्री प्रतिदिन काफी सुचारू हो सकती है, लेकिन यदि हम प्रत्येक रंग और आकार के लिए वस्तु की बिक्री को और अलग कर दें, तो यह जल्द ही विरल हो जाती है। इसलिए, SKU-Store-Color-Size से SKU-Store में ग्रैन्युलैरिटी को कम करने से डेटा पैटर्न को ढेलेदार से सुचारू और इसके विपरीत बदल सकते हैं।

इसके अलावा, सभी आइटम बिक्री में समान रूप से योगदान नहीं करते हैं। हमने देखा है कि आइटम योगदान अक्सर पारेटो वितरण का अनुसरण करता है, जिसमें शीर्ष आइटम बिक्री में सबसे अधिक योगदान करते हैं। इन शीर्ष वस्तुओं की बिक्री अक्सर सुचारू होती है। कम बिक्री रिकॉर्ड वाली वस्तुएं अक्सर ढेलेदार और अनिश्चित होती हैं, और इसलिए अनुमान लगाना कठिन होता है। इन मदों को जोड़ने से वास्तव में शीर्ष विक्रय मदों की सटीकता कम हो सकती है। इन अवलोकनों के आधार पर, हम वस्तुओं को अलग-अलग समूहों में अलग कर सकते हैं, शीर्ष बिक्री वस्तुओं पर पूर्वानुमान मॉडल को प्रशिक्षित कर सकते हैं, और कम बिक्री वाली वस्तुओं को कोने के मामलों के रूप में संभाल सकते हैं।

डेटा संवर्धन और अतिरिक्त डेटासेट चयन

जब हम पूर्वानुमान परिणामों के प्रदर्शन को बेहतर बनाने के लिए अतिरिक्त डेटासेट का उपयोग करना चाहते हैं, तो हम इस पर भरोसा कर सकते हैं समय श्रृंखला डेटासेट और मेटाडेटा डेटासेट. खुदरा डोमेन में, अंतर्ज्ञान और डोमेन ज्ञान के आधार पर, इन्वेंट्री, मूल्य, प्रचार और सर्दी या गर्मी के मौसम जैसी सुविधाओं को संबंधित समय श्रृंखला के रूप में आयात किया जा सकता है। सुविधाओं की उपयोगिता की पहचान करने का सबसे सरल तरीका फीचर महत्व है। पूर्वानुमान में, यह स्पष्टीकरण विश्लेषण द्वारा किया जाता है। भविष्यवाणी पूर्वसूचक व्याख्यात्मकता यह बेहतर ढंग से समझने में हमारी मदद करता है कि डेटासेट की विशेषताएं लक्ष्य के लिए पूर्वानुमानों को कैसे प्रभावित करती हैं। पूर्वानुमान प्रत्येक विशेषता के सापेक्ष प्रभाव की मात्रा निर्धारित करने के लिए प्रभाव स्कोर नामक एक मीट्रिक का उपयोग करता है और यह निर्धारित करता है कि वे पूर्वानुमान मूल्यों को बढ़ाते हैं या घटाते हैं। यदि एक या अधिक विशेषताओं का प्रभाव स्कोर शून्य है, तो इन विशेषताओं का पूर्वानुमान मूल्यों पर कोई महत्वपूर्ण प्रभाव नहीं पड़ता है। इस तरह, हम कम प्रभाव वाली सुविधाओं को जल्दी से हटा सकते हैं और संभावित सुविधाओं को पुनरावृत्त रूप से जोड़ सकते हैं। यह नोट करना महत्वपूर्ण है कि प्रभाव स्कोर विशेषताओं के सापेक्ष प्रभाव को मापते हैं, जिन्हें अन्य सभी विशेषताओं के प्रभाव स्कोर के साथ सामान्यीकृत किया जाता है।

सभी एमएल परियोजनाओं की तरह, अतिरिक्त सुविधाओं के साथ सटीकता में सुधार के लिए पुनरावृत्त प्रयोगों की आवश्यकता होती है। मॉडल सटीकता पर वृद्धिशील परिवर्तनों के प्रभाव को देखते हुए आपको डेटासेट के कई संयोजनों के साथ प्रयोग करने की आवश्यकता है। आप पूर्वानुमान कंसोल के माध्यम से या इसके साथ कई पूर्वानुमान प्रयोग चलाने का प्रयास कर सकते हैं पूर्वानुमान एपीआई के साथ पायथन नोटबुक. इसके अलावा, आप के साथ जहाज कर सकते हैं एडब्ल्यूएस CloudFormation, जो AWS को तैनात करता है, सामान्य उपयोग के मामलों के लिए तैयार समाधान प्रदान करता है (उदाहरण के लिए, मशीन लर्निंग समाधान के साथ पूर्वानुमान सटीकता में सुधार). पूर्वानुमान स्वचालित रूप से डेटासेट को अलग करता है और भविष्यवाणियों का मूल्यांकन करने के लिए सटीकता मीट्रिक उत्पन्न करता है। अधिक जानकारी के लिए देखें पूर्वसूचक सटीकता का मूल्यांकन. यह डेटा वैज्ञानिकों को सबसे अच्छा प्रदर्शन करने वाले मॉडल को हासिल करने के लिए तेजी से पुनरावृति करने में मदद करता है।

उन्नत सुधार और कोने के मामलों को संभालना

हमने उल्लेख किया है कि पूर्वानुमान एल्गोरिदम डेटा से मौसमी, रुझान और चक्रीय विशेषताओं को सीख सकते हैं। इन विशेषताओं वाली वस्तुओं और उपयुक्त डेटा घनत्व और मात्रा के लिए, हम अनुमान लगाने के लिए पूर्वानुमान का उपयोग कर सकते हैं। हालाँकि, ढेलेदार डेटा पैटर्न का सामना करते समय, विशेष रूप से जब डेटा की मात्रा कम होती है, तो हमें उन्हें अलग तरीके से संभालने की आवश्यकता हो सकती है, जैसे कि एक नियम-सेट के आधार पर अनुभवजन्य अनुमान के साथ।

घने SKU के लिए, हम समय श्रृंखला डेटासेट के समान व्यवहार वाले सबसेट के साथ मॉडल को प्रशिक्षित करके पूर्वानुमान सटीकता में और सुधार करते हैं। हमारे द्वारा उपयोग की जाने वाली सबसेट पृथक्करण रणनीतियाँ व्यावसायिक तर्क, उत्पाद प्रकार, डेटा घनत्व और एल्गोरिथम द्वारा सीखे गए पैटर्न हैं। सबसेट उत्पन्न होने के बाद, हम अलग-अलग सबसेट के लिए कई पूर्वानुमान मॉडल को प्रशिक्षित कर सकते हैं। ऐसे ही एक उदाहरण के लिए देखें अमेज़ॅन पूर्वानुमान के साथ उपयोग के लिए क्लस्टर समय श्रृंखला डेटा.

उत्पादन की ओर: डेटासेट, निगरानी और पुनर्प्रशिक्षण को अद्यतन करना

आइए पूर्वानुमान के साथ एक उदाहरण आर्किटेक्चर का अन्वेषण करें, जैसा कि निम्नलिखित आरेख में दिखाया गया है। हर बार एक एंड-यूज़र एक नए डेटासेट को समेकित करता है अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3), यह ट्रिगर करता है AWS स्टेप फ़ंक्शंस विभिन्न घटकों को ऑर्केस्ट्रेट करने के लिए, जिसमें डेटासेट आयात कार्य बनाना, एक ऑटो प्रेडिक्टर बनाना और पूर्वानुमान उत्पन्न करना शामिल है। पूर्वानुमान के परिणाम उत्पन्न होने के बाद, पूर्वानुमान निर्यात बनाएँ चरण उन्हें डाउनस्ट्रीम उपभोक्ताओं के लिए Amazon S3 में निर्यात करता है। इस स्वचालित पाइपलाइन का प्रावधान करने के तरीके के बारे में अधिक जानकारी के लिए देखें AWS CloudFormation के साथ स्वचालन. यह S3 बकेट में डेटासेट को स्वचालित रूप से परिनियोजित करने और पूर्वानुमान पाइपलाइन को ट्रिगर करने के लिए CloudFormation स्टैक का उपयोग करता है। आप अपने स्वयं के डेटासेट के साथ पूर्वानुमान उत्पन्न करने के लिए समान स्वचालन स्टैक का उपयोग कर सकते हैं।

खुदरा उद्योग में अमेज़ॅन पूर्वानुमान को लागू करना: पीओसी से उत्पादन प्लेटोब्लॉकचेन डेटा इंटेलिजेंस तक की यात्रा। लंबवत खोज. ऐ.

पूर्वानुमान प्रणाली में हाल के रुझानों को शामिल करने के दो तरीके हैं: डेटा को अपडेट करना या भविष्यवक्ता को फिर से प्रशिक्षित करना।

हाल के रुझानों को दर्शाने वाले अपडेट किए गए डेटा के साथ पूर्वानुमान उत्पन्न करने के लिए, आपको अपडेट की गई इनपुट डेटा फ़ाइल को S3 बकेट में अपलोड करने की आवश्यकता है (अपडेट किए गए इनपुट डेटा में अभी भी आपके सभी मौजूदा डेटा शामिल होने चाहिए)। जब आप अपडेट किए गए डेटासेट को आयात करते हैं तो पूर्वानुमान स्वचालित रूप से भविष्यवक्ता को फिर से प्रशिक्षित नहीं करता है। तुम कर सकते हो पूर्वानुमान उत्पन्न करें जैसा कि आप आमतौर पर करते हैं। पूर्वानुमान अद्यतन किए गए इनपुट डेटा में अंतिम दिन से शुरू होने वाले पूर्वानुमान क्षितिज की भविष्यवाणी करता है। इसलिए, हाल के रुझानों को पूर्वानुमान द्वारा उत्पादित किसी भी नए संदर्भ में शामिल किया गया है।

हालाँकि, यदि आप चाहते हैं कि आपका भविष्यवक्ता नए डेटा से प्रशिक्षित हो, तो आपको एक नया भविष्यवक्ता बनाना होगा। डेटा पैटर्न (मौसमी, रुझान, या चक्र) बदलने पर आपको मॉडल को फिर से प्रशिक्षित करने पर विचार करने की आवश्यकता हो सकती है। जैसा कि में बताया गया है अमेज़ॅन पूर्वानुमान के साथ भविष्यवक्ता सटीकता की निरंतर निगरानी करें, आर्थिक वातावरण में या उपभोक्ता व्यवहार में परिवर्तन जैसे कारकों के कारण भविष्यवक्ता के प्रदर्शन में समय के साथ उतार-चढ़ाव आएगा। इसलिए, भविष्यवक्ता को फिर से प्रशिक्षित करने की आवश्यकता हो सकती है, या अत्यधिक सटीक भविष्यवाणियां जारी रखने के लिए एक नया भविष्यवक्ता बनाने की आवश्यकता हो सकती है। की मदद से भविष्यवक्ता निगरानी, पूर्वानुमान आपके भविष्यवक्ताओं की गुणवत्ता को ट्रैक कर सकता है, जिससे आप परिचालन प्रयासों को कम कर सकते हैं, जबकि आपको अपने भविष्यवक्ताओं को रखने, पुनः प्रशिक्षित करने या पुनर्निर्माण के बारे में अधिक सूचित निर्णय लेने में मदद मिलती है।

निष्कर्ष

अमेज़ॅन पूर्वानुमान एमएल पर आधारित एक समय श्रृंखला पूर्वानुमान सेवा है और व्यापार मेट्रिक्स विश्लेषण के लिए बनाया गया है। हम ऐतिहासिक बिक्री और अन्य प्रासंगिक जानकारी जैसे इन्वेंट्री, प्रचार या सीज़न को जोड़कर उच्च सटीकता के साथ मांग पूर्वानुमान भविष्यवाणी को एकीकृत कर सकते हैं। 8 सप्ताह के भीतर, हमने अपने एक खुदरा ग्राहक को सटीक मांग पूर्वानुमान प्राप्त करने में मदद की—मैन्युअल पूर्वानुमान की तुलना में 10% सुधार। इससे मासिक 16 श्रम घंटों की प्रत्यक्ष बचत होती है और अनुमानित बिक्री में 11.8% तक की वृद्धि होती है।

इस पोस्ट ने आपकी पूर्वानुमान परियोजना को अवधारणा के प्रमाण से उत्पादन तक लाने के लिए सामान्य प्रथाओं को साझा किया। के साथ अभी शुरू करें अमेज़न का पूर्वानुमान अपने व्यवसाय के लिए अत्यधिक सटीक पूर्वानुमान प्राप्त करने के लिए।

लेखक के बारे में

खुदरा उद्योग में अमेज़ॅन पूर्वानुमान को लागू करना: पीओसी से उत्पादन प्लेटोब्लॉकचेन डेटा इंटेलिजेंस तक की यात्रा। लंबवत खोज. ऐ. यानवेई कुई, PhD, AWS में मशीन लर्निंग स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। उन्होंने IRISA (रिसर्च इंस्टीट्यूट ऑफ कंप्यूटर साइंस एंड रैंडम सिस्टम्स) में मशीन लर्निंग रिसर्च शुरू किया, और कंप्यूटर विज़न, नेचुरल लैंग्वेज प्रोसेसिंग और ऑनलाइन यूजर बिहेवियर प्रेडिक्शन में आर्टिफिशियल इंटेलिजेंस पावर्ड इंडस्ट्रियल एप्लिकेशन बनाने का कई वर्षों का अनुभव है। AWS में, वह डोमेन विशेषज्ञता साझा करता है और ग्राहकों को व्यावसायिक संभावनाओं को अनलॉक करने में मदद करता है, और बड़े पैमाने पर मशीन लर्निंग के साथ कार्रवाई योग्य परिणाम प्राप्त करने में मदद करता है। काम के बाहर, उन्हें पढ़ना और यात्रा करना पसंद है।

खुदरा उद्योग में अमेज़ॅन पूर्वानुमान को लागू करना: पीओसी से उत्पादन प्लेटोब्लॉकचेन डेटा इंटेलिजेंस तक की यात्रा। लंबवत खोज. ऐ. गॉर्डन वांग Amazon Web Services की प्रोफेशनल सर्विसेज टीम में सीनियर डेटा साइंटिस्ट हैं। वह मीडिया, निर्माण, ऊर्जा, खुदरा और स्वास्थ्य सेवा सहित कई उद्योगों में ग्राहकों का समर्थन करता है। उन्हें कंप्यूटर विज़न, डीप लर्निंग और MLOps का शौक है। अपने खाली समय में उन्हें दौड़ना और लंबी पैदल यात्रा करना बहुत पसंद है।