अमेज़ॅन सैजमेकर ऑटोपायलट आपको पूर्ण नियंत्रण और दृश्यता बनाए रखने की अनुमति देते हुए, स्वचालित रूप से आपके डेटा के आधार पर सर्वश्रेष्ठ मशीन लर्निंग (एमएल) मॉडल बनाता है, प्रशिक्षित करता है और ट्यून करता है। हमने हाल ही में घोषणा की है ऑटोपायलट में समय श्रृंखला डेटा के लिए समर्थन. आप समय श्रृंखला डेटा, या सामान्य रूप से अनुक्रम डेटा पर प्रतिगमन और वर्गीकरण कार्यों से निपटने के लिए ऑटोपायलट का उपयोग कर सकते हैं। समय श्रृंखला डेटा एक विशेष प्रकार का अनुक्रम डेटा है जहां डेटा बिंदु सम समय अंतराल पर एकत्र किए जाते हैं।
डेटा को मैन्युअल रूप से तैयार करना, सही एमएल मॉडल का चयन करना और इसके मापदंडों को अनुकूलित करना एक विशेषज्ञ व्यवसायी के लिए भी एक जटिल कार्य है। हालांकि स्वचालित दृष्टिकोण मौजूद हैं जो सर्वोत्तम मॉडल और उनके पैरामीटर ढूंढ सकते हैं, ये आम तौर पर अनुक्रम के रूप में आने वाले डेटा को संभाल नहीं सकते हैं, जैसे कि नेटवर्क ट्रैफ़िक, बिजली की खपत, या समय के साथ दर्ज किए गए घरेलू खर्च। चूंकि यह डेटा अलग-अलग समय बिंदुओं पर प्राप्त अवलोकनों का रूप लेता है, इसलिए लगातार अवलोकनों को एक-दूसरे से स्वतंत्र नहीं माना जा सकता है और इसे समग्र रूप से संसाधित करने की आवश्यकता होती है। अनुक्रमिक डेटा से निपटने में समस्याओं की एक विस्तृत श्रृंखला के लिए आप ऑटोपायलट का उपयोग कर सकते हैं। उदाहरण के लिए, आप दुर्भावनापूर्ण गतिविधियों की पहचान करने के लिए समय के साथ रिकॉर्ड किए गए नेटवर्क ट्रैफ़िक को वर्गीकृत कर सकते हैं, या यह निर्धारित कर सकते हैं कि व्यक्ति अपने क्रेडिट इतिहास के आधार पर बंधक के लिए योग्य हैं या नहीं। आप समय श्रृंखला डेटा युक्त एक डेटासेट प्रदान करते हैं और ऑटोपायलट बाकी को संभालता है, विशेष फीचर ट्रांसफॉर्म के माध्यम से अनुक्रमिक डेटा को संसाधित करता है और आपकी ओर से सबसे अच्छा मॉडल ढूंढता है।
ऑटोपायलट एमएल मॉडल के निर्माण की भारी भारोत्तोलन को समाप्त करता है, और आपको अपने डेटा के आधार पर सर्वश्रेष्ठ एमएल मॉडल को स्वचालित रूप से बनाने, प्रशिक्षित करने और ट्यून करने में मदद करता है। ऑटोपायलट आपके डेटा पर कई एल्गोरिदम चलाता है और पूरी तरह से प्रबंधित कंप्यूट इंफ्रास्ट्रक्चर पर उनके हाइपरपैरामीटर को ट्यून करता है। इस पोस्ट में, हम प्रदर्शित करते हैं कि आप इसका उपयोग कैसे कर सकते हैं ऑटोपायलट समय श्रृंखला डेटा पर वर्गीकरण और प्रतिगमन समस्याओं को हल करने के लिए। ऑटोपायलट मॉडल बनाने और प्रशिक्षण देने के निर्देशों के लिए, देखें Amazon SageMaker Autopilot के साथ ग्राहक मंथन की भविष्यवाणी.
ऑटोपायलट का उपयोग करके समय श्रृंखला डेटा वर्गीकरण
चल रहे उदाहरण के रूप में, हम समय श्रृंखला पर एक बहु-वर्ग समस्या पर विचार करते हैं डाटासेट यूवेवजेस्चरलाइब्रेरीएक्स, आठ पूर्वनिर्धारित हाथ के इशारों में से एक का प्रदर्शन करते हुए एक्सेलेरोमीटर सेंसर के समान रीडिंग शामिल हैं। सरलता के लिए, हम एक्सेलेरोमीटर के केवल X आयाम पर विचार करते हैं। कार्य सेंसर रीडिंग से पूर्वनिर्धारित इशारों में समय श्रृंखला डेटा को मैप करने के लिए एक वर्गीकरण मॉडल का निर्माण करना है। निम्न आंकड़ा CSV प्रारूप में डेटासेट की पहली पंक्तियों को दिखाता है। संपूर्ण तालिका में 896 पंक्तियाँ और दो स्तंभ हैं: पहला स्तंभ एक हावभाव लेबल है और दूसरा स्तंभ सेंसर रीडिंग की एक समय श्रृंखला है।
Amazon SageMaker Data Wrangler के साथ डेटा को सही फॉर्मेट में बदलें
संख्यात्मक, श्रेणीबद्ध और मानक टेक्स्ट कॉलम स्वीकार करने के शीर्ष पर, ऑटोपायलट अब एक अनुक्रम इनपुट कॉलम भी स्वीकार करता है। यदि आपका समय श्रृंखला डेटा इस प्रारूप का पालन नहीं करता है, तो आप इसे आसानी से बदल सकते हैं अमेज़न SageMaker डेटा रैंगलर. डेटा रैंगलर एमएल के लिए डेटा एकत्र करने और तैयार करने में लगने वाले समय को हफ्तों से घटाकर मिनटों कर देता है। डेटा रैंगलर के साथ, आप डेटा तैयार करने और फीचर इंजीनियरिंग की प्रक्रिया को सरल बना सकते हैं, और डेटा तैयारी वर्कफ़्लो के प्रत्येक चरण को पूरा कर सकते हैं, जिसमें डेटा चयन, क्लींजिंग, एक्सप्लोरेशन और विज़ुअलाइज़ेशन एकल विज़ुअल इंटरफ़ेस से शामिल हैं। उदाहरण के लिए, एक ही डेटासेट पर विचार करें लेकिन एक अलग इनपुट प्रारूप में: प्रत्येक इशारा (आईडी द्वारा निर्दिष्ट) एक्सेलेरोमीटर के समान माप का एक क्रम है। लंबवत रूप से संग्रहीत होने पर, प्रत्येक पंक्ति में टाइमस्टैम्प और एक मान होता है। निम्नलिखित आंकड़ा इस डेटा की तुलना इसके मूल प्रारूप और अनुक्रम प्रारूप में करता है।
डेटा रैंगलर का उपयोग करके इस डेटासेट को पहले वर्णित प्रारूप में बदलने के लिए, डेटासेट को यहां से लोड करें अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। फिर का उपयोग करें समय श्रृंखला समूह द्वारा परिवर्तन, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है, और डेटा को वापस Amazon S3 में CSV प्रारूप में निर्यात करें।
जब डेटासेट अपने निर्दिष्ट प्रारूप में होता है, तो आप ऑटोपायलट के साथ आगे बढ़ सकते हैं। डेटा रैंगलर के अन्य टाइम सीरीज़ ट्रांसफॉर्मर को देखने के लिए देखें अमेज़ॅन सेजमेकर डेटा रैंगलर के साथ समय श्रृंखला डेटा तैयार करें.
ऑटोएमएल जॉब लॉन्च करें
ऑटोपायलट द्वारा समर्थित अन्य इनपुट प्रकारों की तरह, डेटासेट की प्रत्येक पंक्ति एक अलग अवलोकन है और प्रत्येक कॉलम एक विशेषता है। इस उदाहरण में, हमारे पास एक एकल स्तंभ है जिसमें समय श्रृंखला डेटा है, लेकिन आपके पास एकाधिक समय श्रृंखला स्तंभ हो सकते हैं। आपके पास विभिन्न इनपुट प्रकारों के साथ कई कॉलम भी हो सकते हैं, जैसे समय श्रृंखला, टेक्स्ट और संख्यात्मक।
सेवा मेरे एक ऑटोपायलट प्रयोग बनाएं, डेटासेट को S3 बकेट में रखें और भीतर एक नया प्रयोग बनाएं अमेज़ॅन सैजमेकर स्टूडियो. जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है, आपको प्रयोग का नाम, डेटासेट का S3 स्थान, आउटपुट कलाकृतियों के लिए S3 स्थान और भविष्यवाणी करने के लिए कॉलम नाम निर्दिष्ट करना होगा।
ऑटोपायलट डेटा का विश्लेषण करता है, एमएल पाइपलाइन बनाता है, और इस वर्गीकरण कार्य पर हाइपरपैरामीटर ऑप्टिमाइज़ेशन के डिफ़ॉल्ट 250 पुनरावृत्तियों को चलाता है। जैसा कि निम्नलिखित मॉडल लीडरबोर्ड में दिखाया गया है, ऑटोपायलट 0.821 सटीकता तक पहुंचता है, और आप केवल एक क्लिक में सर्वश्रेष्ठ मॉडल को तैनात कर सकते हैं।
इसके अलावा, ऑटोपायलट a . उत्पन्न करता है डेटा अन्वेषण रिपोर्ट, जहां आप अपने डेटा की कल्पना और अन्वेषण कर सकते हैं।
ऑटोपायलट के लिए पारदर्शिता मूलभूत है। आप उम्मीदवार परिभाषा नोटबुक के भीतर जेनरेट की गई एमएल पाइपलाइनों का निरीक्षण और संशोधन कर सकते हैं। निम्न स्क्रीनशॉट दर्शाता है कि कैसे ऑटोपायलट समय श्रृंखला ट्रांसफार्मर के संयोजन से पाइपलाइनों की एक श्रृंखला की सिफारिश करता है TSFeatureExtractor
विभिन्न एमएल एल्गोरिदम के साथ, जैसे कि ग्रेडिएंट बूस्टेड डिसीजन ट्री और लीनियर मॉडल। TSFeatureExtractor
आपके लिए सैकड़ों टाइम सीरीज़ सुविधाओं को निकालता है, जिन्हें भविष्यवाणियां करने के लिए डाउनस्ट्रीम एल्गोरिदम में फीड किया जाता है। समय श्रृंखला सुविधाओं की पूरी सूची के लिए, देखें निकाली गई सुविधाओं पर अवलोकन.
निष्कर्ष
इस पोस्ट में, हमने कुछ ही क्लिक में समय श्रृंखला वर्गीकरण और प्रतिगमन समस्याओं को हल करने के लिए सेजमेकर ऑटोपायलट का उपयोग करने का तरीका दिखाया।
ऑटोपायलट के बारे में अधिक जानकारी के लिए देखें अमेज़ॅन सैजमेकर ऑटोपायलट. सेजमेकर की संबंधित विशेषताओं का पता लगाने के लिए, देखें अमेज़न SageMaker डेटा रैंगलर.
लेखक के बारे में
निकिता इवकिना एक अनुप्रयुक्त वैज्ञानिक, अमेज़ॅन सेजमेकर डेटा रैंगलर है।
ऐनी मिल्बर्ट एक सॉफ्टवेयर डेवलपमेंट इंजीनियर है जो Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग पर काम कर रहा है।
वैलेरियो पेरोन Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग और ऑटोपायलट पर काम करने वाला एक एप्लाइड साइंस मैनेजर है।
मेघना सतीशो एक सॉफ्टवेयर डेवलपमेंट इंजीनियर है जो Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग पर काम कर रहा है।
अली तकबिरी एक एआई/एमएल विशेषज्ञ समाधान आर्किटेक्ट है, और एडब्ल्यूएस क्लाउड पर अपनी व्यावसायिक चुनौतियों को हल करने के लिए मशीन लर्निंग का उपयोग करके ग्राहकों की मदद करता है।
- "
- 100
- About
- प्राप्त
- गतिविधियों
- एल्गोरिदम
- की अनुमति दे
- हालांकि
- वीरांगना
- की घोषणा
- स्वचालित
- एडब्ल्यूएस
- BEST
- बढ़ाया
- निर्माण
- इमारत
- बनाता है
- व्यापार
- चुनौतियों
- वर्गीकरण
- बादल
- स्तंभ
- जटिल
- गणना करना
- लगातार
- खपत
- शामिल हैं
- नियंत्रण
- बनाना
- श्रेय
- ग्राहक
- तिथि
- व्यवहार
- तैनात
- विकास
- विभिन्न
- आयाम
- नहीं करता है
- आसानी
- बिजली
- इंजीनियर
- अभियांत्रिकी
- उदाहरण
- खर्च
- प्रयोग
- अन्वेषण
- अर्क
- Feature
- विशेषताएं
- फेड
- आकृति
- प्रथम
- का पालन करें
- निम्नलिखित
- प्रपत्र
- प्रारूप
- पूर्ण
- सामान्य जानकारी
- समूह
- मदद करता है
- इतिहास
- परिवार
- कैसे
- How To
- HTTPS
- सैकड़ों
- पहचान करना
- सहित
- करें-
- इंफ्रास्ट्रक्चर
- इंटरफेस
- IT
- सीख रहा हूँ
- लिंक्डइन
- सूची
- भार
- स्थान
- मशीन
- यंत्र अधिगम
- प्रबंधक
- नक्शा
- ML
- आदर्श
- मॉडल
- नेटवर्क
- प्रसार यातायात
- नोटबुक
- इष्टतमीकरण
- अन्य
- भविष्यवाणी
- भविष्यवाणियों
- मुसीबत
- समस्याओं
- प्रक्रिया
- प्रदान करना
- रेंज
- की सिफारिश की
- बाकी
- दौड़ना
- विज्ञान
- वैज्ञानिक
- कई
- सरल
- सॉफ्टवेयर
- सॉफ्टवेयर विकास
- समाधान ढूंढे
- हल
- विशेषीकृत
- भंडारण
- समर्थित
- समर्थन करता है
- कार्य
- यहाँ
- पहर
- ऊपर का
- यातायात
- प्रशिक्षण
- गाड़ियों
- उपयोग
- मूल्य
- दृश्यता
- दृश्य
- अंदर
- काम कर रहे
- X