अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

अमेज़ॅन सेजमेकर ऑटोपायलट अब समय श्रृंखला डेटा का समर्थन करता है

अमेज़ॅन सैजमेकर ऑटोपायलट आपको पूर्ण नियंत्रण और दृश्यता बनाए रखने की अनुमति देते हुए, स्वचालित रूप से आपके डेटा के आधार पर सर्वश्रेष्ठ मशीन लर्निंग (एमएल) मॉडल बनाता है, प्रशिक्षित करता है और ट्यून करता है। हमने हाल ही में घोषणा की है ऑटोपायलट में समय श्रृंखला डेटा के लिए समर्थन. आप समय श्रृंखला डेटा, या सामान्य रूप से अनुक्रम डेटा पर प्रतिगमन और वर्गीकरण कार्यों से निपटने के लिए ऑटोपायलट का उपयोग कर सकते हैं। समय श्रृंखला डेटा एक विशेष प्रकार का अनुक्रम डेटा है जहां डेटा बिंदु सम समय अंतराल पर एकत्र किए जाते हैं।

डेटा को मैन्युअल रूप से तैयार करना, सही एमएल मॉडल का चयन करना और इसके मापदंडों को अनुकूलित करना एक विशेषज्ञ व्यवसायी के लिए भी एक जटिल कार्य है। हालांकि स्वचालित दृष्टिकोण मौजूद हैं जो सर्वोत्तम मॉडल और उनके पैरामीटर ढूंढ सकते हैं, ये आम तौर पर अनुक्रम के रूप में आने वाले डेटा को संभाल नहीं सकते हैं, जैसे कि नेटवर्क ट्रैफ़िक, बिजली की खपत, या समय के साथ दर्ज किए गए घरेलू खर्च। चूंकि यह डेटा अलग-अलग समय बिंदुओं पर प्राप्त अवलोकनों का रूप लेता है, इसलिए लगातार अवलोकनों को एक-दूसरे से स्वतंत्र नहीं माना जा सकता है और इसे समग्र रूप से संसाधित करने की आवश्यकता होती है। अनुक्रमिक डेटा से निपटने में समस्याओं की एक विस्तृत श्रृंखला के लिए आप ऑटोपायलट का उपयोग कर सकते हैं। उदाहरण के लिए, आप दुर्भावनापूर्ण गतिविधियों की पहचान करने के लिए समय के साथ रिकॉर्ड किए गए नेटवर्क ट्रैफ़िक को वर्गीकृत कर सकते हैं, या यह निर्धारित कर सकते हैं कि व्यक्ति अपने क्रेडिट इतिहास के आधार पर बंधक के लिए योग्य हैं या नहीं। आप समय श्रृंखला डेटा युक्त एक डेटासेट प्रदान करते हैं और ऑटोपायलट बाकी को संभालता है, विशेष फीचर ट्रांसफॉर्म के माध्यम से अनुक्रमिक डेटा को संसाधित करता है और आपकी ओर से सबसे अच्छा मॉडल ढूंढता है।

ऑटोपायलट एमएल मॉडल के निर्माण की भारी भारोत्तोलन को समाप्त करता है, और आपको अपने डेटा के आधार पर सर्वश्रेष्ठ एमएल मॉडल को स्वचालित रूप से बनाने, प्रशिक्षित करने और ट्यून करने में मदद करता है। ऑटोपायलट आपके डेटा पर कई एल्गोरिदम चलाता है और पूरी तरह से प्रबंधित कंप्यूट इंफ्रास्ट्रक्चर पर उनके हाइपरपैरामीटर को ट्यून करता है। इस पोस्ट में, हम प्रदर्शित करते हैं कि आप इसका उपयोग कैसे कर सकते हैं ऑटोपायलट समय श्रृंखला डेटा पर वर्गीकरण और प्रतिगमन समस्याओं को हल करने के लिए। ऑटोपायलट मॉडल बनाने और प्रशिक्षण देने के निर्देशों के लिए, देखें Amazon SageMaker Autopilot के साथ ग्राहक मंथन की भविष्यवाणी.

ऑटोपायलट का उपयोग करके समय श्रृंखला डेटा वर्गीकरण

चल रहे उदाहरण के रूप में, हम समय श्रृंखला पर एक बहु-वर्ग समस्या पर विचार करते हैं डाटासेट यूवेवजेस्चरलाइब्रेरीएक्स, आठ पूर्वनिर्धारित हाथ के इशारों में से एक का प्रदर्शन करते हुए एक्सेलेरोमीटर सेंसर के समान रीडिंग शामिल हैं। सरलता के लिए, हम एक्सेलेरोमीटर के केवल X आयाम पर विचार करते हैं। कार्य सेंसर रीडिंग से पूर्वनिर्धारित इशारों में समय श्रृंखला डेटा को मैप करने के लिए एक वर्गीकरण मॉडल का निर्माण करना है। निम्न आंकड़ा CSV प्रारूप में डेटासेट की पहली पंक्तियों को दिखाता है। संपूर्ण तालिका में 896 पंक्तियाँ और दो स्तंभ हैं: पहला स्तंभ एक हावभाव लेबल है और दूसरा स्तंभ सेंसर रीडिंग की एक समय श्रृंखला है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

Amazon SageMaker Data Wrangler के साथ डेटा को सही फॉर्मेट में बदलें

संख्यात्मक, श्रेणीबद्ध और मानक टेक्स्ट कॉलम स्वीकार करने के शीर्ष पर, ऑटोपायलट अब एक अनुक्रम इनपुट कॉलम भी स्वीकार करता है। यदि आपका समय श्रृंखला डेटा इस प्रारूप का पालन नहीं करता है, तो आप इसे आसानी से बदल सकते हैं अमेज़न SageMaker डेटा रैंगलर. डेटा रैंगलर एमएल के लिए डेटा एकत्र करने और तैयार करने में लगने वाले समय को हफ्तों से घटाकर मिनटों कर देता है। डेटा रैंगलर के साथ, आप डेटा तैयार करने और फीचर इंजीनियरिंग की प्रक्रिया को सरल बना सकते हैं, और डेटा तैयारी वर्कफ़्लो के प्रत्येक चरण को पूरा कर सकते हैं, जिसमें डेटा चयन, क्लींजिंग, एक्सप्लोरेशन और विज़ुअलाइज़ेशन एकल विज़ुअल इंटरफ़ेस से शामिल हैं। उदाहरण के लिए, एक ही डेटासेट पर विचार करें लेकिन एक अलग इनपुट प्रारूप में: प्रत्येक इशारा (आईडी द्वारा निर्दिष्ट) एक्सेलेरोमीटर के समान माप का एक क्रम है। लंबवत रूप से संग्रहीत होने पर, प्रत्येक पंक्ति में टाइमस्टैम्प और एक मान होता है। निम्नलिखित आंकड़ा इस डेटा की तुलना इसके मूल प्रारूप और अनुक्रम प्रारूप में करता है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

डेटा रैंगलर का उपयोग करके इस डेटासेट को पहले वर्णित प्रारूप में बदलने के लिए, डेटासेट को यहां से लोड करें अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3)। फिर का उपयोग करें समय श्रृंखला समूह द्वारा परिवर्तन, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है, और डेटा को वापस Amazon S3 में CSV प्रारूप में निर्यात करें।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

जब डेटासेट अपने निर्दिष्ट प्रारूप में होता है, तो आप ऑटोपायलट के साथ आगे बढ़ सकते हैं। डेटा रैंगलर के अन्य टाइम सीरीज़ ट्रांसफॉर्मर को देखने के लिए देखें अमेज़ॅन सेजमेकर डेटा रैंगलर के साथ समय श्रृंखला डेटा तैयार करें.

ऑटोएमएल जॉब लॉन्च करें

ऑटोपायलट द्वारा समर्थित अन्य इनपुट प्रकारों की तरह, डेटासेट की प्रत्येक पंक्ति एक अलग अवलोकन है और प्रत्येक कॉलम एक विशेषता है। इस उदाहरण में, हमारे पास एक एकल स्तंभ है जिसमें समय श्रृंखला डेटा है, लेकिन आपके पास एकाधिक समय श्रृंखला स्तंभ हो सकते हैं। आपके पास विभिन्न इनपुट प्रकारों के साथ कई कॉलम भी हो सकते हैं, जैसे समय श्रृंखला, टेक्स्ट और संख्यात्मक।

सेवा मेरे एक ऑटोपायलट प्रयोग बनाएं, डेटासेट को S3 बकेट में रखें और भीतर एक नया प्रयोग बनाएं अमेज़ॅन सैजमेकर स्टूडियो. जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है, आपको प्रयोग का नाम, डेटासेट का S3 स्थान, आउटपुट कलाकृतियों के लिए S3 स्थान और भविष्यवाणी करने के लिए कॉलम नाम निर्दिष्ट करना होगा।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

ऑटोपायलट डेटा का विश्लेषण करता है, एमएल पाइपलाइन बनाता है, और इस वर्गीकरण कार्य पर हाइपरपैरामीटर ऑप्टिमाइज़ेशन के डिफ़ॉल्ट 250 पुनरावृत्तियों को चलाता है। जैसा कि निम्नलिखित मॉडल लीडरबोर्ड में दिखाया गया है, ऑटोपायलट 0.821 सटीकता तक पहुंचता है, और आप केवल एक क्लिक में सर्वश्रेष्ठ मॉडल को तैनात कर सकते हैं।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

इसके अलावा, ऑटोपायलट a . उत्पन्न करता है डेटा अन्वेषण रिपोर्ट, जहां आप अपने डेटा की कल्पना और अन्वेषण कर सकते हैं।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

ऑटोपायलट के लिए पारदर्शिता मूलभूत है। आप उम्मीदवार परिभाषा नोटबुक के भीतर जेनरेट की गई एमएल पाइपलाइनों का निरीक्षण और संशोधन कर सकते हैं। निम्न स्क्रीनशॉट दर्शाता है कि कैसे ऑटोपायलट समय श्रृंखला ट्रांसफार्मर के संयोजन से पाइपलाइनों की एक श्रृंखला की सिफारिश करता है TSFeatureExtractor विभिन्न एमएल एल्गोरिदम के साथ, जैसे कि ग्रेडिएंट बूस्टेड डिसीजन ट्री और लीनियर मॉडल। TSFeatureExtractor आपके लिए सैकड़ों टाइम सीरीज़ सुविधाओं को निकालता है, जिन्हें भविष्यवाणियां करने के लिए डाउनस्ट्रीम एल्गोरिदम में फीड किया जाता है। समय श्रृंखला सुविधाओं की पूरी सूची के लिए, देखें निकाली गई सुविधाओं पर अवलोकन.

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.

निष्कर्ष

इस पोस्ट में, हमने कुछ ही क्लिक में समय श्रृंखला वर्गीकरण और प्रतिगमन समस्याओं को हल करने के लिए सेजमेकर ऑटोपायलट का उपयोग करने का तरीका दिखाया।

ऑटोपायलट के बारे में अधिक जानकारी के लिए देखें अमेज़ॅन सैजमेकर ऑटोपायलट. सेजमेकर की संबंधित विशेषताओं का पता लगाने के लिए, देखें अमेज़न SageMaker डेटा रैंगलर.


लेखक के बारे में

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.निकिता इवकिना एक अनुप्रयुक्त वैज्ञानिक, अमेज़ॅन सेजमेकर डेटा रैंगलर है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.ऐनी मिल्बर्ट एक सॉफ्टवेयर डेवलपमेंट इंजीनियर है जो Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग पर काम कर रहा है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.वैलेरियो पेरोन Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग और ऑटोपायलट पर काम करने वाला एक एप्लाइड साइंस मैनेजर है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ.मेघना सतीशो एक सॉफ्टवेयर डेवलपमेंट इंजीनियर है जो Amazon SageMaker ऑटोमैटिक मॉडल ट्यूनिंग पर काम कर रहा है।

अमेज़ॅन सेजमेकर ऑटोपायलट अब टाइम सीरीज़ डेटा प्लेटोब्लॉकचैन डेटा इंटेलिजेंस का समर्थन करता है। लंबवत खोज। ऐ. अली तकबिरी एक एआई/एमएल विशेषज्ञ समाधान आर्किटेक्ट है, और एडब्ल्यूएस क्लाउड पर अपनी व्यावसायिक चुनौतियों को हल करने के लिए मशीन लर्निंग का उपयोग करके ग्राहकों की मदद करता है।

समय टिकट:

से अधिक AWS मशीन लर्निंग