डेटा तैयार करना किसी भी डेटा-संचालित प्रोजेक्ट में एक महत्वपूर्ण कदम है, और सही उपकरण होने से परिचालन दक्षता में काफी वृद्धि हो सकती है। अमेज़न SageMaker डेटा रैंगलर मशीन लर्निंग (एमएल) के लिए सारणीबद्ध और छवि डेटा को एकत्रित करने और तैयार करने में लगने वाला समय हफ्तों से घटाकर मिनटों में कर देता है। सेजमेकर डेटा रैंगलर के साथ, आप डेटा तैयारी और फीचर इंजीनियरिंग की प्रक्रिया को सरल बना सकते हैं और एक ही विज़ुअल इंटरफ़ेस से डेटा चयन, सफाई, अन्वेषण और विज़ुअलाइज़ेशन सहित डेटा तैयारी वर्कफ़्लो के प्रत्येक चरण को पूरा कर सकते हैं।
इस पोस्ट में, हम सेजमेकर डेटा रैंगलर की नवीनतम विशेषताओं का पता लगाते हैं जो विशेष रूप से परिचालन अनुभव को बेहतर बनाने के लिए डिज़ाइन की गई हैं। हम इसके समर्थन में गहराई से उतरते हैं सरल भंडारण सेवा (अमेज़ॅन S3) प्रकट फ़ाइलें, एक इंटरैक्टिव डेटा प्रवाह में अनुमान कलाकृतियाँ, और सहज एकीकरण JSON (जावास्क्रिप्ट ऑब्जेक्ट नोटेशन) अनुमान के लिए प्रारूप, इस बात पर प्रकाश डालते हुए कि कैसे ये संवर्द्धन डेटा तैयारी को आसान और अधिक कुशल बनाते हैं।
नई सुविधाओं का परिचय
इस अनुभाग में, हम इष्टतम डेटा तैयारी के लिए सेजमेकर डेटा रैंगलर की नई सुविधाओं पर चर्चा करते हैं।
एमएल अनुमान के लिए सेजमेकर ऑटोपायलट के साथ S3 मेनिफेस्ट फ़ाइल समर्थन
सेजमेकर डेटा रैंगलर सक्षम बनाता है एकीकृत डेटा तैयारी और मॉडल प्रशिक्षण साथ अनुभव अमेज़ॅन सैजमेकर ऑटोपायलट बस कुछ ही क्लिक में. आप अपने डेटा प्रवाह में परिवर्तित किए गए डेटा पर मॉडलों को स्वचालित रूप से प्रशिक्षित करने, ट्यून करने और तैनात करने के लिए सेजमेकर ऑटोपायलट का उपयोग कर सकते हैं।
यह अनुभव अब S3 मेनिफेस्ट फ़ाइल समर्थन के साथ और भी सरल हो गया है। S3 मेनिफेस्ट फ़ाइल एक टेक्स्ट फ़ाइल है जो S3 बकेट में संग्रहीत ऑब्जेक्ट (फ़ाइलों) को सूचीबद्ध करती है। यदि SageMaker डेटा रैंगलर में आपका निर्यात किया गया डेटासेट काफी बड़ा है और Amazon S3 में कई-भाग वाली डेटा फ़ाइलों में विभाजित है, तो अब SageMaker डेटा रैंगलर स्वचालित रूप से S3 में इन सभी डेटा फ़ाइलों का प्रतिनिधित्व करने वाली एक मैनिफ़ेस्ट फ़ाइल बनाएगा। इस जेनरेट की गई मेनिफेस्ट फ़ाइल का उपयोग अब प्रशिक्षण के लिए सभी विभाजित डेटा को लेने के लिए सेजमेकर डेटा रैंगलर में सेजमेकर ऑटोपायलट यूआई के साथ किया जा सकता है।
इस सुविधा के लॉन्च से पहले, सेजमेकर डेटा रैंगलर से तैयार डेटा पर प्रशिक्षित सेजमेकर ऑटोपायलट मॉडल का उपयोग करते समय, आप केवल एक डेटा फ़ाइल चुन सकते थे, जो पूरे डेटासेट का प्रतिनिधित्व नहीं कर सकता है, खासकर यदि डेटासेट बहुत बड़ा है। इस नए मेनिफेस्ट फ़ाइल अनुभव के साथ, आप अपने डेटासेट के एक सबसेट तक सीमित नहीं हैं। आप मेनिफेस्ट फ़ाइल का उपयोग करके अपने सभी डेटा का प्रतिनिधित्व करने वाले सेजमेकर ऑटोपायलट के साथ एक एमएल मॉडल बना सकते हैं और अपने एमएल अनुमान और उत्पादन परिनियोजन के लिए इसका उपयोग कर सकते हैं। यह सुविधा सेजमेकर ऑटोपायलट के साथ प्रशिक्षण एमएल मॉडल को सरल बनाकर और डेटा प्रोसेसिंग वर्कफ़्लो को सुव्यवस्थित करके परिचालन दक्षता को बढ़ाती है।
उत्पन्न कलाकृतियों में अनुमान प्रवाह के लिए समर्थन जोड़ा गया
ग्राहक उन डेटा परिवर्तनों को लेना चाहते हैं जो उन्होंने अपने मॉडल प्रशिक्षण डेटा पर लागू किए हैं, जैसे कि वन-हॉट एन्कोडिंग, पीसीए, और लापता मानों को लागू करना, और उन डेटा परिवर्तनों को उत्पादन में वास्तविक समय अनुमान या बैच अनुमान पर लागू करना चाहते हैं। ऐसा करने के लिए, आपके पास एक सेजमेकर डेटा रैंगलर अनुमान आर्टिफैक्ट होना चाहिए, जिसका उपभोग सेजमेकर मॉडल द्वारा किया जाता है।
पहले, अनुमान कलाकृतियाँ केवल यूआई से उत्पन्न की जा सकती थीं जब सेजमेकर ऑटोपायलट प्रशिक्षण में निर्यात किया जाता था या एक अनुमान पाइपलाइन नोटबुक निर्यात किया जाता था। यदि आप अपने सेजमेकर डेटा रैंगलर प्रवाह को इसके बाहर ले जाना चाहते हैं तो यह लचीलापन प्रदान नहीं करता है अमेज़ॅन सैजमेकर स्टूडियो पर्यावरण। अब, आप सेजमेकर डेटा रैंगलर प्रोसेसिंग जॉब के माध्यम से किसी भी संगत प्रवाह फ़ाइल के लिए एक अनुमान आर्टिफैक्ट उत्पन्न कर सकते हैं। यह कोड-प्रथम एमएलओपीएस व्यक्तियों के लिए सेजमेकर डेटा रैंगलर प्रवाह के साथ प्रोग्रामेटिक, एंड-टू-एंड एमएलओपीएस को सक्षम बनाता है, साथ ही यूआई से नौकरी बनाकर एक अनुमान आर्टिफैक्ट प्राप्त करने के लिए एक सहज, नो-कोड पथ भी सक्षम बनाता है।
डेटा तैयारी को सुव्यवस्थित करना
JSON आधुनिक डेटा पारिस्थितिकी तंत्र में डेटा विनिमय के लिए व्यापक रूप से अपनाया जाने वाला प्रारूप बन गया है। JSON प्रारूप के साथ सेजमेकर डेटा रैंगलर का एकीकरण आपको परिवर्तन और सफाई के लिए JSON डेटा को सहजता से संभालने की अनुमति देता है। JSON के लिए मूल समर्थन प्रदान करके, सेजमेकर डेटा रैंगलर संरचित और अर्ध-संरचित डेटा के साथ काम करने की प्रक्रिया को सरल बनाता है, जिससे आप मूल्यवान अंतर्दृष्टि निकाल सकते हैं और डेटा को कुशलतापूर्वक तैयार कर सकते हैं। सेजमेकर डेटा रैंगलर अब बैच और रीयल-टाइम अनुमान एंडपॉइंट परिनियोजन दोनों के लिए JSON प्रारूप का समर्थन करता है।
समाधान अवलोकन
हमारे उपयोग के मामले में, हम नमूने का उपयोग करते हैं अमेज़ॅन ग्राहक डेटासेट की समीक्षा करता है यह दिखाने के लिए कि कैसे सेजमेकर डेटा रैंगलर सेजमेकर ऑटोपायलट का उपयोग करके एक नया एमएल मॉडल बनाने के परिचालन प्रयास को सरल बना सकता है। अमेज़ॅन ग्राहक समीक्षा डेटासेट में अमेज़ॅन की उत्पाद समीक्षाएं और मेटाडेटा शामिल हैं, जिसमें मई 142.8 से जुलाई 1996 तक की 2014 मिलियन समीक्षाएं शामिल हैं।
उच्च स्तर पर, हम इस बड़े डेटासेट को प्रबंधित करने और निम्नलिखित क्रियाएं करने के लिए सेजमेकर डेटा रैंगलर का उपयोग करते हैं:
- केवल एक नमूना नहीं, बल्कि सभी डेटासेट का उपयोग करके सेजमेकर ऑटोपायलट में एक एमएल मॉडल विकसित करें।
- सेजमेकर डेटा रैंगलर द्वारा उत्पन्न अनुमान आर्टिफैक्ट के साथ एक वास्तविक समय अनुमान पाइपलाइन बनाएं, और इनपुट और आउटपुट के लिए JSON स्वरूपण का उपयोग करें।
सेजमेकर ऑटोपायलट के साथ S3 मेनिफेस्ट फ़ाइल समर्थन
SageMaker डेटा रैंगलर का उपयोग करके SageMaker ऑटोपायलट प्रयोग बनाते समय, आप पहले केवल एक CSV या Parquet फ़ाइल निर्दिष्ट कर सकते थे। अब आप S3 मेनिफेस्ट फ़ाइल का भी उपयोग कर सकते हैं, जिससे आप SageMaker ऑटोपायलट प्रयोगों के लिए बड़ी मात्रा में डेटा का उपयोग कर सकते हैं। सेजमेकर डेटा रैंगलर स्वचालित रूप से इनपुट डेटा फ़ाइलों को कई छोटी फ़ाइलों में विभाजित करेगा और एक मैनिफेस्ट उत्पन्न करेगा जिसका उपयोग सेजमेकर ऑटोपायलट प्रयोग में इंटरैक्टिव सत्र से सभी डेटा खींचने के लिए किया जा सकता है, न कि केवल एक छोटा सा नमूना।
निम्नलिखित चरणों को पूरा करें:
- अमेज़ॅन ग्राहक समीक्षा डेटा को सीएसवी फ़ाइल से सेजमेकर डेटा रैंगलर में आयात करें। डेटा आयात करते समय नमूनाकरण अक्षम करना सुनिश्चित करें।
- उन परिवर्तनों को निर्दिष्ट करें जो डेटा को सामान्य बनाते हैं। इस उदाहरण के लिए, सेजमेकर डेटा रैंगलर के अंतर्निहित परिवर्तनों का उपयोग करके प्रतीकों को हटाएं और सब कुछ लोअरकेस में बदल दें।
- चुनें ट्रेन का मॉडल प्रशिक्षण शुरू करना।
सेजमेकर ऑटोपायलट के साथ एक मॉडल को प्रशिक्षित करने के लिए, सेजमेकर स्वचालित रूप से S3 बकेट में डेटा निर्यात करता है। इस जैसे बड़े डेटासेट के लिए, यह स्वचालित रूप से फ़ाइल को छोटी फ़ाइलों में तोड़ देगा और एक मैनिफ़ेस्ट उत्पन्न करेगा जिसमें छोटी फ़ाइलों का स्थान शामिल होगा।
- सबसे पहले, अपना इनपुट डेटा चुनें.
इससे पहले, सेजमेकर डेटा रैंगलर के पास सेजमेकर ऑटोपायलट के साथ उपयोग करने के लिए एक मेनिफेस्ट फ़ाइल उत्पन्न करने का विकल्प नहीं था। आज, मेनिफेस्ट फ़ाइल समर्थन जारी होने के साथ, सेजमेकर डेटा रैंगलर स्वचालित रूप से एक मेनिफेस्ट फ़ाइल को अमेज़ॅन एस3 में निर्यात करेगा, मेनिफेस्ट फ़ाइल एस3 स्थान के साथ सेजमेकर ऑटोपायलट प्रशिक्षण के एस3 स्थान को पहले से भर देगा, और मेनिफेस्ट फ़ाइल विकल्प को टॉगल करेगा। हाँ. मेनिफेस्ट फ़ाइल बनाने या उपयोग करने के लिए कोई कार्य आवश्यक नहीं है।
- भविष्यवाणी करने के लिए मॉडल के लिए लक्ष्य का चयन करके अपने प्रयोग को कॉन्फ़िगर करें।
- इसके बाद, एक प्रशिक्षण विधि चुनें. इस मामले में, हम चयन करते हैं ऑटो और सेजमेकर ऑटोपायलट को डेटासेट आकार के आधार पर सर्वोत्तम प्रशिक्षण पद्धति का निर्णय लेने दें।
- परिनियोजन सेटिंग्स निर्दिष्ट करें.
- अंत में, कार्य कॉन्फ़िगरेशन की समीक्षा करें और प्रशिक्षण के लिए सेजमेकर ऑटोपायलट प्रयोग सबमिट करें। जब सेजमेकर ऑटोपायलट प्रयोग पूरा कर लेता है, तो आप प्रशिक्षण परिणाम देख सकते हैं और सर्वोत्तम मॉडल का पता लगा सकते हैं।
मेनिफेस्ट फ़ाइलों के समर्थन के लिए धन्यवाद, आप सेजमेकर ऑटोपायलट प्रयोग के लिए अपने संपूर्ण डेटासेट का उपयोग कर सकते हैं, न कि केवल अपने डेटा का एक सबसेट।
सेजमेकर डेटा रैंगलर के साथ सेजमेकर ऑटोपायलट का उपयोग करने के बारे में अधिक जानकारी के लिए देखें अमेज़ॅन सेजमेकर डेटा रैंगलर और अमेज़ॅन सेजमेकर ऑटोपायलट के साथ एकीकृत डेटा तैयारी और मॉडल प्रशिक्षण।
सेजमेकर प्रसंस्करण नौकरियों से अनुमान कलाकृतियाँ उत्पन्न करें
अब, आइए देखें कि हम सेजमेकर डेटा रैंगलर यूआई और सेजमेकर डेटा रैंगलर नोटबुक दोनों के माध्यम से अनुमान कलाकृतियां कैसे उत्पन्न कर सकते हैं।
सेजमेकर डेटा रैंगलर यूआई
हमारे उपयोग के मामले में, हम यूआई के माध्यम से अपने डेटा को संसाधित करना चाहते हैं और फिर परिणामी डेटा का उपयोग सेजमेकर कंसोल के माध्यम से एक मॉडल को प्रशिक्षित और तैनात करने के लिए करना चाहते हैं। निम्नलिखित चरणों को पूरा करें:
- पिछले अनुभाग में आपके द्वारा बनाए गए डेटा प्रवाह को खोलें।
- अंतिम परिवर्तन के आगे धन चिह्न चुनें, चुनें गंतव्य जोड़ें, और चुनें अमेज़न S3. यहीं पर संसाधित डेटा संग्रहीत किया जाएगा।
- चुनें नौकरी पैदा करो.
- चुनते हैं अनुमान कलाकृतियाँ उत्पन्न करें एक अनुमान विरूपण साक्ष्य उत्पन्न करने के लिए अनुमान पैरामीटर अनुभाग में।
- अनुमान आर्टिफ़ैक्ट नाम के लिए, अपने अनुमान आर्टिफ़ैक्ट का नाम दर्ज करें (फ़ाइल एक्सटेंशन के रूप में .tar.gz के साथ)।
- अनुमान आउटपुट नोड के लिए, अपने प्रशिक्षण डेटा पर लागू परिवर्तनों के अनुरूप गंतव्य नोड दर्ज करें।
- चुनें कार्य कॉन्फ़िगर करें.
- के अंतर्गत कार्य विन्यास, के लिए एक पथ दर्ज करें प्रवाह फ़ाइल S3 स्थान. एक फ़ोल्डर कहा जाता है
data_wrangler_flows
इस स्थान के अंतर्गत बनाया जाएगा, और अनुमान विरूपण साक्ष्य इस फ़ोल्डर में अपलोड किया जाएगा। अपलोड स्थान बदलने के लिए, एक अलग S3 स्थान सेट करें। - अन्य सभी विकल्पों के लिए डिफ़ॉल्ट छोड़ें और चुनें बनाएं प्रसंस्करण कार्य सृजित करने के लिए.
प्रसंस्करण कार्य एक बनाएगाtarball (.tar.gz)
इसमें एक नए जोड़े गए अनुमान अनुभाग के साथ एक संशोधित डेटा प्रवाह फ़ाइल शामिल है जो आपको अनुमान के लिए इसका उपयोग करने की अनुमति देती है। आपको अपने अनुमान समाधान को तैनात करते समय सेजमेकर मॉडल को आर्टिफैक्ट प्रदान करने के लिए अनुमान आर्टिफैक्ट के एस 3 यूनिफॉर्म रिसोर्स आइडेंटिफ़ायर (यूआरआई) की आवश्यकता होती है। यूआरआई फॉर्म में होगा{Flow file S3 location}/data_wrangler_flows/{inference artifact name}.tar.gz
. - यदि आपने पहले इन मूल्यों पर ध्यान नहीं दिया था, तो आप प्रासंगिक विवरण खोजने के लिए प्रसंस्करण कार्य का लिंक चुन सकते हैं। हमारे उदाहरण में, यूआरआई है
s3://sagemaker-us-east-1-43257985977/data_wrangler_flows/example-2023-05-30T12-20-18.tar.gz.
- का मान कॉपी करें छवि प्रसंस्करण; हमें अपना मॉडल बनाते समय भी इस यूआरआई की आवश्यकता होती है।
- अब हम इस यूआरआई का उपयोग सेजमेकर कंसोल पर सेजमेकर मॉडल बनाने के लिए कर सकते हैं, जिसे हम बाद में एंडपॉइंट या बैच ट्रांसफॉर्म जॉब पर तैनात कर सकते हैं।
- के अंतर्गत मॉडल सेटिंग्स¸ एक मॉडल नाम दर्ज करें और अपनी IAM भूमिका निर्दिष्ट करें।
- के लिए कंटेनर इनपुट विकल्प, चुनते हैं मॉडल कलाकृतियाँ और अनुमान छवि स्थान प्रदान करें.
- के लिए अनुमान कोड छवि का स्थान, प्रसंस्करण छवि यूआरआई दर्ज करें।
- के लिए मॉडल कलाकृतियों का स्थान, अनुमान आर्टिफैक्ट यूआरआई दर्ज करें।
- इसके अतिरिक्त, यदि आपके डेटा में एक लक्ष्य कॉलम है जिसका पूर्वानुमान प्रशिक्षित एमएल मॉडल द्वारा लगाया जाएगा, तो नीचे उस कॉलम का नाम निर्दिष्ट करें पर्यावरण चर, साथ में
INFERENCE_TARGET_COLUMN_NAME
as कुंजी और कॉलम का नाम इस प्रकार है वैल्यू . - चुनकर अपना मॉडल बनाना समाप्त करें मॉडल बनाएं.
अब हमारे पास एक मॉडल है जिसे हम एंडपॉइंट या बैच ट्रांसफ़ॉर्म जॉब पर तैनात कर सकते हैं।
सेजमेकर डेटा रैंगलर नोटबुक
प्रसंस्करण कार्य से अनुमान आर्टिफैक्ट उत्पन्न करने के लिए कोड-प्रथम दृष्टिकोण के लिए, हम चुनकर उदाहरण कोड पा सकते हैं को निर्यात नोड मेनू पर और दोनों में से किसी एक को चुनें अमेज़न S3, SageMaker पाइपलाइनया, सेजमेकर अनुमान पाइपलाइन। हम चुनेंगे सेजमेकर अनुमान पाइपलाइन इस उदाहरण में।
इस नोटबुक में, शीर्षक से एक अनुभाग है प्रोसेसर बनाएं (यह सेजमेकर पाइपलाइन नोटबुक में समान है, लेकिन अमेज़ॅन एस3 नोटबुक में, समतुल्य कोड इसके अंतर्गत होगा कार्य विन्यास अनुभाग)। इस अनुभाग के निचले भाग में हमारे अनुमान आर्टिफैक्ट के लिए एक कॉन्फ़िगरेशन है जिसे कहा जाता है inference_params
. इसमें वही जानकारी शामिल है जो हमने यूआई में देखी थी, अर्थात् अनुमान विरूपण साक्ष्य नाम और अनुमान आउटपुट नोड। ये मान पहले से भरे जाएंगे लेकिन इन्हें संशोधित किया जा सकता है। इसके अतिरिक्त एक पैरामीटर भी है जिसे कहा जाता है use_inference_params
, जिसे सेट करने की आवश्यकता है True
प्रसंस्करण कार्य में इस कॉन्फ़िगरेशन का उपयोग करने के लिए।
आगे नीचे शीर्षक वाला एक अनुभाग है पाइपलाइन चरणों को परिभाषित करें, जहां inference_params
कॉन्फ़िगरेशन को कार्य तर्कों की सूची में जोड़ा जाता है और सेजमेकर डेटा रैंगलर प्रोसेसिंग चरण की परिभाषा में पारित किया जाता है। अमेज़न S3 नोटबुक में, job_arguments
के तुरंत बाद परिभाषित किया गया है कार्य विन्यास अनुभाग।
इन सरल कॉन्फ़िगरेशन के साथ, इस नोटबुक द्वारा बनाया गया प्रसंस्करण कार्य हमारी प्रवाह फ़ाइल (हमारी नोटबुक में पहले परिभाषित) के समान S3 स्थान पर एक अनुमान आर्टिफ़ैक्ट उत्पन्न करेगा। हम प्रोग्रामेटिक रूप से इस S3 स्थान को निर्धारित कर सकते हैं और इस आर्टिफैक्ट का उपयोग करके SageMaker मॉडल बना सकते हैं सेजमेकर पायथन एसडीके, जिसे सेजमेकर इन्फेरेंस पाइपलाइन नोटबुक में प्रदर्शित किया गया है।
यही दृष्टिकोण किसी भी पायथन कोड पर लागू किया जा सकता है जो सेजमेकर डेटा रैंगलर प्रोसेसिंग जॉब बनाता है।
अनुमान के दौरान इनपुट और आउटपुट के लिए JSON फ़ाइल स्वरूप समर्थन
वेबसाइटों और अनुप्रयोगों के लिए एपीआई के लिए अनुरोध/प्रतिक्रिया के रूप में JSON का उपयोग करना बहुत आम है ताकि जानकारी को विभिन्न प्रोग्रामिंग भाषाओं द्वारा पार्स करना आसान हो।
पहले, आपके पास एक प्रशिक्षित मॉडल होने के बाद, आप केवल सेजमेकर डेटा रैंगलर अनुमान पाइपलाइन में इनपुट प्रारूप के रूप में सीएसवी के माध्यम से इसके साथ बातचीत कर सकते थे। आज, आप JSON को इनपुट और आउटपुट प्रारूप के रूप में उपयोग कर सकते हैं, जो सेजमेकर डेटा रैंगलर अनुमान कंटेनरों के साथ इंटरैक्ट करते समय अधिक लचीलापन प्रदान करता है।
अनुमान पाइपलाइन नोटबुक में इनपुट और आउटपुट के लिए JSON का उपयोग शुरू करने के लिए, निम्नलिखित चरणों को पूरा करें:
- पेलोड को परिभाषित करें.
प्रत्येक पेलोड के लिए, मॉडल एक कुंजी नामक इंस्टेंसेस की अपेक्षा कर रहा है। मान वस्तुओं की एक सूची है, प्रत्येक का अपना डेटा बिंदु है। ऑब्जेक्ट को एक कुंजी की आवश्यकता होती है जिसे फीचर्स कहा जाता है, और मान एकल डेटा बिंदु की विशेषताएं होनी चाहिए जिन्हें मॉडल में सबमिट करने का इरादा है। एक ही अनुरोध में एकाधिक डेटा पॉइंट सबमिट किए जा सकते हैं, प्रति अनुरोध 6 एमबी के कुल आकार तक।
निम्नलिखित कोड देखें:
- विवरण दें
ContentType
asapplication/json
. - मॉडल को डेटा प्रदान करें और JSON प्रारूप में अनुमान प्राप्त करें।
देख अनुमान के लिए सामान्य डेटा प्रारूप नमूना इनपुट और आउटपुट JSON उदाहरणों के लिए।
क्लीन अप
जब आप सेजमेकर डेटा रैंगलर का उपयोग समाप्त कर लें, तो हम अनुशंसा करते हैं कि आप अतिरिक्त शुल्क से बचने के लिए उस इंस्टेंस को बंद कर दें जिस पर यह चलता है। सेजमेकर डेटा रैंगलर ऐप और संबंधित इंस्टेंस को बंद करने के निर्देशों के लिए देखें शट डाउन डेटा रैंगलर.
निष्कर्ष
SageMaker डेटा रैंगलर की नई सुविधाएँ, जिनमें S3 मेनिफेस्ट फ़ाइलों के लिए समर्थन, अनुमान क्षमताएं और JSON प्रारूप एकीकरण शामिल हैं, डेटा तैयारी के परिचालन अनुभव को बदल देती हैं। ये संवर्द्धन डेटा आयात को सुव्यवस्थित करते हैं, डेटा परिवर्तनों को स्वचालित करते हैं और JSON डेटा के साथ काम करना सरल बनाते हैं। इन सुविधाओं के साथ, आप अपनी परिचालन दक्षता बढ़ा सकते हैं, मैन्युअल प्रयास को कम कर सकते हैं, और आसानी से अपने डेटा से मूल्यवान अंतर्दृष्टि निकाल सकते हैं। सेजमेकर डेटा रैंगलर की नई सुविधाओं की शक्ति को अपनाएं और अपने डेटा तैयारी वर्कफ़्लो की पूरी क्षमता को अनलॉक करें।
सेजमेकर डेटा रैंगलर के साथ शुरुआत करने के लिए, नवीनतम जानकारी देखें सेजमेकर डेटा रैंगलर उत्पाद पृष्ठ.
लेखक के बारे में
मुनीश डबरा अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) में एक प्रिंसिपल सॉल्यूशंस आर्किटेक्ट हैं। उनका वर्तमान फोकस क्षेत्र एआई/एमएल और ऑब्जर्वेबिलिटी है। स्केलेबल वितरित सिस्टम के डिजाइन और निर्माण में उनकी मजबूत पृष्ठभूमि है। उन्हें AWS में ग्राहकों को उनके व्यवसाय को नया करने और बदलने में मदद करने में आनंद आता है। लिंक्डइन: /मदाबरा
पैट्रिक लिनो अमेज़ॅन सेजमेकर डेटा रैंगलर के साथ एक सॉफ्टवेयर डेवलपमेंट इंजीनियर है। वह Amazon SageMaker Data Wrangler को प्रोडक्शनाइज्ड ML वर्कफ़्लोज़ के लिए नंबर एक डेटा तैयारी टूल बनाने के लिए प्रतिबद्ध है। काम के बाहर, आप उसे पढ़ते हुए, संगीत सुनते हुए, दोस्तों के साथ बातचीत करते हुए, और उसके चर्च में सेवा करते हुए पा सकते हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. ऑटोमोटिव/ईवीएस, कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- BlockOffsets. पर्यावरणीय ऑफसेट स्वामित्व का आधुनिकीकरण। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/optimize-data-preparation-with-new-features-in-aws-sagemaker-data-wrangler/
- :हैस
- :है
- :नहीं
- :कहाँ
- $यूपी
- 100
- 1996
- 2014
- 7
- 8
- 9
- a
- कार्रवाई
- जोड़ा
- अतिरिक्त
- इसके अतिरिक्त
- दत्तक
- बाद
- ऐ / एमएल
- सब
- की अनुमति दे
- की अनुमति देता है
- भी
- वीरांगना
- अमेज़न SageMaker
- अमेज़ॅन सैजमेकर ऑटोपायलट
- अमेज़न SageMaker डेटा रैंगलर
- अमेज़ॅन वेब सेवा
- अमेज़ॅन वेब सेवा (एडब्ल्यूएस)
- राशियाँ
- an
- और
- कोई
- एपीआई
- अनुप्रयोग
- अनुप्रयोगों
- लागू
- लागू करें
- दृष्टिकोण
- हैं
- क्षेत्रों के बारे में जानकारी का उपयोग करके ट्रेडिंग कर सकते हैं।
- तर्क
- AS
- जुड़े
- At
- को स्वचालित रूप से
- स्वतः
- से बचने
- एडब्ल्यूएस
- पृष्ठभूमि
- आधारित
- BE
- बन
- जा रहा है
- BEST
- बड़ा
- के छात्रों
- तल
- टूटना
- निर्माण
- इमारत
- में निर्मित
- व्यापार
- लेकिन
- by
- बुलाया
- कर सकते हैं
- क्षमताओं
- मामला
- परिवर्तन
- प्रभार
- चेक
- चुनें
- चुनने
- चर्च
- सफाई
- कोड
- स्तंभ
- प्रतिबद्ध
- सामान्य
- संगत
- पूरा
- पूरा करता है
- विन्यास
- कंसोल
- प्रयुक्त
- कंटेनरों
- शामिल हैं
- बातचीत
- इसी
- सका
- बनाना
- बनाया
- बनाता है
- बनाना
- महत्वपूर्ण
- वर्तमान
- ग्राहक
- ग्राहक
- तिथि
- आंकडों का आदान प्रदान
- डेटा अंक
- डेटा तैयारी
- डेटा संसाधन
- डेटा पर ही आधारित
- डेटासेट
- दिन
- तय
- चूक
- परिभाषित
- परिभाषा
- गड्ढा
- साबित
- तैनात
- तैनाती
- तैनाती
- बनाया गया
- डिज़ाइन बनाना
- गंतव्य
- विवरण
- निर्धारित करना
- विकास
- विभिन्न
- चर्चा करना
- वितरित
- वितरित प्रणाली
- do
- नीचे
- दौरान
- से प्रत्येक
- पूर्व
- आराम
- आसान
- आसान
- पारिस्थितिकी प्रणालियों
- दक्षता
- कुशल
- कुशलता
- प्रयास
- भी
- आलिंगन
- सक्षम बनाता है
- समर्थकारी
- शुरू से अंत तक
- endpoint
- इंजीनियर
- अभियांत्रिकी
- बढ़ाना
- संवर्द्धन
- बढ़ाता है
- दर्ज
- संपूर्ण
- वातावरण
- बराबर
- विशेष रूप से
- कभी
- प्रत्येक
- प्रतिदिन
- सब कुछ
- उदाहरण
- उदाहरण
- एक्सचेंज
- उम्मीद
- अनुभव
- प्रयोग
- प्रयोगों
- अन्वेषण
- का पता लगाने
- निर्यात
- निर्यात
- विस्तार
- उद्धरण
- Feature
- विशेषताएं
- कुछ
- पट्टिका
- फ़ाइलें
- खोज
- लचीलापन
- प्रवाह
- प्रवाह
- फोकस
- का पालन करें
- निम्नलिखित
- के लिए
- प्रपत्र
- प्रारूप
- मित्रों
- से
- पूर्ण
- आगे
- उत्पन्न
- उत्पन्न
- मिल
- बहुत
- था
- संभालना
- है
- होने
- he
- मदद
- हाई
- पर प्रकाश डाला
- उसे
- उसके
- कैसे
- How To
- एचटीएमएल
- HTTPS
- i
- समान
- पहचानकर्ता
- if
- की छवि
- तुरंत
- आयात
- का आयात
- में सुधार
- in
- शामिल
- सहित
- करें-
- कुछ नया
- निवेश
- अंतर्दृष्टि
- उदाहरण
- निर्देश
- एकीकरण
- इरादा
- बातचीत
- बातचीत
- इंटरैक्टिव
- इंटरफेस
- में
- सहज ज्ञान युक्त
- IT
- आईटी इस
- जावास्क्रिप्ट
- काम
- जेपीजी
- JSON
- जुलाई
- केवल
- कुंजी
- भाषाऐं
- बड़ा
- पिछली बार
- बाद में
- ताज़ा
- लांच
- सीख रहा हूँ
- चलो
- स्तर
- पसंद
- सीमित
- LINK
- लिंक्डइन
- सूची
- सुनना
- सूचियाँ
- स्थान
- देखिए
- मशीन
- यंत्र अधिगम
- बनाना
- निर्माण
- प्रबंधन
- गाइड
- मई..
- मेन्यू
- मेटाडाटा
- तरीका
- हो सकता है
- दस लाख
- मिनटों
- लापता
- ML
- एमएलओपीएस
- आदर्श
- मॉडल
- आधुनिक
- संशोधित
- अधिक
- अधिक कुशल
- विभिन्न
- संगीत
- चाहिए
- नाम
- नामांकित
- यानी
- देशी
- आवश्यक
- आवश्यकता
- की जरूरत है
- नया
- नई सुविधाएँ
- नए नए
- अगला
- नहीं
- नोड
- नोटबुक
- अभी
- संख्या
- वस्तु
- वस्तुओं
- of
- on
- ONE
- केवल
- परिचालन
- इष्टतम
- ऑप्टिमाइज़ करें
- विकल्प
- ऑप्शंस
- or
- अन्य
- हमारी
- आउट
- उत्पादन
- बाहर
- अपना
- प्राचल
- पैरामीटर
- पारित कर दिया
- पथ
- प्रति
- निष्पादन
- चुनना
- पाइपलाइन
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- प्लस
- बिन्दु
- अंक
- पद
- संभावित
- बिजली
- भविष्यवाणी करना
- भविष्यवाणी
- तैयारी
- तैयार करना
- तैयार
- सुंदर
- पहले से
- प्रिंसिपल
- प्रक्रिया
- प्रसंस्कृत
- प्रसंस्करण
- एस्ट्रो मॉल
- उत्पाद समीक्षा
- उत्पादन
- कार्यक्रम संबंधी
- प्रोग्रामिंग
- प्रोग्रामिंग की भाषाएँ
- परियोजना
- प्रदान करना
- प्रदान कर
- अजगर
- पढ़ना
- वास्तविक समय
- प्राप्त करना
- की सिफारिश
- को कम करने
- कम कर देता है
- और
- प्रासंगिक
- हटाना
- प्रतिनिधित्व
- का प्रतिनिधित्व
- का अनुरोध
- की आवश्यकता होती है
- संसाधन
- जिसके परिणामस्वरूप
- परिणाम
- की समीक्षा
- समीक्षा
- सही
- भूमिका
- चलाता है
- s
- sagemaker
- सेजमेकर अनुमान
- SageMaker पाइपलाइन
- वही
- देखा
- स्केलेबल
- निर्बाध
- मूल
- अनुभाग
- देखना
- का चयन
- चयन
- सेवाएँ
- सेवारत
- सत्र
- सेट
- सेटिंग्स
- कई
- चाहिए
- दिखाना
- शट डाउन
- हस्ताक्षर
- सरल
- सरलीकृत
- को आसान बनाने में
- सरल बनाने
- एक
- आकार
- छोटा
- छोटे
- So
- सॉफ्टवेयर
- सॉफ्टवेयर विकास
- समाधान
- समाधान ढूंढे
- विशेष रूप से
- विभाजित
- प्रारंभ
- शुरू
- कदम
- कदम
- भंडारण
- संग्रहित
- सुवीही
- व्यवस्थित बनाने
- मजबूत
- संरचित
- प्रस्तुत
- प्रस्तुत
- ऐसा
- समर्थन
- समर्थन करता है
- निश्चित
- सिस्टम
- लेना
- लेता है
- लक्ष्य
- कि
- RSI
- जानकारी
- लेकिन हाल ही
- फिर
- वहाँ।
- इन
- इसका
- उन
- यहाँ
- पहर
- शीर्षक से
- सेवा मेरे
- आज
- भी
- साधन
- उपकरण
- कुल
- रेलगाड़ी
- प्रशिक्षित
- प्रशिक्षण
- बदालना
- परिवर्तन
- परिवर्तनों
- तब्दील
- रूपांतरण
- दो बार
- ui
- के अंतर्गत
- अनलॉक
- अपलोड की गई
- उपयोग
- उदाहरण
- प्रयुक्त
- का उपयोग
- मूल्यवान
- मूल्य
- मान
- बहुत
- के माध्यम से
- देखें
- दृश्य
- करना चाहते हैं
- जरूरत है
- we
- वेब
- वेब सेवाओं
- वेबसाइटों
- सप्ताह
- कुंआ
- कब
- कौन कौन से
- व्यापक रूप से
- मर्जी
- साथ में
- काम
- वर्कफ़्लो
- workflows
- काम कर रहे
- आप
- आपका
- जेफिरनेट