अमेज़न SageMaker फ़ीचर स्टोर मशीन लर्निंग (एमएल) मॉडल द्वारा उपयोग के लिए फीचर डेटा को स्टोर और पुनर्प्राप्त करने के लिए एक उद्देश्य-निर्मित सेवा है। फ़ीचर स्टोर एक ऑनलाइन स्टोर प्रदान करता है जो कम-विलंबता, उच्च-थ्रूपुट पढ़ने और लिखने में सक्षम है, और एक ऑफ़लाइन स्टोर है जो सभी ऐतिहासिक रिकॉर्ड डेटा तक थोक पहुंच प्रदान करता है। फ़ीचर स्टोर ऑनलाइन और ऑफलाइन स्टोर के बीच डेटा के सिंक्रनाइज़ेशन को संभालता है।
क्योंकि मॉडल विकास एक पुनरावृत्तीय प्रक्रिया है, ग्राहक अक्सर ऑफ़लाइन स्टोर से पूछताछ करेंगे और मॉडल प्रशिक्षण के लिए विभिन्न डेटासेट बनाएंगे। वर्तमान में, ऑफ़लाइन स्टोर में सुविधाओं तक पहुंचने के कई तरीके हैं, जिनमें SQL क्वेरी चलाना भी शामिल है अमेज़न एथेना या अपाचे स्पार्क में स्पार्क एसक्यूएल का उपयोग करना। हालाँकि, इन पैटर्नों के लिए तदर्थ (और कभी-कभी जटिल) SQL कथन लिखने की आवश्यकता होती है, जो डेटा वैज्ञानिक व्यक्तित्व के लिए हमेशा उपयुक्त नहीं होता है।
सुविधा स्टोर हाल ही में बढ़ाया गया ऑफ़लाइन स्टोर से डेटासेट बनाना आसान बनाने के लिए सेजमेकर पायथन एसडीके। इस रिलीज़ के साथ, आप SQL क्वेरी लिखे बिना डेटासेट बनाने के लिए SDK में विधियों के एक नए सेट का उपयोग कर सकते हैं। ये नई विधियाँ समय-समय पर सटीकता सुनिश्चित करते हुए समय यात्रा, डुप्लिकेट रिकॉर्ड को फ़िल्टर करने और कई फीचर समूहों में शामिल होने जैसे सामान्य संचालन का समर्थन करती हैं।
इस पोस्ट में, हम प्रदर्शित करते हैं कि किसी SQL कथन को लिखे बिना एमएल-तैयार डेटासेट बनाने के लिए SageMaker Python SDK का उपयोग कैसे करें।
समाधान अवलोकन
नई कार्यक्षमता प्रदर्शित करने के लिए, हम दो डेटासेट के साथ काम करते हैं: लीड और वेब मार्केटिंग मेट्रिक्स। इन डेटासेट का उपयोग एक मॉडल बनाने के लिए किया जा सकता है जो भविष्यवाणी करता है कि क्या कोई लीड उस लीड के लिए कैप्चर की गई मार्केटिंग गतिविधियों और मेट्रिक्स को देखते हुए बिक्री में परिवर्तित हो जाएगी।
लीड डेटा में संभावित ग्राहकों के बारे में जानकारी होती है जिन्हें उपयोग करके पहचाना जाता है Lead_ProspectID
. लीड के लिए सुविधाएँ (उदाहरण के लिए, LeadSource
) को समय के साथ अपडेट किया जा सकता है, जिसके परिणामस्वरूप उस लीड के लिए एक नया रिकॉर्ड बन जाता है। Lead_EventTime
उस समय को दर्शाता है जिसमें प्रत्येक रिकॉर्ड बनाया जाता है। निम्नलिखित स्क्रीनशॉट इस डेटा का एक उदाहरण दिखाता है।
वेब मार्केटिंग मेट्रिक्स डेटा किसी लीड के लिए सहभागिता मेट्रिक्स को ट्रैक करता है, जहां प्रत्येक लीड की पहचान का उपयोग करके की जाती है Web_ProspectID
। Web_EventTime
उस समय को दर्शाता है जिसमें रिकॉर्ड बनाया गया था। लीड फ़ीचर समूह के विपरीत, इस फ़ीचर समूह में प्रति लीड केवल एक रिकॉर्ड होता है। निम्नलिखित स्क्रीनशॉट इस डेटा का एक उदाहरण दिखाता है।
हम इसके प्रमुख भागों से गुजरते हैं sagemaker-feature-store-offline-sdk.ipynb
नोटबुक, जो निम्नलिखित चरणों को प्रदर्शित करता है:
- फ़ीचर समूह से एक डेटासेट बनाएं।
- अनेक फ़ीचर समूहों से जुड़ें.
- विशिष्ट टाइमस्टैम्प पर ईवेंट के सेट के आधार पर फीचर समूह और डेटासेट के बीच एक पॉइंट-इन-टाइम जॉइन करें।
- एक विशिष्ट समय सीमा के भीतर फीचर इतिहास को पुनः प्राप्त करें।
- विशिष्ट टाइमस्टैम्प के रूप में सुविधाएँ पुनः प्राप्त करें।
.. पूर्वापेक्षाएँ
आपको निम्नलिखित पूर्वापेक्षाएँ चाहिए:
हम मानते हैं कि मौजूदा डेटा का उपयोग करके लीड डेटा के लिए एक फीचर समूह बनाया गया है FeatureGroup.create
विधि, और चर का उपयोग करके संदर्भित किया जा सकता है base_fg
. फ़ीचर समूहों पर अधिक जानकारी के लिए, देखें फ़ीचर समूह बनाएँ.
फ़ीचर समूह से एक डेटासेट बनाएं
सैजमेकर एसडीके का उपयोग करके डेटासेट बनाने के लिए, हम नए का उपयोग करते हैं FeatureStore
क्लास, जिसमें शामिल है create_dataset
तरीका। यह विधि एक आधार फीचर समूह को स्वीकार करती है जिसे अन्य फीचर समूहों या डेटाफ्रेम से जोड़ा जा सकता है। हम लीड फीचर समूह को आधार और एक के रूप में प्रदान करके शुरू करते हैं अमेज़न सरल भंडारण सेवा (अमेज़ॅन S3) डेटासेट संग्रहीत करने का पथ:
RSI create_dataset
विधि एक रिटर्न DatasetBuilder
ऑब्जेक्ट, जिसका उपयोग एक या एकाधिक फीचर समूहों से डेटासेट उत्पन्न करने के लिए किया जा सकता है (जिसे हम अगले भाग में प्रदर्शित करते हैं)। केवल लीड सुविधाओं से युक्त एक सरल डेटासेट बनाने के लिए, हम इसे लागू करते हैं to_csv_file
तरीका। यह ऑफ़लाइन स्टोर से सुविधाओं को पुनः प्राप्त करने के लिए एथेना में एक क्वेरी चलाता है, और परिणामों को निर्दिष्ट S3 पथ पर सहेजता है।
अनेक फ़ीचर समूहों से जुड़ें
सेजमेकर एसडीके के साथ, आप डेटासेट बनाने के लिए आसानी से कई फीचर समूहों में शामिल हो सकते हैं। आप मौजूदा पांडा डेटाफ़्रेम के बीच एकल या एकाधिक फ़ीचर समूहों में शामिल होने का कार्य भी कर सकते हैं। आधार सुविधा समूह जुड़ने के लिए एक महत्वपूर्ण अवधारणा है। आधार फ़ीचर समूह वह फ़ीचर समूह है जिसमें अन्य फ़ीचर समूह या पांडा डेटाफ़्रेम शामिल होते हैं।
का उपयोग करके डेटासेट बनाते समय create_dataset
समारोह, हम उपयोग करते हैं with_feature_group
विधि, जो आधार सुविधा समूह में रिकॉर्ड पहचानकर्ता और लक्ष्य सुविधा नाम का उपयोग करके आधार सुविधा समूह और अन्य सुविधा समूह के बीच एक आंतरिक जुड़ाव करती है। हमारे उदाहरण में, बेस फीचर समूह लीड फीचर समूह है, और लक्ष्य फीचर समूह वेब मार्केटिंग फीचर समूह है। with_feature_group
विधि निम्नलिखित तर्क स्वीकार करती है:
- फीचर_ग्रुप - यह वह फीचर समूह है जिसके साथ हम जुड़ रहे हैं। हमारे कोड नमूने में, लक्ष्य सुविधा समूह वेब मार्केटिंग डेटासेट का उपयोग करके बनाया गया है।
- target_feature_name_in_base - बेस फीचर समूह में फीचर का नाम जिसे हम जॉइन में कुंजी के रूप में उपयोग कर रहे हैं। हम उपयोग करते हैं
Lead_ProspectID
आधार सुविधा समूह के लिए रिकॉर्ड पहचानकर्ता के रूप में। - शामिल_सुविधा_नाम - यह आधार फीचर समूह के फीचर नामों की सूची है। हम इस फ़ील्ड का उपयोग उन सुविधाओं को निर्दिष्ट करने के लिए करते हैं जिन्हें हम डेटासेट में शामिल करना चाहते हैं।
निम्नलिखित कोड लक्ष्य सुविधा समूह के साथ आधार सुविधा समूह में शामिल होकर डेटासेट बनाने का एक उदाहरण दिखाता है:
आप जोड़ कर कई फीचर समूहों को शामिल करने के लिए जॉइन ऑपरेशंस का विस्तार कर सकते हैं with_feature_group
पूर्ववर्ती कोड उदाहरण के अंत में विधि और नए फीचर समूह के लिए आवश्यक तर्कों को परिभाषित करना। आप अपने मौजूदा पांडा डेटाफ़्रेम के आधार को परिभाषित करके और इच्छुक फ़ीचर समूहों के साथ जुड़कर मौजूदा डेटाफ़्रेम के साथ जुड़ने का कार्य भी कर सकते हैं। निम्न कोड नमूना दिखाता है कि मौजूदा पांडा डेटाफ़्रेम और मौजूदा फ़ीचर समूह के साथ डेटासेट कैसे बनाया जाए:
इन विभिन्न विन्यासों पर अधिक उदाहरणों के लिए, देखें अपने फ़ीचर समूहों से एक डेटासेट बनाएं.
एक पॉइंट-इन-टाइम जॉइन बनाएं
इस संवर्द्धन की सबसे शक्तिशाली क्षमताओं में से एक जटिल SQL कोड लिखने की आवश्यकता के बिना सरलता से पॉइंट-इन-टाइम जॉइन करना है। एमएल मॉडल बनाते समय, डेटा वैज्ञानिकों को बचने की आवश्यकता होती है गोपनीय जानकारी का चोरी हो जाना या लक्ष्य रिसाव, जो गलती से मॉडल प्रशिक्षण के दौरान डेटा का उपयोग कर रहा है जो भविष्यवाणी के समय उपलब्ध नहीं होगा। उदाहरण के लिए, यदि हम क्रेडिट कार्ड धोखाधड़ी की भविष्यवाणी करने की कोशिश कर रहे हैं, तो हमें उन लेनदेन को बाहर करना चाहिए जो धोखाधड़ी के आरोप के बाद आते हैं, हम भविष्यवाणी करने की कोशिश कर रहे हैं, अन्यथा प्रशिक्षित मॉडल इस धोखाधड़ी के बाद की जानकारी का उपयोग मॉडल को बदलने के लिए कर सकता है, जिससे इसे सामान्य बनाया जा सकता है। कम अच्छी तरह से।
पॉइंट-इन-टाइम सटीक सुविधा डेटा की पुनर्प्राप्ति के लिए आपको एक इकाई डेटाफ़्रेम प्रदान करने की आवश्यकता होती है जो रिकॉर्ड आईडी (या प्राथमिक कुंजी) और संबंधित ईवेंट समय का एक सेट प्रदान करता है जो ईवेंट के लिए कटऑफ समय के रूप में कार्य करता है। इस पुनर्प्राप्ति तंत्र को कभी-कभी कहा जाता है पंक्ति-स्तरीय समय यात्रा, क्योंकि यह प्रत्येक पंक्ति कुंजी के लिए एक अलग समय बाधा लागू करने की अनुमति देता है। सेजमेकर एसडीके के साथ पॉइंट-इन-टाइम जुड़ने के लिए, हम इसका उपयोग करते हैं डेटासेट बिल्डर क्लास और कन्स्ट्रक्टर को आधार तर्क के रूप में इकाई डेटाफ्रेम प्रदान करें।
निम्नलिखित कोड में, हम दो रिकॉर्ड के साथ एक साधारण इकाई DataFrame बनाते हैं। हम समय श्रृंखला डेटा (जनवरी 2023 के मध्य) के पास, कटऑफ़ समय इंगित करने के लिए उपयोग किया जाने वाला ईवेंट समय सेट करते हैं:
जब हम उपयोग करते हैं point_in_time_accurate_join
कार्यक्षमता के साथ create_dataset
कॉल करें, आंतरिक क्वेरी टाइमस्टैम्प के साथ सभी रिकॉर्ड को बाहर कर देती है, फिर कटऑफ समय प्रदान किया जाता है, जो नवीनतम फीचर मान लौटाता है जो घटना के समय उपलब्ध होता:
ध्यान दें कि पॉइंट-इन-टाइम जॉइन द्वारा लौटाए गए डेटाफ़्रेम में केवल दो रिकॉर्ड हैं। ऐसा इसलिए है क्योंकि हमने इकाई डेटाफ़्रेम में केवल दो रिकॉर्ड आईडी सबमिट की हैं, प्रत्येक के लिए एक Lead_ProspectID
हम पुनः प्राप्त करना चाहते हैं. पॉइंट-इन-टाइम मानदंड निर्दिष्ट करता है कि रिकॉर्ड का ईवेंट समय (में संग्रहीत)। Lead_Eventtime
फ़ील्ड) में एक मान होना चाहिए जो कटऑफ़ समय से कम हो।
इसके अतिरिक्त, हम क्वेरी को केवल नवीनतम रिकॉर्ड पुनर्प्राप्त करने का निर्देश देते हैं जो इस मानदंड को पूरा करता है क्योंकि हमने इसे लागू किया है with_number_of_recent_records_by_record_identifier
तरीका। जब के साथ संयोजन में उपयोग किया जाता है point_in_time_accurate_join
विधि, यह कॉल करने वाले को यह निर्दिष्ट करने की अनुमति देती है कि कितने रिकॉर्ड उन लोगों से वापस आने हैं जो बिंदु-में-समय पर शामिल होने के मानदंड को पूरा करते हैं।
एथेना क्वेरी परिणामों के साथ पॉइंट-इन-टाइम जॉइन परिणामों की तुलना करें
SageMaker SDK द्वारा लौटाए गए आउटपुट को सत्यापित करने के लिए point_in_time_accurate_join
फ़ंक्शन, हम इसकी तुलना एथेना क्वेरी के परिणाम से करते हैं। सबसे पहले, हम फ़ीचर स्टोर रनटाइम द्वारा बनाई गई विशिष्ट तालिका से जुड़े SELECT स्टेटमेंट का उपयोग करके एक मानक एथेना क्वेरी बनाते हैं। इस तालिका का नाम संदर्भ द्वारा पाया जा सकता है table_name
इंस्टेंट करने के बाद फ़ील्ड athena_query
से FeatureGroup
एपीआई:
एथेना क्वेरी में कोई पॉइंट-इन-टाइम जॉइन सिमेंटिक्स शामिल नहीं है, इसलिए यह निर्दिष्ट से मेल खाने वाले सभी रिकॉर्ड लौटाता है record_id
(Lead_ProspectID
).
इसके बाद, हम आसान तुलना के लिए एथेना परिणामों को घटना समय के अनुसार क्रमबद्ध करने के लिए पांडा लाइब्रेरी का उपयोग करते हैं। इकाई डेटाफ़्रेम में निर्दिष्ट ईवेंट समय के बाद के टाइमस्टैम्प वाले रिकॉर्ड (उदाहरण के लिए, 2023-01-15T00:00:00Z
) को प्रस्तुत किया गया point_in_time_accurate_join
पॉइंट-इन-टाइम परिणामों में न दिखें. क्योंकि हमने अतिरिक्त रूप से निर्दिष्ट किया है कि हमें पिछले से केवल एक ही रिकॉर्ड चाहिए create_dataset
कोड, हम केवल कटऑफ़ समय से पहले नवीनतम रिकॉर्ड प्राप्त करते हैं। एथेना क्वेरी परिणामों के साथ सैजमेकर एसडीके परिणामों की तुलना करके, हम देखते हैं कि पॉइंट-इन-टाइम जॉइन फ़ंक्शन ने उचित रिकॉर्ड लौटाए।
इसलिए, हमें विश्वास है कि हम पंक्ति-स्तरीय समय यात्रा करने और लक्ष्य रिसाव से बचने के लिए सेजमेकर एसडीके का उपयोग कर सकते हैं। इसके अलावा, यह क्षमता कई फीचर समूहों में काम करती है जिन्हें पूरी तरह से अलग-अलग समय-सीमा पर ताज़ा किया जा सकता है।
एक विशिष्ट समय सीमा के भीतर फीचर इतिहास पुनः प्राप्त करें
हम डेटासेट बनाने के लिए फीचर समूहों में शामिल होने पर समय सीमा विंडो निर्दिष्ट करने के उपयोग को भी प्रदर्शित करना चाहते हैं। समय विंडो का उपयोग करके परिभाषित किया गया है with_event_time_range
, जो दो इनपुट स्वीकार करता है, starting_timestamp
और ending_timestamp
, और एक डेटासेट बिल्डर ऑब्जेक्ट लौटाता है। हमारे कोड नमूने में, हम से 1 पूरे दिन के लिए पुनर्प्राप्ति समय विंडो सेट करते हैं 2022-07-01 00:00:00
जब तक 2022-07-02 00:00:00
.
निम्नलिखित कोड दिखाता है कि लक्ष्य सुविधा समूह के साथ आधार सुविधा समूह में शामिल होने के दौरान निर्दिष्ट ईवेंट समय विंडो के साथ डेटासेट कैसे बनाया जाए:
हम उपयोग करके बनाए गए डेटासेट के आकारों के बीच अंतर की भी पुष्टि करते हैं with_event_time_range
के साथ पांडास डेटाफ़्रेम में निर्यात करके to_dataframe()
विधि और डेटा प्रदर्शित करना। ध्यान दें कि कैसे परिणाम सेट में मूल 10,020 रिकॉर्ड का केवल एक अंश है, क्योंकि यह केवल उन रिकॉर्ड को पुनर्प्राप्त करता है जिनके event_time
1 दिन की समयावधि के भीतर है.
विशिष्ट टाइमस्टैम्प के रूप में सुविधाएँ पुनः प्राप्त करें
RSI DatasetBuilder as_of
विधि डेटासेट से सुविधाओं को पुनर्प्राप्त करती है जो टाइमस्टैम्प-आधारित बाधा को पूरा करती है, जिसे कॉल करने वाला फ़ंक्शन के तर्क के रूप में प्रदान करता है। यह तंत्र पहले से एकत्र किए गए डेटा पर प्रयोगों को दोबारा चलाने, समय श्रृंखला मॉडल का बैकटेस्टिंग, या डेटा ऑडिटिंग उद्देश्यों के लिए ऑफ़लाइन स्टोर की पिछली स्थिति से डेटासेट बनाने जैसे परिदृश्यों के लिए उपयोगी है। इस कार्यक्षमता को कभी-कभी समय यात्रा के रूप में संदर्भित किया जाता है क्योंकि यह अनिवार्य रूप से डेटा स्टोर को पहले की तारीख और समय पर वापस ले जाती है। इस समय बाधा को के रूप में भी जाना जाता है कटऑफ टाइमस्टैम्प.
हमारे नमूना कोड में, हम सबसे पहले इसे पढ़कर कटऑफ टाइमस्टैम्प बनाते हैं write_time
फ़ीचर स्टोर को लिखे गए अंतिम रिकॉर्ड का मूल्य, जिसके साथ लिखा गया था put_record
. फिर हम यह कटऑफ टाइमस्टैम्प प्रदान करते हैं DatasetBuilder
के तर्क के रूप में as_of
तरीका:
यह ध्यान रखना महत्वपूर्ण है कि as_of
विधि समय की कमी को आंतरिक पर लागू करती है write_time
फ़ील्ड, जो फ़ीचर स्टोर द्वारा स्वचालित रूप से उत्पन्न होती है। write_time
फ़ील्ड वास्तविक टाइमस्टैम्प का प्रतिनिधित्व करता है जब रिकॉर्ड डेटा स्टोर में लिखा जाता है। यह जैसे अन्य तरीकों से अलग है point-in-time-accurate-join
और with_event_time_range
जो क्लाइंट द्वारा प्रदत्त का उपयोग करता है event_time
एक तुलनित्र के रूप में क्षेत्र।
क्लीन अप
चल रहे शुल्कों से बचने के लिए इस उदाहरण के हिस्से के रूप में बनाए गए सभी संसाधनों को हटाना सुनिश्चित करें। इसमें फीचर समूह और ऑफ़लाइन स्टोर डेटा वाले S3 बकेट शामिल हैं।
सेजमेकर पायथन एसडीके अनुभव बनाम एसक्यूएल लेखन
SageMaker Python SDK में नए तरीके आपको जल्दी से डेटासेट बनाने और एमएल जीवनचक्र के दौरान प्रशिक्षण चरण में तेजी से जाने की अनुमति देते हैं। बचाए जा सकने वाले समय और प्रयास को दिखाने के लिए, आइए एक उपयोग के मामले की जांच करें जहां हमें एक निर्दिष्ट समय सीमा के भीतर सुविधाओं को पुनः प्राप्त करते समय दो फीचर समूहों में शामिल होने की आवश्यकता होती है। निम्नलिखित आंकड़ा ऑफ़लाइन फ़ीचर स्टोर बनाम एसक्यूएल पर पायथन प्रश्नों की तुलना करता है, जिसका उपयोग पायथन क्वेरी के पीछे डेटासेट बनाने के लिए किया जाता है।
जैसा कि आप देख सकते हैं, दो फीचर समूहों को जोड़ने के समान ऑपरेशन के लिए आपको एक लंबी, जटिल SQL क्वेरी बनाने की आवश्यकता होती है, जबकि इसे केवल का उपयोग करके पूरा किया जा सकता है with_feature_group
और with_event_time_range
सेजमेकर पायथन एसडीके में विधियाँ।
निष्कर्ष
पायथन सेजमेकर एसडीके में नई ऑफ़लाइन स्टोर विधियां आपको जटिल एसक्यूएल स्टेटमेंट लिखने के बिना अपनी ऑफ़लाइन सुविधाओं को क्वेरी करने की अनुमति देती हैं। यह उन ग्राहकों के लिए एक सहज अनुभव प्रदान करता है जो मॉडल विकास के दौरान पायथन कोड लिखने के आदी हैं। फीचर समूहों के बारे में अधिक जानकारी के लिए देखें अपने फ़ीचर समूहों से एक डेटासेट बनाएं और फ़ीचर स्टोर एपीआई: फ़ीचर समूह.
इस पोस्ट का पूरा उदाहरण यहां पाया जा सकता है गिटहब भंडार. इसे आज़माएं और हमें टिप्पणियों में अपनी प्रतिक्रिया दें।
लेखक के बारे में
पॉल हरगिस ने AWS, Amazon और हॉर्टनवर्क्स सहित कई कंपनियों में मशीन लर्निंग पर अपने प्रयासों पर ध्यान केंद्रित किया है। उन्हें प्रौद्योगिकी समाधान बनाने और लोगों को उनका लाभ उठाने का तरीका सिखाने में आनंद आता है। पॉल वास्तविक दुनिया की समस्याओं को हल करने के लिए ग्राहकों को उनकी मशीन लर्निंग पहल का विस्तार करने में मदद करना पसंद करते हैं। AWS में अपनी भूमिका से पहले, वह अमेज़ॅन एक्सपोर्ट्स एंड एक्सपेंशंस के लिए प्रमुख वास्तुकार थे और मदद कर रहे थे amazon.com अंतर्राष्ट्रीय खरीदारों के लिए अनुभव में सुधार करें।
मेकित गुनगोर AWS में एक AI/ML स्पेशलिस्ट सॉल्यूशन आर्किटेक्ट है, जो ग्राहकों को बड़े पैमाने पर AI/ML सॉल्यूशंस डिजाइन और बनाने में मदद करता है। वह दूरसंचार ग्राहकों के लिए एआई/एमएल उपयोग के मामलों की एक विस्तृत श्रृंखला को कवर करता है और वर्तमान में जेनरेटिव एआई, एलएलएम और प्रशिक्षण और अनुमान अनुकूलन पर ध्यान केंद्रित करता है। उसे अक्सर जंगल में लंबी पैदल यात्रा करते या अपने खाली समय में अपने दोस्तों के साथ बोर्ड गेम खेलते हुए देखा जा सकता है।
टोनी चेन AWS में एक मशीन लर्निंग सॉल्यूशंस आर्किटेक्ट है, जो ग्राहकों को क्लाउड में स्केलेबल और मजबूत मशीन लर्निंग क्षमताओं को डिजाइन करने में मदद करता है। एक पूर्व डेटा वैज्ञानिक और डेटा इंजीनियर के रूप में, वह मशीन लर्निंग के संचालन में संगठनों के सामने आने वाली कुछ सबसे चुनौतीपूर्ण समस्याओं से निपटने में मदद करने के लिए अपने अनुभव का लाभ उठाते हैं।
सोविक कुमार नाथ AWS के साथ AI/ML समाधान वास्तुकार है। उनके पास मशीन लर्निंग के लिए एंड-टू-एंड डिज़ाइन और समाधान का व्यापक अनुभव है; वित्तीय, परिचालन और विपणन विश्लेषिकी के भीतर व्यापार विश्लेषण; स्वास्थ्य देखभाल; आपूर्ति श्रृंखला; और आईओटी। काम के बाहर, सोविक को यात्रा करना और फिल्में देखना पसंद है।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- ईवीएम वित्त। विकेंद्रीकृत वित्त के लिए एकीकृत इंटरफ़ेस। यहां पहुंचें।
- क्वांटम मीडिया समूह। आईआर/पीआर प्रवर्धित। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 डेटा इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/build-machine-learning-ready-datasets-from-the-amazon-sagemaker-offline-feature-store-using-the-amazon-sagemaker-python-sdk/
- :हैस
- :है
- :कहाँ
- $यूपी
- 1
- 10
- 100
- 11
- 14
- 15% तक
- 16
- 2023
- 22
- 24
- 7
- 8
- a
- About
- स्वीकार करता है
- पहुँच
- पूरा
- शुद्धता
- सही
- के पार
- गतिविधियों
- वास्तविक
- Ad
- जोड़ने
- इसके अतिरिक्त
- बाद
- AI
- ऐ / एमएल
- सब
- अनुमति देना
- की अनुमति देता है
- भी
- हमेशा
- वीरांगना
- अमेज़न SageMaker
- अमेज़ॅन वेब सेवा
- an
- विश्लेषिकी
- और
- अन्य
- कोई
- अपाचे
- एपीआई
- एपीआई
- लागू
- हैं
- तर्क
- तर्क
- AS
- At
- लेखा परीक्षा
- स्वतः
- उपलब्ध
- से बचने
- एडब्ल्यूएस
- वापस
- Backtesting
- आधार
- आधारित
- BE
- क्योंकि
- किया गया
- पीछे
- के बीच
- मंडल
- बोर्ड खेल
- निर्माण
- निर्माता
- इमारत
- व्यापार
- by
- कॉल
- कोलर
- कर सकते हैं
- क्षमताओं
- सक्षम
- पर कब्जा कर लिया
- कार्ड
- मामला
- मामलों
- श्रृंखला
- चुनौतीपूर्ण
- प्रभार
- प्रभार
- कक्षा
- बादल
- कोड
- टिप्पणियाँ
- सामान्य
- कंपनियों
- तुलना
- की तुलना
- तुलना
- पूरी तरह से
- जटिल
- संकल्पना
- आत्मविश्वास
- पुष्टि करें
- संयोजन
- मिलकर
- शामिल
- शामिल हैं
- बदलना
- इसी
- सका
- कवर
- बनाना
- बनाया
- बनाना
- श्रेय
- क्रेडिट कार्ड
- मापदंड
- वर्तमान में
- ग्राहक
- तिथि
- आँकड़े वाला वैज्ञानिक
- डेटासेट
- तारीख
- दिनांक और समय
- दिन
- परिभाषित
- परिभाषित करने
- दिखाना
- दर्शाता
- डिज़ाइन
- डिजाइन
- विकास
- अंतर
- विभिन्न
- प्रदर्शित
- नहीं करता है
- dont
- दौरान
- से प्रत्येक
- पूर्व
- आसान
- आसानी
- आसान
- प्रयास
- प्रयासों
- समाप्त
- शुरू से अंत तक
- सगाई
- इंजीनियर
- सुनिश्चित
- सत्ता
- युग
- अनिवार्य
- कार्यक्रम
- घटनाओं
- की जांच
- उदाहरण
- उदाहरण
- मौजूदा
- विस्तार
- अनुभव
- प्रयोगों
- निर्यात
- विस्तार
- व्यापक
- विस्तृत अनुभव
- चेहरा
- Feature
- विशेषताएं
- फ़ीचर स्टोर
- प्रतिक्रिया
- खेत
- आकृति
- पट्टिका
- छानने
- वित्तीय
- प्रथम
- ध्यान केंद्रित
- केंद्रित
- निम्नलिखित
- के लिए
- प्रपत्र
- पूर्व
- पाया
- अंश
- फ्रेम
- धोखा
- कपटपूर्ण
- मुक्त
- अक्सर
- मित्रों
- से
- पूर्ण
- समारोह
- कार्यक्षमता
- और भी
- Games
- उत्पन्न
- उत्पन्न
- उत्पादक
- जनरेटिव एआई
- मिल
- देना
- दी
- समूह
- समूह की
- हैंडल
- है
- होने
- he
- स्वास्थ्य सेवा
- मदद
- मदद
- उसके
- ऐतिहासिक
- इतिहास
- कैसे
- How To
- तथापि
- एचटीएमएल
- http
- HTTPS
- पहचान
- पहचानकर्ता
- आईडी
- if
- आयात
- महत्वपूर्ण
- में सुधार
- in
- शामिल
- शामिल
- सहित
- संकेत मिलता है
- करें-
- पहल
- निविष्टियां
- उदाहरण
- रुचि
- आंतरिक
- अंतरराष्ट्रीय स्तर पर
- में
- IOT
- IT
- में शामिल होने
- में शामिल हो गए
- शामिल होने
- जुड़ती
- जेपीजी
- केवल
- कुंजी
- जानना
- पिछली बार
- बाद में
- ताज़ा
- नेतृत्व
- बिक्रीसूत्र
- सीख रहा हूँ
- कम
- चलो
- लीवरेज
- leverages
- पुस्तकालय
- जीवन चक्र
- पसंद
- को यह पसंद है
- सूची
- स्थान
- लंबा
- मशीन
- यंत्र अधिगम
- बनाना
- निर्माण
- बहुत
- विपणन (मार्केटिंग)
- मैच
- मई..
- तंत्र
- मिलना
- की बैठक
- तरीका
- तरीकों
- मेट्रिक्स
- मध्यम
- ML
- आदर्श
- मॉडल
- अधिक
- अधिकांश
- चाल
- चलचित्र
- विभिन्न
- चाहिए
- नाम
- नामों
- निकट
- आवश्यकता
- नया
- अगला
- नोटबुक
- सूचना..
- वस्तु
- of
- ऑफ़लाइन
- अक्सर
- on
- ONE
- चल रहे
- ऑनलाइन
- केवल
- आपरेशन
- परिचालन
- संचालन
- इष्टतमीकरण
- or
- संगठनों
- मूल
- अन्य
- अन्यथा
- हमारी
- उत्पादन
- बाहर
- के ऊपर
- पांडा
- भाग
- भागों
- पास
- पथ
- पैटर्न उपयोग करें
- पॉल
- स्टाफ़
- निष्पादन
- प्रदर्शन
- अवधि
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- खेल
- पद
- शक्तिशाली
- भविष्यवाणी करना
- भविष्यवाणी
- भविष्यवाणी
- आवश्यक शर्तें
- पिछला
- पहले से
- प्राथमिक
- पूर्व
- समस्याओं
- प्रक्रिया
- उचित
- भावी
- प्रदान करना
- प्रदान करता है
- प्रदान कर
- प्रयोजनों
- अजगर
- प्रश्नों
- जल्दी से
- रेंज
- पढ़ना
- असली दुनिया
- रिकॉर्ड
- अभिलेख
- संदर्भित
- निर्दिष्ट
- और
- का प्रतिनिधित्व करता है
- की आवश्यकता होती है
- अपेक्षित
- की आवश्यकता होती है
- उपयुक्त संसाधन चुनें
- परिणाम
- परिणाम
- वापसी
- लौटने
- रिटर्न
- मजबूत
- भूमिका
- रोल
- आरओडब्ल्यू
- दौड़ना
- sagemaker
- बिक्री
- वही
- स्केलेबल
- स्केल
- परिदृश्यों
- वैज्ञानिक
- वैज्ञानिकों
- एसडीके
- निर्बाध
- सेकंड
- अनुभाग
- देखना
- अर्थ विज्ञान
- कई
- सेवा
- सेवा
- सेवाएँ
- सेट
- की स्थापना
- व्यवस्था
- कई
- चाहिए
- दिखाना
- दिखाता है
- सरल
- केवल
- एक
- आकार
- So
- समाधान
- समाधान ढूंढे
- हल
- कुछ
- स्पार्क
- विशेषज्ञ
- विशिष्ट
- विनिर्दिष्ट
- मानक
- प्रारंभ
- राज्य
- कथन
- बयान
- कदम
- कदम
- भंडारण
- की दुकान
- संग्रहित
- भंडार
- प्रस्तुत
- ऐसा
- उपयुक्त
- आपूर्ति
- आपूर्ति
- आपूर्ति श्रृंखला
- समर्थन
- तुल्यकालन
- तालिका
- पकड़ना
- लक्ष्य
- शिक्षण
- टेक्नोलॉजी
- दूरसंचार
- से
- कि
- RSI
- लेकिन हाल ही
- उन
- फिर
- वहाँ।
- इन
- इसका
- उन
- यहाँ
- बंधा होना
- पहर
- समय श्रृंखला
- समय यात्रा
- समयसीमा
- बार
- टाइमस्टैम्प
- सेवा मेरे
- टोनी
- प्रशिक्षित
- प्रशिक्षण
- लेनदेन
- यात्रा
- यात्रा का
- कोशिश
- दो
- यूनिक्स
- भिन्न
- जब तक
- अद्यतन
- us
- उपयोग
- उदाहरण
- प्रयुक्त
- का उपयोग
- मूल्य
- मान
- विभिन्न
- सत्यापित
- vs
- करना चाहते हैं
- था
- देख
- तरीके
- we
- वेब
- वेब सेवाओं
- कुंआ
- कब
- जहाँ तक
- कौन कौन से
- जब
- कौन
- किसका
- चौड़ा
- विस्तृत श्रृंखला
- विकिपीडिया
- मर्जी
- साथ में
- अंदर
- बिना
- काम
- कार्य
- होगा
- लिखना
- लिख रहे हैं
- लिखा हुआ
- आप
- आपका
- जेफिरनेट