AWS लो कोड-नो कोड सेवाओं के साथ निवेश प्रक्रिया में तेजी लाएं

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

पिछले कुछ वर्षों में संस्थागत संपत्ति प्रबंधकों के स्रोत और उनकी निवेश प्रक्रिया में कई डेटा स्रोतों को एकीकृत करने के तरीके में जबरदस्त प्रतिमान देखा गया है। जोखिम सहसंबंधों में लगातार बदलाव, अस्थिरता के अप्रत्याशित स्रोत और निष्क्रिय रणनीतियों से बढ़ती प्रतिस्पर्धा के साथ, परिसंपत्ति प्रबंधक प्रतिस्पर्धा में बढ़त हासिल करने और जोखिम-समायोजित रिटर्न में सुधार करने के लिए तीसरे पक्ष के डेटा स्रोतों के व्यापक सेट को नियोजित कर रहे हैं। हालाँकि, कई डेटा स्रोतों से लाभ निकालने की प्रक्रिया बेहद चुनौतीपूर्ण हो सकती है। एसेट मैनेजर की डेटा इंजीनियरिंग टीम डेटा अधिग्रहण और प्रीप्रोसेसिंग से अधिभारित होती है, जबकि डेटा साइंस टीम निवेश अंतर्दृष्टि के लिए डेटा खनन कर रही है।

तृतीय-पक्ष या वैकल्पिक डेटा निवेश प्रक्रिया में उपयोग किए गए डेटा को संदर्भित करता है, जो पारंपरिक बाजार डेटा प्रदाताओं के बाहर से प्राप्त होता है। संस्थागत निवेशक अक्सर अपने पारंपरिक डेटा स्रोतों को तीसरे पक्ष या वैकल्पिक डेटा के साथ अपनी निवेश प्रक्रिया में बढ़त हासिल करने के लिए बढ़ा रहे हैं। विशिष्ट रूप से उद्धृत उदाहरणों में उपग्रह इमेजिंग, क्रेडिट कार्ड डेटा और सोशल मीडिया की भावना शामिल है, लेकिन यह इन्हीं तक सीमित नहीं है। फंड मैनेजर बाहरी डेटासेट में सालाना लगभग $3 बिलियन का निवेश करते हैं, जिसमें सालाना खर्च में 20-30 प्रतिशत की वृद्धि होती है।

उपलब्ध तृतीय-पक्ष और वैकल्पिक डेटासेट की घातीय वृद्धि के साथ, एक नया डेटासेट नई निवेश अंतर्दृष्टि जोड़ता है या नहीं, इसका त्वरित विश्लेषण करने की क्षमता निवेश प्रबंधन उद्योग में एक प्रतिस्पर्धी अंतर है। AWS नो-कोड लो-कोड (LCNC) डेटा और AI सेवाएँ गैर-तकनीकी टीमों को प्रारंभिक डेटा स्क्रीनिंग करने, डेटा ऑनबोर्डिंग को प्राथमिकता देने, समय-से-अंतर्दृष्टि में तेजी लाने और मूल्यवान तकनीकी संसाधनों को मुक्त करने में सक्षम बनाती हैं - एक स्थायी प्रतिस्पर्धी लाभ का निर्माण करती हैं।

इस ब्लॉग पोस्ट में, हम चर्चा करते हैं कि कैसे, एक संस्थागत संपत्ति प्रबंधक के रूप में, आप तकनीकी टीमों से परे प्रारंभिक डेटा विश्लेषण और प्राथमिकता प्रक्रिया को स्केल करने और अपने निर्णय लेने में तेजी लाने के लिए AWS LCNC डेटा और AI सेवाओं का लाभ उठा सकते हैं। AWS LCNC सेवाओं के साथ, आप विभिन्न तृतीय-पक्ष डेटासेट, प्रीप्रोसेस डेटा की त्वरित सदस्यता और मूल्यांकन करने में सक्षम हैं, और कोड का एक भी टुकड़ा लिखे बिना मशीन लर्निंग (ML) मॉडल का उपयोग करके उनकी भविष्य कहनेवाला शक्ति की जाँच कर सकते हैं।

समाधान अवलोकन

हमारा उपयोग मामला बाहरी डेटासेट की स्टॉक मूल्य भविष्यवाणी शक्ति का विश्लेषण करने और इसकी विशेषता महत्व की पहचान करने के लिए है - कौन से फ़ील्ड स्टॉक मूल्य प्रदर्शन को सबसे अधिक प्रभावित करते हैं। यह आपकी निवेश प्रक्रिया के साथ फिट होने के लिए पारंपरिक मात्रात्मक पद्धतियों का उपयोग करके डेटासेट में एकाधिक क्षेत्रों में से कौन सा अधिक बारीकी से मूल्यांकन किया जाना चाहिए, यह पहचानने के लिए प्रथम-पास परीक्षण के रूप में कार्य करता है। इस प्रकार का प्रथम-पास परीक्षण विश्लेषकों द्वारा शीघ्रता से किया जा सकता है, जिससे समय की बचत होती है और आपको डेटासेट ऑनबोर्डिंग को अधिक तेज़ी से प्राथमिकता देने में मदद मिलती है। साथ ही, जब हम अपने लक्षित उदाहरण के रूप में स्टॉक मूल्य का उपयोग कर रहे हैं, तो अन्य मेट्रिक्स जैसे लाभप्रदता, मूल्यांकन अनुपात, या ट्रेडिंग वॉल्यूम का भी उपयोग किया जा सकता है। इस उपयोग मामले के लिए उपयोग किए जाने वाले सभी डेटासेट में प्रकाशित किए गए हैं AWS डेटा एक्सचेंज.

निम्नलिखित आरेख एंड-टू-एंड आर्किटेक्चर और निर्णय लेने के लिए उपयोग की जाने वाली AWS LCNC सेवाओं की व्याख्या करता है:

हमारे समाधान में निम्नलिखित चरण और समाधान शामिल हैं:

डेटा अंतर्ग्रहण: प्रकाशित वैकल्पिक डेटासेट की सदस्यता लेने और उन्हें डाउनलोड करने के लिए AWS डेटा एक्सचेंज अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी।
डेटा इंजीनियरिंग: AWS ग्लू डेटाब्रयू डेटा इंजीनियरिंग और अमेज़न S3 में संग्रहीत डेटा के परिवर्तन के लिए।
यंत्र अधिगम: अमेज़ॅन सेजमेकर कैनवास भविष्यवाणी के लिए एक समय श्रृंखला पूर्वानुमान मॉडल बनाने और पूर्वानुमान पर डेटा के प्रभाव की पहचान करने के लिए।
व्यापारिक सूचना: अमेज़न क्विकसाइट या अमेज़ॅन सैजमेकर कैनवस निर्णय लेने के लिए पूर्वानुमान के लिए फीचर महत्व की समीक्षा करने के लिए।

डेटा अंतर्ग्रहण

AWS डेटा एक्सचेंज क्लाउड में तृतीय-पक्ष डेटा को खोजना, सब्सक्राइब करना और उसका उपयोग करना आसान बनाता है। आप AWS डेटा एक्सचेंज कैटलॉग के माध्यम से ब्राउज़ कर सकते हैं और ऐसे डेटा उत्पाद ढूंढ सकते हैं जो आपके व्यवसाय और के लिए प्रासंगिक हैं सदस्यता के प्रदाताओं से डेटा के लिए बिना किसी और प्रक्रिया के, और ईटीएल प्रक्रिया की कोई आवश्यकता नहीं है। ध्यान दें कि कई प्रदाता निःशुल्क आरंभिक सब्सक्रिप्शन प्रदान करते हैं, जो आपको अग्रिम लागत वहन किए बिना उनके डेटा का विश्लेषण करने की अनुमति देते हैं।

इस उपयोग के मामले के लिए, AWS डेटा एक्सचेंज में नीचे दिए गए डेटासेट को खोजें और सब्सक्राइब करें:

मार्केट कैप द्वारा शीर्ष 20 अमेरिकी कंपनियों के लिए 10 साल के अंत का स्टॉक डेटा द्वारा प्रकाशित अल्फा सहूलियत. इस मुफ्त डेटासेट में 20 सितंबर, 10 तक बाजार पूंजीकरण द्वारा शीर्ष 5 अमेरिकी शेयरों के लिए 2020 वर्षों का ऐतिहासिक डेटा शामिल है। डेटासेट में निम्नलिखित 10 प्रतीक शामिल हैं- एएपीएल: एप्पल इंक।; AMZN: Amazon.com, Inc.; बीआरके-ए: बर्कशायर हैथवे इंक. (कक्षा ए); एफबी: फेसबुक, इंक।; GOOG: वर्णमाला इंक।; जेएनजे: जॉनसन एंड जॉनसन; एमए: मास्टरकार्ड शामिल; MSFT: Microsoft Corporation V: Visa Inc.; और WMT: वॉलमार्ट इंक।
प्रमुख डेटा फ़ील्ड में शामिल हैं
- ओपन: दिन के लिए कारोबार के शुरुआती मूल्य के रूप में
- उच्च: दिन के लिए व्यापार के रूप में उच्च मूल्य
- कम: दिन के लिए कारोबार के रूप में कम कीमत
- बंद करें: दिन के लिए ट्रेड किए गए बंद मूल्य के रूप में
- वॉल्यूम: दिन के लिए ट्रेडिंग वॉल्यूम
- एडजस्टेड क्लोज: दिन का स्प्लिट और डिविडेंड-एडजस्टेड क्लोजिंग प्राइस
- विभाजन अनुपात: प्रभावी तिथि पर शेयरों की नई और पुरानी संख्या का अनुपात
- लाभांश: नकद लाभांश भुगतान राशि
S3 लघु ब्याज और प्रतिभूति वित्त डेटा द्वारा प्रकाशित S3 पार्टनर्स. इस डेटासेट में निम्नलिखित फ़ील्ड हैं:

क्षेत्र	Description
व्यापार तिथि	दर के लिए प्रभावी तिथि
सुरक्षा आईडी	सुरक्षा पहचानकर्ताओं में सेडोल, आईएसआईएन, एफआईजीआई, टिकर, ब्लूमबर्ग आईडी शामिल हैं
नाम	सुरक्षा का नाम
प्रस्ताव दर	मौजूदा शॉर्ट पोजीशन के लिए भुगतान किया गया मार्केट कंपोजिट फाइनेंसिंग शुल्क
बोली दर	लंबे धारकों द्वारा ऋण पर मौजूदा शेयरों के लिए अर्जित बाजार समग्र उधार शुल्क
अंतिम दर	उस तारीख को उधार लिए गए वृद्धिशील शेयरों के लिए अर्जित बाजार संमिश्र ऋण शुल्क (हाजिर दर)
भीड़	मोमेंटम इंडिकेटर मार्केट फ्लोट के सापेक्ष दैनिक शॉर्टिंग और कवरिंग इवेंट को मापता है
लघु ब्याज	शेयरों की संख्या में व्यक्त वास्तविक समय कम ब्याज
लघु ब्याज काल्पनिक	लघु ब्याज * मूल्य (यूएसडी)
लघु ब्याज पीसीटी	इक्विटी फ्लोट के प्रतिशत के रूप में व्यक्त रीयल-टाइम लघु ब्याज
S3फ्लोट	शॉर्ट सेलिंग द्वारा बनाए गए सिंथेटिक लॉन्ग सहित व्यापार योग्य शेयरों की संख्या
S3SIPctFloat	वास्तविक समय लघु ब्याज प्रक्षेपण S3 फ्लोट द्वारा विभाजित
सांकेतिक उपलब्धता	S3 अनुमानित उपलब्ध उधार योग्य मात्रा
उपयोग	कुल उधार देने योग्य आपूर्ति से वास्तविक समय कम ब्याज विभाजित
डेज़टूकवर10डे	यह एक तरलता माप = लघु ब्याज / 10-दिवसीय औसत ADTV है
डेज़टूकवर30डे	यह एक तरलता माप = लघु ब्याज / 30-दिवसीय औसत ADTV है
डेज़टूकवर90डे	यह एक तरलता माप = लघु ब्याज / 90-दिवसीय औसत ADTV है
मूल एसआई	प्वाइंट इन टाइम शॉर्ट इंटरेस्ट

डेटा प्राप्त करने के लिए, आप पहले AWS डेटा एक्सचेंज में डेटासेट खोजेंगे और डेटासेट की सदस्यता लेंगे:

AWS लो कोड-नो कोड सेवाओं प्लेटोब्लॉकचेन डेटा इंटेलिजेंस के साथ निवेश प्रक्रिया में तेजी लाएं। लंबवत खोज. ऐ.

एक बार जब डेटासेट का प्रकाशक आपके सदस्यता अनुरोधों को स्वीकार कर लेता है, तो आपके पास अपनी S3 बकेट में डाउनलोड करने के लिए डेटासेट उपलब्ध होंगे:

चुनते हैं ऑटो-एक्सपोर्ट जॉब डेस्टिनेशन जोड़ें, S3 बकेट का विवरण प्रदान करें और डेटासेट डाउनलोड करें:

अल्फ़ा वेंटेज डेटासेट प्राप्त करने के लिए चरणों को दोहराएं। एक बार पूरा हो जाने पर, आपके पास अपने S3 बकेट में दोनों डेटासेट होंगे।

डाटा इंजीनियरिंग

एक बार डेटासेट आपके S3 बकेट में हो जाने के बाद, आप इसका उपयोग कर सकते हैं AWS ग्लू डेटाब्रयू डेटा को बदलने के लिए। AWS Glue DataBrew डेटा तैयार करने के कार्यों को स्वचालित करने के लिए 350 से अधिक पूर्व-निर्मित परिवर्तनों की पेशकश करता है (जैसे कि विसंगतियों को फ़िल्टर करना, प्रारूपों का मानकीकरण करना और अमान्य मानों को ठीक करना) अन्यथा हाथ से कोडित परिवर्तनों को लिखने के लिए दिनों या हफ्तों की आवश्यकता होगी।

AWS DataBrew में पूर्वानुमान के लिए समेकित क्यूरेटेड डेटासेट बनाने के लिए, नीचे दिए गए चरणों का पालन करें। विस्तृत जानकारी के लिए, कृपया इसे देखें ब्लॉग.

DataBrew डेटासेट बनाएं।
DataBrew डेटासेट को DataBrew प्रोजेक्ट में लोड करें।
DataBrew व्यंजनों का निर्माण करें।
DataBrew जॉब्स चलाएँ।

डेटाब्रू डेटासेट बनाएं: एडब्ल्यूएस ग्लू डेटाब्रू में, ए डाटासेट S3 बकेट से अपलोड किए गए डेटा का प्रतिनिधित्व करता है। हम दो DataBrew डेटासेट बनाएंगे - दिन के अंत में स्टॉक मूल्य और S3 लघु ब्याज दोनों के लिए। जब आप अपना डेटासेट बनाते हैं, तो आप केवल एक बार S3 कनेक्शन विवरण दर्ज करते हैं। उस बिंदु से, DataBrew आपके लिए अंतर्निहित डेटा तक पहुंच सकता है।

DataBrew डेटासेट को DataBrew प्रोजेक्ट्स में लोड करें: एडब्ल्यूएस ग्लू डेटाब्रू में, ए परियोजना आपके डेटा विश्लेषण और परिवर्तन प्रयासों का केंद्रबिंदु है। एक DataBrew प्रोजेक्ट DataBrew डेटासेट को एक साथ लाता है और आपको एक डेटा ट्रांसफ़ॉर्मेशन (DataBrew रेसिपी) विकसित करने में सक्षम बनाता है। यहाँ फिर से, हम दिन के अंत में स्टॉक मूल्य और S3 लघु ब्याज के लिए दो DataBrew प्रोजेक्ट बनाएंगे।

DataBrew व्यंजनों का निर्माण करें: DataBrew में, ए नुस्खा डेटा परिवर्तन चरणों का एक सेट है। आप इन चरणों को अपने डेटासेट पर लागू कर सकते हैं। उपयोग के मामले में, हम दो परिवर्तन बनाएंगे। पहला दिन के अंत के स्टॉक मूल्य टाइमस्टैम्प कॉलम के प्रारूप को बदल देगा ताकि डेटासेट को S3 लघु ब्याज से जोड़ा जा सके:

दूसरा परिवर्तन डेटा को क्यूरेट करता है, और इसका अंतिम चरण यह सुनिश्चित करता है कि हम डेटासेट को एकल क्यूरेटेड डेटासेट में शामिल करें। डेटा ट्रांसफ़ॉर्मेशन रेसिपी बनाने के बारे में अधिक जानकारी के लिए, इसे देखें ब्लॉग.

डेटाब्रू नौकरियां: DataBrew रेसिपी के निर्माण के बाद, आप पहले दिन के अंत में स्टॉक प्राइस DataBrew जॉब चला सकते हैं और उसके बाद S3 शॉर्ट इंटरेस्ट रेसिपी चला सकते हैं। इसका संदर्भ लें ब्लॉग एकल समेकित डेटासेट बनाने के लिए। अंतिम क्यूरेटेड डेटासेट को S3 बकेट में सेव करें।

एंड-टू-एंड डेटा इंजीनियरिंग वर्कफ़्लो इस तरह दिखेगा:

मशीन लर्निंग

डेटा-इंजीनियरिंग के बाद बनाए गए क्यूरेटेड डेटासेट के साथ, आप इसका उपयोग कर सकते हैं अमेज़ॅन सेजमेकर कैनवास अपना पूर्वानुमान मॉडल बनाने और पूर्वानुमान पर सुविधाओं के प्रभाव का विश्लेषण करने के लिए। अमेज़ॅन सेजमेकर कैनवास व्यापार उपयोगकर्ताओं को एक विज़ुअल पॉइंट-एंड-क्लिक इंटरफ़ेस प्रदान करता है जो उन्हें मॉडल बनाने और अपने दम पर सटीक एमएल पूर्वानुमान उत्पन्न करने की अनुमति देता है - बिना किसी एमएल अनुभव की आवश्यकता के या कोड की एक पंक्ति लिखने के लिए।

Amazon SageMaker कैनवास में समय श्रृंखला पूर्वानुमान मॉडल बनाने के लिए, नीचे दिए गए चरणों का पालन करें। विस्तृत जानकारी के लिए, इसे देखें ब्लॉग:

SageMaker कैनवास में क्यूरेटेड डेटासेट का चयन करें।
समय श्रृंखला पूर्वानुमान मॉडल बनाएँ।
परिणामों का विश्लेषण करें और महत्व को दर्शाएं।

समय श्रृंखला पूर्वानुमान मॉडल बनाएँ: एक बार जब आप डेटासेट का चयन कर लेते हैं, तो भविष्यवाणी करने के लिए लक्ष्य कॉलम चुनें। हमारे मामले में, यह स्टॉक टिकर की क्लोज कीमत होगी। SageMaker कैनवास स्वचालित रूप से पता लगाता है कि यह एक समय श्रृंखला पूर्वानुमान समस्या कथन है।

समय श्रृंखला पूर्वानुमान के लिए आपको मॉडल को निम्नानुसार कॉन्फ़िगर करना होगा। आइटम आईडी के लिए, स्टॉक टिकर नाम चुनें। याद रखें, हमारे डेटासेट में शीर्ष 10 शेयरों के लिए स्टॉक टिकर मूल्य हैं। टाइम स्टैम्प के लिए टाइमस्टैम्प कॉलम का चयन करें, और अंत में, उन दिनों की संख्या दर्ज करें, जिनका आप भविष्य में पूर्वानुमान करना चाहते हैं [पूर्वानुमान क्षितिज]।

अब आप मॉडल बनाने के लिए तैयार हैं। सैजमेकर कैनवस मॉडल बनाने के लिए दो विकल्प प्रदान करता है: क्विक बिल्ड और स्टैंडर्ड बिल्ड। हमारे मामले में, हम "मानक बिल्ड" का उपयोग करेंगे।

स्टैंडर्ड बिल्ड को मॉडल बनाने और उपयोग करने में लगभग तीन घंटे लगते हैं अमेज़न का पूर्वानुमान, अंतर्निहित पूर्वानुमान इंजन के रूप में एमएल पर आधारित एक समय श्रृंखला पूर्वानुमान सेवा। पूर्वानुमान एमएल अनुभव की आवश्यकता के बिना पारंपरिक और गहन शिक्षण मॉडल के मॉडल के माध्यम से अत्यधिक सटीक पूर्वानुमान बनाता है।

एक बार मॉडल बन जाने के बाद, अब आप मॉडल के प्रदर्शन (भविष्यवाणी की सटीकता) और सुविधा के महत्व की समीक्षा कर सकते हैं। जैसा कि नीचे दिए गए आंकड़े से देखा जा सकता है, मॉडल भीड़ और DaysToCover10Day को दो शीर्ष सुविधाओं के रूप में पहचानता है जो पूर्वानुमान मूल्यों को चलाते हैं। यह हमारे बाजार अंतर्ज्ञान के अनुरूप है, क्योंकि क्राउडिंग एक मोमेंटम इंडिकेटर है जो दैनिक शॉर्टिंग और कवरिंग इवेंट्स को मापता है, और नियर-टर्म शॉर्ट इंटरेस्ट एक लिक्विडिटी माप है, यह दर्शाता है कि निवेशक स्टॉक में कैसे तैनात हैं। गति और तरलता दोनों ही मूल्य अस्थिरता को बढ़ा सकते हैं।

यह परिणाम इंगित करता है कि इन दो विशेषताओं (या क्षेत्रों) का स्टॉक मूल्य आंदोलनों के साथ घनिष्ठ संबंध है और ऑनबोर्डिंग और आगे के विश्लेषण के लिए उच्च प्राथमिकता दी जा सकती है।

व्यापारिक सूचना

समय श्रृंखला पूर्वानुमान के संदर्भ में, की धारणा पीछे हटना मौजूदा ऐतिहासिक डेटा का उपयोग करके पूर्वानुमान पद्धति की सटीकता का आकलन करने की प्रक्रिया को संदर्भित करता है। प्रक्रिया आम तौर पर पुनरावृत्त होती है और ऐतिहासिक डेटा में मौजूद कई तिथियों पर दोहराई जाती है।

जैसा कि हम पहले ही चर्चा कर चुके हैं, सेजमेकर कैनवस अमेज़ॅन पूर्वानुमान का उपयोग समय-श्रृंखला पूर्वानुमान के लिए इंजन के रूप में करता है। पूर्वानुमान मॉडल निर्माण प्रक्रिया के एक भाग के रूप में एक बैकटेस्ट बनाता है। अब आप अमेज़न पूर्वानुमान में साइन इन करके पूर्वसूचक विवरण देख सकते हैं। मॉडल व्याख्यात्मकता पर गहरी समझ के लिए, इसे देखें ब्लॉग.

अमेज़ॅन पूर्वानुमान भारित निरपेक्ष प्रतिशत त्रुटि (WAPE), रूट माध्य वर्ग त्रुटि (RMSE), पूर्ण प्रतिशत त्रुटि (MAPE), और पूर्ण मापित त्रुटि (MASE) जैसे पूर्वसूचक मेट्रिक्स पर अतिरिक्त विवरण प्रदान करता है। आप अमेज़न पूर्वानुमान से पूर्वसूचक गुणवत्ता स्कोर निर्यात कर सकते हैं।

अमेज़ॅन पूर्वानुमान प्रदान किए गए समय श्रृंखला डेटासेट के लिए एक बैकटेस्ट चलाता है। बैकटेस्ट परिणाम का उपयोग करके डाउनलोड के लिए उपलब्ध हैं निर्यात backtest परिणाम बटन। निर्यात किए गए बैकटेस्ट परिणाम S3 बकेट में डाउनलोड किए जाते हैं।

अब हम Amazon QuickSight में बैकटेस्ट रिजल्ट्स प्लॉट करेंगे। Amazon QuickSight में बैकटेस्ट परिणामों की कल्पना करने के लिए, QuickSight से Amazon S3 में डेटासेट से कनेक्ट करें और एक विज़ुअलाइज़ेशन बनाएं।

क्लीन अप

इस समाधान में लीवरेज की गई AWS सेवाएँ प्रबंधित और प्रकृति में सर्वर रहित हैं। सेजमेकर कैनवस को लंबे समय तक चलने वाले एमएल प्रशिक्षण चलाने के लिए डिज़ाइन किया गया है और यह हमेशा चालू रहेगा। सुनिश्चित करें कि आपने स्पष्ट रूप से SageMaker कैनवास को लॉग ऑफ कर दिया है। कृपया देखें डॉक्स अधिक जानकारी के लिए.

निष्कर्ष

इस ब्लॉग पोस्ट में, हमने चर्चा की कि कैसे, एक संस्थागत संपत्ति प्रबंधक के रूप में, आप गैर-तकनीकी कर्मियों को प्रारंभिक डेटासेट स्क्रीनिंग को ऑफ़लोड करके बाहरी डेटासेट के मूल्यांकन में तेजी लाने के लिए AWS लो-कोड नो-कोड (LCNC) डेटा और AI सेवाओं का लाभ उठा सकते हैं। ऑनबोर्डिंग और आगे के विश्लेषण के लिए कौन से डेटासेट को प्राथमिकता दी जानी चाहिए, यह तय करने में आपकी सहायता के लिए यह प्रथम-पास विश्लेषण जल्दी से किया जा सकता है।

हमने चरण-दर-चरण प्रदर्शित किया कि कैसे एक डेटा विश्लेषक AWS डेटा एक्सचेंज के माध्यम से नया तृतीय-पक्ष डेटा प्राप्त कर सकता है, डेटा को प्रीप्रोसेस करने के लिए AWS Glue DataBrew नो-कोड ETL सेवाओं का उपयोग करता है और मूल्यांकन करता है कि डेटासेट में कौन सी विशेषताएं मॉडल के पूर्वानुमान पर सबसे अधिक प्रभाव डालती हैं। .

एक बार जब डेटा विश्लेषण-तैयार हो जाता है, तो एक विश्लेषक भविष्य कहनेवाला मॉडल बनाने, इसके फिट का मूल्यांकन करने और महत्वपूर्ण विशेषताओं की पहचान करने के लिए SageMaker कैनवास का उपयोग करता है। हमारे उदाहरण में, मॉडल के एमएपीई (.05) और डब्ल्यूएपीई (.045) ने एक अच्छे फिट का संकेत दिया और "क्राउडिंग" और "डेज़टूकवर10डे" को पूर्वानुमान पर सबसे बड़े प्रभाव के साथ डेटासेट में संकेतों के रूप में दिखाया। इस विश्लेषण ने निर्धारित किया कि कौन सा डेटा मॉडल को सबसे अधिक प्रभावित करता है और इसलिए आगे की जांच और आपके अल्फा संकेतों या जोखिम प्रबंधन प्रक्रिया में संभावित समावेशन के लिए प्राथमिकता दी जा सकती है। और उतना ही महत्वपूर्ण, व्याख्यात्मकता स्कोर इंगित करता है कि कौन सा डेटा पूर्वानुमान निर्धारित करने में अपेक्षाकृत कम भूमिका निभाता है और इसलिए आगे की जांच के लिए कम प्राथमिकता हो सकती है।

आपकी निवेश प्रक्रिया का समर्थन करने के लिए तृतीय-पक्ष वित्तीय डेटा की क्षमता का अधिक तेज़ी से मूल्यांकन करने के लिए, इसकी समीक्षा करें AWS डेटा एक्सचेंज पर उपलब्ध वित्तीय सेवा डेटा स्रोत, और दो डेटाब्रू और कैनवास एक कोशिश आज।

लेखक के बारे में

बोरिस लिट्विन प्रिंसिपल सॉल्यूशन आर्किटेक्ट है, जो फाइनेंशियल सर्विसेज इंडस्ट्री इनोवेशन के लिए जिम्मेदार है। वह क्वांट और फिनटेक के पूर्व संस्थापक हैं, जो व्यवस्थित निवेश के प्रति जुनूनी हैं।

मीनाक्षीसुंदरम थंडावरायण AWS के साथ एक वरिष्ठ AI/ML विशेषज्ञ हैं। वह उनकी एआई और एमएल यात्रा में हाई-टेक रणनीतिक खातों की मदद करता है। वह डेटा-संचालित एआई के बारे में बहुत भावुक हैं।

कैमिलो अनन्या यूके में स्थित AWS के साथ एक वरिष्ठ स्टार्टअप सॉल्यूशंस आर्किटेक्ट है। वह एक उत्साही टेक्नोलॉजिस्ट हैं जो किसी भी आकार के स्टार्टअप्स को बनाने और विकसित करने में मदद करते हैं।

डैन सिन्नरेइच एडब्ल्यूएस के साथ एक वरिष्ठ उत्पाद प्रबंधक है, जो एमएल के साथ बेहतर निर्णय लेने के लिए कंपनियों को सशक्त बनाने पर केंद्रित है। उन्होंने पूर्व में बड़े संस्थागत निवेशकों के लिए पोर्टफोलियो एनालिटिक्स प्लेटफॉर्म और मल्टी-एसेट क्लास रिस्क मॉडल बनाए थे।

समय टिकट: दिसम्बर 20/2022दिसम्बर 23/2022

समय टिकट: जनवरी 17, 2024

एडब्ल्यूएस लो कोड-नो कोड सेवाओं के साथ निवेश प्रक्रिया में तेजी लाएं

प्लेटो द्वारा पुनर्प्रकाशित

समाधान अवलोकन

डेटा अंतर्ग्रहण

डाटा इंजीनियरिंग

मशीन लर्निंग

व्यापारिक सूचना

क्लीन अप

निष्कर्ष

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

अमेज़ॅन सेजमेकर डेटा रैंगलर का उपयोग करके बड़े डेटासेट पर प्रशिक्षित मापदंडों को फिर से करें

अमेज़ॅन सेजमेकर डेटा रैंगलर के साथ टेक्स्ट डेटा में पैटर्न का पता लगाएं

श्वेतपत्र: स्वास्थ्य देखभाल और जीवन विज्ञान में मशीन लर्निंग सर्वोत्तम अभ्यास

Amazon पर Amp ने ग्राहक जुड़ाव बढ़ाने के लिए डेटा का इस्तेमाल कैसे किया, भाग 1: डेटा एनालिटिक्स प्लेटफ़ॉर्म बनाना

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा