बनाएं, साझा करें, तैनात करें: कैसे व्यापार विश्लेषक और डेटा वैज्ञानिक नो-कोड एमएल और अमेज़ॅन सेजमेकर कैनवस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके तेजी से बाजार में समय प्राप्त करते हैं। लंबवत खोज. ऐ.

बिल्ड, शेयर, डिप्लॉय: कैसे व्यापार विश्लेषक और डेटा वैज्ञानिक बिना कोड एमएल और अमेज़ॅन सेजमेकर कैनवास का उपयोग करके तेजी से समय-समय पर बाजार प्राप्त करते हैं

मशीन लर्निंग (एमएल) संगठनों को राजस्व बढ़ाने, व्यवसाय के विकास को चलाने और कई कार्यक्षेत्रों में मुख्य व्यावसायिक कार्यों को अनुकूलित करके लागत को कम करने में मदद करता है, जैसे कि मांग का पूर्वानुमान, क्रेडिट स्कोरिंग, मूल्य निर्धारण, ग्राहक मंथन की भविष्यवाणी करना, अगले सर्वोत्तम प्रस्तावों की पहचान करना, देर से शिपमेंट की भविष्यवाणी करना, और विनिर्माण गुणवत्ता में सुधार। पारंपरिक एमएल विकास चक्र में महीनों लगते हैं और दुर्लभ डेटा विज्ञान और एमएल इंजीनियरिंग कौशल की आवश्यकता होती है। एमएल मॉडल के लिए विश्लेषकों के विचार अक्सर डेटा साइंस टीम बैंडविड्थ की प्रतीक्षा में लंबे बैकलॉग में बैठते हैं, जबकि डेटा वैज्ञानिक अधिक जटिल एमएल परियोजनाओं पर ध्यान केंद्रित करते हैं जिनके लिए उनके पूर्ण कौशल की आवश्यकता होती है।

इस गतिरोध को तोड़ने में मदद करने के लिए, हमने पेश किया अमेज़न सेजमेकर कैनवास, एक नो-कोड एमएल समाधान जो कंपनियों को एमएल समाधानों की डिलीवरी को घंटों या दिनों तक तेज करने में मदद कर सकता है। सेजमेकर कैनवास विश्लेषकों को डेटा लेक, डेटा वेयरहाउस और ऑपरेशनल डेटा स्टोर में उपलब्ध डेटा का आसानी से उपयोग करने में सक्षम बनाता है; एमएल मॉडल का निर्माण; और उनका उपयोग अंतःक्रियात्मक रूप से भविष्यवाणियां करने और बल्क डेटासेट पर बैच स्कोरिंग के लिए करें—सभी बिना कोड की एक पंक्ति लिखे।

इस पोस्ट में, हम दिखाते हैं कि कैसे सेजमेकर कैनवास डेटा वैज्ञानिकों और व्यापार विश्लेषकों के बीच सहयोग को सक्षम बनाता है, बाजार में तेजी से समय प्राप्त करता है और एमएल समाधानों के विकास में तेजी लाता है। विश्लेषकों को एमएल विशेषज्ञ बनने की आवश्यकता के बिना सेजमेकर कैनवास में अपना स्वयं का नो-कोड एमएल कार्यक्षेत्र मिलता है। इसके बाद विश्लेषक कुछ क्लिक के साथ अपने मॉडल कैनवास से साझा कर सकते हैं, जिसके साथ डेटा वैज्ञानिक काम कर सकेंगे अमेज़ॅन सैजमेकर स्टूडियो, एक एंड-टू-एंड एमएल एकीकृत विकास पर्यावरण (आईडीई)। एक साथ काम करके, व्यापार विश्लेषक अपने डोमेन ज्ञान और प्रयोग के परिणाम ला सकते हैं, जबकि डेटा वैज्ञानिक प्रभावी ढंग से पाइपलाइन बना सकते हैं और प्रक्रिया को सुव्यवस्थित कर सकते हैं।

आइए इस बात पर गहराई से विचार करें कि कार्यप्रवाह कैसा दिखेगा।

व्यापार विश्लेषक एक मॉडल बनाते हैं, फिर उसे साझा करते हैं

यह समझने के लिए कि कैसे सेजमेकर कैनवास व्यापार विश्लेषकों और डेटा वैज्ञानिकों (या एमएल इंजीनियरों) के बीच सहयोग को सरल बनाता है, हम पहले एक व्यापार विश्लेषक के रूप में प्रक्रिया का रुख करते हैं। आरंभ करने से पहले, देखें अमेज़ॅन सेजमेकर कैनवास की घोषणा - व्यापार विश्लेषकों के लिए एक दृश्य, बिना कोड मशीन सीखने की क्षमता सेजमेकर कैनवास के साथ मॉडल के निर्माण और परीक्षण के निर्देशों के लिए।

इस पोस्ट के लिए, हम के एक संशोधित संस्करण का उपयोग करते हैं क्रेडिट कार्ड धोखाधड़ी का पता लगाने वाला डेटासेट कागल से, एक द्विआधारी वर्गीकरण समस्या के लिए एक प्रसिद्ध डेटासेट। डेटासेट मूल रूप से अत्यधिक असंतुलित है - इसमें बहुत कम प्रविष्टियाँ हैं जिन्हें एक नकारात्मक वर्ग (विसंगत लेनदेन) के रूप में वर्गीकृत किया गया है। लक्ष्य सुविधा वितरण के बावजूद, हम अभी भी इस डेटासेट का उपयोग कर सकते हैं, क्योंकि सेजमेकर कैनवास इस असंतुलन को संभालता है क्योंकि यह एक मॉडल को स्वचालित रूप से प्रशिक्षित और ट्यून करता है। इस डेटासेट में लगभग 9 मिलियन सेल होते हैं। आप भी डाउनलोड कर सकते हैं इस डेटासेट का छोटा संस्करण. डेटासेट का आकार लगभग 500,000 कोशिकाओं पर बहुत छोटा है, क्योंकि यह बेतरतीब ढंग से कम-नमूना किया गया है और फिर यह सुनिश्चित करने के लिए SMOTE तकनीक के साथ अधिक-नमूना किया गया है कि इस प्रक्रिया के दौरान यथासंभव कम जानकारी खो जाती है। सेजमेकर कैनवास फ्री टियर के तहत इस घटे हुए डेटासेट के साथ पूरे प्रयोग को चलाने पर आपको $0 का खर्च आता है।

मॉडल के निर्माण के बाद, विश्लेषक इसका उपयोग या तो व्यक्तिगत अनुरोधों के लिए या थोक में संपूर्ण इनपुट डेटासेट के लिए सीधे कैनवास में पूर्वानुमान लगाने के लिए कर सकते हैं।

पूर्वानुमान उत्पन्न करने के लिए प्रशिक्षित मॉडल का उपयोग करें

कैनवास स्टैंडर्ड बिल्ड के साथ निर्मित मॉडल को एक बटन के क्लिक पर आसानी से डेटा वैज्ञानिकों और एमएल इंजीनियरों के साथ साझा किया जा सकता है जो सेजमेकर स्टूडियो का उपयोग करते हैं। यह डेटा वैज्ञानिक को आपके द्वारा बनाए गए मॉडल के प्रदर्शन को सत्यापित करने और प्रतिक्रिया प्रदान करने की अनुमति देता है। एमएल इंजीनियर आपके मॉडल को चुन सकते हैं और इसे मौजूदा वर्कफ़्लो और आपकी कंपनी और आपके ग्राहकों के लिए उपलब्ध उत्पादों के साथ एकीकृत कर सकते हैं। ध्यान दें कि, लेखन के समय, कैनवास त्वरित बिल्ड या समय श्रृंखला पूर्वानुमान मॉडल के साथ निर्मित मॉडल को साझा करना संभव नहीं है।

कैनवास UI के माध्यम से एक मॉडल साझा करना सीधा है:

  1. आपके द्वारा बनाए गए मॉडल दिखाने वाले पृष्ठ पर, एक मॉडल चुनें।
  2. चुनें Share.विश्लेषण टैब से प्रशिक्षित मॉडल साझा करें
  3. उस मॉडल के एक या अधिक संस्करण चुनें, जिसे आप साझा करना चाहते हैं।
  4. वैकल्पिक रूप से, एक नोट शामिल करें जिसमें मॉडल या आपके द्वारा खोजी जा रही सहायता के बारे में अधिक संदर्भ दिया गया हो।
  5. चुनें सेजमेकर स्टूडियो लिंक बनाएं.मॉडल को सेजमेकर स्टूडियो के साथ साझा करें
  6. जेनरेट किए गए लिंक को कॉपी करें।जनरेट किए गए लिंक को कॉपी करें

और बस! अब आप स्लैक, ईमेल या अपनी पसंद के किसी अन्य तरीके से अपने सहकर्मियों के साथ लिंक साझा कर सकते हैं। आपके मॉडल तक पहुंचने के लिए डेटा वैज्ञानिक को उसी सेजमेकर स्टूडियो डोमेन में होना चाहिए, इसलिए सुनिश्चित करें कि आपके संगठन व्यवस्थापक के साथ भी ऐसा ही हो।

स्लैक संदेश या ईमेल भेजकर मॉडल साझा करें

डेटा वैज्ञानिक सेजमेकर स्टूडियो से मॉडल की जानकारी प्राप्त करते हैं

अब, एक डेटा वैज्ञानिक या एमएल इंजीनियर की भूमिका निभाते हैं, और सेजमेकर स्टूडियो का उपयोग करके चीजों को उनके दृष्टिकोण से देखते हैं।

विश्लेषक द्वारा साझा किया गया लिंक हमें सेजमेकर स्टूडियो में ले जाता है, जो एंड-टू-एंड एमएल वर्कफ़्लो के लिए पहला क्लाउड-आधारित आईडीई है।

मॉडल का अवलोकन दिखाएं जैसा कि सेजमेकर स्टूडियो में देखा गया है

टैब स्वचालित रूप से खुलता है, और सेजमेकर कैनवास में विश्लेषक द्वारा बनाए गए मॉडल का एक सिंहावलोकन दिखाता है। आप जल्दी से मॉडल का नाम, एमएल समस्या प्रकार, मॉडल संस्करण और किस उपयोगकर्ता ने मॉडल बनाया (कैनवास यूजर आईडी के तहत) देख सकते हैं। आपके पास इनपुट डेटासेट और सेजमेकर द्वारा उत्पादित सर्वोत्तम मॉडल के बारे में विवरण तक पहुंच है। हम उस पोस्ट में बाद में गोता लगाएंगे।

पर इनपुट डेटासेट टैब पर, आप स्रोत से इनपुट डेटासेट तक डेटा प्रवाह भी देख सकते हैं। इस मामले में, केवल एक डेटा स्रोत का उपयोग किया जाता है और कोई जॉइन ऑपरेशन लागू नहीं किया गया है, इसलिए एक एकल स्रोत दिखाया गया है। आप डेटासेट के बारे में आंकड़ों और विवरणों का विश्लेषण चुनकर कर सकते हैं डेटा अन्वेषण नोटबुक खोलें. यह नोटबुक आपको उस डेटा का पता लगाने देती है जो मॉडल को प्रशिक्षित करने से पहले उपलब्ध था, और इसमें लक्ष्य चर का विश्लेषण, इनपुट डेटा का एक नमूना, कॉलम और पंक्तियों के आंकड़े और विवरण, साथ ही डेटा वैज्ञानिक के लिए अन्य उपयोगी जानकारी शामिल है। डेटासेट के बारे में अधिक जानें। इस रिपोर्ट के बारे में अधिक जानने के लिए देखें डेटा अन्वेषण रिपोर्ट.

पूर्ण किए गए कार्यों और कार्य की जानकारी के साथ मॉडल का अवलोकन दिखाएं

इनपुट डेटासेट का विश्लेषण करने के बाद, मॉडल ओवरव्यू के दूसरे टैब पर चलते हैं, ऑटोएमएल जॉब. इस टैब में ऑटोएमएल जॉब का विवरण होता है जब आपने सेजमेकर कैनवास में स्टैंडर्ड बिल्ड विकल्प का चयन किया था।

सेजमेकर कैनवास के नीचे की ऑटोएमएल तकनीक एमएल मॉडल के निर्माण की भारी भारोत्तोलन को समाप्त करती है। यह आपको पूर्ण नियंत्रण और दृश्यता बनाए रखने की अनुमति देते हुए, स्वचालित दृष्टिकोण का उपयोग करके आपके डेटा के आधार पर सर्वश्रेष्ठ एमएल मॉडल को स्वचालित रूप से बनाता है, प्रशिक्षित करता है और ट्यून करता है। जेनरेट किए गए उम्मीदवार मॉडल के साथ-साथ ऑटोएमएल प्रक्रिया के दौरान उपयोग किए जाने वाले हाइपर-पैरामीटर पर यह दृश्यता में निहित है उम्मीदवार पीढ़ी नोटबुक, जो इस टैब पर उपलब्ध है।

RSI ऑटोएमएल जॉब टैब में ऑटोएमएल प्रक्रिया के हिस्से के रूप में निर्मित प्रत्येक मॉडल की एक सूची भी होती है, जिसे F1 उद्देश्य मीट्रिक द्वारा क्रमबद्ध किया जाता है। शुरू की गई प्रशिक्षण नौकरियों में से सर्वश्रेष्ठ मॉडल को उजागर करने के लिए, हरे वृत्त के साथ एक टैग का उपयोग किया जाता है सर्वश्रेष्ठ मॉडल स्तंभ। आप प्रशिक्षण और मूल्यांकन चरण के दौरान उपयोग किए जाने वाले अन्य मेट्रिक्स की भी आसानी से कल्पना कर सकते हैं, जैसे सटीकता स्कोर और वक्र के तहत क्षेत्र (एयूसी)। ऑटोएमएल जॉब के दौरान आप जिन मॉडलों को प्रशिक्षित कर सकते हैं, उनके बारे में अधिक जानने के लिए और प्रशिक्षित मॉडल के प्रदर्शन का मूल्यांकन करने के लिए उपयोग की जाने वाली मेट्रिक्स का संदर्भ लें। मॉडल समर्थन, मीट्रिक और सत्यापन.

मॉडल के बारे में अधिक जानने के लिए, अब आप सर्वश्रेष्ठ मॉडल पर राइट-क्लिक कर सकते हैं और चुन सकते हैं मॉडल विवरण में खोलें. वैकल्पिक रूप से, आप चुन सकते हैं सर्वश्रेष्ठ मॉडल के शीर्ष पर लिंक मॉडल अवलोकन जिस अनुभाग में आप पहली बार गए थे।

फ़ीचर महत्व और मीट्रिक के साथ मॉडल विवरण

मॉडल विवरण पृष्ठ में इस इनपुट डेटा के साथ सबसे अच्छा प्रदर्शन करने वाले मॉडल के बारे में उपयोगी जानकारी की अधिकता है। आइए पहले पृष्ठ के शीर्ष पर सारांश पर ध्यान दें। पिछले उदाहरण के स्क्रीनशॉट से पता चलता है कि सैकड़ों मॉडल प्रशिक्षण में से एक XGBoost मॉडल ने इनपुट डेटासेट पर सबसे अच्छा प्रदर्शन किया। इस लेखन के समय, सेजमेकर कैनवास तीन प्रकार के एमएल एल्गोरिदम को प्रशिक्षित कर सकता है: रैखिक शिक्षार्थी, एक्सजीबीओस्ट, और एक बहुपरत परसेप्ट्रॉन (एमएलपी), प्रत्येक प्रीप्रोसेसिंग पाइपलाइनों और हाइपर-पैरामीटर की एक विस्तृत विविधता के साथ। प्रत्येक एल्गोरिथम के बारे में अधिक जानने के लिए, देखें समर्थित एल्गोरिदम पृष्ठ.

सेजमेकर में के स्केलेबल और कुशल कार्यान्वयन के लिए एक व्याख्यात्मक कार्यक्षमता भी शामिल है कर्नेलशैप, सहकारी खेल सिद्धांत के क्षेत्र से एक शैप्ले मूल्य की अवधारणा पर आधारित है जो प्रत्येक विशेषता को एक विशेष भविष्यवाणी के लिए एक महत्वपूर्ण मूल्य प्रदान करता है। यह पारदर्शिता की अनुमति देता है कि मॉडल अपनी भविष्यवाणियों पर कैसे पहुंचा, और यह सुविधा महत्व को परिभाषित करने के लिए बहुत उपयोगी है। फीचर महत्व सहित एक पूर्ण व्याख्यात्मक रिपोर्ट पीडीएफ, नोटबुक, या कच्चे डेटा प्रारूप में डाउनलोड करने योग्य है। उस रिपोर्ट में, मेट्रिक्स का एक व्यापक सेट दिखाया गया है और साथ ही AutoML कार्य के दौरान उपयोग किए जाने वाले हाइपर-पैरामीटर की पूरी सूची भी दिखाई गई है। इस बारे में अधिक जानने के लिए कि कैसे सेजमेकर ऑटोएमएल समाधानों और मानक एमएल एल्गोरिदम के लिए एकीकृत व्याख्यात्मकता उपकरण प्रदान करता है, देखें अमेज़ॅन सेजमेकर ऑटोपायलट का उपयोग करके एकीकृत व्याख्यात्मक टूल का उपयोग करें और मॉडल की गुणवत्ता में सुधार करें.

अंत में, इस दृश्य में अन्य टैब प्रदर्शन विवरण (भ्रम मैट्रिक्स, सटीक रिकॉल वक्र, आरओसी वक्र), इनपुट के लिए उपयोग की जाने वाली कलाकृतियों और ऑटोएमएल नौकरी के दौरान उत्पन्न, और नेटवर्क विवरण के बारे में जानकारी दिखाते हैं।

इस बिंदु पर, डेटा वैज्ञानिक के पास दो विकल्प हैं: सीधे मॉडल को तैनात करें, या एक प्रशिक्षण पाइपलाइन बनाएं जिसे शेड्यूल किया जा सकता है या मैन्युअल रूप से या स्वचालित रूप से ट्रिगर किया जा सकता है। निम्नलिखित अनुभाग दोनों विकल्पों में कुछ अंतर्दृष्टि प्रदान करते हैं।

मॉडल को सीधे तैनात करें

यदि डेटा वैज्ञानिक ऑटोएमएल नौकरी द्वारा प्राप्त परिणामों से संतुष्ट हैं, तो वे सीधे मॉडल को तैनात कर सकते हैं मॉडल विवरण पृष्ठ। यह चुनना जितना आसान है मॉडल तैनात करें मॉडल के नाम के आगे।

अतिरिक्त मॉडल विवरण, जहां से मॉडल को परिनियोजित करना है

सेजमेकर आपको परिनियोजन के लिए दो विकल्प दिखाता है: एक वास्तविक समय समापन बिंदु, द्वारा संचालित अमेज़ॅन सेजमेकर एंडपॉइंट्स, और बैच अनुमान, द्वारा संचालित अमेज़न SageMaker बैच परिवर्तन.

AutoML से पूर्वानुमान लॉन्च करने का विकल्प

सेजमेकर अनुमान के अन्य तरीके भी प्रदान करता है। अधिक जानने के लिए देखें अनुमान के लिए मॉडल तैनात करें.

रीयल-टाइम पूर्वानुमान मोड को सक्षम करने के लिए, आप बस समापन बिंदु को एक नाम, एक आवृत्ति प्रकार और एक आवृत्ति गणना देते हैं। चूंकि इस मॉडल को भारी गणना संसाधनों की आवश्यकता नहीं है, आप 1 की प्रारंभिक गणना के साथ सीपीयू-आधारित इंस्टेंस का उपयोग कर सकते हैं। आप उपलब्ध विभिन्न प्रकार के उदाहरणों और उनके विनिर्देशों के बारे में अधिक जान सकते हैं। अमेज़ॅन सेजमेकर मूल्य निर्धारण पृष्ठ (में ऑन-डिमांड मूल्य निर्धारण अनुभाग, चुनें रीयल-टाइम अनुमान टैब)। यदि आप नहीं जानते कि आपको अपने परिनियोजन के लिए कौन सा उदाहरण चुनना चाहिए, तो आप सेजमेकर से अपने KPI के अनुसार अपने लिए सबसे अच्छा उदाहरण खोजने के लिए भी कह सकते हैं। सेजमेकर अनुमान अनुशंसाकर्ता. आप इस संबंध में अतिरिक्त वैकल्पिक पैरामीटर भी प्रदान कर सकते हैं कि आप समापन बिंदु से अनुरोध और प्रतिक्रिया डेटा कैप्चर करना चाहते हैं या नहीं। यदि आप योजना बना रहे हैं तो यह उपयोगी साबित हो सकता है अपने मॉडल की निगरानी करना. आप अपनी प्रतिक्रिया के हिस्से के रूप में यह भी चुन सकते हैं कि आप कौन सी सामग्री प्रदान करना चाहते हैं—चाहे वह केवल भविष्यवाणी हो या भविष्यवाणी की संभावना, सभी वर्गों की संभावना, और लक्ष्य लेबल।

एक बार में इनपुट के पूरे सेट के लिए भविष्यवाणियां प्राप्त करने वाले बैच स्कोरिंग जॉब को चलाने के लिए, आप बैच ट्रांसफॉर्म जॉब को लॉन्च कर सकते हैं एडब्ल्यूएस प्रबंधन कंसोल या सेजमेकर पायथन एसडीके के माध्यम से। बैच परिवर्तन के बारे में अधिक जानने के लिए, देखें बैच ट्रांसफॉर्म का प्रयोग करें और उदाहरण नोटबुक।

एक प्रशिक्षण पाइपलाइन को परिभाषित करें

एमएल मॉडल बहुत कम ही, यदि कभी भी, स्थिर और अपरिवर्तनीय माने जा सकते हैं, क्योंकि वे उस आधार रेखा से बहाव करते हैं जिस पर उन्हें प्रशिक्षित किया गया है। वास्तविक दुनिया का डेटा समय के साथ विकसित होता है, और इससे अधिक पैटर्न और अंतर्दृष्टि निकलती है, जो ऐतिहासिक डेटा पर प्रशिक्षित मूल मॉडल द्वारा कैप्चर की जा सकती है या नहीं। इस समस्या को हल करने के लिए, आप एक प्रशिक्षण पाइपलाइन स्थापित कर सकते हैं जो आपके मॉडल को उपलब्ध नवीनतम डेटा के साथ स्वचालित रूप से फिर से प्रशिक्षित करती है।

इस पाइपलाइन को परिभाषित करने में, डेटा वैज्ञानिक के विकल्पों में से एक एक बार फिर प्रशिक्षण पाइपलाइन के लिए ऑटोएमएल का उपयोग करना है। आप से create_auto_ml_job() API को लागू करके प्रोग्रामेटिक रूप से AutoML जॉब लॉन्च कर सकते हैं एडब्ल्यूएस Boto3 एसडीके. आप इस ऑपरेशन को an . से कॉल कर सकते हैं AWS लाम्बा एक के भीतर समारोह AWS स्टेप फ़ंक्शंस वर्कफ़्लो, या लैम्ब्डास्टेप इन . से अमेज़न SageMaker पाइपलाइन.

वैकल्पिक रूप से, डेटा वैज्ञानिक एक संपूर्ण प्रशिक्षण पाइपलाइन को परिभाषित करने के लिए AutoML नौकरी से प्राप्त ज्ञान, कलाकृतियों और हाइपर-पैरामीटर का उपयोग कर सकते हैं। आपको निम्नलिखित संसाधनों की आवश्यकता है:

  • उपयोग के मामले के लिए सबसे अच्छा काम करने वाला एल्गोरिदम - आपने यह जानकारी कैनवास-जनरेटेड मॉडल के सारांश से पहले ही प्राप्त कर ली है। इस उपयोग के मामले के लिए, यह XGBoost बिल्ट-इन एल्गोरिथम है। सेजमेकर के साथ XGBoost एल्गोरिदम को प्रशिक्षित करने के लिए सेजमेकर पायथन एसडीके का उपयोग करने के निर्देशों के लिए, देखें सेजमेकर पायथन एसडीके के साथ XGBoost का उपयोग करें.
    कैनवास नौकरी के साथ प्रशिक्षित एल्गोरिदम के बारे में जानकारी
  • AutoML जॉब द्वारा व्युत्पन्न हाइपरपैरामीटर - ये में उपलब्ध हैं व्याख्या करने योग्य अनुभाग। सेजमेकर पायथन एसडीके के साथ प्रशिक्षण कार्य को परिभाषित करते समय आप उन्हें इनपुट के रूप में उपयोग कर सकते हैं।
    मॉडल हाइपरपैरामीटर
  • आर्टिफ़ैक्ट्स अनुभाग में प्रदान किया गया फ़ीचर इंजीनियरिंग कोड - आप इस कोड का उपयोग प्रशिक्षण से पहले डेटा को प्रीप्रोसेस करने के लिए कर सकते हैं (उदाहरण के लिए, अमेज़ॅन सेजमेकर प्रोसेसिंग के माध्यम से), या अनुमान से पहले (उदाहरण के लिए, सेजमेकर इंट्रेंस पाइपलाइन के हिस्से के रूप में)।
    फ़ीचर इंजीनियरिंग कोड का S3 URI

आप इन संसाधनों को सेजमेकर पाइपलाइन के हिस्से के रूप में जोड़ सकते हैं। हम इस पोस्ट में कार्यान्वयन विवरण को छोड़ देते हैं - इस विषय पर आने वाली अधिक सामग्री के लिए बने रहें।

निष्कर्ष

सेजमेकर कैनवास आपको बिना किसी कोड को लिखे भविष्यवाणी उत्पन्न करने के लिए एमएल का उपयोग करने देता है। एक व्यापार विश्लेषक स्वायत्त रूप से स्थानीय डेटासेट के साथ-साथ पहले से संग्रहीत डेटा के साथ इसका उपयोग करना शुरू कर सकता है अमेज़न सरल भंडारण सेवा (अमेज़न S3), अमेज़न रेडशिफ्ट, या स्नोफ्लेक। कुछ ही क्लिक के साथ, वे अपने डेटासेट तैयार कर सकते हैं और उसमें शामिल हो सकते हैं, अनुमानित सटीकता का विश्लेषण कर सकते हैं, सत्यापित कर सकते हैं कि कौन से कॉलम प्रभावशाली हैं, सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल को प्रशिक्षित करते हैं, और नए व्यक्ति या बैच पूर्वानुमान उत्पन्न करते हैं, बिना किसी विशेषज्ञ डेटा वैज्ञानिक को खींचने की आवश्यकता के। फिर, आवश्यकतानुसार, वे मॉडल को डेटा वैज्ञानिकों या एमएलओपीएस इंजीनियरों की एक टीम के साथ साझा कर सकते हैं, जो मॉडल को सेजमेकर स्टूडियो में आयात करते हैं, और उत्पादन समाधान देने के लिए विश्लेषक के साथ काम करते हैं।

व्यावसायिक विश्लेषक स्वतंत्र रूप से एमएल में डिग्री के बिना और कोड की एक भी पंक्ति लिखे बिना अपने डेटा से अंतर्दृष्टि प्राप्त कर सकते हैं। डेटा वैज्ञानिकों के पास अब अधिक चुनौतीपूर्ण परियोजनाओं पर काम करने के लिए अतिरिक्त समय हो सकता है जो एआई और एमएल के अपने व्यापक ज्ञान का बेहतर उपयोग कर सकते हैं।

हमारा मानना ​​है कि यह नया सहयोग आपके व्यवसाय के लिए कई अधिक शक्तिशाली एमएल समाधान बनाने का द्वार खोलता है। अब आपके पास मूल्यवान व्यावसायिक अंतर्दृष्टि उत्पन्न करने वाले विश्लेषक हैं, जबकि डेटा वैज्ञानिकों और एमएल इंजीनियरों को आवश्यकतानुसार परिष्कृत, ट्यून और विस्तार करने में सहायता करते हैं।

अतिरिक्त संसाधन


लेखक के बारे में

बनाएं, साझा करें, तैनात करें: कैसे व्यापार विश्लेषक और डेटा वैज्ञानिक नो-कोड एमएल और अमेज़ॅन सेजमेकर कैनवस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके तेजी से बाजार में समय प्राप्त करते हैं। लंबवत खोज. ऐ.डेविड गैलीटेली ईएमईए क्षेत्र में एआई/एमएल के लिए विशेषज्ञ समाधान आर्किटेक्ट हैं। वह ब्रुसेल्स में स्थित है और पूरे बेनेलक्स में ग्राहकों के साथ मिलकर काम करता है। वह बहुत छोटा था, जब से वह 7 साल की उम्र में कोड करना शुरू कर दिया था, तब से वह एक डेवलपर रहा है, उसने विश्वविद्यालय में एआई/एमएल सीखना शुरू कर दिया था, और तब से इसके साथ प्यार हो गया है।

बनाएं, साझा करें, तैनात करें: कैसे व्यापार विश्लेषक और डेटा वैज्ञानिक नो-कोड एमएल और अमेज़ॅन सेजमेकर कैनवस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके तेजी से बाजार में समय प्राप्त करते हैं। लंबवत खोज. ऐ.मार्क रॉय AWS के लिए एक प्रिंसिपल मशीन लर्निंग आर्किटेक्ट है, जो ग्राहकों को AI / ML समाधान तैयार करने और बनाने में मदद करता है। कंप्यूटर के विज़न, डीप लर्निंग और एंटरप्राइज़ में ML स्केलिंग में प्राथमिक रुचि के साथ, मार्क का काम एमएल उपयोग के मामलों की एक विस्तृत श्रृंखला को कवर करता है। उन्होंने बीमा, वित्तीय सेवाओं, मीडिया और मनोरंजन, स्वास्थ्य सेवा, उपयोगिताओं और विनिर्माण सहित कई उद्योगों में कंपनियों की मदद की है। मार्क में छह AWS प्रमाणपत्र हैं, जिनमें ML विशेषता प्रमाणन भी शामिल है। AWS में शामिल होने से पहले, मार्क 25 साल से अधिक के लिए एक वास्तुकार, डेवलपर और प्रौद्योगिकी नेता थे, जिसमें वित्तीय सेवाओं में 19 साल शामिल थे।

समय टिकट:

से अधिक AWS मशीन लर्निंग