Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

Amazon SageMaker जम्पस्टार्ट समाधानों में मशीन लर्निंग के माध्यम से व्यवसाय की समस्याओं को शुरू से अंत तक हल करें

अमेज़न SageMaker जम्पस्टार्ट मशीन लर्निंग (एमएल) के साथ शुरुआत करने में आपकी मदद करने के लिए विभिन्न प्रकार की समस्या के लिए पूर्व-प्रशिक्षित, ओपन-सोर्स मॉडल प्रदान करता है। जम्पस्टार्ट समाधान टेम्पलेट भी प्रदान करता है जो सामान्य उपयोग के मामलों के लिए बुनियादी ढांचा स्थापित करता है, और एमएल के लिए निष्पादन योग्य उदाहरण नोटबुक के साथ अमेज़न SageMaker.

एक व्यावसायिक उपयोगकर्ता के रूप में, आपको जम्पस्टार्ट समाधानों के साथ निम्नलिखित कार्य करने को मिलते हैं:

  • समाधानों का अन्वेषण करें और मूल्यांकन करें कि आपकी व्यावसायिक आवश्यकताओं के लिए कौन से अच्छे मेल हैं।
  • एक क्लिक के साथ समाधान लॉन्च करें अमेज़ॅन सैजमेकर स्टूडियो. यह लॉन्च करता है a एडब्ल्यूएस CloudFormation आवश्यक संसाधन बनाने के लिए टेम्पलेट।
  • अंतर्निहित नोटबुक और मॉडल संपत्तियों तक पहुंच के साथ अपनी आवश्यकताओं को पूरा करने के लिए समाधान संशोधित करें।
  • एक बार किए गए अधिग्रहीत संसाधनों को हटा दें।

यह पोस्ट उन पांच एमएल समाधानों पर केंद्रित है जिन्हें हाल ही में पांच अलग-अलग व्यावसायिक चुनौतियों का समाधान करने के लिए जोड़ा गया था। इस लेखन के रूप में, जम्पस्टार्ट वित्तीय लेनदेन में धोखाधड़ी का पता लगाने से लेकर हस्तलेखन को पहचानने तक अलग-अलग 23 व्यावसायिक समाधान प्रदान करता है। जम्पस्टार्ट के माध्यम से पेश किए जाने वाले समाधानों की संख्या नियमित आधार पर बढ़ती जाती है क्योंकि इसमें अधिक समाधान जोड़े जाते हैं।

समाधान अवलोकन

पांच नए समाधान इस प्रकार हैं:

  • मूल्य अनुकूलन - अपने व्यवसाय के उद्देश्य को प्राप्त करने के लिए अपने उत्पाद या सेवा की कीमत निर्धारित करने के लिए इष्टतम निर्णय लेने में आपकी मदद करने के लिए अनुकूलन योग्य एमएल मॉडल प्रदान करता है, जैसे राजस्व, लाभ, या अन्य कस्टम मेट्रिक्स को अधिकतम करना।
  • पक्षी प्रजातियों की भविष्यवाणी - दिखाता है कि आप ऑब्जेक्ट डिटेक्शन मॉडल को कैसे प्रशिक्षित और फाइन-ट्यून कर सकते हैं। यह प्रशिक्षण छवि वृद्धि के माध्यम से मॉडल ट्यूनिंग को प्रदर्शित करता है, और प्रशिक्षण कार्य के पुनरावृत्तियों (युगों) में होने वाले सटीकता सुधारों को चार्ट करता है।
  • फेफड़े के कैंसर से बचने की भविष्यवाणी - दिखाता है कि आप किसी मरीज के फेफड़ों के कैंसर से बचने की संभावना का अनुमान लगाने के लिए एक एमएल एल्गोरिथम में 2डी और 3डी रेडियोमिक विशेषताओं और रोगी जनसांख्यिकी को कैसे फीड कर सकते हैं। इस भविष्यवाणी के परिणाम प्रदाताओं को उचित सक्रिय उपाय करने में मदद कर सकते हैं।
  • वित्तीय भुगतान वर्गीकरण - लेन-देन की जानकारी के आधार पर वित्तीय लेनदेन को वर्गीकृत करने के लिए एमएल मॉडल को प्रशिक्षित और तैनात करने का तरीका दर्शाता है। आप इस समाधान का उपयोग धोखाधड़ी का पता लगाने, वैयक्तिकरण, या विसंगति का पता लगाने में एक मध्यवर्ती चरण के रूप में भी कर सकते हैं।
  • मोबाइल फोन ग्राहकों के लिए मंथन की भविष्यवाणी - मोबाइल कॉल ट्रांजेक्शन डेटासेट का उपयोग करके एक मंथन भविष्यवाणी मॉडल को जल्दी से विकसित करने का तरीका दर्शाता है। यह उन उपयोगकर्ताओं के लिए एक सरल उदाहरण है जो ML में नए हैं।

.. पूर्वापेक्षाएँ

इन समाधानों का उपयोग करने के लिए, सुनिश्चित करें कि आपके पास एक निष्पादन भूमिका के साथ स्टूडियो तक पहुंच है जो आपको सेजमेकर कार्यक्षमता चलाने की अनुमति देती है। स्टूडियो में अपनी उपयोगकर्ता भूमिका के लिए, सुनिश्चित करें कि सेजमेकर प्रोजेक्ट्स और जम्पस्टार्ट विकल्प चालू है।

निम्नलिखित अनुभागों में, हम पांच नए समाधानों में से प्रत्येक के माध्यम से जाते हैं और चर्चा करते हैं कि यह कैसे काम करता है, साथ ही कुछ सिफारिशों के साथ कि आप इसे अपनी व्यावसायिक आवश्यकताओं के लिए कैसे उपयोग कर सकते हैं।

मूल्य अनुकूलन

व्यवसाय सर्वोत्तम परिणाम प्राप्त करने के लिए विभिन्न लीवर का उपयोग करना पसंद करते हैं। उदाहरण के लिए, किसी उत्पाद या सेवा की कीमत एक लीवर है जिसे एक व्यवसाय नियंत्रित कर सकता है। सवाल यह है कि लाभ या राजस्व जैसे व्यावसायिक उद्देश्य को अधिकतम करने के लिए किसी उत्पाद या सेवा को किस कीमत पर निर्धारित किया जाए, यह कैसे तय किया जाए।

यह समाधान अनुकूलन योग्य एमएल मॉडल प्रदान करता है जिससे आपको अपने उद्देश्य को प्राप्त करने के लिए अपने उत्पाद या सेवा की कीमत निर्धारित करने के लिए इष्टतम निर्णय लेने में मदद मिलती है, जैसे राजस्व, लाभ, या अन्य कस्टम मेट्रिक्स को अधिकतम करना। समाधान ऐतिहासिक डेटा से मूल्य-मात्रा संबंधों को सीखने के लिए एमएल और कारण अनुमान दृष्टिकोण का उपयोग करता है, और कस्टम उद्देश्य मेट्रिक्स को अनुकूलित करने के लिए वास्तविक समय में गतिशील मूल्य अनुशंसाएं करने में सक्षम है।

निम्न स्क्रीनशॉट नमूना इनपुट डेटा दिखाता है।

समाधान में तीन भाग शामिल हैं:

  • मूल्य लोच का अनुमान - यह एक डबल एमएल एल्गोरिथम के माध्यम से कारण अनुमान से अनुमान लगाया जाता है
  • वॉल्यूम पूर्वानुमान - यह पैगंबर एल्गोरिथम का उपयोग करके पूर्वानुमान लगाया गया है
  • मूल्य अनुकूलन - यह विभिन्न मूल्य परिदृश्यों के माध्यम से क्या-अगर अनुकरण द्वारा प्राप्त किया जाता है

समाधान राजस्व को अधिकतम करने के लिए अगले दिन के लिए अनुशंसित मूल्य प्रदान करता है। इसके अलावा, आउटपुट में अनुमानित मूल्य लोच शामिल है, जो कि वॉल्यूम पर कीमत के प्रभाव को इंगित करने वाला एक मूल्य है, और एक पूर्वानुमान मॉडल है, जो अगले दिन की मात्रा का अनुमान लगाने में सक्षम है। निम्नलिखित चार्ट से पता चलता है कि एक कारण मॉडल जिसमें परिकलित मूल्य लोच शामिल है, एक भविष्य कहनेवाला मॉडल की तुलना में क्या-अगर विश्लेषण (व्यवहार मूल्य से बड़े विचलन के साथ) के तहत बेहतर प्रदर्शन करता है जो समय श्रृंखला डेटा का उपयोग करके भविष्यवाणी की मात्रा के लिए पैगंबर का उपयोग करता है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

आप निम्न उपयोग के मामलों के लिए इस समाधान को अपने व्यवसाय में लागू कर सकते हैं:

  • खुदरा स्टोर के लिए माल की इष्टतम कीमत निर्धारित करें
  • ग्राहक खरीद पर छूट कूपन के प्रभाव का अनुमान लगाएं
  • किसी भी व्यवसाय में विभिन्न प्रोत्साहन विधियों के प्रभाव की भविष्यवाणी करना

पक्षी प्रजातियों की भविष्यवाणी

आज व्यवसायों के लिए कई कंप्यूटर विज़न (CV) अनुप्रयोग हैं। उन अनुप्रयोगों में से एक ऑब्जेक्ट डिटेक्शन है, जहां एक एमएल एल्गोरिदम एक छवि में किसी ऑब्जेक्ट के स्थान को उसके चारों ओर एक बाउंडिंग बॉक्स खींचकर पता लगाता है, और ऑब्जेक्ट के प्रकार की पहचान करता है। ऑब्जेक्ट डिटेक्शन मॉडल को लागू करना और इसे ठीक करना सीखना उस संगठन के लिए बहुत महत्वपूर्ण हो सकता है जिसके पास सीवी की जरूरत है।

यह समाधान एक उदाहरण प्रदान करता है कि सेजमेकर एल्गोरिथम को चित्र प्रदान करते समय बाउंडिंग बॉक्स विनिर्देशों का अनुवाद कैसे किया जाए। यह समाधान क्षैतिज रूप से फ़्लिप की गई प्रशिक्षण छवियों (दर्पण छवियों) को जोड़कर ऑब्जेक्ट डिटेक्शन मॉडल को बेहतर बनाने का तरीका भी दर्शाता है।

बड़ी संख्या में कक्षाएं (200 पक्षी प्रजातियां) होने पर ऑब्जेक्ट डिटेक्शन चुनौतियों के साथ प्रयोग करने के लिए एक नोटबुक प्रदान की जाती है। नोटबुक यह भी दिखाती है कि प्रशिक्षण कार्य के युगों में होने वाले सटीकता सुधारों को कैसे चार्ट किया जाए। निम्न छवि पक्षियों के डेटासेट से उदाहरण चित्र दिखाती है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

इस समाधान में पाँच चरण हैं:

  1. डाउनलोड सहित डेटा तैयार करें और RecordIO फ़ाइल पीढ़ी।
  2. ऑब्जेक्ट डिटेक्शन मॉडल बनाएं और प्रशिक्षित करें।
  3. एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।
  4. विस्तारित डेटासेट के साथ ऑब्जेक्ट डिटेक्शन मॉडल को फिर से बनाएं और प्रशिक्षित करें।
  5. एक समापन बिंदु परिनियोजित करें और विस्तारित मॉडल प्रदर्शन का मूल्यांकन करें।

आपको आउटपुट के रूप में निम्न मिलता है:

  • आपकी परीक्षण छवि के विरुद्ध बॉन्डिंग बॉक्स के साथ ऑब्जेक्ट डिटेक्शन परिणाम
  • एक प्रशिक्षित ऑब्जेक्ट डिटेक्शन मॉडल
  • एक अतिरिक्त विस्तारित (फ़्लिप) डेटासेट के साथ एक प्रशिक्षित ऑब्जेक्ट डिटेक्शन मॉडल
  • प्रत्येक मॉडल में से एक के साथ दो अलग-अलग समापन बिंदु तैनात किए गए हैं

निम्नलिखित चार्ट प्रशिक्षण के दौरान मॉडल पुनरावृत्तियों (युगों) के खिलाफ मॉडल सुधार दिखाता है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

निम्नलिखित उदाहरण दो परीक्षण छवियों से आउटपुट हैं।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

आप निम्न उपयोग के मामलों के लिए इस समाधान को अपने व्यवसाय में लागू कर सकते हैं:

  • एक पैकेजिंग उद्योग में एक कन्वेयर बेल्ट पर वस्तुओं का पता लगाएं
  • पिज्जा पर टॉपिंग का पता लगाएं
  • आपूर्ति श्रृंखला परिचालन अनुप्रयोगों को लागू करें जिसमें वस्तु का पता लगाना शामिल है

फेफड़े के कैंसर से बचने की भविष्यवाणी

COVID-19 ने फेफड़ों से संबंधित चिकित्सा चुनौतियों पर बहुत अधिक ध्यान दिया। इसने अस्पतालों, डॉक्टरों, नर्सों और रेडियोलॉजिस्ट पर भी काफी दबाव डाला है। एक संभावना की कल्पना करें जहां आप चिकित्सा चिकित्सकों की सहायता के लिए एमएल को एक शक्तिशाली उपकरण के रूप में लागू कर सकते हैं और उन्हें अपने काम में तेजी लाने में मदद कर सकते हैं। इस समाधान में, हम दिखाते हैं कि कैसे 2डी और 3डी रेडियोमिक विशेषताएं और रोगी जनसांख्यिकी को एक एमएल एल्गोरिथम को खिलाया जा सकता है ताकि मरीज के फेफड़ों के कैंसर से बचने की संभावना का अनुमान लगाया जा सके। इस भविष्यवाणी के परिणाम प्रदाताओं को उचित सक्रिय उपाय करने में मदद कर सकते हैं।

यह समाधान दर्शाता है कि नॉन-स्मॉल सेल लंग कैंसर (NSCLC) रेडियोजेनोमिक्स डेटासेट के लिए एक स्केलेबल ML पाइपलाइन का निर्माण कैसे किया जाता है, जिसमें RNA अनुक्रमण डेटा, नैदानिक ​​डेटा (EHR डेटा का प्रतिबिंबित), और चिकित्सा चित्र शामिल हैं। मशीन मॉडल बनाने के लिए कई प्रकार के डेटा का उपयोग करना कहलाता है मल्टी मॉडल एमएल. यह समाधान गैर-छोटे सेल फेफड़ों के कैंसर से निदान रोगियों के जीवित रहने के परिणाम की भविष्यवाणी करता है।

निम्न छवि नॉन-स्मॉल सेल लंग कैंसर (NSCLC) रेडियोजीनोमिक्स डेटासेट से इनपुट डेटा का एक उदाहरण दिखाती है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

समाधान के हिस्से के रूप में, ट्यूमर के ऊतकों से कुल आरएनए निकाला गया और आरएनए अनुक्रमण तकनीक के साथ विश्लेषण किया गया। यद्यपि मूल डेटा में 22,000 से अधिक जीन होते हैं, हम 21 अत्यधिक सहसंपीड़ित जीन समूहों (मेटाजेन्स) से 10 जीन रखते हैं जिनकी पहचान की गई थी, जो सार्वजनिक रूप से उपलब्ध जीन-अभिव्यक्ति समूहों में मान्य थे, और रोग का निदान के साथ सहसंबद्ध थे।

नैदानिक ​​रिकॉर्ड सीएसवी प्रारूप में संग्रहीत किए जाते हैं। प्रत्येक पंक्ति एक रोगी से मेल खाती है, और कॉलम में जनसांख्यिकी, ट्यूमर चरण और जीवित रहने की स्थिति सहित रोगियों के बारे में जानकारी होती है।

जीनोमिक डेटा के लिए, हम 21 अत्यधिक सहसंपीड़ित जीन समूहों (मेटाजेन्स) से 10 जीन रखते हैं जिनकी पहचान की गई थी, जो सार्वजनिक रूप से उपलब्ध जीन-एक्सप्रेशन कॉहोर्ट्स में मान्य थे, और प्रैग्नेंसी के साथ सहसंबद्ध थे।

मेडिकल इमेजिंग डेटा के लिए, हम रोगी-स्तरीय 3D रेडियोमिक विशेषताएं बनाते हैं जो सीटी स्कैन में देखे गए ट्यूमर के आकार, आकार और दृश्य विशेषताओं की व्याख्या करते हैं। प्रत्येक रोगी अध्ययन के लिए, निम्नलिखित चरणों का पालन किया जाता है:

  1. सीटी स्कैन और ट्यूमर विभाजन दोनों के लिए 2डी DICOM स्लाइस फाइलें पढ़ें, उन्हें 3डी वॉल्यूम में मिलाएं, वॉल्यूम को निफ्टी फॉर्मेट में सेव करें।
  2. सीटी मात्रा और ट्यूमर विभाजन संरेखित करें ताकि हम ट्यूमर के अंदर गणना पर ध्यान केंद्रित कर सकें।
  3. पिराडियोमिक्स लाइब्रेरी का उपयोग करके ट्यूमर क्षेत्र का वर्णन करने वाले रेडियोमिक विशेषताओं की गणना करें।
  4. आठ वर्गों की 120 रेडियोमिक विशेषताएं निकालें, जैसे कि वितरण के सांख्यिकीय निरूपण और ब्याज के ट्यूमरस क्षेत्र के भीतर तीव्रता की सह-घटना, और आकार-आधारित माप ट्यूमर को रूपात्मक रूप से वर्णित करते हैं।

मॉडल प्रशिक्षण के लिए एक रोगी का बहु-मोडल दृश्य बनाने के लिए, हम तीन तौर-तरीकों से फीचर वैक्टर में शामिल होते हैं। फिर हम डेटा को प्रोसेस करते हैं। सबसे पहले, हम फीचर स्केलिंग का उपयोग करके स्वतंत्र सुविधाओं की श्रेणी को सामान्य करते हैं। फिर हम आयामीता को कम करने के लिए सुविधाओं पर प्रमुख घटक विश्लेषण (पीसीए) करते हैं और सबसे अधिक भेदभावपूर्ण विशेषताओं की पहचान करते हैं जो डेटा में 95% भिन्नता का योगदान करते हैं।

इसके परिणामस्वरूप 215 सुविधाओं से 45 प्रमुख घटकों तक की आयामीता में कमी आती है, जो पर्यवेक्षित शिक्षार्थी के लिए सुविधाओं का गठन करती है।

समाधान एक एमएल मॉडल तैयार करता है जो संभावना के रूप में एनएससीएलसी रोगियों के जीवित रहने की स्थिति (मृत या जीवित) की भविष्यवाणी करता है। मॉडल और भविष्यवाणी के अलावा, हम मॉडल की व्याख्या करने के लिए रिपोर्ट भी तैयार करते हैं। मेडिकल इमेजिंग पाइपलाइन विज़ुअलाइज़ेशन उद्देश्यों के लिए 3 डी फेफड़े के सीटी वॉल्यूम और ट्यूमर सेगमेंटेशन का उत्पादन करती है।

आप इस समाधान को स्वास्थ्य देखभाल और जीवन विज्ञान के उपयोग के मामलों में लागू कर सकते हैं।

वित्तीय भुगतान वर्गीकरण

किसी व्यवसाय या उपभोक्ता के सभी वित्तीय लेनदेन को लेना और उन्हें विभिन्न श्रेणियों में व्यवस्थित करना काफी मददगार हो सकता है। यह उपयोगकर्ता को यह जानने में मदद कर सकता है कि उन्होंने किस श्रेणी में कितना खर्च किया है, और यह अलर्ट भी बढ़ा सकता है जब किसी श्रेणी में लेनदेन या खर्च अप्रत्याशित रूप से ऊपर या नीचे हो जाता है।

यह समाधान दर्शाता है कि लेनदेन की जानकारी के आधार पर वित्तीय लेनदेन को वर्गीकृत करने के लिए एमएल मॉडल को कैसे प्रशिक्षित और तैनात किया जाए। कई बैंक अपने अंतिम उपयोगकर्ताओं को उनकी खर्च करने की आदतों का अवलोकन देने के लिए इसे एक सेवा के रूप में प्रदान करते हैं। आप इस समाधान का उपयोग धोखाधड़ी का पता लगाने, वैयक्तिकरण, या विसंगति का पता लगाने में एक मध्यवर्ती चरण के रूप में भी कर सकते हैं। हम आवश्यक अंतर्निहित बुनियादी ढांचे के साथ XGBoost मॉडल को प्रशिक्षित और तैनात करने के लिए SageMaker का उपयोग करते हैं।

इस समाधान को प्रदर्शित करने के लिए हम जिस सिंथेटिक डेटासेट में निम्नलिखित विशेषताएं हैं:

  • लेन-देन_श्रेणी - लेन-देन की श्रेणी, निम्नलिखित 19 विकल्पों में से: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Home, तथा Pension and insurances.
  • रिसीवर_द - प्राप्त करने वाले पक्ष के लिए एक पहचानकर्ता। पहचानकर्ता में 16 नंबर होते हैं।
  • प्रेषक आईडी - भेजने वाली पार्टी के लिए एक पहचानकर्ता। पहचानकर्ता में 16 नंबर होते हैं।
  • राशि - हस्तांतरित की जाने वाली राशि।
  • टाइमस्टैम्प - YYYY-MM-DD HH:MM:SS प्रारूप में लेन-देन का टाइमस्टैम्प।

डेटासेट के पहले पांच अवलोकन इस प्रकार हैं:

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

इस समाधान के लिए, हम XGBoost का उपयोग करते हैं, जो ग्रेडिएंट बूस्टेड ट्री एल्गोरिथम का एक लोकप्रिय और कुशल ओपन-सोर्स कार्यान्वयन है। ग्रेडिएंट बूस्टिंग एक पर्यवेक्षित शिक्षण एल्गोरिदम है जो सरल और कमजोर मॉडल के सेट से अनुमानों के संयोजन को जोड़कर लक्ष्य चर की सटीक भविष्यवाणी करने का प्रयास करता है। इसका कार्यान्वयन सेजमेकर बिल्ट-इन एल्गोरिदम में उपलब्ध है।

वित्तीय भुगतान वर्गीकरण समाधान में चार चरण होते हैं:

  1. डेटा तैयार करें।
  2. एक फीचर स्टोर बनाएं।
  3. XGBoost मॉडल बनाएं और प्रशिक्षित करें।
  4. एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।

हमें निम्नलिखित आउटपुट मिलता है:

  • हमारे उदाहरण डेटासेट के आधार पर एक प्रशिक्षित XGBoost मॉडल
  • एक सेजमेकर एंडपॉइंट जो लेनदेन श्रेणी की भविष्यवाणी कर सकता है

इस समाधान को चलाने के बाद, आपको निम्न के जैसा एक वर्गीकरण रिपोर्ट देखना चाहिए।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

आपके व्यवसाय के लिए संभावित अनुप्रयोगों में निम्नलिखित शामिल हैं:

  • खुदरा और निवेश बैंकिंग में विभिन्न वित्तीय अनुप्रयोग
  • जब लेनदेन को किसी भी उपयोग के मामले में वर्गीकृत करने की आवश्यकता होती है (केवल वित्तीय नहीं)

मोबाइल फोन ग्राहकों के लिए मंथन की भविष्यवाणी

ग्राहक मंथन की भविष्यवाणी करना एक बहुत ही सामान्य व्यावसायिक आवश्यकता है। कई अध्ययनों से पता चलता है कि एक मौजूदा ग्राहक को बनाए रखने की लागत एक नया ग्राहक प्राप्त करने की तुलना में बहुत कम है। चुनौती अक्सर उन व्यवसायों से आती है जिन्हें यह समझने में कठिन समय होता है कि ग्राहक क्यों मंथन कर रहा है, या एक मॉडल का निर्माण कर रहा है जो मंथन की भविष्यवाणी करता है।

इस उदाहरण में, जो उपयोगकर्ता एमएल के लिए नए हैं, वे अनुभव कर सकते हैं कि कैसे एक मोबाइल कॉल लेनदेन डेटासेट का उपयोग करके एक मंथन भविष्यवाणी मॉडल को जल्दी से विकसित किया जा सकता है। यह समाधान ग्राहक प्रोफ़ाइल डेटासेट पर XGBoost मॉडल को प्रशिक्षित करने और तैनात करने के लिए SageMaker का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि ग्राहक के मोबाइल फोन ऑपरेटर को छोड़ने की संभावना है या नहीं।

यह समाधान जिस डेटासेट का उपयोग करता है वह सार्वजनिक रूप से उपलब्ध है और इसका उल्लेख डेनियल टी. लारोज़ की पुस्तक डिस्कवरिंग नॉलेज इन डेटा में किया गया है। इसका श्रेय लेखक ने यूनिवर्सिटी ऑफ कैलिफोर्निया इरविन रिपोजिटरी ऑफ मशीन लर्निंग डेटासेट्स को दिया है।

यह डेटासेट किसी अज्ञात यूएस मोबाइल ऑपरेटर के ग्राहक की प्रोफ़ाइल का वर्णन करने के लिए निम्नलिखित 21 विशेषताओं का उपयोग करता है।

  • राज्य: अमेरिकी राज्य जिसमें ग्राहक रहता है, दो अक्षरों के संक्षिप्त नाम द्वारा दर्शाया गया है; उदाहरण के लिए, OH या NJ
  • खाते की अवधि: यह खाता सक्रिय हुए दिनों की संख्या
  • क्षेत्र कोड: संबंधित ग्राहक के फ़ोन नंबर का तीन अंकों का क्षेत्र कोड
  • फ़ोन: शेष सात अंकों का फ़ोन नंबर
  • अंतर्राष्ट्रीय योजना: क्या ग्राहक के पास अंतर्राष्ट्रीय कॉलिंग योजना है: हाँ/नहीं
  • VMail योजना: क्या ग्राहक के पास वॉइस मेल सुविधा है: हाँ/नहीं
  • VMail संदेश: प्रति माह ध्वनि मेल संदेशों की औसत संख्या
  • दिन मिनट: दिन के दौरान उपयोग किए जाने वाले कॉलिंग मिनटों की कुल संख्या
  • दिन की कॉलें: दिन के दौरान की गई कॉलों की कुल संख्या
  • दिन का शुल्क: दिन के समय की कॉल की बिल लागत
  • ईव मिनट्स, ईव कॉल्स, ईव चार्ज: शाम के दौरान की गई कॉलों की बिल की लागत
  • रात के मिनट, रात की कॉल, रात का शुल्क: रात के समय की गई कॉलों की बिल लागत
  • अंतरराष्ट्रीय मिनट, अंतरराष्ट्रीय कॉल, अंतरराष्ट्रीय शुल्क: अंतरराष्ट्रीय कॉल के लिए बिल की लागत
  • CustServ कॉल्स: Customer Service को किए गए कॉलों की संख्या
  • मंथन ?: क्या ग्राहक ने सेवा छोड़ दी: सच/गलत

इस समाधान में तीन चरण होते हैं:

  1. डेटा तैयार करें।
  2. XGBoost मॉडल बनाएं और प्रशिक्षित करें।
  3. एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।

हमें निम्नलिखित आउटपुट मिलता है:

  • उपयोगकर्ता मंथन की भविष्यवाणी करने के लिए हमारे उदाहरण डेटासेट पर आधारित एक प्रशिक्षित XGBoost मॉडल
  • एक सेजमेकर एंडपॉइंट जो उपयोगकर्ता मंथन की भविष्यवाणी कर सकता है

यह मॉडल यह अनुमान लगाने में मदद करता है कि 5,000 मोबाइल फोन ग्राहकों में से कितने अपने वर्तमान मोबाइल फोन ऑपरेटर का उपयोग बंद कर देंगे।

निम्नलिखित चार्ट मॉडल से आउटपुट के रूप में मंथन की संभाव्यता वितरण दिखाता है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

आप इसे निम्नलिखित उपयोग मामलों के लिए अपने व्यवसाय में लागू कर सकते हैं:

  • अपने खुद के व्यवसाय में ग्राहक मंथन की भविष्यवाणी करें
  • वर्गीकृत करें कि कौन से ग्राहक आपका मार्केटिंग ईमेल खोल सकते हैं और कौन नहीं (बाइनरी वर्गीकरण)
  • भविष्यवाणी करें कि किन छात्रों के पाठ्यक्रम से बाहर होने की संभावना है

संसाधनों को साफ करें

जम्पस्टार्ट में समाधान चलाने के बाद, चुनना सुनिश्चित करें सभी संसाधन हटाएं इसलिए आपके द्वारा इस प्रक्रिया में बनाए गए सभी संसाधन हटा दिए जाते हैं और आपकी बिलिंग रोक दी जाती है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।

सारांश

इस पोस्ट ने आपको जम्पस्टार्ट समाधानों के आधार पर एमएल लागू करके विभिन्न व्यावसायिक समस्याओं को हल करने का तरीका दिखाया। हालांकि यह पोस्ट हाल ही में जम्पस्टार्ट में जोड़े गए पांच नए समाधानों पर केंद्रित है, लेकिन कुल 23 उपलब्ध समाधान हैं। हम आपको स्टूडियो में लॉग इन करने और जम्पस्टार्ट समाधानों को स्वयं देखने और उनसे तत्काल मूल्य प्राप्त करने के लिए प्रोत्साहित करते हैं। अधिक जानकारी के लिए देखें अमेज़ॅन सैजमेकर स्टूडियो और सेजमेकर जम्पस्टार्ट.

नोट: यदि आप अपने एडब्ल्यूएस क्षेत्र के जम्पस्टार्ट कंसोल में उपरोक्त सभी पांच समाधान नहीं देखते हैं, तो कृपया एक सप्ताह तक प्रतीक्षा करें और फिर से जांच करें। हम उन्हें चरणबद्ध तरीके से विभिन्न क्षेत्रों में जारी कर रहे हैं।


लेखक के बारे में

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ। डॉ. राजू पेनमाचा एडब्ल्यूएस में एआई प्लेटफॉर्म्स में एआई/एमएल स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह सेजमेकर में सेवाओं के लो-कोड/नो-कोड सूट पर काम करता है जो ग्राहकों को आसानी से मशीन लर्निंग मॉडल और समाधान बनाने और तैनात करने में मदद करता है। जब वह ग्राहकों की मदद नहीं करता, तो वह नई जगहों की यात्रा करना पसंद करता है।

Amazon SageMaker जम्पस्टार्ट समाधान प्लेटोब्लॉकचैन डेटा इंटेलिजेंस में मशीन लर्निंग के माध्यम से व्यावसायिक समस्याओं को शुरू से अंत तक हल करें। लंबवत खोज। ऐ।मनन शाह Amazon वेब सर्विसेज में सॉफ्टवेयर डेवलपमेंट मैनेजर हैं। वह एक एमएल उत्साही है और नो-कोड/लो-कोड एआई/एमएल उत्पादों के निर्माण पर ध्यान केंद्रित करता है। वह महान सॉफ्टवेयर बनाने के लिए अन्य प्रतिभाशाली, तकनीकी लोगों को सशक्त बनाने का प्रयास करता है।

समय टिकट:

से अधिक AWS मशीन लर्निंग

अमेज़ॅन सेजमेकर कैनवास भावना विश्लेषण और टेक्स्ट विश्लेषण मॉडल का उपयोग करके उत्पाद समीक्षाओं से अंतर्दृष्टि प्राप्त करने के लिए नो-कोड मशीन लर्निंग का उपयोग करें | अमेज़न वेब सेवाएँ

स्रोत नोड: 1899999
समय टिकट: अक्टूबर 9, 2023

डेवलपर उत्पादकता को बढ़ावा देना: डेलॉइट नो-कोड/लो-कोड मशीन लर्निंग के लिए अमेज़ॅन सेजमेकर कैनवास का उपयोग कैसे करता है | अमेज़न वेब सेवाएँ

स्रोत नोड: 1920150
समय टिकट: दिसम्बर 1, 2023