Amazon SageMaker जम्पस्टार्ट सॉल्यूशंस में मशीन लर्निंग के माध्यम से व्यवसाय की समस्याओं को एंड-टू-एंड हल करें

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

अमेज़न SageMaker जम्पस्टार्ट मशीन लर्निंग (एमएल) के साथ शुरुआत करने में आपकी मदद करने के लिए विभिन्न प्रकार की समस्या के लिए पूर्व-प्रशिक्षित, ओपन-सोर्स मॉडल प्रदान करता है। जम्पस्टार्ट समाधान टेम्पलेट भी प्रदान करता है जो सामान्य उपयोग के मामलों के लिए बुनियादी ढांचा स्थापित करता है, और एमएल के लिए निष्पादन योग्य उदाहरण नोटबुक के साथ अमेज़न SageMaker.

एक व्यावसायिक उपयोगकर्ता के रूप में, आपको जम्पस्टार्ट समाधानों के साथ निम्नलिखित कार्य करने को मिलते हैं:

समाधानों का अन्वेषण करें और मूल्यांकन करें कि आपकी व्यावसायिक आवश्यकताओं के लिए कौन से अच्छे मेल हैं।
एक क्लिक के साथ समाधान लॉन्च करें अमेज़ॅन सैजमेकर स्टूडियो. यह लॉन्च करता है a एडब्ल्यूएस CloudFormation आवश्यक संसाधन बनाने के लिए टेम्पलेट।
अंतर्निहित नोटबुक और मॉडल संपत्तियों तक पहुंच के साथ अपनी आवश्यकताओं को पूरा करने के लिए समाधान संशोधित करें।
एक बार किए गए अधिग्रहीत संसाधनों को हटा दें।

यह पोस्ट उन पांच एमएल समाधानों पर केंद्रित है जिन्हें हाल ही में पांच अलग-अलग व्यावसायिक चुनौतियों का समाधान करने के लिए जोड़ा गया था। इस लेखन के रूप में, जम्पस्टार्ट वित्तीय लेनदेन में धोखाधड़ी का पता लगाने से लेकर हस्तलेखन को पहचानने तक अलग-अलग 23 व्यावसायिक समाधान प्रदान करता है। जम्पस्टार्ट के माध्यम से पेश किए जाने वाले समाधानों की संख्या नियमित आधार पर बढ़ती जाती है क्योंकि इसमें अधिक समाधान जोड़े जाते हैं।

समाधान अवलोकन

पांच नए समाधान इस प्रकार हैं:

मूल्य अनुकूलन - अपने व्यवसाय के उद्देश्य को प्राप्त करने के लिए अपने उत्पाद या सेवा की कीमत निर्धारित करने के लिए इष्टतम निर्णय लेने में आपकी मदद करने के लिए अनुकूलन योग्य एमएल मॉडल प्रदान करता है, जैसे राजस्व, लाभ, या अन्य कस्टम मेट्रिक्स को अधिकतम करना।
पक्षी प्रजातियों की भविष्यवाणी - दिखाता है कि आप ऑब्जेक्ट डिटेक्शन मॉडल को कैसे प्रशिक्षित और फाइन-ट्यून कर सकते हैं। यह प्रशिक्षण छवि वृद्धि के माध्यम से मॉडल ट्यूनिंग को प्रदर्शित करता है, और प्रशिक्षण कार्य के पुनरावृत्तियों (युगों) में होने वाले सटीकता सुधारों को चार्ट करता है।
फेफड़े के कैंसर से बचने की भविष्यवाणी - दिखाता है कि आप किसी मरीज के फेफड़ों के कैंसर से बचने की संभावना का अनुमान लगाने के लिए एक एमएल एल्गोरिथम में 2डी और 3डी रेडियोमिक विशेषताओं और रोगी जनसांख्यिकी को कैसे फीड कर सकते हैं। इस भविष्यवाणी के परिणाम प्रदाताओं को उचित सक्रिय उपाय करने में मदद कर सकते हैं।
वित्तीय भुगतान वर्गीकरण - लेन-देन की जानकारी के आधार पर वित्तीय लेनदेन को वर्गीकृत करने के लिए एमएल मॉडल को प्रशिक्षित और तैनात करने का तरीका दर्शाता है। आप इस समाधान का उपयोग धोखाधड़ी का पता लगाने, वैयक्तिकरण, या विसंगति का पता लगाने में एक मध्यवर्ती चरण के रूप में भी कर सकते हैं।
मोबाइल फोन ग्राहकों के लिए मंथन की भविष्यवाणी - मोबाइल कॉल ट्रांजेक्शन डेटासेट का उपयोग करके एक मंथन भविष्यवाणी मॉडल को जल्दी से विकसित करने का तरीका दर्शाता है। यह उन उपयोगकर्ताओं के लिए एक सरल उदाहरण है जो ML में नए हैं।

.. पूर्वापेक्षाएँ

इन समाधानों का उपयोग करने के लिए, सुनिश्चित करें कि आपके पास एक निष्पादन भूमिका के साथ स्टूडियो तक पहुंच है जो आपको सेजमेकर कार्यक्षमता चलाने की अनुमति देती है। स्टूडियो में अपनी उपयोगकर्ता भूमिका के लिए, सुनिश्चित करें कि सेजमेकर प्रोजेक्ट्स और जम्पस्टार्ट विकल्प चालू है।

निम्नलिखित अनुभागों में, हम पांच नए समाधानों में से प्रत्येक के माध्यम से जाते हैं और चर्चा करते हैं कि यह कैसे काम करता है, साथ ही कुछ सिफारिशों के साथ कि आप इसे अपनी व्यावसायिक आवश्यकताओं के लिए कैसे उपयोग कर सकते हैं।

मूल्य अनुकूलन

व्यवसाय सर्वोत्तम परिणाम प्राप्त करने के लिए विभिन्न लीवर का उपयोग करना पसंद करते हैं। उदाहरण के लिए, किसी उत्पाद या सेवा की कीमत एक लीवर है जिसे एक व्यवसाय नियंत्रित कर सकता है। सवाल यह है कि लाभ या राजस्व जैसे व्यावसायिक उद्देश्य को अधिकतम करने के लिए किसी उत्पाद या सेवा को किस कीमत पर निर्धारित किया जाए, यह कैसे तय किया जाए।

यह समाधान अनुकूलन योग्य एमएल मॉडल प्रदान करता है जिससे आपको अपने उद्देश्य को प्राप्त करने के लिए अपने उत्पाद या सेवा की कीमत निर्धारित करने के लिए इष्टतम निर्णय लेने में मदद मिलती है, जैसे राजस्व, लाभ, या अन्य कस्टम मेट्रिक्स को अधिकतम करना। समाधान ऐतिहासिक डेटा से मूल्य-मात्रा संबंधों को सीखने के लिए एमएल और कारण अनुमान दृष्टिकोण का उपयोग करता है, और कस्टम उद्देश्य मेट्रिक्स को अनुकूलित करने के लिए वास्तविक समय में गतिशील मूल्य अनुशंसाएं करने में सक्षम है।

निम्न स्क्रीनशॉट नमूना इनपुट डेटा दिखाता है।

समाधान में तीन भाग शामिल हैं:

मूल्य लोच का अनुमान - यह एक डबल एमएल एल्गोरिथम के माध्यम से कारण अनुमान से अनुमान लगाया जाता है
वॉल्यूम पूर्वानुमान - यह पैगंबर एल्गोरिथम का उपयोग करके पूर्वानुमान लगाया गया है
मूल्य अनुकूलन - यह विभिन्न मूल्य परिदृश्यों के माध्यम से क्या-अगर अनुकरण द्वारा प्राप्त किया जाता है

समाधान राजस्व को अधिकतम करने के लिए अगले दिन के लिए अनुशंसित मूल्य प्रदान करता है। इसके अलावा, आउटपुट में अनुमानित मूल्य लोच शामिल है, जो कि वॉल्यूम पर कीमत के प्रभाव को इंगित करने वाला एक मूल्य है, और एक पूर्वानुमान मॉडल है, जो अगले दिन की मात्रा का अनुमान लगाने में सक्षम है। निम्नलिखित चार्ट से पता चलता है कि एक कारण मॉडल जिसमें परिकलित मूल्य लोच शामिल है, एक भविष्य कहनेवाला मॉडल की तुलना में क्या-अगर विश्लेषण (व्यवहार मूल्य से बड़े विचलन के साथ) के तहत बेहतर प्रदर्शन करता है जो समय श्रृंखला डेटा का उपयोग करके भविष्यवाणी की मात्रा के लिए पैगंबर का उपयोग करता है।

आप निम्न उपयोग के मामलों के लिए इस समाधान को अपने व्यवसाय में लागू कर सकते हैं:

खुदरा स्टोर के लिए माल की इष्टतम कीमत निर्धारित करें
ग्राहक खरीद पर छूट कूपन के प्रभाव का अनुमान लगाएं
किसी भी व्यवसाय में विभिन्न प्रोत्साहन विधियों के प्रभाव की भविष्यवाणी करना

पक्षी प्रजातियों की भविष्यवाणी

आज व्यवसायों के लिए कई कंप्यूटर विज़न (CV) अनुप्रयोग हैं। उन अनुप्रयोगों में से एक ऑब्जेक्ट डिटेक्शन है, जहां एक एमएल एल्गोरिदम एक छवि में किसी ऑब्जेक्ट के स्थान को उसके चारों ओर एक बाउंडिंग बॉक्स खींचकर पता लगाता है, और ऑब्जेक्ट के प्रकार की पहचान करता है। ऑब्जेक्ट डिटेक्शन मॉडल को लागू करना और इसे ठीक करना सीखना उस संगठन के लिए बहुत महत्वपूर्ण हो सकता है जिसके पास सीवी की जरूरत है।

यह समाधान एक उदाहरण प्रदान करता है कि सेजमेकर एल्गोरिथम को चित्र प्रदान करते समय बाउंडिंग बॉक्स विनिर्देशों का अनुवाद कैसे किया जाए। यह समाधान क्षैतिज रूप से फ़्लिप की गई प्रशिक्षण छवियों (दर्पण छवियों) को जोड़कर ऑब्जेक्ट डिटेक्शन मॉडल को बेहतर बनाने का तरीका भी दर्शाता है।

बड़ी संख्या में कक्षाएं (200 पक्षी प्रजातियां) होने पर ऑब्जेक्ट डिटेक्शन चुनौतियों के साथ प्रयोग करने के लिए एक नोटबुक प्रदान की जाती है। नोटबुक यह भी दिखाती है कि प्रशिक्षण कार्य के युगों में होने वाले सटीकता सुधारों को कैसे चार्ट किया जाए। निम्न छवि पक्षियों के डेटासेट से उदाहरण चित्र दिखाती है।

इस समाधान में पाँच चरण हैं:

डाउनलोड सहित डेटा तैयार करें और RecordIO फ़ाइल पीढ़ी।
ऑब्जेक्ट डिटेक्शन मॉडल बनाएं और प्रशिक्षित करें।
एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।
विस्तारित डेटासेट के साथ ऑब्जेक्ट डिटेक्शन मॉडल को फिर से बनाएं और प्रशिक्षित करें।
एक समापन बिंदु परिनियोजित करें और विस्तारित मॉडल प्रदर्शन का मूल्यांकन करें।

आपको आउटपुट के रूप में निम्न मिलता है:

आपकी परीक्षण छवि के विरुद्ध बॉन्डिंग बॉक्स के साथ ऑब्जेक्ट डिटेक्शन परिणाम
एक प्रशिक्षित ऑब्जेक्ट डिटेक्शन मॉडल
एक अतिरिक्त विस्तारित (फ़्लिप) डेटासेट के साथ एक प्रशिक्षित ऑब्जेक्ट डिटेक्शन मॉडल
प्रत्येक मॉडल में से एक के साथ दो अलग-अलग समापन बिंदु तैनात किए गए हैं

निम्नलिखित चार्ट प्रशिक्षण के दौरान मॉडल पुनरावृत्तियों (युगों) के खिलाफ मॉडल सुधार दिखाता है।

निम्नलिखित उदाहरण दो परीक्षण छवियों से आउटपुट हैं।

एक पैकेजिंग उद्योग में एक कन्वेयर बेल्ट पर वस्तुओं का पता लगाएं
पिज्जा पर टॉपिंग का पता लगाएं
आपूर्ति श्रृंखला परिचालन अनुप्रयोगों को लागू करें जिसमें वस्तु का पता लगाना शामिल है

फेफड़े के कैंसर से बचने की भविष्यवाणी

COVID-19 ने फेफड़ों से संबंधित चिकित्सा चुनौतियों पर बहुत अधिक ध्यान दिया। इसने अस्पतालों, डॉक्टरों, नर्सों और रेडियोलॉजिस्ट पर भी काफी दबाव डाला है। एक संभावना की कल्पना करें जहां आप चिकित्सा चिकित्सकों की सहायता के लिए एमएल को एक शक्तिशाली उपकरण के रूप में लागू कर सकते हैं और उन्हें अपने काम में तेजी लाने में मदद कर सकते हैं। इस समाधान में, हम दिखाते हैं कि कैसे 2डी और 3डी रेडियोमिक विशेषताएं और रोगी जनसांख्यिकी को एक एमएल एल्गोरिथम को खिलाया जा सकता है ताकि मरीज के फेफड़ों के कैंसर से बचने की संभावना का अनुमान लगाया जा सके। इस भविष्यवाणी के परिणाम प्रदाताओं को उचित सक्रिय उपाय करने में मदद कर सकते हैं।

यह समाधान दर्शाता है कि नॉन-स्मॉल सेल लंग कैंसर (NSCLC) रेडियोजेनोमिक्स डेटासेट के लिए एक स्केलेबल ML पाइपलाइन का निर्माण कैसे किया जाता है, जिसमें RNA अनुक्रमण डेटा, नैदानिक डेटा (EHR डेटा का प्रतिबिंबित), और चिकित्सा चित्र शामिल हैं। मशीन मॉडल बनाने के लिए कई प्रकार के डेटा का उपयोग करना कहलाता है मल्टी मॉडल एमएल. यह समाधान गैर-छोटे सेल फेफड़ों के कैंसर से निदान रोगियों के जीवित रहने के परिणाम की भविष्यवाणी करता है।

निम्न छवि नॉन-स्मॉल सेल लंग कैंसर (NSCLC) रेडियोजीनोमिक्स डेटासेट से इनपुट डेटा का एक उदाहरण दिखाती है।

समाधान के हिस्से के रूप में, ट्यूमर के ऊतकों से कुल आरएनए निकाला गया और आरएनए अनुक्रमण तकनीक के साथ विश्लेषण किया गया। यद्यपि मूल डेटा में 22,000 से अधिक जीन होते हैं, हम 21 अत्यधिक सहसंपीड़ित जीन समूहों (मेटाजेन्स) से 10 जीन रखते हैं जिनकी पहचान की गई थी, जो सार्वजनिक रूप से उपलब्ध जीन-अभिव्यक्ति समूहों में मान्य थे, और रोग का निदान के साथ सहसंबद्ध थे।

नैदानिक रिकॉर्ड सीएसवी प्रारूप में संग्रहीत किए जाते हैं। प्रत्येक पंक्ति एक रोगी से मेल खाती है, और कॉलम में जनसांख्यिकी, ट्यूमर चरण और जीवित रहने की स्थिति सहित रोगियों के बारे में जानकारी होती है।

जीनोमिक डेटा के लिए, हम 21 अत्यधिक सहसंपीड़ित जीन समूहों (मेटाजेन्स) से 10 जीन रखते हैं जिनकी पहचान की गई थी, जो सार्वजनिक रूप से उपलब्ध जीन-एक्सप्रेशन कॉहोर्ट्स में मान्य थे, और प्रैग्नेंसी के साथ सहसंबद्ध थे।

मेडिकल इमेजिंग डेटा के लिए, हम रोगी-स्तरीय 3D रेडियोमिक विशेषताएं बनाते हैं जो सीटी स्कैन में देखे गए ट्यूमर के आकार, आकार और दृश्य विशेषताओं की व्याख्या करते हैं। प्रत्येक रोगी अध्ययन के लिए, निम्नलिखित चरणों का पालन किया जाता है:

सीटी स्कैन और ट्यूमर विभाजन दोनों के लिए 2डी DICOM स्लाइस फाइलें पढ़ें, उन्हें 3डी वॉल्यूम में मिलाएं, वॉल्यूम को निफ्टी फॉर्मेट में सेव करें।
सीटी मात्रा और ट्यूमर विभाजन संरेखित करें ताकि हम ट्यूमर के अंदर गणना पर ध्यान केंद्रित कर सकें।
पिराडियोमिक्स लाइब्रेरी का उपयोग करके ट्यूमर क्षेत्र का वर्णन करने वाले रेडियोमिक विशेषताओं की गणना करें।
आठ वर्गों की 120 रेडियोमिक विशेषताएं निकालें, जैसे कि वितरण के सांख्यिकीय निरूपण और ब्याज के ट्यूमरस क्षेत्र के भीतर तीव्रता की सह-घटना, और आकार-आधारित माप ट्यूमर को रूपात्मक रूप से वर्णित करते हैं।

मॉडल प्रशिक्षण के लिए एक रोगी का बहु-मोडल दृश्य बनाने के लिए, हम तीन तौर-तरीकों से फीचर वैक्टर में शामिल होते हैं। फिर हम डेटा को प्रोसेस करते हैं। सबसे पहले, हम फीचर स्केलिंग का उपयोग करके स्वतंत्र सुविधाओं की श्रेणी को सामान्य करते हैं। फिर हम आयामीता को कम करने के लिए सुविधाओं पर प्रमुख घटक विश्लेषण (पीसीए) करते हैं और सबसे अधिक भेदभावपूर्ण विशेषताओं की पहचान करते हैं जो डेटा में 95% भिन्नता का योगदान करते हैं।

इसके परिणामस्वरूप 215 सुविधाओं से 45 प्रमुख घटकों तक की आयामीता में कमी आती है, जो पर्यवेक्षित शिक्षार्थी के लिए सुविधाओं का गठन करती है।

समाधान एक एमएल मॉडल तैयार करता है जो संभावना के रूप में एनएससीएलसी रोगियों के जीवित रहने की स्थिति (मृत या जीवित) की भविष्यवाणी करता है। मॉडल और भविष्यवाणी के अलावा, हम मॉडल की व्याख्या करने के लिए रिपोर्ट भी तैयार करते हैं। मेडिकल इमेजिंग पाइपलाइन विज़ुअलाइज़ेशन उद्देश्यों के लिए 3 डी फेफड़े के सीटी वॉल्यूम और ट्यूमर सेगमेंटेशन का उत्पादन करती है।

आप इस समाधान को स्वास्थ्य देखभाल और जीवन विज्ञान के उपयोग के मामलों में लागू कर सकते हैं।

वित्तीय भुगतान वर्गीकरण

किसी व्यवसाय या उपभोक्ता के सभी वित्तीय लेनदेन को लेना और उन्हें विभिन्न श्रेणियों में व्यवस्थित करना काफी मददगार हो सकता है। यह उपयोगकर्ता को यह जानने में मदद कर सकता है कि उन्होंने किस श्रेणी में कितना खर्च किया है, और यह अलर्ट भी बढ़ा सकता है जब किसी श्रेणी में लेनदेन या खर्च अप्रत्याशित रूप से ऊपर या नीचे हो जाता है।

यह समाधान दर्शाता है कि लेनदेन की जानकारी के आधार पर वित्तीय लेनदेन को वर्गीकृत करने के लिए एमएल मॉडल को कैसे प्रशिक्षित और तैनात किया जाए। कई बैंक अपने अंतिम उपयोगकर्ताओं को उनकी खर्च करने की आदतों का अवलोकन देने के लिए इसे एक सेवा के रूप में प्रदान करते हैं। आप इस समाधान का उपयोग धोखाधड़ी का पता लगाने, वैयक्तिकरण, या विसंगति का पता लगाने में एक मध्यवर्ती चरण के रूप में भी कर सकते हैं। हम आवश्यक अंतर्निहित बुनियादी ढांचे के साथ XGBoost मॉडल को प्रशिक्षित और तैनात करने के लिए SageMaker का उपयोग करते हैं।

इस समाधान को प्रदर्शित करने के लिए हम जिस सिंथेटिक डेटासेट में निम्नलिखित विशेषताएं हैं:

लेन-देन_श्रेणी - लेन-देन की श्रेणी, निम्नलिखित 19 विकल्पों में से: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Home, तथा Pension and insurances.
रिसीवर_द - प्राप्त करने वाले पक्ष के लिए एक पहचानकर्ता। पहचानकर्ता में 16 नंबर होते हैं।
प्रेषक आईडी - भेजने वाली पार्टी के लिए एक पहचानकर्ता। पहचानकर्ता में 16 नंबर होते हैं।
राशि - हस्तांतरित की जाने वाली राशि।
टाइमस्टैम्प - YYYY-MM-DD HH:MM:SS प्रारूप में लेन-देन का टाइमस्टैम्प।

डेटासेट के पहले पांच अवलोकन इस प्रकार हैं:

इस समाधान के लिए, हम XGBoost का उपयोग करते हैं, जो ग्रेडिएंट बूस्टेड ट्री एल्गोरिथम का एक लोकप्रिय और कुशल ओपन-सोर्स कार्यान्वयन है। ग्रेडिएंट बूस्टिंग एक पर्यवेक्षित शिक्षण एल्गोरिदम है जो सरल और कमजोर मॉडल के सेट से अनुमानों के संयोजन को जोड़कर लक्ष्य चर की सटीक भविष्यवाणी करने का प्रयास करता है। इसका कार्यान्वयन सेजमेकर बिल्ट-इन एल्गोरिदम में उपलब्ध है।

वित्तीय भुगतान वर्गीकरण समाधान में चार चरण होते हैं:

डेटा तैयार करें।
एक फीचर स्टोर बनाएं।
XGBoost मॉडल बनाएं और प्रशिक्षित करें।
एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।

हमें निम्नलिखित आउटपुट मिलता है:

हमारे उदाहरण डेटासेट के आधार पर एक प्रशिक्षित XGBoost मॉडल
एक सेजमेकर एंडपॉइंट जो लेनदेन श्रेणी की भविष्यवाणी कर सकता है

इस समाधान को चलाने के बाद, आपको निम्न के जैसा एक वर्गीकरण रिपोर्ट देखना चाहिए।

आपके व्यवसाय के लिए संभावित अनुप्रयोगों में निम्नलिखित शामिल हैं:

खुदरा और निवेश बैंकिंग में विभिन्न वित्तीय अनुप्रयोग
जब लेनदेन को किसी भी उपयोग के मामले में वर्गीकृत करने की आवश्यकता होती है (केवल वित्तीय नहीं)

मोबाइल फोन ग्राहकों के लिए मंथन की भविष्यवाणी

ग्राहक मंथन की भविष्यवाणी करना एक बहुत ही सामान्य व्यावसायिक आवश्यकता है। कई अध्ययनों से पता चलता है कि एक मौजूदा ग्राहक को बनाए रखने की लागत एक नया ग्राहक प्राप्त करने की तुलना में बहुत कम है। चुनौती अक्सर उन व्यवसायों से आती है जिन्हें यह समझने में कठिन समय होता है कि ग्राहक क्यों मंथन कर रहा है, या एक मॉडल का निर्माण कर रहा है जो मंथन की भविष्यवाणी करता है।

इस उदाहरण में, जो उपयोगकर्ता एमएल के लिए नए हैं, वे अनुभव कर सकते हैं कि कैसे एक मोबाइल कॉल लेनदेन डेटासेट का उपयोग करके एक मंथन भविष्यवाणी मॉडल को जल्दी से विकसित किया जा सकता है। यह समाधान ग्राहक प्रोफ़ाइल डेटासेट पर XGBoost मॉडल को प्रशिक्षित करने और तैनात करने के लिए SageMaker का उपयोग करता है ताकि यह अनुमान लगाया जा सके कि ग्राहक के मोबाइल फोन ऑपरेटर को छोड़ने की संभावना है या नहीं।

यह समाधान जिस डेटासेट का उपयोग करता है वह सार्वजनिक रूप से उपलब्ध है और इसका उल्लेख डेनियल टी. लारोज़ की पुस्तक डिस्कवरिंग नॉलेज इन डेटा में किया गया है। इसका श्रेय लेखक ने यूनिवर्सिटी ऑफ कैलिफोर्निया इरविन रिपोजिटरी ऑफ मशीन लर्निंग डेटासेट्स को दिया है।

यह डेटासेट किसी अज्ञात यूएस मोबाइल ऑपरेटर के ग्राहक की प्रोफ़ाइल का वर्णन करने के लिए निम्नलिखित 21 विशेषताओं का उपयोग करता है।

राज्य: अमेरिकी राज्य जिसमें ग्राहक रहता है, दो अक्षरों के संक्षिप्त नाम द्वारा दर्शाया गया है; उदाहरण के लिए, OH या NJ
खाते की अवधि: यह खाता सक्रिय हुए दिनों की संख्या
क्षेत्र कोड: संबंधित ग्राहक के फ़ोन नंबर का तीन अंकों का क्षेत्र कोड
फ़ोन: शेष सात अंकों का फ़ोन नंबर
अंतर्राष्ट्रीय योजना: क्या ग्राहक के पास अंतर्राष्ट्रीय कॉलिंग योजना है: हाँ/नहीं
VMail योजना: क्या ग्राहक के पास वॉइस मेल सुविधा है: हाँ/नहीं
VMail संदेश: प्रति माह ध्वनि मेल संदेशों की औसत संख्या
दिन मिनट: दिन के दौरान उपयोग किए जाने वाले कॉलिंग मिनटों की कुल संख्या
दिन की कॉलें: दिन के दौरान की गई कॉलों की कुल संख्या
दिन का शुल्क: दिन के समय की कॉल की बिल लागत
ईव मिनट्स, ईव कॉल्स, ईव चार्ज: शाम के दौरान की गई कॉलों की बिल की लागत
रात के मिनट, रात की कॉल, रात का शुल्क: रात के समय की गई कॉलों की बिल लागत
अंतरराष्ट्रीय मिनट, अंतरराष्ट्रीय कॉल, अंतरराष्ट्रीय शुल्क: अंतरराष्ट्रीय कॉल के लिए बिल की लागत
CustServ कॉल्स: Customer Service को किए गए कॉलों की संख्या
मंथन ?: क्या ग्राहक ने सेवा छोड़ दी: सच/गलत

इस समाधान में तीन चरण होते हैं:

डेटा तैयार करें।
XGBoost मॉडल बनाएं और प्रशिक्षित करें।
एक समापन बिंदु परिनियोजित करें और मॉडल के प्रदर्शन का मूल्यांकन करें।

हमें निम्नलिखित आउटपुट मिलता है:

उपयोगकर्ता मंथन की भविष्यवाणी करने के लिए हमारे उदाहरण डेटासेट पर आधारित एक प्रशिक्षित XGBoost मॉडल
एक सेजमेकर एंडपॉइंट जो उपयोगकर्ता मंथन की भविष्यवाणी कर सकता है

यह मॉडल यह अनुमान लगाने में मदद करता है कि 5,000 मोबाइल फोन ग्राहकों में से कितने अपने वर्तमान मोबाइल फोन ऑपरेटर का उपयोग बंद कर देंगे।

निम्नलिखित चार्ट मॉडल से आउटपुट के रूप में मंथन की संभाव्यता वितरण दिखाता है।

आप इसे निम्नलिखित उपयोग मामलों के लिए अपने व्यवसाय में लागू कर सकते हैं:

अपने खुद के व्यवसाय में ग्राहक मंथन की भविष्यवाणी करें
वर्गीकृत करें कि कौन से ग्राहक आपका मार्केटिंग ईमेल खोल सकते हैं और कौन नहीं (बाइनरी वर्गीकरण)
भविष्यवाणी करें कि किन छात्रों के पाठ्यक्रम से बाहर होने की संभावना है

संसाधनों को साफ करें

जम्पस्टार्ट में समाधान चलाने के बाद, चुनना सुनिश्चित करें सभी संसाधन हटाएं इसलिए आपके द्वारा इस प्रक्रिया में बनाए गए सभी संसाधन हटा दिए जाते हैं और आपकी बिलिंग रोक दी जाती है।

सारांश

इस पोस्ट ने आपको जम्पस्टार्ट समाधानों के आधार पर एमएल लागू करके विभिन्न व्यावसायिक समस्याओं को हल करने का तरीका दिखाया। हालांकि यह पोस्ट हाल ही में जम्पस्टार्ट में जोड़े गए पांच नए समाधानों पर केंद्रित है, लेकिन कुल 23 उपलब्ध समाधान हैं। हम आपको स्टूडियो में लॉग इन करने और जम्पस्टार्ट समाधानों को स्वयं देखने और उनसे तत्काल मूल्य प्राप्त करने के लिए प्रोत्साहित करते हैं। अधिक जानकारी के लिए देखें अमेज़ॅन सैजमेकर स्टूडियो और सेजमेकर जम्पस्टार्ट.

नोट: यदि आप अपने एडब्ल्यूएस क्षेत्र के जम्पस्टार्ट कंसोल में उपरोक्त सभी पांच समाधान नहीं देखते हैं, तो कृपया एक सप्ताह तक प्रतीक्षा करें और फिर से जांच करें। हम उन्हें चरणबद्ध तरीके से विभिन्न क्षेत्रों में जारी कर रहे हैं।

लेखक के बारे में

डॉ. राजू पेनमाचा एडब्ल्यूएस में एआई प्लेटफॉर्म्स में एआई/एमएल स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। वह सेजमेकर में सेवाओं के लो-कोड/नो-कोड सूट पर काम करता है जो ग्राहकों को आसानी से मशीन लर्निंग मॉडल और समाधान बनाने और तैनात करने में मदद करता है। जब वह ग्राहकों की मदद नहीं करता, तो वह नई जगहों की यात्रा करना पसंद करता है।

मनन शाह Amazon वेब सर्विसेज में सॉफ्टवेयर डेवलपमेंट मैनेजर हैं। वह एक एमएल उत्साही है और नो-कोड/लो-कोड एआई/एमएल उत्पादों के निर्माण पर ध्यान केंद्रित करता है। वह महान सॉफ्टवेयर बनाने के लिए अन्य प्रतिभाशाली, तकनीकी लोगों को सशक्त बनाने का प्रयास करता है।

समय टिकट: अक्टूबर 31नवम्बर 1/2022

समय टिकट: जून 6, 2023

Amazon SageMaker जम्पस्टार्ट समाधानों में मशीन लर्निंग के माध्यम से व्यवसाय की समस्याओं को शुरू से अंत तक हल करें

प्लेटो द्वारा पुनर्प्रकाशित

समाधान अवलोकन

.. पूर्वापेक्षाएँ

मूल्य अनुकूलन

पक्षी प्रजातियों की भविष्यवाणी

फेफड़े के कैंसर से बचने की भविष्यवाणी

वित्तीय भुगतान वर्गीकरण

मोबाइल फोन ग्राहकों के लिए मंथन की भविष्यवाणी

संसाधनों को साफ करें

सारांश

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

Amazon SageMaker Studio जीवनचक्र कॉन्फ़िगरेशन को परिनियोजित करने के लिए AWS CDK का उपयोग करें अमेज़न वेब सेवाएँ

साप्ताहिक पूर्वानुमान अब रविवार को अमेज़न पूर्वानुमान के साथ शुरू हो सकते हैं

अमेज़ॅन सेजमेकर स्वचालित मॉडल ट्यूनिंग अब हाइपरबैंड के साथ तीन गुना तेज हाइपरपैरामीटर ट्यूनिंग प्रदान करता है

अमेज़ॅन केंद्र इंटेलिजेंट रैंकिंग और ओपनसर्च प्लगइन के साथ बेहतर खोज परिणाम प्राप्त करें

AWS सर्वर रहित और मशीन लर्निंग सेवाओं का उपयोग करके रीयल-टाइम धोखाधड़ी का पता लगाना

Amazon SageMaker पाइपलाइनों के साथ Amazon पैकेजिंग इनोवेशन में ML पाइपलाइनों की स्थिरता और लचीलेपन में सुधार

Amazon SageMaker Python SDK का उपयोग करके Amazon SageMaker ऑफ़लाइन फ़ीचर स्टोर से मशीन सीखने के लिए तैयार डेटासेट बनाएँ | अमेज़न वेब सेवाएँ

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा