अमेज़ॅन सेजमेकर जम्पस्टार्ट का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

छवि वर्गीकरण एक कंप्यूटर दृष्टि-आधारित मशीन लर्निंग (एमएल) तकनीक है जो आपको छवियों को वर्गीकृत करने की अनुमति देती है। छवि वर्गीकरण के कुछ प्रसिद्ध उदाहरणों में हस्तलिखित अंकों का वर्गीकरण, चिकित्सा छवि वर्गीकरण और चेहरे की पहचान शामिल है। छवि वर्गीकरण कई व्यावसायिक अनुप्रयोगों के साथ एक उपयोगी तकनीक है, लेकिन एक अच्छा छवि वर्गीकरण मॉडल बनाना तुच्छ नहीं है।

एमएल मॉडल का मूल्यांकन करते समय कई विचार भूमिका निभा सकते हैं। मॉडल सटीकता से परे, महत्व के अन्य संभावित मेट्रिक्स मॉडल प्रशिक्षण समय और अनुमान समय हैं। एमएल मॉडल के विकास की पुनरावृत्ति प्रकृति को देखते हुए, तेज प्रशिक्षण समय डेटा वैज्ञानिकों को विभिन्न परिकल्पनाओं का त्वरित परीक्षण करने की अनुमति देता है। रीयल-टाइम अनुप्रयोगों में तेज़ अनुमान लगाना महत्वपूर्ण हो सकता है।

अमेज़न SageMaker जम्पस्टार्ट लोकप्रिय एमएल कार्यों में पूर्व-प्रशिक्षित मॉडलों की एक विस्तृत विविधता की एक-क्लिक फ़ाइन-ट्यूनिंग और परिनियोजन प्रदान करता है, साथ ही सामान्य व्यावसायिक समस्याओं को हल करने वाले एंड-टू-एंड समाधानों का चयन करता है। ये सुविधाएँ एमएल प्रक्रिया के प्रत्येक चरण से भारी भारोत्तोलन को हटा देती हैं, जिससे उच्च-गुणवत्ता वाले मॉडल विकसित करना आसान हो जाता है और तैनाती के लिए समय कम हो जाता है। जम्पस्टार्ट एपीआई आपको अपने स्वयं के डेटासेट पर जम्पस्टार्ट-समर्थित पूर्व-प्रशिक्षित मॉडल के विशाल चयन को प्रोग्रामेटिक रूप से परिनियोजित करने और फ़ाइन-ट्यून करने की अनुमति देता है।

आप परिनियोजन से पहले जम्पस्टार्ट में पेश किए गए एमएल मॉडल को वृद्धिशील रूप से प्रशिक्षित और ट्यून कर सकते हैं। इस लेखन के समय, जम्पस्टार्ट में 87 डीप-लर्निंग आधारित छवि वर्गीकरण मॉडल उपलब्ध हैं।

लेकिन कौन सा मॉडल आपको सबसे अच्छा परिणाम देगा? इस पोस्ट में, हम कई मॉडलों को आसानी से चलाने और ब्याज के तीन आयामों पर उनके आउटपुट की तुलना करने के लिए एक पद्धति प्रस्तुत करते हैं: मॉडल सटीकता, प्रशिक्षण समय और अनुमान समय।

समाधान अवलोकन

जम्पस्टार्ट आपको इसके यूआई या इसके एपीआई के साथ जम्पस्टार्ट कंसोल से मॉडल को प्रशिक्षित, ट्यून और तैनात करने की अनुमति देता है। इस पोस्ट में, हम एपीआई मार्ग का उपयोग करते हैं, और विभिन्न सहायक लिपियों के साथ एक नोटबुक प्रस्तुत करते हैं। आप इस नोटबुक को चला सकते हैं और एक दूसरे के विरुद्ध इन मॉडलों की आसान तुलना के लिए परिणाम प्राप्त कर सकते हैं, और फिर मॉडल सटीकता, प्रशिक्षण समय और अनुमान समय के संदर्भ में आपके व्यवसाय की आवश्यकता के लिए उपयुक्त मॉडल चुन सकते हैं।

RSI सार्वजनिक डाटासेट इस पोस्ट में उपयोग की गई रोगग्रस्त और स्वस्थ पौधों की लगभग 55,000 छवियों को नियंत्रित परिस्थितियों में एकत्र किया गया है, जिसमें 0–38 तक के वर्ग लेबल हैं। इस डेटासेट को प्रशिक्षण और सत्यापन डेटासेट में विभाजित किया गया है, जिसमें लगभग 44,000 प्रशिक्षण के तहत और 11,000 चित्र सत्यापन के तहत हैं। निम्नलिखित कुछ नमूना चित्र हैं।

इस अभ्यास के लिए, हमने जम्पस्टार्ट द्वारा प्रस्तावित दो रूपरेखाओं-प्योरोर्च और टेन्सरफ्लो- से मॉडलों का चयन किया। निम्नलिखित 15 मॉडल एल्गोरिदम इन रूपरेखाओं से लोकप्रिय तंत्रिका नेटवर्क आर्किटेक्चर की एक विस्तृत श्रृंखला को कवर करते हैं:

pytorch-ic-alexnet-FT
pytorch-ic-densenet121-FT
pytorch-ic-densenet201-FT
pytorch-ic-googlenet-FT
pytorch-ic-mobilenet-v2-FT
pytorch-ic-resnet152-FT
pytorch-ic-resnet34-FT
tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
tensorflow-ic-imagenet-inception-v3-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

हम मॉडल का उपयोग करते हैं tensorflow-ic-imagenet-inception-v3-classification-4-FT एक आधार के रूप में जिसके विरुद्ध अन्य मॉडलों के परिणामों की तुलना की जाती है। यह आधार मॉडल मनमाने ढंग से चुना गया था।

इस तुलना को चलाने के लिए प्रयुक्त कोड पर उपलब्ध है AWS नमूने GitHub रेपो.

परिणाम

इस खंड में, हम इन 15 रनों से परिणाम प्रस्तुत करते हैं। इन सभी रनों के लिए, इस्तेमाल किए गए हाइपरपैरामीटर युग = 5, सीखने की दर = 0.001, बैच आकार = 16 थे।

मॉडल सटीकता, प्रशिक्षण समय और मॉडल से अनुमान समय tensorflow-ic-imagenet-inception-v3-classification-4-FT आधार के रूप में लिया गया था, और अन्य सभी मॉडलों के परिणाम इस आधार मॉडल के सापेक्ष प्रस्तुत किए गए हैं। हमारा इरादा यहां यह दिखाना नहीं है कि कौन सा मॉडल सबसे अच्छा है बल्कि यह दिखाना है कि कैसे, जम्पस्टार्ट एपीआई के माध्यम से, आप विभिन्न मॉडलों के परिणामों की तुलना कर सकते हैं और फिर एक मॉडल का चयन कर सकते हैं जो आपके उपयोग के मामले में सबसे उपयुक्त है।

निम्न स्क्रीनशॉट उस आधार मॉडल को हाइलाइट करता है जिसके विरुद्ध अन्य सभी मॉडलों की तुलना की गई थी।

निम्नलिखित प्लॉट सापेक्ष सटीकता बनाम सापेक्ष प्रशिक्षण समय का विस्तृत दृश्य दिखाता है। PyTorch मॉडल लाल रंग में और TensorFlow मॉडल नीले रंग में कोडित होते हैं।

पिछली साजिश में एक हरे अंडाकार के साथ हाइलाइट किए गए मॉडल में सापेक्ष सटीकता और कम सापेक्ष प्रशिक्षण समय का अच्छा संयोजन होता है। निम्न तालिका इन तीन मॉडलों पर अधिक विवरण प्रदान करती है।

मॉडल का नाम	सापेक्ष शुद्धता	सापेक्ष प्रशिक्षण का समय
Tensorflow-ic-imagenet-mobilenet-v2-050-224-वर्गीकरण-4-एफटी	1.01	0.74
Tensorflow-ic-imagenet-mobilenet-v2-140-224-वर्गीकरण-4-एफटी	1.02	0.74
टेंसरफ़्लो-आईसी-बिट-s-r101x1-ilsvrc2012-वर्गीकरण-1-FT	1.04	1.16

निम्नलिखित प्लॉट सापेक्ष सटीकता बनाम सापेक्ष अनुमान समय की तुलना करता है। PyTorch मॉडल लाल रंग में और TensorFlow मॉडल नीले रंग में कोडित होते हैं।

निम्न तालिका हरे दीर्घवृत्त में तीन मॉडलों पर विवरण प्रदान करती है।

मॉडल का नाम	सापेक्ष शुद्धता	सापेक्ष निष्कर्ष समय
Tensorflow-ic-imagenet-mobilenet-v2-050-224-वर्गीकरण-4-एफटी	1.01	0.94
Tensorflow-ic-imagenet-mobilenet-v2-140-224-वर्गीकरण-4-एफटी	1.02	0.90
टेंसरफ़्लो-आईसी-बिट-s-r101x1-ilsvrc2012-वर्गीकरण-1-FT	1.04	1.43

दो प्लॉट स्पष्ट रूप से प्रदर्शित करते हैं कि कुछ मॉडल एल्गोरिदम ने चुने गए तीन आयामों पर दूसरों की तुलना में बेहतर प्रदर्शन किया। इस अभ्यास के माध्यम से पेश किया गया लचीलापन आपको सही एल्गोरिद्म चुनने में मदद कर सकता है, और प्रदान की गई नोटबुक का उपयोग करके, आप इस प्रकार के प्रयोग को 87 उपलब्ध मॉडलों में से किसी पर भी आसानी से चला सकते हैं।

निष्कर्ष

इस पोस्ट में, हमने दिखाया कि जम्पस्टार्ट का उपयोग कैसे करें ताकि मॉडल की सटीकता, प्रशिक्षण समय और अनुमान विलंबता जैसे रुचि के कई आयामों पर उच्च प्रदर्शन करने वाली छवि वर्गीकरण मॉडल का निर्माण किया जा सके। हमने इस अभ्यास को आपके स्वयं के डेटासेट पर चलाने के लिए कोड भी प्रदान किया है; जम्पस्टार्ट मॉडल हब में छवि वर्गीकरण के लिए वर्तमान में उपलब्ध 87 मॉडलों में से आप रुचि के किसी भी मॉडल को चुन सकते हैं। हम आपको आज इसे आजमाने के लिए प्रोत्साहित करते हैं।

जम्पस्टार्ट पर अधिक विवरण के लिए, देखें सेजमेकर जम्पस्टार्ट.

लेखक के बारे में

डॉ. राजू पेनमाचा एडब्ल्यूएस में एआई प्लेटफॉर्म्स में एआई/एमएल स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। उन्होंने स्टैनफोर्ड विश्वविद्यालय से पीएचडी की उपाधि प्राप्त की। वह सेजमेकर में सेवाओं के कम/नो-कोड सूट पर बारीकी से काम करता है, जो ग्राहकों को आसानी से मशीन लर्निंग मॉडल और समाधान बनाने और तैनात करने में मदद करता है। ग्राहकों की मदद न करने पर, वह नई जगहों की यात्रा करना पसंद करते हैं।

डॉ आशीष खेतानी Amazon SageMaker बिल्ट-इन एल्गोरिदम के साथ एक वरिष्ठ एप्लाइड साइंटिस्ट हैं और मशीन लर्निंग एल्गोरिदम विकसित करने में मदद करते हैं। उन्होंने इलिनोइस विश्वविद्यालय उरबाना-शैंपेन से पीएचडी की उपाधि प्राप्त की। वह मशीन लर्निंग और सांख्यिकीय अनुमान में एक सक्रिय शोधकर्ता हैं, और उन्होंने NeurIPS, ICML, ICLR, JMLR, ACL और EMNLP सम्मेलनों में कई पत्र प्रकाशित किए हैं।