अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.

अमेज़ॅन सैजमेकर जम्पस्टार्ट का उपयोग करके उच्च प्रदर्शन करने वाली छवि वर्गीकरण मॉडल बनाएं

छवि वर्गीकरण एक कंप्यूटर दृष्टि-आधारित मशीन लर्निंग (एमएल) तकनीक है जो आपको छवियों को वर्गीकृत करने की अनुमति देती है। छवि वर्गीकरण के कुछ प्रसिद्ध उदाहरणों में हस्तलिखित अंकों का वर्गीकरण, चिकित्सा छवि वर्गीकरण और चेहरे की पहचान शामिल है। छवि वर्गीकरण कई व्यावसायिक अनुप्रयोगों के साथ एक उपयोगी तकनीक है, लेकिन एक अच्छा छवि वर्गीकरण मॉडल बनाना तुच्छ नहीं है।

एमएल मॉडल का मूल्यांकन करते समय कई विचार भूमिका निभा सकते हैं। मॉडल सटीकता से परे, महत्व के अन्य संभावित मेट्रिक्स मॉडल प्रशिक्षण समय और अनुमान समय हैं। एमएल मॉडल के विकास की पुनरावृत्ति प्रकृति को देखते हुए, तेज प्रशिक्षण समय डेटा वैज्ञानिकों को विभिन्न परिकल्पनाओं का त्वरित परीक्षण करने की अनुमति देता है। रीयल-टाइम अनुप्रयोगों में तेज़ अनुमान लगाना महत्वपूर्ण हो सकता है।

अमेज़न SageMaker जम्पस्टार्ट लोकप्रिय एमएल कार्यों में पूर्व-प्रशिक्षित मॉडलों की एक विस्तृत विविधता की एक-क्लिक फ़ाइन-ट्यूनिंग और परिनियोजन प्रदान करता है, साथ ही सामान्य व्यावसायिक समस्याओं को हल करने वाले एंड-टू-एंड समाधानों का चयन करता है। ये सुविधाएँ एमएल प्रक्रिया के प्रत्येक चरण से भारी भारोत्तोलन को हटा देती हैं, जिससे उच्च-गुणवत्ता वाले मॉडल विकसित करना आसान हो जाता है और तैनाती के लिए समय कम हो जाता है। जम्पस्टार्ट एपीआई आपको अपने स्वयं के डेटासेट पर जम्पस्टार्ट-समर्थित पूर्व-प्रशिक्षित मॉडल के विशाल चयन को प्रोग्रामेटिक रूप से परिनियोजित करने और फ़ाइन-ट्यून करने की अनुमति देता है।

आप परिनियोजन से पहले जम्पस्टार्ट में पेश किए गए एमएल मॉडल को वृद्धिशील रूप से प्रशिक्षित और ट्यून कर सकते हैं। इस लेखन के समय, जम्पस्टार्ट में 87 डीप-लर्निंग आधारित छवि वर्गीकरण मॉडल उपलब्ध हैं।

लेकिन कौन सा मॉडल आपको सबसे अच्छा परिणाम देगा? इस पोस्ट में, हम कई मॉडलों को आसानी से चलाने और ब्याज के तीन आयामों पर उनके आउटपुट की तुलना करने के लिए एक पद्धति प्रस्तुत करते हैं: मॉडल सटीकता, प्रशिक्षण समय और अनुमान समय।

समाधान अवलोकन

जम्पस्टार्ट आपको इसके यूआई या इसके एपीआई के साथ जम्पस्टार्ट कंसोल से मॉडल को प्रशिक्षित, ट्यून और तैनात करने की अनुमति देता है। इस पोस्ट में, हम एपीआई मार्ग का उपयोग करते हैं, और विभिन्न सहायक लिपियों के साथ एक नोटबुक प्रस्तुत करते हैं। आप इस नोटबुक को चला सकते हैं और एक दूसरे के विरुद्ध इन मॉडलों की आसान तुलना के लिए परिणाम प्राप्त कर सकते हैं, और फिर मॉडल सटीकता, प्रशिक्षण समय और अनुमान समय के संदर्भ में आपके व्यवसाय की आवश्यकता के लिए उपयुक्त मॉडल चुन सकते हैं।

RSI सार्वजनिक डाटासेट इस पोस्ट में उपयोग की गई रोगग्रस्त और स्वस्थ पौधों की लगभग 55,000 छवियों को नियंत्रित परिस्थितियों में एकत्र किया गया है, जिसमें 0–38 तक के वर्ग लेबल हैं। इस डेटासेट को प्रशिक्षण और सत्यापन डेटासेट में विभाजित किया गया है, जिसमें लगभग 44,000 प्रशिक्षण के तहत और 11,000 चित्र सत्यापन के तहत हैं। निम्नलिखित कुछ नमूना चित्र हैं।

इस अभ्यास के लिए, हमने जम्पस्टार्ट द्वारा प्रस्तावित दो रूपरेखाओं-प्योरोर्च और टेन्सरफ्लो- से मॉडलों का चयन किया। निम्नलिखित 15 मॉडल एल्गोरिदम इन रूपरेखाओं से लोकप्रिय तंत्रिका नेटवर्क आर्किटेक्चर की एक विस्तृत श्रृंखला को कवर करते हैं:

  • pytorch-ic-alexnet-FT
  • pytorch-ic-densenet121-FT
  • pytorch-ic-densenet201-FT
  • pytorch-ic-googlenet-FT
  • pytorch-ic-mobilenet-v2-FT
  • pytorch-ic-resnet152-FT
  • pytorch-ic-resnet34-FT
  • tensorflow-ic-bit-s-r101x1-ilsvrc2012-classification-1-FT
  • tensorflow-ic-imagenet-inception-resnet-v2-classification 4-FT
  • tensorflow-ic-imagenet-inception-v3-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-050-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-075-224-classification-4-FT
  • tensorflow-ic-imagenet-mobilenet-v2-140-224-classification-4-FT
  • tensorflow-ic-imagenet-resnet-v2-152-classification-4-FT
  • tensorflow-ic-tf2-preview-mobilenet-v2-classification-4-FT

हम मॉडल का उपयोग करते हैं tensorflow-ic-imagenet-inception-v3-classification-4-FT एक आधार के रूप में जिसके विरुद्ध अन्य मॉडलों के परिणामों की तुलना की जाती है। यह आधार मॉडल मनमाने ढंग से चुना गया था।

इस तुलना को चलाने के लिए प्रयुक्त कोड पर उपलब्ध है AWS नमूने GitHub रेपो.

परिणाम

इस खंड में, हम इन 15 रनों से परिणाम प्रस्तुत करते हैं। इन सभी रनों के लिए, इस्तेमाल किए गए हाइपरपैरामीटर युग = 5, सीखने की दर = 0.001, बैच आकार = 16 थे।

मॉडल सटीकता, प्रशिक्षण समय और मॉडल से अनुमान समय tensorflow-ic-imagenet-inception-v3-classification-4-FT आधार के रूप में लिया गया था, और अन्य सभी मॉडलों के परिणाम इस आधार मॉडल के सापेक्ष प्रस्तुत किए गए हैं। हमारा इरादा यहां यह दिखाना नहीं है कि कौन सा मॉडल सबसे अच्छा है बल्कि यह दिखाना है कि कैसे, जम्पस्टार्ट एपीआई के माध्यम से, आप विभिन्न मॉडलों के परिणामों की तुलना कर सकते हैं और फिर एक मॉडल का चयन कर सकते हैं जो आपके उपयोग के मामले में सबसे उपयुक्त है।

निम्न स्क्रीनशॉट उस आधार मॉडल को हाइलाइट करता है जिसके विरुद्ध अन्य सभी मॉडलों की तुलना की गई थी।

अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.

निम्नलिखित प्लॉट सापेक्ष सटीकता बनाम सापेक्ष प्रशिक्षण समय का विस्तृत दृश्य दिखाता है। PyTorch मॉडल लाल रंग में और TensorFlow मॉडल नीले रंग में कोडित होते हैं।

अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.

पिछली साजिश में एक हरे अंडाकार के साथ हाइलाइट किए गए मॉडल में सापेक्ष सटीकता और कम सापेक्ष प्रशिक्षण समय का अच्छा संयोजन होता है। निम्न तालिका इन तीन मॉडलों पर अधिक विवरण प्रदान करती है।

मॉडल का नाम सापेक्ष शुद्धता सापेक्ष प्रशिक्षण का समय
Tensorflow-ic-imagenet-mobilenet-v2-050-224-वर्गीकरण-4-एफटी 1.01 0.74
Tensorflow-ic-imagenet-mobilenet-v2-140-224-वर्गीकरण-4-एफटी 1.02 0.74
टेंसरफ़्लो-आईसी-बिट-s-r101x1-ilsvrc2012-वर्गीकरण-1-FT 1.04 1.16

निम्नलिखित प्लॉट सापेक्ष सटीकता बनाम सापेक्ष अनुमान समय की तुलना करता है। PyTorch मॉडल लाल रंग में और TensorFlow मॉडल नीले रंग में कोडित होते हैं।

अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.

निम्न तालिका हरे दीर्घवृत्त में तीन मॉडलों पर विवरण प्रदान करती है।

मॉडल का नाम सापेक्ष शुद्धता सापेक्ष निष्कर्ष समय
Tensorflow-ic-imagenet-mobilenet-v2-050-224-वर्गीकरण-4-एफटी 1.01 0.94
Tensorflow-ic-imagenet-mobilenet-v2-140-224-वर्गीकरण-4-एफटी 1.02 0.90
टेंसरफ़्लो-आईसी-बिट-s-r101x1-ilsvrc2012-वर्गीकरण-1-FT 1.04 1.43

दो प्लॉट स्पष्ट रूप से प्रदर्शित करते हैं कि कुछ मॉडल एल्गोरिदम ने चुने गए तीन आयामों पर दूसरों की तुलना में बेहतर प्रदर्शन किया। इस अभ्यास के माध्यम से पेश किया गया लचीलापन आपको सही एल्गोरिद्म चुनने में मदद कर सकता है, और प्रदान की गई नोटबुक का उपयोग करके, आप इस प्रकार के प्रयोग को 87 उपलब्ध मॉडलों में से किसी पर भी आसानी से चला सकते हैं।

निष्कर्ष

इस पोस्ट में, हमने दिखाया कि जम्पस्टार्ट का उपयोग कैसे करें ताकि मॉडल की सटीकता, प्रशिक्षण समय और अनुमान विलंबता जैसे रुचि के कई आयामों पर उच्च प्रदर्शन करने वाली छवि वर्गीकरण मॉडल का निर्माण किया जा सके। हमने इस अभ्यास को आपके स्वयं के डेटासेट पर चलाने के लिए कोड भी प्रदान किया है; जम्पस्टार्ट मॉडल हब में छवि वर्गीकरण के लिए वर्तमान में उपलब्ध 87 मॉडलों में से आप रुचि के किसी भी मॉडल को चुन सकते हैं। हम आपको आज इसे आजमाने के लिए प्रोत्साहित करते हैं।

जम्पस्टार्ट पर अधिक विवरण के लिए, देखें सेजमेकर जम्पस्टार्ट.


लेखक के बारे में

अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.डॉ. राजू पेनमाचा एडब्ल्यूएस में एआई प्लेटफॉर्म्स में एआई/एमएल स्पेशलिस्ट सॉल्यूशंस आर्किटेक्ट हैं। उन्होंने स्टैनफोर्ड विश्वविद्यालय से पीएचडी की उपाधि प्राप्त की। वह सेजमेकर में सेवाओं के कम/नो-कोड सूट पर बारीकी से काम करता है, जो ग्राहकों को आसानी से मशीन लर्निंग मॉडल और समाधान बनाने और तैनात करने में मदद करता है। ग्राहकों की मदद न करने पर, वह नई जगहों की यात्रा करना पसंद करते हैं।

अमेज़ॅन सेजमेकर जम्पस्टार्ट प्लेटोब्लॉकचेन डेटा इंटेलिजेंस का उपयोग करके उच्च प्रदर्शन वाले छवि वर्गीकरण मॉडल बनाएं। लंबवत खोज. ऐ.डॉ आशीष खेतानी Amazon SageMaker बिल्ट-इन एल्गोरिदम के साथ एक वरिष्ठ एप्लाइड साइंटिस्ट हैं और मशीन लर्निंग एल्गोरिदम विकसित करने में मदद करते हैं। उन्होंने इलिनोइस विश्वविद्यालय उरबाना-शैंपेन से पीएचडी की उपाधि प्राप्त की। वह मशीन लर्निंग और सांख्यिकीय अनुमान में एक सक्रिय शोधकर्ता हैं, और उन्होंने NeurIPS, ICML, ICLR, JMLR, ACL और EMNLP सम्मेलनों में कई पत्र प्रकाशित किए हैं।

समय टिकट:

से अधिक AWS मशीन लर्निंग

अमेज़ॅन सेजमेकर स्टूडियो और अमेज़ॅन सेजमेकर ऑटोपायलट का उपयोग करके उपग्रह छवि सुविधाओं का उपयोग करके मैंग्रोव वनों की पहचान करें - भाग 1

स्रोत नोड: 1497650
समय टिकट: जून 21, 2022