अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

अपने Amazon Rekognition कस्टम लेबल मॉडल को बेहतर बनाने के लिए टिप्स

इस पोस्ट में, हम आपके कंप्यूटर विज़न मॉडल के प्रदर्शन को बेहतर बनाने के लिए सर्वोत्तम प्रथाओं पर चर्चा करते हैं अमेज़ॅन रेकग्निशन कस्टम लेबल. रिकॉग्निशन कस्टम लेबल छवि वर्गीकरण और ऑब्जेक्ट डिटेक्शन उपयोग मामलों के लिए कस्टम कंप्यूटर विज़न मॉडल बनाने के लिए पूरी तरह से प्रबंधित सेवा है। मान्यता कस्टम लेबल में पूर्व-प्रशिक्षित मॉडल का निर्माण होता है अमेज़ॅन रेकग्निशन, जो पहले से ही कई श्रेणियों में लाखों छवियों पर प्रशिक्षित हैं। हजारों छवियों के बजाय, आप प्रशिक्षण छवियों के एक छोटे से सेट (कुछ सौ या उससे कम) के साथ शुरुआत कर सकते हैं जो आपके उपयोग के मामले के लिए विशिष्ट हैं। मान्यता कस्टम लेबल एक कस्टम मॉडल के निर्माण में शामिल जटिलता को दूर करता है। यह स्वचालित रूप से प्रशिक्षण डेटा का निरीक्षण करता है, सही एमएल एल्गोरिदम का चयन करता है, उदाहरण प्रकार का चयन करता है, विभिन्न हाइपरपैरामीटर सेटिंग्स के साथ कई उम्मीदवार मॉडल को प्रशिक्षित करता है, और सर्वश्रेष्ठ प्रशिक्षित मॉडल का उत्पादन करता है। पहचान कस्टम लेबल्स से उपयोग में आसान इंटरफ़ेस भी प्रदान करता है एडब्ल्यूएस प्रबंधन कंसोल छवियों को लेबल करने, मॉडल को प्रशिक्षित करने, मॉडल को तैनात करने और परीक्षण के परिणामों की कल्पना करने सहित संपूर्ण एमएल वर्कफ़्लो के प्रबंधन के लिए।

ऐसे समय होते हैं जब किसी मॉडल की सटीकता सबसे अच्छी नहीं होती है, और आपके पास मॉडल के कॉन्फ़िगरेशन पैरामीटर को समायोजित करने के लिए कई विकल्प नहीं होते हैं। परदे के पीछे ऐसे कई कारक हैं जो उच्च प्रदर्शन वाले मॉडल के निर्माण में महत्वपूर्ण भूमिका निभाते हैं, जैसे कि निम्नलिखित:

  • चित्र कोण
  • छवि वियोजन
  • छवि पहलू अनुपात
  • हल्का
  • पृष्ठभूमि की स्पष्टता और जीवंतता
  • रंग विपरीत
  • नमूना डेटा आकार

प्रोडक्शन-ग्रेड रिकग्निशन कस्टम लेबल मॉडल को प्रशिक्षित करने के लिए सामान्य चरणों का पालन किया जाता है:

  1. समीक्षा वर्गीकरण - यह उन विशेषताओं / वस्तुओं की सूची को परिभाषित करता है जिन्हें आप एक छवि में पहचानना चाहते हैं।
  2. प्रासंगिक डेटा एकत्र करें - यह सबसे महत्वपूर्ण कदम है, जहां आपको प्रासंगिक छवियों को एकत्र करने की आवश्यकता होती है, जो कि आप एक उत्पादन वातावरण में देखेंगे। इसमें अलग-अलग पृष्ठभूमि, प्रकाश व्यवस्था या कैमरा कोण वाली वस्तुओं की छवियां शामिल हो सकती हैं। फिर आप एकत्रित छवियों को विभाजित करके एक प्रशिक्षण और परीक्षण डेटासेट बनाते हैं। आपको परीक्षण डेटासेट के हिस्से के रूप में केवल वास्तविक दुनिया की छवियों को शामिल करना चाहिए, और किसी भी कृत्रिम रूप से उत्पन्न छवियों को शामिल नहीं करना चाहिए। आपके द्वारा एकत्र किए गए डेटा की व्याख्याएं मॉडल के प्रदर्शन के लिए महत्वपूर्ण हैं। सुनिश्चित करें कि बाउंडिंग बॉक्स वस्तुओं के चारों ओर तंग हैं और लेबल सटीक हैं। हम कुछ युक्तियों पर चर्चा करते हैं जिन पर आप इस पोस्ट में बाद में उपयुक्त डेटासेट बनाते समय विचार कर सकते हैं।
  3. प्रशिक्षण मेट्रिक्स की समीक्षा करें - मॉडल को प्रशिक्षित करने के लिए पिछले डेटासेट का उपयोग करें और F1 स्कोर, सटीक और रिकॉल के लिए प्रशिक्षण मेट्रिक्स की समीक्षा करें। हम इस पोस्ट में बाद में प्रशिक्षण मेट्रिक्स का विश्लेषण करने के तरीके के बारे में विस्तार से चर्चा करेंगे।
  4. प्रशिक्षित मॉडल का मूल्यांकन करें - भविष्यवाणियों का मूल्यांकन करने के लिए ज्ञात लेबल के साथ अनदेखी छवियों (मॉडल के प्रशिक्षण के लिए उपयोग नहीं की गई) के एक सेट का उपयोग करें। यह कदम हमेशा यह सुनिश्चित करने के लिए किया जाना चाहिए कि मॉडल उत्पादन वातावरण में अपेक्षित प्रदर्शन करता है।
  5. पुन: प्रशिक्षण (वैकल्पिक) - सामान्य तौर पर, किसी भी मशीन लर्निंग मॉडल को प्रशिक्षित करना वांछित परिणाम प्राप्त करने के लिए एक पुनरावृत्ति प्रक्रिया है, एक कंप्यूटर विज़न मॉडल अलग नहीं है। चरण 4 में परिणामों की समीक्षा करें, यह देखने के लिए कि क्या प्रशिक्षण डेटा में अधिक छवियों को जोड़ने की आवश्यकता है और उपरोक्त चरण 3 - 5 को दोहराएं।

इस पोस्ट में, हम आपके मॉडल के प्रदर्शन को बेहतर बनाने के लिए प्रासंगिक डेटा (चरण 2) एकत्र करने और आपके प्रशिक्षित मीट्रिक (चरण 3) का मूल्यांकन करने के सर्वोत्तम अभ्यासों पर ध्यान केंद्रित करते हैं।

प्रासंगिक डेटा एकत्र करें

यह प्रोडक्शन-ग्रेड रिकग्निशन कस्टम लेबल मॉडल के प्रशिक्षण का सबसे महत्वपूर्ण चरण है। विशेष रूप से, दो डेटासेट हैं: प्रशिक्षण और परीक्षण। प्रशिक्षण डेटा का उपयोग मॉडल को प्रशिक्षित करने के लिए किया जाता है, और आपको एक उपयुक्त प्रशिक्षण सेट बनाने के लिए प्रयास करने की आवश्यकता होती है। मान्यता कस्टम लेबल मॉडल के लिए अनुकूलित हैं एफ 1 का स्कोर अपने प्रोजेक्ट के लिए सबसे सटीक मॉडल का चयन करने के लिए परीक्षण डेटासेट पर। इसलिए, वास्तविक दुनिया से मिलता-जुलता परीक्षण डेटासेट बनाना आवश्यक है।

छवियों की संख्या

हम अनुशंसा करते हैं कि प्रति लेबल कम से कम 15-20 छवियां हों। अधिक विविधताओं वाली अधिक छवियां होने से जो आपके उपयोग के मामले को दर्शाती हैं, मॉडल के प्रदर्शन में सुधार करेगी।

संतुलित डेटासेट

आदर्श रूप से, डेटासेट में प्रत्येक लेबल में समान संख्या में नमूने होने चाहिए। प्रति लेबल छवियों की संख्या में भारी असमानता नहीं होनी चाहिए। उदाहरण के लिए, एक डेटासेट जहां एक लेबल के लिए छवियों की उच्चतम संख्या 1,000 बनाम 50 है, दूसरे लेबल के लिए छवियां एक असंतुलित डेटासेट जैसा दिखता है। हम अनुशंसा करते हैं कि छवियों की सबसे कम संख्या वाले लेबल बनाम छवियों की उच्चतम संख्या वाले लेबल के बीच 1:50 के एकतरफा अनुपात वाले परिदृश्यों से बचें।

विभिन्न प्रकार की छवियां

प्रशिक्षण और परीक्षण डेटासेट में छवियां शामिल करें जो वास्तविक दुनिया में आपके द्वारा उपयोग की जाने वाली चीज़ों से मिलती-जुलती हैं। उदाहरण के लिए, यदि आप लिविंग रूम बनाम बेडरूम की छवियों को वर्गीकृत करना चाहते हैं, तो आपको दोनों कमरों की खाली और सुसज्जित छवियों को शामिल करना चाहिए।

निम्नलिखित एक सुसज्जित रहने वाले कमरे की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

इसके विपरीत, निम्नलिखित एक असज्जित रहने वाले कमरे का एक उदाहरण है।

निम्नलिखित एक सुसज्जित बेडरूम की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

निम्नलिखित एक असज्जित बेडरूम की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

बदलती पृष्ठभूमि

विभिन्न पृष्ठभूमि वाले चित्र शामिल करें। प्राकृतिक संदर्भ वाली छवियां सादे पृष्ठभूमि की तुलना में बेहतर परिणाम प्रदान कर सकती हैं।

निम्नलिखित एक घर के सामने के यार्ड की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

निम्नलिखित एक अलग पृष्ठभूमि के साथ एक अलग घर के सामने के यार्ड की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

अलग-अलग प्रकाश व्यवस्था की स्थिति

अलग-अलग प्रकाश वाली छवियों को शामिल करें ताकि यह अनुमान के दौरान होने वाली विभिन्न प्रकाश स्थितियों को कवर कर सके (उदाहरण के लिए, फ्लैश के साथ और बिना)। आप अलग-अलग संतृप्ति, रंग और चमक वाली छवियां भी शामिल कर सकते हैं।

निम्नलिखित सामान्य प्रकाश में एक फूल की एक उदाहरण छवि है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

इसके विपरीत, निम्न छवि तेज रोशनी में उसी फूल की है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

भिन्न कोण

वस्तु के विभिन्न कोणों से ली गई छवियों को शामिल करें। यह मॉडल को वस्तुओं की विभिन्न विशेषताओं को सीखने में मदद करता है।

निम्नलिखित चित्र विभिन्न कोणों से एक ही शयन कक्ष की हैं।

 अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.   अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

ऐसे अवसर हो सकते हैं जहां विभिन्न प्रकार की छवियों को प्राप्त करना संभव न हो। उन परिदृश्यों में, सिंथेटिक छवियों को प्रशिक्षण डेटासेट के हिस्से के रूप में उत्पन्न किया जा सकता है। सामान्य छवि वृद्धि तकनीकों के बारे में अधिक जानकारी के लिए देखें डेटा ऑगमेंटेशन.

नकारात्मक लेबल जोड़ें

छवि वर्गीकरण के लिए, नकारात्मक लेबल जोड़ने से मॉडल सटीकता बढ़ाने में मदद मिल सकती है। उदाहरण के लिए, आप एक नकारात्मक लेबल जोड़ सकते हैं, जो किसी भी आवश्यक लेबल से मेल नहीं खाता। निम्नलिखित छवि पूर्ण विकसित फूलों की पहचान करने के लिए उपयोग किए जाने वाले विभिन्न लेबलों का प्रतिनिधित्व करती है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

नकारात्मक लेबल जोड़ना not_fully_grown मॉडल को उन विशेषताओं को सीखने में मदद करता है जो इसका हिस्सा नहीं हैं fully_grown लेबल।

लेबल भ्रम को संभालना

प्रशिक्षण या परीक्षण डेटासेट में छूटे किसी भी पैटर्न को पहचानने के लिए परीक्षण डेटासेट पर परिणामों का विश्लेषण करें। कभी-कभी छवियों की दृष्टि से जांच करके ऐसे पैटर्न को खोजना आसान होता है। निम्न छवि में, मॉडल पिछवाड़े बनाम आंगन लेबल के बीच हल करने के लिए संघर्ष कर रहा है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

इस परिदृश्य में, डेटासेट में इन लेबलों में और छवियां जोड़ना और लेबलों को फिर से परिभाषित करना ताकि प्रत्येक लेबल अलग हो, मॉडल की सटीकता को बढ़ाने में मदद कर सकता है।

डेटा वृद्धि

रिकॉग्निशन कस्टम लेबल के अंदर, हम मॉडल प्रशिक्षण के लिए विभिन्न डेटा संवर्द्धन करते हैं, जिसमें छवि की यादृच्छिक क्रॉपिंग, रंग घबराना, यादृच्छिक गाऊसी शोर, और बहुत कुछ शामिल है। आपके विशिष्ट उपयोग के मामलों के आधार पर, आपके प्रशिक्षण डेटा में अधिक स्पष्ट डेटा संवर्द्धन जोड़ना भी फायदेमंद हो सकता है। उदाहरण के लिए, यदि आप रंग और श्वेत और श्याम दोनों छवियों में जानवरों का पता लगाने में रुचि रखते हैं, तो आप प्रशिक्षण डेटा में समान छवियों के काले और सफेद और रंग संस्करण जोड़कर संभावित रूप से बेहतर सटीकता प्राप्त कर सकते हैं।

हम परीक्षण डेटा पर संवर्द्धन की अनुशंसा नहीं करते हैं जब तक कि संवर्द्धन आपके उत्पादन उपयोग के मामलों को प्रतिबिंबित न करें।

प्रशिक्षण मेट्रिक्स की समीक्षा करें

F1 स्कोर, सटीक, रिकॉल और कल्पित थ्रेशोल्ड हैं मेट्रिक्स जो रिकॉग्निशन कस्टम लेबल का उपयोग करके एक मॉडल के प्रशिक्षण के आउटपुट के रूप में उत्पन्न होते हैं। प्रदान किए गए परीक्षण डेटासेट के आधार पर मॉडल को सर्वश्रेष्ठ F1 स्कोर के लिए अनुकूलित किया गया है। परीक्षण डेटासेट के आधार पर कल्पित सीमा भी उत्पन्न होती है। आप सटीकता या याद के संदर्भ में अपनी व्यावसायिक आवश्यकता के आधार पर सीमा को समायोजित कर सकते हैं।

क्योंकि परीक्षण डेटासेट पर कल्पित थ्रेशोल्ड सेट किए गए हैं, एक उपयुक्त परीक्षण सेट को वास्तविक दुनिया के उत्पादन उपयोग के मामले को प्रतिबिंबित करना चाहिए। यदि परीक्षण डेटासेट उपयोग के मामले का प्रतिनिधि नहीं है, तो आप अपनी वास्तविक दुनिया की छवियों पर कृत्रिम रूप से उच्च F1 स्कोर और खराब मॉडल प्रदर्शन देख सकते हैं।

मॉडल का प्रारंभिक मूल्यांकन करते समय ये मीट्रिक सहायक होते हैं। प्रोडक्शन-ग्रेड सिस्टम के लिए, हम वास्तविक दुनिया के बाहरी डेटासेट (500-1,000 अनदेखी छवियों) के प्रतिनिधि के खिलाफ मॉडल का मूल्यांकन करने की सलाह देते हैं। यह मूल्यांकन करने में मदद करता है कि मॉडल एक उत्पादन प्रणाली में कैसा प्रदर्शन करेगा और किसी भी लापता पैटर्न की पहचान भी करेगा और मॉडल को फिर से प्रशिक्षित करके उन्हें सही करेगा। यदि आप F1 स्कोर और बाहरी मूल्यांकन के बीच एक बेमेल देखते हैं, तो हमारा सुझाव है कि आप जांच करें कि क्या आपका परीक्षण डेटा वास्तविक दुनिया के उपयोग के मामले को प्रतिबिंबित कर रहा है।

निष्कर्ष

इस पोस्ट में, हमने आपको पहचान कस्टम लेबल मॉडल में सुधार के लिए सर्वोत्तम प्रथाओं के बारे में बताया। हम आपको इसके बारे में और जानने के लिए प्रोत्साहित करते हैं मान्यता कस्टम लेबल और इसे अपने व्यवसाय-विशिष्ट डेटासेट के लिए आज़माएँ।


लेखक के बारे में

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.अमित गुप्ता एडब्ल्यूएस में वरिष्ठ एआई सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। वह बड़े पैमाने पर अच्छी तरह से आर्किटेक्टेड मशीन लर्निंग सॉल्यूशंस के साथ ग्राहकों को सक्षम बनाने के बारे में भावुक हैं।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.योगेश चतुर्वेदी कंप्यूटर विज़न पर ध्यान देने के साथ AWS में सॉल्यूशन आर्किटेक्ट हैं। वह क्लाउड तकनीकों का उपयोग करके ग्राहकों की व्यावसायिक चुनौतियों का समाधान करने के लिए उनके साथ काम करता है। काम के बाहर, उन्हें लंबी पैदल यात्रा, यात्रा करना और खेल देखना पसंद है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.हाओ यांगो Amazon Rekognition Custom Labels टीम में वरिष्ठ अनुप्रयुक्त वैज्ञानिक हैं। उनकी मुख्य शोध रुचियां सीमित टिप्पणियों के साथ वस्तु का पता लगाना और सीखना हैं। बाहर के कामों में, हाओ को फिल्में देखना, फोटोग्राफी करना और बाहरी गतिविधियों का आनंद मिलता है।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.पश्मीन मिस्त्री Amazon Rekognition Custom Labels के वरिष्ठ उत्पाद प्रबंधक हैं। काम के अलावा, पश्मीन को एडवेंचरस हाइक, फोटोग्राफी और अपने परिवार के साथ समय बिताना पसंद है।

समय टिकट:

से अधिक AWS मशीन लर्निंग

अमेज़ॅन सेजमेकर कैनवस और जेनरेटिव एआई | का उपयोग करके अपने व्यावसायिक उपयोगकर्ताओं को कंपनी दस्तावेज़ों से अंतर्दृष्टि निकालने के लिए सशक्त बनाएं अमेज़न वेब सेवाएँ

स्रोत नोड: 1909087
समय टिकट: अक्टूबर 26, 2023

क्विकसाइट में अमेज़ॅन क्यू बिजनेस और अमेज़ॅन क्यू कर्मचारियों को अधिक डेटा-संचालित होने और कंपनी के ज्ञान का उपयोग करके बेहतर, तेज़ निर्णय लेने का अधिकार देता है | अमेज़न वेब सेवाएँ

स्रोत नोड: 1969885
समय टिकट: अप्रैल 30, 2024