अपने Amazon Recognition कस्टम लेबल मॉडल को बेहतर बनाने के लिए टिप्स

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

इस पोस्ट में, हम आपके कंप्यूटर विज़न मॉडल के प्रदर्शन को बेहतर बनाने के लिए सर्वोत्तम प्रथाओं पर चर्चा करते हैं अमेज़ॅन रेकग्निशन कस्टम लेबल. रिकॉग्निशन कस्टम लेबल छवि वर्गीकरण और ऑब्जेक्ट डिटेक्शन उपयोग मामलों के लिए कस्टम कंप्यूटर विज़न मॉडल बनाने के लिए पूरी तरह से प्रबंधित सेवा है। मान्यता कस्टम लेबल में पूर्व-प्रशिक्षित मॉडल का निर्माण होता है अमेज़ॅन रेकग्निशन, जो पहले से ही कई श्रेणियों में लाखों छवियों पर प्रशिक्षित हैं। हजारों छवियों के बजाय, आप प्रशिक्षण छवियों के एक छोटे से सेट (कुछ सौ या उससे कम) के साथ शुरुआत कर सकते हैं जो आपके उपयोग के मामले के लिए विशिष्ट हैं। मान्यता कस्टम लेबल एक कस्टम मॉडल के निर्माण में शामिल जटिलता को दूर करता है। यह स्वचालित रूप से प्रशिक्षण डेटा का निरीक्षण करता है, सही एमएल एल्गोरिदम का चयन करता है, उदाहरण प्रकार का चयन करता है, विभिन्न हाइपरपैरामीटर सेटिंग्स के साथ कई उम्मीदवार मॉडल को प्रशिक्षित करता है, और सर्वश्रेष्ठ प्रशिक्षित मॉडल का उत्पादन करता है। पहचान कस्टम लेबल्स से उपयोग में आसान इंटरफ़ेस भी प्रदान करता है एडब्ल्यूएस प्रबंधन कंसोल छवियों को लेबल करने, मॉडल को प्रशिक्षित करने, मॉडल को तैनात करने और परीक्षण के परिणामों की कल्पना करने सहित संपूर्ण एमएल वर्कफ़्लो के प्रबंधन के लिए।

ऐसे समय होते हैं जब किसी मॉडल की सटीकता सबसे अच्छी नहीं होती है, और आपके पास मॉडल के कॉन्फ़िगरेशन पैरामीटर को समायोजित करने के लिए कई विकल्प नहीं होते हैं। परदे के पीछे ऐसे कई कारक हैं जो उच्च प्रदर्शन वाले मॉडल के निर्माण में महत्वपूर्ण भूमिका निभाते हैं, जैसे कि निम्नलिखित:

चित्र कोण
छवि वियोजन
छवि पहलू अनुपात
हल्का
पृष्ठभूमि की स्पष्टता और जीवंतता
रंग विपरीत
नमूना डेटा आकार

प्रोडक्शन-ग्रेड रिकग्निशन कस्टम लेबल मॉडल को प्रशिक्षित करने के लिए सामान्य चरणों का पालन किया जाता है:

समीक्षा वर्गीकरण - यह उन विशेषताओं / वस्तुओं की सूची को परिभाषित करता है जिन्हें आप एक छवि में पहचानना चाहते हैं।
प्रासंगिक डेटा एकत्र करें - यह सबसे महत्वपूर्ण कदम है, जहां आपको प्रासंगिक छवियों को एकत्र करने की आवश्यकता होती है, जो कि आप एक उत्पादन वातावरण में देखेंगे। इसमें अलग-अलग पृष्ठभूमि, प्रकाश व्यवस्था या कैमरा कोण वाली वस्तुओं की छवियां शामिल हो सकती हैं। फिर आप एकत्रित छवियों को विभाजित करके एक प्रशिक्षण और परीक्षण डेटासेट बनाते हैं। आपको परीक्षण डेटासेट के हिस्से के रूप में केवल वास्तविक दुनिया की छवियों को शामिल करना चाहिए, और किसी भी कृत्रिम रूप से उत्पन्न छवियों को शामिल नहीं करना चाहिए। आपके द्वारा एकत्र किए गए डेटा की व्याख्याएं मॉडल के प्रदर्शन के लिए महत्वपूर्ण हैं। सुनिश्चित करें कि बाउंडिंग बॉक्स वस्तुओं के चारों ओर तंग हैं और लेबल सटीक हैं। हम कुछ युक्तियों पर चर्चा करते हैं जिन पर आप इस पोस्ट में बाद में उपयुक्त डेटासेट बनाते समय विचार कर सकते हैं।
प्रशिक्षण मेट्रिक्स की समीक्षा करें - मॉडल को प्रशिक्षित करने के लिए पिछले डेटासेट का उपयोग करें और F1 स्कोर, सटीक और रिकॉल के लिए प्रशिक्षण मेट्रिक्स की समीक्षा करें। हम इस पोस्ट में बाद में प्रशिक्षण मेट्रिक्स का विश्लेषण करने के तरीके के बारे में विस्तार से चर्चा करेंगे।
प्रशिक्षित मॉडल का मूल्यांकन करें - भविष्यवाणियों का मूल्यांकन करने के लिए ज्ञात लेबल के साथ अनदेखी छवियों (मॉडल के प्रशिक्षण के लिए उपयोग नहीं की गई) के एक सेट का उपयोग करें। यह कदम हमेशा यह सुनिश्चित करने के लिए किया जाना चाहिए कि मॉडल उत्पादन वातावरण में अपेक्षित प्रदर्शन करता है।
पुन: प्रशिक्षण (वैकल्पिक) - सामान्य तौर पर, किसी भी मशीन लर्निंग मॉडल को प्रशिक्षित करना वांछित परिणाम प्राप्त करने के लिए एक पुनरावृत्ति प्रक्रिया है, एक कंप्यूटर विज़न मॉडल अलग नहीं है। चरण 4 में परिणामों की समीक्षा करें, यह देखने के लिए कि क्या प्रशिक्षण डेटा में अधिक छवियों को जोड़ने की आवश्यकता है और उपरोक्त चरण 3 - 5 को दोहराएं।

इस पोस्ट में, हम आपके मॉडल के प्रदर्शन को बेहतर बनाने के लिए प्रासंगिक डेटा (चरण 2) एकत्र करने और आपके प्रशिक्षित मीट्रिक (चरण 3) का मूल्यांकन करने के सर्वोत्तम अभ्यासों पर ध्यान केंद्रित करते हैं।

प्रासंगिक डेटा एकत्र करें

यह प्रोडक्शन-ग्रेड रिकग्निशन कस्टम लेबल मॉडल के प्रशिक्षण का सबसे महत्वपूर्ण चरण है। विशेष रूप से, दो डेटासेट हैं: प्रशिक्षण और परीक्षण। प्रशिक्षण डेटा का उपयोग मॉडल को प्रशिक्षित करने के लिए किया जाता है, और आपको एक उपयुक्त प्रशिक्षण सेट बनाने के लिए प्रयास करने की आवश्यकता होती है। मान्यता कस्टम लेबल मॉडल के लिए अनुकूलित हैं एफ 1 का स्कोर अपने प्रोजेक्ट के लिए सबसे सटीक मॉडल का चयन करने के लिए परीक्षण डेटासेट पर। इसलिए, वास्तविक दुनिया से मिलता-जुलता परीक्षण डेटासेट बनाना आवश्यक है।

छवियों की संख्या

हम अनुशंसा करते हैं कि प्रति लेबल कम से कम 15-20 छवियां हों। अधिक विविधताओं वाली अधिक छवियां होने से जो आपके उपयोग के मामले को दर्शाती हैं, मॉडल के प्रदर्शन में सुधार करेगी।

संतुलित डेटासेट

आदर्श रूप से, डेटासेट में प्रत्येक लेबल में समान संख्या में नमूने होने चाहिए। प्रति लेबल छवियों की संख्या में भारी असमानता नहीं होनी चाहिए। उदाहरण के लिए, एक डेटासेट जहां एक लेबल के लिए छवियों की उच्चतम संख्या 1,000 बनाम 50 है, दूसरे लेबल के लिए छवियां एक असंतुलित डेटासेट जैसा दिखता है। हम अनुशंसा करते हैं कि छवियों की सबसे कम संख्या वाले लेबल बनाम छवियों की उच्चतम संख्या वाले लेबल के बीच 1:50 के एकतरफा अनुपात वाले परिदृश्यों से बचें।

विभिन्न प्रकार की छवियां

प्रशिक्षण और परीक्षण डेटासेट में छवियां शामिल करें जो वास्तविक दुनिया में आपके द्वारा उपयोग की जाने वाली चीज़ों से मिलती-जुलती हैं। उदाहरण के लिए, यदि आप लिविंग रूम बनाम बेडरूम की छवियों को वर्गीकृत करना चाहते हैं, तो आपको दोनों कमरों की खाली और सुसज्जित छवियों को शामिल करना चाहिए।

निम्नलिखित एक सुसज्जित रहने वाले कमरे की एक उदाहरण छवि है।

इसके विपरीत, निम्नलिखित एक असज्जित रहने वाले कमरे का एक उदाहरण है।

निम्नलिखित एक सुसज्जित बेडरूम की एक उदाहरण छवि है।

निम्नलिखित एक असज्जित बेडरूम की एक उदाहरण छवि है।

बदलती पृष्ठभूमि

विभिन्न पृष्ठभूमि वाले चित्र शामिल करें। प्राकृतिक संदर्भ वाली छवियां सादे पृष्ठभूमि की तुलना में बेहतर परिणाम प्रदान कर सकती हैं।

निम्नलिखित एक घर के सामने के यार्ड की एक उदाहरण छवि है।

निम्नलिखित एक अलग पृष्ठभूमि के साथ एक अलग घर के सामने के यार्ड की एक उदाहरण छवि है।

अलग-अलग प्रकाश व्यवस्था की स्थिति

अलग-अलग प्रकाश वाली छवियों को शामिल करें ताकि यह अनुमान के दौरान होने वाली विभिन्न प्रकाश स्थितियों को कवर कर सके (उदाहरण के लिए, फ्लैश के साथ और बिना)। आप अलग-अलग संतृप्ति, रंग और चमक वाली छवियां भी शामिल कर सकते हैं।

निम्नलिखित सामान्य प्रकाश में एक फूल की एक उदाहरण छवि है।

इसके विपरीत, निम्न छवि तेज रोशनी में उसी फूल की है।

भिन्न कोण

वस्तु के विभिन्न कोणों से ली गई छवियों को शामिल करें। यह मॉडल को वस्तुओं की विभिन्न विशेषताओं को सीखने में मदद करता है।

निम्नलिखित चित्र विभिन्न कोणों से एक ही शयन कक्ष की हैं।

अपने Amazon Recognition कस्टम लेबल मॉडल प्लेटोब्लॉकचैन डेटा इंटेलिजेंस को बेहतर बनाने के लिए टिप्स। लंबवत खोज। ऐ.

ऐसे अवसर हो सकते हैं जहां विभिन्न प्रकार की छवियों को प्राप्त करना संभव न हो। उन परिदृश्यों में, सिंथेटिक छवियों को प्रशिक्षण डेटासेट के हिस्से के रूप में उत्पन्न किया जा सकता है। सामान्य छवि वृद्धि तकनीकों के बारे में अधिक जानकारी के लिए देखें डेटा ऑगमेंटेशन.

नकारात्मक लेबल जोड़ें

छवि वर्गीकरण के लिए, नकारात्मक लेबल जोड़ने से मॉडल सटीकता बढ़ाने में मदद मिल सकती है। उदाहरण के लिए, आप एक नकारात्मक लेबल जोड़ सकते हैं, जो किसी भी आवश्यक लेबल से मेल नहीं खाता। निम्नलिखित छवि पूर्ण विकसित फूलों की पहचान करने के लिए उपयोग किए जाने वाले विभिन्न लेबलों का प्रतिनिधित्व करती है।

नकारात्मक लेबल जोड़ना not_fully_grown मॉडल को उन विशेषताओं को सीखने में मदद करता है जो इसका हिस्सा नहीं हैं fully_grown लेबल।

लेबल भ्रम को संभालना

प्रशिक्षण या परीक्षण डेटासेट में छूटे किसी भी पैटर्न को पहचानने के लिए परीक्षण डेटासेट पर परिणामों का विश्लेषण करें। कभी-कभी छवियों की दृष्टि से जांच करके ऐसे पैटर्न को खोजना आसान होता है। निम्न छवि में, मॉडल पिछवाड़े बनाम आंगन लेबल के बीच हल करने के लिए संघर्ष कर रहा है।

इस परिदृश्य में, डेटासेट में इन लेबलों में और छवियां जोड़ना और लेबलों को फिर से परिभाषित करना ताकि प्रत्येक लेबल अलग हो, मॉडल की सटीकता को बढ़ाने में मदद कर सकता है।

डेटा वृद्धि

रिकॉग्निशन कस्टम लेबल के अंदर, हम मॉडल प्रशिक्षण के लिए विभिन्न डेटा संवर्द्धन करते हैं, जिसमें छवि की यादृच्छिक क्रॉपिंग, रंग घबराना, यादृच्छिक गाऊसी शोर, और बहुत कुछ शामिल है। आपके विशिष्ट उपयोग के मामलों के आधार पर, आपके प्रशिक्षण डेटा में अधिक स्पष्ट डेटा संवर्द्धन जोड़ना भी फायदेमंद हो सकता है। उदाहरण के लिए, यदि आप रंग और श्वेत और श्याम दोनों छवियों में जानवरों का पता लगाने में रुचि रखते हैं, तो आप प्रशिक्षण डेटा में समान छवियों के काले और सफेद और रंग संस्करण जोड़कर संभावित रूप से बेहतर सटीकता प्राप्त कर सकते हैं।

हम परीक्षण डेटा पर संवर्द्धन की अनुशंसा नहीं करते हैं जब तक कि संवर्द्धन आपके उत्पादन उपयोग के मामलों को प्रतिबिंबित न करें।

प्रशिक्षण मेट्रिक्स की समीक्षा करें

F1 स्कोर, सटीक, रिकॉल और कल्पित थ्रेशोल्ड हैं मेट्रिक्स जो रिकॉग्निशन कस्टम लेबल का उपयोग करके एक मॉडल के प्रशिक्षण के आउटपुट के रूप में उत्पन्न होते हैं। प्रदान किए गए परीक्षण डेटासेट के आधार पर मॉडल को सर्वश्रेष्ठ F1 स्कोर के लिए अनुकूलित किया गया है। परीक्षण डेटासेट के आधार पर कल्पित सीमा भी उत्पन्न होती है। आप सटीकता या याद के संदर्भ में अपनी व्यावसायिक आवश्यकता के आधार पर सीमा को समायोजित कर सकते हैं।

क्योंकि परीक्षण डेटासेट पर कल्पित थ्रेशोल्ड सेट किए गए हैं, एक उपयुक्त परीक्षण सेट को वास्तविक दुनिया के उत्पादन उपयोग के मामले को प्रतिबिंबित करना चाहिए। यदि परीक्षण डेटासेट उपयोग के मामले का प्रतिनिधि नहीं है, तो आप अपनी वास्तविक दुनिया की छवियों पर कृत्रिम रूप से उच्च F1 स्कोर और खराब मॉडल प्रदर्शन देख सकते हैं।

मॉडल का प्रारंभिक मूल्यांकन करते समय ये मीट्रिक सहायक होते हैं। प्रोडक्शन-ग्रेड सिस्टम के लिए, हम वास्तविक दुनिया के बाहरी डेटासेट (500-1,000 अनदेखी छवियों) के प्रतिनिधि के खिलाफ मॉडल का मूल्यांकन करने की सलाह देते हैं। यह मूल्यांकन करने में मदद करता है कि मॉडल एक उत्पादन प्रणाली में कैसा प्रदर्शन करेगा और किसी भी लापता पैटर्न की पहचान भी करेगा और मॉडल को फिर से प्रशिक्षित करके उन्हें सही करेगा। यदि आप F1 स्कोर और बाहरी मूल्यांकन के बीच एक बेमेल देखते हैं, तो हमारा सुझाव है कि आप जांच करें कि क्या आपका परीक्षण डेटा वास्तविक दुनिया के उपयोग के मामले को प्रतिबिंबित कर रहा है।

निष्कर्ष

इस पोस्ट में, हमने आपको पहचान कस्टम लेबल मॉडल में सुधार के लिए सर्वोत्तम प्रथाओं के बारे में बताया। हम आपको इसके बारे में और जानने के लिए प्रोत्साहित करते हैं मान्यता कस्टम लेबल और इसे अपने व्यवसाय-विशिष्ट डेटासेट के लिए आज़माएँ।

लेखक के बारे में

अमित गुप्ता एडब्ल्यूएस में वरिष्ठ एआई सर्विसेज सॉल्यूशंस आर्किटेक्ट हैं। वह बड़े पैमाने पर अच्छी तरह से आर्किटेक्टेड मशीन लर्निंग सॉल्यूशंस के साथ ग्राहकों को सक्षम बनाने के बारे में भावुक हैं।

योगेश चतुर्वेदी कंप्यूटर विज़न पर ध्यान देने के साथ AWS में सॉल्यूशन आर्किटेक्ट हैं। वह क्लाउड तकनीकों का उपयोग करके ग्राहकों की व्यावसायिक चुनौतियों का समाधान करने के लिए उनके साथ काम करता है। काम के बाहर, उन्हें लंबी पैदल यात्रा, यात्रा करना और खेल देखना पसंद है।

हाओ यांगो Amazon Rekognition Custom Labels टीम में वरिष्ठ अनुप्रयुक्त वैज्ञानिक हैं। उनकी मुख्य शोध रुचियां सीमित टिप्पणियों के साथ वस्तु का पता लगाना और सीखना हैं। बाहर के कामों में, हाओ को फिल्में देखना, फोटोग्राफी करना और बाहरी गतिविधियों का आनंद मिलता है।

पश्मीन मिस्त्री Amazon Rekognition Custom Labels के वरिष्ठ उत्पाद प्रबंधक हैं। काम के अलावा, पश्मीन को एडवेंचरस हाइक, फोटोग्राफी और अपने परिवार के साथ समय बिताना पसंद है।

समय टिकट: सितम्बर 9, 2022सितम्बर 10, 2022

से अधिक AWS मशीन लर्निंग

मेंडिक्स जेनेरिक एआई और अमेज़ॅन बेडरॉक के साथ ग्राहकों के अनुभवों को कैसे बदल रहा है | अमेज़न वेब सेवाएँ

AWS मशीन लर्निंग

स्रोत नोड: 1913698

समय टिकट: नवम्बर 15, 2023

Amazon EKS पर PyTorch 2.0 FSDP के साथ स्केल एलएलएम - भाग 2 | अमेज़न वेब सेवाएँ

स्रोत क्लस्टर:

AWS मशीन लर्निंग

स्रोत नोड: 1960833

समय टिकट: अप्रैल 1, 2024

अपने Amazon Rekognition कस्टम लेबल मॉडल को बेहतर बनाने के लिए टिप्स

प्लेटो द्वारा पुनर्प्रकाशित

प्रासंगिक डेटा एकत्र करें

छवियों की संख्या

संतुलित डेटासेट

विभिन्न प्रकार की छवियां

बदलती पृष्ठभूमि

अलग-अलग प्रकाश व्यवस्था की स्थिति

भिन्न कोण

नकारात्मक लेबल जोड़ें

लेबल भ्रम को संभालना

डेटा वृद्धि

प्रशिक्षण मेट्रिक्स की समीक्षा करें

निष्कर्ष

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

Amazon SageMaker में TensorFlow छवि वर्गीकरण मॉडल के लिए स्थानांतरण सीखना

रेनेट के साथ तंत्रिका नेटवर्क को स्वचालित रूप से फिर से प्रशिक्षित करें

Amazon SageMaker Data Wrangler का उपयोग करके मशीन लर्निंग के लिए Amazon EMR से डेटा तैयार करें

अमेज़ॅन सेजमेकर पर पहनावा एमएल मॉडल चलाएं

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा