Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न

यह स्टॉर्म रिप्लाई के सीटीओ बर्नार्ड पैक्स और डसॉल्ट सिस्टम्स 3डीएक्ससाइट के वरिष्ठ रणनीतिकार कार्ल हर्कट के साथ सह-लिखित एक पोस्ट है।

जबकि कंप्यूटर विज़न औद्योगिक रखरखाव, निर्माण, रसद और उपभोक्ता अनुप्रयोगों के लिए महत्वपूर्ण हो सकता है, इसे अपनाना प्रशिक्षण डेटासेट के मैनुअल निर्माण द्वारा सीमित है। औद्योगिक संदर्भ में लेबल किए गए चित्रों का निर्माण मुख्य रूप से मैन्युअल रूप से किया जाता है, जो सीमित पहचान क्षमताएं बनाता है, स्केल नहीं करता है, और इसके परिणामस्वरूप श्रम लागत और व्यावसायिक मूल्य प्राप्ति में देरी होती है। यह उत्पाद डिजाइन, उत्पाद इंजीनियरिंग और उत्पाद विन्यास में तेजी से पुनरावृत्तियों द्वारा प्रदान की जाने वाली व्यावसायिक चपलता के खिलाफ जाता है। यह प्रक्रिया कार, हवाई जहाज, या आधुनिक इमारतों जैसे जटिल उत्पादों के लिए पैमाना नहीं है, क्योंकि उन परिदृश्यों में प्रत्येक लेबलिंग प्रोजेक्ट अद्वितीय है (अद्वितीय उत्पादों से संबंधित)। नतीजतन, डेटा तैयार करने में बड़े प्रयास के बिना, कभी-कभी उपयोग केस डिलीवरी को सीमित किए बिना, कंप्यूटर विज़न तकनीक को बड़े पैमाने पर अद्वितीय परियोजनाओं पर आसानी से लागू नहीं किया जा सकता है।

इस पोस्ट में, हम एक नया दृष्टिकोण प्रस्तुत करते हैं जहां डिजाइन और सीएडी फाइलों से अत्यधिक विशिष्ट कंप्यूटर विज़न सिस्टम बनाए जाते हैं। हम नेत्रहीन सही डिजिटल जुड़वाँ के निर्माण और सिंथेटिक लेबल वाली छवियों की पीढ़ी के साथ शुरू करते हैं। फिर हम इन छवियों को धक्का देते हैं अमेज़ॅन रेकग्निशन कस्टम लेबल कस्टम ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करने के लिए। सॉफ्टवेयर के साथ मौजूदा बौद्धिक संपदा का उपयोग करके, हम विभिन्न औद्योगिक संदर्भों के लिए कंप्यूटर विज़न को वहनीय और प्रासंगिक बना रहे हैं।

मान्यता प्रणालियों का अनुकूलन व्यावसायिक परिणामों को चलाने में मदद करता है

डिजिटल जुड़वाँ से निर्मित विशिष्ट कंप्यूटर विज़न सिस्टम में विशिष्ट गुण होते हैं, जिन्हें निम्नलिखित उपयोग के मामलों में चित्रित किया जा सकता है:

  • अद्वितीय उत्पादों के लिए पता लगाने की क्षमता - एयरबस, बोइंग और अन्य विमान निर्माता अद्वितीय प्रदान करते हैं निर्माता सीरियल नंबर (एमएसएन) उनके द्वारा उत्पादित प्रत्येक विमान के लिए। इसे उत्पन्न करने के लिए, संपूर्ण उत्पादन प्रक्रिया के दौरान प्रबंधित किया जाता है उड़ान योग्यता दस्तावेज और उड़ान भरने की अनुमति प्राप्त करें। ए डिजिटल ट्विन (भौतिक उत्पाद का प्रतिनिधित्व करने वाला एक आभासी 3D मॉडल) प्रत्येक एमएसएन के विन्यास से प्राप्त किया जा सकता है, और एक वितरित कंप्यूटर दृष्टि प्रणाली उत्पन्न करता है जो औद्योगिक सुविधाओं में इस एमएसएन की प्रगति को ट्रैक करता है। कस्टम मान्यता एयरलाइनों को दी गई पारदर्शिता को स्वचालित करती है, और एयरलाइनों द्वारा मैन्युअल रूप से निष्पादित अधिकांश चौकियों को बदल देती है। अद्वितीय उत्पादों पर स्वचालित गुणवत्ता आश्वासन हवाई जहाजों, कारों, इमारतों और यहां तक ​​कि शिल्प प्रस्तुतियों पर भी लागू हो सकता है।
  • प्रासंगिक संवर्धित वास्तविकता - प्रोफेशनल-ग्रेड कंप्यूटर विज़न सिस्टम सीमित परिदृश्यों को दायरे में ला सकते हैं, लेकिन उच्च भेदभाव क्षमताओं के साथ। उदाहरण के लिए, औद्योगिक रखरखाव में, एक तस्वीर में एक स्क्रूड्राइवर ढूंढना बेकार है; आपको स्क्रूड्राइवर मॉडल या यहां तक ​​कि उसके सीरियल नंबर की पहचान करने की आवश्यकता है। ऐसे सीमित संदर्भों में, कस्टम पहचान प्रणाली सामान्य पहचान प्रणाली से बेहतर प्रदर्शन करती है क्योंकि वे अपने निष्कर्षों में अधिक प्रासंगिक हैं। कस्टम रिकग्निशन सिस्टम के माध्यम से सटीक फीडबैक लूप सक्षम करते हैं समर्पित संवर्धित वास्तविकता एचएमआई या मोबाइल उपकरणों में वितरित।
  • एंड-टू-एंड गुणवत्ता नियंत्रण - साथ में सिस्टम इंजीनियरिंग, आप आंशिक निर्माणों के डिजिटल जुड़वाँ बना सकते हैं, और कंप्यूटर विज़न सिस्टम उत्पन्न कर सकते हैं जो निर्माण और उत्पादन प्रक्रियाओं के विभिन्न चरणों के अनुकूल होते हैं। दृश्य नियंत्रण को निर्माण कार्यस्थानों के साथ जोड़ा जा सकता है, जिससे एंड-टू-एंड निरीक्षण और दोषों का शीघ्र पता लगाया जा सकता है। कस्टम पहचान एंड-टू-एंड निरीक्षण के लिए असेंबली लाइनों में दोषों के कैस्केडिंग को प्रभावी ढंग से रोकता है। अस्वीकृति दर को कम करना और उत्पादन उत्पादन को अधिकतम करना अंतिम लक्ष्य है।
  • लचीला गुणवत्ता निरीक्षण - आधुनिक गुणवत्ता निरीक्षण को डिजाइन विविधताओं और लचीले निर्माण के अनुकूल होना पड़ता है। डिजाइन में बदलाव उत्पाद के उपयोग और उत्पाद रखरखाव पर फीडबैक लूप से आते हैं। लचीला निर्माण मेक-टू-ऑर्डर रणनीति के लिए एक प्रमुख क्षमता है, और लागत-अनुकूलन के लीन निर्माण सिद्धांत के साथ संरेखित होती है। डिजिटल ट्विन्स में डिज़ाइन विविधताओं और कॉन्फ़िगरेशन विकल्पों को एकीकृत करके, कस्टम मान्यता कंप्यूटर विज़न सिस्टम के उत्पादन योजनाओं और डिज़ाइन विविधताओं के गतिशील अनुकूलन को सक्षम बनाती है।

Amazon Rekognition द्वारा संचालित Dassault Systèmes 3DEXCITE के साथ कंप्यूटर विज़न को बेहतर बनाएं

डिजिटल ट्विन्स में गहरी विशेषज्ञता वाली कंपनी डसॉल्ट सिस्टम्स के भीतर, जो दूसरा सबसे बड़ा यूरोपीय सॉफ्टवेयर संपादक भी है, 3DEXCITE टीम एक अलग रास्ता तलाश रही है। जैसा कि कार्ल हर्कट द्वारा समझाया गया है, "क्या होगा यदि सिंथेटिक छवियों से प्रशिक्षित एक तंत्रिका मॉडल एक भौतिक उत्पाद को पहचान सके?" 3DEXCITE ने इस अजीबोगरीब दृष्टिकोण की व्यवहार्यता को साबित करते हुए, AWS इन्फ्रास्ट्रक्चर के साथ अपनी तकनीक को मिलाकर इस समस्या को हल किया है। इसे . के रूप में भी जाना जाता है क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन, जहां डिटेक्शन मॉडल स्रोत डोमेन (सिंथेटिक छवियों) से लेबल की गई छवियों से सीखता है और लेबल रहित लक्ष्य डोमेन (भौतिक घटक) के लिए भविष्यवाणियां करता है।

डसॉल्ट सिस्टम्स 3DEXCITE और AWS प्रोटोटाइप टीम ने एक प्रदर्शन प्रणाली बनाने के लिए सेना में शामिल हो गए हैं जो एक औद्योगिक गियरबॉक्स के कुछ हिस्सों को पहचानती है। यह प्रोटोटाइप 3 सप्ताह में बनाया गया था, और प्रशिक्षित मॉडल ने 98% F1 स्कोर हासिल किया। मान्यता मॉडल को पूरी तरह से एक सॉफ्टवेयर पाइपलाइन से प्रशिक्षित किया गया है, जिसमें वास्तविक हिस्से की कोई तस्वीर नहीं है। एक औद्योगिक गियरबॉक्स के डिजाइन और सीएडी फाइलों से, 3DEXCITE ने दृष्टि से सही डिजिटल जुड़वां बनाए हैं। उन्होंने डिजिटल जुड़वां से हजारों सिंथेटिक लेबल वाली छवियां भी तैयार कीं। फिर उन्होंने इन छवियों से एक अत्यधिक विशिष्ट तंत्रिका मॉडल को प्रशिक्षित करने के लिए पहचान कस्टम लेबल का उपयोग किया और एक संबंधित मान्यता एपीआई प्रदान किया। उन्होंने गियरबॉक्स के एक भौतिक भाग के किसी भी वेबकैम से पहचान को सक्षम करने के लिए एक वेबसाइट बनाई।

अमेज़ॅन रेकग्निशन एक एआई सेवा है जो आपको छवियों और वीडियो से सार्थक मेटाडेटा निकालने की अनुमति देने के लिए गहन शिक्षण तकनीक का उपयोग करती है - जिसमें वस्तुओं, लोगों, पाठ, दृश्यों, गतिविधियों और संभावित रूप से अनुपयुक्त सामग्री की पहचान करना शामिल है - बिना मशीन लर्निंग (एमएल) विशेषज्ञता की आवश्यकता है। Amazon Rekognition अत्यधिक सटीक चेहरे का विश्लेषण और चेहरे की खोज क्षमताएं भी प्रदान करता है जिसका उपयोग आप विभिन्न प्रकार के उपयोगकर्ता सत्यापन, लोगों की गिनती और सुरक्षा उपयोग के मामलों का पता लगाने, विश्लेषण करने और चेहरों की तुलना करने के लिए कर सकते हैं। अंत में, पहचान कस्टम लेबल के साथ, आप ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण मॉडल बनाने के लिए अपने स्वयं के डेटा का उपयोग कर सकते हैं।

कंप्यूटर दृष्टि के लिए मान्यता कस्टम लेबल के साथ सिंथेटिक लेबल वाली छवियों के निर्माण के लिए डसॉल्ट सिस्टम्स तकनीक का संयोजन मान्यता प्रणालियों के लिए एक स्केलेबल वर्कफ़्लो प्रदान करता है। उपयोग में आसानी यहां एक महत्वपूर्ण सकारात्मक कारक है क्योंकि समग्र सॉफ्टवेयर पाइपलाइन में पहचान कस्टम लेबल जोड़ना मुश्किल नहीं है—यह एक एपीआई को वर्कफ़्लो में एकीकृत करने जितना आसान है। एमएल वैज्ञानिक होने की आवश्यकता नहीं है; बस एडब्ल्यूएस को कैप्चर किए गए फ्रेम भेजें और एक परिणाम प्राप्त करें जिसे आप डेटाबेस में दर्ज कर सकते हैं या वेब ब्राउज़र में प्रदर्शित कर सकते हैं।

यह आगे प्रशिक्षण डेटासेट के मैन्युअल निर्माण पर नाटकीय सुधार को रेखांकित करता है। आप महंगे, अनावश्यक काम के घंटों की आवश्यकता के बिना, तेजी से और अधिक सटीकता के साथ बेहतर परिणाम प्राप्त कर सकते हैं। इतने सारे संभावित उपयोग के मामलों के साथ, डसॉल्ट सिस्टम्स और रिकॉग्निशन कस्टम लेबल्स के संयोजन में आज के व्यवसायों को महत्वपूर्ण और तत्काल आरओआई प्रदान करने की क्षमता है।

समाधान अवलोकन

इस समाधान में पहला कदम उन छवियों को प्रस्तुत करना है जो प्रशिक्षण डेटासेट बनाते हैं। यह 3DEXCITE प्लेटफॉर्म द्वारा किया जाता है। हम स्क्रिप्ट का उपयोग करके लेबलिंग डेटा प्रोग्रामेटिक रूप से उत्पन्न कर सकते हैं। अमेज़ॅन सैजमेकर ग्राउंड ट्रुथ वर्गीकरण और ऑब्जेक्ट डिटेक्शन कार्यों के लिए छवियों और वीडियो को आसानी से लेबल करने के लिए एक एनोटेशन टूल प्रदान करता है। Amazon Rekognition में एक मॉडल को प्रशिक्षित करने के लिए, लेबलिंग फ़ाइल को ग्राउंड ट्रुथ प्रारूप का अनुपालन करने की आवश्यकता होती है। ये लेबल JSON में हैं, जिसमें छवि आकार, बाउंडिंग बॉक्स निर्देशांक और वर्ग आईडी जैसी जानकारी शामिल है।

फिर सिंथेटिक छवियों और मेनिफेस्ट को . पर अपलोड करें अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3), जहां पहचान कस्टम लेबल उन्हें प्रशिक्षण डेटासेट के घटकों के रूप में आयात कर सकते हैं।

रिकॉग्निशन कस्टम लेबल को मॉडल बनाम वास्तविक घटक छवियों के एक सेट का परीक्षण करने देने के लिए, हम कैमरे से लिए गए वास्तविक इंजन भागों की तस्वीरों का एक सेट प्रदान करते हैं और परीक्षण डेटासेट के रूप में उपयोग करने के लिए उन्हें Amazon S3 पर अपलोड करते हैं।

अंत में, रिकॉग्निशन कस्टम लेबल सिंथेटिक प्रशिक्षण डेटासेट और वास्तविक वस्तुओं के चित्रों से बने परीक्षण डेटासेट का उपयोग करके सर्वश्रेष्ठ ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करता है, और उस मॉडल के साथ एंडपॉइंट बनाता है जिसका उपयोग हम अपने एप्लिकेशन में ऑब्जेक्ट रिकग्निशन चलाने के लिए कर सकते हैं।

निम्नलिखित आरेख हमारे समाधान वर्कफ़्लो को दिखाता है:
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

सिंथेटिक चित्र बनाएं

सिंथेटिक छवियां 3Dexperience प्लेटफॉर्म से उत्पन्न होती हैं, जो कि डसॉल्ट सिस्टम्स का एक उत्पाद है। यह प्लेटफ़ॉर्म आपको ऑब्जेक्ट की CAD (कंप्यूटर एडेड डिज़ाइन) फ़ाइल के आधार पर फ़ोटोरियलिस्टिक चित्र बनाने और प्रस्तुत करने की अनुमति देता है। हम प्लेटफॉर्म पर इमेज ट्रांसफॉर्मेशन कॉन्फिगरेशन को बदलकर कुछ ही घंटों में हजारों वेरिएंट जेनरेट कर सकते हैं।

इस प्रोटोटाइप में, हमने ऑब्जेक्ट डिटेक्शन के लिए निम्नलिखित पांच स्पष्ट रूप से अलग गियरबॉक्स भागों का चयन किया। इनमें गियर हाउसिंग, गियर अनुपात, असर कवर, निकला हुआ किनारा और वर्म गियर शामिल हैं।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

हमने छवि विविधता को बढ़ाने और सिंथेटिक डेटा को अधिक फोटोरियलिस्टिक बनाने के लिए निम्नलिखित डेटा वृद्धि विधियों का उपयोग किया। यह मॉडल सामान्यीकरण त्रुटि को कम करने में मदद करता है।

  • / बाहर ज़ूम - यह विधि छवियों में ऑब्जेक्ट को बेतरतीब ढंग से ज़ूम इन या आउट करती है।
  • रोटेशन - यह विधि ऑब्जेक्ट को छवियों में घुमाती है, और ऐसा लगता है कि वर्चुअल कैमरा 360-डिग्री कोण से ऑब्जेक्ट की यादृच्छिक तस्वीरें लेता है।
  • सामग्री के रंगरूप में सुधार करें - हमने पहचाना कि कुछ गियर भागों के लिए प्रारंभिक रेंडरिंग में सामग्री का स्वरूप कम यथार्थवादी है। हमने सिंथेटिक छवियों को बेहतर बनाने के लिए एक धातु प्रभाव जोड़ा।
  • विभिन्न प्रकाश व्यवस्था सेटिंग्स का प्रयोग करें - इस प्रोटोटाइप में, हमने दो प्रकाश व्यवस्था की स्थिति का अनुकरण किया:
    • गोदाम - एक यथार्थवादी प्रकाश वितरण। छाया और प्रतिबिंब संभव हैं।
    • स्टूडियो - वस्तु के चारों ओर एक सजातीय प्रकाश डाला जाता है। यह यथार्थवादी नहीं है लेकिन कोई छाया या प्रतिबिंब नहीं है।
  • वास्तविक समय में वस्तु को कैसे देखा जाता है, इसकी यथार्थवादी स्थिति का उपयोग करें - वास्तविक जीवन में, कुछ वस्तुओं, जैसे कि एक निकला हुआ किनारा और असर कवर, आमतौर पर एक सतह पर रखा जाता है, और मॉडल ऊपर और नीचे के पहलुओं के आधार पर वस्तुओं का पता लगा रहा है। इसलिए, हमने प्रशिक्षण छवियों को हटा दिया जो भागों के पतले किनारे को दिखाते हैं, जिसे किनारे की स्थिति भी कहा जाता है, और वस्तुओं की छवियों को एक सपाट स्थिति में बढ़ाया जाता है।
  • एक छवि में कई ऑब्जेक्ट जोड़ें - वास्तविक जीवन परिदृश्यों में, कई गियर भाग सभी एक दृश्य में दिखाई दे सकते हैं, इसलिए हमने ऐसे चित्र तैयार किए जिनमें कई गियर भाग होते हैं।

3Dexperience प्लेटफ़ॉर्म पर, हम इमेज के लिए अलग-अलग बैकग्राउंड लागू कर सकते हैं, जो इमेज की विविधता को और बढ़ाने में मदद कर सकता है। समय सीमा के कारण, हमने इसे इस प्रोटोटाइप में लागू नहीं किया।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

सिंथेटिक प्रशिक्षण डेटासेट आयात करें

एमएल में, लेबल किए गए डेटा का मतलब है कि लक्ष्य को दिखाने के लिए प्रशिक्षण डेटा को एनोटेट किया जाता है, यही वह जवाब है जिसे आप अपने एमएल मॉडल की भविष्यवाणी करना चाहते हैं। लेबल किए गए डेटा का उपयोग मान्यता कस्टम लेबल द्वारा किया जा सकता है, जिसका अनुपालन ग्राउंड ट्रुथ मेनिफेस्ट फ़ाइल आवश्यकताओं के साथ किया जाना चाहिए। एक मेनिफेस्ट फ़ाइल एक या अधिक JSON लाइनों से बनी होती है; प्रत्येक पंक्ति में एक छवि के लिए जानकारी होती है। सिंथेटिक प्रशिक्षण डेटा के लिए, लेबलिंग जानकारी को सीएडी फ़ाइल और छवि परिवर्तन कॉन्फ़िगरेशन के आधार पर प्रोग्रामेटिक रूप से उत्पन्न किया जा सकता है, जो लेबलिंग कार्य के महत्वपूर्ण मैन्युअल प्रयास को बचाता है। फ़ाइल स्वरूपों को लेबल करने की आवश्यकताओं के बारे में अधिक जानकारी के लिए, देखें एक मेनिफेस्ट फ़ाइल बनाएं और मेनिफेस्ट फाइलों में वस्तु स्थानीयकरण. छवि लेबलिंग का एक उदाहरण निम्नलिखित है:

{ "source-ref": "s3://<bucket>/<prefix>/multiple_objects.png", "bounding-box": { "image_size": [ { "width": 1024, "height": 1024, "depth": 3 } ], "annotations": [ { "class_id": 1, "top": 703, "left": 606, "width": 179, "height": 157 }, { "class_id": 4, "top": 233, "left": 533, "width": 118, "height": 139 }, { "class_id": 0, "top": 592, "left": 154, "width": 231, "height": 332 }, { "class_id": 3, "top": 143, "left": 129, "width": 268, "height": 250 } ] }, "bounding-box-metadata": { "objects": [ { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 } ], "class-map": { "0": "Gear_Housing", "1": "Gear_Ratio", "3": "Flange", "4": "Worm_Gear" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2021-06-18T11:56:01", "job-name": "3DEXCITE" }
}

मेनिफेस्ट फ़ाइल तैयार होने के बाद, हम इसे S3 बकेट में अपलोड करते हैं, और फिर विकल्प का चयन करके रिकॉग्निशन कस्टम लेबल में एक प्रशिक्षण डेटासेट बनाते हैं। अमेज़न SageMaker ग्राउंड ट्रूथ द्वारा लेबल की गई छवियाँ आयात करें.
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

मेनिफेस्ट फ़ाइल आयात होने के बाद, हम लेबलिंग जानकारी को Amazon Rekognition कंसोल पर दृष्टिगत रूप से देख सकते हैं। इससे हमें यह पुष्टि करने में मदद मिलती है कि मेनिफेस्ट फ़ाइल जेनरेट और आयात की गई है। अधिक विशेष रूप से, बाउंडिंग बॉक्स को छवियों में ऑब्जेक्ट के साथ संरेखित करना चाहिए, और ऑब्जेक्ट की क्लास आईडी को सही ढंग से असाइन किया जाना चाहिए।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

परीक्षण डेटासेट बनाएं

परीक्षण छवियों को वास्तविक जीवन में एक फोन या कैमरे के साथ विभिन्न कोणों और प्रकाश व्यवस्था की स्थिति से कैप्चर किया जाता है, क्योंकि हम वास्तविक जीवन परिदृश्यों के खिलाफ मॉडल सटीकता को सत्यापित करना चाहते हैं, जिसे हमने सिंथेटिक डेटा का उपयोग करके प्रशिक्षित किया है। आप इन परीक्षण छवियों को एक S3 बकेट में अपलोड कर सकते हैं, और फिर उन्हें पहचान कस्टम लेबल में डेटासेट के रूप में आयात कर सकते हैं। या आप उन्हें सीधे अपने स्थानीय मशीन से डेटासेट पर अपलोड कर सकते हैं।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

रिकॉग्निशन कस्टम लेबल्स बिल्ट-इन इमेज एनोटेशन क्षमता प्रदान करता है, जिसका ग्राउंड ट्रुथ के समान अनुभव है। परीक्षण डेटा आयात होने पर आप लेबलिंग कार्य प्रारंभ कर सकते हैं। ऑब्जेक्ट डिटेक्शन यूज केस के लिए, बाउंडिंग बॉक्स को रुचि की वस्तुओं के चारों ओर कसकर बनाया जाना चाहिए, जो मॉडल को लक्ष्य ऑब्जेक्ट से संबंधित क्षेत्रों और पिक्सेल को सटीक रूप से सीखने में मदद करता है। इसके अलावा, आपको सभी छवियों में लक्ष्य ऑब्जेक्ट के प्रत्येक इंस्टेंस को लेबल करना चाहिए, यहां तक ​​कि वे जो आंशिक रूप से दृश्य से बाहर हैं या अन्य ऑब्जेक्ट द्वारा रोके गए हैं, अन्यथा मॉडल अधिक झूठे नकारात्मक की भविष्यवाणी करता है।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन मॉडल बनाएं

मान्यता कस्टम लेबल पूरी तरह से प्रबंधित सेवा है; आपको बस ट्रेन और परीक्षण डेटासेट प्रदान करने की आवश्यकता है। यह मॉडलों के एक सेट को प्रशिक्षित करता है और प्रदान किए गए डेटा के आधार पर सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल को चुनता है। इस प्रोटोटाइप में, हम पहले बताए गए छवि वृद्धि विधियों के विभिन्न संयोजनों के साथ प्रयोग करके सिंथेटिक प्रशिक्षण डेटासेट को पुनरावृत्त रूप से तैयार करते हैं। रिकॉग्निशन कस्टम लेबल में प्रत्येक प्रशिक्षण डेटासेट के लिए एक मॉडल बनाया गया है, जो हमें विशेष रूप से इस उपयोग के मामले के लिए इष्टतम प्रशिक्षण डेटासेट की तुलना करने और खोजने की अनुमति देता है। प्रत्येक मॉडल में प्रशिक्षण छवियों की न्यूनतम संख्या होती है, जिसमें अच्छी छवि विविधता होती है, और सर्वोत्तम मॉडल सटीकता प्रदान करता है। 15 पुनरावृत्तियों के बाद, हमने लगभग 1 सिंथेटिक प्रशिक्षण छवियों का उपयोग करके 98% मॉडल सटीकता का F10,000 स्कोर हासिल किया, जो औसतन प्रति ऑब्जेक्ट 2,000 छवियां है।
Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

मॉडल अनुमान के परिणाम

निम्न छवि अमेज़ॅन रिकॉग्निशन मॉडल को रीयल-टाइम अनुमान एप्लिकेशन में उपयोग किया जा रहा है। उच्च आत्मविश्वास के साथ सभी घटकों का सही ढंग से पता लगाया जाता है।

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

निष्कर्ष

इस पोस्ट में, हमने दिखाया कि कैसे विशुद्ध रूप से सिंथेटिक छवियों पर एक कंप्यूटर विज़न मॉडल को प्रशिक्षित किया जाए, और कैसे मॉडल अभी भी वास्तविक दुनिया की वस्तुओं को विश्वसनीय रूप से पहचान सकता है। यह प्रशिक्षण डेटा एकत्र करने और लेबल करने के लिए महत्वपूर्ण मैन्युअल प्रयास बचाता है। इस खोज के साथ, डसॉल्ट सिस्टम्स डिजाइनरों और इंजीनियरों द्वारा बनाए गए 3D उत्पाद मॉडल के व्यावसायिक मूल्य का विस्तार कर रहा है, क्योंकि अब आप भौतिक दुनिया में छवियों के लिए मान्यता प्रणालियों में CAD, CAE और PLM डेटा का उपयोग कर सकते हैं।

पहचान कस्टम लेबल की प्रमुख विशेषताओं और उपयोग के मामलों के बारे में अधिक जानकारी के लिए, देखें अमेज़ॅन रेकग्निशन कस्टम लेबल. यदि आपकी छवियों को मूल रूप से ग्राउंड ट्रुथ के साथ लेबल नहीं किया गया है, जो इस परियोजना के लिए मामला था, देखें एक मैनिफ़ेस्ट फ़ाइल बनाना अपने लेबलिंग डेटा को उस प्रारूप में बदलने के लिए जिसे पहचान कस्टम लेबल उपभोग कर सकते हैं।


लेखक के बारे में

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.वुडी बोर्राकिनो वर्तमान में AWS में एक वरिष्ठ मशीन लर्निंग स्पेशलिस्ट सॉल्यूशन आर्किटेक्ट हैं। मिलान, इटली में स्थित, वुडी ने 2015 में एडब्ल्यूएस में शामिल होने से पहले सॉफ्टवेयर विकास पर काम किया, जहां उनका विकास कंप्यूटर विजन और स्थानिक कंप्यूटिंग (एआर/वीआर/एक्सआर) प्रौद्योगिकियों के लिए जुनून है। उनका जुनून अब मेटावर्स इनोवेशन पर केंद्रित है। उसका अनुसरण करें Linkedin.

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.यिंग होउ, PhD, AWS में मशीन लर्निंग प्रोटोटाइप आर्किटेक्ट हैं। उनकी रुचि के मुख्य क्षेत्र डीप लर्निंग, कंप्यूटर विज़न, एनएलपी और टाइम सीरीज़ डेटा प्रेडिक्शन हैं। अपने खाली समय में, उन्हें उपन्यास पढ़ना और यूके में राष्ट्रीय उद्यानों में लंबी पैदल यात्रा करना पसंद है।

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.बर्नार्ड पैक्स वर्तमान में स्टॉर्म रिप्लाई का सीटीओ है जो एडब्ल्यूएस पर तैनात औद्योगिक समाधानों पर केंद्रित है। पेरिस, फ्रांस में स्थित, बर्नार्ड ने पहले प्रिंसिपल सॉल्यूशन आर्किटेक्ट और एडब्ल्यूएस में प्रिंसिपल कंसल्टेंट के रूप में काम किया। उद्यम आधुनिकीकरण में उनका योगदान औद्योगिक के लिए AWS, AWS CDK को कवर करता है, और ये अब ग्रीन आईटी और वॉयस-आधारित सिस्टम में आते हैं। उसका अनुसरण करें ट्विटर.

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.कार्ल हर्कटी वर्तमान में डसॉल्ट सिस्टम्स 3DEExcite में वरिष्ठ रणनीतिकार हैं। जर्मनी के म्यूनिख में स्थित, वह कंप्यूटर विज़न के अभिनव कार्यान्वयन बनाता है जो मूर्त परिणाम देता है। उसका अनुसरण करें लिंक्डइन.

समय टिकट:

से अधिक AWS मशीन लर्निंग