अमेज़ॅन रिकॉग्निशन कस्टम लेबल्स और डसॉल्ट सिस्टम्स के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विजन 3DEXCITE

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

यह स्टॉर्म रिप्लाई के सीटीओ बर्नार्ड पैक्स और डसॉल्ट सिस्टम्स 3डीएक्ससाइट के वरिष्ठ रणनीतिकार कार्ल हर्कट के साथ सह-लिखित एक पोस्ट है।

जबकि कंप्यूटर विज़न औद्योगिक रखरखाव, निर्माण, रसद और उपभोक्ता अनुप्रयोगों के लिए महत्वपूर्ण हो सकता है, इसे अपनाना प्रशिक्षण डेटासेट के मैनुअल निर्माण द्वारा सीमित है। औद्योगिक संदर्भ में लेबल किए गए चित्रों का निर्माण मुख्य रूप से मैन्युअल रूप से किया जाता है, जो सीमित पहचान क्षमताएं बनाता है, स्केल नहीं करता है, और इसके परिणामस्वरूप श्रम लागत और व्यावसायिक मूल्य प्राप्ति में देरी होती है। यह उत्पाद डिजाइन, उत्पाद इंजीनियरिंग और उत्पाद विन्यास में तेजी से पुनरावृत्तियों द्वारा प्रदान की जाने वाली व्यावसायिक चपलता के खिलाफ जाता है। यह प्रक्रिया कार, हवाई जहाज, या आधुनिक इमारतों जैसे जटिल उत्पादों के लिए पैमाना नहीं है, क्योंकि उन परिदृश्यों में प्रत्येक लेबलिंग प्रोजेक्ट अद्वितीय है (अद्वितीय उत्पादों से संबंधित)। नतीजतन, डेटा तैयार करने में बड़े प्रयास के बिना, कभी-कभी उपयोग केस डिलीवरी को सीमित किए बिना, कंप्यूटर विज़न तकनीक को बड़े पैमाने पर अद्वितीय परियोजनाओं पर आसानी से लागू नहीं किया जा सकता है।

इस पोस्ट में, हम एक नया दृष्टिकोण प्रस्तुत करते हैं जहां डिजाइन और सीएडी फाइलों से अत्यधिक विशिष्ट कंप्यूटर विज़न सिस्टम बनाए जाते हैं। हम नेत्रहीन सही डिजिटल जुड़वाँ के निर्माण और सिंथेटिक लेबल वाली छवियों की पीढ़ी के साथ शुरू करते हैं। फिर हम इन छवियों को धक्का देते हैं अमेज़ॅन रेकग्निशन कस्टम लेबल कस्टम ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करने के लिए। सॉफ्टवेयर के साथ मौजूदा बौद्धिक संपदा का उपयोग करके, हम विभिन्न औद्योगिक संदर्भों के लिए कंप्यूटर विज़न को वहनीय और प्रासंगिक बना रहे हैं।

मान्यता प्रणालियों का अनुकूलन व्यावसायिक परिणामों को चलाने में मदद करता है

डिजिटल जुड़वाँ से निर्मित विशिष्ट कंप्यूटर विज़न सिस्टम में विशिष्ट गुण होते हैं, जिन्हें निम्नलिखित उपयोग के मामलों में चित्रित किया जा सकता है:

अद्वितीय उत्पादों के लिए पता लगाने की क्षमता - एयरबस, बोइंग और अन्य विमान निर्माता अद्वितीय प्रदान करते हैं निर्माता सीरियल नंबर (एमएसएन) उनके द्वारा उत्पादित प्रत्येक विमान के लिए। इसे उत्पन्न करने के लिए, संपूर्ण उत्पादन प्रक्रिया के दौरान प्रबंधित किया जाता है उड़ान योग्यता दस्तावेज और उड़ान भरने की अनुमति प्राप्त करें। ए डिजिटल ट्विन (भौतिक उत्पाद का प्रतिनिधित्व करने वाला एक आभासी 3D मॉडल) प्रत्येक एमएसएन के विन्यास से प्राप्त किया जा सकता है, और एक वितरित कंप्यूटर दृष्टि प्रणाली उत्पन्न करता है जो औद्योगिक सुविधाओं में इस एमएसएन की प्रगति को ट्रैक करता है। कस्टम मान्यता एयरलाइनों को दी गई पारदर्शिता को स्वचालित करती है, और एयरलाइनों द्वारा मैन्युअल रूप से निष्पादित अधिकांश चौकियों को बदल देती है। अद्वितीय उत्पादों पर स्वचालित गुणवत्ता आश्वासन हवाई जहाजों, कारों, इमारतों और यहां तक कि शिल्प प्रस्तुतियों पर भी लागू हो सकता है।
प्रासंगिक संवर्धित वास्तविकता - प्रोफेशनल-ग्रेड कंप्यूटर विज़न सिस्टम सीमित परिदृश्यों को दायरे में ला सकते हैं, लेकिन उच्च भेदभाव क्षमताओं के साथ। उदाहरण के लिए, औद्योगिक रखरखाव में, एक तस्वीर में एक स्क्रूड्राइवर ढूंढना बेकार है; आपको स्क्रूड्राइवर मॉडल या यहां तक कि उसके सीरियल नंबर की पहचान करने की आवश्यकता है। ऐसे सीमित संदर्भों में, कस्टम पहचान प्रणाली सामान्य पहचान प्रणाली से बेहतर प्रदर्शन करती है क्योंकि वे अपने निष्कर्षों में अधिक प्रासंगिक हैं। कस्टम रिकग्निशन सिस्टम के माध्यम से सटीक फीडबैक लूप सक्षम करते हैं समर्पित संवर्धित वास्तविकता एचएमआई या मोबाइल उपकरणों में वितरित।
एंड-टू-एंड गुणवत्ता नियंत्रण - साथ में सिस्टम इंजीनियरिंग, आप आंशिक निर्माणों के डिजिटल जुड़वाँ बना सकते हैं, और कंप्यूटर विज़न सिस्टम उत्पन्न कर सकते हैं जो निर्माण और उत्पादन प्रक्रियाओं के विभिन्न चरणों के अनुकूल होते हैं। दृश्य नियंत्रण को निर्माण कार्यस्थानों के साथ जोड़ा जा सकता है, जिससे एंड-टू-एंड निरीक्षण और दोषों का शीघ्र पता लगाया जा सकता है। कस्टम पहचान एंड-टू-एंड निरीक्षण के लिए असेंबली लाइनों में दोषों के कैस्केडिंग को प्रभावी ढंग से रोकता है। अस्वीकृति दर को कम करना और उत्पादन उत्पादन को अधिकतम करना अंतिम लक्ष्य है।
लचीला गुणवत्ता निरीक्षण - आधुनिक गुणवत्ता निरीक्षण को डिजाइन विविधताओं और लचीले निर्माण के अनुकूल होना पड़ता है। डिजाइन में बदलाव उत्पाद के उपयोग और उत्पाद रखरखाव पर फीडबैक लूप से आते हैं। लचीला निर्माण मेक-टू-ऑर्डर रणनीति के लिए एक प्रमुख क्षमता है, और लागत-अनुकूलन के लीन निर्माण सिद्धांत के साथ संरेखित होती है। डिजिटल ट्विन्स में डिज़ाइन विविधताओं और कॉन्फ़िगरेशन विकल्पों को एकीकृत करके, कस्टम मान्यता कंप्यूटर विज़न सिस्टम के उत्पादन योजनाओं और डिज़ाइन विविधताओं के गतिशील अनुकूलन को सक्षम बनाती है।

Amazon Rekognition द्वारा संचालित Dassault Systèmes 3DEXCITE के साथ कंप्यूटर विज़न को बेहतर बनाएं

डिजिटल ट्विन्स में गहरी विशेषज्ञता वाली कंपनी डसॉल्ट सिस्टम्स के भीतर, जो दूसरा सबसे बड़ा यूरोपीय सॉफ्टवेयर संपादक भी है, 3DEXCITE टीम एक अलग रास्ता तलाश रही है। जैसा कि कार्ल हर्कट द्वारा समझाया गया है, "क्या होगा यदि सिंथेटिक छवियों से प्रशिक्षित एक तंत्रिका मॉडल एक भौतिक उत्पाद को पहचान सके?" 3DEXCITE ने इस अजीबोगरीब दृष्टिकोण की व्यवहार्यता को साबित करते हुए, AWS इन्फ्रास्ट्रक्चर के साथ अपनी तकनीक को मिलाकर इस समस्या को हल किया है। इसे . के रूप में भी जाना जाता है क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन, जहां डिटेक्शन मॉडल स्रोत डोमेन (सिंथेटिक छवियों) से लेबल की गई छवियों से सीखता है और लेबल रहित लक्ष्य डोमेन (भौतिक घटक) के लिए भविष्यवाणियां करता है।

डसॉल्ट सिस्टम्स 3DEXCITE और AWS प्रोटोटाइप टीम ने एक प्रदर्शन प्रणाली बनाने के लिए सेना में शामिल हो गए हैं जो एक औद्योगिक गियरबॉक्स के कुछ हिस्सों को पहचानती है। यह प्रोटोटाइप 3 सप्ताह में बनाया गया था, और प्रशिक्षित मॉडल ने 98% F1 स्कोर हासिल किया। मान्यता मॉडल को पूरी तरह से एक सॉफ्टवेयर पाइपलाइन से प्रशिक्षित किया गया है, जिसमें वास्तविक हिस्से की कोई तस्वीर नहीं है। एक औद्योगिक गियरबॉक्स के डिजाइन और सीएडी फाइलों से, 3DEXCITE ने दृष्टि से सही डिजिटल जुड़वां बनाए हैं। उन्होंने डिजिटल जुड़वां से हजारों सिंथेटिक लेबल वाली छवियां भी तैयार कीं। फिर उन्होंने इन छवियों से एक अत्यधिक विशिष्ट तंत्रिका मॉडल को प्रशिक्षित करने के लिए पहचान कस्टम लेबल का उपयोग किया और एक संबंधित मान्यता एपीआई प्रदान किया। उन्होंने गियरबॉक्स के एक भौतिक भाग के किसी भी वेबकैम से पहचान को सक्षम करने के लिए एक वेबसाइट बनाई।

अमेज़ॅन रेकग्निशन एक एआई सेवा है जो आपको छवियों और वीडियो से सार्थक मेटाडेटा निकालने की अनुमति देने के लिए गहन शिक्षण तकनीक का उपयोग करती है - जिसमें वस्तुओं, लोगों, पाठ, दृश्यों, गतिविधियों और संभावित रूप से अनुपयुक्त सामग्री की पहचान करना शामिल है - बिना मशीन लर्निंग (एमएल) विशेषज्ञता की आवश्यकता है। Amazon Rekognition अत्यधिक सटीक चेहरे का विश्लेषण और चेहरे की खोज क्षमताएं भी प्रदान करता है जिसका उपयोग आप विभिन्न प्रकार के उपयोगकर्ता सत्यापन, लोगों की गिनती और सुरक्षा उपयोग के मामलों का पता लगाने, विश्लेषण करने और चेहरों की तुलना करने के लिए कर सकते हैं। अंत में, पहचान कस्टम लेबल के साथ, आप ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण मॉडल बनाने के लिए अपने स्वयं के डेटा का उपयोग कर सकते हैं।

कंप्यूटर दृष्टि के लिए मान्यता कस्टम लेबल के साथ सिंथेटिक लेबल वाली छवियों के निर्माण के लिए डसॉल्ट सिस्टम्स तकनीक का संयोजन मान्यता प्रणालियों के लिए एक स्केलेबल वर्कफ़्लो प्रदान करता है। उपयोग में आसानी यहां एक महत्वपूर्ण सकारात्मक कारक है क्योंकि समग्र सॉफ्टवेयर पाइपलाइन में पहचान कस्टम लेबल जोड़ना मुश्किल नहीं है—यह एक एपीआई को वर्कफ़्लो में एकीकृत करने जितना आसान है। एमएल वैज्ञानिक होने की आवश्यकता नहीं है; बस एडब्ल्यूएस को कैप्चर किए गए फ्रेम भेजें और एक परिणाम प्राप्त करें जिसे आप डेटाबेस में दर्ज कर सकते हैं या वेब ब्राउज़र में प्रदर्शित कर सकते हैं।

यह आगे प्रशिक्षण डेटासेट के मैन्युअल निर्माण पर नाटकीय सुधार को रेखांकित करता है। आप महंगे, अनावश्यक काम के घंटों की आवश्यकता के बिना, तेजी से और अधिक सटीकता के साथ बेहतर परिणाम प्राप्त कर सकते हैं। इतने सारे संभावित उपयोग के मामलों के साथ, डसॉल्ट सिस्टम्स और रिकॉग्निशन कस्टम लेबल्स के संयोजन में आज के व्यवसायों को महत्वपूर्ण और तत्काल आरओआई प्रदान करने की क्षमता है।

समाधान अवलोकन

इस समाधान में पहला कदम उन छवियों को प्रस्तुत करना है जो प्रशिक्षण डेटासेट बनाते हैं। यह 3DEXCITE प्लेटफॉर्म द्वारा किया जाता है। हम स्क्रिप्ट का उपयोग करके लेबलिंग डेटा प्रोग्रामेटिक रूप से उत्पन्न कर सकते हैं। अमेज़ॅन सैजमेकर ग्राउंड ट्रुथ वर्गीकरण और ऑब्जेक्ट डिटेक्शन कार्यों के लिए छवियों और वीडियो को आसानी से लेबल करने के लिए एक एनोटेशन टूल प्रदान करता है। Amazon Rekognition में एक मॉडल को प्रशिक्षित करने के लिए, लेबलिंग फ़ाइल को ग्राउंड ट्रुथ प्रारूप का अनुपालन करने की आवश्यकता होती है। ये लेबल JSON में हैं, जिसमें छवि आकार, बाउंडिंग बॉक्स निर्देशांक और वर्ग आईडी जैसी जानकारी शामिल है।

फिर सिंथेटिक छवियों और मेनिफेस्ट को . पर अपलोड करें अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3), जहां पहचान कस्टम लेबल उन्हें प्रशिक्षण डेटासेट के घटकों के रूप में आयात कर सकते हैं।

रिकॉग्निशन कस्टम लेबल को मॉडल बनाम वास्तविक घटक छवियों के एक सेट का परीक्षण करने देने के लिए, हम कैमरे से लिए गए वास्तविक इंजन भागों की तस्वीरों का एक सेट प्रदान करते हैं और परीक्षण डेटासेट के रूप में उपयोग करने के लिए उन्हें Amazon S3 पर अपलोड करते हैं।

अंत में, रिकॉग्निशन कस्टम लेबल सिंथेटिक प्रशिक्षण डेटासेट और वास्तविक वस्तुओं के चित्रों से बने परीक्षण डेटासेट का उपयोग करके सर्वश्रेष्ठ ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करता है, और उस मॉडल के साथ एंडपॉइंट बनाता है जिसका उपयोग हम अपने एप्लिकेशन में ऑब्जेक्ट रिकग्निशन चलाने के लिए कर सकते हैं।

निम्नलिखित आरेख हमारे समाधान वर्कफ़्लो को दिखाता है:

सिंथेटिक चित्र बनाएं

सिंथेटिक छवियां 3Dexperience प्लेटफॉर्म से उत्पन्न होती हैं, जो कि डसॉल्ट सिस्टम्स का एक उत्पाद है। यह प्लेटफ़ॉर्म आपको ऑब्जेक्ट की CAD (कंप्यूटर एडेड डिज़ाइन) फ़ाइल के आधार पर फ़ोटोरियलिस्टिक चित्र बनाने और प्रस्तुत करने की अनुमति देता है। हम प्लेटफॉर्म पर इमेज ट्रांसफॉर्मेशन कॉन्फिगरेशन को बदलकर कुछ ही घंटों में हजारों वेरिएंट जेनरेट कर सकते हैं।

इस प्रोटोटाइप में, हमने ऑब्जेक्ट डिटेक्शन के लिए निम्नलिखित पांच स्पष्ट रूप से अलग गियरबॉक्स भागों का चयन किया। इनमें गियर हाउसिंग, गियर अनुपात, असर कवर, निकला हुआ किनारा और वर्म गियर शामिल हैं।

हमने छवि विविधता को बढ़ाने और सिंथेटिक डेटा को अधिक फोटोरियलिस्टिक बनाने के लिए निम्नलिखित डेटा वृद्धि विधियों का उपयोग किया। यह मॉडल सामान्यीकरण त्रुटि को कम करने में मदद करता है।

/ बाहर ज़ूम - यह विधि छवियों में ऑब्जेक्ट को बेतरतीब ढंग से ज़ूम इन या आउट करती है।
रोटेशन - यह विधि ऑब्जेक्ट को छवियों में घुमाती है, और ऐसा लगता है कि वर्चुअल कैमरा 360-डिग्री कोण से ऑब्जेक्ट की यादृच्छिक तस्वीरें लेता है।
सामग्री के रंगरूप में सुधार करें - हमने पहचाना कि कुछ गियर भागों के लिए प्रारंभिक रेंडरिंग में सामग्री का स्वरूप कम यथार्थवादी है। हमने सिंथेटिक छवियों को बेहतर बनाने के लिए एक धातु प्रभाव जोड़ा।
विभिन्न प्रकाश व्यवस्था सेटिंग्स का प्रयोग करें - इस प्रोटोटाइप में, हमने दो प्रकाश व्यवस्था की स्थिति का अनुकरण किया:
- गोदाम - एक यथार्थवादी प्रकाश वितरण। छाया और प्रतिबिंब संभव हैं।
- स्टूडियो - वस्तु के चारों ओर एक सजातीय प्रकाश डाला जाता है। यह यथार्थवादी नहीं है लेकिन कोई छाया या प्रतिबिंब नहीं है।
वास्तविक समय में वस्तु को कैसे देखा जाता है, इसकी यथार्थवादी स्थिति का उपयोग करें - वास्तविक जीवन में, कुछ वस्तुओं, जैसे कि एक निकला हुआ किनारा और असर कवर, आमतौर पर एक सतह पर रखा जाता है, और मॉडल ऊपर और नीचे के पहलुओं के आधार पर वस्तुओं का पता लगा रहा है। इसलिए, हमने प्रशिक्षण छवियों को हटा दिया जो भागों के पतले किनारे को दिखाते हैं, जिसे किनारे की स्थिति भी कहा जाता है, और वस्तुओं की छवियों को एक सपाट स्थिति में बढ़ाया जाता है।
एक छवि में कई ऑब्जेक्ट जोड़ें - वास्तविक जीवन परिदृश्यों में, कई गियर भाग सभी एक दृश्य में दिखाई दे सकते हैं, इसलिए हमने ऐसे चित्र तैयार किए जिनमें कई गियर भाग होते हैं।

3Dexperience प्लेटफ़ॉर्म पर, हम इमेज के लिए अलग-अलग बैकग्राउंड लागू कर सकते हैं, जो इमेज की विविधता को और बढ़ाने में मदद कर सकता है। समय सीमा के कारण, हमने इसे इस प्रोटोटाइप में लागू नहीं किया।

सिंथेटिक प्रशिक्षण डेटासेट आयात करें

एमएल में, लेबल किए गए डेटा का मतलब है कि लक्ष्य को दिखाने के लिए प्रशिक्षण डेटा को एनोटेट किया जाता है, यही वह जवाब है जिसे आप अपने एमएल मॉडल की भविष्यवाणी करना चाहते हैं। लेबल किए गए डेटा का उपयोग मान्यता कस्टम लेबल द्वारा किया जा सकता है, जिसका अनुपालन ग्राउंड ट्रुथ मेनिफेस्ट फ़ाइल आवश्यकताओं के साथ किया जाना चाहिए। एक मेनिफेस्ट फ़ाइल एक या अधिक JSON लाइनों से बनी होती है; प्रत्येक पंक्ति में एक छवि के लिए जानकारी होती है। सिंथेटिक प्रशिक्षण डेटा के लिए, लेबलिंग जानकारी को सीएडी फ़ाइल और छवि परिवर्तन कॉन्फ़िगरेशन के आधार पर प्रोग्रामेटिक रूप से उत्पन्न किया जा सकता है, जो लेबलिंग कार्य के महत्वपूर्ण मैन्युअल प्रयास को बचाता है। फ़ाइल स्वरूपों को लेबल करने की आवश्यकताओं के बारे में अधिक जानकारी के लिए, देखें एक मेनिफेस्ट फ़ाइल बनाएं और मेनिफेस्ट फाइलों में वस्तु स्थानीयकरण. छवि लेबलिंग का एक उदाहरण निम्नलिखित है:

{ "source-ref": "s3://<bucket>/<prefix>/multiple_objects.png", "bounding-box": { "image_size": [ { "width": 1024, "height": 1024, "depth": 3 } ], "annotations": [ { "class_id": 1, "top": 703, "left": 606, "width": 179, "height": 157 }, { "class_id": 4, "top": 233, "left": 533, "width": 118, "height": 139 }, { "class_id": 0, "top": 592, "left": 154, "width": 231, "height": 332 }, { "class_id": 3, "top": 143, "left": 129, "width": 268, "height": 250 } ] }, "bounding-box-metadata": { "objects": [ { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 } ], "class-map": { "0": "Gear_Housing", "1": "Gear_Ratio", "3": "Flange", "4": "Worm_Gear" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2021-06-18T11:56:01", "job-name": "3DEXCITE" }
}

मेनिफेस्ट फ़ाइल तैयार होने के बाद, हम इसे S3 बकेट में अपलोड करते हैं, और फिर विकल्प का चयन करके रिकॉग्निशन कस्टम लेबल में एक प्रशिक्षण डेटासेट बनाते हैं। अमेज़न SageMaker ग्राउंड ट्रूथ द्वारा लेबल की गई छवियाँ आयात करें.

मेनिफेस्ट फ़ाइल आयात होने के बाद, हम लेबलिंग जानकारी को Amazon Rekognition कंसोल पर दृष्टिगत रूप से देख सकते हैं। इससे हमें यह पुष्टि करने में मदद मिलती है कि मेनिफेस्ट फ़ाइल जेनरेट और आयात की गई है। अधिक विशेष रूप से, बाउंडिंग बॉक्स को छवियों में ऑब्जेक्ट के साथ संरेखित करना चाहिए, और ऑब्जेक्ट की क्लास आईडी को सही ढंग से असाइन किया जाना चाहिए।

परीक्षण डेटासेट बनाएं

परीक्षण छवियों को वास्तविक जीवन में एक फोन या कैमरे के साथ विभिन्न कोणों और प्रकाश व्यवस्था की स्थिति से कैप्चर किया जाता है, क्योंकि हम वास्तविक जीवन परिदृश्यों के खिलाफ मॉडल सटीकता को सत्यापित करना चाहते हैं, जिसे हमने सिंथेटिक डेटा का उपयोग करके प्रशिक्षित किया है। आप इन परीक्षण छवियों को एक S3 बकेट में अपलोड कर सकते हैं, और फिर उन्हें पहचान कस्टम लेबल में डेटासेट के रूप में आयात कर सकते हैं। या आप उन्हें सीधे अपने स्थानीय मशीन से डेटासेट पर अपलोड कर सकते हैं।

रिकॉग्निशन कस्टम लेबल्स बिल्ट-इन इमेज एनोटेशन क्षमता प्रदान करता है, जिसका ग्राउंड ट्रुथ के समान अनुभव है। परीक्षण डेटा आयात होने पर आप लेबलिंग कार्य प्रारंभ कर सकते हैं। ऑब्जेक्ट डिटेक्शन यूज केस के लिए, बाउंडिंग बॉक्स को रुचि की वस्तुओं के चारों ओर कसकर बनाया जाना चाहिए, जो मॉडल को लक्ष्य ऑब्जेक्ट से संबंधित क्षेत्रों और पिक्सेल को सटीक रूप से सीखने में मदद करता है। इसके अलावा, आपको सभी छवियों में लक्ष्य ऑब्जेक्ट के प्रत्येक इंस्टेंस को लेबल करना चाहिए, यहां तक कि वे जो आंशिक रूप से दृश्य से बाहर हैं या अन्य ऑब्जेक्ट द्वारा रोके गए हैं, अन्यथा मॉडल अधिक झूठे नकारात्मक की भविष्यवाणी करता है।

क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन मॉडल बनाएं

मान्यता कस्टम लेबल पूरी तरह से प्रबंधित सेवा है; आपको बस ट्रेन और परीक्षण डेटासेट प्रदान करने की आवश्यकता है। यह मॉडलों के एक सेट को प्रशिक्षित करता है और प्रदान किए गए डेटा के आधार पर सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल को चुनता है। इस प्रोटोटाइप में, हम पहले बताए गए छवि वृद्धि विधियों के विभिन्न संयोजनों के साथ प्रयोग करके सिंथेटिक प्रशिक्षण डेटासेट को पुनरावृत्त रूप से तैयार करते हैं। रिकॉग्निशन कस्टम लेबल में प्रत्येक प्रशिक्षण डेटासेट के लिए एक मॉडल बनाया गया है, जो हमें विशेष रूप से इस उपयोग के मामले के लिए इष्टतम प्रशिक्षण डेटासेट की तुलना करने और खोजने की अनुमति देता है। प्रत्येक मॉडल में प्रशिक्षण छवियों की न्यूनतम संख्या होती है, जिसमें अच्छी छवि विविधता होती है, और सर्वोत्तम मॉडल सटीकता प्रदान करता है। 15 पुनरावृत्तियों के बाद, हमने लगभग 1 सिंथेटिक प्रशिक्षण छवियों का उपयोग करके 98% मॉडल सटीकता का F10,000 स्कोर हासिल किया, जो औसतन प्रति ऑब्जेक्ट 2,000 छवियां है।

मॉडल अनुमान के परिणाम

निम्न छवि अमेज़ॅन रिकॉग्निशन मॉडल को रीयल-टाइम अनुमान एप्लिकेशन में उपयोग किया जा रहा है। उच्च आत्मविश्वास के साथ सभी घटकों का सही ढंग से पता लगाया जाता है।

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE PlatoBlockchain Data Intelligence के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न। लंबवत खोज। ऐ.

निष्कर्ष

इस पोस्ट में, हमने दिखाया कि कैसे विशुद्ध रूप से सिंथेटिक छवियों पर एक कंप्यूटर विज़न मॉडल को प्रशिक्षित किया जाए, और कैसे मॉडल अभी भी वास्तविक दुनिया की वस्तुओं को विश्वसनीय रूप से पहचान सकता है। यह प्रशिक्षण डेटा एकत्र करने और लेबल करने के लिए महत्वपूर्ण मैन्युअल प्रयास बचाता है। इस खोज के साथ, डसॉल्ट सिस्टम्स डिजाइनरों और इंजीनियरों द्वारा बनाए गए 3D उत्पाद मॉडल के व्यावसायिक मूल्य का विस्तार कर रहा है, क्योंकि अब आप भौतिक दुनिया में छवियों के लिए मान्यता प्रणालियों में CAD, CAE और PLM डेटा का उपयोग कर सकते हैं।

पहचान कस्टम लेबल की प्रमुख विशेषताओं और उपयोग के मामलों के बारे में अधिक जानकारी के लिए, देखें अमेज़ॅन रेकग्निशन कस्टम लेबल. यदि आपकी छवियों को मूल रूप से ग्राउंड ट्रुथ के साथ लेबल नहीं किया गया है, जो इस परियोजना के लिए मामला था, देखें एक मैनिफ़ेस्ट फ़ाइल बनाना अपने लेबलिंग डेटा को उस प्रारूप में बदलने के लिए जिसे पहचान कस्टम लेबल उपभोग कर सकते हैं।

लेखक के बारे में

वुडी बोर्राकिनो वर्तमान में AWS में एक वरिष्ठ मशीन लर्निंग स्पेशलिस्ट सॉल्यूशन आर्किटेक्ट हैं। मिलान, इटली में स्थित, वुडी ने 2015 में एडब्ल्यूएस में शामिल होने से पहले सॉफ्टवेयर विकास पर काम किया, जहां उनका विकास कंप्यूटर विजन और स्थानिक कंप्यूटिंग (एआर/वीआर/एक्सआर) प्रौद्योगिकियों के लिए जुनून है। उनका जुनून अब मेटावर्स इनोवेशन पर केंद्रित है। उसका अनुसरण करें Linkedin.

यिंग होउ, PhD, AWS में मशीन लर्निंग प्रोटोटाइप आर्किटेक्ट हैं। उनकी रुचि के मुख्य क्षेत्र डीप लर्निंग, कंप्यूटर विज़न, एनएलपी और टाइम सीरीज़ डेटा प्रेडिक्शन हैं। अपने खाली समय में, उन्हें उपन्यास पढ़ना और यूके में राष्ट्रीय उद्यानों में लंबी पैदल यात्रा करना पसंद है।

बर्नार्ड पैक्स वर्तमान में स्टॉर्म रिप्लाई का सीटीओ है जो एडब्ल्यूएस पर तैनात औद्योगिक समाधानों पर केंद्रित है। पेरिस, फ्रांस में स्थित, बर्नार्ड ने पहले प्रिंसिपल सॉल्यूशन आर्किटेक्ट और एडब्ल्यूएस में प्रिंसिपल कंसल्टेंट के रूप में काम किया। उद्यम आधुनिकीकरण में उनका योगदान औद्योगिक के लिए AWS, AWS CDK को कवर करता है, और ये अब ग्रीन आईटी और वॉयस-आधारित सिस्टम में आते हैं। उसका अनुसरण करें ट्विटर.

कार्ल हर्कटी वर्तमान में डसॉल्ट सिस्टम्स 3DEExcite में वरिष्ठ रणनीतिकार हैं। जर्मनी के म्यूनिख में स्थित, वह कंप्यूटर विज़न के अभिनव कार्यान्वयन बनाता है जो मूर्त परिणाम देता है। उसका अनुसरण करें लिंक्डइन.

समय टिकट: मार्च २०,२०२१

से अधिक AWS मशीन लर्निंग

एमएल-संचालित सर्वर रहित स्टैक का उपयोग करके अमेज़ॅन केंद्र से अपने उपयोगकर्ता के खोज व्यवहार पर अंतर्दृष्टि प्राप्त करें अमेज़न वेब सेवाएँ

स्रोत क्लस्टर:

AWS मशीन लर्निंग

स्रोत नोड: 1840291

समय टिकट: 25 मई 2023

Amazon वैयक्तिकृत अनुशंसाओं के व्यावसायिक प्रभाव को मापें

AWS मशीन लर्निंग

स्रोत नोड: 1820243

समय टिकट: मार्च 30, 2023

Amazon Rekognition Custom Labels और Dassault Systems 3DEXCITE के साथ सिंथेटिक डेटासेट का उपयोग करते हुए कंप्यूटर विज़न

प्लेटो द्वारा पुनर्प्रकाशित

मान्यता प्रणालियों का अनुकूलन व्यावसायिक परिणामों को चलाने में मदद करता है

Amazon Rekognition द्वारा संचालित Dassault Systèmes 3DEXCITE के साथ कंप्यूटर विज़न को बेहतर बनाएं

समाधान अवलोकन

सिंथेटिक चित्र बनाएं

सिंथेटिक प्रशिक्षण डेटासेट आयात करें

परीक्षण डेटासेट बनाएं

क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन मॉडल बनाएं

मॉडल अनुमान के परिणाम

निष्कर्ष

लेखक के बारे में

से अधिक AWS मशीन लर्निंग

Amazon वैयक्तिकृत अनुशंसाओं के व्यावसायिक प्रभाव को मापें

सुरक्षित Amazon SageMaker Studio द्वारा निर्धारित URL भाग 2: JWT प्रमाणीकरण के साथ निजी API

AWS मीडिया इंटेलिजेंस और हगिंग फेस का उपयोग करके टैक्सोनॉमी-आधारित प्रासंगिक लक्ष्यीकरण बनाएं BERT

IMDb नॉलेज ग्राफ़ का उपयोग करके पावर अनुशंसाएँ और खोज - भाग 2

हगिंग फेस और अमेज़ॅन सेजमेकर एसिंक्रोनस इंट्रेंस एंडपॉइंट्स के साथ उच्च-मूल्य वाले अनुसंधान में सुधार करें

अमेज़ॅन सेजमेकर स्वचालित मॉडल ट्यूनिंग अब सेजमेकर प्रशिक्षण इंस्टेंस फ़ॉलबैक का समर्थन करता है

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा