यह स्टॉर्म रिप्लाई के सीटीओ बर्नार्ड पैक्स और डसॉल्ट सिस्टम्स 3डीएक्ससाइट के वरिष्ठ रणनीतिकार कार्ल हर्कट के साथ सह-लिखित एक पोस्ट है।
जबकि कंप्यूटर विज़न औद्योगिक रखरखाव, निर्माण, रसद और उपभोक्ता अनुप्रयोगों के लिए महत्वपूर्ण हो सकता है, इसे अपनाना प्रशिक्षण डेटासेट के मैनुअल निर्माण द्वारा सीमित है। औद्योगिक संदर्भ में लेबल किए गए चित्रों का निर्माण मुख्य रूप से मैन्युअल रूप से किया जाता है, जो सीमित पहचान क्षमताएं बनाता है, स्केल नहीं करता है, और इसके परिणामस्वरूप श्रम लागत और व्यावसायिक मूल्य प्राप्ति में देरी होती है। यह उत्पाद डिजाइन, उत्पाद इंजीनियरिंग और उत्पाद विन्यास में तेजी से पुनरावृत्तियों द्वारा प्रदान की जाने वाली व्यावसायिक चपलता के खिलाफ जाता है। यह प्रक्रिया कार, हवाई जहाज, या आधुनिक इमारतों जैसे जटिल उत्पादों के लिए पैमाना नहीं है, क्योंकि उन परिदृश्यों में प्रत्येक लेबलिंग प्रोजेक्ट अद्वितीय है (अद्वितीय उत्पादों से संबंधित)। नतीजतन, डेटा तैयार करने में बड़े प्रयास के बिना, कभी-कभी उपयोग केस डिलीवरी को सीमित किए बिना, कंप्यूटर विज़न तकनीक को बड़े पैमाने पर अद्वितीय परियोजनाओं पर आसानी से लागू नहीं किया जा सकता है।
इस पोस्ट में, हम एक नया दृष्टिकोण प्रस्तुत करते हैं जहां डिजाइन और सीएडी फाइलों से अत्यधिक विशिष्ट कंप्यूटर विज़न सिस्टम बनाए जाते हैं। हम नेत्रहीन सही डिजिटल जुड़वाँ के निर्माण और सिंथेटिक लेबल वाली छवियों की पीढ़ी के साथ शुरू करते हैं। फिर हम इन छवियों को धक्का देते हैं अमेज़ॅन रेकग्निशन कस्टम लेबल कस्टम ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करने के लिए। सॉफ्टवेयर के साथ मौजूदा बौद्धिक संपदा का उपयोग करके, हम विभिन्न औद्योगिक संदर्भों के लिए कंप्यूटर विज़न को वहनीय और प्रासंगिक बना रहे हैं।
मान्यता प्रणालियों का अनुकूलन व्यावसायिक परिणामों को चलाने में मदद करता है
डिजिटल जुड़वाँ से निर्मित विशिष्ट कंप्यूटर विज़न सिस्टम में विशिष्ट गुण होते हैं, जिन्हें निम्नलिखित उपयोग के मामलों में चित्रित किया जा सकता है:
- अद्वितीय उत्पादों के लिए पता लगाने की क्षमता - एयरबस, बोइंग और अन्य विमान निर्माता अद्वितीय प्रदान करते हैं निर्माता सीरियल नंबर (एमएसएन) उनके द्वारा उत्पादित प्रत्येक विमान के लिए। इसे उत्पन्न करने के लिए, संपूर्ण उत्पादन प्रक्रिया के दौरान प्रबंधित किया जाता है उड़ान योग्यता दस्तावेज और उड़ान भरने की अनुमति प्राप्त करें। ए डिजिटल ट्विन (भौतिक उत्पाद का प्रतिनिधित्व करने वाला एक आभासी 3D मॉडल) प्रत्येक एमएसएन के विन्यास से प्राप्त किया जा सकता है, और एक वितरित कंप्यूटर दृष्टि प्रणाली उत्पन्न करता है जो औद्योगिक सुविधाओं में इस एमएसएन की प्रगति को ट्रैक करता है। कस्टम मान्यता एयरलाइनों को दी गई पारदर्शिता को स्वचालित करती है, और एयरलाइनों द्वारा मैन्युअल रूप से निष्पादित अधिकांश चौकियों को बदल देती है। अद्वितीय उत्पादों पर स्वचालित गुणवत्ता आश्वासन हवाई जहाजों, कारों, इमारतों और यहां तक कि शिल्प प्रस्तुतियों पर भी लागू हो सकता है।
- प्रासंगिक संवर्धित वास्तविकता - प्रोफेशनल-ग्रेड कंप्यूटर विज़न सिस्टम सीमित परिदृश्यों को दायरे में ला सकते हैं, लेकिन उच्च भेदभाव क्षमताओं के साथ। उदाहरण के लिए, औद्योगिक रखरखाव में, एक तस्वीर में एक स्क्रूड्राइवर ढूंढना बेकार है; आपको स्क्रूड्राइवर मॉडल या यहां तक कि उसके सीरियल नंबर की पहचान करने की आवश्यकता है। ऐसे सीमित संदर्भों में, कस्टम पहचान प्रणाली सामान्य पहचान प्रणाली से बेहतर प्रदर्शन करती है क्योंकि वे अपने निष्कर्षों में अधिक प्रासंगिक हैं। कस्टम रिकग्निशन सिस्टम के माध्यम से सटीक फीडबैक लूप सक्षम करते हैं समर्पित संवर्धित वास्तविकता एचएमआई या मोबाइल उपकरणों में वितरित।
- एंड-टू-एंड गुणवत्ता नियंत्रण - साथ में सिस्टम इंजीनियरिंग, आप आंशिक निर्माणों के डिजिटल जुड़वाँ बना सकते हैं, और कंप्यूटर विज़न सिस्टम उत्पन्न कर सकते हैं जो निर्माण और उत्पादन प्रक्रियाओं के विभिन्न चरणों के अनुकूल होते हैं। दृश्य नियंत्रण को निर्माण कार्यस्थानों के साथ जोड़ा जा सकता है, जिससे एंड-टू-एंड निरीक्षण और दोषों का शीघ्र पता लगाया जा सकता है। कस्टम पहचान एंड-टू-एंड निरीक्षण के लिए असेंबली लाइनों में दोषों के कैस्केडिंग को प्रभावी ढंग से रोकता है। अस्वीकृति दर को कम करना और उत्पादन उत्पादन को अधिकतम करना अंतिम लक्ष्य है।
- लचीला गुणवत्ता निरीक्षण - आधुनिक गुणवत्ता निरीक्षण को डिजाइन विविधताओं और लचीले निर्माण के अनुकूल होना पड़ता है। डिजाइन में बदलाव उत्पाद के उपयोग और उत्पाद रखरखाव पर फीडबैक लूप से आते हैं। लचीला निर्माण मेक-टू-ऑर्डर रणनीति के लिए एक प्रमुख क्षमता है, और लागत-अनुकूलन के लीन निर्माण सिद्धांत के साथ संरेखित होती है। डिजिटल ट्विन्स में डिज़ाइन विविधताओं और कॉन्फ़िगरेशन विकल्पों को एकीकृत करके, कस्टम मान्यता कंप्यूटर विज़न सिस्टम के उत्पादन योजनाओं और डिज़ाइन विविधताओं के गतिशील अनुकूलन को सक्षम बनाती है।
Amazon Rekognition द्वारा संचालित Dassault Systèmes 3DEXCITE के साथ कंप्यूटर विज़न को बेहतर बनाएं
डिजिटल ट्विन्स में गहरी विशेषज्ञता वाली कंपनी डसॉल्ट सिस्टम्स के भीतर, जो दूसरा सबसे बड़ा यूरोपीय सॉफ्टवेयर संपादक भी है, 3DEXCITE टीम एक अलग रास्ता तलाश रही है। जैसा कि कार्ल हर्कट द्वारा समझाया गया है, "क्या होगा यदि सिंथेटिक छवियों से प्रशिक्षित एक तंत्रिका मॉडल एक भौतिक उत्पाद को पहचान सके?" 3DEXCITE ने इस अजीबोगरीब दृष्टिकोण की व्यवहार्यता को साबित करते हुए, AWS इन्फ्रास्ट्रक्चर के साथ अपनी तकनीक को मिलाकर इस समस्या को हल किया है। इसे . के रूप में भी जाना जाता है क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन, जहां डिटेक्शन मॉडल स्रोत डोमेन (सिंथेटिक छवियों) से लेबल की गई छवियों से सीखता है और लेबल रहित लक्ष्य डोमेन (भौतिक घटक) के लिए भविष्यवाणियां करता है।
डसॉल्ट सिस्टम्स 3DEXCITE और AWS प्रोटोटाइप टीम ने एक प्रदर्शन प्रणाली बनाने के लिए सेना में शामिल हो गए हैं जो एक औद्योगिक गियरबॉक्स के कुछ हिस्सों को पहचानती है। यह प्रोटोटाइप 3 सप्ताह में बनाया गया था, और प्रशिक्षित मॉडल ने 98% F1 स्कोर हासिल किया। मान्यता मॉडल को पूरी तरह से एक सॉफ्टवेयर पाइपलाइन से प्रशिक्षित किया गया है, जिसमें वास्तविक हिस्से की कोई तस्वीर नहीं है। एक औद्योगिक गियरबॉक्स के डिजाइन और सीएडी फाइलों से, 3DEXCITE ने दृष्टि से सही डिजिटल जुड़वां बनाए हैं। उन्होंने डिजिटल जुड़वां से हजारों सिंथेटिक लेबल वाली छवियां भी तैयार कीं। फिर उन्होंने इन छवियों से एक अत्यधिक विशिष्ट तंत्रिका मॉडल को प्रशिक्षित करने के लिए पहचान कस्टम लेबल का उपयोग किया और एक संबंधित मान्यता एपीआई प्रदान किया। उन्होंने गियरबॉक्स के एक भौतिक भाग के किसी भी वेबकैम से पहचान को सक्षम करने के लिए एक वेबसाइट बनाई।
अमेज़ॅन रेकग्निशन एक एआई सेवा है जो आपको छवियों और वीडियो से सार्थक मेटाडेटा निकालने की अनुमति देने के लिए गहन शिक्षण तकनीक का उपयोग करती है - जिसमें वस्तुओं, लोगों, पाठ, दृश्यों, गतिविधियों और संभावित रूप से अनुपयुक्त सामग्री की पहचान करना शामिल है - बिना मशीन लर्निंग (एमएल) विशेषज्ञता की आवश्यकता है। Amazon Rekognition अत्यधिक सटीक चेहरे का विश्लेषण और चेहरे की खोज क्षमताएं भी प्रदान करता है जिसका उपयोग आप विभिन्न प्रकार के उपयोगकर्ता सत्यापन, लोगों की गिनती और सुरक्षा उपयोग के मामलों का पता लगाने, विश्लेषण करने और चेहरों की तुलना करने के लिए कर सकते हैं। अंत में, पहचान कस्टम लेबल के साथ, आप ऑब्जेक्ट डिटेक्शन और छवि वर्गीकरण मॉडल बनाने के लिए अपने स्वयं के डेटा का उपयोग कर सकते हैं।
कंप्यूटर दृष्टि के लिए मान्यता कस्टम लेबल के साथ सिंथेटिक लेबल वाली छवियों के निर्माण के लिए डसॉल्ट सिस्टम्स तकनीक का संयोजन मान्यता प्रणालियों के लिए एक स्केलेबल वर्कफ़्लो प्रदान करता है। उपयोग में आसानी यहां एक महत्वपूर्ण सकारात्मक कारक है क्योंकि समग्र सॉफ्टवेयर पाइपलाइन में पहचान कस्टम लेबल जोड़ना मुश्किल नहीं है—यह एक एपीआई को वर्कफ़्लो में एकीकृत करने जितना आसान है। एमएल वैज्ञानिक होने की आवश्यकता नहीं है; बस एडब्ल्यूएस को कैप्चर किए गए फ्रेम भेजें और एक परिणाम प्राप्त करें जिसे आप डेटाबेस में दर्ज कर सकते हैं या वेब ब्राउज़र में प्रदर्शित कर सकते हैं।
यह आगे प्रशिक्षण डेटासेट के मैन्युअल निर्माण पर नाटकीय सुधार को रेखांकित करता है। आप महंगे, अनावश्यक काम के घंटों की आवश्यकता के बिना, तेजी से और अधिक सटीकता के साथ बेहतर परिणाम प्राप्त कर सकते हैं। इतने सारे संभावित उपयोग के मामलों के साथ, डसॉल्ट सिस्टम्स और रिकॉग्निशन कस्टम लेबल्स के संयोजन में आज के व्यवसायों को महत्वपूर्ण और तत्काल आरओआई प्रदान करने की क्षमता है।
समाधान अवलोकन
इस समाधान में पहला कदम उन छवियों को प्रस्तुत करना है जो प्रशिक्षण डेटासेट बनाते हैं। यह 3DEXCITE प्लेटफॉर्म द्वारा किया जाता है। हम स्क्रिप्ट का उपयोग करके लेबलिंग डेटा प्रोग्रामेटिक रूप से उत्पन्न कर सकते हैं। अमेज़ॅन सैजमेकर ग्राउंड ट्रुथ वर्गीकरण और ऑब्जेक्ट डिटेक्शन कार्यों के लिए छवियों और वीडियो को आसानी से लेबल करने के लिए एक एनोटेशन टूल प्रदान करता है। Amazon Rekognition में एक मॉडल को प्रशिक्षित करने के लिए, लेबलिंग फ़ाइल को ग्राउंड ट्रुथ प्रारूप का अनुपालन करने की आवश्यकता होती है। ये लेबल JSON में हैं, जिसमें छवि आकार, बाउंडिंग बॉक्स निर्देशांक और वर्ग आईडी जैसी जानकारी शामिल है।
फिर सिंथेटिक छवियों और मेनिफेस्ट को . पर अपलोड करें अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस 3), जहां पहचान कस्टम लेबल उन्हें प्रशिक्षण डेटासेट के घटकों के रूप में आयात कर सकते हैं।
रिकॉग्निशन कस्टम लेबल को मॉडल बनाम वास्तविक घटक छवियों के एक सेट का परीक्षण करने देने के लिए, हम कैमरे से लिए गए वास्तविक इंजन भागों की तस्वीरों का एक सेट प्रदान करते हैं और परीक्षण डेटासेट के रूप में उपयोग करने के लिए उन्हें Amazon S3 पर अपलोड करते हैं।
अंत में, रिकॉग्निशन कस्टम लेबल सिंथेटिक प्रशिक्षण डेटासेट और वास्तविक वस्तुओं के चित्रों से बने परीक्षण डेटासेट का उपयोग करके सर्वश्रेष्ठ ऑब्जेक्ट डिटेक्शन मॉडल को प्रशिक्षित करता है, और उस मॉडल के साथ एंडपॉइंट बनाता है जिसका उपयोग हम अपने एप्लिकेशन में ऑब्जेक्ट रिकग्निशन चलाने के लिए कर सकते हैं।
निम्नलिखित आरेख हमारे समाधान वर्कफ़्लो को दिखाता है:
सिंथेटिक चित्र बनाएं
सिंथेटिक छवियां 3Dexperience प्लेटफॉर्म से उत्पन्न होती हैं, जो कि डसॉल्ट सिस्टम्स का एक उत्पाद है। यह प्लेटफ़ॉर्म आपको ऑब्जेक्ट की CAD (कंप्यूटर एडेड डिज़ाइन) फ़ाइल के आधार पर फ़ोटोरियलिस्टिक चित्र बनाने और प्रस्तुत करने की अनुमति देता है। हम प्लेटफॉर्म पर इमेज ट्रांसफॉर्मेशन कॉन्फिगरेशन को बदलकर कुछ ही घंटों में हजारों वेरिएंट जेनरेट कर सकते हैं।
इस प्रोटोटाइप में, हमने ऑब्जेक्ट डिटेक्शन के लिए निम्नलिखित पांच स्पष्ट रूप से अलग गियरबॉक्स भागों का चयन किया। इनमें गियर हाउसिंग, गियर अनुपात, असर कवर, निकला हुआ किनारा और वर्म गियर शामिल हैं।
हमने छवि विविधता को बढ़ाने और सिंथेटिक डेटा को अधिक फोटोरियलिस्टिक बनाने के लिए निम्नलिखित डेटा वृद्धि विधियों का उपयोग किया। यह मॉडल सामान्यीकरण त्रुटि को कम करने में मदद करता है।
- / बाहर ज़ूम - यह विधि छवियों में ऑब्जेक्ट को बेतरतीब ढंग से ज़ूम इन या आउट करती है।
- रोटेशन - यह विधि ऑब्जेक्ट को छवियों में घुमाती है, और ऐसा लगता है कि वर्चुअल कैमरा 360-डिग्री कोण से ऑब्जेक्ट की यादृच्छिक तस्वीरें लेता है।
- सामग्री के रंगरूप में सुधार करें - हमने पहचाना कि कुछ गियर भागों के लिए प्रारंभिक रेंडरिंग में सामग्री का स्वरूप कम यथार्थवादी है। हमने सिंथेटिक छवियों को बेहतर बनाने के लिए एक धातु प्रभाव जोड़ा।
- विभिन्न प्रकाश व्यवस्था सेटिंग्स का प्रयोग करें - इस प्रोटोटाइप में, हमने दो प्रकाश व्यवस्था की स्थिति का अनुकरण किया:
- गोदाम - एक यथार्थवादी प्रकाश वितरण। छाया और प्रतिबिंब संभव हैं।
- स्टूडियो - वस्तु के चारों ओर एक सजातीय प्रकाश डाला जाता है। यह यथार्थवादी नहीं है लेकिन कोई छाया या प्रतिबिंब नहीं है।
- वास्तविक समय में वस्तु को कैसे देखा जाता है, इसकी यथार्थवादी स्थिति का उपयोग करें - वास्तविक जीवन में, कुछ वस्तुओं, जैसे कि एक निकला हुआ किनारा और असर कवर, आमतौर पर एक सतह पर रखा जाता है, और मॉडल ऊपर और नीचे के पहलुओं के आधार पर वस्तुओं का पता लगा रहा है। इसलिए, हमने प्रशिक्षण छवियों को हटा दिया जो भागों के पतले किनारे को दिखाते हैं, जिसे किनारे की स्थिति भी कहा जाता है, और वस्तुओं की छवियों को एक सपाट स्थिति में बढ़ाया जाता है।
- एक छवि में कई ऑब्जेक्ट जोड़ें - वास्तविक जीवन परिदृश्यों में, कई गियर भाग सभी एक दृश्य में दिखाई दे सकते हैं, इसलिए हमने ऐसे चित्र तैयार किए जिनमें कई गियर भाग होते हैं।
3Dexperience प्लेटफ़ॉर्म पर, हम इमेज के लिए अलग-अलग बैकग्राउंड लागू कर सकते हैं, जो इमेज की विविधता को और बढ़ाने में मदद कर सकता है। समय सीमा के कारण, हमने इसे इस प्रोटोटाइप में लागू नहीं किया।
सिंथेटिक प्रशिक्षण डेटासेट आयात करें
एमएल में, लेबल किए गए डेटा का मतलब है कि लक्ष्य को दिखाने के लिए प्रशिक्षण डेटा को एनोटेट किया जाता है, यही वह जवाब है जिसे आप अपने एमएल मॉडल की भविष्यवाणी करना चाहते हैं। लेबल किए गए डेटा का उपयोग मान्यता कस्टम लेबल द्वारा किया जा सकता है, जिसका अनुपालन ग्राउंड ट्रुथ मेनिफेस्ट फ़ाइल आवश्यकताओं के साथ किया जाना चाहिए। एक मेनिफेस्ट फ़ाइल एक या अधिक JSON लाइनों से बनी होती है; प्रत्येक पंक्ति में एक छवि के लिए जानकारी होती है। सिंथेटिक प्रशिक्षण डेटा के लिए, लेबलिंग जानकारी को सीएडी फ़ाइल और छवि परिवर्तन कॉन्फ़िगरेशन के आधार पर प्रोग्रामेटिक रूप से उत्पन्न किया जा सकता है, जो लेबलिंग कार्य के महत्वपूर्ण मैन्युअल प्रयास को बचाता है। फ़ाइल स्वरूपों को लेबल करने की आवश्यकताओं के बारे में अधिक जानकारी के लिए, देखें एक मेनिफेस्ट फ़ाइल बनाएं और मेनिफेस्ट फाइलों में वस्तु स्थानीयकरण. छवि लेबलिंग का एक उदाहरण निम्नलिखित है:
मेनिफेस्ट फ़ाइल तैयार होने के बाद, हम इसे S3 बकेट में अपलोड करते हैं, और फिर विकल्प का चयन करके रिकॉग्निशन कस्टम लेबल में एक प्रशिक्षण डेटासेट बनाते हैं। अमेज़न SageMaker ग्राउंड ट्रूथ द्वारा लेबल की गई छवियाँ आयात करें.
मेनिफेस्ट फ़ाइल आयात होने के बाद, हम लेबलिंग जानकारी को Amazon Rekognition कंसोल पर दृष्टिगत रूप से देख सकते हैं। इससे हमें यह पुष्टि करने में मदद मिलती है कि मेनिफेस्ट फ़ाइल जेनरेट और आयात की गई है। अधिक विशेष रूप से, बाउंडिंग बॉक्स को छवियों में ऑब्जेक्ट के साथ संरेखित करना चाहिए, और ऑब्जेक्ट की क्लास आईडी को सही ढंग से असाइन किया जाना चाहिए।
परीक्षण डेटासेट बनाएं
परीक्षण छवियों को वास्तविक जीवन में एक फोन या कैमरे के साथ विभिन्न कोणों और प्रकाश व्यवस्था की स्थिति से कैप्चर किया जाता है, क्योंकि हम वास्तविक जीवन परिदृश्यों के खिलाफ मॉडल सटीकता को सत्यापित करना चाहते हैं, जिसे हमने सिंथेटिक डेटा का उपयोग करके प्रशिक्षित किया है। आप इन परीक्षण छवियों को एक S3 बकेट में अपलोड कर सकते हैं, और फिर उन्हें पहचान कस्टम लेबल में डेटासेट के रूप में आयात कर सकते हैं। या आप उन्हें सीधे अपने स्थानीय मशीन से डेटासेट पर अपलोड कर सकते हैं।
रिकॉग्निशन कस्टम लेबल्स बिल्ट-इन इमेज एनोटेशन क्षमता प्रदान करता है, जिसका ग्राउंड ट्रुथ के समान अनुभव है। परीक्षण डेटा आयात होने पर आप लेबलिंग कार्य प्रारंभ कर सकते हैं। ऑब्जेक्ट डिटेक्शन यूज केस के लिए, बाउंडिंग बॉक्स को रुचि की वस्तुओं के चारों ओर कसकर बनाया जाना चाहिए, जो मॉडल को लक्ष्य ऑब्जेक्ट से संबंधित क्षेत्रों और पिक्सेल को सटीक रूप से सीखने में मदद करता है। इसके अलावा, आपको सभी छवियों में लक्ष्य ऑब्जेक्ट के प्रत्येक इंस्टेंस को लेबल करना चाहिए, यहां तक कि वे जो आंशिक रूप से दृश्य से बाहर हैं या अन्य ऑब्जेक्ट द्वारा रोके गए हैं, अन्यथा मॉडल अधिक झूठे नकारात्मक की भविष्यवाणी करता है।
क्रॉस-डोमेन ऑब्जेक्ट डिटेक्शन मॉडल बनाएं
मान्यता कस्टम लेबल पूरी तरह से प्रबंधित सेवा है; आपको बस ट्रेन और परीक्षण डेटासेट प्रदान करने की आवश्यकता है। यह मॉडलों के एक सेट को प्रशिक्षित करता है और प्रदान किए गए डेटा के आधार पर सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल को चुनता है। इस प्रोटोटाइप में, हम पहले बताए गए छवि वृद्धि विधियों के विभिन्न संयोजनों के साथ प्रयोग करके सिंथेटिक प्रशिक्षण डेटासेट को पुनरावृत्त रूप से तैयार करते हैं। रिकॉग्निशन कस्टम लेबल में प्रत्येक प्रशिक्षण डेटासेट के लिए एक मॉडल बनाया गया है, जो हमें विशेष रूप से इस उपयोग के मामले के लिए इष्टतम प्रशिक्षण डेटासेट की तुलना करने और खोजने की अनुमति देता है। प्रत्येक मॉडल में प्रशिक्षण छवियों की न्यूनतम संख्या होती है, जिसमें अच्छी छवि विविधता होती है, और सर्वोत्तम मॉडल सटीकता प्रदान करता है। 15 पुनरावृत्तियों के बाद, हमने लगभग 1 सिंथेटिक प्रशिक्षण छवियों का उपयोग करके 98% मॉडल सटीकता का F10,000 स्कोर हासिल किया, जो औसतन प्रति ऑब्जेक्ट 2,000 छवियां है।
मॉडल अनुमान के परिणाम
निम्न छवि अमेज़ॅन रिकॉग्निशन मॉडल को रीयल-टाइम अनुमान एप्लिकेशन में उपयोग किया जा रहा है। उच्च आत्मविश्वास के साथ सभी घटकों का सही ढंग से पता लगाया जाता है।
निष्कर्ष
इस पोस्ट में, हमने दिखाया कि कैसे विशुद्ध रूप से सिंथेटिक छवियों पर एक कंप्यूटर विज़न मॉडल को प्रशिक्षित किया जाए, और कैसे मॉडल अभी भी वास्तविक दुनिया की वस्तुओं को विश्वसनीय रूप से पहचान सकता है। यह प्रशिक्षण डेटा एकत्र करने और लेबल करने के लिए महत्वपूर्ण मैन्युअल प्रयास बचाता है। इस खोज के साथ, डसॉल्ट सिस्टम्स डिजाइनरों और इंजीनियरों द्वारा बनाए गए 3D उत्पाद मॉडल के व्यावसायिक मूल्य का विस्तार कर रहा है, क्योंकि अब आप भौतिक दुनिया में छवियों के लिए मान्यता प्रणालियों में CAD, CAE और PLM डेटा का उपयोग कर सकते हैं।
पहचान कस्टम लेबल की प्रमुख विशेषताओं और उपयोग के मामलों के बारे में अधिक जानकारी के लिए, देखें अमेज़ॅन रेकग्निशन कस्टम लेबल. यदि आपकी छवियों को मूल रूप से ग्राउंड ट्रुथ के साथ लेबल नहीं किया गया है, जो इस परियोजना के लिए मामला था, देखें एक मैनिफ़ेस्ट फ़ाइल बनाना अपने लेबलिंग डेटा को उस प्रारूप में बदलने के लिए जिसे पहचान कस्टम लेबल उपभोग कर सकते हैं।
लेखक के बारे में
वुडी बोर्राकिनो वर्तमान में AWS में एक वरिष्ठ मशीन लर्निंग स्पेशलिस्ट सॉल्यूशन आर्किटेक्ट हैं। मिलान, इटली में स्थित, वुडी ने 2015 में एडब्ल्यूएस में शामिल होने से पहले सॉफ्टवेयर विकास पर काम किया, जहां उनका विकास कंप्यूटर विजन और स्थानिक कंप्यूटिंग (एआर/वीआर/एक्सआर) प्रौद्योगिकियों के लिए जुनून है। उनका जुनून अब मेटावर्स इनोवेशन पर केंद्रित है। उसका अनुसरण करें Linkedin.
यिंग होउ, PhD, AWS में मशीन लर्निंग प्रोटोटाइप आर्किटेक्ट हैं। उनकी रुचि के मुख्य क्षेत्र डीप लर्निंग, कंप्यूटर विज़न, एनएलपी और टाइम सीरीज़ डेटा प्रेडिक्शन हैं। अपने खाली समय में, उन्हें उपन्यास पढ़ना और यूके में राष्ट्रीय उद्यानों में लंबी पैदल यात्रा करना पसंद है।
बर्नार्ड पैक्स वर्तमान में स्टॉर्म रिप्लाई का सीटीओ है जो एडब्ल्यूएस पर तैनात औद्योगिक समाधानों पर केंद्रित है। पेरिस, फ्रांस में स्थित, बर्नार्ड ने पहले प्रिंसिपल सॉल्यूशन आर्किटेक्ट और एडब्ल्यूएस में प्रिंसिपल कंसल्टेंट के रूप में काम किया। उद्यम आधुनिकीकरण में उनका योगदान औद्योगिक के लिए AWS, AWS CDK को कवर करता है, और ये अब ग्रीन आईटी और वॉयस-आधारित सिस्टम में आते हैं। उसका अनुसरण करें ट्विटर.
कार्ल हर्कटी वर्तमान में डसॉल्ट सिस्टम्स 3DEExcite में वरिष्ठ रणनीतिकार हैं। जर्मनी के म्यूनिख में स्थित, वह कंप्यूटर विज़न के अभिनव कार्यान्वयन बनाता है जो मूर्त परिणाम देता है। उसका अनुसरण करें लिंक्डइन.
- कॉइनस्मार्ट। यूरोप का सर्वश्रेष्ठ बिटकॉइन और क्रिप्टो एक्सचेंज।
- प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। नि: शुल्क प्रवेश।
- क्रिप्टोहॉक। Altcoin रडार। मुफ्त परीक्षण।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/computer-vision-using-synthetic-datasets-with-amazon-rekognition-custom-labels-and-dassault-systemes-3dexcite/
- "
- 000
- 100
- 3d
- About
- सही
- हासिल
- के पार
- गतिविधियों
- दत्तक ग्रहण
- AI
- एयरलाइंस
- हवाई जहाज
- सब
- वीरांगना
- विश्लेषण
- एपीआई
- आवेदन
- अनुप्रयोगों
- दृष्टिकोण
- चारों ओर
- सौंपा
- संवर्धित
- स्वचालित
- औसत
- एडब्ल्यूएस
- जा रहा है
- BEST
- सीमा
- मुक्केबाज़ी
- ब्राउज़र
- निर्माण
- में निर्मित
- व्यापार
- व्यवसायों
- सीएडी
- क्षमताओं
- कारों
- मामलों
- वर्गीकरण
- एकत्रित
- संयोजन
- संयोजन
- कंपनी
- जटिल
- अंग
- कंप्यूटिंग
- आत्मविश्वास
- विन्यास
- कंसोल
- सलाहकार
- उपभोग
- उपभोक्ता
- शामिल हैं
- लागत
- सका
- बनाता है
- महत्वपूर्ण
- सीटीओ
- तिथि
- डाटाबेस
- देरी
- प्रसव
- डिज़ाइन
- पता चला
- खोज
- विकास
- डिवाइस
- विभिन्न
- डिजिटल
- डिस्प्ले
- वितरित
- वितरण
- विविधता
- नहीं करता है
- डोमेन
- गतिशील
- शीघ्र
- आसानी
- Edge
- संपादक
- प्रभाव
- समर्थकारी
- endpoint
- अभियांत्रिकी
- इंजीनियर्स
- उद्यम
- यूरोपीय
- उदाहरण
- का विस्तार
- अनुभव
- विशेषज्ञता
- अन्वेषण
- चेहरे के
- और तेज
- Feature
- विशेषताएं
- प्रतिक्रिया
- प्रथम
- ध्यान केंद्रित
- का पालन करें
- निम्नलिखित
- प्रारूप
- फ्रांस
- गियर
- उत्पन्न
- पीढ़ी
- जर्मनी
- लक्ष्य
- अच्छा
- हरा
- विकास
- ऊंचाई
- मदद
- मदद करता है
- यहाँ उत्पन्न करें
- हाई
- अत्यधिक
- HMI
- आवासन
- कैसे
- How To
- HTTPS
- पहचान करना
- की छवि
- तत्काल
- लागू करने के
- में सुधार
- शामिल
- सहित
- बढ़ना
- वृद्धि हुई
- औद्योगिक
- करें-
- इंफ्रास्ट्रक्चर
- नवोन्मेष
- अभिनव
- बौद्धिक
- बौद्धिक संपदा
- ब्याज
- रुचियों
- IT
- इटली
- में शामिल हो गए
- कुंजी
- जानने वाला
- लेबलिंग
- लेबल
- श्रम
- जानें
- सीख रहा हूँ
- प्रकाश
- सीमित
- लाइन
- लिंक्डइन
- स्थानीय
- रसद
- मशीन
- यंत्र अधिगम
- निर्माण
- कामयाब
- गाइड
- मैन्युअल
- विनिर्माण
- मेटावर्स
- ML
- मोबाइल
- मोबाइल उपकरणों
- आदर्श
- मॉडल
- अधिकांश
- एमएसएन
- राष्ट्रीय
- संख्या
- संख्या
- विकल्प
- ऑप्शंस
- आदेश
- अन्य
- अन्यथा
- पेरिस
- स्टाफ़
- फ़ोटोरियलिस्टिक
- भौतिक
- चित्र
- मंच
- संभव
- भविष्यवाणी
- भविष्यवाणियों
- वर्तमान
- प्रिंसिपल
- मुसीबत
- प्रक्रिया
- प्रक्रियाओं
- उत्पादन
- प्रस्तुत
- एस्ट्रो मॉल
- उत्पादन
- प्रस्तुतियों
- उत्पाद
- परियोजना
- परियोजनाओं
- संपत्ति
- प्रोटोटाइप
- प्रदान करना
- प्रदान करता है
- गुणवत्ता
- पढ़ना
- वास्तविक समय
- प्राप्त करना
- पहचान
- पहचानता
- को कम करने
- को कम करने
- अपेक्षित
- आवश्यकताएँ
- परिणाम
- आरओआई
- रन
- सुरक्षा
- स्केलेबल
- स्केल
- वैज्ञानिक
- Search
- चयनित
- कई
- सेवा
- सेट
- महत्वपूर्ण
- समान
- सरल
- आकार
- So
- सॉफ्टवेयर
- सॉफ्टवेयर विकास
- समाधान ढूंढे
- विशेषीकृत
- विशेष रूप से
- प्रारंभ
- तना
- भंडारण
- आंधी
- स्ट्रेटेजी
- सतह
- प्रणाली
- सिस्टम
- लक्ष्य
- कार्य
- टीम
- टेक्नोलॉजीज
- टेक्नोलॉजी
- परीक्षण
- परीक्षण
- स्रोत
- हजारों
- भर
- पहर
- आज का दि
- ऊपर का
- प्रशिक्षण
- गाड़ियों
- परिवर्तन
- ट्रांसपेरेंसी
- Uk
- अद्वितीय
- us
- उपयोग
- मूल्य
- सत्यापन
- बनाम
- वीडियो
- देखें
- वास्तविक
- दृष्टि
- वेब
- वेब ब्राउजर
- वेबकैम
- वेबसाइट
- विकिपीडिया
- बिना
- काम
- काम किया
- विश्व