अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ प्लस में कुछ-क्लिक सेगमेंटेशन मास्क लेबलिंग

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

अमेज़न सेजमेकर ग्राउंड ट्रुथ प्लस एक प्रबंधित डेटा लेबलिंग सेवा है जो मशीन लर्निंग (एमएल) अनुप्रयोगों के लिए डेटा को लेबल करना आसान बनाती है। एक सामान्य उपयोग का मामला सिमेंटिक सेगमेंटेशन है, जो एक कंप्यूटर विज़न एमएल तकनीक है जिसमें एक छवि में अलग-अलग पिक्सेल को क्लास लेबल असाइन करना शामिल है। उदाहरण के लिए, चलते हुए वाहन द्वारा कैप्चर किए गए वीडियो फ़्रेम में, क्लास लेबल में वाहन, पैदल यात्री, सड़कें, ट्रैफ़िक सिग्नल, भवन या पृष्ठभूमि शामिल हो सकते हैं। यह छवि में विभिन्न वस्तुओं के स्थानों की उच्च-सटीक समझ प्रदान करता है और अक्सर इसका उपयोग स्वायत्त वाहनों या रोबोटिक्स के लिए धारणा प्रणाली बनाने के लिए किया जाता है। सिमेंटिक सेगमेंटेशन के लिए एक एमएल मॉडल बनाने के लिए, पिक्सेल स्तर पर बड़ी मात्रा में डेटा को लेबल करना सबसे पहले आवश्यक है। यह लेबलिंग प्रक्रिया जटिल है। इसके लिए कुशल लेबलर्स और महत्वपूर्ण समय की आवश्यकता होती है—कुछ छवियों को सटीक रूप से लेबल करने में 2 घंटे या उससे अधिक समय लग सकता है!

2019 में, हमने ग्राउंड ट्रूथ के लिए ऑटो-सेगमेंट नामक एक एमएल-संचालित इंटरैक्टिव लेबलिंग टूल जारी किया जो आपको जल्दी और आसानी से उच्च गुणवत्ता वाले सेगमेंटेशन मास्क बनाने की अनुमति देता है। अधिक जानकारी के लिए देखें ऑटो-सेगमेंटेशन टूल. यह सुविधा आपको किसी वस्तु पर सबसे ऊपर-, बाएँ-, नीचे- और दाएँ-सबसे "चरम बिंदुओं" पर क्लिक करने की अनुमति देकर काम करती है। पृष्ठभूमि में चलने वाला एक ML मॉडल इस उपयोगकर्ता इनपुट को निगलेगा और एक उच्च-गुणवत्ता वाला सेगमेंटेशन मास्क लौटाएगा जो ग्राउंड ट्रूथ लेबलिंग टूल में तुरंत प्रस्तुत होता है। हालाँकि, यह सुविधा आपको केवल चार क्लिक करने की अनुमति देती है। कुछ मामलों में, एमएल-जेनरेट किया गया मास्क अनजाने में किसी छवि के कुछ हिस्सों को याद कर सकता है, जैसे ऑब्जेक्ट सीमा के आसपास जहां किनारे अस्पष्ट हैं या जहां रंग, संतृप्ति, या छाया परिवेश में मिलती है।

सुधारात्मक क्लिकों की एक लचीली संख्या के साथ चरम बिंदु क्लिकिंग

हमने अब सीमा बिंदुओं के अतिरिक्त क्लिक की अनुमति देने के लिए टूल को बढ़ाया है, जो एमएल मॉडल को रीयल-टाइम फीडबैक प्रदान करता है। यह आपको अधिक सटीक विभाजन मास्क बनाने की अनुमति देता है। निम्नलिखित उदाहरण में, छाया के पास कमजोर सीमाओं के कारण प्रारंभिक विभाजन परिणाम सटीक नहीं है। महत्वपूर्ण रूप से, यह उपकरण एक ऐसे मोड में काम करता है जो रीयल-टाइम फ़ीडबैक की अनुमति देता है—इसके लिए आपको सभी बिंदुओं को एक साथ निर्दिष्ट करने की आवश्यकता नहीं होती है। इसके बजाय, आप पहले चार माउस क्लिक कर सकते हैं, जो एमएल मॉडल को सेगमेंटेशन मास्क बनाने के लिए ट्रिगर करेगा। फिर आप इस मास्क का निरीक्षण कर सकते हैं, किसी भी संभावित अशुद्धि का पता लगा सकते हैं, और बाद में मॉडल को सही परिणाम में "नज" करने के लिए अतिरिक्त क्लिक कर सकते हैं।

अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ प्लस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस में कुछ-क्लिक सेगमेंटेशन मास्क लेबलिंग। लंबवत खोज. ऐ.

हमारे पिछले लेबलिंग टूल ने आपको ठीक चार माउस क्लिक (लाल बिंदु) करने की अनुमति दी थी। प्रारंभिक विभाजन परिणाम (छायांकित लाल क्षेत्र) छाया के पास कमजोर सीमाओं (लाल मास्क के नीचे-बाएं) के कारण सटीक नहीं है।

हमारे उन्नत लेबलिंग टूल के साथ, उपयोगकर्ता फिर से पहले चार माउस क्लिक करता है (शीर्ष चित्र में लाल बिंदु)। फिर आपके पास परिणामी विभाजन मुखौटा (शीर्ष आकृति में छायांकित लाल क्षेत्र) का निरीक्षण करने का अवसर है। आप अतिरिक्त माउस क्लिक कर सकते हैं (निचली आकृति में हरे रंग के बिंदु) जिससे मॉडल मास्क को परिष्कृत कर सके (निचली आकृति में छायांकित लाल क्षेत्र)।

उपकरण के मूल संस्करण की तुलना में, उन्नत संस्करण एक बेहतर परिणाम प्रदान करता है जब वस्तुएं विकृत, गैर-उत्तल होती हैं, और आकार और उपस्थिति में भिन्न होती हैं।

हमने सेगमेंटेशन मास्क उत्पन्न करने के लिए पहले बेसलाइन टूल (केवल चार चरम क्लिक के साथ) चलाकर सैंपल डेटा पर इस बेहतर टूल के प्रदर्शन का अनुकरण किया और इसके औसत इंटरसेक्शन ओवर यूनियन (mIoU) का मूल्यांकन किया, जो सेगमेंटेशन मास्क के लिए सटीकता का एक सामान्य उपाय है। फिर हमने सिम्युलेटेड सुधारात्मक क्लिक लागू किए और प्रत्येक सिम्युलेटेड क्लिक के बाद mIoU में सुधार का मूल्यांकन किया। निम्न तालिका इन परिणामों को सारांशित करती है। पहली पंक्ति mIoU दिखाती है, और दूसरी पंक्ति त्रुटि दिखाती है (जो 100% ऋण mIoU द्वारा दी गई है)। केवल पाँच अतिरिक्त माउस क्लिक के साथ, हम इस कार्य के लिए त्रुटि को 9% तक कम कर सकते हैं!

.	.	सुधारात्मक क्लिकों की संख्या	.
.	आधारभूत	1	2	3	4	5
एमआईओयू	72.72	76.56	77.62	78.89	80.57	81.73
त्रुटि	27% तक	23% तक	22% तक	21% तक	19% तक	18% तक

ग्राउंड ट्रूथ और परफॉर्मेंस प्रोफाइलिंग के साथ इंटीग्रेशन

इस मॉडल को ग्राउंड ट्रूथ के साथ एकीकृत करने के लिए, हम एक मानक आर्किटेक्चर पैटर्न का पालन करते हैं जैसा कि निम्नलिखित आरेख में दिखाया गया है। सबसे पहले, हम एमएल मॉडल को डॉकर छवि में बनाते हैं और इसे तैनात करते हैं अमेज़ॅन इलास्टिक कंटेनर रजिस्ट्री (अमेज़ॅन ईसीआर), एक पूरी तरह से प्रबंधित डॉकर कंटेनर रजिस्ट्री जो कंटेनर छवियों को स्टोर करना, साझा करना और तैनात करना आसान बनाती है। का उपयोग सेजमेकर इंट्रेंस टूलकिट डॉकर छवि के निर्माण में हमें मॉडल सर्विंग के लिए आसानी से सर्वोत्तम प्रथाओं का उपयोग करने और कम-विलंबता निष्कर्ष प्राप्त करने की अनुमति मिलती है। हम फिर एक बनाते हैं अमेज़न SageMaker मॉडल को होस्ट करने के लिए रीयल-टाइम एंडपॉइंट। हम एक परिचय देते हैं AWS लाम्बा विभिन्न प्रकार के डेटा परिवर्तन की पेशकश करने के लिए SageMaker समापन बिंदु के सामने एक प्रॉक्सी के रूप में कार्य करें। अंत में, हम प्रयोग करते हैं अमेज़ॅन एपीआई गेटवे हमारे बैकएंड को सुरक्षित प्रमाणीकरण प्रदान करने के लिए, हमारे फ्रंट एंड, ग्राउंड ट्रुथ लेबलिंग एप्लिकेशन के साथ एकीकरण के एक तरीके के रूप में।

आप उद्देश्य-निर्मित ML टूल के लिए अपने स्वयं के उपयोग के मामलों के लिए इस सामान्य पैटर्न का अनुसरण कर सकते हैं और उन्हें कस्टम ग्राउंड ट्रुथ टास्क UI के साथ एकीकृत कर सकते हैं। अधिक जानकारी के लिए, देखें अमेज़न SageMaker ग्राउंड ट्रूथ के साथ एक कस्टम डेटा लेबलिंग वर्कफ़्लो बनाएँ.

इस आर्किटेक्चर का प्रावधान करने और हमारे मॉडल को तैनात करने के बाद AWS क्लाउड डेवलपमेंट किट (एडब्ल्यूएस सीडीके), हमने विभिन्न सैजमेकर उदाहरण प्रकारों के साथ अपने मॉडल की विलंबता विशेषताओं का मूल्यांकन किया। यह करने के लिए बहुत सीधा है क्योंकि हम अपने मॉडल की सेवा के लिए सैजमेकर रीयल-टाइम इंट्रेंस एंडपॉइंट का उपयोग करते हैं। SageMaker रीयल-टाइम इंट्रेंस एंडपॉइंट मूल रूप से एकीकृत करता है अमेज़ॅन क्लाउडवॉच और बिना किसी आवश्यक सेटअप के मेमोरी उपयोग और मॉडल विलंबता जैसे मेट्रिक्स का उत्सर्जन करें (देखें सेजमेकर एंडपॉइंट इनवोकेशन मेट्रिक्स अधिक जानकारी के लिए)।

निम्नलिखित चित्र में, हम SageMaker रीयल-टाइम इंट्रेंस एंडपॉइंट्स द्वारा मूल रूप से उत्सर्जित ModelLatency मीट्रिक दिखाते हैं। हम क्लाउडवॉच में विभिन्न मीट्रिक गणित कार्यों का आसानी से उपयोग कर सकते हैं, जैसे कि p50 या p90 विलंबता, विलंबता प्रतिशतक दिखाने के लिए।

निम्न तालिका तीन उदाहरण प्रकारों के लिए सिमेंटिक विभाजन के लिए हमारे उन्नत चरम क्लिकिंग टूल के लिए इन परिणामों को सारांशित करती है: p2.xlarge, p3.2xlarge, और g4dn.xlarge। हालांकि p3.2xबड़ा उदाहरण सबसे कम विलंबता प्रदान करता है, g4dn.xबड़ा उदाहरण सर्वोत्तम लागत-से-प्रदर्शन अनुपात प्रदान करता है। g4dn.xबड़ा उदाहरण p8xबड़े उदाहरण की तुलना में केवल 35% धीमा (3.2 मिलीसेकंड) है, लेकिन यह p81xबड़े उदाहरण की तुलना में प्रति घंटे के आधार पर 3.2% कम खर्चीला है (देखें अमेज़न SageMaker मूल्य निर्धारण SageMaker उदाहरण प्रकार और मूल्य निर्धारण के बारे में अधिक जानकारी के लिए)।

	सेजमेकर इंस्टेंस टाइप	p90 विलंबता (एमएस)
1	p2.xबड़ा	751
2	p3.2xबड़ा	424
3	g4dn.xबड़ा	459

निष्कर्ष

इस पोस्ट में, हमने सिमेंटिक सेगमेंटेशन एनोटेशन कार्यों के लिए ग्राउंड ट्रूथ ऑटो सेगमेंट फीचर का विस्तार पेश किया। जबकि टूल का मूल संस्करण आपको ठीक चार माउस क्लिक करने की अनुमति देता है, जो एक उच्च-गुणवत्ता वाले सेगमेंटेशन मास्क प्रदान करने के लिए एक मॉडल को ट्रिगर करता है, एक्सटेंशन आपको सुधारात्मक क्लिक करने में सक्षम बनाता है और इस तरह बेहतर भविष्यवाणी करने के लिए एमएल मॉडल को अपडेट और गाइड करता है। हमने एक बुनियादी वास्तुशिल्प पैटर्न भी प्रस्तुत किया है जिसका उपयोग आप ग्राउंड ट्रूथ लेबलिंग यूआई में इंटरैक्टिव टूल को तैनात और एकीकृत करने के लिए कर सकते हैं। अंत में, हमने मॉडल विलंबता को सारांशित किया, और दिखाया कि कैसे SageMaker रीयल-टाइम इंट्रेंस एंडपॉइंट्स का उपयोग मॉडल के प्रदर्शन की निगरानी करना आसान बनाता है।

यह उपकरण कैसे लेबलिंग लागत को कम कर सकता है और सटीकता बढ़ा सकता है, इस बारे में अधिक जानने के लिए देखें अमेज़न सैजमेकर डेटा लेबलिंग आज एक परामर्श शुरू करने के लिए।

लेखक के बारे में

अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ प्लस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस में कुछ-क्लिक सेगमेंटेशन मास्क लेबलिंग। लंबवत खोज. ऐ. जोनाथन बकी Amazon Web Services में एक सॉफ्टवेयर इंजीनियर है जो मशीन लर्निंग और डिस्ट्रीब्यूटेड सिस्टम्स के इंटरसेक्शन पर काम करता है। उनके काम में मशीन लर्निंग मॉडल का उत्पादन करना और ग्राहकों के हाथों में नवीनतम क्षमताओं को रखने के लिए मशीन लर्निंग द्वारा संचालित उपन्यास सॉफ्टवेयर एप्लिकेशन विकसित करना शामिल है।

अमेज़ॅन सेजमेकर ग्राउंड ट्रुथ प्लस प्लेटोब्लॉकचेन डेटा इंटेलिजेंस में कुछ-क्लिक सेगमेंटेशन मास्क लेबलिंग। लंबवत खोज. ऐ. ली एरान ली ह्यूमेन-इन-द-लूप सेवाओं, AWS AI, Amazon में एप्लाइड साइंस मैनेजर है। उनकी शोध रुचियों में 3डी डीप लर्निंग, और विजन और लैंग्वेज रिप्रेजेंटेशन लर्निंग शामिल हैं। पहले वह Alexa AI में वरिष्ठ वैज्ञानिक, स्केल AI में मशीन लर्निंग के प्रमुख और Pony.ai में मुख्य वैज्ञानिक थे। इससे पहले, वह उबर एटीजी में परसेप्शन टीम और उबर में मशीन लर्निंग प्लेटफॉर्म टीम के साथ स्वायत्त ड्राइविंग, मशीन लर्निंग सिस्टम और एआई की रणनीतिक पहल के लिए मशीन लर्निंग पर काम कर रहे थे। उन्होंने बेल लैब्स में अपना करियर शुरू किया और कोलंबिया विश्वविद्यालय में सहायक प्रोफेसर थे। उन्होंने ICML'17 और ICCV'19 में सह-ट्यूटोरियल पढ़ाए, और ऑटोनॉमस ड्राइविंग, 3D विजन और रोबोटिक्स, मशीन लर्निंग सिस्टम और एडवरसेरियल मशीन लर्निंग के लिए मशीन लर्निंग पर NeurIPS, ICML, CVPR, ICCV में कई कार्यशालाओं का सह-आयोजन किया। उन्होंने कॉर्नेल यूनिवर्सिटी से कंप्यूटर साइंस में पीएचडी की है। वह एसीएम फेलो और आईईईई फेलो हैं।

एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
प्लेटोब्लॉकचैन। Web3 मेटावर्स इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
स्रोत: https://aws.amazon.com/blogs/machine-learning/few-click-segmentation-mask-labeling-in-amazon-sagemaker-ground-truth-plus/

समय टिकट: मार्च २०,२०२१

समय टिकट: 2 मई 2022

प्लेटो द्वारा पुनर्प्रकाशित

Amazon SageMaker Studio Lab का उपयोग करके मल्टी-कैमरा ईवेंट का विश्लेषण और कल्पना करें

सर्वर रहित AWS ग्लू इंटरएक्टिव सत्रों का उपयोग करके Amazon SageMaker Studio में बड़े पैमाने पर डेटा तैयार करें

अमेज़ॅन सेजमेकर पर एमएलओपीएस के साथ मजबूत समय श्रृंखला का पूर्वानुमान | अमेज़न वेब सेवाएँ

हमारे बारे में

ऊर्ध्वाधर खोज और ऐ

मंच

जुड़े रहें

लेखा