सिंथेटिक डेटा प्लेटोब्लॉकचेन डेटा इंटेलिजेंस मशीन लर्निंग में वास्तविक प्रदर्शन सुधार की पेशकश कर सकता है। लंबवत खोज. ऐ.

सिंथेटिक डेटा मशीन लर्निंग में वास्तविक प्रदर्शन सुधार की पेशकश कर सकता है

बड़े पैमाने पर वीडियो डेटासेट के साथ एक्शन रिकग्निशन में नाटकीय रूप से सुधार हुआ है। फिर भी, ये डेटासेट क्यूरेशन लागत, गोपनीयता, नैतिकता, पूर्वाग्रह और कॉपीराइट से संबंधित मुद्दों के साथ हैं। इसलिए, एमआईटी वैज्ञानिक सिंथेटिक डेटासेट की ओर रुख कर रहे हैं।

इन्हें एक ऐसे कंप्यूटर द्वारा बनाया जाता है जो दृश्यों, वस्तुओं और मनुष्यों के 3डी मॉडल का उपयोग करके विशिष्ट कार्यों की कई अलग-अलग क्लिप जल्दी से तैयार करता है - वास्तविक डेटा के साथ आने वाले संभावित कॉपीराइट मुद्दों या नैतिक चिंताओं के बिना।

क्या सिंथेटिक डेटा वास्तविक डेटा जितना अच्छा है?

एमआईटी, एमआईटी-आईबीएम वॉटसन एआई लैब और बोस्टन विश्वविद्यालय के वैज्ञानिकों की एक टीम ने इस प्रश्न का उत्तर देने की कोशिश की। उन्होंने 150,000 वीडियो क्लिप का एक सिंथेटिक डेटासेट बनाया जो विभिन्न प्रकार के मानवीय कार्यों का प्रतिनिधित्व करता था और प्रशिक्षित करता था मशीन सीखने इस डेटासेट का उपयोग करने वाले मॉडल। फिर उन्होंने वास्तविक दुनिया से ली गई फिल्मों के छह डेटासेट इन मॉडलों पर प्रदर्शित किए ताकि यह परीक्षण किया जा सके कि वे उन रिकॉर्डिंग में होने वाली गतिविधियों को कितनी अच्छी तरह पकड़ सकते हैं।

वैज्ञानिकों ने पाया कि कृत्रिम रूप से प्रशिक्षित मॉडल उन वीडियो के लिए वास्तविक डेटा पर प्रशिक्षित मॉडल से भी बेहतर प्रदर्शन करते हैं जिनमें कम पृष्ठभूमि वाली वस्तुएं होती हैं।

यह खोज वैज्ञानिकों को वास्तविक कार्यों पर अधिक सटीकता से प्रदर्शन करने में मॉडलों की सहायता के लिए सिंथेटिक डेटासेट का उपयोग करने में सहायता कर सकती है। वास्तविक डेटासेट के उपयोग से जुड़ी कुछ नैतिक, गोपनीयता और कॉपीराइट चिंताओं को कम करने के लिए, यह शोधकर्ताओं को यह निर्धारित करने में भी सहायता कर सकता है कि कौन से मशीन-लर्निंग एप्लिकेशन सिंथेटिक डेटा के साथ प्रशिक्षण के लिए सबसे उपयुक्त हैं।

एमआईटी-आईबीएम वॉटसन एआई लैब के प्रमुख वैज्ञानिक और प्रबंधक रोजेरियो फेरिस ने कहा, “हमारे शोध का अंतिम लक्ष्य वास्तविक डेटा प्रीट्रेनिंग को सिंथेटिक डेटा प्रीट्रेनिंग से बदलना है। सिंथेटिक डेटा में एक क्रिया बनाने में लागत आती है, लेकिन एक बार ऐसा हो जाने पर, आप मुद्रा, प्रकाश व्यवस्था आदि को बदलकर असीमित छवियां या वीडियो उत्पन्न कर सकते हैं। यही सिंथेटिक डेटा की सुंदरता है।

वैज्ञानिकों ने मानव गतिविधियों को कैद करने वाले सिंथेटिक वीडियो क्लिप के तीन सार्वजनिक रूप से उपलब्ध डेटासेट का उपयोग करके एक नया सिंथेटिक एक्शन प्री-ट्रेनिंग एंड ट्रांसफर (SynAPT) संकलित करके शुरुआत की। इसमें लगभग 150 एक्शन श्रेणियां हैं, प्रति श्रेणी 1,000 वीडियो क्लिप हैं।

तीन मशीन लर्निंग मॉडल को डेटासेट के निर्माण के बाद उसका उपयोग करके क्रियाओं को पहचानने के लिए पूर्व-प्रशिक्षित किया गया था। प्रीट्रेनिंग एक मॉडल को दूसरे कार्य को सिखाने से पहले एक कार्य सिखाने की प्रक्रिया है। पूर्व-प्रशिक्षित मॉडल उन मापदंडों का उपयोग कर सकता है जो उसने पहले ही सीखे हैं ताकि उसे नए डेटासेट के साथ एक नया कार्य तेजी से और अधिक कुशलता से सीखने में मदद मिल सके। इसे इस बात पर आधारित किया जाता है कि लोग कैसे सीखते हैं, यानी जब हम कुछ नया जानते हैं तो पिछली जानकारी का पुन: उपयोग करना। पूर्व-प्रशिक्षित मॉडल का परीक्षण वास्तविक वीडियो क्लिप के छह डेटासेट का उपयोग करके किया गया है, प्रत्येक कार्यों के वर्गों को कैप्चर कर रहा है जो प्रशिक्षण डेटा से भिन्न थे।

वैज्ञानिकों के लिए यह देखना आश्चर्यजनक था कि सभी तीन सिंथेटिक मॉडल ने छह डेटासेट में से चार पर वास्तविक वीडियो क्लिप के साथ प्रशिक्षित मॉडल से बेहतर प्रदर्शन किया। उनकी सटीकता उन डेटासेट के लिए उच्चतम थी जिनमें "कम दृश्य-वस्तु पूर्वाग्रह" वाले वीडियो क्लिप शामिल थे। इसका मतलब है कि मॉडल दृश्य में पृष्ठभूमि या अन्य वस्तुओं को देखकर कार्रवाई को नहीं पहचान सकता है - उसे कार्रवाई पर ही ध्यान केंद्रित करना होगा।

फेरिस ने कहा, "कम दृश्य-वस्तु पूर्वाग्रह वाले वीडियो में, क्रियाओं की अस्थायी गतिशीलता वस्तुओं या पृष्ठभूमि की उपस्थिति से अधिक महत्वपूर्ण है, और यह सिंथेटिक डेटा के साथ अच्छी तरह से कैप्चर किया गया प्रतीत होता है।"

“उच्च दृश्य-वस्तु पूर्वाग्रह एक बाधा के रूप में कार्य कर सकता है। मॉडल क्रिया के बजाय किसी वस्तु को देखकर किसी क्रिया को गलत वर्गीकृत कर सकता है। यह मॉडल को भ्रमित कर सकता है।”

एमआईटी-आईबीएम वॉटसन एआई लैब के शोध स्टाफ सदस्य, सह-लेखक रामेश्वर पांडा ने कहा, "इन परिणामों के आधार पर, शोधकर्ता भविष्य के काम में अधिक एक्शन क्लास और अतिरिक्त सिंथेटिक वीडियो प्लेटफ़ॉर्म शामिल करना चाहते हैं, अंततः उन मॉडलों की एक सूची तैयार करना चाहते हैं जिन्हें सिंथेटिक डेटा का उपयोग करके पूर्व-प्रशिक्षित किया गया है।"

"हम ऐसे मॉडल बनाना चाहते हैं जिनका प्रदर्शन साहित्य में मौजूदा मॉडलों की तुलना में बहुत समान या उससे भी बेहतर हो, लेकिन उन किसी भी पूर्वाग्रह या सुरक्षा चिंताओं से बंधे बिना।"

सह-लेखक और CSAIL पोस्टडॉक सूयॉन्ग जिन ने कहा, "वे अपने काम को अनुसंधान के साथ जोड़ना चाहते हैं जो अधिक सटीक और यथार्थवादी सिंथेटिक वीडियो उत्पन्न करना चाहता है, जो मॉडल के प्रदर्शन को बढ़ावा दे सकता है।"

“हम गोपनीयता के मुद्दों या प्रासंगिक या सामाजिक पूर्वाग्रह को रोकने के लिए सिंथेटिक डेटासेट का उपयोग करते हैं, लेकिन मॉडल क्या सीखता है? क्या यह कुछ ऐसा सीखता है जो निष्पक्ष हो?”

सह-लेखक समर्थ मिश्रा, बोस्टन विश्वविद्यालय (बीयू) में स्नातक छात्र हैं। कहा“अच्छी तरह से एनोटेटेड सिंथेटिक डेटा प्राप्त करने की कम लागत होने के बावजूद, वर्तमान में, हमारे पास वास्तविक वीडियो के साथ सबसे बड़े एनोटेटेड डेटासेट को टक्कर देने के पैमाने वाला डेटासेट नहीं है। वास्तविक वीडियो के साथ विभिन्न लागतों और चिंताओं पर चर्चा करके और सिंथेटिक डेटा की प्रभावकारिता दिखाकर, हम इस दिशा में प्रयासों को प्रेरित करने की उम्मीद करते हैं।

जर्नल संदर्भ:

  1. यो-व्हाट किम एट अल। सिंथेटिक डेटा पर आधारित वीडियो प्रस्तुतिकरण कितने हस्तांतरणीय हैं? काग़ज़

समय टिकट:

से अधिक टेक एक्सप्लोरर