आवास का मूल्य निर्धारित करना मशीन लर्निंग (एमएल) का उपयोग करने का एक उत्कृष्ट उदाहरण है। हैरिसन और रुबिनफेल्ड (1978) ने एक महत्वपूर्ण प्रभाव डाला, जिन्होंने एक अभूतपूर्व पेपर और डेटासेट प्रकाशित किया जिसे अनौपचारिक रूप से बोस्टन हाउसिंग डेटासेट के रूप में जाना जाने लगा। इस मौलिक कार्य ने वायु गुणवत्ता सहित कई आयामों के आधार पर आवास की कीमतों का अनुमान लगाने की एक विधि प्रस्तावित की, जो उनके शोध का मुख्य फोकस था। लगभग 50 साल बाद, व्यावसायिक निर्णय लेने में डेटा और एमएल का उपयोग करने में रुचि रखने वाले छात्रों और पेशेवरों के लिए आवास की कीमतों का अनुमान एक महत्वपूर्ण शिक्षण उपकरण बन गया है।
इस पोस्ट में, हम विशेष रूप से दृश्य प्रश्न उत्तर (वीक्यूए) के कार्य के लिए डिज़ाइन किए गए ओपन-सोर्स मॉडल के उपयोग पर चर्चा करते हैं। वीक्यूए के साथ, आप प्राकृतिक भाषा का उपयोग करके किसी फोटो के बारे में प्रश्न पूछ सकते हैं और अपने प्रश्न का उत्तर प्राप्त कर सकते हैं - वह भी सरल भाषा में। इस पोस्ट में हमारा लक्ष्य प्रेरित करना और प्रदर्शित करना है कि इस तकनीक का उपयोग करके क्या संभव है। हम इस क्षमता का उपयोग करने का प्रस्ताव करते हैं अमेज़न SageMaker एमएल उपयोग के मामले में प्रतिगमन मॉडल सटीकता में सुधार करने के लिए और स्वतंत्र रूप से, दृश्य छवियों की स्वचालित टैगिंग के लिए सेवाओं का मंच।
हम एक संगत प्रदान करते हैं यूट्यूब वीडियो यह दर्शाता है कि यहां क्या चर्चा की गई है। सबसे प्रमुख बिंदु को उजागर करने के लिए वीडियो प्लेबैक बीच में ही शुरू हो जाएगा। हमारा सुझाव है कि आप इस अवधारणा को सुदृढ़ करने और इसकी बेहतर समझ हासिल करने के लिए इस वीडियो को पढ़ें।
फाउंडेशन मॉडल
यह समाधान हगिंग फेस मॉडल रिपॉजिटरी में प्रकाशित फाउंडेशन मॉडल के उपयोग पर केंद्रित है। यहां, हम इस शब्द का उपयोग करते हैं फाउंडेशन मॉडल एक कृत्रिम बुद्धिमत्ता (एआई) क्षमता का वर्णन करने के लिए जिसे डेटा के एक बड़े और विविध निकाय पर पूर्व-प्रशिक्षित किया गया है। फाउंडेशन मॉडल कभी-कभी शून्य से किसी मॉडल को प्रशिक्षित करने के बोझ के बिना उपयोग के लिए तैयार हो सकते हैं। कुछ फाउंडेशन मॉडल को ठीक किया जा सकता है, जिसका अर्थ है कि उन्हें अतिरिक्त पैटर्न सिखाना जो आपके व्यवसाय के लिए प्रासंगिक हैं लेकिन मूल, सामान्यीकृत प्रकाशित मॉडल से गायब हैं। कभी-कभी सही प्रतिक्रिया देने के लिए फाइन-ट्यूनिंग की आवश्यकता होती है जो आपके उपयोग के मामले या ज्ञान के निकाय के लिए अद्वितीय होती है।
में गले लगना रिपॉजिटरी में चुनने के लिए कई VQA मॉडल हैं। हमने इस लेखन के समय सबसे अधिक डाउनलोड वाले मॉडल का चयन किया। हालाँकि यह पोस्ट एक ओपन-सोर्स मॉडल रिपॉजिटरी से एक मॉडल का उपयोग करने की क्षमता प्रदर्शित करता है, वही अवधारणा उस मॉडल पर लागू होगी जिसे आपने शून्य से प्रशिक्षित किया है या किसी अन्य विश्वसनीय प्रदाता से उपयोग किया है।
क्लासिक उपयोग के मामले में एक आधुनिक दृष्टिकोण
घर की कीमत का अनुमान परंपरागत रूप से सारणीबद्ध डेटा के माध्यम से लगाया जाता है जहां कीमत की जानकारी देने के लिए संपत्ति की विशेषताओं का उपयोग किया जाता है। यद्यपि विचार करने के लिए सैकड़ों विशेषताएं हो सकती हैं, कुछ मूलभूत उदाहरण तैयार स्थान में घर का आकार, शयनकक्षों और स्नानघरों की संख्या और निवास का स्थान हैं।
मशीन लर्निंग सारणीबद्ध डेटा से परे विविध इनपुट स्रोतों को शामिल करने में सक्षम है, जैसे ऑडियो, स्थिर चित्र, मोशन वीडियो और प्राकृतिक भाषा। एआई में, शब्द बहुविध विभिन्न प्रकार के मीडिया प्रकारों, जैसे छवियाँ और सारणीबद्ध डेटा, के उपयोग को संदर्भित करता है। इस पोस्ट में, हम दिखाते हैं कि आज की आधुनिक दुनिया द्वारा उत्पादित प्रचुर मात्रा में डिजिटल निकास में बंद छिपे हुए मूल्य को खोजने और मुक्त करने के लिए मल्टीमॉडल डेटा का उपयोग कैसे करें।
इस विचार को ध्यान में रखते हुए, हम संपत्ति की छवियों से छिपी हुई विशेषताओं को निकालने के लिए फाउंडेशन मॉडल के उपयोग का प्रदर्शन करते हैं। छवियों में पाई गई अंतर्दृष्टि का उपयोग करके, जो पहले सारणीबद्ध डेटा में उपलब्ध नहीं थी, हम मॉडल की सटीकता में सुधार कर सकते हैं। इस पोस्ट में चर्चा की गई दोनों छवियां और सारणीबद्ध डेटा मूल रूप से उपलब्ध कराए गए और प्रकाशित किए गए थे GitHub अहमद और मुस्तफ़ा द्वारा (2016)।
एक तस्वीर एक हजार शब्दों के बराबर होती है
अब जब हम वीक्यूए की क्षमताओं को समझ गए हैं, तो आइए रसोई की निम्नलिखित दो छवियों पर विचार करें। आप इन छवियों से घर के मूल्य का आकलन कैसे करेंगे? आप स्वयं से कौन से प्रश्न पूछेंगे? हर तस्वीर आपके मन में दर्जनों सवाल पैदा कर सकती है। उनमें से कुछ प्रश्नों से सार्थक उत्तर मिल सकते हैं जो गृह मूल्यांकन प्रक्रिया में सुधार करेंगे।
तस्वीरें अनस्प्लैश पर फ्रांसेस्का टोसोलिनी (बाएं) और साइडकिक्स मीडिया (दाएं) को श्रेय देती हैं
निम्नलिखित तालिका उनके संबंधित उत्तरों के साथ प्रश्न दिखाकर वीक्यूए इंटरैक्शन के वास्तविक उदाहरण प्रदान करती है। उत्तर श्रेणीबद्ध, सतत मूल्य या द्विआधारी प्रतिक्रियाओं के रूप में आ सकते हैं।
उदाहरण प्रश्न | फाउंडेशन मॉडल से उदाहरण उत्तर |
काउंटरटॉप्स किससे बने होते हैं? | ग्रेनाइट, टाइल, संगमरमर, लैमिनेट, आदि। |
क्या यह महँगी रसोई है? | हाँ नही |
कितने अलग-अलग सिंक हैं? | 0, 1, 2 |
संदर्भ वास्तुकला
इस पोस्ट में, हम उपयोग करते हैं अमेज़न SageMaker डेटा रैंगलर डेटासेट में हजारों फ़ोटो के लिए दृश्य प्रश्नों का एक समान सेट पूछना। सेजमेकर डेटा रैंगलर को डेटा तैयारी और फीचर इंजीनियरिंग की प्रक्रिया को सरल बनाने के उद्देश्य से बनाया गया है। 300 से अधिक अंतर्निहित परिवर्तन प्रदान करके, सेजमेकर डेटा रैंगलर एमएल के लिए सारणीबद्ध और छवि डेटा तैयार करने में लगने वाले समय को हफ्तों से मिनटों तक कम करने में मदद करता है। यहां, सेजमेकर डेटा रैंगलर मॉडल प्रशिक्षण के लिए फाउंडेशन मॉडल से फोटो-जनित सुविधाओं के साथ मूल सारणीबद्ध सेट से डेटा सुविधाओं को जोड़ता है।
इसके बाद, हम इसके उपयोग से एक प्रतिगमन मॉडल बनाते हैं अमेज़ॅन सेजमेकर कैनवास. सेजमेकर कैनवस बिना कोई कोड लिखे एक मॉडल बना सकता है, और 2-15 मिनट में प्रारंभिक परिणाम दे सकता है। निम्नलिखित अनुभाग में, हम इस समाधान मार्गदर्शन को संभव बनाने के लिए उपयोग की जाने वाली एक संदर्भ वास्तुकला प्रदान करते हैं।
हगिंग फेस और अन्य प्रदाताओं के कई लोकप्रिय मॉडल एक-क्लिक पर तैनात किए जा सकते हैं अमेज़न SageMaker जम्पस्टार्ट. इन रिपॉजिटरी में सैकड़ों-हजारों मॉडल उपलब्ध हैं। इस पोस्ट के लिए, हम एक ऐसा मॉडल चुनते हैं जो सेजमेकर जम्पस्टार्ट में उपलब्ध नहीं है, जिसके लिए ग्राहक परिनियोजन की आवश्यकता होती है। जैसा कि निम्नलिखित चित्र में दिखाया गया है, हम एक का उपयोग करके अनुमान लगाने के लिए एक हगिंग फेस मॉडल तैनात करते हैं अमेज़ॅन सैजमेकर स्टूडियो स्मरण पुस्तक। नोटबुक का उपयोग वास्तविक समय अनुमान के लिए एक समापन बिंदु तैनात करने के लिए किया जाता है। नोटबुक उन परिसंपत्तियों का उपयोग करता है जिनमें हगिंग फेस बाइनरी मॉडल, एक कंटेनर छवि के लिए एक संकेतक और एक उद्देश्य-निर्मित inference.py स्क्रिप्ट शामिल है जो मॉडल के अपेक्षित इनपुट और आउटपुट से मेल खाती है। जैसे ही आप इसे पढ़ेंगे, उपलब्ध VQA मॉडलों का मिश्रण बदल सकता है। महत्वपूर्ण बात यह है कि जब आप इसे पढ़ें तो उपलब्ध वीक्यूए मॉडल की समीक्षा करें और अपने द्वारा चुने गए मॉडल को तैनात करने के लिए तैयार रहें, जिसका अपना एपीआई अनुरोध और प्रतिक्रिया अनुबंध होगा।
सेजमेकर एंडपॉइंट द्वारा वीक्यूए मॉडल परोसे जाने के बाद, हम पाइपलाइन को व्यवस्थित करने के लिए सेजमेकर डेटा रैंगलर का उपयोग करते हैं जो अंततः डिजिटल छवियों से निकाले गए सारणीबद्ध डेटा और सुविधाओं को जोड़ती है और मॉडल प्रशिक्षण के लिए डेटा को दोबारा आकार देती है। अगला आंकड़ा एक दृश्य प्रस्तुत करता है कि पूर्ण पैमाने पर डेटा परिवर्तन कार्य कैसे चलाया जाता है।
निम्नलिखित चित्र में, हम डेटा तैयारी कार्यों को व्यवस्थित करने के लिए सेजमेकर डेटा रैंगलर और मॉडल प्रशिक्षण के लिए सेजमेकर कैनवास का उपयोग करते हैं। सबसे पहले, सेजमेकर डेटा रैंगलर का उपयोग करता है अमेज़न स्थान सेवा कच्चे डेटा में उपलब्ध ज़िप कोड को अक्षांश और देशांतर सुविधाओं में परिवर्तित करना। दूसरा, सेजमेकर डेटा रैंगलर वास्तविक समय के अनुमान के लिए सेजमेकर द्वारा होस्ट किए गए एंडपॉइंट पर हजारों तस्वीरें भेजने में समन्वय करने में सक्षम है, जो प्रति दृश्य प्रश्नों का एक समान सेट पूछता है। इसके परिणामस्वरूप सुविधाओं की एक समृद्ध श्रृंखला तैयार होती है जो रसोई, बाथरूम, घर के बाहरी हिस्से और अन्य चीज़ों में देखी गई विशेषताओं का वर्णन करती है। सेजमेकर डेटा रैंगलर द्वारा डेटा तैयार किए जाने के बाद, एक प्रशिक्षण डेटा सेट उपलब्ध है अमेज़न सरल भंडारण सेवा (अमेज़ॅन एस3)। इनपुट के रूप में S3 डेटा का उपयोग करते हुए, सेजमेकर कैनवस किसी भी कोड को लिखे बिना, कम से कम 2-15 मिनट में एक मॉडल को प्रशिक्षित करने में सक्षम है।
सेजमेकर डेटा रैंगलर का उपयोग करके डेटा परिवर्तन
निम्नलिखित स्क्रीनशॉट सेजमेकर डेटा रैंगलर वर्कफ़्लो दिखाता है। वर्कफ़्लो अमेज़ॅन S3 में संग्रहीत घरों की हजारों तस्वीरों के साथ शुरू होता है। इसके बाद, एक दृश्य डिटेक्टर दृश्य निर्धारित करता है, जैसे कि रसोई या बाथरूम। अंत में, छवियों से प्रश्नों का एक दृश्य-विशिष्ट सेट पूछा जाता है, जिसके परिणामस्वरूप प्रशिक्षण के लिए एक समृद्ध, सारणीबद्ध डेटासेट उपलब्ध होता है।
निम्नलिखित सेजमेकर डेटा रैंगलर कस्टम ट्रांसफ़ॉर्मेशन कोड का एक उदाहरण है जिसका उपयोग फाउंडेशन मॉडल के साथ इंटरैक्ट करने और रसोई के चित्रों के बारे में जानकारी प्राप्त करने के लिए किया जाता है। पिछले स्क्रीनशॉट में, यदि आप किचन फीचर नोड चुनते हैं, तो निम्नलिखित कोड दिखाई देगा:
सुरक्षा विचार के रूप में, आपको सबसे पहले अपने सेजमेकर रीयल-टाइम एंडपॉइंट को कॉल करने के लिए सेजमेकर डेटा रैंगलर को सक्षम करना होगा AWS पहचान और अभिगम प्रबंधन (मैं हूँ)। इसी प्रकार, सेजमेकर डेटा रैंगलर के माध्यम से आपके द्वारा उपयोग किए जाने वाले किसी भी AWS संसाधनों को समान अनुमति अनुमतियों की आवश्यकता होगी।
सेजमेकर डेटा रैंगलर से पहले और बाद की डेटा संरचनाएँ
इस अनुभाग में, हम मूल सारणीबद्ध डेटा की संरचना और संवर्धित डेटा पर चर्चा करते हैं। उन्नत डेटा में इस उदाहरण के उपयोग के मामले से संबंधित नई डेटा सुविधाएँ शामिल हैं। अपने आवेदन में, अपने वर्गीकरण या प्रतिगमन कार्य में सहायता के लिए अपनी छवियों में उपलब्ध प्रश्नों के विविध सेट की कल्पना करने के लिए समय निकालें। विचार यह है कि जितना संभव हो उतने प्रश्नों की कल्पना करें और फिर यह सुनिश्चित करने के लिए उनका परीक्षण करें कि वे मूल्य-वर्द्धन प्रदान करते हैं।
मूल सारणीबद्ध डेटा की संरचना
जैसा कि स्रोत में वर्णित है गीथहब रेपो, नमूना डेटासेट में प्रति संपत्ति चार छवियों सहित 535 सारणीबद्ध रिकॉर्ड शामिल हैं। निम्न तालिका मूल सारणीबद्ध डेटा की संरचना को दर्शाती है।
Feature | टिप्पणी |
बेडरूम की संख्या | . |
बाथरूम की संख्या | . |
क्षेत्रफल (वर्ग फुट) | . |
ज़िप कोड | . |
मूल्य | यह पूर्वानुमानित किया जाने वाला लक्ष्य चर है। |
उन्नत डेटा की संरचना
निम्न तालिका उन्नत डेटा संरचना को दर्शाती है, जिसमें छवियों से प्राप्त कई नई सुविधाएँ शामिल हैं।
Feature | टिप्पणी |
बेडरूम की संख्या | . |
बाथरूम की संख्या | . |
क्षेत्रफल (वर्ग फुट) | . |
अक्षांश | अमेज़ॅन लोकेशन सर्विस में मूल ज़िप कोड पास करके गणना की गई। यह ज़िप के लिए केन्द्रक मान है। |
देशान्तर | अमेज़ॅन लोकेशन सर्विस में मूल ज़िप कोड पास करके गणना की गई। यह ज़िप के लिए केन्द्रक मान है। |
क्या शयनकक्ष में गुंबददार छत है? | 0 = नहीं; 1 = हाँ |
क्या बाथरूम महंगा है? | 0 = नहीं; 1 = हाँ |
क्या रसोई महंगी है? | 0 = नहीं; 1 = हाँ |
मूल्य | यह पूर्वानुमानित किया जाने वाला लक्ष्य चर है। |
सेजमेकर कैनवस के साथ मॉडल प्रशिक्षण
सेजमेकर डेटा रैंगलर प्रोसेसिंग जॉब पूरी तरह से तैयार करता है और संपूर्ण सारणीबद्ध प्रशिक्षण डेटासेट को अमेज़ॅन एस3 में उपलब्ध कराता है। इसके बाद, सेजमेकर कैनवस एमएल जीवनचक्र के मॉडल निर्माण चरण को संबोधित करता है। कैनवास S3 प्रशिक्षण सेट को खोलकर शुरू होता है। किसी मॉडल को समझने में सक्षम होना अक्सर ग्राहक की एक प्रमुख आवश्यकता होती है। कोड लिखे बिना, और कुछ ही क्लिक के भीतर, सेजमेकर कैनवस मॉडल प्रदर्शन पर समृद्ध, दृश्य प्रतिक्रिया प्रदान करता है। जैसा कि निम्नलिखित अनुभाग में स्क्रीनशॉट में देखा गया है, सेजमेकर कैनवस दिखाता है कि एकल विशेषताएं मॉडल को कैसे सूचित करती हैं।
मॉडल को मूल सारणीबद्ध डेटा और रियल-एस्टेट छवियों से प्राप्त सुविधाओं के साथ प्रशिक्षित किया गया
हम निम्नलिखित स्क्रीनशॉट से देख सकते हैं कि संपत्ति की छवियों से विकसित सुविधाएँ महत्वपूर्ण थीं। इन परिणामों के आधार पर, फोटो से "क्या यह रसोई महंगी है" प्रश्न मूल सारणीबद्ध सेट में "बेडरूम की संख्या" से अधिक महत्वपूर्ण था, जिसमें क्रमशः 7.08 और 5.498 के फीचर महत्व मान थे।
निम्नलिखित स्क्रीनशॉट मॉडल के बारे में महत्वपूर्ण जानकारी प्रदान करता है। सबसे पहले, अवशिष्ट ग्राफ बैंगनी छायांकित क्षेत्र के आसपास सेट क्लस्टरिंग में अधिकांश बिंदुओं को दिखाता है। यहां, इस चित्रण के लिए सेजमेकर कैनवस के बाहर दो आउटलेर्स को मैन्युअल रूप से एनोटेट किया गया था। ये आउटलेयर वास्तविक घरेलू मूल्य और अनुमानित मूल्य के बीच महत्वपूर्ण अंतर दर्शाते हैं। इसके अतिरिक्त, आर2 मान, जिसकी संभावित सीमा 0-100% है, 76% पर दिखाया गया है। यह इंगित करता है कि मॉडल अपूर्ण है और इसमें घरेलू मूल्यों का पूरी तरह से अनुमान लगाने के लिए सभी विविधताओं को ध्यान में रखने के लिए पर्याप्त सूचना बिंदु नहीं हैं।
हम अधिक व्यापक मॉडल बनाने के लिए अतिरिक्त सिग्नल खोजने और प्रस्तावित करने के लिए आउटलेर्स का उपयोग कर सकते हैं। उदाहरण के लिए, इन बाहरी संपत्तियों में एक स्विमिंग पूल शामिल हो सकता है या भूमि के बड़े भूखंड पर स्थित हो सकता है। डेटासेट में ये सुविधाएँ शामिल नहीं थीं; हालाँकि, आप इस डेटा का पता लगाने और अतिरिक्त सुविधा के रूप में शामिल "स्विमिंग पूल" के साथ एक नए मॉडल को प्रशिक्षित करने में सक्षम हो सकते हैं। आदर्श रूप से, आपके अगले प्रयास में, आर2 मूल्य में वृद्धि होगी और एमएई और आरएमएसई मूल्यों में कमी आएगी।
रियल-एस्टेट छवियों से प्राप्त सुविधाओं के बिना प्रशिक्षित मॉडल
अंत में, अगले भाग पर जाने से पहले, आइए जानें कि क्या छवियों की विशेषताएं सहायक थीं। निम्नलिखित स्क्रीनशॉट वीक्यूए मॉडल की सुविधाओं के बिना एक और सेजमेकर कैनवास प्रशिक्षित मॉडल प्रदान करता है। हम देखते हैं कि मॉडल त्रुटि दर 282K के RMSE से 352K के RMSE तक बढ़ गई है। इससे, हम यह निष्कर्ष निकाल सकते हैं कि छवियों से तीन सरल प्रश्नों ने मॉडल सटीकता में लगभग 20% सुधार किया। दिखाया नहीं गया है, लेकिन पूरा होने के लिए, आर2 निम्नलिखित मॉडल के मूल्य में भी गिरावट आई, जो वीक्यूए सुविधाओं के साथ 62% के मूल्य से गिरकर 76% के मूल्य पर आ गया। यह इस बात का उदाहरण है कि कैसे सेजमेकर कैनवस तेजी से प्रयोग करना और डेटा-संचालित दृष्टिकोण का उपयोग करना आसान बनाता है जो आपकी व्यावसायिक आवश्यकता को पूरा करने के लिए एक मॉडल तैयार करता है।
आगे देख रहा
कई संगठन फाउंडेशन मॉडल में दिलचस्पी ले रहे हैं, खासकर जब से सामान्य पूर्व-प्रशिक्षित ट्रांसफार्मर (जीपीटी) आधिकारिक तौर पर दिसंबर 2022 में रुचि का मुख्यधारा का विषय बन गया है। फाउंडेशन मॉडल में रुचि का एक बड़ा हिस्सा बड़े भाषा मॉडल (एलएलएम) कार्यों पर केंद्रित है ; हालाँकि, अन्य विविध उपयोग के मामले उपलब्ध हैं, जैसे कि कंप्यूटर विज़न और, अधिक संकीर्ण रूप से, यहाँ वर्णित विशेष VQA कार्य।
यह पोस्ट उद्योग उपयोग के मामलों को हल करने के लिए मल्टीमॉडल डेटा के उपयोग को प्रेरित करने के लिए एक उदाहरण है। यद्यपि हमने प्रतिगमन मॉडल में वीक्यूए के उपयोग और लाभ का प्रदर्शन किया है, इसका उपयोग बाद की खोज या व्यावसायिक वर्कफ़्लो रूटिंग के लिए छवियों को लेबल और टैग करने के लिए भी किया जा सकता है। कल्पना करें कि आप बिक्री या किराए के लिए सूचीबद्ध संपत्तियों की खोज करने में सक्षम हैं। मान लीजिए आप टाइल फर्श या संगमरमर के काउंटरटॉप्स वाली एक संपत्ति ढूंढना चाहते हैं। आज, आपको उम्मीदवारों की संपत्तियों की एक लंबी सूची प्राप्त करनी पड़ सकती है और प्रत्येक उम्मीदवार को ब्राउज़ करते समय खुद को दृष्टि से फ़िल्टर करना पड़ सकता है। इसके बजाय, उन सूचियों को फ़िल्टर करने में सक्षम होने की कल्पना करें जिनमें ये सुविधाएँ शामिल हैं - भले ही किसी व्यक्ति ने उन्हें स्पष्ट रूप से टैग न किया हो। बीमा उद्योग में, दावा क्षति का अनुमान लगाने, या छवियों से व्यावसायिक वर्कफ़्लो में अगली कार्रवाई को रूट करने की क्षमता की कल्पना करें। सोशल मीडिया प्लेटफ़ॉर्म में, फ़ोटो को बाद में उपयोग के लिए ऑटो-टैग किया जा सकता है।
सारांश
इस पोस्ट में दिखाया गया है कि सेजमेकर प्लेटफ़ॉर्म का उपयोग करके क्लासिक एमएल उपयोग के मामले को बेहतर बनाने के लिए फाउंडेशन मॉडल द्वारा सक्षम कंप्यूटर विज़न का उपयोग कैसे किया जाए। प्रस्तावित समाधान के हिस्से के रूप में, हमने सार्वजनिक मॉडल रजिस्ट्री पर उपलब्ध एक लोकप्रिय वीक्यूए मॉडल का पता लगाया और वास्तविक समय के अनुमान के लिए सेजमेकर एंडपॉइंट का उपयोग करके इसे तैनात किया।
इसके बाद, हमने वर्कफ़्लो को व्यवस्थित करने के लिए सेजमेकर डेटा रैंगलर का उपयोग किया जिसमें सारणीबद्ध डेटा का एक समृद्ध सेट उत्पन्न करने के लिए छवियों से समान प्रश्न पूछे गए थे। अंत में, हमने एक प्रतिगमन मॉडल को प्रशिक्षित करने के लिए सेजमेकर कैनवास का उपयोग किया। यह ध्यान रखना महत्वपूर्ण है कि नमूना डेटासेट बहुत सरल था और इसलिए डिज़ाइन के अनुसार अपूर्ण था। फिर भी, सेजमेकर कैनवस मॉडल सटीकता को समझना और बेसलाइन मॉडल की सटीकता में सुधार के लिए अतिरिक्त संकेतों की तलाश करना आसान बनाता है।
हमें उम्मीद है कि इस पोस्ट ने आपको अपने संगठन के पास मौजूद मल्टीमॉडल डेटा का उपयोग करने के लिए प्रोत्साहित किया है। इसके अतिरिक्त, हमें उम्मीद है कि पोस्ट ने आपको मॉडल प्रशिक्षण को एक पुनरावृत्तीय प्रक्रिया के रूप में मानने के लिए प्रेरित किया है। थोड़े से धैर्य के साथ एक महान मॉडल हासिल किया जा सकता है। जो मॉडल लगभग पूर्ण होते हैं वे सच होने के लिए बहुत अच्छे हो सकते हैं, शायद लक्ष्य रिसाव या ओवरफिटिंग का परिणाम। एक आदर्श परिदृश्य ऐसे मॉडल से शुरू होगा जो अच्छा है, लेकिन सही नहीं है। त्रुटियों, हानियों और अवशिष्ट प्लॉटों का उपयोग करके, आप अपने प्रारंभिक आधारभूत अनुमान से सटीकता बढ़ाने के लिए अतिरिक्त डेटा सिग्नल प्राप्त कर सकते हैं।
AWS एमएल सेवाओं का सबसे व्यापक और गहरा सेट प्रदान करता है और क्लाउड इंफ्रास्ट्रक्चर का समर्थन करता है, जिससे एमएल हर डेवलपर, डेटा वैज्ञानिक और विशेषज्ञ व्यवसायी के हाथों में आ जाता है। यदि आप सेजमेकर डेटा रैंगलर और सेजमेकर कैनवस सहित सेजमेकर प्लेटफॉर्म के बारे में अधिक जानने के लिए उत्सुक हैं, तो कृपया अपनी एडब्ल्यूएस खाता टीम तक पहुंचें और बातचीत शुरू करें। इसके अलावा, सेजमेकर डेटा रैंगलर के बारे में और अधिक पढ़ने पर विचार करें कस्टम परिवर्तन.
संदर्भ
अहमद, ईएच, और मुस्तफ़ा, एम. (2016)। दृश्य और पाठ्य सुविधाओं से घर की कीमत का अनुमान। IJCCI 2016-कम्प्यूटेशनल इंटेलिजेंस पर 8वें अंतर्राष्ट्रीय संयुक्त सम्मेलन की कार्यवाही, 3, 62-68।
हैरिसन जूनियर, डी., और रुबिनफेल्ड, डीएल (1978)। हेडोनिक आवास की कीमतें और स्वच्छ हवा की मांग। पर्यावरण अर्थशास्त्र और प्रबंधन जर्नल, 5(1), 81-102.
किम, डब्ल्यू., सन, बी. और किम, आई.. (2021)। ViLT: कनवल्शन या क्षेत्र पर्यवेक्षण के बिना विज़न-एंड-लैंग्वेज ट्रांसफार्मर। मशीन लर्निंग अनुसंधान की कार्यवाही में मशीन लर्निंग पर 38वें अंतर्राष्ट्रीय सम्मेलन की कार्यवाही। 139:5583-5594.
के बारे में लेखक
चार्ल्स लाफलिन एक प्रिंसिपल एआई/एमएल स्पेशलिस्ट सॉल्यूशन आर्किटेक्ट हैं और एडब्ल्यूएस में अमेज़ॅन सेजमेकर सर्विस टीम में काम करते हैं। वह सेवा रोडमैप को आकार देने में मदद करता है और अत्याधुनिक एडब्ल्यूएस प्रौद्योगिकियों और विचार नेतृत्व का उपयोग करके अपने व्यवसायों को बदलने में मदद करने के लिए विभिन्न एडब्ल्यूएस ग्राहकों के साथ दैनिक सहयोग करता है। चार्ल्स के पास आपूर्ति श्रृंखला प्रबंधन में एमएस और पीएच.डी. है। डेटा साइंस में.
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/use-foundation-models-to-improve-model-accuracy-with-amazon-sagemaker/
- :हैस
- :है
- :नहीं
- :कहाँ
- $यूपी
- 08
- 1
- 100
- 2016
- 2021
- 2022
- 32
- 49
- 50
- 50 वर्षों
- 7
- 8
- 8th
- a
- क्षमता
- योग्य
- About
- प्रचुर
- पहुँच
- लेखा
- शुद्धता
- हासिल
- कार्रवाई
- अतिरिक्त
- इसके अतिरिक्त
- पतों
- बाद
- अहमद
- AI
- ऐ / एमएल
- आकाशवाणी
- सब
- अनुमति देना
- लगभग
- साथ - साथ
- भी
- हालांकि
- वीरांगना
- अमेज़न SageMaker
- अमेज़ॅन वेब सेवा
- amp
- an
- और
- अन्य
- जवाब
- जवाब
- कोई
- एपीआई
- दिखाई देते हैं
- आवेदन
- लागू करें
- दृष्टिकोण
- स्थापत्य
- हैं
- चारों ओर
- ऐरे
- कृत्रिम
- कृत्रिम बुद्धिमत्ता
- कृत्रिम बुद्धिमत्ता (AI)
- AS
- पूछना
- पूछ
- आकलन
- संपत्ति
- At
- करने का प्रयास
- ऑडियो
- स्वचालित
- उपलब्ध
- एडब्ल्यूएस
- आधारित
- आधारभूत
- BE
- बन गया
- बन
- बनने
- किया गया
- से पहले
- शुरू करना
- जा रहा है
- लाभ
- के बीच
- परे
- परिवर्तन
- बोस्टन
- के छात्रों
- निर्माण
- इमारत
- में निर्मित
- बोझ
- व्यापार
- व्यवसायों
- लेकिन
- by
- कॉल
- कर सकते हैं
- उम्मीदवार
- कैनवास
- क्षमताओं
- क्षमता
- सक्षम
- मामला
- मामलों
- अधिकतम सीमा
- केंद्रित
- केंद्र
- श्रृंखला
- परिवर्तन
- विशेषताएँ
- चार्ल्स
- चुनें
- दावा
- क्लासिक
- वर्गीकरण
- स्वच्छ
- बादल
- क्लाउड इन्फ्रास्ट्रक्चर
- गुच्छन
- कोड
- कोड
- सहयोग
- रंग
- जोड़ती
- कैसे
- पूरा
- व्यापक
- कम्प्यूटेशनल
- कंप्यूटर
- Computer Vision
- संकल्पना
- निष्कर्ष निकाला है
- सम्मेलन
- विचार करना
- विचार
- शामिल
- कंटेनर
- शामिल हैं
- निरंतर
- अनुबंध
- कन्वर्सेशन (Conversation)
- बदलना
- समन्वय
- सही
- इसी
- सका
- श्रेय
- जिज्ञासु
- रिवाज
- ग्राहक
- ग्राहक
- अग्रणी
- दैनिक
- तिथि
- डेटा तैयारी
- डेटा विज्ञान
- आँकड़े वाला वैज्ञानिक
- डेटा सेट
- डेटा संरचना
- डेटा पर ही आधारित
- दिसंबर
- निर्णय
- कमी
- गहरी
- उद्धार
- मांग
- दिखाना
- साबित
- दर्शाता
- तैनात
- तैनात
- तैनाती
- निकाली गई
- वर्णन
- वर्णित
- डिज़ाइन
- बनाया गया
- निर्धारित
- विकसित
- डेवलपर
- डिजिटल
- आयाम
- चर्चा करना
- चर्चा की
- कई
- do
- कर देता है
- नहीं करता है
- डाउनलोड
- दर्जनों
- छोड़ने
- e
- से प्रत्येक
- आसान
- अर्थशास्त्र (इकोनॉमिक्स)
- सक्षम
- सक्षम
- प्रोत्साहित किया
- endpoint
- अभियांत्रिकी
- वर्धित
- पर्याप्त
- संपूर्ण
- ambiental
- त्रुटि
- त्रुटियाँ
- विशेष रूप से
- आकलन
- आदि
- और भी
- प्रत्येक
- उदाहरण
- उदाहरण
- अपेक्षित
- महंगा
- प्रयोग
- विशेषज्ञ
- स्पष्ट रूप से
- का पता लगाने
- उद्धरण
- चेहरा
- Feature
- विशेषताएं
- प्रतिक्रिया
- पैर
- कुछ
- आकृति
- फ़िल्टर
- अंत में
- खोज
- प्रथम
- मंज़िल
- फोकस
- का पालन करें
- निम्नलिखित
- इस प्रकार है
- के लिए
- प्रपत्र
- पाया
- बुनियाद
- चार
- से
- पूर्ण स्केल
- पूरी तरह से
- समारोह
- कार्यों
- मौलिक
- लाभ
- अंतराल
- सामान्य जानकारी
- उत्पन्न
- मिल
- लक्ष्य
- अच्छा
- ग्राफ
- महान
- अभूतपूर्व
- मार्गदर्शन
- हाथ
- है
- he
- मदद
- सहायक
- मदद करता है
- यहाँ उत्पन्न करें
- छिपा हुआ
- हाइलाइट
- रखती है
- होम
- गृह
- आशा
- मेजबानी
- मकान
- आवासन
- कैसे
- How To
- तथापि
- http
- HTTPS
- सैकड़ों
- i
- विचार
- आदर्श
- आदर्श
- पहचान
- if
- दिखाता है
- की छवि
- छवियों
- कल्पना करना
- आयात
- महत्व
- महत्वपूर्ण
- में सुधार
- उन्नत
- in
- शामिल
- शामिल
- सहित
- शामिल
- बढ़ना
- वृद्धि हुई
- तेजी
- स्वतंत्र रूप से
- इंगित करता है
- उद्योग
- प्रभाव
- सूचित करना
- करें-
- इंफ्रास्ट्रक्चर
- प्रारंभिक
- निवेश
- अंतर्दृष्टि
- प्रेरित
- प्रेरित
- बजाय
- बीमा
- बुद्धि
- बातचीत
- बातचीत
- ब्याज
- रुचि
- अंतरराष्ट्रीय स्तर पर
- में
- IT
- आईटी इस
- काम
- संयुक्त
- जेपीजी
- JSON
- कुंजी
- किम
- ज्ञान
- जानने वाला
- लेबल
- भूमि
- भाषा
- बड़ा
- बाद में
- नेतृत्व
- नेतृत्व
- जानें
- सीख रहा हूँ
- जीवन चक्र
- सूची
- सूचीबद्ध
- लिस्टिंग
- थोड़ा
- एलएलएम
- स्थित
- स्थान
- बंद
- लंबा
- हानि
- मशीन
- यंत्र अधिगम
- बनाया गया
- मुख्य धारा
- बनाना
- बनाता है
- प्रबंध
- मैन्युअल
- बहुत
- मैच
- मई..
- सार्थक
- साधन
- मीडिया
- तरीका
- बीच का रास्ता
- हो सकता है
- मन
- मिनटों
- लापता
- मिश्रण
- ML
- आदर्श
- मॉडल
- आधुनिक
- अधिक
- अधिकांश
- प्रस्ताव
- चलती
- चाहिए
- प्राकृतिक
- आवश्यकता
- जरूरत
- नया
- नई सुविधाएँ
- अगला
- नहीं
- नोड
- नोटबुक
- संख्या
- अनेक
- प्राप्त
- हुआ
- of
- ऑफर
- आधिकारिक तौर पर
- अक्सर
- on
- केवल
- खुला स्रोत
- उद्घाटन
- or
- आदेश
- संगठन
- संगठनों
- मूल
- मौलिक रूप से
- अन्य
- हमारी
- आउट
- ग़ैर
- उत्पादन
- बाहर
- अपना
- काग़ज़
- भाग
- पासिंग
- धैर्य
- पैटर्न उपयोग करें
- प्रति
- उत्तम
- प्रदर्शन
- शायद
- अनुमतियाँ
- व्यक्ति
- चरण
- फ़ोटो
- तस्वीरें
- चित्र
- तस्वीरें
- पाइपलाइन
- मैदान
- मंच
- प्लेटफार्म
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- कृप्या अ
- बिन्दु
- अंक
- पूल
- लोकप्रिय
- हिस्सा
- अधिकारी
- संभव
- पद
- भविष्यवाणी
- प्रारंभिक
- तैयारी
- तैयार करना
- तैयार
- तैयार
- पहले से
- मूल्य
- मूल्य
- प्रिंसिपल
- कार्यवाही
- प्रक्रिया
- प्रसंस्करण
- प्रस्तुत
- पेशेवरों
- गुण
- संपत्ति
- प्रस्ताव
- प्रस्तावित
- प्रदान करना
- बशर्ते
- प्रदाता
- प्रदाताओं
- प्रदान करता है
- प्रदान कर
- सार्वजनिक
- प्रकाशित
- लाना
- गुणवत्ता
- प्रश्न
- प्रशन
- जल्दी से
- R
- रेंज
- मूल्यांकन करें
- कच्चा
- पहुंच
- पढ़ना
- पढ़ना
- तैयार
- वास्तविक समय
- प्राप्त करना
- अभिलेख
- को कम करने
- संदर्भ
- संदर्भित करता है
- क्षेत्र
- रजिस्ट्री
- सुदृढ़
- सापेक्ष
- प्रासंगिक
- किराया
- कोष
- प्रतिनिधित्व
- का अनुरोध
- आवश्यकता
- की आवश्यकता होती है
- अनुसंधान
- आकृति बदलें
- निवास
- उपयुक्त संसाधन चुनें
- क्रमश
- प्रतिक्रिया
- प्रतिक्रियाएं
- परिणाम
- जिसके परिणामस्वरूप
- परिणाम
- वापसी
- की समीक्षा
- धनी
- अमीर
- रोडमैप
- मार्ग
- मार्ग
- रन
- क्रम
- s
- sagemaker
- बिक्री
- वही
- नमूना डेटासेट
- परिदृश्य
- दृश्य
- विज्ञान
- वैज्ञानिक
- स्कॉट
- लिपि
- Search
- दूसरा
- अनुभाग
- सुरक्षा
- देखना
- शोध
- देखा
- चयनित
- भेजना
- सेवा
- सेवा की
- सेवा
- सेवाएँ
- सेट
- कई
- आकार
- दिखाना
- दिखाया
- दिखाता है
- दृष्टि
- संकेत
- महत्वपूर्ण
- समान
- उसी प्रकार
- सरल
- को आसान बनाने में
- के बाद से
- एक
- आकार
- So
- सोशल मीडिया
- सोशल मीडिया
- सामाजिक मीडिया प्लेटफॉर्म
- समाधान
- हल
- कुछ
- कभी कभी
- इसके
- स्रोत
- सूत्रों का कहना है
- अंतरिक्ष
- विशेषज्ञ
- विशेषीकृत
- विशेष रूप से
- चौकोर
- प्रारंभ
- फिर भी
- भंडारण
- संग्रहित
- सरल
- संरचना
- संरचनाओं
- छात्र
- आगामी
- ऐसा
- सुझाव
- पर्यवेक्षण
- आपूर्ति
- आपूर्ति श्रृंखला
- आपूर्ति श्रृंखला प्रबंधन
- सहायक
- निश्चित
- तालिका
- टैग
- लेना
- लेता है
- लक्ष्य
- कार्य
- कार्य
- शिक्षण
- टीम
- टेक्नोलॉजीज
- टेक्नोलॉजी
- अवधि
- परीक्षण
- शाब्दिक
- से
- कि
- RSI
- स्रोत
- लेकिन हाल ही
- उन
- फिर
- वहाँ।
- इसलिये
- इन
- वे
- बात
- इसका
- उन
- विचार
- वैचारिक नेतृत्व
- हज़ार
- हजारों
- तीन
- यहाँ
- पहर
- सेवा मेरे
- आज
- आज का दि
- भी
- साधन
- विषय
- पारंपरिक रूप से
- रेलगाड़ी
- प्रशिक्षित
- प्रशिक्षण
- बदालना
- परिवर्तन
- परिवर्तनों
- ट्रांसफार्मर
- ट्रान्सफ़ॉर्मर
- <strong>उद्देश्य</strong>
- विश्वस्त
- दो
- टाइप
- प्रकार
- अंत में
- समझना
- समझ
- अद्वितीय
- Unsplash
- उपयोग
- उदाहरण
- प्रयुक्त
- का उपयोग करता है
- का उपयोग
- उपयोग
- मूल्याकंन
- मूल्य
- मूल्य संवर्धित
- मान
- परिवर्तनशील
- विविधता
- बहुत
- वीडियो
- देखें
- दिखाई
- दृष्टि
- दृश्य
- W
- करना चाहते हैं
- था
- we
- वेब
- वेब सेवाओं
- सप्ताह
- कुंआ
- थे
- क्या
- एचएमबी क्या है?
- कौन कौन से
- कौन
- मर्जी
- खिड़कियां
- साथ में
- अंदर
- बिना
- लकड़ी
- काम
- वर्कफ़्लो
- कार्य
- विश्व
- लायक
- होगा
- लिख रहे हैं
- साल
- पैदावार
- आप
- आपका
- स्वयं
- यूट्यूब
- जेफिरनेट
- शून्य
- ज़िप