Amazon SageMaker Canvas | के साथ कोड की एक भी पंक्ति लिखे बिना मशीन लर्निंग का उपयोग करें अमेज़न वेब सेवाएँ

Amazon SageMaker Canvas | के साथ कोड की एक भी पंक्ति लिखे बिना मशीन लर्निंग का उपयोग करें अमेज़न वेब सेवाएँ

हाल के दिनों में, भविष्यवाणियां करने के लिए मशीन लर्निंग (एमएल) का उपयोग करते हुए, विशेष रूप से पाठ और छवियों के रूप में डेटा के लिए, गहन शिक्षण मॉडल बनाने और ट्यूनिंग के लिए व्यापक एमएल ज्ञान की आवश्यकता होती है। आज, एमएल किसी भी उपयोगकर्ता के लिए अधिक सुलभ हो गया है जो व्यावसायिक मूल्य उत्पन्न करने के लिए एमएल मॉडल का उपयोग करना चाहता है। साथ अमेज़ॅन सेजमेकर कैनवास, आप कोड की एक भी पंक्ति लिखे बिना सारणीबद्ध या समय श्रृंखला डेटा से परे कई अलग-अलग डेटा प्रकारों के लिए पूर्वानुमान बना सकते हैं। इन क्षमताओं में छवि, पाठ और दस्तावेज़ डेटा प्रकारों के लिए पूर्व-प्रशिक्षित मॉडल शामिल हैं।

इस पोस्ट में, हम चर्चा करते हैं कि आप सारणीबद्ध डेटा से परे समर्थित डेटा प्रकारों के लिए पूर्वानुमान प्राप्त करने के लिए पूर्व-प्रशिक्षित मॉडल का उपयोग कैसे कर सकते हैं।

पाठ डेटा

सेजमेकर कैनवस एमएल मॉडल के निर्माण, प्रशिक्षण और तैनाती के लिए एक दृश्य, नो-कोड वातावरण प्रदान करता है। प्राकृतिक भाषा प्रसंस्करण (एनएलपी) कार्यों के लिए, सेजमेकर कैनवस सहजता से एकीकृत होता है Amazon Comprehend आपको भाषा पहचान, इकाई पहचान, भावना विश्लेषण, विषय मॉडलिंग और बहुत कुछ जैसी प्रमुख एनएलपी क्षमताओं को निष्पादित करने की अनुमति देने के लिए। एकीकरण अमेज़ॅन कॉम्प्रिहेंड के मजबूत एनएलपी मॉडल का उपयोग करने के लिए किसी भी कोडिंग या डेटा इंजीनियरिंग की आवश्यकता को समाप्त करता है। आप बस अपना टेक्स्ट डेटा प्रदान करते हैं और आमतौर पर उपयोग की जाने वाली चार क्षमताओं में से चयन करते हैं: भावना विश्लेषण, भाषा का पता लगाना, संस्थाओं का निष्कर्षण, और व्यक्तिगत जानकारी का पता लगाना। प्रत्येक परिदृश्य के लिए, आप परीक्षण करने के लिए यूआई का उपयोग कर सकते हैं और संग्रहीत डेटा का चयन करने के लिए बैच भविष्यवाणी का उपयोग कर सकते हैं अमेज़न सरल भंडारण सेवा (अमेज़न S3)।

सेजमेकर कैनवस पर टेक्स्ट डेटा का विश्लेषण

भावनाओं का विश्लेषण

भावना विश्लेषण के साथ, सेजमेकर कैनवास आपको अपने इनपुट टेक्स्ट की भावना का विश्लेषण करने की अनुमति देता है। यह निर्धारित कर सकता है कि समग्र भावना सकारात्मक, नकारात्मक, मिश्रित या तटस्थ है, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है। यह उत्पाद समीक्षाओं का विश्लेषण करने जैसी स्थितियों में उपयोगी है। उदाहरण के लिए, पाठ "मुझे यह उत्पाद पसंद है, यह अद्भुत है!" सेजमेकर कैनवस द्वारा इसे सकारात्मक भावना के रूप में वर्गीकृत किया जाएगा, जबकि "यह उत्पाद भयानक है, मुझे इसे खरीदने का अफसोस है" को नकारात्मक भावना के रूप में लेबल किया जाएगा।

सेजमेकर कैनवस पर भावना विश्लेषण

संस्थाएँ निष्कर्षण

सेजमेकर कैनवस पाठ का विश्लेषण कर सकता है और स्वचालित रूप से उसमें उल्लिखित संस्थाओं का पता लगा सकता है। जब कोई दस्तावेज़ विश्लेषण के लिए सेजमेकर कैनवस को भेजा जाता है, तो यह पाठ में लोगों, संगठनों, स्थानों, तिथियों, मात्राओं और अन्य संस्थाओं की पहचान करेगा। यह इकाई निष्कर्षण क्षमता आपको दस्तावेज़ों में चर्चा किए गए प्रमुख लोगों, स्थानों और विवरणों के बारे में तुरंत जानकारी प्राप्त करने में सक्षम बनाती है। समर्थित संस्थाओं की सूची के लिए, देखें संस्थाओं.

सेजमेकर कैनवस पर एंटाइट्स एक्सट्रैक्शन

भाषा का पता लगाने

सेजमेकर कैनवस अमेज़ॅन कॉम्प्रिहेंन्ड का उपयोग करके टेक्स्ट की प्रमुख भाषा भी निर्धारित कर सकता है। यह मुख्य भाषा की पहचान करने के लिए पाठ का विश्लेषण करता है और पता लगाई गई प्रमुख भाषा के लिए आत्मविश्वास स्कोर प्रदान करता है, लेकिन बहुभाषी दस्तावेजों के लिए प्रतिशत विश्लेषण का संकेत नहीं देता है। एकाधिक भाषाओं में लंबे दस्तावेज़ों के साथ सर्वोत्तम परिणामों के लिए, पाठ को छोटे टुकड़ों में विभाजित करें और भाषा प्रतिशत का अनुमान लगाने के लिए परिणामों को एकत्रित करें। यह पाठ के कम से कम 20 अक्षरों के साथ सबसे अच्छा काम करता है।

सेजमेकर कैनवास पर भाषा का पता लगाना

व्यक्तिगत जानकारी का पता लगाना

आप सेजमेकर कैनवस के साथ व्यक्तिगत जानकारी का पता लगाकर संवेदनशील डेटा की सुरक्षा भी कर सकते हैं। यह व्यक्तिगत रूप से पहचान योग्य जानकारी (पीआईआई) संस्थाओं का स्वचालित रूप से पता लगाने के लिए टेक्स्ट दस्तावेज़ों का विश्लेषण कर सकता है, जिससे आप नाम, पते, जन्म तिथि, फोन नंबर, ईमेल पते और बहुत कुछ जैसे संवेदनशील डेटा का पता लगा सकते हैं। यह 100 केबी तक के दस्तावेज़ों का विश्लेषण करता है और प्रत्येक खोजी गई इकाई के लिए एक आत्मविश्वास स्कोर प्रदान करता है ताकि आप सबसे संवेदनशील जानकारी की समीक्षा कर सकें और उसे चुनिंदा रूप से संशोधित कर सकें। पता लगाई गई संस्थाओं की सूची के लिए, देखें पीआईआई संस्थाओं का पता लगाना.

सेजमेकर कैनवास पर पीआईआई का पता लगाना

छवि डेटा

सेजमेकर कैनवस एक विज़ुअल, नो-कोड इंटरफ़ेस प्रदान करता है जो आपके लिए कंप्यूटर विज़न क्षमताओं का उपयोग करना आसान बनाता है। अमेज़ॅन रेकग्निशन छवि विश्लेषण के लिए. उदाहरण के लिए, आप छवियों का एक डेटासेट अपलोड कर सकते हैं, वस्तुओं और दृश्यों का पता लगाने के लिए अमेज़ॅन रिकॉग्निशन का उपयोग कर सकते हैं, और उपयोग के मामलों की एक विस्तृत श्रृंखला को संबोधित करने के लिए टेक्स्ट डिटेक्शन कर सकते हैं। विज़ुअल इंटरफ़ेस और अमेज़ॅन रिकॉग्निशन एकीकरण गैर-डेवलपर्स के लिए उन्नत कंप्यूटर विज़न तकनीकों का उपयोग करना संभव बनाता है।

सेजमेकर कैनवस पर छवि डेटा का विश्लेषण

छवियों में वस्तु का पता लगाना

सेजमेकर कैनवास किसी छवि में लेबल (ऑब्जेक्ट्स) का पता लगाने के लिए अमेज़ॅन रिकॉग्निशन का उपयोग करता है। आप सेजमेकर कैनवस यूआई से छवि अपलोड कर सकते हैं या इसका उपयोग कर सकते हैं बैच भविष्यवाणी S3 बकेट में संग्रहीत छवियों का चयन करने के लिए टैब। जैसा कि निम्नलिखित उदाहरण में दिखाया गया है, यह छवि में वस्तुओं को निकाल सकता है जैसे क्लॉक टॉवर, बस, इमारतें और बहुत कुछ। आप पूर्वानुमान परिणामों को खोजने और उन्हें क्रमबद्ध करने के लिए इंटरफ़ेस का उपयोग कर सकते हैं।

सेजमेकर कैनवास पर छवियों में वस्तु का पता लगाना

छवियों में पाठ का पता लगाना

छवियों से पाठ निकालना एक बहुत ही सामान्य उपयोग का मामला है। अब, आप इस कार्य को सेजमेकर कैनवस पर बिना किसी कोड के आसानी से कर सकते हैं। टेक्स्ट को लाइन आइटम के रूप में निकाला जाता है, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है। छवि के भीतर छोटे वाक्यांशों को एक साथ वर्गीकृत किया गया है और एक वाक्यांश के रूप में पहचाना गया है।

सेजमेकर कैनवास पर छवियों में टेक्स्ट का पता लगाना

आप छवियों का एक सेट अपलोड करके बैच पूर्वानुमान लगा सकते हैं, एक ही बैच में सभी छवियां निकाल सकते हैं और परिणामों को सीएसवी फ़ाइल के रूप में डाउनलोड कर सकते हैं। यह समाधान तब उपयोगी होता है जब आप छवियों में टेक्स्ट निकालना और उसका पता लगाना चाहते हैं।

दस्तावेज़ डेटा

सेजमेकर कैनवस विभिन्न प्रकार के उपयोग के लिए तैयार समाधान प्रदान करता है जो आपकी दिन-प्रतिदिन की दस्तावेज़ समझ आवश्यकताओं को हल करते हैं। ये समाधान द्वारा संचालित हैं अमेज़न टेक्सट्रेक. दस्तावेज़ों के लिए सभी उपलब्ध विकल्प देखने के लिए, चुनें उपयोग के लिए तैयार मॉडल नेविगेशन फलक में और फ़िल्टर करें दस्तावेज़, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है।

सेजमेकर कैनवास पर दस्तावेज़ डेटा का विश्लेषण

दस्तावेज़ विश्लेषण

दस्तावेज़ विश्लेषण खोजे गए पाठ के बीच संबंधों के लिए दस्तावेज़ों और प्रपत्रों का विश्लेषण करता है। ऑपरेशन दस्तावेज़ निष्कर्षण की चार श्रेणियां लौटाते हैं: कच्चा पाठ, प्रपत्र, तालिकाएँ और हस्ताक्षर। दस्तावेज़ संरचना को समझने की समाधान की क्षमता आपको उस प्रकार के डेटा में अतिरिक्त लचीलापन देती है जिसे आप दस्तावेज़ों से निकालना चाहते हैं। निम्नलिखित स्क्रीनशॉट इस बात का उदाहरण है कि टेबल डिटेक्शन कैसा दिखता है।

सेजमेकर कैनवास पर दस्तावेज़ विश्लेषण

यह समाधान जटिल दस्तावेज़ों के लेआउट को समझने में सक्षम है, जो तब सहायक होता है जब आपको अपने दस्तावेज़ों में विशिष्ट जानकारी निकालने की आवश्यकता होती है।

पहचान दस्तावेज़ विश्लेषण

यह समाधान व्यक्तिगत पहचान पत्र, ड्राइवर लाइसेंस, या पहचान के अन्य समान रूपों जैसे दस्तावेजों का विश्लेषण करने के लिए डिज़ाइन किया गया है। मध्य नाम, काउंटी और जन्म स्थान जैसी जानकारी, सटीकता पर व्यक्तिगत आत्मविश्वास स्कोर के साथ, प्रत्येक पहचान दस्तावेज़ के लिए वापस कर दी जाएगी, जैसा कि निम्नलिखित स्क्रीनशॉट में दिखाया गया है।

सेजमेकर कैनवास पर पहचान दस्तावेज़ विश्लेषण

बैच भविष्यवाणी करने का एक विकल्प है, जिससे आप पहचान दस्तावेजों के सेट को थोक में अपलोड कर सकते हैं और उन्हें बैच जॉब के रूप में संसाधित कर सकते हैं। यह पहचान दस्तावेज़ विवरण को कुंजी-मूल्य जोड़े में बदलने का एक त्वरित और निर्बाध तरीका प्रदान करता है जिसका उपयोग डेटा विश्लेषण जैसी डाउनस्ट्रीम प्रक्रियाओं के लिए किया जा सकता है।

व्यय विश्लेषण

व्यय विश्लेषण को चालान और रसीद जैसे व्यय दस्तावेजों का विश्लेषण करने के लिए डिज़ाइन किया गया है। निम्नलिखित स्क्रीनशॉट इसका एक उदाहरण है कि निकाली गई जानकारी कैसी दिखती है।

सेजमेकर कैनवास पर व्यय विश्लेषण

परिणाम सारांश फ़ील्ड और पंक्ति आइटम फ़ील्ड के रूप में लौटाए जाते हैं। सारांश फ़ील्ड दस्तावेज़ से निकाले गए कुंजी-मूल्य जोड़े हैं, और इसमें कुंजियाँ शामिल हैं महायोग, नियत तारीख, तथा कर. लाइन आइटम फ़ील्ड उस डेटा को संदर्भित करते हैं जो दस्तावेज़ में एक तालिका के रूप में संरचित है। यह दस्तावेज़ के लेआउट को बनाए रखते हुए उससे जानकारी निकालने के लिए उपयोगी है।

दस्तावेज़ प्रश्न

दस्तावेज़ क्वेरीज़ आपके दस्तावेज़ों के बारे में प्रश्न पूछने के लिए डिज़ाइन की गई हैं। जब आपके पास बहु-पृष्ठ दस्तावेज़ हों और आप अपने दस्तावेज़ों से बहुत विशिष्ट उत्तर निकालना चाहते हों तो यह उपयोग करने के लिए एक बढ़िया समाधान है। निम्नलिखित इस बात का उदाहरण है कि आप किस प्रकार के प्रश्न पूछ सकते हैं और निकाले गए उत्तर कैसे दिखते हैं।

सेजमेकर कैनवास पर दस्तावेज़ क्वेरीज़

समाधान आपको अपने दस्तावेज़ों के साथ इंटरैक्ट करने के लिए एक सीधा इंटरफ़ेस प्रदान करता है। यह तब सहायक होता है जब आप बड़े दस्तावेज़ों में विशिष्ट विवरण प्राप्त करना चाहते हैं।

निष्कर्ष

सेजमेकर कैनवस टेक्स्ट, छवियों और दस्तावेज़ों जैसे विभिन्न डेटा प्रकारों में आसानी से एमएल का उपयोग करने के लिए एक नो-कोड वातावरण प्रदान करता है। विज़ुअल इंटरफ़ेस और AWS सेवाओं जैसे Amazon Comprehend, Amazon Rekognition, और Amazon Texttract के साथ एकीकरण कोडिंग और डेटा इंजीनियरिंग की आवश्यकता को समाप्त कर देता है। आप भावनाओं, संस्थाओं, भाषाओं और पीआईआई के लिए पाठ का विश्लेषण कर सकते हैं। छवियों, वस्तु और पाठ का पता लगाने के लिए कंप्यूटर विज़न उपयोग के मामलों को सक्षम बनाता है। अंत में, दस्तावेज़ विश्लेषण डाउनस्ट्रीम प्रक्रियाओं के लिए इसके लेआउट को संरक्षित करते हुए पाठ को निकाल सकता है। सेजमेकर कैनवस में उपयोग के लिए तैयार समाधान आपके लिए संरचित और असंरचित डेटा दोनों से अंतर्दृष्टि उत्पन्न करने के लिए उन्नत एमएल तकनीकों का उपयोग करना संभव बनाता है। यदि आप उपयोग के लिए तैयार एमएल मॉडल के साथ नो-कोड टूल का उपयोग करने में रुचि रखते हैं, तो आज ही सेजमेकर कैनवास आज़माएं। अधिक जानकारी के लिए देखें अमेज़ॅन सेजमेकर कैनवास का उपयोग करने के साथ शुरुआत करना.


लेखक के बारे में

Amazon SageMaker Canvas | के साथ कोड की एक भी पंक्ति लिखे बिना मशीन लर्निंग का उपयोग करें अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.जूलिया आंग सिंगापुर में स्थित एक सॉल्यूशन आर्किटेक्ट है। उन्होंने स्वास्थ्य और सार्वजनिक क्षेत्र से लेकर डिजिटल देशी व्यवसायों तक कई क्षेत्रों में ग्राहकों के साथ काम किया है, ताकि उनकी व्यावसायिक जरूरतों के अनुसार समाधान अपनाया जा सके। वह दक्षिण पूर्व एशिया और उससे आगे के ग्राहकों को अपने व्यवसायों में एआई और एमएल का उपयोग करने में भी सहायता कर रही है। काम के अलावा, वह यात्रा करके और रचनात्मक गतिविधियों में संलग्न होकर दुनिया के बारे में सीखना पसंद करती है।

Amazon SageMaker Canvas | के साथ कोड की एक भी पंक्ति लिखे बिना मशीन लर्निंग का उपयोग करें अमेज़ॅन वेब सेवाएँ प्लेटोब्लॉकचेन डेटा इंटेलिजेंस। लंबवत खोज. ऐ.लोके जून काई सिंगापुर स्थित एआई/एमएल के लिए एक विशेषज्ञ समाधान वास्तुकार हैं। वह पूरे आसियान में ग्राहकों के साथ एडब्ल्यूएस में बड़े पैमाने पर मशीन लर्निंग समाधान तैयार करने के लिए काम करता है। जून काई लो-कोड नो-कोड मशीन लर्निंग टूल्स के समर्थक हैं। अपने खाली समय में वह प्रकृति के साथ रहना पसंद करते हैं।

समय टिकट:

से अधिक AWS मशीन लर्निंग