छवि से टेक्स्ट या डेटा कैसे निकालें

प्लेटो द्वारा पुनर्प्रकाशित

अनुयायियों: 0

किसी छवि से पाठ निकालना एक बोझिल प्रक्रिया हो सकती है। अधिकांश लोग छवि से टेक्स्ट/डेटा में मैन्युअल रूप से कुंजी करते हैं; लेकिन यह समय लेने वाली और अक्षम दोनों है जब आपके पास निपटने के लिए बहुत सारी छवियां होती हैं।

टेक्स्ट कन्वर्टर्स के लिए छवि छवियों से पाठ निकालने का एक साफ-सुथरा तरीका प्रदान करें।

जबकि ऐसे उपकरण अच्छा काम करते हैं, निकाले गए पाठ/डेटा को अक्सर असंरचित तरीके से प्रस्तुत किया जाता है जिसके परिणामस्वरूप बहुत अधिक पोस्ट प्रोसेसिंग होती है।

An एआई-संचालित ओसीआर जैसे नैनोनेट छवियों से टेक्स्ट खींच सकते हैं और निकाले गए डेटा को साफ, व्यवस्थित और संरचित तरीके से प्रस्तुत कर सकते हैं।

नैनोनेट्स छवियों से सटीक, बड़े पैमाने पर और कई भाषाओं में डेटा निकालता है। नैनोनेट्स एकमात्र टेक्स्ट रिकग्निशन ओसीआर है जो निकाले गए टेक्स्ट को बड़े करीने से संरचित प्रारूपों में प्रस्तुत करता है जो पूरी तरह से अनुकूलन योग्य हैं। कैप्चर किए गए डेटा को टेबल, लाइन आइटम या किसी अन्य प्रारूप के रूप में प्रस्तुत किया जा सकता है।

नीचे अपनी छवि अपलोड करने के लिए क्लिक करें
नैनोनेट्स का ओसीआर स्वचालित रूप से आपकी फ़ाइल की सामग्री को पहचानता है और इसे टेक्स्ट में परिवर्तित करता है
निकाले गए टेक्स्ट को कच्ची टेक्स्ट फ़ाइल के रूप में डाउनलोड करें या एपीआई के माध्यम से एकीकृत करें

विषय - सूची

यहां तीन उन्नत विधियां दी गई हैं जिनमें आप नैनोनेट्स ओसीआर का उपयोग छवियों से टेक्स्ट का पता लगाने और निकालने के लिए कर सकते हैं, पीडीएफ से पाठ निकालेंs, पीडीएफ से डेटा निकालेंया पीडीएफ पार्स करें और अन्य दस्तावेज़ प्रकार:

नैनोनेट्स का उपयोग करके एक छवि से पाठ निकालना

इसके लिए नि:शुल्क ऑनलाइन ओसीआर चाहिए पाठ के लिए छवि, टेबल के लिए पीडीएफ, पाठ के लिए पीडीएफया, पीडीएफ डेटा निष्कर्षण? नैनोनेट ऑनलाइन देखें ओसीआर एपीआई कार्रवाई में और मुफ्त में कस्टम ओसीआर मॉडल बनाना शुरू करें!

नैनोनेट्स में नीचे सूचीबद्ध विशिष्ट छवि प्रकारों के लिए पूर्व-प्रशिक्षित ओसीआर मॉडल हैं। प्रत्येक पूर्व-प्रशिक्षित ओसीआर मॉडल को छवि प्रकार में टेक्स्ट को नाम, पता, तिथि, समाप्ति इत्यादि जैसे उपयुक्त फ़ील्ड से सटीक रूप से जोड़ने और निकाले गए टेक्स्ट को साफ और व्यवस्थित तरीके से प्रस्तुत करने के लिए प्रशिक्षित किया जाता है।

चालान
रसीद
चालक का लाइसेंस (यूएस)
पासपोर्ट

नैनोनेट्स ऑनलाइन ओसीआर और ओसीआर एपीआई कई दिलचस्प हैं बक्सों का इस्तेमाल करें.

[एम्बेडेड सामग्री]

प्राप्तियों की छवियों से पाठ निकालने वाले नैनोनेट

चरण 1: एक उपयुक्त OCR मॉडल का चयन करें

लॉग इन करें नैनोनेट्स के लिए और एक ओसीआर मॉडल का चयन करें जो उस छवि के लिए उपयुक्त है जिससे आप टेक्स्ट और डेटा निकालना चाहते हैं। यदि पूर्व-प्रशिक्षित ओसीआर मॉडल में से कोई भी आपकी आवश्यकताओं के अनुरूप नहीं है, तो आप कस्टम ओसीआर मॉडल बनाने का तरीका जानने के लिए आगे बढ़ सकते हैं।

चरण 2: फ़ाइलें जोड़ें

उन फ़ाइलों/छवियों को जोड़ें जिनसे आप टेक्स्ट निकालना चाहते हैं। आप जितनी चाहें उतनी छवियां जोड़ सकते हैं।

चरण 3: परीक्षण

मॉडल को छवि से टेक्स्ट चलाने और निकालने के लिए कुछ सेकंड दें।

चरण 4: सत्यापित करें

दाईं ओर तालिका दृश्य की जाँच करके, प्रत्येक फ़ाइल से निकाले गए पाठ को त्वरित रूप से सत्यापित करें। आप आसानी से दोबारा जांच सकते हैं कि टेक्स्ट को सही ढंग से पहचाना गया है और उपयुक्त फ़ील्ड या टैग से मेल खाता है।

आप इस स्तर पर फ़ील्ड मानों और लेबलों को संपादित/सही करना भी चुन सकते हैं। नैनोनेट्स छवि के टेम्पलेट से बंधे नहीं हैं।

निकाले गए डेटा को "सूची दृश्य" या "JSON" प्रारूप में प्रदर्शित किया जा सकता है।

इमेज प्लेटोब्लॉकचेन डेटा इंटेलिजेंस से टेक्स्ट या डेटा कैसे निकालें। लंबवत खोज. ऐ. — निकाले गए टेक्स्ट को सूची या JSON आउटपुट के रूप में प्रदर्शित किया जाता है

आप सत्यापित करने वाले प्रत्येक मान या फ़ील्ड के पास स्थित चेकबॉक्स पर टिक कर सकते हैं या तुरंत आगे बढ़ने के लिए "डेटा सत्यापित करें" पर क्लिक कर सकते हैं।

चरण 5: निर्यात करें

एक बार सभी फाइलों का सत्यापन हो गया। आप xml, xlsx या csv फ़ाइल के रूप में बड़े करीने से व्यवस्थित डेटा निर्यात कर सकते हैं।

नैनोसेट्स दिलचस्प हैं बक्सों का इस्तेमाल करें और अद्वितीय ग्राहक सफलता की कहानियाँ. पता करें कि नैनोनेट्स आपके व्यवसाय को और अधिक उत्पादक बनाने के लिए कैसे कर सकते हैं।

नैनोनेट्स के साथ एक कस्टम ओसीआर मॉडल बनाना आसान है। आप आम तौर पर किसी भी छवि या दस्तावेज़ प्रकार के लिए किसी भी भाषा में एक मॉडल का निर्माण, प्रशिक्षण और तैनाती 25 मिनट से कम समय में कर सकते हैं (मॉडल को प्रशिक्षित करने के लिए उपयोग की जाने वाली फाइलों की संख्या के आधार पर)।

इस विधि में पहले 4 चरणों का पालन करने के लिए नीचे दिया गया वीडियो देखें:

[एम्बेडेड सामग्री]

अपने खुद के ओसीआर मॉडल को नैनोनेट्स के साथ कैसे प्रशिक्षित करें

चरण 1: अपना खुद का ओसीआर मॉडल बनाएं

लॉग इन करें नैनोनेट्स पर क्लिक करें और "अपना खुद का ओसीआर मॉडल बनाएं" पर क्लिक करें।

चरण 2: प्रशिक्षण फ़ाइलें / चित्र अपलोड करें

नमूना फ़ाइलें अपलोड करें जिनका उपयोग ओसीआर मॉडल को प्रशिक्षित करने के लिए किया जाएगा। आपके द्वारा बनाए गए ओसीआर मॉडल की सटीकता काफी हद तक इस स्तर पर अपलोड की गई फ़ाइलों / छवियों की गुणवत्ता और मात्रा पर निर्भर करेगी

चरण 3: फ़ाइलों / छवियों पर एनोटेट पाठ

अब एक उपयुक्त फ़ील्ड या लेबल के साथ टेक्स्ट या डेटा के प्रत्येक टुकड़े को एनोटेट करें। यह महत्वपूर्ण कदम आपके OCR मॉडल को छवियों से उपयुक्त पाठ निकालने और कस्टम फ़ील्ड्स के साथ जोड़ना सिखाएगा जो आपकी आवश्यकताओं के लिए प्रासंगिक हैं।

आप टेक्स्ट या डेटा को एनोटेट करने के लिए एक नया लेबल भी जोड़ सकते हैं। याद रखें, नैनोनेट्स छवि के टेम्पलेट से बंधे नहीं हैं!

चरण 4: कस्टम OCR मॉडल को प्रशिक्षित करें

सभी प्रशिक्षण फ़ाइलों / छवियों के लिए एनोटेशन पूरा होने के बाद, "ट्रेन मॉडल" पर क्लिक करें। प्रशिक्षण आमतौर पर प्रशिक्षण के लिए फ़ाइलों और कतारबद्ध मॉडलों की संख्या के आधार पर 20 मिनट से 2 घंटे के बीच होता है। आप ऐसा कर सकते हैं उन्नयन इस स्तर पर तेजी से परिणाम प्राप्त करने के लिए एक भुगतान योजना (आमतौर पर 20 मिनट से कम)।

नैनोनेट्स विभिन्न ओसीआर मॉडल बनाने के लिए गहन शिक्षा का लाभ उठाते हैं और सटीकता के लिए एक दूसरे के खिलाफ उनका परीक्षण करते हैं। नैनोनेट्स तब सर्वश्रेष्ठ ओसीआर मॉडल (आपके इनपुट और सटीकता स्तरों के आधार पर) को चुनता है।

"मॉडल मेट्रिक्स" टैब विभिन्न मापों और तुलनात्मक विश्लेषणों से पता चलता है कि नैनोनेट्स को उन सभी के बीच सबसे अच्छा ओसीआर मॉडल चुनने की अनुमति दी गई थी। आप सटीकता के उच्च स्तर को प्राप्त करने के लिए मॉडल (प्रशिक्षण छवियों की एक विस्तृत श्रृंखला और बेहतर एनोटेशन प्रदान करके) को पुनः प्राप्त कर सकते हैं।

या, यदि आप सटीकता से संतुष्ट हैं, तो परीक्षण और सत्यापित करने के लिए "परीक्षण" पर क्लिक करें कि क्या यह कस्टम OCR मॉडल छवियों या फ़ाइलों के नमूने पर अपेक्षित है, जिसमें से पाठ / डेटा को निकालने की आवश्यकता है।

चरण 5: डेटा का परीक्षण और सत्यापन करें

कस्टम OCR मॉडल का परीक्षण और सत्यापन करने के लिए कुछ नमूना चित्रों को जोड़ें।

निकाले गए पाठ की सटीकता की जाँच करें — निकाले गए पाठ की सटीकता का परीक्षण और सत्यापन करें

यदि टेक्स्ट को उचित रूप से पहचाना, निकाला और प्रस्तुत किया गया है तो फ़ाइल को निर्यात करें। जैसा कि आप नीचे देख सकते हैं, निकाले गए डेटा को साफ-सुथरे प्रारूप में व्यवस्थित और प्रस्तुत किया गया है।

निर्यातित डेटा बड़े करीने से सूचीबद्ध है

बधाई हो, अब आपने कुछ खास प्रकार की छवियों से टेक्स्ट निकालने के लिए एक कस्टम OCR मॉडल बनाया और प्रशिक्षित किया है!

क्या आपका व्यवसाय डिजिटल दस्तावेज़ों, चित्रों या PDF में पाठ पहचान से संबंधित है? क्या आपने सोचा है कि छवियों से टेक्स्ट को सही तरीके से कैसे निकाला जाए?

NanoNets API के साथ अपने स्वयं के OCR मॉडल को प्रशिक्षित करें

यहाँ एक ट्रेन के लिए विस्तृत गाइड अपने स्वयं के ओसीआर मॉडल का उपयोग कर नैनोनेट्स एपीआई. में दस्तावेज़ीकरण, आप पायथन, शेल, रूबी, गोलंग, जावा, और सी# में कोड नमूनों को फायर करने के लिए तैयार पाएंगे, साथ ही विभिन्न समापन बिंदुओं के लिए विस्तृत एपीआई स्पेक्स भी पाएंगे।

नैनोनेट्स एपीआई का उपयोग करके अपने स्वयं के मॉडल को प्रशिक्षित करने के लिए चरण-दर-चरण मार्गदर्शिका यहां दी गई है:

चरण 1: क्लोन रिपो

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

चरण 2: अपनी मुफ्त एपीआई कुंजी प्राप्त करें

से अपनी मुफ्त एपीआई कुंजी प्राप्त करें https://app.nanonets.com/#/keys

चरण 3: एक पर्यावरण चर के रूप में एपीआई कुंजी सेट करें

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

चरण 4: एक नया मॉडल बनाएँ

python ./code/create-model.py

नोट: यह एक MODEL_ID बनाता है जिसे आपको अगले चरण के लिए आवश्यक है

चरण 5: पर्यावरण चर के रूप में मॉडल आईडी जोड़ें

export NANONETS_MODEL_ID=YOUR_MODEL_ID

चरण 6: प्रशिक्षण डेटा अपलोड करें

आप जिस वस्तु का पता लगाना चाहते हैं, उसके चित्र एकत्र करें। एक बार जब आप फोल्डर में डेटासेट तैयार कर लेते हैं images (छवि फ़ाइलें), डेटासेट अपलोड करना शुरू करें।

python ./code/upload-training.py

चरण 7: ट्रेन मॉडल

छवियाँ अपलोड हो जाने के बाद, मॉडल का प्रशिक्षण शुरू करें

python ./code/train-model.py

चरण 8: मॉडल राज्य प्राप्त करें

प्रशिक्षण के लिए मॉडल में ~ 30 मिनट का समय लगता है। मॉडल प्रशिक्षित होने के बाद आपको एक ईमेल मिलेगा। इस बीच आप मॉडल की स्थिति की जांच करते हैं

watch -n 100 python ./code/model-state.py

चरण 9: भविष्यवाणी करें

एक बार मॉडल को प्रशिक्षित किया जाता है। आप मॉडल का उपयोग करके भविष्यवाणियां कर सकते हैं

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

अन्य ओसीआर एपीआई पर नैनोनेट्स का उपयोग करने के लाभ छवियों से पाठ निकालने के संबंध में बेहतर सटीकता से परे हैं। यहां 7 कारण दिए गए हैं कि आपको इसके बजाय पाठ पहचान के लिए नैनोनेट्स ओसीआर का उपयोग करने पर विचार क्यों करना चाहिए:

1. कस्टम डेटा के साथ कार्य करना

अधिकांश ओसीआर सॉफ्टवेयर डेटा के प्रकार पर काफी कठोर होते हैं जिसके साथ वे काम कर सकते हैं। उपयोग के मामले के लिए एक ओसीआर मॉडल को प्रशिक्षित करने के लिए इसकी आवश्यकताओं और विशिष्टताओं के संबंध में बड़ी मात्रा में लचीलेपन की आवश्यकता होती है; चालान प्रसंस्करण के लिए एक ओसीआर पासपोर्ट के लिए एक ओसीआर से काफी अलग होगा! नैनोनेट ऐसी कठोर सीमाओं से बंधे नहीं हैं। नैनोनेट्स ओसीआर मॉडल को प्रशिक्षित करने के लिए आपके अपने डेटा का उपयोग करता है जो आपके व्यवसाय की विशेष जरूरतों को पूरा करने के लिए सबसे उपयुक्त हैं।

2. गैर-अंग्रेज़ी या एकाधिक भाषाओं के साथ कार्य करना

चूंकि नैनोनेट कस्टम डेटा के साथ प्रशिक्षण पर ध्यान केंद्रित करता है, इसलिए इसे एक एकल ओसीआर मॉडल बनाने के लिए विशिष्ट रूप से रखा गया है जो एक ही समय में किसी भी भाषा या कई भाषाओं में छवियों से टेक्स्ट निकाल सकता है।

3. कोई पोस्ट-प्रोसेसिंग की आवश्यकता नहीं है

ओसीआर मॉडल का उपयोग करके निकाले गए पाठ को समझदारी से संरचित और एक समझदार प्रारूप में प्रस्तुत करने की आवश्यकता है; अन्यथा सार्थक जानकारी में डेटा को पुन: व्यवस्थित करने में काफी समय और संसाधन खर्च होते हैं। जबकि अधिकांश ओसीआर उपकरण केवल छवियों से डेटा को पकड़ते हैं और डंप करते हैं, नैनोनेट्स केवल प्रासंगिक डेटा निकालता है और स्वचालित रूप से उन्हें बुद्धिमानी से संरचित क्षेत्रों में सॉर्ट करता है जिससे इसे देखना और समझना आसान हो जाता है।

4. लगातार सीखता है

व्यवसायों को अक्सर गतिशील रूप से बदलती आवश्यकताओं और जरूरतों का सामना करना पड़ता है। संभावित बाधाओं को दूर करने के लिए, नैनोनेट्स आपको नए डेटा के साथ अपने मॉडल को आसानी से फिर से प्रशिक्षित करने की अनुमति देता है। यह आपके ओसीआर मॉडल को अप्रत्याशित परिवर्तनों के अनुकूल होने की अनुमति देता है।

5. सामान्य डेटा बाधाओं को आसानी से संभालता है

नैनोनेट्स एआई, एमएल और डीप लर्निंग तकनीकों का लाभ उठाते हैं ताकि सामान्य डेटा बाधाओं को दूर किया जा सके जो टेक्स्ट पहचान और निष्कर्षण को बहुत प्रभावित करते हैं। नैनोनेट्स ओसीआर हस्तलिखित पाठ, एक साथ कई भाषाओं में पाठ की छवियों, कम रिज़ॉल्यूशन वाली छवियों, नए या कर्सिव फोंट और अलग-अलग आकार वाले चित्र, छायादार पाठ के साथ चित्र, झुका हुआ पाठ, यादृच्छिक असंरचित पाठ, छवि शोर, धुंधली छवियों को पहचान और संभाल सकता है। और अधिक। पारंपरिक ओसीआर एपीआई ऐसी बाधाओं के तहत प्रदर्शन करने के लिए सुसज्जित नहीं हैं; उन्हें बहुत उच्च स्तर की निष्ठा पर डेटा की आवश्यकता होती है जो वास्तविक जीवन परिदृश्यों में आदर्श नहीं है।

6. डेवलपर्स की कोई इन-हाउस टीम की आवश्यकता नहीं है

अपनी व्यावसायिक आवश्यकताओं के लिए नैनोनेट्स एपीआई को वैयक्तिकृत करने के लिए डेवलपर्स को काम पर रखने और प्रतिभा प्राप्त करने के बारे में चिंता करने की आवश्यकता नहीं है। नैनोनेट्स को परेशानी मुक्त एकीकरण के लिए बनाया गया था। आप अधिकांश सीआरएम, ईआरपी या आरपीए सॉफ्टवेयर के साथ नैनोनेट्स को आसानी से एकीकृत कर सकते हैं।

7. अनुकूलित करें, अनुकूलित करें, अनुकूलित करें

आप नैनोनेट्स ओसीआर के साथ टेक्स्ट/डेटा के जितने चाहें उतने क्षेत्रों को कैप्चर कर सकते हैं। आप कस्टम सत्यापन नियम भी बना सकते हैं जो आपकी विशिष्ट टेक्स्ट पहचान और टेक्स्ट निष्कर्षण आवश्यकताओं के लिए काम करते हैं। नैनोनेट्स आपके दस्तावेज़ के टेम्पलेट से बिल्कुल भी बाध्य नहीं हैं। आप टेबल या लाइन आइटम या किसी अन्य प्रारूप में डेटा कैप्चर कर सकते हैं!

नैनोनेट्स में कई उपयोग के मामले हैं जो आपके व्यवसाय के प्रदर्शन को अनुकूलित कर सकते हैं, लागत बचा सकते हैं और विकास को बढ़ावा दे सकते हैं। मालूम करना नैनोनेट्स के उपयोग के मामले आपके उत्पाद पर कैसे लागू हो सकते हैं।

या बाहर की जाँच करें नैनोनेट्स ओसीआर एपीआई कार्रवाई में और निर्माण कस्टम शुरू करते हैं ओसीआर मुक्त करने के लिए मॉडल!

अपडेट जुलाई 2022: यह पोस्ट मूल रूप से . में प्रकाशित हुआ था अक्टूबर 2020 और तब से अद्यतन किया गया है नियमित तौर पर.

ये रही एक स्लाइड इस लेख में निष्कर्षों का सारांश। यहाँ एक है वैकल्पिक संस्करण इस पोस्ट के।

समय टिकट: जुलाई 17, 2022जुलाई 18, 2022

समय टिकट: अप्रैल 10, 2023