ओसीआर और डीप लर्निंग प्लेटोब्लॉकचैन डेटा इंटेलिजेंस के साथ स्वचालित चालान प्रसंस्करण। लंबवत खोज। ऐ.

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

चाहते स्वचालित चालान प्रसंस्करण? नैनोनेट्स के पूर्व-प्रशिक्षित की जाँच करें चालान ओसीआर or अपना खुद का बनाओ अनुकूलित चालान ओसीआर। आप भी कर सकते हैं एक डेमो अनुसूची हमारे एपी उपयोग के मामलों के बारे में अधिक जानने के लिए!


परिचय

लंबे समय तक, हमने भुगतानों को संसाधित करने और खातों को बनाए रखने के लिए कागज के चालान पर भरोसा किया है। इनवॉइसिंग इनवॉइस आमतौर पर किसी को मैन्युअल रूप से कई इनवॉइस के माध्यम से ब्राउज़ करने और एक बही में नीचे चीजों को जॉट करने में खर्च करता है।

लेकिन क्या कागज, मानव श्रम और समय की कम बर्बादी के साथ इस प्रक्रिया को बेहतर, अधिक कुशलता से किया जा सकता है?

इन प्रक्रियाओं के माध्यम से मैन्युअल रूप से जाने की कई कमियों के बीच उच्च लागत, अधिक से अधिक जनशक्ति की आवश्यकता होती है, दोहराए जाने वाले कार्यों में अधिक समय और कार्बन फुटप्रिंट की अधिक मात्रा होती है।

एक चालान के डिजिटलीकरण की प्रक्रिया को 4 चरणों में तोड़ा जा सकता है:

  1. भौतिक दस्तावेज़ को डिजिटल संस्करण में परिवर्तित करना - इसके माध्यम से किया जा सकता है
    • इनवॉइस स्कैनिंग
    • एक कैमरे के माध्यम से एक छवि पर क्लिक करना
  2. सूचना निष्कर्षण - इसके द्वारा किया जा सकता है
    • मनुष्य - मैन्युअल रूप से समीक्षकों द्वारा किया जाता है जो त्रुटियों के लिए चालान का विश्लेषण करेगा, उसमें पाठ पढ़ें और भंडारण और भविष्य की पुनर्प्राप्ति के लिए एक सॉफ़्टवेयर में दर्ज करें।
    • मशीनें -
      • ऑप्टिकल चरित्र मान्यता - दस्तावेजों में मौजूद पाठ और संख्याओं को पहचानना।
      • सूचना निकालना - ओसीआर की प्रक्रिया पूरी हो जाने के बाद यह पहचानना महत्वपूर्ण है कि पाठ का कौन सा टुकड़ा किस निकाले गए क्षेत्र से मेल खाता है। यदि कोई फ़ील्ड कुल, उप-योग, चालान की तिथि, विक्रेता आदि है।
  3. डेटा डंप - एक बार जानकारी निकाले जाने के बाद इसे पुनर्प्राप्ति योग्य प्रारूप में संग्रहीत करने की आवश्यकता होती है, जैसे
    • एक डेटाबेस
    • एक एक्सेल शीट
    • एक ईआरपी प्रणाली।

यह पोस्ट ज्यादातर ओसीआर और सूचना निष्कर्षण पर केंद्रित है। इससे पहले कि हम ओसीआर की वर्तमान स्थिति और सूचना निष्कर्षण में क्या गलत है, इस पर विचार करें बीजक संसाधित करना, आइए सबसे पहले यह देखें कि हमें सबसे पहले इनवॉइस डिजिटाइजेशन की परवाह क्यों करनी चाहिए।


नैनोनेट्स सपोर्ट करता है चालान पकड़ना, चालान प्रबंधन & चालान स्वचालन 60 से अधिक भाषाओं में। अपना खुद का मॉडल बनाएं या आज एक डेमो का अनुरोध करें!


डिजिटाइज़ इनवॉइस क्यों?

डिजिटाइज़िंग जानकारी के कई फायदे हैं जो एक व्यवसाय कई आधारों पर प्राप्त कर सकता है। व्यवसाय अपनी प्रक्रियाओं को बेहतर तरीके से ट्रैक कर सकते हैं, बेहतर ग्राहक सेवा प्रदान कर सकते हैं, अपने कर्मचारियों की उत्पादकता में सुधार कर सकते हैं और लागत को कम कर सकते हैं।

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

यहां कुछ कारण दिए गए हैं कि आपको अपने खुद के व्यवसाय के लिए डिजिटाइज़िंग इनवॉइस पर क्यों विचार करना चाहिए।

  1. प्रक्रियाओं को स्वचालित करने के लिए
    गहन सीखने और ओसीआर के साथ, आप स्वचालित रूप से इन इनवॉइस छवियों को ले सकते हैं, उनमें से तालिकाओं और पाठ को निकाल सकते हैं, विभिन्न क्षेत्रों के मूल्यों को निकाल सकते हैं, त्रुटि सुधार कर सकते हैं, जांचें कि क्या उत्पाद आपके स्वीकार्य इन्वेंट्री से मेल खाते हैं और अंत में सब कुछ चेक होने पर दावे को संसाधित करते हैं। बीमा उद्योग ने परंपरागत रूप से जो किया है, उससे यह एक बड़ी छलांग है, लेकिन फिर भी यह बहुत फायदेमंद साबित हो सकता है।
  2. दक्षता बढ़ाने के लिए
    इनवॉइस को डिजिटाइज़ करके, कई प्रक्रियाओं को बहुत तेज़ और आसान बनाया जा सकता है। उदाहरण के लिए एक खुदरा स्टोर श्रृंखला लें जो हर महीने के अंत में वस्तुओं और प्रक्रिया भुगतान के लिए कुछ नियमित विक्रेताओं से संबंधित है। की प्रक्रिया को स्वचालित करके यह स्टोर बहुत समय बचा सकता है चालान प्रबंधन. विक्रेताओं को बस एक ऐप या वेबसाइट पर बिल अपलोड करने होते हैं और वे तुरंत प्रतिक्रिया प्राप्त कर सकते हैं कि क्या चित्र अच्छे रिज़ॉल्यूशन के हैं यदि छवि पूरे चालान की है, यदि छवि नकली है या डिजिटल रूप से हेरफेर की गई है, आदि से बहुत बचत होती है। समय।
  3. लागत कम करने के लिए
    वही रिटेल स्टोर्स की फ्रैंचाइज़ी OCR और डीप लर्निंग का उपयोग करके इनवॉइस डिजिटलीकरण को स्वचालित करके बहुत सारा पैसा बचाती है। एक चालान जिसे तीन समीक्षकों के हाथों से गुजरना पड़ता है ताकि कोई त्रुटि न हो, वह घटकर एक रह जाता है। कंप्यूटर द्वारा संसाधित किए गए चालानों की संख्या एक इंसान की तुलना में कई गुना तेज़ है। समय में यह जांचना शामिल है कि क्या चालान धोखाधड़ी है, क्या इसमें सभी जानकारी है, क्या सभी जानकारी सही है, सभी डेटा को स्प्रेडशीट या डेटाबेस में मैन्युअल रूप से दर्ज करना, गणना चलाना और अंत में भुगतान की प्रक्रिया करना शामिल है।
  4. बेहतर भंडारण के लिए
    विवादों के मामले में, विक्रेता ऐप तक पहुंच सकता है और वह सभी चालान के माध्यम से देख सकता है जिसे उसने अपलोड किया है और प्रत्येक चालान के पोस्ट-प्रोसेसिंग परिणाम, वस्तुओं, उनकी मात्रा, प्रत्येक की लागत, छूट और छूट की व्याख्या करता है। इस डेटा को डेटाबेस में दर्ज करने की प्रक्रिया को स्वचालित बनाने वाली कंपनी अब इस जानकारी को कभी भी प्राप्त कर सकती है।
  5. ग्राहकों की संतुष्टि बढ़ाने के लिए
    इसी तरह से चालान प्रसंस्करण से कंपनियों को अपनी ग्राहक सेवा में सुधार करने में भी मदद मिल सकती है। क्या ई-कॉमर्स प्लेटफॉर्म से आपकी डिलीवरी में कोई उत्पाद गायब है? उन तक पहुंचें, उन्हें चालान भेजें और बताएं कि क्या कमी है और कंपनी स्वचालित रूप से इसे पढ़ लेगी रसीद, पता लगाएं कि उनके गोदामों में क्या बचा है और आपको यह कहते हुए एक प्रतिक्रिया भेजें कि आपका लापता उत्पाद अब रास्ते में है!
  6. पारिस्थितिक पदचिह्न को कम करने के लिए
    कुछ सरल गणनाएँ जैसे की की गईं यहाँ उत्पन्न करें हम महसूस करते हैं कि एक महीने में 50000 चालान बनाने वाले एक मध्यम आकार के संगठन में एक वर्ष में 30 से अधिक पेड़ों की बलि दी जाती है। यह संख्या चालान के दोहराव के कारण बढ़ने वाली है। कागज की इसी मात्रा को भी निर्माण के लिए 2.5 मिलियन लीटर पानी की आवश्यकता होती है। ऐसे समय में, संगठनों द्वारा अपने पारिस्थितिक पदचिह्न को कम करने के लिए आवश्यक कदम उठाना पर्यावरण की मदद करने में एक लंबा रास्ता तय कर सकता है।

चालान प्रक्रिया का विकास

समय के साथ चालानों की समीक्षा की प्रक्रिया विकसित हुई है। प्रौद्योगिकी में वृद्धि ने तीन प्रमुख चरणों के माध्यम से चालान प्रसंस्करण की प्रक्रिया को देखा है।

चरण 1: मैनुअल समीक्षा

एक उपयोग के मामले पर विचार करें जहां एक संगठन अपने नियमित विक्रेताओं को महीने के खर्चों की प्रतिपूर्ति करने की प्रक्रिया से गुजर रहा है।

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

चालान की प्रक्रिया के लिए निम्नलिखित चरणों का पालन किया जाता है -

  1. लोगों से अपेक्षा की जाती है कि वे व्यक्तिगत रूप से संबंधित संगठन के संपर्क बिंदु पर कई चालान जमा करें।
  2. यह व्यक्ति एक समीक्षक के सभी चालानों को आगे बढ़ाएगा, जो पूरी तरह से हर दस्तावेज़ की समीक्षा करेगा। इसमें एक सॉफ्टवेयर में प्रत्येक विवरण लिखना या दर्ज करना शामिल है जैसे कि खरीदारी करने वाले व्यक्ति का नाम, खरीदी गई दुकान का नाम, खरीद की तारीख और समय, खरीदी गई वस्तुएं, उनकी लागत, छूट और कर।
  3. गणना किए गए प्रत्येक इनवॉइस का योग, मैन्युअल रूप से या यदि डेटा एंट्री सॉफ़्टवेयर विशेष रूप से लेखांकन उद्देश्यों के लिए डिज़ाइन किया गया है, तो उक्त सॉफ़्टवेयर का उपयोग करके।
  4. एक अंतिम बिल/रसीद अंतिम आंकड़ों के साथ किया जाता है और भुगतान संसाधित किए जाते हैं।

चरण 2: इनवॉइस स्कैनिंग और मैनुअल समीक्षा

ओसीआर तकनीकों के आगमन के साथ, बहुत समय स्वचालित रूप से बचाया गया था डिजिटल छवि से पाठ को निकालना किसी भी चालान या एक दस्तावेज की। यह वह जगह है जहां वर्तमान में स्वचालन के किसी भी रूप के लिए ओसीआर का उपयोग करने वाले अधिकांश संगठन हैं।

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना
  1. चालान की डिजिटल प्रतियां प्राप्त की जाती हैं स्कैनिंग चालान या कैमरे का उपयोग करके तस्वीरें लेना।
  2. RSI पाठ निकाला जाता है OCR का उपयोग करके इन चालानों से। यह डिजिटल टेक्स्ट प्रदान करने में सक्षम है जो डेटा प्रविष्टि को थोड़ा आसान बनाता है। लेकिन बहुत सारे काम अभी भी मैन्युअल रूप से किए जाने की आवश्यकता है।
  3. प्रत्येक चालान के ओसीआर परिणामों को प्रासंगिक डेटा खोजने और अप्रासंगिक डेटा को छोड़ने के लिए उचित रूप से पार्स किया जाना है।
  4. एक बार यह हो जाने के बाद, डेटा को एक सॉफ़्टवेयर में दर्ज करना होगा जो समीक्षक को उसके कार्य को आसान बनाने के लिए एक टेम्पलेट प्रदान करता है। यह टेम्प्लेट प्रत्येक उपयोग के मामले, संगठन और अधिकतर प्रत्येक भिन्न प्रकार के चालान के लिए अद्वितीय है। जबकि ओसीआर प्रक्रिया चालान प्रसंस्करण में मदद करती है, लेकिन ओसीआर के असंरचित परिणामों के कारण यह कई कठिन भागों को हल नहीं करती है।
  5. दर्ज किए गए डेटा को सही त्रुटियों के लिए मैन्युअल समीक्षा के माध्यम से रखा गया है। इस प्रक्रिया में कुछ समय लगता है क्योंकि यह वर्तमान में उपलब्ध ओसीआर टूल के खराब प्रदर्शन के कारण कई समीक्षकों के माध्यम से जाता है।
  6. अंत में, गणना की जाती है और भुगतान विवरण वित्त विभाग को भेज दिया जाता है।

कैसे करें बेहतर इनवॉइस डिजिटाइज?

ओसीआर और गहन शिक्षण का उपयोग करके, हमने मशीनों को बेहतर प्रदर्शन करने में सक्षम बनाया है और कुछ मामलों में मनुष्यों से भी बेहतर है।

डिजिटाइज़िंग चालान में कई मानव मॉडरेट चरण शामिल हैं:

  1. उपयोगकर्ता द्वारा लिए गए और अपलोड किए गए चालान की डिजिटल छवियां।
  2. आगे की प्रक्रिया के लिए फिट होने के लिए सत्यापित छवि - अच्छा रिज़ॉल्यूशन, छवि में दिखाई देने वाला सभी डेटा, सत्यापित दिनांक, आदि।
  3. धोखाधड़ी के लिए जाँच की गई छवियाँ।
  4. इन चित्रों में पाठ निकाला और सही प्रारूप में डाल दिया।
  5. टेक्स्ट डेटा टेबल, स्प्रेडशीट, डेटाबेस, बैलेंस शीट आदि में दर्ज किया गया।

चरण 3: डीप लर्निंग और ओसीआर

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

डीप लर्निंग एप्रोच में टेक्स्ट को पढ़ने और छवियों से संरचित और असंरचित जानकारी निकालने की विशेष समस्या में प्रगति देखी गई है। ऑप्टिकल कैरेक्टर रिकग्निशन टेक्नॉलॉजी के साथ मौजूदा डीप लर्निंग मेथड्स को मर्ज करके, कंपनियां और व्यक्ति इसकी प्रक्रिया को स्वचालित करने में सक्षम हो गए हैं दस्तावेजों का डिजिटलीकरण और आसान मैनुअल डेटा प्रविष्टि प्रक्रियाओं, बेहतर लॉगिंग और स्टोरेज, कम त्रुटियों और बेहतर प्रतिक्रिया समय को सक्षम किया।

इस तरह के कार्यों के लिए बाजार और ओपन-सोर्स समुदाय में कई उपकरण उपलब्ध हैं, सभी उनके पेशेवरों और विपक्षों के साथ। उनमें से कुछ Google विज़न एपीआई, अमेज़ॅन रिकॉग्निशन और माइक्रोसॉफ्ट कॉग्निटिव सर्विसेज हैं। सबसे अधिक इस्तेमाल किया जाने वाला ओपन-सोर्स उपकरण हैं ध्यान-ओसीआर और Tesseract.

ये सभी उपकरण एक ही तरीके से कम हो जाते हैं - खराब सटीकता जिसमें मैनुअल त्रुटि सुधार और निम्नलिखित के बाद नियम-आधारित इंजन की आवश्यकता होती है पाठ निष्कर्षण वास्तव में किसी भी सार्थक तरीके से डेटा का उपयोग करने में सक्षम होना चाहिए। हम इन समस्याओं के बारे में और आने वाले वर्गों में और अधिक बात करेंगे।

क्या समस्या को दिलचस्प बनाता है?

RSI ओसीआर परिदृश्य अधिकतर नियम-आधारित इंजन होते हैं, जो पैटर्न के मिलान के बाद OCR परिणामों पर बहुत अधिक निर्भर करते हैं या विशिष्ट टेम्पलेट्स को परिभाषित करते हैं जिन्हें OCR परिणाम में फिट होने के लिए मजबूर किया जाता है। इस दृष्टिकोण में कुछ सफलता मिली है लेकिन इसके लिए शीर्ष पर निर्मित सॉफ्टवेयर की एक परत की आवश्यकता होती है। ओसीआर इंजन जो एक संसाधन-खपत कार्य है।

इस नियम-आधारित दृष्टिकोण के साथ एक बड़ी समस्या यह है कि सॉफ़्टवेयर की इस अतिरिक्त परत को हर बार जब आप एक नए इनवॉइस टेम्पलेट के साथ काम कर रहे होते हैं, तब फिर से डिज़ाइन करना पड़ता है। ओसीआर के साथ-साथ टेंपलेटिंग प्रक्रिया को स्वचालित करना चालान के साथ काम करने वाले किसी भी व्यक्ति के लिए एक बड़ा प्रभाव पैदा कर सकता है।

और यही वह समस्या है जिस पर हम हैं नैनोनेट्स हल करने का संकल्प लिया।

इस समस्या के बारे में एक कम-ज्ञात दृष्टिकोण में मशीन सीखने का उपयोग करना शामिल है जिसमें दस्तावेज़ या संरचना की संरचना सीखने के लिए हमें डेटा के साथ काम करने की अनुमति है, उन क्षेत्रों को स्थानीय करें जिन्हें हमें पहले निकालने की आवश्यकता है जैसे कि हम एक वस्तु का पता लगाने की समस्या को हल कर रहे थे (और OCR नहीं) और फिर उसमें से टेक्स्ट प्राप्त करना। यह आपके तंत्रिका नेटवर्क को मॉडलिंग करके यह जानने के लिए किया जा सकता है कि टेबल को कैसे पहचाना जाए और कैसे निकाला जाए, इसमें मौजूद कॉलम और फील्ड को समझने के लिए, कौन से कॉलम और फील्ड को आमतौर पर इनवॉइस प्रारूप के बावजूद पाया जाता है।

इस तरह के दृष्टिकोण का लाभ यह है कि मशीन लर्निंग मॉडल बनाना संभव हो जाता है जिसे किसी भी तरह के दस्तावेज़ या चालान के लिए सामान्यीकृत किया जा सकता है और बिना किसी अनुकूलन के बॉक्स से बाहर किया जा सकता है। समय-समय पर नए डेटा को इकट्ठा करके और मॉडल को लगातार सीखने के लिए लूप को जोड़ने से डेटा की एक बड़ी विविधता पर शानदार प्रदर्शन हो सकता है।


मन में OCR समस्या है? चालान, पीडीएफ या नंबर प्लेट को डिजिटल बनाना चाहते हैं? वहां जाओ नैनोनेट्स और मुक्त करने के लिए ओसीआर मॉडल का निर्माण!


वर्तमान गहन शिक्षण उपकरण पर्याप्त क्यों नहीं हैं?

सभी लाभों के साथ भी स्वचालित चालान प्रसंस्करण की पेशकश करने के लिए, उद्योगों ने ओसीआर और गहन शिक्षण प्रौद्योगिकियों को व्यापक रूप से नहीं अपनाया है और इसके कई कारण हैं।

आइए एक उदाहरण से समझने की कोशिश करें - एक स्वास्थ्य बीमा कंपनी जो नुस्खे और चालान का काम करती है। उपयोगकर्ताओं को अपने फ़ोन या कंप्यूटर पर चालान की तस्वीरें अपलोड करने की सुविधा देकर आपकी बीमा कंपनी में दावा प्रसंस्करण को स्वचालित करना स्कैनिंग चालान ग्राहकों के लिए सुविधा में वृद्धि करेगा और उन्हें और अधिक आकर्षित करेगा। ये अपलोड की गई छवियां आम तौर पर मैन्युअल समीक्षा के कई दौरों से गुजरती हैं जहां आप सत्यापित करते हैं कि यदि संख्याएं जोड़ दी जाती हैं तो चालान वैध हैं, यह उत्पाद में उल्लिखित उत्पाद हैं प्राप्तियों बीमा दावे आदि के लिए मान्य हैं, लेकिन चालान प्रसंस्करण स्वचालन के साथ, इन कार्यों को मैन्युअल रूप से करने में लगने वाले समय के एक अंश में किया जा सकता है, और जनशक्ति में कम से कम 50% की कमी की आवश्यकता होती है।

लेकिन उद्योग के उपयोग के मामले में प्रदर्शन के अंत में इस तरह के अंत का निर्माण करने में बाधाएं हैं, ऑटोमेशन ड्राइव कर सकते हैं जबकि यह सुनिश्चित करते हैं कि त्रुटियां बजट का अधिक उपभोग नहीं करती हैं और ऑनबोर्डिंग की उच्च दर भी चला रही हैं।

OCR तकनीक की सटीकता

वर्तमान में, बाजार में उपलब्ध सर्वोत्तम ओसीआर उपकरण किसी भी उपयोग के मामले के लिए इन एपीआई को बड़े पैमाने पर लागू करने के लिए संतोषजनक प्रदर्शन नहीं करते हैं। इसके अनुसार लेख, Google विज़न, सबसे अच्छा ओसीआर एपीआई अभी उपलब्ध केवल 80% सटीकता प्रदान करने में सक्षम है। बाजार में अन्य उत्पादों की सटीकता अमेज़ॅन रेकग्निशन और Microsoft संज्ञानात्मक सेवाएँ निराशाजनक हैं। Microsoft ने 65% की सटीकता के साथ प्रदर्शन किया जबकि AWS मान्यता ने केवल 21% सटीकता के साथ प्रदर्शन किया।

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना
स्रोत

यह इस तथ्य से भी बदतर बना है कि ये एपीआई विशिष्ट डेटा के लिए कस्टम प्रशिक्षण के लिए अनुमति नहीं देते हैं जो कंपनी सबसे अधिक उपयोग कर रही होगी। सटीकता के संदर्भ में मनुष्यों की तुलना में खराब प्रदर्शन करने वाले सॉफ़्टवेयर में निवेश करना, फिर भी मैन्युअल प्रविष्टि, मैनुअल त्रुटि सुधार और मैनुअल समीक्षा की आवश्यकता होती है, जो समय और धन की बर्बादी की तरह लगता है।

गहन शिक्षण विशेषज्ञता

Google Vision जैसे OCR उत्पादों को कई कमियों का सामना करना पड़ता है जब उसे विभिन्न अभिविन्यासों, विभिन्न भाषाओं, छायादार या शोर वाले पाठ से निपटना पड़ता है। वे आपको अपने डेटा का उपयोग करने और कस्टम मॉडल बनाने की अनुमति नहीं देते हैं, जिससे किसी संगठन के वर्कफ़्लो में उत्पाद का सीधा एकीकरण मुश्किल हो जाता है। कई बार, इस तरह की समस्या से निपटने के लिए, संगठनों को डेटा साइंस या मशीन लर्निंग टीम को नियुक्त करना पड़ता है और अपने लिए ये उपकरण बनाने पड़ते हैं। इसमें समय, पैसा और प्रयास लगता है।

इसके बाद, डेटा वैज्ञानिकों को कंपनी के लक्ष्यों के साथ अपने ज्ञान और विशेषज्ञता को संरेखित करना होगा और यह पता लगाना होगा कि उन परिणामों को देने के लिए क्या मेट्रिक्स ऑप्टिमाइज़ करना है। इसके लिए डेटा वैज्ञानिक को व्यावसायिक प्रस्ताव को समझने, गणितीय समस्या में बदलने, कंपनी SLAs को समझने, सही डेटा खोजने, मशीन लर्निंग मॉडल बनाने की आवश्यकता होती है, यह सुनिश्चित करने के लिए उन्हें ट्यून करते हैं कि त्रुटि के मामलों को इनायत से नियंत्रित किया जाता है। ।

सही डेटा मिल रहा है

सही मशीन लर्निंग मॉडल बनाने का एक बहुत ही महत्वपूर्ण हिस्सा सही डेटा ढूंढना है, और हमारे पास काम करने के लिए पर्याप्त डेटा नहीं है। नंबर प्लेट पहचान या लिखावट पहचान जैसे कार्यों के लिए ओसीआर के लिए डेटासेट उपलब्ध हैं, लेकिन ये डेटासेट उस तरह की सटीकता प्राप्त करने के लिए पर्याप्त नहीं हैं, जिसकी बीमा दावा प्रसंस्करण या विक्रेता पुनर्भुगतान असाइनमेंट के लिए आवश्यकता होती है।

इन उपयोग के मामलों के लिए हमें अपने मॉडल बनाने और उन्हें उस तरह के डेटा पर प्रशिक्षित करने की आवश्यकता होती है, जिस पर हम सबसे अधिक काम करने जा रहे हैं, जबकि यह भी सुनिश्चित करते हैं कि त्रुटियां कम से कम हों और डेटासेट संतुलित हो। व्यवहार करना, मान लीजिए डॉक्टरों के नुस्खे या प्राप्तियों छोटे विक्रेताओं से हमारे मॉडलों को डिजिटल और हस्तलिखित पाठ दस्तावेज़ों पर अच्छा प्रदर्शन करने की आवश्यकता होती है।

कम्प्यूटेशनल संसाधन

एक इन-हाउस एमएल समाधान के निर्माण में एल्गोरिदम को सर्वोत्तम सटीकता के साथ डिजाइन करने के लिए सिर्फ सर्वश्रेष्ठ मशीन लर्निंग इंजीनियरों को काम पर रखने से अधिक शामिल है। छवि डेटा पर मॉडल के निर्माण के लिए कम्प्यूटेशनल आवश्यकताएं अधिक हैं और आमतौर पर इसमें या तो आधार पर या क्लाउड पर जीपीयू शामिल हैं। Google क्लाउड प्लेटफ़ॉर्म पर के -80 जीपीयू इंस्टेंस चलाने पर प्रति माह लगभग 230 डॉलर का खर्च आता है। ये लागत तब बढ़ जाती है जब आपको मॉडल को प्रशिक्षित करना होता है या नए डेटा के साथ पुराने मॉडल को फिर से बनाना होता है।

यदि इन-हाउस सॉल्यूशन का निर्माण आपके द्वारा चुना गया दृष्टिकोण है, तो इसके निर्माण की लागतों पर हस्ताक्षर करने वाले ग्राहकों की बढ़ी हुई राशि, प्रसंस्करण चालानों की बढ़ी हुई दर और आवश्यक मैनुअल समीक्षकों की संख्या में कमी के द्वारा मुआवजा दिया जाना चाहिए।

अपने व्यापार की जरूरतों के लिए समाधान का समाधान

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

उदाहरण के लिए, वेंडर पुनर्भुगतान प्रणाली का निर्माण, हमें कई चरणों को शामिल करने की आवश्यकता है। अपनी संगठनात्मक आवश्यकताओं के लिए एक वर्कफ़्लो ढूँढना मशीन सीखने के मॉडल के निर्माण के समान नहीं है जो आपको अच्छी सटीकता देगा।

आपको जो चाहिए वह है मॉडल:

  1. कम से कम मानव-स्तरीय सटीकता प्रदान करें
  2. सभी प्रकार के डेटा को संभाल सकते हैं
  3. स्थिर त्रुटि से निपटने
  4. मानव पर्यवेक्षण की सुविधा बढ़ाएँ
  5. डेटा प्रोसेसिंग चरणों में पारदर्शिता प्रदान करें
  6. धोखाधड़ी के लिए जाँच करें
  7. OCR परिणामों को पोस्ट-प्रोसेस करने की अनुमति दें ताकि उन्हें एक संरचना में रखा जा सके
  8. यह सुनिश्चित करने की अनुमति दें कि सभी आवश्यक फ़ील्ड हैं और मान सही हैं
  9. इस डेटा के आसान भंडारण और डेटाबेसिंग की अनुमति दें
  10. परिणामों के आधार पर अधिसूचना प्रक्रियाओं को स्वचालित करने की अनुमति दें

यह है, जैसा कि आप अनुमान लगा सकते हैं, एक लंबी और कठिन प्रक्रिया, अक्सर सीधे आगे के समाधान के साथ नहीं।


नैनोनेट्स सपोर्ट करता है चालान पकड़ना & चालान स्वचालन 60 से अधिक भाषाओं में। अपना खुद का मॉडल बनाएं या आज एक डेमो का अनुरोध करें!


नैनोनेट्स डालें

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

- नैनोनेट्स आपको मशीन लर्निंग टैलेंट खोजने, मॉडल बनाने, क्लाउड इंफ्रास्ट्रक्चर या तैनाती को समझने की चिंता करने की जरूरत नहीं है। आपको बस एक व्यावसायिक समस्या है जिसके समाधान की आवश्यकता है।

वेब-आधारित GUI का उपयोग करना आसान है

नैनोनेट वेब आधारित जीयूआई का उपयोग करने के लिए एक आसान प्रदान करता है जो उनके एपीआई के साथ संचार करता है और आपको मॉडल बनाने देता है, उन्हें आपके डेटा पर प्रशिक्षित करता है, सटीक और सटीकता जैसे महत्वपूर्ण मैट्रिक्स प्राप्त करता है और किसी भी कोड को लिखे बिना, आपकी छवियों पर आक्षेप करता है।

क्लाउड-होस्टेड मॉडल

समाधान प्राप्त करने के लिए सीधे उपयोग किए जाने वाले कई मॉडल प्रदान करने के अलावा, उपयोगकर्ता अपने मॉडल का निर्माण कर सकते हैं जो क्लाउड पर होस्ट किए जाते हैं और अनुमान उद्देश्यों के लिए एपीआई अनुरोध के साथ एक्सेस किए जा सकते हैं। प्रशिक्षण के लिए GCP उदाहरण या GPU प्राप्त करने के बारे में चिंता करने की कोई आवश्यकता नहीं है।

अत्याधुनिक एल्गोरिदम

निर्मित मॉडल आपको सर्वोत्तम परिणाम प्राप्त करने के लिए अत्याधुनिक एल्गोरिदम का उपयोग करते हैं। ये मॉडल लगातार अधिक और बेहतर डेटा और बेहतर तकनीक, बेहतर आर्किटेक्चर डिजाइन और अधिक मजबूत हाइपरपैरेट सेटिंग्स के साथ बेहतर बनने के लिए विकसित होते हैं।

क्षेत्र निष्कर्षण

चालान डिजिटलीकरण उत्पाद के निर्माण में सबसे बड़ी चुनौती निकाले गए पाठ को संरचना देना है। यह हमारे ओसीआर एपीआई द्वारा आसान बना दिया जाता है जो मूल्यों के साथ सभी आवश्यक क्षेत्रों को स्वचालित रूप से निकालता है और उन्हें आसानी से एक्सेस करने और बनाने के लिए आपको एक टेबल या जेएसएन प्रारूप में डालता है।

स्वचालन चालित

हम नैनोनेट्स का मानना ​​है कि चालान डिजिटलीकरण जैसी स्वचालित प्रक्रियाओं से मौद्रिक लाभ, ग्राहक संतुष्टि और कर्मचारी संतुष्टि के मामले में आपके संगठन पर व्यापक प्रभाव पड़ सकता है। नैनोनेट्स मशीन लर्निंग को सर्वव्यापी बनाने का प्रयास करता है और उस अंत तक, हमारा लक्ष्य आपके द्वारा हल की गई किसी भी व्यावसायिक समस्या को कम से कम मानवीय पर्यवेक्षण और बजट की आवश्यकता है।

नैनोसेट्स के साथ ओसीआर

RSI नैनोनेट्स प्लेटफॉर्म आपको आसानी से ओसीआर मॉडल बनाने की अनुमति देता है। आप अपना डेटा अपलोड कर सकते हैं, उसे एनोटेट कर सकते हैं, मॉडल सेट कर सकते हैं कि ट्रेन के लिए और एक ब्राउज़र आधारित यूआई के माध्यम से भविष्यवाणियां प्राप्त कर सकते हैं, कोड की एक भी लाइन लिखे बिना, GPU के बारे में चिंता करने या अपने गहरे सीखने के मॉडल के लिए सही आर्किटेक्चर खोजने के लिए।

अद्यतन: हमारे मॉडल और भी अधिक सटीक हैं। हमने आपको और बेहतर बनाने के लिए पीओ नंबर, ईमेल आईडी और टेबल एक्सट्रैक्शन जैसे नए फ़ील्ड जोड़े हैं चालान स्वचालन workflows.

नैनोसेट के साथ डिजिटाइज़िंग चालान शुरू करें - 1 डिजिटलीकरण पर क्लिक करें:

OCR और डीप लर्निंग के साथ ऑटोमेशन प्रोसेसिंग को स्वचालित करना

एक डेमो सेट करें

यह जानने के लिए कि इस समस्या को हल करने में नैनोनेट कैसे आपकी मदद कर सकता है, यह जानने के लिए एक डेमो सेट करें


‌‌

इसके अलावा पढ़ना

अपडेट:
ओसीआर और डीप लर्निंग का उपयोग करके इनवॉइस प्रोसेसिंग को स्वचालित करने में विभिन्न दृष्टिकोणों के बारे में अधिक पठन सामग्री जोड़ी गई।

समय टिकट:

से अधिक एअर इंडिया और मशीन लर्निंग