ফর্ম তথ্য নিষ্কাশন

প্লেটো দ্বারা প্রকাশিত

অনুসরণকারী: 0

ফর্ম তথ্য নিষ্কাশন

মুদ্রিত বা হাতে লেখা ফর্ম থেকে ডেটা বের করতে চান? চেক আউট ন্যানোনেটস™ ফর্ম ডেটা এক্সট্র্যাক্টর বিনামূল্যে এবং যে কোনো ফর্ম থেকে তথ্য রপ্তানি স্বয়ংক্রিয় জন্য!

রূপ সর্বত্র আছে; এগুলিকে একটি নির্দিষ্ট বিন্যাসে প্রয়োজনীয় তথ্য পূরণ করতে অংশগ্রহণকারীদের জিজ্ঞাসা করে তথ্য সংগ্রহের জন্য তৈরি করা নথি হিসাবে সংজ্ঞায়িত করা হয়। অল্প সময়ের মধ্যে প্রচুর ডেটা সংগ্রহ করার ক্ষমতার কারণে তারা সহায়ক। যাইহোক, সমস্ত ফর্মের ডেটা সংগ্রহ করার ক্ষমতা একই থাকে না এবং প্রায়ই পরে ম্যানুয়াল কাজের প্রয়োজন হয়। অতএব, ফর্ম ডেটা নিষ্কাশনের প্রক্রিয়াটিকে বুদ্ধিমত্তার সাথে স্বয়ংক্রিয় করতে আমরা সরঞ্জাম এবং অ্যালগরিদমের উপর নির্ভর করি। এই ব্লগ পোস্টটি ওসিআর এবং ডিপ লার্নিং ব্যবহার করে ফর্মগুলি থেকে ডেটা বের করার জন্য বিভিন্ন পরিস্থিতিতে এবং কৌশলগুলিতে গভীরভাবে ডুব দেবে।

ফর্ম ডেটা নিষ্কাশন কি?
কি সমস্যাকে চ্যালেঞ্জিং করে তোলে?
ফর্ম নিষ্কাশন সমস্যার গভীরতা
কিভাবে ফর্ম ডেটা নিষ্কাশন সমাধান বিকশিত হয়েছে?
OCR ব্যবহার করে ফর্ম ডেটা এক্সট্রাকশন
গভীর শিক্ষা ব্যবহার করে ফর্ম ডেটা নিষ্কাশন সমাধান করা
ন্যানোনেটস প্রবেশ করান

ফর্ম ডেটা নিষ্কাশন কি?

ফর্ম ডেটা এক্সট্রাকশন হল ফর্মগুলি থেকে ডেটা বের করার প্রক্রিয়া - অনলাইন এবং অফলাইন উভয়ই৷ এই ডেটা যে কোনও ফর্ম্যাটে পাওয়া যেতে পারে, সাধারণত প্রাসঙ্গিক তথ্য সহ একটি ফর্ম থাকে৷ যাইহোক, এই ডেটা বের করা সবসময় সহজ কাজ নয় কারণ অনেক লেআউট এবং ডিজাইন সহজে পাঠ্য নির্বাচন করার অনুমতি দেয় না। তাদের থেকে ডেটা অনুলিপি করার কোন স্থানীয় উপায় নেই। অতএব, আমরা আরও কার্যকর এবং কম ত্রুটি-প্রবণ ফর্মগুলি থেকে ডেটা বের করতে সহায়তা করার জন্য স্বয়ংক্রিয় কৌশলগুলির উপর নির্ভর করি।

ফর্ম তথ্য নিষ্কাশন কি?

উদাহরণস্বরূপ, আজ, অনেক ব্যবহারকারী যোগাযোগের তথ্য সংগ্রহ করতে PDF-ভিত্তিক ফর্মের উপর নির্ভর করে। এটি তথ্য সংগ্রহের একটি অত্যন্ত কার্যকর উপায় কারণ এটি প্রেরক এবং প্রাপককে ইনপুট প্রদানের প্রয়োজন হয় না। কিন্তু পিডিএফ ফর্ম থেকে এই ডেটা বের করা চ্যালেঞ্জিং এবং ব্যয়বহুল হতে পারে।

এখানে, ফর্ম ডেটা এক্সট্রাকশন পিডিএফ ফর্ম থেকে ডেটা বের করতে সাহায্য করতে পারে, যেমন নাম, ইমেল ঠিকানা, ফোন নম্বর, ইত্যাদি। এটি এক্সেল, শীট বা অন্য কোনও কাঠামোগত বিন্যাসের মতো অন্য অ্যাপ্লিকেশনে আমদানি করা যেতে পারে। এটি যেভাবে কাজ করে তা হল নিষ্কাশন সরঞ্জামগুলি পিডিএফ ফাইলের উপর পড়ে, স্বয়ংক্রিয়ভাবে এটির যা প্রয়োজন তা বের করে এবং এটিকে সহজে-পঠন বিন্যাসে সংগঠিত করে। এই ডেটা এক্সেল, CSV, JSON এবং অন্যান্য ভাল-গঠিত ডেটা ফর্ম্যাটের মতো অন্যান্য ফর্ম্যাটে রপ্তানি করা যেতে পারে। পরবর্তী বিভাগে, আসুন ফর্ম ডেটা নিষ্কাশন অ্যালগরিদম তৈরি করার সময় প্রায়শই সম্মুখীন হওয়া কিছু চ্যালেঞ্জের দিকে নজর দেওয়া যাক।

মুদ্রিত বা হাতে লেখা ফর্ম থেকে ডেটা বের করতে চান? Nanonets চেক আউট™ ফর্ম ডেটা এক্সট্র্যাক্টর বিনামূল্যে এবং যেকোনো ফর্ম থেকে তথ্য রপ্তানি স্বয়ংক্রিয়!

কি ফর্ম ডেটা নিষ্কাশন চ্যালেঞ্জিং করে তোলে?

বিভিন্ন কারণে ডেটা নিষ্কাশন একটি উত্তেজনাপূর্ণ সমস্যা। একটির জন্য, এটি একটি চিত্র শনাক্তকরণ সমস্যা, তবে এটিকে চিত্রটিতে উপস্থিত হতে পারে এমন পাঠ্য এবং ফর্মের বিন্যাসকেও বিবেচনা করতে হবে, যা একটি অ্যালগরিদম তৈরি করাকে আরও জটিল করে তোলে৷ এই বিভাগটি ডেটা নিষ্কাশন অ্যালগরিদম তৈরি করার সময় লোকেরা যে সাধারণ চ্যালেঞ্জগুলির মুখোমুখি হয় সেগুলি নিয়ে আলোচনা করে৷

ডেটার অভাব: ডেটা এক্সট্রাকশন অ্যালগরিদমগুলি সাধারণত শক্তিশালী গভীর শিক্ষা এবং কম্পিউটার ভিশন-ভিত্তিক অ্যালগরিদম ব্যবহার করে তৈরি করা হয়। এগুলি সাধারণত অত্যাধুনিক কর্মক্ষমতা অর্জনের জন্য প্রচুর পরিমাণে ডেটার উপর নির্ভর করে। এইভাবে, একটি সামঞ্জস্যপূর্ণ এবং নির্ভরযোগ্য ডেটাসেট খুঁজে পাওয়া এবং সেগুলিকে প্রক্রিয়াকরণ করা ডেটা নিষ্কাশন সরঞ্জাম বা সফ্টওয়্যারের যে কোনও ফর্মের জন্য অত্যন্ত গুরুত্বপূর্ণ। উদাহরণস্বরূপ, বলুন যে আমাদের একাধিক টেমপ্লেট সহ ফর্ম রয়েছে, তাহলে এই অ্যালগরিদমগুলি বিস্তৃত ফর্মগুলি বুঝতে সক্ষম হওয়া উচিত; তাই তাদের একটি শক্তিশালী ডেটাসেটে প্রশিক্ষণ দিলে আরও সঠিক কর্মক্ষমতা থাকবে।
হরফ, ভাষা এবং লেআউট পরিচালনা করা: বিভিন্ন ধরণের ফর্ম ডেটার জন্য উপলব্ধ বিভিন্ন টাইপফেস, ডিজাইন এবং টেমপ্লেটের চমকপ্রদ পরিমাণ রয়েছে৷ এগুলি বেশ কয়েকটি সম্পূর্ণ ভিন্ন শ্রেণীবিভাগের মধ্যে পড়তে পারে, যা বিবেচনায় নেওয়ার জন্য প্রচুর পরিমাণে বিভিন্ন চরিত্রের ধরন থাকলে সঠিক স্বীকৃতি নিশ্চিত করা চ্যালেঞ্জিং করে তোলে। তাই ফন্ট সংগ্রহকে একটি নির্দিষ্ট ভাষা এবং টাইপের মধ্যে সীমাবদ্ধ করা গুরুত্বপূর্ণ কারণ এটি অনেকগুলি প্রক্রিয়া তৈরি করবে যা আপনার কাছে সেই নথিগুলি যথাযথভাবে প্রক্রিয়া করার পরে মসৃণভাবে প্রবাহিত হবে। বহুভাষিক ক্ষেত্রে, একাধিক ভাষার অক্ষরগুলির মধ্যে ধাক্কাধাক্কির জন্য প্রস্তুত থাকতে হবে এবং জটিল টাইপোগ্রাফির যত্ন নিতে হবে।

চিত্র উত্স: মধ্যম

ওরিয়েন্টেশন এবং স্কু (ঘূর্ণন): ডেটা কিউরেশনের সময়, আমরা প্রায়ই ইনপুট ডেটা সংগ্রহের জন্য অ্যালগরিদম প্রশিক্ষণের জন্য চিত্রগুলি স্ক্যান করি। আপনি যদি কখনও একটি স্ক্যানার বা ডিজিটাল ক্যামেরা ব্যবহার করে থাকেন, তাহলে আপনি লক্ষ্য করেছেন যে আপনি যে কোণে নথির ছবিগুলি ক্যাপচার করেন তা কখনও কখনও সেগুলিকে তির্যক দেখাতে পারে। এটি তির্যকতা হিসাবে পরিচিত যা কোণের ডিগ্রি বোঝায়। এই তির্যকতা মডেলের নির্ভুলতা কমাতে পারে। সৌভাগ্যবশত, আমাদের সফ্টওয়্যার কীভাবে চিত্রের নির্দিষ্ট অঞ্চলে বৈশিষ্ট্যগুলি সনাক্ত করে তা পরিবর্তন করে এই সমস্যার সমাধান করতে বিভিন্ন কৌশল ব্যবহার করা যেতে পারে। এই জাতীয় কৌশলের একটি উদাহরণ হল প্রজেকশন প্রোফাইল পদ্ধতি বা ফুরিয়ার ট্রান্সফরমেশন পদ্ধতি, যা আকার, মাত্রা এবং টেক্সচার স্বীকৃতিতে অনেক পরিষ্কার ফলাফলের জন্য অনুমতি দেয়! যদিও অভিযোজন এবং তির্যকতা সাধারণ ভুল হতে পারে, তবে এগুলি বড় সংখ্যায় মডেলের নির্ভুলতাকে প্রভাবিত করতে পারে।

চিত্র উত্স: পাইইমেজসার্চ

তথ্য নিরাপত্তা: আপনি যদি ডেটা সংগ্রহের জন্য বিভিন্ন উত্স থেকে ডেটা আহরণ করেন, তাহলে নিরাপত্তা ব্যবস্থাগুলি সম্পর্কে সচেতন হওয়া গুরুত্বপূর্ণ৷ অন্যথায়, আপনি স্থানান্তর করা তথ্যের সাথে আপস করার ঝুঁকি নেবেন। এটি এমন পরিস্থিতির দিকে নিয়ে যেতে পারে যেখানে ব্যক্তিগত তথ্য লঙ্ঘন করা হয় বা একটি API এ পাঠানো তথ্য নিরাপদ নয়। অতএব, ডেটা নিষ্কাশনের জন্য ETL স্ক্রিপ্ট এবং অনলাইন এপিআইগুলির সাথে কাজ করার সময়, একজনকে অবশ্যই ডেটা সুরক্ষা সংক্রান্ত সমস্যা সম্পর্কে সচেতন হতে হবে।
টেবিল এক্সট্রাকশন: কখনও কখনও, আমরা টেবিলের ভিতরে ফর্ম ডেটা দেখতে পাই; একটি শক্তিশালী অ্যালগরিদম তৈরি করা যা ফর্ম নিষ্কাশন এবং টেবিল নিষ্কাশন উভয়ই পরিচালনা করতে পারে চ্যালেঞ্জিং হতে পারে। স্বাভাবিক পদ্ধতি হল এই অ্যালগরিদমগুলিকে স্বাধীনভাবে তৈরি করা এবং সেগুলিকে ডেটাতে প্রয়োগ করা, তবে এটি আরও গণনা শক্তির ব্যবহারকে নেতৃত্ব দেবে যা খরচ বাড়ায়। অতএব, একটি আদর্শ ফর্ম নিষ্কাশন একটি প্রদত্ত নথি থেকে ফর্ম-ডেটা এবং ডেটা উভয়ই বের করতে সক্ষম হওয়া উচিত।

চিত্র উত্স: জিসিএন

পোস্ট প্রসেসিং/এক্সপোর্টিং আউটপুট: কোনো ডেটা নিষ্কাশন থেকে আউটপুট ডেটা সোজা নয়। অতএব, বিকাশকারীরা ফলাফলগুলিকে আরও কাঠামোগত বিন্যাসে ফিল্টার করতে পোস্ট-প্রসেসিং কৌশলগুলির উপর নির্ভর করে। ডেটা প্রক্রিয়াকরণের পরে, এটি CSV, Excel, বা একটি ডাটাবেসের মতো আরও কাঠামোগত বিন্যাসে রপ্তানি করা হয়। সংস্থাগুলি এই প্রক্রিয়াটিকে স্বয়ংক্রিয় করার জন্য তৃতীয় পক্ষের সংহতকরণের উপর নির্ভর করে বা APIs বিকাশ করে, যা আবার সময়সাপেক্ষ। সুতরাং, আদর্শ ডেটা নিষ্কাশন অ্যালগরিদমগুলি নমনীয় এবং বহিরাগত ডেটাসোর্সের সাথে যোগাযোগ করা সহজ হওয়া উচিত।

ফর্ম ডেটা এক্সট্রাকশনে পোস্ট-প্রসেসিং

বিভিন্ন পরিস্থিতি সহ ফর্ম নিষ্কাশনের গভীরতা বোঝা

এখন পর্যন্ত, আমরা ফর্ম ডেটা নিষ্কাশনের মৌলিক এবং চ্যালেঞ্জগুলি নিয়ে আলোচনা করেছি। এই বিভাগে, আমরা বিভিন্ন পরিস্থিতিতে গভীরভাবে ডুব দেব এবং ফর্ম ডেটা নিষ্কাশনের গভীরতা বুঝতে পারব। আমরা কীভাবে এই নির্দিষ্ট পরিস্থিতিতে নিষ্কাশন প্রক্রিয়া স্বয়ংক্রিয় করতে পারি তাও দেখব।

দৃশ্য #1: অফলাইন ফর্মের জন্য হাতে লেখা স্বীকৃতি

অফলাইন ফর্ম সাধারণত দৈনন্দিন জীবনে সম্মুখীন হয়. ফর্মগুলি পূরণ করা এবং জমা দেওয়া সহজ হওয়ার জন্য এটি অপরিহার্য। অফলাইন ফর্মগুলিকে ম্যানুয়ালি ডিজিটালাইজ করা একটি ব্যস্ত এবং ব্যয়বহুল কাজ হতে পারে, যে কারণে গভীর শিক্ষার অ্যালগরিদম প্রয়োজন৷ হস্তলিখিত নথিগুলি হস্তলিখিত অক্ষরগুলির জটিলতার কারণে ডেটা বের করার জন্য একটি বড় চ্যালেঞ্জ। অতএব, ডেটা শনাক্তকরণ অ্যালগরিদমগুলি ব্যাপকভাবে ব্যবহৃত হয় যার দ্বারা একটি মেশিন হাতে লেখা পাঠ্য পড়তে এবং ব্যাখ্যা করতে শেখে। প্রক্রিয়াটিতে হাতে লেখা শব্দের ছবি স্ক্যান করা এবং সেগুলিকে ডেটাতে রূপান্তর করা জড়িত যা একটি অ্যালগরিদম দ্বারা প্রক্রিয়া করা এবং বিশ্লেষণ করা যেতে পারে। অ্যালগরিদম তারপর স্ট্রোকের উপর ভিত্তি করে একটি অক্ষর মানচিত্র তৈরি করে এবং পাঠ্যটি বের করার জন্য সংশ্লিষ্ট অক্ষরগুলিকে স্বীকৃতি দেয়।

চিত্র উত্স: NSIT ডেটাসেট

পরিস্থিতি #2: ফর্মগুলিতে চেকবক্স সনাক্তকরণ

চেকবক্স ফর্মগুলি হল ডেটা ইনপুটের একটি ফর্ম যা একটি ইনপুট ক্ষেত্রে ব্যবহারকারীর কাছ থেকে তথ্য সংগ্রহ করতে ব্যবহৃত হয়। এই ধরনের ডেটা সাধারণত তালিকা এবং সারণিতে পাওয়া যায় যাতে ব্যবহারকারীকে এক বা একাধিক আইটেম নির্বাচন করতে হয়, যেমন আইটেম তারা যোগাযোগ করতে চায়। এটি যেকোনো স্থানে পাওয়া যাবে- অনলাইন ফর্ম, প্রশ্নাবলী এবং সমীক্ষা ইত্যাদি। আজ, কিছু অ্যালগরিদম এমনকি চেকবক্স থেকে ডেটা নিষ্কাশন প্রক্রিয়া স্বয়ংক্রিয় করতে পারে। এই অ্যালগরিদমের প্রাথমিক লক্ষ্য হল কম্পিউটার ভিশন কৌশল ব্যবহার করে ইনপুট অঞ্চলগুলি সনাক্ত করা। এর মধ্যে রেখাগুলি সনাক্ত করা (অনুভূমিক এবং উল্লম্ব), ফিল্টার প্রয়োগ করা, কনট্যুর এবং চিত্রগুলিতে প্রান্ত সনাক্ত করা জড়িত। ইনপুট অঞ্চল চিহ্নিত করার পরে, চিহ্নিত বা অচিহ্নিত চেকবক্স বিষয়বস্তুগুলি বের করা সহজ।

ফর্ম তথ্য নিষ্কাশন চেকবক্স সনাক্তকরণ

দৃশ্যকল্প #3: সময়ে সময়ে ফর্মের লেআউট পরিবর্তন

যখন ফর্ম পূরণ করার কথা আসে, তখন সাধারণত দুটি ভিন্ন ধরনের বিকল্প থাকে। কিছু ফর্মের জন্য, আমাদের সমস্ত প্রাসঙ্গিক ক্ষেত্রে লিখে আমাদের তথ্য প্রদান করতে হবে, অন্যদের জন্য, আমরা কয়েকটি চেকবক্স থেকে নির্বাচন করে তথ্য প্রদান করতে পারি। ফর্মের ধরন এবং এর প্রেক্ষাপটের উপর নির্ভর করে ফর্মের বিন্যাসও পরিবর্তিত হয়। অতএব, একটি অ্যালগরিদম তৈরি করা অপরিহার্য যা একাধিক অসংগঠিত নথি পরিচালনা করতে পারে এবং ফর্ম লেবেলের উপর নির্ভর করে বুদ্ধিমানের সাথে সামগ্রী বের করতে পারে। ডকুমেন্ট লেআউটগুলি পরিচালনা করার জন্য গভীর শিক্ষার আর্কিটেকচারের একটি জনপ্রিয় কৌশল হল গ্রাফ সিএনএন। গ্রাফ কনভোলিউশনাল নেটওয়ার্ক (GCNs) এর পিছনে ধারণা হল নিউরন অ্যাক্টিভেশনগুলি ডেটা-চালিত হয় তা নিশ্চিত করা। এগুলি গ্রাফগুলিতে কাজ করার জন্য ডিজাইন করা হয়েছে, যা নোড এবং প্রান্তগুলির সমন্বয়ে গঠিত। একটি গ্রাফ কনভোলিউশনাল স্তর একটি টাস্ক-নির্দিষ্ট প্রশিক্ষণ সংকেতের অনুপস্থিতিতে নিদর্শনগুলি সনাক্ত করতে সক্ষম। অতএব, ডেটা শক্তিশালী হলে এগুলি উপযুক্ত।

দৃশ্যকল্প #4: টেবিল সেল সনাক্তকরণ

কিছু ক্ষেত্রে, ব্যবসায়গুলি টেবিল কোষ সমন্বিত বিশেষ ধরনের ফর্ম জুড়ে আসে। টেবিল সেলগুলি একটি টেবিলের ভিতরে আয়তক্ষেত্রাকার এলাকা যেখানে ডেটা সংরক্ষণ করা হয়। এগুলিকে হেডার, সারি বা কলাম হিসাবে শ্রেণীবদ্ধ করা যেতে পারে। একটি আদর্শ অ্যালগরিদমের এই সমস্ত ধরণের কোষ এবং তাদের সীমানা চিহ্নিত করা উচিত তাদের থেকে ডেটা বের করার জন্য। টেবিল নিষ্কাশনের জন্য কিছু জনপ্রিয় কৌশলগুলির মধ্যে রয়েছে স্ট্রিম এবং ল্যাটিস; এগুলি হল অ্যালগরিদম যা চিত্রগুলিতে সাধারণ আইসোমরফিক অপারেশনগুলি ব্যবহার করে লাইন, আকার, বহুভুজ সনাক্ত করতে সহায়তা করতে পারে।

কিভাবে ফর্ম ডেটা নিষ্কাশন সমাধান বিকশিত হয়েছে?

ফর্ম ডেটা নিষ্কাশনের উৎপত্তি প্রাক-কম্পিউটার দিনগুলিতে যখন লোকেরা কাগজের ফর্মগুলি পরিচালনা করত। কম্পিউটিংয়ের আবির্ভাবের সাথে সাথে ইলেকট্রনিকভাবে ডেটা সংরক্ষণ করা সম্ভব হয়ে ওঠে। কম্পিউটার প্রোগ্রামগুলি রিপোর্ট তৈরি করতে ডেটা ব্যবহার করতে পারে, যেমন বিক্রয় পরিসংখ্যান। এই সফ্টওয়্যারটি মেইলিং লেবেল যেমন গ্রাহকদের নাম এবং ঠিকানা প্রিন্ট করতে এবং চালান প্রিন্ট করতে ব্যবহার করা যেতে পারে, যেমন বকেয়া পরিমাণ এবং যে ঠিকানায় এটি পাঠানো উচিত। যাইহোক, আজ আমরা ফর্ম ডেটা নিষ্কাশন সফ্টওয়্যারটির একটি ভিন্ন সংস্করণ দেখতে পাচ্ছি; এগুলি অত্যন্ত নির্ভুল, দ্রুত এবং অত্যন্ত সংগঠিত এবং কাঠামোগতভাবে ডেটা সরবরাহ করে৷ এখন, সংক্ষিপ্তভাবে বিভিন্ন ধরনের ফর্ম ডেটা নিষ্কাশন কৌশল নিয়ে আলোচনা করা যাক।

ডেটা এক্সট্রাকশন থেকে নিয়ম-ভিত্তিক: নিয়ম-ভিত্তিক নিষ্কাশন একটি কৌশল যা স্বয়ংক্রিয়ভাবে একটি নির্দিষ্ট টেমপ্লেট ফর্ম থেকে ডেটা বের করে। এটি কোনো মানুষের হস্তক্ষেপ ছাড়াই ডেটা বের করতে পারে। তারা পৃষ্ঠার বিভিন্ন ক্ষেত্র পরীক্ষা করে এবং আশেপাশের পাঠ্য, লেবেল এবং অন্যান্য প্রাসঙ্গিক সূত্রের উপর ভিত্তি করে কোনটি বের করতে হবে তা নির্ধারণ করে কাজ করে। এই অ্যালগরিদমগুলি সাধারণত ETL স্ক্রিপ্ট বা ওয়েব স্ক্র্যাপিং ব্যবহার করে তৈরি এবং স্বয়ংক্রিয় হয়। যাইহোক, যখন তারা অদেখা তথ্যের উপর পরীক্ষা করা হয়, তারা সম্পূর্ণরূপে ব্যর্থ হয়।
OCR ব্যবহার করে ফর্ম ডেটা এক্সট্রাকশন: OCR হল ডেটা নিষ্কাশন সমস্যার যেকোনো প্রকারের জন্য একটি সহজ সমাধান। যাইহোক, সঠিক কর্মক্ষমতা অর্জনের জন্য একজনকে অবশ্যই অতিরিক্ত স্ক্রিপ্ট এবং প্রোগ্রাম লিখতে হবে। OCR কাজ করার জন্য, এটিতে পাঠ্য সহ একটি চিত্রের একটি ইনপুট প্রয়োজন৷ সফ্টওয়্যারটি তারপর প্রতিটি পিক্সেল পড়ে এবং প্রতিটি পিক্সেলকে তার সংশ্লিষ্ট অক্ষরের সাথে তুলনা করে। যদি এটি মেলে, তবে এটি সেই অক্ষরটি আউটপুট করবে এবং অক্ষরের যথেষ্ট কাছাকাছি যেকোন সংখ্যা বা চিহ্ন। OCR-এর সাথে সবচেয়ে বড় চ্যালেঞ্জ হল কীভাবে অক্ষর আলাদা করা যায় তা খুঁজে বের করা। উদাহরণস্বরূপ, যখন নোটগুলি একসাথে কাছাকাছি থাকে বা ওভারল্যাপ হয়, যেমন "a" এবং "e।" অতএব, আমরা যখন অফলাইন ফর্মগুলি বের করি তখন এগুলি কাজ নাও করতে পারে৷
ফর্ম তথ্য নিষ্কাশন জন্য NER: নামকৃত সত্তা স্বীকৃতি হল প্রাকৃতিক ভাষা পাঠে পূর্বনির্ধারিত সত্ত্বাকে চিহ্নিত ও শ্রেণীবদ্ধ করার কাজ। এটি প্রায়শই ফর্মগুলি থেকে তথ্য আহরণ করতে ব্যবহৃত হয়, যেখানে লোকেরা নাম, ঠিকানা, মন্তব্য ইত্যাদি টাইপ করে৷ নামযুক্ত সত্তাগুলিকে স্বীকৃতি দেওয়ার কাজটি কোরফারেন্স রেজোলিউশনের বৃহত্তর কাজের সাথে ঘনিষ্ঠভাবে সম্পর্কিত, যা নির্ধারণ করে যে একই সত্তার উল্লেখগুলিকে নির্দেশ করে কিনা৷ একই বাস্তব জগতের সত্তা। আজ উন্নত প্রোগ্রামিং টুলস এবং ফ্রেমওয়ার্কের সাথে, আমরা তথ্য নিষ্কাশনের কাজগুলির জন্য NER ভিত্তিক মডেলগুলি তৈরি করতে প্রাক-প্রশিক্ষিত মডেলগুলিকে কাজে লাগাতে পারি।

চিত্র উত্স: মধ্যম

ফর্ম ডেটা এক্সট্রাকশনের জন্য ডিপ লার্নিং ব্যবহার করা: গভীর শিক্ষা নতুন নয়, এটি কয়েক দশক ধরে চলে আসছে, তবে গভীর শিক্ষার স্থাপত্য এবং কম্পিউটিং শক্তির সাম্প্রতিক উন্নয়নগুলি যুগান্তকারী ফলাফলের দিকে পরিচালিত করেছে। ডিপ লার্নিং ব্যবহার করে ফর্ম ডেটা এক্সট্র্যাকশন প্রায় যেকোনো ফর্ম্যাটেই অত্যাধুনিক পারফরম্যান্স অর্জন করে, সেটা ডিজিটাল হোক বা হাতে লেখা। প্রক্রিয়াটি শুরু হয় গভীর নিউরাল নেটওয়ার্ক (DNN) হাজার হাজার বা লক্ষাধিক বিভিন্ন উদাহরণ খাওয়ানোর মাধ্যমে যা লেবেলযুক্ত। উদাহরণ স্বরূপ, নাম, ইমেল, আইডি ইত্যাদির মতো ইমেজ-ফর্ম লেবেল। যাইহোক, একটি অত্যন্ত নির্ভুল মডেল তৈরি করতে প্রচুর দক্ষতা এবং পরীক্ষা-নিরীক্ষার প্রয়োজন।

ফর্ম ডেটা নিষ্কাশনের জন্য গভীর শিক্ষা

OCR ব্যবহার করে ফর্ম ডেটা এক্সট্রাকশন

ফর্মগুলি থেকে ডেটা বের করার জন্য অনেকগুলি বিভিন্ন লাইব্রেরি উপলব্ধ। কিন্তু যদি আপনি একটি ফর্ম একটি ইমেজ থেকে তথ্য নিষ্কাশন করতে চান? এখানেই Tesseract OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) আসে। Tesseract হল একটি ওপেন-সোর্স OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) ইঞ্জিন যা HP দ্বারা তৈরি করা হয়েছে। Tesseract OCR ব্যবহার করে, স্ক্যান করা নথি যেমন কাগজের চালান, রসিদ এবং চেকগুলি অনুসন্ধানযোগ্য, সম্পাদনাযোগ্য ডিজিটাল ফাইলগুলিতে রূপান্তর করা সম্ভব। এটি বিভিন্ন ভাষায় উপলব্ধ এবং বিভিন্ন চিত্র বিন্যাসে অক্ষর চিনতে পারে। Tesseract সাধারণত টেক্সট এক্সট্রাক্ট করার জন্য ইমেজ প্রক্রিয়া করার জন্য অন্যান্য লাইব্রেরির সাথে একত্রে ব্যবহার করা হয়।

এটি পরীক্ষা করার জন্য, নিশ্চিত করুন যে আপনি আপনার স্থানীয় মেশিনে Tesseract ইনস্টল করেছেন। আপনি OCR চালানোর জন্য Tesseract CLI বা Python bindings ব্যবহার করতে পারেন। Python-tesseract হল Google এর Tesseract-OCR ইঞ্জিনের জন্য একটি মোড়ক। এটি জেপিইজি, পিএনজি, জিআইএফ, বিএমপি, টিফ এবং অন্যান্য সহ পিলো এবং লেপটোনিকা ইমেজিং লাইব্রেরি দ্বারা সমর্থিত সমস্ত চিত্রের ধরন পড়তে ব্যবহার করা যেতে পারে। প্রয়োজনে টেসারেক্ট করার জন্য আপনি এটিকে একটি স্বতন্ত্র আমন্ত্রণ স্ক্রিপ্ট হিসাবে সহজেই ব্যবহার করতে পারেন।

এখন, ফর্ম ডেটা সম্বলিত একটি রসিদ নেওয়া যাক এবং কম্পিউটার ভিশন এবং টেসার্যাক্ট ব্যবহার করে পাঠ্যের অবস্থান সনাক্ত করার চেষ্টা করা যাক।

import pytesseract
from pytesseract import Output
import cv2 img = cv2.imread('receipt.jpg')
d = pytesseract.image_to_data(img, output_type=Output.DICT)
n_boxes = len(d['level'])
for i in range(n_boxes): (x, y, w, h) = (d['left'][i], d['top'][i], d['width'][i], d['height'][i]) img = cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2) cv2.imshow(img,'img')

OCR ব্যবহার করে ফর্ম ডেটা এক্সট্রাকশন

এখানে, আউটপুটে, আমরা দেখতে পাচ্ছি, প্রোগ্রামটি ফর্মের ভিতরের সমস্ত পাঠ্য সনাক্ত করতে সক্ষম হয়েছিল। এখন, সমস্ত তথ্য বের করার জন্য এটিতে OCR প্রয়োগ করা যাক। আমরা সহজভাবে ব্যবহার করে এটি করতে পারেন image_to_string পাইথনে ফাংশন।

extracted_text = pytesseract.image_to_string(img, lang = 'deu')

আউটপুট:

Berghotel
Grosse Scheidegg
3818 Grindelwald
Familie R.Müller Rech.Nr. 4572 30.07.2007/13:29: 17
Bar Tisch 7/01
2xLatte Macchiato &ä 4.50 CHF 9,00
1xGloki a 5.00 CH 5.00
1xSchweinschnitzel ä 22.00 CHF 22.00
IxChässpätz 1 a 18.50 CHF 18.50 Total: CHF 54.50 Incl. 7.6% MwSt 54.50 CHF: 3.85 Entspricht in Euro 36.33 EUR
Es bediente Sie: Ursula MwSt Nr. : 430 234
Tel.: 033 853 67 16
Fax.: 033 853 67 19
E-mail: grossescheidegs@b luewin. Ch

এখানে আমরা ফর্ম থেকে সমস্ত তথ্য বের করতে সক্ষম। যাইহোক, বেশিরভাগ ক্ষেত্রে, শুধুমাত্র OCR ব্যবহার করে সাহায্য করবে না কারণ নিষ্কাশিত ডেটা সম্পূর্ণরূপে অসংগঠিত হবে। অতএব, ব্যবহারকারীরা ফর্মের মূল-মূল্য জোড়া নিষ্কাশনের উপর নির্ভর করে, যা শুধুমাত্র নির্দিষ্ট সত্তা যেমন আইডি, তারিখ, ট্যাক্সের পরিমাণ ইত্যাদি সনাক্ত করতে পারে। এটি শুধুমাত্র গভীর শিক্ষার মাধ্যমেই সম্ভব। পরবর্তী বিভাগে, আসুন দেখি কিভাবে আমরা তথ্য নিষ্কাশনের অ্যালগরিদম তৈরি করতে বিভিন্ন গভীর শিক্ষার কৌশল ব্যবহার করতে পারি।

গভীর শিক্ষা ব্যবহার করে ফর্ম ডেটা নিষ্কাশন সমাধান করা

ভিজ্যুয়াল রিচ ডকুমেন্টস থেকে মাল্টিমোডাল ইনফরমেশন এক্সট্রাকশনের জন্য গ্রাফ কনভোলিউশন

গ্রাফ কনভোলিউশনাল নেটওয়ার্ক (গ্রাফ সিএনএন) নোড এবং এজ স্ট্রাকচার সংরক্ষণের সময় গ্রাফ ডেটা স্ট্রাকচারে অত্যন্ত নন-লিনিয়ার বৈশিষ্ট্যগুলি কার্যকরভাবে শিখতে সক্ষম ডিপ কনভোলিউশনাল নিউরাল নেটওয়ার্ক (সিএনএন) এর একটি শ্রেণী। তারা গ্রাফ ডেটা স্ট্রাকচারকে ইনপুট হিসেবে নিতে পারে এবং নোড ও প্রান্তের জন্য 'ফিচার ম্যাপ' তৈরি করতে পারে। ফলস্বরূপ বৈশিষ্ট্যগুলি গ্রাফ শ্রেণীবিভাগ, ক্লাস্টারিং বা সম্প্রদায় সনাক্তকরণের জন্য ব্যবহার করা যেতে পারে। GCNগুলি চালান এবং রসিদগুলির মতো বড়, দৃশ্যত সমৃদ্ধ নথি থেকে তথ্য আহরণের জন্য একটি শক্তিশালী সমাধান প্রদান করে। এগুলি প্রক্রিয়া করার জন্য, প্রতিটি চিত্রকে নোড এবং প্রান্তগুলির সমন্বয়ে একটি গ্রাফে রূপান্তরিত করতে হবে। চিত্রের যেকোনো শব্দ তার নিজস্ব নোড দ্বারা প্রতিনিধিত্ব করা হয়; বাকি ডেটার ভিজ্যুয়ালাইজেশন নোডের বৈশিষ্ট্য ভেক্টরে এনকোড করা হয়।

নথি গ্রাফ। গ্রাফের প্রতিটি নোড একে অপরের সাথে সম্পূর্ণভাবে সংযুক্ত।(কি SRC)

এই মডেলটি প্রথমে ডকুমেন্টের প্রতিটি টেক্সট সেগমেন্টকে গ্রাফ এম্বেডিং-এ এনকোড করে। এটি করার ফলে পাঠ্যের একটি ব্লকের মধ্যে এর অবস্থান বা অবস্থান সহ প্রতিটি পাঠ্য উপাদানকে ঘিরে চাক্ষুষ এবং পাঠ্য প্রসঙ্গ ক্যাপচার করে। তারপরে এটি এই গ্রাফগুলিকে টেক্সট এম্বেডিংয়ের সাথে একত্রিত করে যাতে ডকুমেন্টের গঠন এবং এর মধ্যে যা লেখা আছে তার একটি সামগ্রিক উপস্থাপনা তৈরি করে। মডেলটি পাঠ্যের উপর উচ্চতর ওজন নির্ধারণ করতে শেখে যেগুলি একে অপরের সাথে সম্পর্কিত তাদের অবস্থানের উপর ভিত্তি করে এবং পাঠকদের একটি বৃহত্তর ব্লকের মধ্যে যে প্রেক্ষাপটে তারা উপস্থিত হয় তার উপর ভিত্তি করে সত্তা হতে পারে। অবশেষে, এটি সত্তা নিষ্কাশনের জন্য একটি আদর্শ BiLSTM-CRF মডেল প্রয়োগ করে। ফলাফলগুলি দেখায় যে এই অ্যালগরিদমটি একটি বিস্তৃত মার্জিনে বেসলাইন মডেল (BiLSTM-CRF) কে ছাড়িয়ে যায়৷

লেআউটএলএম: ডকুমেন্ট ইমেজ বোঝার জন্য টেক্সট এবং লেআউটের প্রাক-প্রশিক্ষণ

লেআউটএলএম মডেলের আর্কিটেকচারটি BERT দ্বারা ব্যাপকভাবে অনুপ্রাণিত এবং একটি দ্রুততর R-CNN থেকে ইমেজ এম্বেডিং অন্তর্ভুক্ত করে। লেআউটএলএম ইনপুট এম্বেডিংগুলি টেক্সট এবং অবস্থান এমবেডিংয়ের সংমিশ্রণ হিসাবে তৈরি করা হয়, তারপরে দ্রুত আর-সিএনএন মডেল দ্বারা উত্পন্ন চিত্র এমবেডিংয়ের সাথে মিলিত হয়। মাস্কড ভিজ্যুয়াল-ল্যাংগুয়েজ মডেল এবং মাল্টি-লেবেল ডকুমেন্ট ক্লাসিফিকেশন প্রাথমিকভাবে লেআউটএলএম-এর জন্য প্রি-ট্রেনিং কাজ হিসেবে ব্যবহৃত হয়। LayoutLM মডেলটি মূল্যবান, গতিশীল এবং যেকোন কাজের জন্য যথেষ্ট শক্তিশালী যে লেআউট বোঝার প্রয়োজন হয়, যেমন ফর্ম/রসিদ নিষ্কাশন, নথি চিত্র শ্রেণীবিভাগ, এমনকি ভিজ্যুয়াল প্রশ্নের উত্তর এই প্রশিক্ষণ মডেলের সাথে সঞ্চালিত হতে পারে।

চিত্র উত্স: লেআউটএমএল

LayoutLM মডেলটিকে IIT-CDIP টেস্ট কালেকশন 1.0-এ প্রশিক্ষিত করা হয়েছিল, যার মধ্যে 6 মিলিয়নেরও বেশি নথি এবং 11 মিলিয়নেরও বেশি স্ক্যান করা ডকুমেন্ট ইমেজ রয়েছে যা মোট 12GB ডেটার বেশি। এই মডেলটি ফর্ম বোঝার, রসিদ বোঝা এবং স্ক্যান করা ডকুমেন্ট ইমেজ শ্রেণীবিভাগের কাজগুলিতে বেশ কয়েকটি SOTA প্রাক-প্রশিক্ষিত মডেলকে উল্লেখযোগ্যভাবে ছাড়িয়ে গেছে।

Form2Seq: উচ্চ-ক্রম ফর্ম কাঠামো নিষ্কাশনের জন্য একটি কাঠামো

Form2Seq একটি কাঠামো যা অবস্থানগত ক্রম ব্যবহার করে ইনপুট পাঠ্য থেকে কাঠামো নিষ্কাশনের উপর ফোকাস করে। প্রথাগত seq2seq ফ্রেমওয়ার্কের বিপরীতে, Form2Seq স্ট্রাকচারের আপেক্ষিক স্থানিক অবস্থানগুলিকে তাদের অর্ডারের পরিবর্তে ব্যবহার করে।

এই পদ্ধতিতে, প্রথমে, আমরা নিম্ন-স্তরের উপাদানগুলিকে শ্রেণিবদ্ধ করি যা আরও ভাল প্রক্রিয়াকরণ এবং সংগঠনের জন্য অনুমতি দেবে। 10 ধরনের ফর্ম আছে, যেমন ফিল্ড ক্যাপশন, তালিকা আইটেম, এবং তাই। এরপরে, আমরা নিম্ন-স্তরের উপাদানগুলিকে গোষ্ঠীবদ্ধ করি, যেমন পাঠ্য ক্ষেত্র এবং চয়েসফিল্ড, চয়েস গ্রুপ নামক উচ্চ-ক্রম নির্মাণে। এগুলিকে তথ্য সংগ্রহের প্রক্রিয়া হিসাবে ব্যবহার করা হয় যাতে আরও ভাল ব্যবহারকারীর অভিজ্ঞতা অর্জন করা হয় নিম্ন-স্তরের উপাদানগুলিকে উচ্চ-ক্রম নির্মাণে, যেমন টেক্সট ফিল্ড, চয়েসফিল্ড এবং চয়েস গ্রুপ, ফর্মগুলিতে তথ্য সংগ্রহের প্রক্রিয়া হিসাবে ব্যবহৃত হয়। প্রাকৃতিক পাঠের ক্রমে একটি রৈখিক ক্রমানুসারে উপাদান উপাদানগুলিকে সাজিয়ে এবং Seq2Seq কাঠামোতে তাদের স্থানিক এবং পাঠ্য উপস্থাপনা খাওয়ানোর মাধ্যমে এটি সম্ভব। Seq2Seq ফ্রেমওয়ার্ক প্রেক্ষাপটের উপর নির্ভর করে একটি বাক্যের প্রতিটি উপাদানের জন্য ক্রমানুসারে ভবিষ্যদ্বাণী করে। এটি এটিকে আরও তথ্য প্রক্রিয়া করতে এবং হাতে থাকা টাস্ক সম্পর্কে আরও ভাল বোঝার জন্য অনুমতি দেয়।

উপাদান ধরনের শ্রেণীবিভাগের জন্য Form2seq মডেল আর্কিটেকচার। বিভিন্ন পর্যায় অক্ষর দিয়ে টীকা করা হয় (কি SRC).

মডেলটি শ্রেণীবিন্যাস টাস্কে 90% এর নির্ভুলতা অর্জন করেছে, যা বিভাজন ভিত্তিক বেসলাইন মডেলের চেয়ে বেশি ছিল। টেক্সট ব্লক, টেক্সট ক্ষেত্র এবং পছন্দের ক্ষেত্রে F1 ছিল যথাক্রমে 86.01%, 61.63%। এই ফ্রেমওয়ার্ক টেবিল গঠন স্বীকৃতির জন্য ICDAR ডেটাসেটে ফলাফলের অবস্থা অর্জন করেছে।

কেন ন্যানোনেটস এআই-ভিত্তিক ওসিআর সেরা বিকল্প

যদিও ওসিআর সফ্টওয়্যার পাঠ্যের স্ক্যান করা চিত্রগুলিকে PDF, DOC এবং PPT-এর মতো ফর্ম্যাট করা ডিজিটাল ফাইলগুলিতে রূপান্তর করতে পারে, তবে এটি সর্বদা সঠিক নয়। ন্যানোনেটস এআই-ভিত্তিক ওসিআর ডিপ লার্নিং সিস্টেমের মতো আজকের শীর্ষস্থানীয় সফ্টওয়্যারগুলি স্ক্যান করা নথি থেকে একটি সম্পাদনাযোগ্য ফাইল তৈরি করার সময় প্রথাগত ওসিআর সিস্টেমগুলি যে চ্যালেঞ্জগুলি মোকাবেলা করেছে তা অতিক্রম করেছে৷ এটি ডেটা নিষ্কাশনের জন্য সর্বোত্তম বিকল্প হয়ে উঠেছে কারণ এটি উচ্চ নির্ভুলতার হার এবং শব্দ, গ্রাফিকাল উপাদান এবং বিন্যাস পরিবর্তনের জন্য উচ্চ সহনশীলতার মাত্রা প্রদান করতে পারে। এখন, এআই-ভিত্তিক ওসিআর কীভাবে সেরা বিকল্প তা নিয়ে কয়েকটি পয়েন্ট নিয়ে আলোচনা করা যাক।

ন্যানোনেটস - ফর্ম ডেটা এক্সট্রাকশন

OCR, যেমন আলোচনা করা হয়েছে, তথ্য বের করার একটি সহজ কৌশল। যাইহোক, অদেখা/নতুন ডেটা রাখার সময় তারা ধারাবাহিকভাবে কাজ করবে না। যাইহোক, এআই-ভিত্তিক ওসিআর এই ধরনের পরিস্থিতি পরিচালনা করতে পারে, কারণ তারা বিস্তৃত ডেটার উপর প্রশিক্ষণ দেয়।
সাধারণ ওসিআরগুলি ফর্ম ডেটা নিষ্কাশনের জন্য জটিল লেআউটগুলি পরিচালনা করতে পারে না। তাই, যখন ডিপ লার্নিং বা AI দ্বারা চালিত হয়, তখন তারা ডেটার লেআউট, টেক্সট এবং প্রসঙ্গ বুঝে সর্বোত্তম ফলাফল দেয়।
ডেটাতে গোলমাল থাকলে ওসিআরগুলি কম পারফর্ম করতে পারে, যেমন তির্যকতা, কম-আলোতে স্ক্যান করা ছবি ইত্যাদি, যখন গভীর শিক্ষার মডেলগুলি এই ধরনের পরিস্থিতি পরিচালনা করতে পারে এবং এখনও অত্যন্ত সঠিক ফলাফল প্রদান করতে পারে।
এআই-ভিত্তিক ওসিআরগুলি ঐতিহ্যগত ওসিআরগুলির তুলনায় অত্যন্ত কাস্টমাইজযোগ্য এবং নমনীয়; অসংগঠিত ডেটাকে যে কোনও কাঠামোগত বিন্যাসে রূপান্তর করতে এগুলি বিভিন্ন ধরণের ডেটার উপর তৈরি করা যেতে পারে।
AI-ভিত্তিক OCR থেকে পোস্ট-প্রসেসিং আউটপুটগুলি প্লেইন ওসিআরের তুলনায় অ্যাক্সেসযোগ্য; এগুলি যেকোন ডেটা ফরম্যাটে যেমন JSON, CSV, এক্সেল শীট বা এমনকি একটি ডাটাবেস যেমন Postgres মডেল থেকে সরাসরি এক্সপোর্ট করা যেতে পারে।
AI-ভিত্তিক OCR প্রাক-প্রশিক্ষিত মডেলগুলি ব্যবহার করে একটি সাধারণ API হিসাবে রপ্তানি করা যেতে পারে। এটি এখনও অন্যান্য ঐতিহ্যগত পদ্ধতিতে সম্ভব, তবে একটি সময়মত মডেলগুলিকে ধারাবাহিকভাবে উন্নত করা কঠিন হতে পারে। এআই-ভিত্তিক ওসিআর-এ থাকাকালীন, এটি স্বয়ংক্রিয়ভাবে ত্রুটি দ্বারা সুর করা যেতে পারে।
সোজা ওসিআর ব্যবহার করে টেবিল নিষ্কাশন অত্যন্ত অসম্ভব। যাইহোক, এটি AI/DL এর শক্তি দিয়ে সহজে করা যেতে পারে। আজ, এআই-ভিত্তিক ওসিআরগুলি ইতিবাচকভাবে নথির ভিতরে টেবিল-ভিত্তিক ফর্মগুলি নির্দেশ করতে পারে এবং তথ্য বের করতে পারে।
নথিতে কোনো আর্থিক বা গোপনীয় তথ্য থাকলে, এআই মডেলগুলিও জালিয়াতি পরীক্ষা করতে পারে। এটি মূলত স্ক্যান করা নথি থেকে সম্পাদিত/অস্পষ্ট পাঠ্যের সন্ধান করে এবং প্রশাসকদের অবহিত করে। ডুপ্লিকেট নথি বা তথ্য এই মডেলের মাধ্যমে সনাক্ত করা যেতে পারে. যদিও OCR সহজভাবে এই ধরনের ক্ষেত্রে ব্যর্থ হয়।

সময় স্ট্যাম্প: মার্চ 6, 2022

সময় স্ট্যাম্প: নভেম্বর 15, 2023

ফর্ম তথ্য নিষ্কাশন

প্লেটো দ্বারা প্রকাশিত

ফর্ম ডেটা নিষ্কাশন কি?

কি ফর্ম ডেটা নিষ্কাশন চ্যালেঞ্জিং করে তোলে?

বিভিন্ন পরিস্থিতি সহ ফর্ম নিষ্কাশনের গভীরতা বোঝা

দৃশ্য #1: অফলাইন ফর্মের জন্য হাতে লেখা স্বীকৃতি

পরিস্থিতি #2: ফর্মগুলিতে চেকবক্স সনাক্তকরণ

দৃশ্যকল্প #3: সময়ে সময়ে ফর্মের লেআউট পরিবর্তন

দৃশ্যকল্প #4: টেবিল সেল সনাক্তকরণ

কিভাবে ফর্ম ডেটা নিষ্কাশন সমাধান বিকশিত হয়েছে?

OCR ব্যবহার করে ফর্ম ডেটা এক্সট্রাকশন

গভীর শিক্ষা ব্যবহার করে ফর্ম ডেটা নিষ্কাশন সমাধান করা

কেন ন্যানোনেটস এআই-ভিত্তিক ওসিআর সেরা বিকল্প

থেকে আরো এআই এবং মেশিন লার্নিং

2024 সালে প্রদেয় অ্যাকাউন্টস (এপি) রিপোর্ট এবং রিপোর্টিংয়ের জন্য একটি নির্দেশিকা

একটি ব্যয় রসিদ কি?

12টি উত্তেজনাপূর্ণ RPA পরিসংখ্যান আপনি 2022 সালে মিস করতে পারবেন না

ফোন নম্বর এক্সট্র্যাক্টর: আপনার যা জানা দরকার

Argus মডেলিং: ড্রাইভিং ডেটা-ভিত্তিক রিয়েল এস্টেট সিদ্ধান্ত

বিক্রেতা ব্যবস্থাপনা প্রক্রিয়া: গুরুত্ব, সুবিধা এবং চ্যালেঞ্জ

কি দিন প্রদেয় বকেয়া? আর ডিপিও কিভাবে হিসাব করবেন?

প্রদেয় অ্যাকাউন্টে ডিজিটাল রূপান্তরের জন্য একটি সম্পূর্ণ নির্দেশিকা

আমাদের সম্পর্কে

উল্লম্ব অনুসন্ধান এবং আই

প্ল্যাটফর্ম

যোগাযোগ রেখো

হিসাব