نحوه استخراج متن یا داده از تصویر

بازنشر افلاطون

دنبال: 0

استخراج متن از یک تصویر می تواند یک فرآیند دست و پا گیر باشد. اکثر مردم به صورت دستی متن/داده های تصویر را کلید می زنند. اما زمانی که تصاویر زیادی دارید، این کار هم زمان بر و هم ناکارآمد است.

مبدل های تصویر به متن روشی منظم برای استخراج متن از تصاویر ارائه می دهد.

در حالی که چنین ابزارهایی کار خوبی انجام می دهند، متن/داده های استخراج شده اغلب به شیوه ای بدون ساختار ارائه می شوند که منجر به پردازش پست زیادی می شود.

An OCR مبتنی بر هوش مصنوعی مانند نانو شبکه‌ها می‌توانند متن را از تصاویر بیرون بکشند و داده‌های استخراج‌شده را به شیوه‌ای منظم، سازمان‌یافته و ساختار یافته ارائه کنند.

نانو شبکه ها داده ها را از تصاویر به طور دقیق، در مقیاس و به چندین زبان استخراج می کند. Nanonets تنها OCR تشخیص متن است که متن استخراج شده را در قالب‌های ساختاری منظم و کاملاً قابل تنظیم ارائه می‌کند. داده های گرفته شده را می توان به صورت جداول، آیتم های خطی یا هر قالب دیگری ارائه کرد.

برای آپلود تصویر خود در زیر کلیک کنید
OCR نانوشبکه ها به طور خودکار محتوای فایل شما را تشخیص داده و آن را به متن تبدیل می کند
متن استخراج شده را به صورت فایل متنی خام دانلود کنید یا از طریق API ادغام کنید

فهرست مندرجات

در اینجا سه روش پیشرفته وجود دارد که در آنها می توانید از OCR Nanonets برای شناسایی و استخراج متن از تصاویر استفاده کنید. استخراج متن از PDFs, استخراج داده ها از PDFو یا فایل های PDF را تجزیه کنید و انواع دیگر اسناد:

استخراج متن از تصویر با استفاده از نانو شبکه

به یک OCR آنلاین رایگان برای تصویر به متن, PDF به جدول, PDF به متن، یا استخراج اطلاعات PDF? Nanonets را به صورت آنلاین بررسی کنید OCR API در عمل و شروع به ساخت مدل های سفارشی OCR به صورت رایگان!

Nanonets دارای مدل‌های OCR از پیش آموزش‌دیده برای انواع عکس‌های خاص ذکر شده در زیر است. هر مدل OCR از پیش آموزش داده شده برای ارتباط دقیق متن در نوع تصویر با یک فیلد مناسب مانند نام، آدرس، تاریخ، انقضا و غیره آموزش داده شده است و متن استخراج شده را به شیوه ای منظم و منظم ارائه می دهد.

فاکتورها
رسید
گواهینامه رانندگی (ایالات متحده)
گذرنامه

نانوت OCR و OCR API آنلاین بسیاری از جالب است موارد استفاده.

[محتوای جاسازی شده]

نانوشبکه هایی که متن را از تصاویر رسید استخراج می کنند

مرحله 1: یک مدل OCR مناسب را انتخاب کنید

ورود به Nanonets بروید و یک مدل OCR مناسب با تصویری که می خواهید متن و داده را از آن استخراج کنید، انتخاب کنید. اگر هیچ یک از مدل های OCR از پیش آموزش دیده مطابق با نیازهای شما نیست، می توانید برای اطلاع از نحوه ایجاد یک مدل OCR سفارشی از ادامه راه رد شوید.

مرحله 2: اضافه کردن فایل ها

فایل ها/تصاویری را که می خواهید متن را از آنها استخراج کنید اضافه کنید. می توانید هر تعداد عکس که دوست دارید اضافه کنید.

مرحله 3: تست

چند ثانیه زمان بگذارید تا مدل اجرا شود و متن را از تصویر استخراج کنید.

مرحله 4: تأیید کنید

با بررسی نمای جدول در سمت راست، متن استخراج شده از هر فایل را به سرعت بررسی کنید. شما به راحتی می توانید بررسی کنید که آیا متن به درستی تشخیص داده شده و با یک فیلد یا برچسب مناسب مطابقت داده شده است.

حتی می‌توانید در این مرحله مقادیر و برچسب‌های فیلد را ویرایش/تصحیح کنید. نانوشبکه ها به الگوی تصویر محدود نمی شوند.

متن یا داده های استخراج شده را ویرایش کنید

داده های استخراج شده را می توان در قالب "نمایش لیست" یا "JSON" نمایش داد.

چگونه می توان متن یا داده را از هوش داده پلاتوبلاکچین تصویر استخراج کرد. جستجوی عمودی Ai. — متن استخراج شده به صورت لیست یا خروجی JSON نمایش داده می شود

می‌توانید کنار هر مقدار یا فیلدی را که تأیید می‌کنید علامت بزنید یا روی «تأیید داده‌ها» کلیک کنید تا فوراً ادامه دهید.

مرحله 5: صادرات

پس از تایید تمامی فایل ها می‌توانید داده‌های منظم سازمان‌یافته را به‌عنوان یک فایل xml، xlsx یا csv صادر کنید.

نانو شبکه ها جالب است موارد استفاده و منحصر به فرد داستان موفقیت مشتری. بیابید که چگونه نانوشبکه ها می توانند به کسب و کار شما برای بهره وری بیشتر کمک کنند.

ساخت یک مدل OCR سفارشی با نانو شبکه ها آسان است. شما معمولاً می توانید یک مدل را برای هر نوع تصویر یا سند، به هر زبانی، در کمتر از 25 دقیقه بسازید، آموزش دهید و اجرا کنید (بسته به تعداد فایل های استفاده شده برای آموزش مدل).

برای انجام 4 مرحله اول در این روش ویدیوی زیر را تماشا کنید:

[محتوای جاسازی شده]

چگونه مدل OCR خود را با نانو شبکه ها آموزش دهید

مرحله 1: مدل OCR خود را ایجاد کنید

ورود به Nanonets بروید و روی “Create your own OCR model” کلیک کنید.

مرحله 2: آپلود فایل ها/تصاویر آموزشی

فایل های نمونه ای را بارگذاری کنید که برای آموزش مدل های OCR استفاده می شود. دقت مدل OCR که می‌سازید تا حد زیادی به کیفیت و کمیت فایل‌ها/تصاویر آپلود شده در این مرحله بستگی دارد.

مرحله 3: متن روی فایل ها/تصاویر حاشیه نویسی کنید

اکنون هر قطعه از متن یا داده را با یک فیلد یا برچسب مناسب حاشیه نویسی کنید. این مرحله مهم به مدل OCR شما می آموزد که متن مناسب را از تصاویر استخراج کند و آن را با فیلدهای سفارشی مرتبط با نیازهای شما مرتبط کند.

همچنین می توانید یک برچسب جدید برای حاشیه نویسی متن یا داده ها اضافه کنید. به یاد داشته باشید، نانوشبکه ها به الگوی تصویر محدود نمی شوند!

مرحله 4: مدل OCR سفارشی را آموزش دهید

پس از تکمیل حاشیه نویسی برای همه فایل ها/تصاویر آموزشی، روی "Train Model" کلیک کنید. آموزش معمولا بین 20 دقیقه تا 2 ساعت بسته به تعداد فایل ها و مدل های در صف برای آموزش طول می کشد. تو می توانی ارتقاء به یک برنامه پولی برای دریافت نتایج سریعتر در این مرحله (معمولاً کمتر از 20 دقیقه).

نانوشبکه‌ها از یادگیری عمیق برای ساخت مدل‌های مختلف OCR استفاده می‌کنند و آن‌ها را در مقابل یکدیگر برای دقت آزمایش می‌کنند. سپس Nanonets بهترین مدل OCR را (بر اساس ورودی‌ها و سطوح دقت) انتخاب می‌کند.

برگه «متریک مدل» اندازه‌گیری‌های مختلف و تجزیه و تحلیل‌های مقایسه‌ای را نشان می‌دهد که به نانوشبکه‌ها اجازه می‌دهد بهترین مدل OCR را از بین تمام مدل‌های ساخته شده انتخاب کنند. می توانید مدل را مجدداً آموزش دهید (با ارائه طیف وسیع تری از تصاویر آموزشی و حاشیه نویسی بهتر) تا به سطوح بالاتری از دقت دست یابید.

یا، اگر از دقت راضی هستید، برای آزمایش و بررسی اینکه آیا این مدل OCR سفارشی روی نمونه‌ای از تصاویر یا فایل‌هایی که متن/داده‌ها باید از آن استخراج شود، مطابق انتظار عمل می‌کند، روی «تست» کلیک کنید.

مرحله 5: داده ها را آزمایش و تأیید کنید

برای آزمایش و تأیید مدل OCR سفارشی، چند تصویر نمونه اضافه کنید.

صحت متن استخراج شده را بررسی کنید — تست و بررسی صحت متن استخراج شده

اگر متن شناسایی، استخراج و ارائه شده است، فایل را صادر کنید. همانطور که در زیر مشاهده می کنید، داده های استخراج شده در قالب منظمی سازماندهی و ارائه شده است.

داده های صادر شده به طور منظم فهرست شده است

تبریک می‌گوییم، شما اکنون یک مدل OCR سفارشی برای استخراج متن از انواع خاصی از تصاویر ساخته‌اید و آموزش داده‌اید!

آیا کسب و کار شما با تشخیص متن در اسناد دیجیتال، تصاویر یا PDF سروکار دارد؟ آیا به این فکر کرده اید که چگونه می توان متن را از تصاویر به طور دقیق استخراج کرد؟

مدل های OCR خود را با NanoNets API آموزش دهید

در اینجا یک راهنمای دقیق برای آموزش مدل های OCR خود را با استفاده از Nanonets APIاست. در مستندات، نمونه‌های کد آماده در Python، Shell، Ruby، Golang، Java و C# و همچنین مشخصات API دقیق برای نقاط پایانی مختلف را خواهید یافت.

در اینجا یک راهنمای گام به گام برای آموزش مدل خود با استفاده از Nanonets API آورده شده است:

مرحله 1: Repo را شبیه سازی کنید

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

مرحله 2: کلید API رایگان خود را دریافت کنید

کلید API رایگان خود را از اینجا دریافت کنید https://app.nanonets.com/#/keys

مرحله 3: کلید API را به عنوان یک محیط متغیر تنظیم کنید

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

مرحله 4: یک مدل جدید ایجاد کنید

python ./code/create-model.py

توجه: این یک MODEL_ID را ایجاد می کند که برای مرحله بعدی به آن نیاز دارید

مرحله 5: شناسه مدل را به عنوان متغیر محیط اضافه کنید

export NANONETS_MODEL_ID=YOUR_MODEL_ID

مرحله 6: داده های آموزش را بارگذاری کنید

تصاویر شیئی را که می خواهید تشخیص دهید جمع آوری کنید. هنگامی که مجموعه داده را در پوشه آماده کردید images (فایل های تصویری)، آپلود مجموعه داده را شروع کنید.

python ./code/upload-training.py

مرحله 7: مدل قطار

پس از بارگذاری تصاویر ، آموزش مدل را شروع کنید

python ./code/train-model.py

مرحله 8: حالت مدل را دریافت کنید

آموزش این مدل حدود 30 دقیقه طول می کشد. پس از آموزش مدل، ایمیلی دریافت خواهید کرد. در همین حین شما وضعیت مدل را بررسی می کنید

watch -n 100 python ./code/model-state.py

مرحله 9: پیش بینی کنید

پس از آموزش مدل. با استفاده از مدل می توانید پیش بینی کنید

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

مزایای استفاده از نانو شبکه ها نسبت به سایر API های OCR فراتر از دقت بهتر در استخراج متن از تصاویر است. در اینجا 7 دلیل وجود دارد که چرا باید به جای آن از OCR Nanonets برای تشخیص متن استفاده کنید:

1. کار با داده های سفارشی

اکثر نرم افزارهای OCR از نظر نوع داده هایی که می توانند با آنها کار کنند کاملاً سفت و سخت هستند. آموزش یک مدل OCR برای یک مورد استفاده نیاز به درجه زیادی از انعطاف پذیری با توجه به الزامات و مشخصات آن دارد. OCR برای پردازش فاکتور بسیار با OCR برای گذرنامه متفاوت است! نانوشبکه ها به چنین محدودیت های سفت و سختی محدود نمی شوند. Nanonets از داده‌های خود برای آموزش مدل‌های OCR استفاده می‌کند که به بهترین وجه برای پاسخگویی به نیازهای خاص کسب‌وکار شما مناسب هستند.

2. کار با غیر انگلیسی یا چند زبان

از آنجایی که Nanonets بر روی آموزش با داده های سفارشی تمرکز می کند، به طور منحصر به فردی برای ساخت یک مدل OCR واحد قرار دارد که می تواند متن را از تصاویر به هر زبان یا چندین زبان به طور همزمان استخراج کند.

3. نیازی به پس پردازش ندارد

متن استخراج شده با استفاده از مدل های OCR باید به طور هوشمندانه ساختار یافته و در قالبی قابل فهم ارائه شود. در غیر این صورت زمان و منابع قابل توجهی صرف سازماندهی مجدد داده ها به اطلاعات معنادار می شود. در حالی که اکثر ابزارهای OCR به سادگی داده ها را از تصاویر می گیرند و می ریزند، Nanonets فقط داده های مربوطه را استخراج می کند و به طور خودکار آنها را در زمینه هایی با ساختار هوشمند مرتب می کند که مشاهده و درک آن را آسان تر می کند.

4. پیوسته یاد می گیرد

کسب و کارها اغلب با نیازها و نیازها به طور پویا در حال تغییر روبرو هستند. برای غلبه بر موانع احتمالی، Nanonets به شما این امکان را می دهد که به راحتی مدل های خود را با داده های جدید دوباره آموزش دهید. این به مدل OCR شما اجازه می دهد تا با تغییرات پیش بینی نشده سازگار شود.

5. محدودیت های داده رایج را به راحتی مدیریت می کند

نانوشبکه‌ها از تکنیک‌های هوش مصنوعی، ML و یادگیری عمیق برای غلبه بر محدودیت‌های رایج داده که به شدت بر تشخیص و استخراج متن تأثیر می‌گذارند، استفاده می‌کنند. نانوشبکه‌های OCR می‌توانند متن دست‌نویس، تصاویر متن به چندین زبان، تصاویر با وضوح پایین، تصاویر با فونت‌های جدید یا خط شکسته و اندازه‌های مختلف، تصاویر با متن سایه‌دار، متن کج‌شده، متن بدون ساختار تصادفی، نویز تصویر، تصاویر تار را شناسایی و مدیریت کند. و بیشتر. APIهای OCR سنتی برای عملکرد تحت چنین محدودیت‌هایی مجهز نیستند. آنها به داده هایی در سطح بسیار بالایی از وفاداری نیاز دارند که در سناریوهای زندگی واقعی معمول نیست.

6. به هیچ تیم داخلی از توسعه دهندگان نیاز ندارد

نیازی به نگرانی در مورد استخدام توسعه دهندگان و به دست آوردن استعداد برای شخصی سازی Nanonets API برای نیازهای تجاری خود نیست. نانو شبکه ها برای یکپارچه سازی بدون دردسر ساخته شده اند. همچنین می توانید به راحتی نانو شبکه ها را با اکثر نرم افزارهای CRM، ERP یا RPA ادغام کنید.

7. سفارشی کردن، سفارشی کردن، سفارشی کردن

می توانید هر تعداد فیلد متن/داده ای را که دوست دارید با Nanonets OCR ضبط کنید. حتی می‌توانید قوانین اعتبارسنجی سفارشی بسازید که برای شناسایی متن و الزامات استخراج متن خاص شما کار می‌کنند. Nanonets به هیچ وجه به الگوی سند شما محدود نمی شود. شما می توانید داده ها را در جداول یا آیتم های خط یا هر فرمت دیگری ضبط کنید!

Nanonets موارد استفاده زیادی دارد که می تواند عملکرد کسب و کار شما را بهینه کند، در هزینه ها صرفه جویی کند و رشد را افزایش دهد. پیدا کردن چگونه موارد استفاده نانوشبکه ها می تواند برای محصول شما اعمال شود.

یا بررسی کنید نانوت OCR API در عمل و شروع به ساختن سفارشی کنید OCR مدل های رایگان!

بروزرسانی جولای 2022: این پست در ابتدا در اکتبر 2020 و از آن زمان به روز شده است به طور منظم.

اینجا یک اسلاید است خلاصه ای از یافته های این مقاله اینجا یک نسخه جایگزین از این پست

تمبر زمان: ژوئیه 17، 2022ژوئیه 18، 2022

تمبر زمان: ژان 30، 2023