استخراج متن از یک تصویر می تواند یک فرآیند دست و پا گیر باشد. اکثر مردم به صورت دستی متن/داده های تصویر را کلید می زنند. اما زمانی که تصاویر زیادی دارید، این کار هم زمان بر و هم ناکارآمد است.
مبدل های تصویر به متن روشی منظم برای استخراج متن از تصاویر ارائه می دهد.
در حالی که چنین ابزارهایی کار خوبی انجام می دهند، متن/داده های استخراج شده اغلب به شیوه ای بدون ساختار ارائه می شوند که منجر به پردازش پست زیادی می شود.
An OCR مبتنی بر هوش مصنوعی مانند نانو شبکهها میتوانند متن را از تصاویر بیرون بکشند و دادههای استخراجشده را به شیوهای منظم، سازمانیافته و ساختار یافته ارائه کنند.
نانو شبکه ها داده ها را از تصاویر به طور دقیق، در مقیاس و به چندین زبان استخراج می کند. Nanonets تنها OCR تشخیص متن است که متن استخراج شده را در قالبهای ساختاری منظم و کاملاً قابل تنظیم ارائه میکند. داده های گرفته شده را می توان به صورت جداول، آیتم های خطی یا هر قالب دیگری ارائه کرد.
- برای آپلود تصویر خود در زیر کلیک کنید
- OCR نانوشبکه ها به طور خودکار محتوای فایل شما را تشخیص داده و آن را به متن تبدیل می کند
- متن استخراج شده را به صورت فایل متنی خام دانلود کنید یا از طریق API ادغام کنید
فهرست مندرجات
در اینجا سه روش پیشرفته وجود دارد که در آنها می توانید از OCR Nanonets برای شناسایی و استخراج متن از تصاویر استفاده کنید. استخراج متن از PDFs, استخراج داده ها از PDFو یا فایل های PDF را تجزیه کنید و انواع دیگر اسناد:
به یک OCR آنلاین رایگان برای تصویر به متن, PDF به جدول, PDF به متن، یا استخراج اطلاعات PDF? Nanonets را به صورت آنلاین بررسی کنید OCR API در عمل و شروع به ساخت مدل های سفارشی OCR به صورت رایگان!
Nanonets دارای مدلهای OCR از پیش آموزشدیده برای انواع عکسهای خاص ذکر شده در زیر است. هر مدل OCR از پیش آموزش داده شده برای ارتباط دقیق متن در نوع تصویر با یک فیلد مناسب مانند نام، آدرس، تاریخ، انقضا و غیره آموزش داده شده است و متن استخراج شده را به شیوه ای منظم و منظم ارائه می دهد.
- فاکتورها
- رسید
- گواهینامه رانندگی (ایالات متحده)
- گذرنامه
نانوت OCR و OCR API آنلاین بسیاری از جالب است موارد استفاده.
مرحله 1: یک مدل OCR مناسب را انتخاب کنید
ورود به Nanonets بروید و یک مدل OCR مناسب با تصویری که می خواهید متن و داده را از آن استخراج کنید، انتخاب کنید. اگر هیچ یک از مدل های OCR از پیش آموزش دیده مطابق با نیازهای شما نیست، می توانید برای اطلاع از نحوه ایجاد یک مدل OCR سفارشی از ادامه راه رد شوید.
مرحله 2: اضافه کردن فایل ها
فایل ها/تصاویری را که می خواهید متن را از آنها استخراج کنید اضافه کنید. می توانید هر تعداد عکس که دوست دارید اضافه کنید.
مرحله 3: تست
چند ثانیه زمان بگذارید تا مدل اجرا شود و متن را از تصویر استخراج کنید.
مرحله 4: تأیید کنید
با بررسی نمای جدول در سمت راست، متن استخراج شده از هر فایل را به سرعت بررسی کنید. شما به راحتی می توانید بررسی کنید که آیا متن به درستی تشخیص داده شده و با یک فیلد یا برچسب مناسب مطابقت داده شده است.
حتی میتوانید در این مرحله مقادیر و برچسبهای فیلد را ویرایش/تصحیح کنید. نانوشبکه ها به الگوی تصویر محدود نمی شوند.
داده های استخراج شده را می توان در قالب "نمایش لیست" یا "JSON" نمایش داد.
میتوانید کنار هر مقدار یا فیلدی را که تأیید میکنید علامت بزنید یا روی «تأیید دادهها» کلیک کنید تا فوراً ادامه دهید.
مرحله 5: صادرات
پس از تایید تمامی فایل ها میتوانید دادههای منظم سازمانیافته را بهعنوان یک فایل xml، xlsx یا csv صادر کنید.
نانو شبکه ها جالب است موارد استفاده و منحصر به فرد داستان موفقیت مشتری. بیابید که چگونه نانوشبکه ها می توانند به کسب و کار شما برای بهره وری بیشتر کمک کنند.
ساخت یک مدل OCR سفارشی با نانو شبکه ها آسان است. شما معمولاً می توانید یک مدل را برای هر نوع تصویر یا سند، به هر زبانی، در کمتر از 25 دقیقه بسازید، آموزش دهید و اجرا کنید (بسته به تعداد فایل های استفاده شده برای آموزش مدل).
برای انجام 4 مرحله اول در این روش ویدیوی زیر را تماشا کنید:
مرحله 1: مدل OCR خود را ایجاد کنید
ورود به Nanonets بروید و روی “Create your own OCR model” کلیک کنید.
مرحله 2: آپلود فایل ها/تصاویر آموزشی
فایل های نمونه ای را بارگذاری کنید که برای آموزش مدل های OCR استفاده می شود. دقت مدل OCR که میسازید تا حد زیادی به کیفیت و کمیت فایلها/تصاویر آپلود شده در این مرحله بستگی دارد.
مرحله 3: متن روی فایل ها/تصاویر حاشیه نویسی کنید
اکنون هر قطعه از متن یا داده را با یک فیلد یا برچسب مناسب حاشیه نویسی کنید. این مرحله مهم به مدل OCR شما می آموزد که متن مناسب را از تصاویر استخراج کند و آن را با فیلدهای سفارشی مرتبط با نیازهای شما مرتبط کند.
همچنین می توانید یک برچسب جدید برای حاشیه نویسی متن یا داده ها اضافه کنید. به یاد داشته باشید، نانوشبکه ها به الگوی تصویر محدود نمی شوند!
مرحله 4: مدل OCR سفارشی را آموزش دهید
پس از تکمیل حاشیه نویسی برای همه فایل ها/تصاویر آموزشی، روی "Train Model" کلیک کنید. آموزش معمولا بین 20 دقیقه تا 2 ساعت بسته به تعداد فایل ها و مدل های در صف برای آموزش طول می کشد. تو می توانی ارتقاء به یک برنامه پولی برای دریافت نتایج سریعتر در این مرحله (معمولاً کمتر از 20 دقیقه).
نانوشبکهها از یادگیری عمیق برای ساخت مدلهای مختلف OCR استفاده میکنند و آنها را در مقابل یکدیگر برای دقت آزمایش میکنند. سپس Nanonets بهترین مدل OCR را (بر اساس ورودیها و سطوح دقت) انتخاب میکند.
برگه «متریک مدل» اندازهگیریهای مختلف و تجزیه و تحلیلهای مقایسهای را نشان میدهد که به نانوشبکهها اجازه میدهد بهترین مدل OCR را از بین تمام مدلهای ساخته شده انتخاب کنند. می توانید مدل را مجدداً آموزش دهید (با ارائه طیف وسیع تری از تصاویر آموزشی و حاشیه نویسی بهتر) تا به سطوح بالاتری از دقت دست یابید.
یا، اگر از دقت راضی هستید، برای آزمایش و بررسی اینکه آیا این مدل OCR سفارشی روی نمونهای از تصاویر یا فایلهایی که متن/دادهها باید از آن استخراج شود، مطابق انتظار عمل میکند، روی «تست» کلیک کنید.
مرحله 5: داده ها را آزمایش و تأیید کنید
برای آزمایش و تأیید مدل OCR سفارشی، چند تصویر نمونه اضافه کنید.
اگر متن شناسایی، استخراج و ارائه شده است، فایل را صادر کنید. همانطور که در زیر مشاهده می کنید، داده های استخراج شده در قالب منظمی سازماندهی و ارائه شده است.
تبریک میگوییم، شما اکنون یک مدل OCR سفارشی برای استخراج متن از انواع خاصی از تصاویر ساختهاید و آموزش دادهاید!
آیا کسب و کار شما با تشخیص متن در اسناد دیجیتال، تصاویر یا PDF سروکار دارد؟ آیا به این فکر کرده اید که چگونه می توان متن را از تصاویر به طور دقیق استخراج کرد؟
مدل های OCR خود را با NanoNets API آموزش دهید
در اینجا یک راهنمای دقیق برای آموزش مدل های OCR خود را با استفاده از Nanonets APIاست. در مستندات، نمونههای کد آماده در Python، Shell، Ruby، Golang، Java و C# و همچنین مشخصات API دقیق برای نقاط پایانی مختلف را خواهید یافت.
در اینجا یک راهنمای گام به گام برای آموزش مدل خود با استفاده از Nanonets API آورده شده است:
مرحله 1: Repo را شبیه سازی کنید
git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm
مرحله 2: کلید API رایگان خود را دریافت کنید
کلید API رایگان خود را از اینجا دریافت کنید https://app.nanonets.com/#/keys
مرحله 3: کلید API را به عنوان یک محیط متغیر تنظیم کنید
export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
مرحله 4: یک مدل جدید ایجاد کنید
python ./code/create-model.py
توجه: این یک MODEL_ID را ایجاد می کند که برای مرحله بعدی به آن نیاز دارید
مرحله 5: شناسه مدل را به عنوان متغیر محیط اضافه کنید
export NANONETS_MODEL_ID=YOUR_MODEL_ID
مرحله 6: داده های آموزش را بارگذاری کنید
تصاویر شیئی را که می خواهید تشخیص دهید جمع آوری کنید. هنگامی که مجموعه داده را در پوشه آماده کردید images
(فایل های تصویری)، آپلود مجموعه داده را شروع کنید.
python ./code/upload-training.py
مرحله 7: مدل قطار
پس از بارگذاری تصاویر ، آموزش مدل را شروع کنید
python ./code/train-model.py
مرحله 8: حالت مدل را دریافت کنید
آموزش این مدل حدود 30 دقیقه طول می کشد. پس از آموزش مدل، ایمیلی دریافت خواهید کرد. در همین حین شما وضعیت مدل را بررسی می کنید
watch -n 100 python ./code/model-state.py
مرحله 9: پیش بینی کنید
پس از آموزش مدل. با استفاده از مدل می توانید پیش بینی کنید
python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg
مزایای استفاده از نانو شبکه ها نسبت به سایر API های OCR فراتر از دقت بهتر در استخراج متن از تصاویر است. در اینجا 7 دلیل وجود دارد که چرا باید به جای آن از OCR Nanonets برای تشخیص متن استفاده کنید:
1. کار با داده های سفارشی
اکثر نرم افزارهای OCR از نظر نوع داده هایی که می توانند با آنها کار کنند کاملاً سفت و سخت هستند. آموزش یک مدل OCR برای یک مورد استفاده نیاز به درجه زیادی از انعطاف پذیری با توجه به الزامات و مشخصات آن دارد. OCR برای پردازش فاکتور بسیار با OCR برای گذرنامه متفاوت است! نانوشبکه ها به چنین محدودیت های سفت و سختی محدود نمی شوند. Nanonets از دادههای خود برای آموزش مدلهای OCR استفاده میکند که به بهترین وجه برای پاسخگویی به نیازهای خاص کسبوکار شما مناسب هستند.
2. کار با غیر انگلیسی یا چند زبان
از آنجایی که Nanonets بر روی آموزش با داده های سفارشی تمرکز می کند، به طور منحصر به فردی برای ساخت یک مدل OCR واحد قرار دارد که می تواند متن را از تصاویر به هر زبان یا چندین زبان به طور همزمان استخراج کند.
3. نیازی به پس پردازش ندارد
متن استخراج شده با استفاده از مدل های OCR باید به طور هوشمندانه ساختار یافته و در قالبی قابل فهم ارائه شود. در غیر این صورت زمان و منابع قابل توجهی صرف سازماندهی مجدد داده ها به اطلاعات معنادار می شود. در حالی که اکثر ابزارهای OCR به سادگی داده ها را از تصاویر می گیرند و می ریزند، Nanonets فقط داده های مربوطه را استخراج می کند و به طور خودکار آنها را در زمینه هایی با ساختار هوشمند مرتب می کند که مشاهده و درک آن را آسان تر می کند.
4. پیوسته یاد می گیرد
کسب و کارها اغلب با نیازها و نیازها به طور پویا در حال تغییر روبرو هستند. برای غلبه بر موانع احتمالی، Nanonets به شما این امکان را می دهد که به راحتی مدل های خود را با داده های جدید دوباره آموزش دهید. این به مدل OCR شما اجازه می دهد تا با تغییرات پیش بینی نشده سازگار شود.
5. محدودیت های داده رایج را به راحتی مدیریت می کند
نانوشبکهها از تکنیکهای هوش مصنوعی، ML و یادگیری عمیق برای غلبه بر محدودیتهای رایج داده که به شدت بر تشخیص و استخراج متن تأثیر میگذارند، استفاده میکنند. نانوشبکههای OCR میتوانند متن دستنویس، تصاویر متن به چندین زبان، تصاویر با وضوح پایین، تصاویر با فونتهای جدید یا خط شکسته و اندازههای مختلف، تصاویر با متن سایهدار، متن کجشده، متن بدون ساختار تصادفی، نویز تصویر، تصاویر تار را شناسایی و مدیریت کند. و بیشتر. APIهای OCR سنتی برای عملکرد تحت چنین محدودیتهایی مجهز نیستند. آنها به داده هایی در سطح بسیار بالایی از وفاداری نیاز دارند که در سناریوهای زندگی واقعی معمول نیست.
6. به هیچ تیم داخلی از توسعه دهندگان نیاز ندارد
نیازی به نگرانی در مورد استخدام توسعه دهندگان و به دست آوردن استعداد برای شخصی سازی Nanonets API برای نیازهای تجاری خود نیست. نانو شبکه ها برای یکپارچه سازی بدون دردسر ساخته شده اند. همچنین می توانید به راحتی نانو شبکه ها را با اکثر نرم افزارهای CRM، ERP یا RPA ادغام کنید.
7. سفارشی کردن، سفارشی کردن، سفارشی کردن
می توانید هر تعداد فیلد متن/داده ای را که دوست دارید با Nanonets OCR ضبط کنید. حتی میتوانید قوانین اعتبارسنجی سفارشی بسازید که برای شناسایی متن و الزامات استخراج متن خاص شما کار میکنند. Nanonets به هیچ وجه به الگوی سند شما محدود نمی شود. شما می توانید داده ها را در جداول یا آیتم های خط یا هر فرمت دیگری ضبط کنید!
Nanonets موارد استفاده زیادی دارد که می تواند عملکرد کسب و کار شما را بهینه کند، در هزینه ها صرفه جویی کند و رشد را افزایش دهد. پیدا کردن چگونه موارد استفاده نانوشبکه ها می تواند برای محصول شما اعمال شود.
یا بررسی کنید نانوت OCR API در عمل و شروع به ساختن سفارشی کنید OCR مدل های رایگان!
بروزرسانی جولای 2022: این پست در ابتدا در اکتبر 2020 و از آن زمان به روز شده است به طور منظم.
اینجا یک اسلاید است خلاصه ای از یافته های این مقاله اینجا یک نسخه جایگزین از این پست
- AI
- هوش مصنوعی و یادگیری ماشین
- آی هنر
- مولد هنر ai
- ربات ai
- هوش مصنوعی
- گواهی هوش مصنوعی
- هوش مصنوعی در بانکداری
- ربات هوش مصنوعی
- ربات های هوش مصنوعی
- نرم افزار هوش مصنوعی
- بلاکچین
- کنفرانس بلاک چین ai
- coingenius
- هوش مصنوعی محاوره ای
- کنفرانس کریپتو ai
- دل-ه
- یادگیری عمیق
- گوگل ai
- فراگیری ماشین
- OCR
- افلاطون
- افلاطون آی
- هوش داده افلاطون
- بازی افلاطون
- PlatoData
- بازی پلاتو
- مقیاس Ai
- نحو
- تشخیص متن
- زفیرنت