كيفية استخراج النص أو البيانات من الصورة

أعاد نشره أفلاطون

المتابعون: 0

يمكن أن يكون استخراج نص من صورة عملية مرهقة. يقوم معظم الأشخاص بإدخال النص / البيانات يدويًا من الصورة ؛ ولكن هذا يستغرق وقتًا طويلاً وغير فعال عندما يكون لديك الكثير من الصور للتعامل معها.

صورة لتحويل النص تقدم طريقة رائعة لاستخراج النص من الصور.

بينما تقوم هذه الأدوات بعمل جيد ، غالبًا ما يتم تقديم النص / البيانات المستخرجة بطريقة غير منظمة تؤدي إلى الكثير من المعالجة اللاحقة.

An OCR يحركها AI مثل شبكات النانو يمكنها سحب النص من الصور وتقديم البيانات المستخرجة بأسلوب منظم ومنظم.

تستخرج شبكات النانو البيانات من الصور بدقة وعلى نطاق واسع وبلغات متعددة. شبكات النانو هي وسيلة التعرف الضوئي على الحروف الوحيدة التي تقدم النص المستخرج بتنسيقات منظمة بدقة وقابلة للتخصيص بالكامل. يمكن تقديم البيانات الملتقطة كجداول أو عناصر سطر أو أي تنسيق آخر.

انقر لتحميل صورتك أدناه
يتعرف التعرف الضوئي على الحروف في Nanonets تلقائيًا على المحتوى في ملفك ويحوله إلى نص
قم بتنزيل النص المستخرج كملف نصي خام أو قم بدمجه عبر API

جدول المحتويات

فيما يلي ثلاث طرق متقدمة يمكنك من خلالها استخدام Nanonets OCR لاكتشاف واستخراج النص من الصور ، استخراج النص من PDFs, استخراج البيانات من ملف PDFق أو تحليل ملفات PDF وأنواع المستندات الأخرى:

استخراج نص من صورة باستخدام شبكات النانو

تحتاج إلى OCR مجاني عبر الإنترنت لـ صورة إلى نص, PDF إلى الجدول, PDF إلى نصالطرق أو استخراج بيانات PDF؟ تحقق من Nanonets على الإنترنت واجهة برمجة تطبيقات OCR في العمل وابدأ في إنشاء نماذج OCR مخصصة مجانًا!

تحتوي شبكات النانو على نماذج التعرف الضوئي على الحروف مدربة مسبقًا لأنواع الصور المحددة المدرجة أدناه. يتم تدريب كل نموذج OCR مدرب مسبقًا لربط النص في نوع الصورة بدقة بالحقل المناسب مثل الاسم والعنوان والتاريخ وانتهاء الصلاحية وما إلى ذلك وتقديم النص المستخرج بطريقة منظمة ومنظمة.

الفواتير
المبالغ المستلمة
رخصة القيادة (الولايات المتحدة)
جوازات السفر

النانو OCR و OCR عبر الإنترنت لديها الكثير من الاهتمام استخدم حالات.

[المحتوى جزءا لا يتجزأ]

شبكات النانو تستخرج النص من صور الإيصالات

الخطوة 1: حدد نموذج التعرف الضوئي على الحروف المناسب

تسجيل الدخول إلى شبكات النانو وحدد نموذج التعرف الضوئي على الحروف المناسب للصورة التي تريد استخراج النص والبيانات منها. إذا لم يناسب أي من نماذج OCR المدربة مسبقًا متطلباتك ، فيمكنك التخطي إلى الأمام لمعرفة كيفية إنشاء نموذج OCR مخصص.

الخطوة 2: إضافة ملفات

أضف الملفات / الصور التي تريد استخراج النص منها. يمكنك إضافة العديد من الصور كما تريد.

الخطوة 3: اختبار

انتظر بضع ثوانٍ لتشغيل النموذج واستخراج النص من الصورة.

الخطوة 4: التحقق

تحقق بسرعة من النص المستخرج من كل ملف ، عن طريق التحقق من عرض الجدول على اليمين. يمكنك بسهولة التحقق مما إذا كان النص قد تم التعرف عليه بشكل صحيح ومطابقته مع حقل أو علامة مناسبة.

يمكنك حتى اختيار تعديل / تصحيح قيم الحقول والتسميات في هذه المرحلة. لا تلتزم شبكات النانو بقالب الصورة.

يمكن عرض البيانات المستخرجة بتنسيق "List View" أو "JSON".

كيفية استخراج نص أو بيانات من ذكاء بيانات Image PlatoBlockchain. البحث العمودي. عاي. — يتم عرض النص المستخرج كقائمة أو إخراج JSON

يمكنك تحديد مربع الاختيار بجوار كل قيمة أو حقل تتحقق منه أو النقر فوق "التحقق من البيانات" للمتابعة على الفور.

الخطوة 5: تصدير

بمجرد التحقق من جميع الملفات. يمكنك تصدير البيانات المنظمة بدقة كملف xml أو xlsx أو csv.

Nanonets لها اهتمام استخدم حالات وفريدة من نوعها قصص نجاح العملاء. اكتشف كيف يمكن للشبكات النانوية أن تدعم عملك ليكون أكثر إنتاجية.

يعد إنشاء نموذج OCR مخصص باستخدام شبكات النانو أمرًا سهلاً. يمكنك عادةً إنشاء نموذج وتدريبه ونشره لأي صورة أو نوع مستند ، بأي لغة ، كل ذلك في أقل من 25 دقيقة (اعتمادًا على عدد الملفات المستخدمة لتدريب النموذج).

شاهد الفيديو أدناه لاتباع أول 4 خطوات بهذه الطريقة:

[المحتوى جزءا لا يتجزأ]

كيفية تدريب نموذج التعرف الضوئي على الحروف الخاص بك باستخدام شبكات النانو

الخطوة 1: قم بإنشاء نموذج OCR الخاص بك

تسجيل الدخول إلى Nanonets وانقر على "إنشاء نموذج التعرف الضوئي على الحروف الخاص بك".

الخطوة الثانية: تحميل ملفات / صور التدريب

قم بتحميل نماذج الملفات التي سيتم استخدامها لتدريب نماذج التعرف الضوئي على الحروف. تعتمد دقة نموذج التعرف الضوئي على الحروف الذي تقوم ببنائه إلى حد كبير على جودة وكمية الملفات / الصور التي تم تحميلها في هذه المرحلة

الخطوة 3: علق النص على الملفات / الصور

قم الآن بتعليق كل جزء من النص أو البيانات باستخدام حقل أو تسمية مناسبة. ستعلم هذه الخطوة الحاسمة نموذج التعرف الضوئي على الحروف الخاص بك لاستخراج النص المناسب من الصور وربطه بالحقول المخصصة ذات الصلة باحتياجاتك.

يمكنك أيضًا إضافة تصنيف جديد للتعليق على النص أو البيانات. تذكر أن شبكات النانو ليست ملزمة بقالب الصورة!

الخطوة 4: تدريب نموذج OCR المخصص

بمجرد اكتمال التعليقات التوضيحية لجميع ملفات / صور التدريب ، انقر فوق "نموذج التدريب". يستغرق التدريب عادة ما بين 20 دقيقة إلى ساعتين حسب عدد الملفات والنماذج في قائمة الانتظار للتدريب. يمكنك ترقية إلى خطة مدفوعة للحصول على نتائج أسرع في هذه المرحلة (عادةً أقل من 20 دقيقة).

تستفيد شبكات النانو من التعلم العميق لبناء نماذج التعرف الضوئي على الحروف المختلفة واختبارها مقابل بعضها البعض للتأكد من دقتها. ثم تختار شبكات النانو أفضل نموذج التعرف الضوئي على الحروف (بناءً على مدخلاتك ومستويات الدقة).

تعرض علامة التبويب "مقاييس النموذج" القياسات المختلفة والتحليلات المقارنة التي سمحت للشبكات النانوية باختيار أفضل نموذج التعرف الضوئي على الحروف من بين كل ما تم إنشاؤه. يمكنك إعادة تدريب النموذج (من خلال توفير نطاق أوسع من صور التدريب وتعليقات توضيحية أفضل) لتحقيق مستويات أعلى من الدقة.

أو ، إذا كنت راضيًا عن الدقة ، فانقر فوق "اختبار" لاختبار والتحقق مما إذا كان نموذج OCR المخصص يعمل كما هو متوقع على عينة من الصور أو الملفات التي يجب استخراج النص / البيانات منها.

الخطوة 5: اختبار البيانات والتحقق منها

أضف بضع صور لاختبار نموذج التعرف الضوئي على الحروف المخصص والتحقق منه.

إذا تم التعرف على النص واستخراجه وتقديمه بشكل مناسب ، فقم بتصدير الملف. كما ترى أدناه ، تم تنظيم البيانات المستخرجة وتقديمها بتنسيق أنيق.

تهانينا ، لقد قمت الآن ببناء وتدريب نموذج OCR مخصص لاستخراج النص من أنواع معينة من الصور!

هل يتعامل عملك مع التعرف على النص في المستندات الرقمية أو الصور أو ملفات PDF؟ هل تساءلت عن كيفية استخراج النص من الصور بدقة؟

قم بتدريب نماذج التعرف الضوئي على الحروف الخاصة بك باستخدام واجهة برمجة تطبيقات NanoNets

وهنا دليل مفصل للتدريب نماذج OCR الخاصة بك باستخدام واجهة برمجة تطبيقات Nanonets. في توثيق، ستجد نماذج أكواد جاهزة لإطلاق النار في Python و Shell و Ruby و Golang و Java و C # ، بالإضافة إلى مواصفات API التفصيلية لنقاط النهاية المختلفة.

إليك دليل خطوة بخطوة لتدريب النموذج الخاص بك باستخدام Nanonets API:

الخطوة 1: استنساخ الريبو

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

الخطوة 2: احصل على مفتاح API المجاني

احصل على مفتاح API المجاني من https://app.nanonets.com/#/keys

الخطوة 3: تعيين مفتاح API كمتغير بيئة

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

الخطوة 4: إنشاء نموذج جديد

python ./code/create-model.py

ملاحظة: يؤدي هذا إلى إنشاء MODEL_ID الذي تحتاجه للخطوة التالية

الخطوة 5: إضافة معرف النموذج باسم متغير البيئة

export NANONETS_MODEL_ID=YOUR_MODEL_ID

الخطوة 6: تحميل بيانات التدريب

اجمع صور الكائن الذي تريد اكتشافه. بمجرد تجهيز مجموعة البيانات في المجلد images (ملفات الصور) ، ابدأ في تحميل مجموعة البيانات.

python ./code/upload-training.py

الخطوة 7: نموذج القطار

بمجرد تحميل الصور ، ابدأ في تدريب النموذج

python ./code/train-model.py

الخطوة 8: الحصول على حالة النموذج

يستغرق النموذج 30 دقيقة للتدريب. ستتلقى بريدًا إلكترونيًا بمجرد تدريب النموذج. في هذه الأثناء تتحقق من حالة النموذج

watch -n 100 python ./code/model-state.py

الخطوة 9: جعل التنبؤ

بمجرد تدريب النموذج. يمكنك عمل تنبؤات باستخدام النموذج

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

تتجاوز فوائد استخدام شبكات النانو على واجهات برمجة تطبيقات OCR الأخرى مجرد الدقة الأفضل فيما يتعلق باستخراج النص من الصور. فيما يلي 7 أسباب تجعلك تفكر في استخدام Nanonets OCR للتعرف على النص بدلاً من ذلك:

1. العمل مع البيانات المخصصة

معظم برامج التعرف الضوئي على الحروف جامدة تمامًا فيما يتعلق بنوع البيانات التي يمكنها العمل معها. يتطلب تدريب نموذج التعرف الضوئي على الحروف لحالة الاستخدام درجة كبيرة من المرونة فيما يتعلق بمتطلباته ومواصفاته ؛ سيختلف التعرف الضوئي على الحروف (OCR) لمعالجة الفاتورة اختلافًا كبيرًا عن التعرف الضوئي على الحروف لجوازات السفر! لا تلتزم شبكات النانو بهذه القيود الصارمة. تستخدم شبكات النانو بياناتك الخاصة لتدريب نماذج التعرف الضوئي على الحروف الأنسب لتلبية الاحتياجات الخاصة لعملك.

2. العمل مع غير الإنجليزية أو لغات متعددة

نظرًا لأن Nanonets يركز على التدريب باستخدام البيانات المخصصة ، فقد تم وضعه بشكل فريد لإنشاء نموذج OCR واحد يمكنه استخراج النص من الصور بأي لغة أو لغات متعددة في نفس الوقت.

3. لا يتطلب أي معالجة لاحقة

يجب أن يكون النص المستخرج باستخدام نماذج التعرف الضوئي على الحروف منظمًا بذكاء وتقديمه بتنسيق واضح ؛ وبخلاف ذلك ، يتم تخصيص قدر كبير من الوقت والموارد لإعادة تنظيم البيانات إلى معلومات مفيدة. في حين أن معظم أدوات التعرف الضوئي على الحروف تحصل ببساطة على البيانات وتفريغها من الصور ، تستخرج Nanonets البيانات ذات الصلة فقط وتفرزها تلقائيًا في حقول منظمة بذكاء مما يسهل عرضها وفهمها.

4. يتعلم باستمرار

غالبًا ما تواجه الشركات متطلبات واحتياجات متغيرة ديناميكيًا. للتغلب على حواجز الطرق المحتملة ، تتيح لك شبكات النانو إعادة تدريب نماذجك بسهولة باستخدام بيانات جديدة. يسمح هذا لنموذج OCR الخاص بك بالتكيف مع التغييرات غير المتوقعة.

5. يعالج قيود البيانات الشائعة بسهولة

تستفيد شبكات النانو من تقنيات الذكاء الاصطناعي والتعلم الآلي والتعلم العميق للتغلب على قيود البيانات الشائعة التي تؤثر بشكل كبير على التعرف على النص واستخراجه. يمكن لـ Nanonets OCR التعرف والتعامل مع النص المكتوب بخط اليد ، وصور النص بلغات متعددة في وقت واحد ، والصور ذات الدقة المنخفضة ، والصور ذات الخطوط الجديدة أو المخطوطة والأحجام المختلفة ، والصور ذات النص الغامض ، والنص المائل ، والنص العشوائي غير المنظم ، وتشويش الصورة ، والصور غير الواضحة و اكثر. واجهات برمجة تطبيقات OCR التقليدية ليست مجهزة للعمل في ظل هذه القيود ؛ تتطلب بيانات على مستوى عالٍ جدًا من الدقة وهذا ليس هو المعيار في سيناريوهات الحياة الواقعية.

6. لا يتطلب أي فريق داخلي من المطورين

لا داعي للقلق بشأن توظيف المطورين واكتساب المواهب لتخصيص Nanonets API لمتطلبات عملك. تم تصميم شبكات النانو لتحقيق تكامل خالٍ من المتاعب. يمكنك أيضًا دمج Nanonets بسهولة مع معظم برامج CRM أو ERP أو RPA.

7. تخصيص وتخصيص وتخصيص

يمكنك التقاط العديد من حقول النص / البيانات التي تريدها باستخدام Nanonets OCR. يمكنك أيضًا إنشاء قواعد تحقق مخصصة تعمل مع متطلبات التعرف على النص واستخراج النص المحددة. لا تلتزم شبكات النانو بقالب المستند الخاص بك على الإطلاق. يمكنك التقاط البيانات في جداول أو عناصر سطر أو أي تنسيق آخر!

تحتوي شبكات النانو على العديد من حالات الاستخدام التي يمكنها تحسين أداء عملك وتوفير التكاليف وتعزيز النمو. اكتشف كيف يمكن تطبيق حالات استخدام Nanonets على منتجك.

أو تحقق من النانو واجهة برمجة تطبيقات OCR في العمل والبدء في بناء العرف التعرف الضوئي على الحروف نماذج مجانية!

تحديث يوليو 2022: تم نشر هذا المنشور في الأصل باللغة أكتوبر 2020 ومنذ ذلك الحين تم تحديثه بانتظام.

هذه شريحة تلخيص النتائج في هذه المقالة. ها هو ملف نسخة بديلة من هذا المنصب.

الطابع الزمني: 17 تموز، 202218 تموز، 2022

الطابع الزمني: يناير 30، 2023