تصویر سے متن یا ڈیٹا کیسے نکالا جائے۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

تصویر سے متن نکالنا ایک مشکل عمل ہوسکتا ہے۔ زیادہ تر لوگ تصویر کے متن/ڈیٹا میں دستی طور پر کلید کرتے ہیں۔ لیکن جب آپ کے پاس بہت ساری تصاویر ہوں تو یہ وقت طلب اور ناکارہ ہے۔

ٹیکسٹ کنورٹرز میں تصویر تصاویر سے متن نکالنے کا ایک صاف طریقہ پیش کرتے ہیں۔

اگرچہ ایسے ٹولز اچھا کام کرتے ہیں، لیکن نکالا گیا متن/ڈیٹا اکثر غیر ساختہ انداز میں پیش کیا جاتا ہے جس کے نتیجے میں بہت زیادہ پوسٹ پروسیسنگ ہوتی ہے۔

An AI سے چلنے والا OCR جیسے Nanonets تصاویر سے متن کھینچ سکتے ہیں اور نکالے گئے ڈیٹا کو صاف، منظم اور منظم انداز میں پیش کر سکتے ہیں۔

Nanonets درست طریقے سے، پیمانے پر، اور متعدد زبانوں میں تصاویر سے ڈیٹا نکالتا ہے۔ Nanonets واحد ٹیکسٹ ریکگنیشن OCR ہے جو نکالے گئے متن کو صاف ستھرا ڈھانچہ والے فارمیٹس میں پیش کرتا ہے جو مکمل طور پر حسب ضرورت ہیں۔ پکڑے گئے ڈیٹا کو ٹیبل، لائن آئٹمز، یا کسی دوسرے فارمیٹ کے طور پر پیش کیا جا سکتا ہے۔

نیچے اپنی تصویر اپ لوڈ کرنے کے لیے کلک کریں۔
Nanonets کا OCR خود بخود آپ کی فائل میں موجود مواد کو پہچانتا ہے اور اسے متن میں بدل دیتا ہے۔
نکالے گئے متن کو خام ٹیکسٹ فائل کے طور پر ڈاؤن لوڈ کریں یا API کے ذریعے انٹیگریٹ کریں۔

کی میز کے مندرجات

یہاں تین جدید طریقے ہیں جن میں آپ تصاویر سے متن کا پتہ لگانے اور نکالنے کے لیے Nanonets OCR استعمال کر سکتے ہیں، پی ڈی ایف سے متن نکالیںs, پی ڈی ایف سے ڈیٹا نکالیں۔یا پی ڈی ایف کو پارس کریں۔ اور دیگر دستاویزات کی اقسام:

Nanonets کا استعمال کرتے ہوئے تصویر سے متن نکالنا

کے لیے ایک مفت آن لائن OCR کی ضرورت ہے۔ تصویر سے متن, پی ڈی ایف ٹو ٹیبل, پی ڈی ایف ٹو ٹیکسٹ، یا پی ڈی ایف ڈیٹا نکالنا? Nanonets آن لائن چیک کریں۔ OCR API ایکشن میں اور مفت میں اپنی مرضی کے مطابق OCR ماڈل بنانا شروع کریں!

Nanonets نے ذیل میں درج مخصوص تصویری اقسام کے لیے پہلے سے تربیت یافتہ OCR ماڈلز ہیں۔ ہر پہلے سے تربیت یافتہ OCR ماڈل کو تربیت دی جاتی ہے کہ وہ تصویر کی قسم میں متن کو ایک مناسب فیلڈ جیسے نام، پتہ، تاریخ، ایکسپائری وغیرہ سے درست طریقے سے منسلک کرے اور نکالے گئے متن کو صاف اور منظم انداز میں پیش کرے۔

انوائس
رسیدیں
ڈرائیونگ لائسنس (امریکہ)
پاسپورٹ

نانونٹس آن لائن OCR اور OCR API بہت سے دلچسپ ہیں مقدمات کا استعمال کریں.

[سرایت مواد]

نانونٹس رسیدوں کی تصاویر سے متن نکال رہے ہیں۔

مرحلہ 1: ایک مناسب OCR ماڈل منتخب کریں۔

لاگ ان Nanonets پر جائیں اور ایک OCR ماڈل منتخب کریں جو اس تصویر کے لیے موزوں ہو جس سے آپ متن اور ڈیٹا نکالنا چاہتے ہیں۔ اگر پہلے سے تربیت یافتہ OCR ماڈلز میں سے کوئی بھی آپ کی ضروریات کے مطابق نہیں ہے، تو آپ اپنی مرضی کے مطابق OCR ماڈل بنانے کا طریقہ معلوم کرنے کے لیے آگے بڑھ سکتے ہیں۔

مرحلہ 2: فائلیں شامل کریں۔

وہ فائلیں/تصاویر شامل کریں جن سے آپ متن نکالنا چاہتے ہیں۔ آپ جتنی چاہیں تصاویر شامل کر سکتے ہیں۔

مرحلہ 3: ٹیسٹ

ماڈل کو چلنے اور تصویر سے متن نکالنے کے لیے چند سیکنڈ کی اجازت دیں۔

مرحلہ 4: تصدیق کریں۔

دائیں جانب ٹیبل ویو کو چیک کرکے، ہر فائل سے نکالے گئے متن کی فوری تصدیق کریں۔ آپ آسانی سے دو بار چیک کر سکتے ہیں کہ آیا متن کو صحیح طریقے سے پہچانا گیا ہے اور مناسب فیلڈ یا ٹیگ کے ساتھ ملایا گیا ہے۔

یہاں تک کہ آپ اس مرحلے پر فیلڈ ویلیوز اور لیبلز میں ترمیم/درست کرنے کا انتخاب بھی کر سکتے ہیں۔ Nanonets تصویر کے سانچے کا پابند نہیں ہے۔

نکالا گیا ڈیٹا "لسٹ ویو" یا "JSON" فارمیٹ میں دکھایا جا سکتا ہے۔

تصویر پلیٹو بلاکچین ڈیٹا انٹیلی جنس سے متن یا ڈیٹا کیسے نکالا جائے۔ عمودی تلاش۔ عی — نکالا ہوا متن فہرست یا JSON آؤٹ پٹ کے بطور ظاہر ہوتا ہے۔

آپ جس قدر یا فیلڈ کی تصدیق کرتے ہیں اس کے ساتھ والے چیک باکس پر نشان لگا سکتے ہیں یا فوری طور پر آگے بڑھنے کے لیے "ڈیٹا کی تصدیق کریں" پر کلک کر سکتے ہیں۔

مرحلہ 5: برآمد کریں۔

تمام فائلوں کی تصدیق ہونے کے بعد۔ آپ xml، xlsx یا csv فائل کے طور پر صاف ستھرا منظم ڈیٹا برآمد کر سکتے ہیں۔

Nanonets دلچسپ ہے مقدمات کا استعمال کریں اور منفرد گاہک کی کامیابی کی کہانیاں. معلوم کریں کہ Nanonets آپ کے کاروبار کو مزید نتیجہ خیز بنانے کے لیے کس طرح طاقت دے سکتے ہیں۔

Nanonets کے ساتھ اپنی مرضی کے مطابق OCR ماڈل بنانا آسان ہے۔ آپ عام طور پر کسی بھی تصویر یا دستاویز کی قسم کے لیے، کسی بھی زبان میں، 25 منٹ سے کم وقت میں (ماڈل کو تربیت دینے کے لیے استعمال ہونے والی فائلوں کی تعداد پر منحصر ہے) کے لیے ماڈل بنا، تربیت اور تعینات کر سکتے ہیں۔

اس طریقے کے پہلے 4 مراحل پر عمل کرنے کے لیے نیچے دی گئی ویڈیو دیکھیں:

[سرایت مواد]

Nanonets کے ساتھ اپنے OCR ماڈل کی تربیت کیسے کریں۔

مرحلہ 1: اپنا OCR ماڈل بنائیں

لاگ ان Nanonets پر جائیں اور "اپنا اپنا OCR ماڈل بنائیں" پر کلک کریں۔

مرحلہ 2: تربیتی فائلیں/تصاویر اپ لوڈ کریں۔

نمونہ فائلیں اپ لوڈ کریں جو OCR ماڈلز کو تربیت دینے کے لیے استعمال ہوں گی۔ آپ کے بنائے ہوئے OCR ماڈل کی درستگی کا انحصار اس مرحلے پر اپ لوڈ کی گئی فائلوں/تصاویر کے معیار اور مقدار پر ہوگا۔

مرحلہ 3: فائلوں/تصاویر پر متن کی تشریح کریں۔

اب متن یا ڈیٹا کے ہر ٹکڑے کو مناسب فیلڈ یا لیبل کے ساتھ تشریح کریں۔ یہ اہم قدم آپ کے OCR ماڈل کو تصاویر سے مناسب متن نکالنے اور اسے اپنی ضروریات کے مطابق اپنی مرضی کے شعبوں کے ساتھ منسلک کرنا سکھائے گا۔

آپ متن یا ڈیٹا کی تشریح کے لیے ایک نیا لیبل بھی شامل کر سکتے ہیں۔ یاد رکھیں، Nanonets تصویر کے سانچے کا پابند نہیں ہے!

مرحلہ 4: حسب ضرورت OCR ماڈل کو تربیت دیں۔

تمام تربیتی فائلوں/تصاویر کے لیے تشریح مکمل ہونے کے بعد، "ٹرین ماڈل" پر کلک کریں۔ ٹریننگ میں عام طور پر فائلوں کی تعداد اور ٹریننگ کے لیے قطار میں لگے ماڈلز کے لحاظ سے 20 منٹ سے 2 گھنٹے لگتے ہیں۔ آپ کر سکتے ہیں۔ اپ گریڈ اس مرحلے پر تیز تر نتائج حاصل کرنے کے لیے ایک بامعاوضہ منصوبے کے لیے (عام طور پر 20 منٹ سے کم)۔

Nanonets مختلف OCR ماڈلز بنانے کے لیے گہری سیکھنے کا فائدہ اٹھاتا ہے اور درستگی کے لیے ایک دوسرے کے خلاف ٹیسٹ کرتا ہے۔ Nanonets پھر بہترین OCR ماڈل (آپ کے ان پٹ اور درستگی کی سطح کی بنیاد پر) چنتا ہے۔

"ماڈل میٹرکس" ٹیب مختلف پیمائشوں اور تقابلی تجزیوں کو دکھاتا ہے جس کی وجہ سے نانونٹس کو ان تمام چیزوں میں سے بہترین OCR ماڈل منتخب کرنے کا موقع ملا جو بنایا گیا تھا۔ آپ اعلی درجے کی درستگی حاصل کرنے کے لیے ماڈل کو دوبارہ تربیت دے سکتے ہیں (تربیتی امیجز کی وسیع رینج اور بہتر تشریح فراہم کر کے)۔

یا، اگر آپ درستگی سے مطمئن ہیں، تو جانچ اور تصدیق کرنے کے لیے "ٹیسٹ" پر کلک کریں کہ آیا یہ کسٹم OCR ماڈل تصویروں یا فائلوں کے نمونے پر توقع کے مطابق کارکردگی کا مظاہرہ کرتا ہے جس سے ٹیکسٹ/ڈیٹا نکالنے کی ضرورت ہے۔

مرحلہ 5: ڈیٹا کی جانچ اور تصدیق کریں۔

حسب ضرورت OCR ماڈل کی جانچ اور تصدیق کے لیے کچھ نمونے کی تصاویر شامل کریں۔

نکالے گئے متن کی درستگی کی تصدیق کریں۔ — نکالے گئے متن کی درستگی کی جانچ اور تصدیق کریں۔

اگر متن کو پہچان لیا گیا ہے، نکالا گیا ہے اور مناسب طریقے سے پیش کیا گیا ہے تو فائل کو برآمد کریں۔ جیسا کہ آپ نیچے دیکھ سکتے ہیں، نکالے گئے ڈیٹا کو منظم اور صاف شکل میں پیش کیا گیا ہے۔

مبارک ہو، اب آپ نے مخصوص قسم کی تصاویر سے متن نکالنے کے لیے ایک حسب ضرورت OCR ماڈل بنایا اور تربیت دی ہے!

کیا آپ کا کاروبار ڈیجیٹل دستاویزات، تصاویر یا پی ڈی ایف میں ٹیکسٹ کی شناخت سے متعلق ہے؟ کیا آپ نے سوچا ہے کہ تصویروں سے متن کو درست طریقے سے کیسے نکالا جائے؟

NanoNets API کے ساتھ اپنے OCR ماڈلز کو تربیت دیں۔

یہاں ایک ہے تربیت کے لیے تفصیلی گائیڈ کا استعمال کرتے ہوئے آپ کے اپنے OCR ماڈلز Nanonets API. میں دستاویزات، آپ کو Python، Shell، Ruby، Golang، Java، اور C# میں کوڈ کے نمونے فائر کرنے کے لیے تیار ملیں گے، نیز مختلف اینڈ پوائنٹس کے لیے تفصیلی API چشمی بھی۔

Nanonets API کا استعمال کرتے ہوئے آپ کے اپنے ماڈل کی تربیت کے لیے یہاں ایک مرحلہ وار گائیڈ ہے:

مرحلہ 1: ریپو کو کلون کریں۔

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

مرحلہ 2: اپنی مفت API کلید حاصل کریں۔

سے اپنی مفت API کلید حاصل کریں۔ https://app.nanonets.com/#/keys

مرحلہ 3: API کلید کو ماحولیاتی متغیر کے طور پر سیٹ کریں۔

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

مرحلہ 4: ایک نیا ماڈل بنائیں

python ./code/create-model.py

نوٹ: یہ ایک MODEL_ID تیار کرتا ہے جس کی آپ کو اگلے مرحلے کے لیے ضرورت ہے۔

مرحلہ 5: ماڈل آئی ڈی کو ماحولیاتی متغیر کے طور پر شامل کریں۔

export NANONETS_MODEL_ID=YOUR_MODEL_ID

مرحلہ 6: ٹریننگ ڈیٹا اپ لوڈ کریں۔

آپ جس چیز کا پتہ لگانا چاہتے ہیں اس کی تصاویر جمع کریں۔ ایک بار جب آپ فولڈر میں ڈیٹاسیٹ تیار کرلیں۔ images (تصویری فائلیں)، ڈیٹاسیٹ اپ لوڈ کرنا شروع کریں۔

python ./code/upload-training.py

مرحلہ 7: ٹرین ماڈل

امیجز اپ لوڈ ہونے کے بعد، ماڈل کی تربیت شروع کریں۔

python ./code/train-model.py

مرحلہ 8: ماڈل اسٹیٹ حاصل کریں۔

ماڈل کو تربیت دینے میں ~30 منٹ لگتے ہیں۔ ماڈل کی تربیت کے بعد آپ کو ایک ای میل موصول ہوگی۔ اس دوران آپ ماڈل کی حالت چیک کرتے ہیں۔

watch -n 100 python ./code/model-state.py

مرحلہ 9: پیشن گوئی کریں

ایک بار جب ماڈل کو تربیت دی جاتی ہے۔ آپ ماڈل کا استعمال کرتے ہوئے پیشین گوئیاں کر سکتے ہیں۔

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

دیگر OCR APIs پر Nanonets استعمال کرنے کے فوائد تصاویر سے متن نکالنے کے حوالے سے بہتر درستگی سے آگے ہیں۔ یہاں 7 وجوہات ہیں جن کی بجائے آپ کو متن کی شناخت کے لیے Nanonets OCR استعمال کرنے پر غور کرنا چاہیے:

1. حسب ضرورت ڈیٹا کے ساتھ کام کرنا

زیادہ تر OCR سافٹ ویئر ڈیٹا کی قسم پر کافی سخت ہوتے ہیں جس کے ساتھ وہ کام کر سکتے ہیں۔ استعمال کے کیس کے لیے OCR ماڈل کی تربیت کے لیے اس کی ضروریات اور تصریحات کے حوالے سے بڑی حد تک لچک کی ضرورت ہوتی ہے۔ انوائس پروسیسنگ کے لیے ایک OCR پاسپورٹ کے لیے OCR سے کافی مختلف ہوگا! Nanonets اس طرح کی سخت حدود کا پابند نہیں ہے۔ Nanonets OCR ماڈلز کو تربیت دینے کے لیے آپ کا اپنا ڈیٹا استعمال کرتا ہے جو آپ کے کاروبار کی مخصوص ضروریات کو پورا کرنے کے لیے بہترین ہیں۔

2. غیر انگریزی یا متعدد زبانوں کے ساتھ کام کرنا

چونکہ Nanonets اپنی مرضی کے اعداد و شمار کے ساتھ تربیت پر توجہ مرکوز کرتا ہے، اسے منفرد طور پر ایک واحد OCR ماڈل بنانے کے لیے رکھا گیا ہے جو ایک ہی وقت میں کسی بھی زبان یا متعدد زبانوں میں تصاویر سے متن نکال سکتا ہے۔

3. پوسٹ پروسیسنگ کی ضرورت نہیں ہے۔

OCR ماڈلز کا استعمال کرتے ہوئے نکالے گئے متن کو ذہانت سے ڈھانچے اور ایک قابل فہم شکل میں پیش کرنے کی ضرورت ہے۔ بصورت دیگر ڈیٹا کو بامعنی معلومات میں دوبارہ ترتیب دینے میں کافی وقت اور وسائل گزر جاتے ہیں۔ جب کہ زیادہ تر OCR ٹولز تصاویر سے ڈیٹا کو آسانی سے پکڑتے اور پھینک دیتے ہیں، Nanonets صرف متعلقہ ڈیٹا کو نکالتا ہے اور خود بخود انہیں ذہین ساختہ فیلڈز میں ترتیب دیتا ہے جس سے اسے دیکھنا اور سمجھنا آسان ہو جاتا ہے۔

4. مسلسل سیکھتا ہے۔

کاروبار اکثر متحرک طور پر بدلتی ہوئی ضروریات اور ضروریات کا سامنا کرتے ہیں۔ ممکنہ رکاوٹوں پر قابو پانے کے لیے، Nanonets آپ کو آسانی سے اپنے ماڈلز کو نئے ڈیٹا کے ساتھ دوبارہ تربیت دینے کی اجازت دیتا ہے۔ یہ آپ کے OCR ماڈل کو غیر متوقع تبدیلیوں کے مطابق ڈھالنے کی اجازت دیتا ہے۔

5. ڈیٹا کی عام رکاوٹوں کو آسانی سے ہینڈل کرتا ہے۔

Nanonets عام ڈیٹا کی رکاوٹوں پر قابو پانے کے لیے AI، ML اور گہری سیکھنے کی تکنیکوں کا فائدہ اٹھاتا ہے جو متن کی شناخت اور نکالنے پر بہت زیادہ اثر انداز ہوتے ہیں۔ Nanonets OCR ہاتھ سے لکھے ہوئے متن، متعدد زبانوں میں ایک ساتھ متن کی تصاویر، کم ریزولوشن والی تصاویر، نئے یا کرسیو فونٹس اور مختلف سائز والی تصاویر، سایہ دار متن والی تصاویر، جھکا ہوا متن، بے ترتیب غیر ساختہ متن، تصویری شور، دھندلی تصاویر کو پہچان اور سنبھال سکتا ہے۔ اور مزید. روایتی OCR APIs اس طرح کی رکاوٹوں کے تحت کارکردگی کا مظاہرہ کرنے کے لیے لیس نہیں ہیں۔ انہیں انتہائی اعلی سطح پر ڈیٹا کی ضرورت ہوتی ہے جو حقیقی زندگی کے منظرناموں میں معمول نہیں ہے۔

6. ڈویلپرز کی اندرون ملک ٹیم کی ضرورت نہیں ہے۔

اپنی کاروباری ضروریات کے لیے Nanonets API کو ذاتی نوعیت کا بنانے کے لیے ڈویلپرز کی خدمات حاصل کرنے اور ٹیلنٹ حاصل کرنے کے بارے میں فکر کرنے کی ضرورت نہیں ہے۔ Nanonets کو پریشانی سے پاک انضمام کے لیے بنایا گیا تھا۔ آپ Nanonets کو زیادہ تر CRM، ERP یا RPA سافٹ ویئر کے ساتھ آسانی سے ضم کر سکتے ہیں۔

7. اپنی مرضی کے مطابق، اپنی مرضی کے مطابق، اپنی مرضی کے مطابق

آپ Nanonets OCR کے ساتھ متن/ڈیٹا کے زیادہ سے زیادہ فیلڈز کیپچر کر سکتے ہیں۔ آپ حسب ضرورت توثیق کے اصول بھی بنا سکتے ہیں جو آپ کے مخصوص متن کی شناخت اور متن نکالنے کی ضروریات کے لیے کام کرتے ہیں۔ Nanonets آپ کے دستاویز کے ٹیمپلیٹ کا بالکل پابند نہیں ہے۔ آپ ٹیبل یا لائن آئٹمز یا کسی اور فارمیٹ میں ڈیٹا حاصل کر سکتے ہیں!

Nanonets کے استعمال کے بہت سے معاملات ہیں جو آپ کی کاروباری کارکردگی کو بہتر بنا سکتے ہیں، لاگت کو بچا سکتے ہیں اور ترقی کو بڑھا سکتے ہیں۔ پتہ چلانا Nanonets کے استعمال کے معاملات آپ کی مصنوعات پر کیسے لاگو ہوسکتے ہیں۔

یا چیک کریں۔ نانونٹس OCR API کارروائی میں اور اپنی مرضی کے مطابق تعمیر شروع کریں OCR ماڈل مفت میں!

اپ ڈیٹ کریں جولائی 2022: یہ پوسٹ اصل میں شائع ہوئی تھی۔ اکتوبر 2020 اور اس کے بعد سے اپ ڈیٹ کیا گیا ہے۔ باقاعدگی سے.

یہاں ایک سلائیڈ ہے۔ اس مضمون میں نتائج کا خلاصہ۔ یہاں ایک ہے متبادل ورژن اس پوسٹ کے.

ٹائم اسٹیمپ: جولائی 17، 2022جولائی 18، 2022

ٹائم اسٹیمپ: جنوری 30، 2023