Cum să extrageți text sau date din imagine PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Cum să extrageți text sau date din imagine

Extragerea textului dintr-o imagine poate fi un proces greoi. Majoritatea oamenilor introduc manual textul/datele din imagine; dar acest lucru este atât consumator de timp, cât și ineficient atunci când aveți multe imagini cu care să vă ocupați.

Convertoare imagine în text oferă o modalitate ordonată de a extrage text din imagini.

În timp ce astfel de instrumente fac o treabă bună, textul/datele extrase sunt adesea prezentate într-o manieră nestructurată, ceea ce duce la o mulțime de post-procesare.

An OCR bazat pe inteligență artificială precum Nanonets poate extrage text din imagini și poate prezenta datele extrase într-un mod ordonat, organizat și structurat.

Nanonets extrage datele din imagini cu acuratețe, la scară și în mai multe limbi. Nanonets este singurul OCR de recunoaștere a textului care prezintă textul extras în formate bine structurate, care sunt complet personalizabile. Datele capturate pot fi prezentate sub formă de tabele, elemente rând sau orice alt format.

  1. Faceți clic pentru a încărca imaginea de mai jos
  2. OCR Nanonets recunoaște automat conținutul din fișierul dvs. și îl convertește în text
  3. Descărcați textul extras ca fișier text brut sau integrați prin API


Cuprins

Iată trei metode avansate în care puteți utiliza Nanonets OCR pentru a detecta și extrage text din imagini, extrageți text din PDFs, extrageți date din PDFs sau analizați PDF-urile și alte tipuri de documente:

Extragerea textului dintr-o imagine folosind Nanonets

Aveți nevoie de un OCR online gratuit pentru imagine în text, PDF pe tabel, PDF în text, Sau Extragerea datelor PDF? Consultați Nanonets online API OCR în acțiune și începeți să construiți gratuit modele OCR personalizate!


Nanonets are modele OCR pre-antrenate pentru tipurile de imagini specifice enumerate mai jos. Fiecare model OCR pre-antrenat este antrenat să relaționeze cu acuratețe textul din tipul de imagine cu un câmp adecvat, cum ar fi numele, adresa, data, expirarea etc. și să prezinte textul extras într-o manieră ordonată și organizată.

  • Facturi
  • încasări
  • Permis de conducere (SUA)
  • Pașapoartele

Nanoneți API OCR și OCR online au multe interesante cazuri de utilizare.


[Conținutul încorporat]
Nanonets care extrag text din imaginile chitanțelor

Pasul 1: Selectați un model OCR adecvat

Conectare la Nanonets și selectați un model OCR care este potrivit pentru imaginea din care doriți să extrageți text și date. Dacă niciunul dintre modelele OCR pregătite în prealabil nu corespunde cerințelor dvs., puteți sări înainte pentru a afla cum să creați un model OCR personalizat.

Pasul 2: Adăugați fișiere

Adăugați fișierele/imaginile din care doriți să extrageți text. Puteți adăuga câte imagini doriți.

Pasul 3: Încercați

Lăsați câteva secunde pentru ca modelul să ruleze și să extragă text din imagine.

Pasul 4: verificați

Verificați rapid textul extras din fiecare fișier, verificând vizualizarea tabelului din dreapta. Puteți verifica cu ușurință dacă textul a fost recunoscut corect și a fost potrivit cu un câmp sau o etichetă adecvată.

Puteți chiar să alegeți să editați/corectați valorile câmpurilor și etichetele în această etapă. Nanonets nu este legat de șablonul imaginii.

Editați textul sau datele extrase
Editați textul sau datele extrase

Datele extrase pot fi afișate într-un format „List View” sau „JSON”.

Puteți bifa caseta de selectare de lângă fiecare valoare sau câmp pe care îl verificați sau faceți clic pe „Verificați datele” pentru a continua instantaneu.

Verificați datele
Verificați datele

Pasul 5: Exportați

Odată ce toate fișierele au fost verificate. Puteți exporta datele bine organizate ca fișier xml, xlsx sau csv.

Exportați datele extrase
Exportați datele extrase

Nanonets are interesant cazuri de utilizare și unic povești de succes ale clienților. Aflați cum Nanonets vă pot ajuta afacerea să fie mai productivă.


Crearea unui model OCR personalizat cu Nanonets este ușoară. De obicei, puteți construi, antrena și implementa un model pentru orice tip de imagine sau document, în orice limbă, totul în mai puțin de 25 de minute (în funcție de numărul de fișiere utilizate pentru antrenarea modelului).

Urmăriți videoclipul de mai jos pentru a urma primii 4 pași ai acestei metode:

[Conținutul încorporat]
Cum să vă instruiți propriul model OCR cu nanoneți

Pasul 1: Creați-vă propriul model OCR

Conectare la Nanonets și faceți clic pe „Creați-vă propriul model OCR”.

Pasul 2: încărcați fișiere / imagini de antrenament

Încărcați exemple de fișiere care vor fi utilizate pentru instruirea modelelor OCR. Acuratețea modelului OCR pe care îl construiți va depinde în mare măsură de calitatea și cantitatea fișierelor / imaginilor încărcate în această etapă

Pasul 3: Adnotați text pe fișiere / imagini

Acum adnotați fiecare bucată de text sau date cu un câmp sau o etichetă corespunzătoare. Acest pas crucial vă va învăța modelul OCR să extragă textul corespunzător din imagini și să îl asocieze cu câmpuri personalizate care sunt relevante pentru nevoile dvs.

De asemenea, puteți adăuga o nouă etichetă pentru a adnota textul sau datele. Amintiți-vă, Nanonets nu este legat de șablonul imaginii!

Pasul 4: Instruiți modelul OCR personalizat

După finalizarea adnotării pentru toate fișierele / imaginile de antrenament, faceți clic pe „Modelul trenului”. Instruirea durează de obicei între 20 de minute și 2 ore, în funcție de numărul de fișiere și de modele aflate în coadă pentru instruire. Poti upgrade-ul la un plan plătit pentru a obține rezultate mai rapide în această etapă (de obicei sub 20 de minute).

Nanonets folosește învățarea profundă pentru a construi diverse modele OCR și le testează unul împotriva celuilalt pentru precizie. Nanonets alege apoi cel mai bun model OCR (pe baza intrărilor și a nivelurilor de precizie).

Fila „Metrici model” arată diferitele măsurători și analize comparative care au permis Nanonets să aleagă cel mai bun model OCR dintre toate cele construite. Puteți reantrenați modelul (prin oferirea unei game mai mari de imagini de antrenament și adnotări mai bune) pentru a obține niveluri mai mari de precizie.

Sau, dacă sunteți mulțumit de acuratețe, faceți clic pe „Testare” pentru a testa și verifica dacă acest model personalizat de OCR funcționează așa cum era de așteptat pe un eșantion de imagini sau fișiere din care textul / datele trebuie extrase.

Pasul 5: testați și verificați datele

Adăugați câteva exemplare de imagini pentru a testa și verifica modelul OCR personalizat.

Verificați acuratețea textului extras
Testați și verificați acuratețea textului extras

Dacă textul a fost recunoscut, extras și prezentat corespunzător, exportați fișierul. După cum puteți vedea mai jos, datele extrase au fost organizate și prezentate într-un format îngrijit.

Datele exportate sunt listate în mod ordonat
Datele exportate sunt listate în mod ordonat

Felicitări, acum ați construit și antrenat un model OCR personalizat pentru a extrage text din anumite tipuri de imagini!


Afacerea dumneavoastră se ocupă de recunoașterea textului în documente digitale, imagini sau PDF-uri? Te-ai întrebat cum să extragi textul din imagini cu precizie?


Antrenați-vă propriile modele OCR cu NanoNets API

Iată un ghid detaliat pentru antrenament propriile modele OCR folosind API Nanonets. În documentaţie, veți găsi exemple de cod gata de declanșare în Python, Shell, Ruby, Golang, Java și C#, precum și specificații detaliate API pentru diferite puncte finale.

Iată un ghid pas cu pas pentru antrenamentul propriului model folosind API-ul Nanonets:

Pasul 1: Clonați Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Pasul 2: Obțineți cheia API gratuită

Obțineți cheia API gratuită de la https://app.nanonets.com/#/keys

Pasul 3: Setați cheia API ca o variabilă de mediu

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Pasul 4: Creează un nou model

python ./code/create-model.py

Notă: Aceasta generează un MODEL_ID de care aveți nevoie pentru pasul următor

Pasul 5: Adăugați ID de model ca variabilă de mediu

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Pasul 6: Încărcați datele de instruire

Colectați imaginile obiectului pe care doriți să le detectați. Odată ce ai setul de date gata în folder images (fișiere imagine), începeți încărcarea setului de date.

python ./code/upload-training.py

Pasul 7: Model de tren

După ce imaginile au fost încărcate, începeți instruirea modelului

python ./code/train-model.py

Pasul 8: Obțineți starea modelului

Modelul durează ~ 30 de minute pentru a se antrena. Veți primi un e-mail după ce modelul va fi instruit. Între timp verificați starea modelului

watch -n 100 python ./code/model-state.py

Pasul 9: Faceți previziunea

Odată ce modelul este instruit. Puteți face predicții folosind modelul

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Beneficiile utilizării Nanonets față de alte API-uri OCR depășesc doar o precizie mai bună în ceea ce privește extragerea textului din imagini. Iată 7 motive pentru care ar trebui să luați în considerare utilizarea Nanonets OCR pentru recunoașterea textului:

1. Lucrul cu date personalizate

Majoritatea software-ului OCR sunt destul de rigide în ceea ce privește tipul de date cu care pot lucra. Antrenarea unui model OCR pentru un caz de utilizare necesită un grad mare de flexibilitate în ceea ce privește cerințele și specificațiile acestuia; un OCR pentru procesarea facturii va fi foarte diferit de un OCR pentru pașapoarte! Nanonets nu este legat de astfel de limitări rigide. Nanonets folosește propriile date pentru a antrena modele OCR care sunt cele mai potrivite pentru a răspunde nevoilor specifice ale afacerii dvs.

2. Lucrul cu non-engleză sau mai multe limbi

Deoarece Nanonets se concentrează pe antrenament cu date personalizate, este plasat în mod unic pentru a construi un singur model OCR care ar putea extrage text din imagini în orice limbă sau mai multe limbi în același timp.

3. Nu necesită post-procesare

Textul extras folosind modele OCR trebuie să fie structurat inteligent și prezentat într-un format inteligibil; altfel, timp și resurse considerabile sunt dedicate reorganizarii datelor în informații semnificative. În timp ce majoritatea instrumentelor OCR pur și simplu preiau și aruncă date din imagini, Nanonets extrage doar datele relevante și le sortează automat în câmpuri structurate inteligent, făcându-le mai ușor de vizualizat și înțeles.

4. Învață continuu

Afacerile se confruntă adesea cu cerințe și nevoi în schimbare dinamică. Pentru a depăși potențialele blocaje, Nanonets vă permite să vă reantrenați cu ușurință modelele cu date noi. Acest lucru permite modelului dvs. OCR să se adapteze la schimbări neprevăzute.

5. Gestionează cu ușurință constrângerile comune de date

Nanonets folosește tehnicile AI, ML și Deep Learning pentru a depăși constrângerile comune de date care afectează în mare măsură recunoașterea și extragerea textului. Nanonets OCR poate recunoaște și gestiona text scris de mână, imagini de text în mai multe limbi simultan, imagini cu rezoluție scăzută, imagini cu fonturi noi sau cursive și dimensiuni diferite, imagini cu text întunecat, text înclinat, text nestructurat aleatoriu, zgomot de imagine, imagini neclare și altele. API-urile OCR tradiționale pur și simplu nu sunt echipate pentru a funcționa sub astfel de constrângeri; au nevoie de date la un nivel foarte ridicat de fidelitate, ceea ce nu este norma în scenariile din viața reală.

6. Nu necesită o echipă internă de dezvoltatori

Nu trebuie să vă faceți griji cu privire la angajarea dezvoltatorilor și dobândirea de talent pentru a personaliza API-ul Nanonets pentru cerințele dvs. de afaceri. Nanonets a fost construit pentru o integrare fără probleme. De asemenea, puteți integra cu ușurință Nanonets cu majoritatea software-ului CRM, ERP sau RPA.

7. Personalizați, personalizați, personalizați

Puteți captura câte câmpuri de text/date doriți cu Nanonets OCR. Puteți chiar să creați reguli de validare personalizate care funcționează pentru cerințele dvs. specifice de recunoaștere și extracție a textului. Nanonets nu este deloc legat de șablonul documentului dvs. Puteți captura date în tabele sau elemente rând sau în orice alt format!


Nanonets are multe cazuri de utilizare care ar putea optimiza performanța afacerii dvs., economisi costuri și crește creșterea. Afla modul în care cazurile de utilizare Nanonets se pot aplica produsului dvs.

Sau verificați Nanoneți API OCR în acțiune și începeți să construiți personalizate OCR modele gratuit!


Actualizează iulie 2022: această postare a fost publicată inițial în octombrie 2020 și de atunci a fost actualizat regulat.

Iată un slide rezumând constatările din acest articol. Iată un versiune alternativă a acestei postări.

Timestamp-ul:

Mai mult de la AI și învățarea automată