Extragerea textului dintr-o imagine poate fi un proces greoi. Majoritatea oamenilor introduc manual textul/datele din imagine; dar acest lucru este atât consumator de timp, cât și ineficient atunci când aveți multe imagini cu care să vă ocupați.
Convertoare imagine în text oferă o modalitate ordonată de a extrage text din imagini.
În timp ce astfel de instrumente fac o treabă bună, textul/datele extrase sunt adesea prezentate într-o manieră nestructurată, ceea ce duce la o mulțime de post-procesare.
An OCR bazat pe inteligență artificială precum Nanonets poate extrage text din imagini și poate prezenta datele extrase într-un mod ordonat, organizat și structurat.
Nanonets extrage datele din imagini cu acuratețe, la scară și în mai multe limbi. Nanonets este singurul OCR de recunoaștere a textului care prezintă textul extras în formate bine structurate, care sunt complet personalizabile. Datele capturate pot fi prezentate sub formă de tabele, elemente rând sau orice alt format.
- Faceți clic pentru a încărca imaginea de mai jos
- OCR Nanonets recunoaște automat conținutul din fișierul dvs. și îl convertește în text
- Descărcați textul extras ca fișier text brut sau integrați prin API
Cuprins
Iată trei metode avansate în care puteți utiliza Nanonets OCR pentru a detecta și extrage text din imagini, extrageți text din PDFs, extrageți date din PDFs sau analizați PDF-urile și alte tipuri de documente:
Aveți nevoie de un OCR online gratuit pentru imagine în text, PDF pe tabel, PDF în text, Sau Extragerea datelor PDF? Consultați Nanonets online API OCR în acțiune și începeți să construiți gratuit modele OCR personalizate!
Nanonets are modele OCR pre-antrenate pentru tipurile de imagini specifice enumerate mai jos. Fiecare model OCR pre-antrenat este antrenat să relaționeze cu acuratețe textul din tipul de imagine cu un câmp adecvat, cum ar fi numele, adresa, data, expirarea etc. și să prezinte textul extras într-o manieră ordonată și organizată.
- Facturi
- încasări
- Permis de conducere (SUA)
- Pașapoartele
Nanoneți API OCR și OCR online au multe interesante cazuri de utilizare.
Pasul 1: Selectați un model OCR adecvat
Conectare la Nanonets și selectați un model OCR care este potrivit pentru imaginea din care doriți să extrageți text și date. Dacă niciunul dintre modelele OCR pregătite în prealabil nu corespunde cerințelor dvs., puteți sări înainte pentru a afla cum să creați un model OCR personalizat.
Pasul 2: Adăugați fișiere
Adăugați fișierele/imaginile din care doriți să extrageți text. Puteți adăuga câte imagini doriți.
Pasul 3: Încercați
Lăsați câteva secunde pentru ca modelul să ruleze și să extragă text din imagine.
Pasul 4: verificați
Verificați rapid textul extras din fiecare fișier, verificând vizualizarea tabelului din dreapta. Puteți verifica cu ușurință dacă textul a fost recunoscut corect și a fost potrivit cu un câmp sau o etichetă adecvată.
Puteți chiar să alegeți să editați/corectați valorile câmpurilor și etichetele în această etapă. Nanonets nu este legat de șablonul imaginii.
Datele extrase pot fi afișate într-un format „List View” sau „JSON”.
Puteți bifa caseta de selectare de lângă fiecare valoare sau câmp pe care îl verificați sau faceți clic pe „Verificați datele” pentru a continua instantaneu.
Pasul 5: Exportați
Odată ce toate fișierele au fost verificate. Puteți exporta datele bine organizate ca fișier xml, xlsx sau csv.
Nanonets are interesant cazuri de utilizare și unic povești de succes ale clienților. Aflați cum Nanonets vă pot ajuta afacerea să fie mai productivă.
Crearea unui model OCR personalizat cu Nanonets este ușoară. De obicei, puteți construi, antrena și implementa un model pentru orice tip de imagine sau document, în orice limbă, totul în mai puțin de 25 de minute (în funcție de numărul de fișiere utilizate pentru antrenarea modelului).
Urmăriți videoclipul de mai jos pentru a urma primii 4 pași ai acestei metode:
Pasul 1: Creați-vă propriul model OCR
Conectare la Nanonets și faceți clic pe „Creați-vă propriul model OCR”.
Pasul 2: încărcați fișiere / imagini de antrenament
Încărcați exemple de fișiere care vor fi utilizate pentru instruirea modelelor OCR. Acuratețea modelului OCR pe care îl construiți va depinde în mare măsură de calitatea și cantitatea fișierelor / imaginilor încărcate în această etapă
Pasul 3: Adnotați text pe fișiere / imagini
Acum adnotați fiecare bucată de text sau date cu un câmp sau o etichetă corespunzătoare. Acest pas crucial vă va învăța modelul OCR să extragă textul corespunzător din imagini și să îl asocieze cu câmpuri personalizate care sunt relevante pentru nevoile dvs.
De asemenea, puteți adăuga o nouă etichetă pentru a adnota textul sau datele. Amintiți-vă, Nanonets nu este legat de șablonul imaginii!
Pasul 4: Instruiți modelul OCR personalizat
După finalizarea adnotării pentru toate fișierele / imaginile de antrenament, faceți clic pe „Modelul trenului”. Instruirea durează de obicei între 20 de minute și 2 ore, în funcție de numărul de fișiere și de modele aflate în coadă pentru instruire. Poti upgrade-ul la un plan plătit pentru a obține rezultate mai rapide în această etapă (de obicei sub 20 de minute).
Nanonets folosește învățarea profundă pentru a construi diverse modele OCR și le testează unul împotriva celuilalt pentru precizie. Nanonets alege apoi cel mai bun model OCR (pe baza intrărilor și a nivelurilor de precizie).
Fila „Metrici model” arată diferitele măsurători și analize comparative care au permis Nanonets să aleagă cel mai bun model OCR dintre toate cele construite. Puteți reantrenați modelul (prin oferirea unei game mai mari de imagini de antrenament și adnotări mai bune) pentru a obține niveluri mai mari de precizie.
Sau, dacă sunteți mulțumit de acuratețe, faceți clic pe „Testare” pentru a testa și verifica dacă acest model personalizat de OCR funcționează așa cum era de așteptat pe un eșantion de imagini sau fișiere din care textul / datele trebuie extrase.
Pasul 5: testați și verificați datele
Adăugați câteva exemplare de imagini pentru a testa și verifica modelul OCR personalizat.
Dacă textul a fost recunoscut, extras și prezentat corespunzător, exportați fișierul. După cum puteți vedea mai jos, datele extrase au fost organizate și prezentate într-un format îngrijit.
Felicitări, acum ați construit și antrenat un model OCR personalizat pentru a extrage text din anumite tipuri de imagini!
Afacerea dumneavoastră se ocupă de recunoașterea textului în documente digitale, imagini sau PDF-uri? Te-ai întrebat cum să extragi textul din imagini cu precizie?
Antrenați-vă propriile modele OCR cu NanoNets API
Iată un ghid detaliat pentru antrenament propriile modele OCR folosind API Nanonets. În documentaţie, veți găsi exemple de cod gata de declanșare în Python, Shell, Ruby, Golang, Java și C#, precum și specificații detaliate API pentru diferite puncte finale.
Iată un ghid pas cu pas pentru antrenamentul propriului model folosind API-ul Nanonets:
Pasul 1: Clonați Repo
git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm
Pasul 2: Obțineți cheia API gratuită
Obțineți cheia API gratuită de la https://app.nanonets.com/#/keys
Pasul 3: Setați cheia API ca o variabilă de mediu
export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
Pasul 4: Creează un nou model
python ./code/create-model.py
Notă: Aceasta generează un MODEL_ID de care aveți nevoie pentru pasul următor
Pasul 5: Adăugați ID de model ca variabilă de mediu
export NANONETS_MODEL_ID=YOUR_MODEL_ID
Pasul 6: Încărcați datele de instruire
Colectați imaginile obiectului pe care doriți să le detectați. Odată ce ai setul de date gata în folder images
(fișiere imagine), începeți încărcarea setului de date.
python ./code/upload-training.py
Pasul 7: Model de tren
După ce imaginile au fost încărcate, începeți instruirea modelului
python ./code/train-model.py
Pasul 8: Obțineți starea modelului
Modelul durează ~ 30 de minute pentru a se antrena. Veți primi un e-mail după ce modelul va fi instruit. Între timp verificați starea modelului
watch -n 100 python ./code/model-state.py
Pasul 9: Faceți previziunea
Odată ce modelul este instruit. Puteți face predicții folosind modelul
python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg
Beneficiile utilizării Nanonets față de alte API-uri OCR depășesc doar o precizie mai bună în ceea ce privește extragerea textului din imagini. Iată 7 motive pentru care ar trebui să luați în considerare utilizarea Nanonets OCR pentru recunoașterea textului:
1. Lucrul cu date personalizate
Majoritatea software-ului OCR sunt destul de rigide în ceea ce privește tipul de date cu care pot lucra. Antrenarea unui model OCR pentru un caz de utilizare necesită un grad mare de flexibilitate în ceea ce privește cerințele și specificațiile acestuia; un OCR pentru procesarea facturii va fi foarte diferit de un OCR pentru pașapoarte! Nanonets nu este legat de astfel de limitări rigide. Nanonets folosește propriile date pentru a antrena modele OCR care sunt cele mai potrivite pentru a răspunde nevoilor specifice ale afacerii dvs.
2. Lucrul cu non-engleză sau mai multe limbi
Deoarece Nanonets se concentrează pe antrenament cu date personalizate, este plasat în mod unic pentru a construi un singur model OCR care ar putea extrage text din imagini în orice limbă sau mai multe limbi în același timp.
3. Nu necesită post-procesare
Textul extras folosind modele OCR trebuie să fie structurat inteligent și prezentat într-un format inteligibil; altfel, timp și resurse considerabile sunt dedicate reorganizarii datelor în informații semnificative. În timp ce majoritatea instrumentelor OCR pur și simplu preiau și aruncă date din imagini, Nanonets extrage doar datele relevante și le sortează automat în câmpuri structurate inteligent, făcându-le mai ușor de vizualizat și înțeles.
4. Învață continuu
Afacerile se confruntă adesea cu cerințe și nevoi în schimbare dinamică. Pentru a depăși potențialele blocaje, Nanonets vă permite să vă reantrenați cu ușurință modelele cu date noi. Acest lucru permite modelului dvs. OCR să se adapteze la schimbări neprevăzute.
5. Gestionează cu ușurință constrângerile comune de date
Nanonets folosește tehnicile AI, ML și Deep Learning pentru a depăși constrângerile comune de date care afectează în mare măsură recunoașterea și extragerea textului. Nanonets OCR poate recunoaște și gestiona text scris de mână, imagini de text în mai multe limbi simultan, imagini cu rezoluție scăzută, imagini cu fonturi noi sau cursive și dimensiuni diferite, imagini cu text întunecat, text înclinat, text nestructurat aleatoriu, zgomot de imagine, imagini neclare și altele. API-urile OCR tradiționale pur și simplu nu sunt echipate pentru a funcționa sub astfel de constrângeri; au nevoie de date la un nivel foarte ridicat de fidelitate, ceea ce nu este norma în scenariile din viața reală.
6. Nu necesită o echipă internă de dezvoltatori
Nu trebuie să vă faceți griji cu privire la angajarea dezvoltatorilor și dobândirea de talent pentru a personaliza API-ul Nanonets pentru cerințele dvs. de afaceri. Nanonets a fost construit pentru o integrare fără probleme. De asemenea, puteți integra cu ușurință Nanonets cu majoritatea software-ului CRM, ERP sau RPA.
7. Personalizați, personalizați, personalizați
Puteți captura câte câmpuri de text/date doriți cu Nanonets OCR. Puteți chiar să creați reguli de validare personalizate care funcționează pentru cerințele dvs. specifice de recunoaștere și extracție a textului. Nanonets nu este deloc legat de șablonul documentului dvs. Puteți captura date în tabele sau elemente rând sau în orice alt format!
Nanonets are multe cazuri de utilizare care ar putea optimiza performanța afacerii dvs., economisi costuri și crește creșterea. Afla modul în care cazurile de utilizare Nanonets se pot aplica produsului dvs.
Sau verificați Nanoneți API OCR în acțiune și începeți să construiți personalizate OCR modele gratuit!
Actualizează iulie 2022: această postare a fost publicată inițial în octombrie 2020 și de atunci a fost actualizat regulat.
Iată un slide rezumând constatările din acest articol. Iată un versiune alternativă a acestei postări.
- AI
- AI și învățarea automată
- ai art
- ai art generator
- ai robot
- inteligență artificială
- certificare de inteligență artificială
- inteligența artificială în domeniul bancar
- robot cu inteligență artificială
- roboți cu inteligență artificială
- software de inteligență artificială
- blockchain
- conferință blockchain ai
- coingenius
- inteligența artificială conversațională
- criptoconferință ai
- dall-e
- învățare profundă
- google ai
- masina de învățare
- OCR
- Plato
- platoul ai
- Informații despre date Platon
- Jocul lui Platon
- PlatoData
- platogaming
- scara ai
- sintaxă
- Recunoașterea textului
- zephyrnet