Kako iz slike izvleči besedilo ali podatke PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Kako iz slike izvleči besedilo ali podatke

Ekstrahiranje besedila iz slike je lahko okoren postopek. Večina ljudi ročno vnese besedilo/podatke s slike; vendar je to zamudno in neučinkovito, če morate obravnavati veliko slik.

Pretvorniki slike v besedilo ponujajo čeden način za ekstrahiranje besedila iz slik.

Čeprav takšna orodja dobro opravljajo svoje delo, so izvlečeno besedilo/podatki pogosto predstavljeni na nestrukturiran način, kar povzroči veliko naknadne obdelave.

An OCR na podlagi umetne inteligence podobno kot Nanonets lahko črpa besedilo iz slik in predstavi izvlečene podatke na urejen, organiziran in strukturiran način.

Nanonets izvleče podatke iz slik natančno, v velikem obsegu in v več jezikih. Nanonets je edini OCR za prepoznavanje besedila, ki predstavlja izvlečeno besedilo v lepo strukturiranih formatih, ki so povsem prilagodljivi. Zajete podatke je mogoče predstaviti kot tabele, vrstične postavke ali v kateri koli drugi obliki.

  1. Kliknite, da naložite svojo sliko spodaj
  2. Nanonets OCR samodejno prepozna vsebino vaše datoteke in jo pretvori v besedilo
  3. Prenesite ekstrahirano besedilo kot neobdelano besedilno datoteko ali integrirajte prek API-ja


Kazalo

Tukaj so tri napredne metode, s katerimi lahko uporabite Nanonets OCR za odkrivanje in ekstrahiranje besedila iz slik, izvlečite besedilo iz PDF-jas, izvleči podatke iz PDF-jay ali razčleni datoteke PDF in druge vrste dokumentov:

Ekstrahiranje besedila iz slike z uporabo Nanonetov

Potrebujete brezplačen spletni OCR za sliko v besedilo, PDF v tabelo, PDF v besediloali Ekstrakcija podatkov PDF? Oglejte si Nanonets na spletu API za OCR v akciji in začnite brezplačno graditi modele OCR po meri!


Nanonets ima vnaprej pripravljene modele OCR za določene vrste slik, navedene spodaj. Vsak predhodno usposobljen model OCR je usposobljen za natančno povezavo besedila v vrsti slike z ustreznim poljem, kot je ime, naslov, datum, potek itd., in predstavi izvlečeno besedilo na čist in organiziran način.

  • Računi
  • prejemki
  • Vozniško dovoljenje (ZDA)
  • Potni listi

Nanoneti spletni OCR in OCR API imajo veliko zanimivih primeri uporabe.


[Vgrajeni vsebina]
Nanoneti črpajo besedilo iz slik računov

1. korak: izberite ustrezen model OCR

Prijava v Nanonets in izberite model OCR, ki ustreza sliki, iz katere želite izvleči besedilo in podatke. Če nobeden od vnaprej usposobljenih modelov OCR ne ustreza vašim zahtevam, lahko preskočite naprej in ugotovite, kako ustvariti model OCR po meri.

2. korak: Dodajte datoteke

Dodajte datoteke/slike, iz katerih želite ekstrahirati besedilo. Dodate lahko poljubno število slik.

Korak 3: preskus

Pustite nekaj sekund, da se model zažene in izvleče besedilo iz slike.

4. korak: preverite

Hitro preverite besedilo, ekstrahirano iz vsake datoteke, tako da preverite pogled tabele na desni. Preprosto lahko še enkrat preverite, ali je bilo besedilo pravilno prepoznano in ali se ujema z ustreznim poljem ali oznako.

Na tej stopnji se lahko celo odločite za urejanje/popravljanje vrednosti polj in oznak. Nanonets ni vezan na predlogo slike.

Uredite ekstrahirano besedilo ali podatke
Uredite ekstrahirano besedilo ali podatke

Ekstrahirani podatki so lahko prikazani v obliki »List View« ali »JSON«.

Lahko označite potrditveno polje poleg vsake vrednosti ali polja, ki ga preverite, ali kliknete »Preveri podatke«, da takoj nadaljujete.

Preverite podatke
Preverite podatke

5. korak: izvoz

Ko so vse datoteke preverjene. Lepo organizirane podatke lahko izvozite kot datoteko xml, xlsx ali csv.

Izvozite ekstrahirane podatke
Izvozite ekstrahirane podatke

Nanonets ima zanimivo primeri uporabe in edinstvena zgodbe o uspehu strank. Ugotovite, kako lahko Nanonets spodbudi vaše podjetje, da postane bolj produktivno.


Izdelava modela OCR po meri z Nanonets je enostavna. Običajno lahko zgradite, učite in uvedete model za katero koli sliko ali vrsto dokumenta, v katerem koli jeziku, vse v manj kot 25 minutah (odvisno od števila datotek, uporabljenih za usposabljanje modela).

Oglejte si spodnji videoposnetek, da sledite prvim 4 korakom te metode:

[Vgrajeni vsebina]
Kako usposobiti svoj lasten OCR model z Nanonets

1. korak: Ustvarite svoj model OCR

Prijava v Nanonets in kliknite »Ustvarite svoj model OCR«.

2. korak: Naložite datoteke/slike za usposabljanje

Naložite vzorčne datoteke, ki bodo uporabljene za usposabljanje modelov OCR. Natančnost modela OCR, ki ga sestavite, bo v veliki meri odvisna od kakovosti in količine datotek/slik, naloženih na tej stopnji

3. korak: Označite besedilo v datotekah/slikah

Zdaj označite vsak del besedila ali podatkov z ustreznim poljem ali oznako. Ta ključni korak bo vaš model OCR naučil izvleči ustrezno besedilo iz slik in ga povezati s polji po meri, ki ustrezajo vašim potrebam.

Dodate lahko tudi novo oznako, da označite besedilo ali podatke. Ne pozabite, Nanonets ni vezan na predlogo slike!

4. korak: Usposobite model OCR po meri

Ko je opomba končana za vse datoteke/slike za usposabljanje, kliknite »Train Model«. Usposabljanje običajno traja od 20 minut do 2 uri, odvisno od števila datotek in modelov v čakalni vrsti za usposabljanje. Ti lahko nadgradnja na plačljivi načrt, da dobite hitrejše rezultate na tej stopnji (običajno manj kot 20 minut).

Nanonets izkorišča globoko učenje za izdelavo različnih modelov OCR in njihovo natančnost med seboj preizkuša. Nanonets nato izbere najboljši model OCR (na podlagi vaših vnosov in ravni natančnosti).

Zavihek »Metrike modela« prikazuje različne meritve in primerjalne analize, ki so podjetju Nanonets omogočile, da izbere najboljši model OCR med vsemi izdelanimi. Model lahko znova usposobite (z zagotavljanjem širšega nabora učnih slik in boljših opomb), da dosežete višje stopnje natančnosti.

Ali pa, če ste zadovoljni z natančnostjo, kliknite »Preizkusi«, da preizkusite in preverite, ali ta model OCR po meri deluje po pričakovanjih na vzorcu slik ali datotek, iz katerih je treba ekstrahirati besedilo/podatke.

5. korak: preizkusite in preverite podatke

Dodajte nekaj vzorčnih slik, da preizkusite in preverite model OCR po meri.

Preverite točnost izvlečenega besedila
Preizkusite in preverite točnost ekstrahiranega besedila

Če je bilo besedilo prepoznano, ekstrahirano in ustrezno predstavljeno, izvozite datoteko. Kot lahko vidite spodaj, so bili izvlečeni podatki organizirani in predstavljeni v lični obliki.

Izvoženi podatki so lepo navedeni
Izvoženi podatki so lepo navedeni

Čestitamo, zdaj ste zgradili in usposobili model OCR po meri za pridobivanje besedila iz določenih vrst slik!


Ali se vaše podjetje ukvarja s prepoznavanjem besedila v digitalnih dokumentih, slikah ali datotekah PDF? Ste se spraševali, kako natančno izvleči besedilo iz slik?


Usposobite svoje lastne modele OCR z NanoNets API

Tukaj podroben vodnik za usposabljanje lastne modele OCR z uporabo Nanonets API. v Dokumentacija, boste našli pripravljene vzorce kode v Python, Shell, Ruby, Golang, Java in C# ter podrobne specifikacije API-ja za različne končne točke.

Tukaj je vodnik po korakih za usposabljanje lastnega modela z uporabo API-ja Nanonets:

1. korak: Klonirajte Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

2. korak: Pridobite brezplačni ključ API

Pridobite brezplačni ključ API https://app.nanonets.com/#/keys

3. korak: Ključ API nastavite kot spremenljivko okolja

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

4. korak: Ustvarite nov model

python ./code/create-model.py

Opomba: S tem ustvarite MODEL_ID, ki ga potrebujete za naslednji korak

5. korak: Dodajte ID modela kot spremenljivko okolja

export NANONETS_MODEL_ID=YOUR_MODEL_ID

6. korak: Prenesite podatke o vadbi

Zberite slike predmeta, ki ga želite zaznati. Ko imate v mapi pripravljen nabor podatkov images (slikovne datoteke), začnite nalagati nabor podatkov.

python ./code/upload-training.py

7. korak: Vadite model

Ko so slike naložene, začnite usposabljati Model

python ./code/train-model.py

8. korak: Pridobite stanje modela

Treniranje modela traja ~ 30 minut. Ko bo model usposobljen, boste prejeli e-pošto. Medtem preverite stanje modela

watch -n 100 python ./code/model-state.py

9. korak: Naredite napoved

Ko je model usposobljen. Lahko predvidevate s pomočjo modela

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Prednosti uporabe Nanonetov v primerjavi z drugimi API-ji OCR presegajo le večjo natančnost glede pridobivanja besedila iz slik. Tukaj je 7 razlogov, zakaj bi morali namesto tega razmisliti o uporabi Nanonets OCR za prepoznavanje besedila:

1. Delo s podatki po meri

Večina programske opreme OCR je precej stroga glede vrste podatkov, s katerimi lahko dela. Usposabljanje modela OCR za primer uporabe zahteva veliko stopnjo prilagodljivosti glede na njegove zahteve in specifikacije; OCR za obdelavo računov se bo močno razlikoval od OCR za potne liste! Nanonets ni vezan na tako toge omejitve. Nanonets uporablja vaše lastne podatke za usposabljanje modelov OCR, ki so najbolj primerni za izpolnjevanje posebnih potreb vašega podjetja.

2. Delo z neangleškimi ali več jeziki

Ker se Nanonets osredotoča na usposabljanje s podatki po meri, je edinstveno postavljen za izdelavo enega samega modela OCR, ki lahko izvleče besedilo iz slik v katerem koli jeziku ali več jezikih hkrati.

3. Ne zahteva naknadne obdelave

Besedilo, ekstrahirano z modeli OCR, mora biti inteligentno strukturirano in predstavljeno v razumljivi obliki; sicer je treba precej časa in virov porabiti za reorganizacijo podatkov v smiselne informacije. Medtem ko večina orodij OCR preprosto zgrabi in izpiše podatke iz slik, Nanonets izvleče samo ustrezne podatke in jih samodejno razvrsti v inteligentno strukturirana polja, kar olajša ogled in razumevanje.

4. Nenehno se uči

Podjetja se pogosto soočajo z dinamično spreminjajočimi se zahtevami in potrebami. Da bi premagali morebitne ovire, vam Nanonets omogoča enostavno ponovno usposabljanje vaših modelov z novimi podatki. To omogoča, da se vaš model OCR prilagodi nepredvidenim spremembam.

5. Z lahkoto obravnava pogoste podatkovne omejitve

Nanoneti izkoriščajo tehnike AI, ML & Deep Learning za premagovanje skupnih podatkovnih omejitev, ki močno vplivajo na prepoznavanje in ekstrakcijo besedila. Nanonets OCR lahko prepozna in obravnava ročno napisano besedilo, slike besedila v več jezikih hkrati, slike z nizko ločljivostjo, slike z novimi ali napisanimi pisavami in različnimi velikostmi, slike s senčnim besedilom, nagnjeno besedilo, naključno nestrukturirano besedilo, šum slike, zamegljene slike in več. Tradicionalni API-ji OCR preprosto niso opremljeni za delovanje pod takšnimi omejitvami; zahtevajo podatke na zelo visoki stopnji zvestobe, kar v scenarijih resničnega življenja ni običajno.

6. Ne potrebuje lastne ekipe razvijalcev

Ni vam treba skrbeti glede najemanja razvijalcev in pridobivanja talentov za prilagoditev Nanonets API za vaše poslovne zahteve. Nanonets je bil zgrajen za integracijo brez težav. Nanonets lahko preprosto integrirate tudi z večino programske opreme CRM, ERP ali RPA.

7. Prilagodite, prilagodite, prilagodite

Z Nanonets OCR lahko zajamete poljubno število besedilnih/podatkovnih polj. Lahko celo sestavite pravila preverjanja po meri, ki ustrezajo vašim zahtevam glede prepoznavanja besedila in ekstrakcije besedila. Nanonets sploh ni vezan na predlogo vašega dokumenta. Podatke lahko zajemate v tabelah ali vrstičnih postavkah ali kateri koli drugi obliki!


Nanonets ima veliko primerov uporabe, ki bi lahko optimizirali vašo poslovno uspešnost, prihranili stroške in spodbudili rast. Ugotovite kako se lahko primeri uporabe Nanonets nanašajo na vaš izdelek.

Ali pa preverite Nanoneti API za OCR v akciji in začnite graditi po meri OCR modeli brezplačno!


Nadgradnja julij 2022: ta objava je bila prvotno objavljena v oktober 2020 in je bil od takrat posodobljen redno.

Tukaj je diapozitiv povzemanje ugotovitev v tem članku. Tukaj je nadomestna različica te objave.

Časovni žig:

Več od AI in strojno učenje