Tekstin tai datan poimiminen kuvasta

Julkaissut Platon

seuraajia: 0

Tekstin poimiminen kuvasta voi olla hankala prosessi. Useimmat ihmiset näppäilevät kuvan tekstin/tiedot manuaalisesti; mutta tämä on sekä aikaa vievää että tehotonta, kun sinulla on paljon kuvia käsiteltävänä.

Kuva tekstiksi muuntimet tarjoavat siistin tavan poimia tekstiä kuvista.

Vaikka tällaiset työkalut tekevät hyvää työtä, purettu teksti/data esitetään usein jäsentämättömällä tavalla, mikä johtaa paljon jälkikäsittelyyn.

An AI-ohjattu OCR kuten Nanonets voi poimia tekstiä kuvista ja esittää poimitut tiedot siististi, organisoidusti ja jäsennellysti.

Nanonets poimii tiedot kuvista tarkasti, mittakaavassa ja useilla kielillä. Nanonets on ainoa tekstintunnistuksen OCR, joka esittää poimittua tekstiä siististi jäsennellyissä muodoissa, jotka ovat täysin muokattavissa. Kaapatut tiedot voidaan esittää taulukoina, rivikohtina tai missä tahansa muussa muodossa.

Napsauta ladataksesi kuvasi alla
Nanonetsin OCR tunnistaa automaattisesti tiedostosi sisällön ja muuntaa sen tekstiksi
Lataa purettu teksti raakatekstitiedostona tai integroi API:n kautta

Sisällysluettelo

Tässä on kolme edistynyttä menetelmää, joilla voit käyttää Nanonets OCR:ää tunnistamaan ja poimimaan tekstiä kuvista, poista teksti PDF-tiedostostas, poimia tietoja PDF-tiedostostas tai jäsentää PDF-tiedostoja ja muut asiakirjatyypit:

Tekstin poimiminen kuvasta nanonetsien avulla

Tarvitsetko ilmaisen online-OCR: n kuva tekstiksi, PDF taulukkoon, PDF tekstiksitai PDF-tietojen poiminta? Tutustu Nanonetsiin verkossa OCR-sovellusliittymä toiminnassa ja aloita räätälöityjen OCR-mallien rakentaminen ilmaiseksi!

Nanonetsilla on valmiiksi koulutettuja OCR-malleja alla lueteltuja kuvatyyppejä varten. Jokainen valmiiksi koulutettu OCR-malli on koulutettu liittämään kuvatyypin teksti tarkasti sopivaan kenttään, kuten nimi, osoite, päivämäärä, viimeinen käyttöpäivä jne., ja esittämään poimitun tekstin siististi ja järjestelmällisesti.

Laskut
tulot
Ajokortti (USA)
Passit

Nanonetit online-OCR- ja OCR-sovellusliittymä on monia mielenkiintoisia Käytä koteloita.

[Upotetun sisällön]

Nanonetit poimivat tekstiä kuittien kuvista

Vaihe 1: Valitse sopiva OCR-malli

Kirjaudu Nanonetsiin ja valitse OCR-malli, joka sopii kuvaan, josta haluat poimia tekstiä ja tietoja. Jos mikään esiopetetuista OCR-malleista ei vastaa vaatimuksiasi, voit siirtyä eteenpäin ja selvittää, kuinka voit luoda mukautetun OCR-mallin.

Vaihe 2: Lisää tiedostoja

Lisää tiedostot/kuvat, joista haluat poimia tekstiä. Voit lisätä niin monta kuvaa kuin haluat.

Vaihe 3: Testi

Anna mallin suorittaa muutama sekunti ja poimia tekstiä kuvasta.

Vaihe 4: Vahvista

Tarkista nopeasti jokaisesta tiedostosta purettu teksti tarkistamalla oikealla olevasta taulukkonäkymästä. Voit helposti tarkistaa, onko teksti tunnistettu oikein ja yhdistetty oikeaan kenttään tai tunnisteeseen.

Voit jopa muokata/korjata kenttien arvoja ja tarroja tässä vaiheessa. Nanonetsia ei sido kuvan malli.

Pura tiedot voidaan näyttää ”Listanäkymä” - tai “JSON” -muodossa.

Tekstin tai datan purkaminen Image PlatoBlockchain Data Intelligencesta. Pystysuuntainen haku. Ai. — Purettu teksti näytetään luettelona tai JSON-lähtönä

Voit valita jokaisen vahvistamasi arvon tai kentän vieressä olevan valintaruudun tai napsauttaa "Vahvista tiedot" jatkaaksesi välittömästi.

Vaihe 5: Vie

Kun kaikki tiedostot on vahvistettu. Voit viedä siististi järjestetyt tiedot xml-, xlsx- tai csv-tiedostoina.

Nanonetsillä on mielenkiintoista Käytä koteloita ja ainutlaatuinen asiakkaiden menestystarinoita. Ota selvää, kuinka Nanonets voi lisätä yritystesi tuottavuutta.

Mukautetun OCR-mallin luominen Nanonetsilla on helppoa. Voit yleensä rakentaa, kouluttaa ja ottaa käyttöön mallin mille tahansa kuva- tai asiakirjatyypille millä tahansa kielellä, kaikki alle 25 minuutissa (riippuen mallin kouluttamiseen käytettyjen tiedostojen määrästä).

Katso alla oleva video seurataksesi tämän menetelmän neljä ensimmäistä vaihetta:

[Upotetun sisällön]

Kuinka kouluttaa omaa OCR-malliasi Nanonetsin avulla

Vaihe 1: Luo oma OCR-malli

Kirjaudu kohtaan Nanonets ja napsauta "Luo oma OCR-malli".

Vaihe 2: Lataa harjoitustiedostot / kuvat

Lataa näytetiedostoja, joita käytetään OCR-mallien kouluttamiseen. Rakentamasi OCR-mallin tarkkuus riippuu suurelta osin tässä vaiheessa ladattujen tiedostojen / kuvien laadusta ja määrästä

Vaihe 3: Merkitse tekstiin tiedostot / kuvat

Merkitse nyt jokainen teksti tai tieto asianmukaiseen kenttään tai tunnisteeseen. Tämä ratkaiseva vaihe opettaa OCR-mallisi poimimaan sopivan tekstin kuvista ja yhdistämään sen omiin tarpeisiisi sopiviin kenttiin.

Voit myös lisätä uuden tunnisteen tekstin tai tietojen merkitsemiseksi. Muista, että Nanonetsia ei sido kuvan malli!

Vaihe 4: Kouluta mukautettu OCR-malli

Kun kaikkien harjoitustiedostojen / kuvien merkintä on valmis, napsauta “Junamalli”. Harjoittelu kestää yleensä 20 min - 2 tuntia tiedostojen lukumäärän ja jonossa olevien mallien mukaan. Sinä pystyt parantaa maksettuun suunnitelmaan saadaksesi nopeammat tulokset tässä vaiheessa (tyypillisesti alle 20 minuuttia).

Nanonets hyödyntää syvällistä oppimista erilaisten OCR-mallien rakentamisessa ja testaa niitä keskenään tarkkuuden suhteen. Nanonets valitsee sitten parhaan OCR-mallin (syötteiden ja tarkkuustasojen perusteella).

"Mallimittarit" -välilehti näyttää erilaiset mittaukset ja vertailevat analyysit, joiden avulla Nanonets valitsi parhaan OCR-mallin kaikista rakennetuista. Voit kouluttaa mallia uudestaan (tarjoamalla laajemman valikoiman harjoittelukuvia ja paremman merkinnän) korkeamman tarkkuustason saavuttamiseksi.

Tai jos olet tyytyväinen tarkkuuteen, napsauta Testaa testataksesi ja varmistaaksesi, että tämä mukautettu OCR-malli toimii odotetusti kuvien tai tiedostojen näytteille, joista teksti / data on purettava.

Vaihe 5: Testaa ja tarkista tiedot

Lisää pari mallikuvaa testataksesi ja vahvistaaksesi mukautetun OCR-mallin.

Tarkista puretun tekstin tarkkuus — Testaa ja varmista poimitun tekstin tarkkuus

Jos teksti on tunnistettu, purettu ja esitetty asianmukaisesti, vie tiedosto. Kuten alla näet, poimitut tiedot on järjestetty ja esitetty siistissä muodossa.

Onnittelut, olet nyt rakentanut ja kouluttanut mukautetun OCR-mallin poimimaan tekstiä tietyntyyppisistä kuvista!

Käsitteleekö yrityksesi tekstintunnistusta digitaalisissa asiakirjoissa, kuvissa tai PDF-tiedostoissa? Oletko miettinyt, kuinka poimia tekstiä kuvista tarkasti?

Kouluta omia OCR-mallejasi NanoNets API:lla

Tässä yksityiskohtainen opas junaan omia OCR-mallejasi käyttämällä Nanonets-sovellusliittymä. Vuonna dokumentointi, löydät valmiit käynnistämään koodinäytteet Pythonissa, Shellissä, Ruby'ssa, Golangissa, Javassa ja C #: ssa sekä yksityiskohtaiset API-tiedot eri päätepisteille.

Tässä on vaiheittainen opas oman mallisi kouluttamiseen Nanonets API:n avulla:

Vaihe 1: Kloonaa Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Vaihe 2: Hanki ilmainen API-avain

Hanki ilmainen API-avain https://app.nanonets.com/#/keys

Vaihe 3: Aseta API-avain ympäristömuuttujaksi

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Vaihe 4: Luo uusi malli

python ./code/create-model.py

Huomaa: Tämä luo mallin_tunnuksen, jota tarvitset seuraavaan vaiheeseen

Vaihe 5: Lisää mallitunnus ympäristömuuttujaksi

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Vaihe 6: Lataa harjoitustiedot

Kerää havaittavan objektin kuvat. Kun tiedostojoukko on valmis kansioon images (kuvatiedostot), aloita tietojoukon lataaminen.

python ./code/upload-training.py

Vaihe 7: Junamalli

Kun kuvat on ladattu, aloita mallin koulutus

python ./code/train-model.py

Vaihe 8: Hanki mallitila

Mallin kouluttaminen kestää ~ 30 minuuttia. Saat sähköpostin, kun malli on koulutettu. Sillä välin tarkistat mallin tilan

watch -n 100 python ./code/model-state.py

Vaihe 9: Tee ennuste

Kun malli on koulutettu. Voit tehdä ennusteita mallin avulla

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Nanonettien käytön edut muihin OCR-sovellusliittymiin verrattuna ylittävät vain paremman tarkkuuden tekstin poimimisessa kuvista. Tässä on 7 syytä, miksi sinun kannattaa harkita Nanonets OCR:n käyttöä tekstintunnistukseen sen sijaan:

1. Mukautettujen tietojen käsittely

Useimmat OCR-ohjelmistot ovat melko tiukkoja sen suhteen, minkä tyyppisten tietojen kanssa ne voivat työskennellä. OCR-mallin kouluttaminen käyttötapausta varten vaatii suurta joustavuutta sen vaatimusten ja spesifikaatioiden suhteen; OCR laskujen käsittelyyn eroaa huomattavasti passien OCR:stä! Nanonetsia eivät sido niin tiukat rajoitukset. Nanonets käyttää omia tietojasi kouluttaakseen OCR-malleja, jotka sopivat parhaiten yrityksesi erityistarpeisiin.

2. Työskentely muiden kuin englannin tai useiden kielten kanssa

Koska Nanonets keskittyy harjoitteluun mukautetuilla tiedoilla, sillä on ainutlaatuiset mahdollisuudet rakentaa yksi OCR-malli, joka voi poimia tekstiä kuvista millä tahansa kielellä tai useilla kielillä samanaikaisesti.

3. Ei vaadi jälkikäsittelyä

OCR-mallien avulla poimittu teksti on jäsenneltävä älykkäästi ja esitettävä ymmärrettävässä muodossa. Muutoin datan järjestämiseen tarkoituksenmukaiseksi tiedoksi kuluu paljon aikaa ja resursseja. Vaikka useimmat OCR-työkalut vain nappaavat ja poistavat tietoja kuvista, Nanonets poimii vain olennaiset tiedot ja lajittelee ne automaattisesti älykkäästi jäsenneltyihin kenttiin, mikä helpottaa niiden katselemista ja ymmärtämistä.

4. Oppii jatkuvasti

Yritykset kohtaavat usein dynaamisesti muuttuvia vaatimuksia ja tarpeita. Mahdollisten tiesulkujen voittamiseksi Nanonetsin avulla voit helposti kouluttaa mallejasi uusilla tiedoilla. Näin OCR-mallisi mukautuu odottamattomiin muutoksiin.

5. Käsittelee yleisiä tietorajoituksia helposti

Nanonets hyödyntää AI-, ML- ja Deep Learning -tekniikoita voittaakseen yleiset tietorajoitteet, jotka vaikuttavat suuresti tekstin tunnistamiseen ja poimimiseen. Nanonets OCR pystyy tunnistamaan ja käsittelemään käsin kirjoitettua tekstiä, tekstin kuvia useilla kielillä kerralla, kuvia, joissa on alhainen resoluutio, kuvia uusilla tai kursiivisilla fonteilla ja eri kokoisilla, kuvia, joissa on hämärää tekstiä, kallistettua tekstiä, satunnaista jäsentelemätöntä tekstiä, kuvakohinaa, epäselviä kuvia ja enemmän. Perinteiset OCR-sovellusliittymät eivät vain ole valmiita toimimaan tällaisissa rajoituksissa; ne vaativat erittäin korkean tarkkuuden dataa, mikä ei ole normaalia tosielämän skenaarioissa.

6. Ei vaadi sisäistä kehittäjätiimiä

Sinun ei tarvitse huolehtia kehittäjien palkkaamisesta ja kykyjen hankkimisesta räätälöidäksesi Nanonets API yrityksesi tarpeita vastaavaksi. Nanonets luotiin vaivatonta integrointia varten. Voit myös helposti integroida Nanonetit useimpiin CRM-, ERP- tai RPA-ohjelmistoihin.

7. Mukauta, mukauta, mukauta

Voit kaapata niin monta teksti-/tietokenttää kuin haluat Nanonets OCR:lla. Voit jopa luoda mukautettuja vahvistussääntöjä, jotka vastaavat erityisiä tekstintunnistus- ja tekstinpoimintavaatimuksiasi. Nanonetsia ei sido asiakirjasi malli ollenkaan. Voit tallentaa tietoja taulukoihin tai rivikohtiin tai missä tahansa muussa muodossa!

Nanonetsilla on monia käyttötapauksia, jotka voisivat optimoida liiketoimintasi suorituskyvyn, säästää kustannuksia ja lisätä kasvua. Selvittää miten Nanonetsin käyttötapaukset voivat soveltua tuotteeseesi.

Tai tarkista Nanonetit OCR-sovellusliittymä toiminnassa ja aloita räätälöinnin rakentaminen OCR mallit ilmaiseksi!

Päivitykset heinäkuu 2022: Tämä viesti on alun perin julkaistu lokakuu 2020 ja on sittemmin päivitetty säännöllisesti.

Tässä on dia yhteenveto tämän artikkelin tuloksista. Tässä on an vaihtoehtoinen versio tämän viestin.

Aikaleima: Heinäkuu 17, 2022Heinäkuu 18, 2022

Aikaleima: Huhtikuu 10, 2023