Tekstin poimiminen kuvasta voi olla hankala prosessi. Useimmat ihmiset näppäilevät kuvan tekstin/tiedot manuaalisesti; mutta tämä on sekä aikaa vievää että tehotonta, kun sinulla on paljon kuvia käsiteltävänä.
Kuva tekstiksi muuntimet tarjoavat siistin tavan poimia tekstiä kuvista.
Vaikka tällaiset työkalut tekevät hyvää työtä, purettu teksti/data esitetään usein jäsentämättömällä tavalla, mikä johtaa paljon jälkikäsittelyyn.
An AI-ohjattu OCR kuten Nanonets voi poimia tekstiä kuvista ja esittää poimitut tiedot siististi, organisoidusti ja jäsennellysti.
Nanonets poimii tiedot kuvista tarkasti, mittakaavassa ja useilla kielillä. Nanonets on ainoa tekstintunnistuksen OCR, joka esittää poimittua tekstiä siististi jäsennellyissä muodoissa, jotka ovat täysin muokattavissa. Kaapatut tiedot voidaan esittää taulukoina, rivikohtina tai missä tahansa muussa muodossa.
- Napsauta ladataksesi kuvasi alla
- Nanonetsin OCR tunnistaa automaattisesti tiedostosi sisällön ja muuntaa sen tekstiksi
- Lataa purettu teksti raakatekstitiedostona tai integroi API:n kautta
Sisällysluettelo
Tässä on kolme edistynyttä menetelmää, joilla voit käyttää Nanonets OCR:ää tunnistamaan ja poimimaan tekstiä kuvista, poista teksti PDF-tiedostostas, poimia tietoja PDF-tiedostostas tai jäsentää PDF-tiedostoja ja muut asiakirjatyypit:
Tarvitsetko ilmaisen online-OCR: n kuva tekstiksi, PDF taulukkoon, PDF tekstiksitai PDF-tietojen poiminta? Tutustu Nanonetsiin verkossa OCR-sovellusliittymä toiminnassa ja aloita räätälöityjen OCR-mallien rakentaminen ilmaiseksi!
Nanonetsilla on valmiiksi koulutettuja OCR-malleja alla lueteltuja kuvatyyppejä varten. Jokainen valmiiksi koulutettu OCR-malli on koulutettu liittämään kuvatyypin teksti tarkasti sopivaan kenttään, kuten nimi, osoite, päivämäärä, viimeinen käyttöpäivä jne., ja esittämään poimitun tekstin siististi ja järjestelmällisesti.
- Laskut
- tulot
- Ajokortti (USA)
- Passit
Nanonetit online-OCR- ja OCR-sovellusliittymä on monia mielenkiintoisia Käytä koteloita.
Vaihe 1: Valitse sopiva OCR-malli
Kirjaudu Nanonetsiin ja valitse OCR-malli, joka sopii kuvaan, josta haluat poimia tekstiä ja tietoja. Jos mikään esiopetetuista OCR-malleista ei vastaa vaatimuksiasi, voit siirtyä eteenpäin ja selvittää, kuinka voit luoda mukautetun OCR-mallin.
Vaihe 2: Lisää tiedostoja
Lisää tiedostot/kuvat, joista haluat poimia tekstiä. Voit lisätä niin monta kuvaa kuin haluat.
Vaihe 3: Testi
Anna mallin suorittaa muutama sekunti ja poimia tekstiä kuvasta.
Vaihe 4: Vahvista
Tarkista nopeasti jokaisesta tiedostosta purettu teksti tarkistamalla oikealla olevasta taulukkonäkymästä. Voit helposti tarkistaa, onko teksti tunnistettu oikein ja yhdistetty oikeaan kenttään tai tunnisteeseen.
Voit jopa muokata/korjata kenttien arvoja ja tarroja tässä vaiheessa. Nanonetsia ei sido kuvan malli.
Pura tiedot voidaan näyttää ”Listanäkymä” - tai “JSON” -muodossa.
Voit valita jokaisen vahvistamasi arvon tai kentän vieressä olevan valintaruudun tai napsauttaa "Vahvista tiedot" jatkaaksesi välittömästi.
Vaihe 5: Vie
Kun kaikki tiedostot on vahvistettu. Voit viedä siististi järjestetyt tiedot xml-, xlsx- tai csv-tiedostoina.
Nanonetsillä on mielenkiintoista Käytä koteloita ja ainutlaatuinen asiakkaiden menestystarinoita. Ota selvää, kuinka Nanonets voi lisätä yritystesi tuottavuutta.
Mukautetun OCR-mallin luominen Nanonetsilla on helppoa. Voit yleensä rakentaa, kouluttaa ja ottaa käyttöön mallin mille tahansa kuva- tai asiakirjatyypille millä tahansa kielellä, kaikki alle 25 minuutissa (riippuen mallin kouluttamiseen käytettyjen tiedostojen määrästä).
Katso alla oleva video seurataksesi tämän menetelmän neljä ensimmäistä vaihetta:
Vaihe 1: Luo oma OCR-malli
Kirjaudu kohtaan Nanonets ja napsauta "Luo oma OCR-malli".
Vaihe 2: Lataa harjoitustiedostot / kuvat
Lataa näytetiedostoja, joita käytetään OCR-mallien kouluttamiseen. Rakentamasi OCR-mallin tarkkuus riippuu suurelta osin tässä vaiheessa ladattujen tiedostojen / kuvien laadusta ja määrästä
Vaihe 3: Merkitse tekstiin tiedostot / kuvat
Merkitse nyt jokainen teksti tai tieto asianmukaiseen kenttään tai tunnisteeseen. Tämä ratkaiseva vaihe opettaa OCR-mallisi poimimaan sopivan tekstin kuvista ja yhdistämään sen omiin tarpeisiisi sopiviin kenttiin.
Voit myös lisätä uuden tunnisteen tekstin tai tietojen merkitsemiseksi. Muista, että Nanonetsia ei sido kuvan malli!
Vaihe 4: Kouluta mukautettu OCR-malli
Kun kaikkien harjoitustiedostojen / kuvien merkintä on valmis, napsauta “Junamalli”. Harjoittelu kestää yleensä 20 min - 2 tuntia tiedostojen lukumäärän ja jonossa olevien mallien mukaan. Sinä pystyt parantaa maksettuun suunnitelmaan saadaksesi nopeammat tulokset tässä vaiheessa (tyypillisesti alle 20 minuuttia).
Nanonets hyödyntää syvällistä oppimista erilaisten OCR-mallien rakentamisessa ja testaa niitä keskenään tarkkuuden suhteen. Nanonets valitsee sitten parhaan OCR-mallin (syötteiden ja tarkkuustasojen perusteella).
"Mallimittarit" -välilehti näyttää erilaiset mittaukset ja vertailevat analyysit, joiden avulla Nanonets valitsi parhaan OCR-mallin kaikista rakennetuista. Voit kouluttaa mallia uudestaan (tarjoamalla laajemman valikoiman harjoittelukuvia ja paremman merkinnän) korkeamman tarkkuustason saavuttamiseksi.
Tai jos olet tyytyväinen tarkkuuteen, napsauta Testaa testataksesi ja varmistaaksesi, että tämä mukautettu OCR-malli toimii odotetusti kuvien tai tiedostojen näytteille, joista teksti / data on purettava.
Vaihe 5: Testaa ja tarkista tiedot
Lisää pari mallikuvaa testataksesi ja vahvistaaksesi mukautetun OCR-mallin.
Jos teksti on tunnistettu, purettu ja esitetty asianmukaisesti, vie tiedosto. Kuten alla näet, poimitut tiedot on järjestetty ja esitetty siistissä muodossa.
Onnittelut, olet nyt rakentanut ja kouluttanut mukautetun OCR-mallin poimimaan tekstiä tietyntyyppisistä kuvista!
Käsitteleekö yrityksesi tekstintunnistusta digitaalisissa asiakirjoissa, kuvissa tai PDF-tiedostoissa? Oletko miettinyt, kuinka poimia tekstiä kuvista tarkasti?
Kouluta omia OCR-mallejasi NanoNets API:lla
Tässä yksityiskohtainen opas junaan omia OCR-mallejasi käyttämällä Nanonets-sovellusliittymä. Vuonna dokumentointi, löydät valmiit käynnistämään koodinäytteet Pythonissa, Shellissä, Ruby'ssa, Golangissa, Javassa ja C #: ssa sekä yksityiskohtaiset API-tiedot eri päätepisteille.
Tässä on vaiheittainen opas oman mallisi kouluttamiseen Nanonets API:n avulla:
Vaihe 1: Kloonaa Repo
git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm
Vaihe 2: Hanki ilmainen API-avain
Hanki ilmainen API-avain https://app.nanonets.com/#/keys
Vaihe 3: Aseta API-avain ympäristömuuttujaksi
export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
Vaihe 4: Luo uusi malli
python ./code/create-model.py
Huomaa: Tämä luo mallin_tunnuksen, jota tarvitset seuraavaan vaiheeseen
Vaihe 5: Lisää mallitunnus ympäristömuuttujaksi
export NANONETS_MODEL_ID=YOUR_MODEL_ID
Vaihe 6: Lataa harjoitustiedot
Kerää havaittavan objektin kuvat. Kun tiedostojoukko on valmis kansioon images
(kuvatiedostot), aloita tietojoukon lataaminen.
python ./code/upload-training.py
Vaihe 7: Junamalli
Kun kuvat on ladattu, aloita mallin koulutus
python ./code/train-model.py
Vaihe 8: Hanki mallitila
Mallin kouluttaminen kestää ~ 30 minuuttia. Saat sähköpostin, kun malli on koulutettu. Sillä välin tarkistat mallin tilan
watch -n 100 python ./code/model-state.py
Vaihe 9: Tee ennuste
Kun malli on koulutettu. Voit tehdä ennusteita mallin avulla
python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg
Nanonettien käytön edut muihin OCR-sovellusliittymiin verrattuna ylittävät vain paremman tarkkuuden tekstin poimimisessa kuvista. Tässä on 7 syytä, miksi sinun kannattaa harkita Nanonets OCR:n käyttöä tekstintunnistukseen sen sijaan:
1. Mukautettujen tietojen käsittely
Useimmat OCR-ohjelmistot ovat melko tiukkoja sen suhteen, minkä tyyppisten tietojen kanssa ne voivat työskennellä. OCR-mallin kouluttaminen käyttötapausta varten vaatii suurta joustavuutta sen vaatimusten ja spesifikaatioiden suhteen; OCR laskujen käsittelyyn eroaa huomattavasti passien OCR:stä! Nanonetsia eivät sido niin tiukat rajoitukset. Nanonets käyttää omia tietojasi kouluttaakseen OCR-malleja, jotka sopivat parhaiten yrityksesi erityistarpeisiin.
2. Työskentely muiden kuin englannin tai useiden kielten kanssa
Koska Nanonets keskittyy harjoitteluun mukautetuilla tiedoilla, sillä on ainutlaatuiset mahdollisuudet rakentaa yksi OCR-malli, joka voi poimia tekstiä kuvista millä tahansa kielellä tai useilla kielillä samanaikaisesti.
3. Ei vaadi jälkikäsittelyä
OCR-mallien avulla poimittu teksti on jäsenneltävä älykkäästi ja esitettävä ymmärrettävässä muodossa. Muutoin datan järjestämiseen tarkoituksenmukaiseksi tiedoksi kuluu paljon aikaa ja resursseja. Vaikka useimmat OCR-työkalut vain nappaavat ja poistavat tietoja kuvista, Nanonets poimii vain olennaiset tiedot ja lajittelee ne automaattisesti älykkäästi jäsenneltyihin kenttiin, mikä helpottaa niiden katselemista ja ymmärtämistä.
4. Oppii jatkuvasti
Yritykset kohtaavat usein dynaamisesti muuttuvia vaatimuksia ja tarpeita. Mahdollisten tiesulkujen voittamiseksi Nanonetsin avulla voit helposti kouluttaa mallejasi uusilla tiedoilla. Näin OCR-mallisi mukautuu odottamattomiin muutoksiin.
5. Käsittelee yleisiä tietorajoituksia helposti
Nanonets hyödyntää AI-, ML- ja Deep Learning -tekniikoita voittaakseen yleiset tietorajoitteet, jotka vaikuttavat suuresti tekstin tunnistamiseen ja poimimiseen. Nanonets OCR pystyy tunnistamaan ja käsittelemään käsin kirjoitettua tekstiä, tekstin kuvia useilla kielillä kerralla, kuvia, joissa on alhainen resoluutio, kuvia uusilla tai kursiivisilla fonteilla ja eri kokoisilla, kuvia, joissa on hämärää tekstiä, kallistettua tekstiä, satunnaista jäsentelemätöntä tekstiä, kuvakohinaa, epäselviä kuvia ja enemmän. Perinteiset OCR-sovellusliittymät eivät vain ole valmiita toimimaan tällaisissa rajoituksissa; ne vaativat erittäin korkean tarkkuuden dataa, mikä ei ole normaalia tosielämän skenaarioissa.
6. Ei vaadi sisäistä kehittäjätiimiä
Sinun ei tarvitse huolehtia kehittäjien palkkaamisesta ja kykyjen hankkimisesta räätälöidäksesi Nanonets API yrityksesi tarpeita vastaavaksi. Nanonets luotiin vaivatonta integrointia varten. Voit myös helposti integroida Nanonetit useimpiin CRM-, ERP- tai RPA-ohjelmistoihin.
7. Mukauta, mukauta, mukauta
Voit kaapata niin monta teksti-/tietokenttää kuin haluat Nanonets OCR:lla. Voit jopa luoda mukautettuja vahvistussääntöjä, jotka vastaavat erityisiä tekstintunnistus- ja tekstinpoimintavaatimuksiasi. Nanonetsia ei sido asiakirjasi malli ollenkaan. Voit tallentaa tietoja taulukoihin tai rivikohtiin tai missä tahansa muussa muodossa!
Nanonetsilla on monia käyttötapauksia, jotka voisivat optimoida liiketoimintasi suorituskyvyn, säästää kustannuksia ja lisätä kasvua. Selvittää miten Nanonetsin käyttötapaukset voivat soveltua tuotteeseesi.
Tai tarkista Nanonetit OCR-sovellusliittymä toiminnassa ja aloita räätälöinnin rakentaminen OCR mallit ilmaiseksi!
Päivitykset heinäkuu 2022: Tämä viesti on alun perin julkaistu lokakuu 2020 ja on sittemmin päivitetty säännöllisesti.
Tässä on dia yhteenveto tämän artikkelin tuloksista. Tässä on an vaihtoehtoinen versio tämän viestin.
- AI
- Tekoäly ja koneoppiminen
- ai taide
- ai taiteen generaattori
- ai robotti
- tekoäly
- tekoälyn sertifiointi
- tekoäly pankkitoiminnassa
- tekoäly robotti
- tekoälyrobotit
- tekoälyohjelmisto
- blockchain
- blockchain-konferenssi ai
- coingenius
- keskustelullinen tekoäly
- kryptokonferenssi ai
- dall's
- syvä oppiminen
- google ai
- koneoppiminen
- OCR
- Platon
- plato ai
- Platonin tietotieto
- Platon peli
- PlatonData
- platopeliä
- mittakaava ai
- syntaksi
- Tekstin tunnistaminen
- zephyrnet