Szöveg vagy adat kinyerése az Image PlatoBlockchain Data Intelligence-ből. Függőleges keresés. Ai.

Szöveg vagy adat kinyerése a képből

Extracting text from an image can be a cumbersome process. Most people manually key in the text/data from the image; but this is both time-consuming and inefficient when you have a lot of images to deal with.

Image to text converters offer a neat way to extract text from images.

While such tools do a good job, the extracted text/data is often presented in an unstructured manner that results in a lot of post processing.

An AI-driven OCR like Nanonets can pull text from images and present the extracted data in a neat, organized & structured manner.

Nanonets extracts data from images accurately, at scale, and in multiple languages. Nanonets is the only text recognition OCR that presents extracted text in neatly structured formats that are entirely customizable. Captured data can be presented as tables, line items, or any other format.

  1. Click to upload your image below
  2. A Nanonets OCR automatikusan felismeri a fájl tartalmát, és szöveggé alakítja
  3. Download the extracted text as a raw text file or integrate via API


Tartalomjegyzék

Here are three advanced methods in which you can use Nanonets OCR to detect and extract text from images, kivonat szöveg PDF-bőls, adatok kinyerése PDF-bőls vagy PDF-ek elemzése and other document types:

Extracting text from an image using Nanonets

Szüksége van egy ingyenes online OCR-re kép szöveggé, PDF a táblázatba, PDF szöveggévagy PDF adatkinyerés? Check out Nanonets online OCR API működés közben, és kezdje el ingyenesen egyedi OCR-modellek készítését!


Nanonets has pre-trained OCR models for the specific image types listed below. Each pre-trained OCR model is trained to accurately relate text in the image type to an appropriate field like name, address, date, expiry etc. and present the extracted text in a neat and organized manner.

  • Számlák
  • bevételek
  • Jogosítvány (USA)
  • Útlevél

Nanonetek online OCR és OCR API sok érdekesség van használati esetek.


[Beágyazott tartalmat]
Nanonets extracting text from images of receipts

1. lépés: Válassza ki a megfelelő OCR-modellt

Bejelentkezés to Nanonets and select an OCR model that is appropriate to the image from which you want to extract text and data. If none of the pre-trained OCR models suit your requirements, you can skip ahead to find out how to create a custom OCR model.

2. lépés: Fájlok hozzáadása

Add the files/images from which you want to extract text. You can add as many images as you like.

3 lépés: Teszt

Allow a few seconds for the model to run and extract text from the image.

4. lépés: Ellenőrizze

Quickly verify the text extracted from each file, by checking the table view on the right. You can easily double-check whether the text has been correctly recognized and matched with an appropriate field or tag.

You can even choose to edit/correct the field values and labels at this stage. Nanonets is not bound by the template of the image.

Szerkessze a kivont szöveget vagy adatokat
Szerkessze a kivont szöveget vagy adatokat

A kinyert adatok „Lista nézet” vagy „JSON” formátumban jeleníthetők meg.

Azonnali továbblépéshez jelölje be a jelölőnégyzetet minden egyes ellenőrzött érték vagy mező mellett, vagy kattintson az „Adatok ellenőrzése” gombra.

Ellenőrizze az adatokat
Ellenőrizze az adatokat

5. lépés: Exportálás

Miután az összes fájlt ellenőrizték. A szépen rendezett adatokat xml, xlsx vagy csv fájlként exportálhatja.

Exportálja a kivont adatokat
Exportálja a kivont adatokat

Nanonets érdekes használati esetek és egyedi vásárlói sikertörténetek. Fedezze fel, hogy a nanonetek miként tudják termelékenyebbé tenni vállalkozását.


Building a custom OCR model with Nanonets is easy. You can typically build, train and deploy a model for any image or document type, in any language, all in under 25 minutes (depending on the number of files used to train the model).

Watch the video below to follow the first 4 steps in this method:

[Beágyazott tartalmat]
Hogyan képezheti ki saját OCR-modelljét nanohálókkal

1. lépés: Hozzon létre saját OCR-modellt

Bejelentkezés a Nanonets-re, és kattintson a „Saját OCR-modell létrehozása” lehetőségre.

2. lépés: Töltsön fel edzésfájlokat/képeket

Töltse fel az OCR-modellek betanításához használt mintafájlokat. Az elkészített OCR-modell pontossága nagymértékben függ az ebben a szakaszban feltöltött fájlok/képek minőségétől és mennyiségétől.

3. lépés: Írjon megjegyzéseket a fájlokhoz/képekhez

Most adjon meg minden szövegrészt vagy adatot megfelelő mezővel vagy címkével. Ez a döntő lépés megtanítja az OCR-modelljét, hogy kinyerje a megfelelő szöveget a képekből, és társítsa azt az Ön igényeinek megfelelő egyéni mezőkkel.

You can also add a new label to annotate the text or data. Remember, Nanonets is not bound by the template of the image!

4. lépés: Tanítsa meg az egyéni OCR-modellt

Miután elkészült az összes képzési fájl/kép megjegyzése, kattintson a „Vonatmodell” elemre. A képzés általában 20 perc és 2 óra között tart, a fájlok számától és a sorban álló modellek számától függően. tudsz frissítés fizetett tervhez, hogy gyorsabb eredményeket érjen el ebben a szakaszban (általában 20 perc alatt).

Nanonets leverages deep learning to build various OCR models and tests them against each other for accuracy. Nanonets then picks out the best OCR model (based on your inputs and accuracy levels).

A „Modell Metrics” lapon a különböző mérések és összehasonlító elemzések láthatók, amelyek lehetővé tették a Nanonets számára, hogy kiválassza a legjobb OCR-modellt a megépítettek közül. A nagyobb pontosság elérése érdekében újra betaníthatja a modellt (a képzési képek szélesebb skálájával és jobb megjegyzésekkel).

Vagy ha elégedett a pontossággal, kattintson a „Teszt” gombra, hogy tesztelje és ellenőrizze, hogy ez az egyéni OCR-modell a várt módon teljesít-e olyan képeken vagy fájlokon, amelyekből szöveget/adatokat kell kivonni.

5. lépés: Az adatok tesztelése és ellenőrzése

Adjon hozzá néhány mintaképet az egyéni OCR-modell teszteléséhez és ellenőrzéséhez.

Ellenőrizze a kivonatolt szöveg pontosságát
Test & verify the accuracy of the extracted text

If the text has been recognized, extracted and presented appropriately then export the file. As you can see below, the extracted data has been organized and presented in a neat format.

Az exportált adatok szépen felsorolva
Az exportált adatok szépen felsorolva

Congratulations, you have now built and trained a custom OCR model to extract text from certain types of images!


Vállalkozása foglalkozik szövegfelismeréssel digitális dokumentumokban, képekben vagy PDF-ekben? Gondolkozott már azon, hogyan lehet pontosan szöveget kivonni a képekből?


Train your own OCR models with NanoNets API

Itt egy részletes útmutató az edzéshez your own OCR models using the Nanonets API. Az dokumentáció, találsz kész kódmintákat Python, Shell, Ruby, Golang, Java és C# nyelveken, valamint részletes API specifikációkat a különböző végpontokhoz.

Here’s a step-by-step guide to training your own model using the Nanonets API:

1. lépés: A Repo klónozása

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

2. lépés: Szerezze meg ingyenes API-kulcsát

Szerezze be ingyenes API-kulcsát innen https://app.nanonets.com/#/keys

3. lépés: Állítsa be az API-kulcsot környezeti változóként

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

4. lépés: Hozzon létre egy új modellt

python ./code/create-model.py

Megjegyzés: Ez létrehoz egy MODEL_ID-t, amelyre szüksége van a következő lépéshez

5. lépés: Adja hozzá a modellazonosítót környezeti változóként

export NANONETS_MODEL_ID=YOUR_MODEL_ID

6. lépés: Töltse fel a képzési adatokat

Gyűjtse össze az észlelni kívánt objektum képeit. Miután elkészült az adatkészlet a mappában images (képfájlok), kezdje el az adatkészlet feltöltését.

python ./code/upload-training.py

7. lépés: Vonatmodell

A képek feltöltése után kezdje el a modell betanítását

python ./code/train-model.py

8. lépés: Get Model State

A modell edzése ~30 percet vesz igénybe. A modell betanítása után e-mailt fog kapni. Közben ellenőrizze a modell állapotát

watch -n 100 python ./code/model-state.py

9. lépés: Készítsen előrejelzést

Miután a modellt betanították. A modell segítségével előrejelzéseket készíthet

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

The benefits of using Nanonets over other OCR APIs go beyond just better accuracy with respect to extracting text from images. Here are 7 reasons why you should consider using the Nanonets OCR for text recognition instead:

1. Working with custom data

Most OCR software are quite rigid on the type of data they can work with. Training an OCR model for a use case requires a large degree of flexibility with respect to its requirements and specifications; an OCR for invoice processing will vastly differ from an OCR for passports! Nanonets isn’t bound by such rigid limitations. Nanonets uses your own data to train OCR models that are best suited to meet the particular needs of your business.

2. Working with non-English or multiple languages

Since Nanonets focuses on training with custom data, it is uniquely placed to build a single OCR model that could extract text from images in any language or multiple languages at the same time.

3. Requires no post-processing

Text extracted using OCR models needs to be intelligently structured and presented in an intelligible format; otherwise considerable time and resources go into re-organizing the data into meaningful information. While most OCR tools simply grab and dump data from images, Nanonets extracts only the relevant data and automatically sorts them into intelligently structured fields making it easier to view and understand.

4. Learns continuously

Businesses often face dynamically changing requirements and needs. To overcome potential roadblocks, Nanonets allows you to easily re-train your models with new data. This allows your OCR model to adapt to unforeseen changes.

5. Handles common data constraints with ease

Nanonets leverages AI, ML & Deep Learning techniques to overcome common data constraints that greatly affect text recognition & extraction. Nanonets OCR can recognize and handle handwritten text, images of text in multiple languages at once, images with low resolution, images with new or cursive fonts and varying sizes, images with shadowy text, tilted text, random unstructured text, image noise, blurred images and more. Traditional OCR APIs are just not equipped to perform under such constraints; they require data at a very high level of fidelity which isn’t the norm in real life scenarios.

6. Requires no in-house team of developers

No need to worry about hiring developers and acquiring talent to personalize Nanonets API for your business requirements. Nanonets was built for hassle-free integration. You can also easily integrate Nanonets with most CRM, ERP or RPA software.

7. Customize, customize, customize

You can capture as many fields of text/data that you like with Nanonets OCR. You can even build custom validation rules that work for your specific text recognition and text extraction requirements. Nanonets is not bound by the template of your document at all. You can capture data in tables or line items or any other format!


A Nanonets számos olyan felhasználási lehetőséget kínál, amelyek optimalizálhatják az üzleti teljesítményt, megtakaríthatják a költségeket és fellendíthetik a növekedést. Kitalál hogyan vonatkozhatnak a Nanonets használati esetei az Ön termékére.

Vagy nézd meg Nanonetek OCR API akcióban, és kezdje el az egyéni kialakítást OCR modellek ingyen!


Frissítések július 2022: ezt a bejegyzést eredetileg ben tették közzé Október 2020 és azóta frissítve lett rendszeresen.

Itt egy dia összefoglalva ebben a cikkben az eredményeket. Itt van egy alternatív változat ennek a bejegyzésnek.

Időbélyeg:

Még több AI és gépi tanulás