Hoe tekst of gegevens uit een afbeelding te extraheren?

Heruitgegeven door Plato

volgers: 0

Het extraheren van tekst uit een afbeelding kan een omslachtig proces zijn. De meeste mensen voeren de tekst/gegevens uit de afbeelding handmatig in; maar dit is zowel tijdrovend als inefficiënt als u veel afbeeldingen moet verwerken.

Afbeelding naar tekst converters bieden een handige manier om tekst uit afbeeldingen te extraheren.

Hoewel dergelijke tools goed werken, worden de geëxtraheerde tekst/gegevens vaak op een ongestructureerde manier gepresenteerd, wat resulteert in veel nabewerking.

An AI-gestuurde OCR zoals Nanonets kan tekst uit afbeeldingen halen en de geëxtraheerde gegevens op een nette, georganiseerde en gestructureerde manier presenteren.

Nanonets haalt gegevens nauwkeurig, op schaal en in meerdere talen uit afbeeldingen. Nanonets is de enige tekstherkenning OCR die geëxtraheerde tekst presenteert in netjes gestructureerde formaten die volledig aanpasbaar zijn. Vastgelegde gegevens kunnen worden gepresenteerd als tabellen, regelitems of een ander formaat.

Klik om uw afbeelding hieronder te uploaden
De OCR van Nanonet herkent automatisch de inhoud in uw bestand en zet het om in tekst
Download de geëxtraheerde tekst als een onbewerkt tekstbestand of integreer via API

Inhoudsopgave

Hier zijn drie geavanceerde methoden waarmee u Nanonets OCR kunt gebruiken om tekst uit afbeeldingen te detecteren en te extraheren, extraheer tekst uit PDFs, extraheer gegevens uit PDFs of ontleden pdf's en andere documenttypen:

Tekst uit een afbeelding extraheren met Nanonets

Een gratis online OCR nodig voor afbeelding naar tekst, PDF naar tafel, PDF naar tekstof PDF-gegevensextractie? Bekijk Nanonetten online OCR-API in actie en begin gratis met het bouwen van aangepaste OCR-modellen!

Nanonets heeft voorgetrainde OCR-modellen voor de onderstaande specifieke afbeeldingstypen. Elk vooraf getraind OCR-model is getraind om tekst in het afbeeldingstype nauwkeurig te relateren aan een geschikt veld zoals naam, adres, datum, vervaldatum enz. en de geëxtraheerde tekst op een nette en georganiseerde manier te presenteren.

Facturen
Ontvangsten
Rijbewijs (VS)
Paspoorten

Nanonetten online OCR & OCR API hebben veel interessante use cases.

[Ingesloten inhoud]

Nanonetten extraheren tekst uit afbeeldingen van bonnen

Stap 1: Selecteer een geschikt OCR-model

Inloggen naar Nanonetten en selecteer een OCR-model dat past bij de afbeelding waaruit u tekst en gegevens wilt extraheren. Als geen van de vooraf getrainde OCR-modellen aan uw vereisten voldoet, kunt u verder gaan om erachter te komen hoe u een aangepast OCR-model kunt maken.

Stap 2: bestanden toevoegen

Voeg de bestanden/afbeeldingen toe waaruit u tekst wilt extraheren. U kunt zoveel afbeeldingen toevoegen als u wilt.

Stap 3: Test

Geef het model enkele seconden de tijd om uit te voeren en tekst uit de afbeelding te extraheren.

Stap 4: Verifieer

Controleer snel de tekst die uit elk bestand is geëxtraheerd door de tabelweergave aan de rechterkant te bekijken. U kunt eenvoudig controleren of de tekst correct is herkend en gekoppeld aan een geschikt veld of label.

U kunt er in dit stadium zelfs voor kiezen om de veldwaarden en labels te bewerken/corrigeren. Nanonets is niet gebonden aan de sjabloon van de afbeelding.

Bewerk de geëxtraheerde tekst of gegevens

De geëxtraheerde gegevens kunnen worden weergegeven in een "List View" of "JSON" -formaat.

Hoe tekst of gegevens uit afbeelding te extraheren PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. — De geëxtraheerde tekst weergegeven als een lijst of JSON-uitvoer

U kunt het selectievakje naast elke waarde of elk veld dat u verifieert, aanvinken of op "Gegevens verifiëren" klikken om direct verder te gaan.

Stap 5: Export

Zodra alle bestanden zijn geverifieerd. U kunt de netjes georganiseerde gegevens exporteren als een xml-, xlsx- of csv-bestand.

Nanonets heeft interessante use cases en uniek succesverhalen van klanten. Ontdek hoe Nanonets uw bedrijf productiever kan maken.

Het bouwen van een aangepast OCR-model met Nanonets is eenvoudig. U kunt doorgaans in minder dan 25 minuten een model bouwen, trainen en implementeren voor elk type afbeelding of document, in elke taal (afhankelijk van het aantal bestanden dat is gebruikt om het model te trainen).

Bekijk onderstaande video om de eerste 4 stappen in deze methode te volgen:

[Ingesloten inhoud]

Hoe u uw eigen OCR-model kunt trainen met Nanonets

Stap 1: Maak uw eigen OCR-model

Inloggen naar Nanonets en klik op "Maak uw eigen OCR-model".

Stap 2: Upload trainingsbestanden / afbeeldingen

Upload voorbeeldbestanden die zullen worden gebruikt om de OCR-modellen te trainen. De nauwkeurigheid van het OCR-model dat u maakt, hangt grotendeels af van de kwaliteit en kwantiteit van de bestanden / afbeeldingen die in dit stadium worden geüpload

Stap 3: annoteer tekst op de bestanden / afbeeldingen

Annoteer nu elk stuk tekst of gegevens met een geschikt veld of label. Deze cruciale stap leert uw OCR-model om de juiste tekst uit afbeeldingen te extraheren en deze te koppelen aan aangepaste velden die relevant zijn voor uw behoeften.

U kunt ook een nieuw label toevoegen om de tekst of gegevens te annoteren. Onthoud dat Nanonets niet gebonden is aan het sjabloon van de afbeelding!

Stap 4: Train het aangepaste OCR-model

Zodra de annotatie voor alle trainingsbestanden / afbeeldingen is voltooid, klikt u op "Train Model". De training duurt gewoonlijk tussen de 20 en 2 uur, afhankelijk van het aantal bestanden en modellen in de wachtrij voor training. Jij kan upgrade naar een betaald plan om in dit stadium snellere resultaten te krijgen (meestal minder dan 20 minuten).

Nanonets maakt gebruik van deep learning om verschillende OCR-modellen te bouwen en ze tegen elkaar te testen op nauwkeurigheid. Nanonets kiest vervolgens het beste OCR-model (op basis van uw invoer en nauwkeurigheidsniveaus).

Het tabblad "Model Metrics" toont de verschillende metingen en vergelijkende analyses waarmee Nanonets het beste OCR-model kon kiezen uit alle modellen. U kunt het model opnieuw trainen (door een breder scala aan trainingsafbeeldingen en betere annotaties te bieden) om een hogere nauwkeurigheid te bereiken.

Of, als u tevreden bent met de nauwkeurigheid, klikt u op "Test" om te testen en te verifiëren of dit aangepaste OCR-model presteert zoals verwacht op een steekproef van afbeeldingen of bestanden waaruit tekst / gegevens moeten worden geëxtraheerd.

Stap 5: Test en verifieer gegevens

Voeg een aantal voorbeeldafbeeldingen toe om het aangepaste OCR-model te testen en te verifiëren.

Controleer de juistheid van de geëxtraheerde tekst — Test en verifieer de nauwkeurigheid van de geëxtraheerde tekst

Als de tekst is herkend, geëxtraheerd en op de juiste manier is gepresenteerd, exporteert u het bestand. Zoals u hieronder kunt zien, zijn de geëxtraheerde gegevens georganiseerd en gepresenteerd in een nette indeling.

Geëxporteerde gegevens netjes weergegeven

Gefeliciteerd, je hebt nu een aangepast OCR-model gebouwd en getraind om tekst uit bepaalde soorten afbeeldingen te extraheren!

Heeft uw bedrijf te maken met tekstherkenning in digitale documenten, afbeeldingen of pdf's? Heeft u zich afgevraagd hoe u nauwkeurig tekst uit afbeeldingen kunt extraheren?

Train uw eigen OCR-modellen met NanoNets API

Hier is een gedetailleerde gids om te trainen uw eigen OCR-modellen met behulp van de Nanonets-API. In de documentatie, vindt u kant-en-klare codevoorbeelden in Python, Shell, Ruby, Golang, Java en C#, evenals gedetailleerde API-specificaties voor verschillende eindpunten.

Hier is een stapsgewijze handleiding voor het trainen van uw eigen model met behulp van de Nanonets API:

Stap 1: Kloon de opslagplaats

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Stap 2: Ontvang uw gratis API-sleutel

Haal uw gratis API-sleutel op https://app.nanonets.com/#/keys

Stap 3: Stel de API-sleutel in als omgevingsvariabele

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Stap 4: maak een nieuw model

python ./code/create-model.py

Opmerking: dit genereert een MODEL_ID die u nodig heeft voor de volgende stap

Stap 5: Model-ID toevoegen als omgevingsvariabele

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Stap 6: Upload de trainingsgegevens

Verzamel de afbeeldingen van het object dat u wilt detecteren. Zodra u de dataset klaar heeft in de map images (afbeeldingsbestanden), start met het uploaden van de dataset.

python ./code/upload-training.py

Stap 7: Train Model

Zodra de afbeeldingen zijn geüpload, begint u met het trainen van het model

python ./code/train-model.py

Stap 8: Verkrijg de modelstatus

Het model heeft ongeveer 30 minuten nodig om te trainen. U ontvangt een e-mail zodra het model is getraind. Ondertussen check je de staat van het model

watch -n 100 python ./code/model-state.py

Stap 9: Maak een voorspelling

Zodra het model is opgeleid. Met het model kun je voorspellingen doen

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

De voordelen van het gebruik van Nanonetten ten opzichte van andere OCR-API's gaan verder dan alleen een betere nauwkeurigheid met betrekking tot het extraheren van tekst uit afbeeldingen. Hier zijn 7 redenen waarom u zou moeten overwegen om Nanonets OCR te gebruiken voor tekstherkenning:

1. Werken met aangepaste gegevens

De meeste OCR-software zijn vrij rigide wat betreft het type gegevens waarmee ze kunnen werken. Het trainen van een OCR-model voor een use case vereist een grote mate van flexibiliteit met betrekking tot de vereisten en specificaties; een OCR voor factuurverwerking zal enorm verschillen van een OCR voor paspoorten! Nanonetten is niet gebonden aan zulke rigide beperkingen. Nanonets gebruikt uw eigen gegevens om OCR-modellen te trainen die het beste aansluiten bij de specifieke behoeften van uw bedrijf.

2. Werken met niet-Engels of meerdere talen

Omdat Nanonets zich richt op training met aangepaste gegevens, is het uniek geplaatst om één enkel OCR-model te bouwen dat tekst uit afbeeldingen in elke taal of meerdere talen tegelijk kan extraheren.

3. Vereist geen nabewerking

Tekst geëxtraheerd met behulp van OCR-modellen moet intelligent worden gestructureerd en in een begrijpelijk formaat worden gepresenteerd; anders gaan er veel tijd en middelen in het reorganiseren van de gegevens in zinvolle informatie. Terwijl de meeste OCR-tools eenvoudig gegevens uit afbeeldingen halen en dumpen, extraheert Nanonets alleen de relevante gegevens en sorteert deze automatisch in intelligent gestructureerde velden, waardoor ze gemakkelijker te bekijken en te begrijpen zijn.

4. Leert continu

Bedrijven worden vaak geconfronteerd met dynamisch veranderende eisen en behoeften. Om mogelijke obstakels te overwinnen, kunt u met Nanonets uw modellen eenvoudig opnieuw trainen met nieuwe gegevens. Hierdoor kan uw OCR-model zich aanpassen aan onvoorziene veranderingen.

5. Kan gemakkelijk omgaan met veelvoorkomende gegevensbeperkingen

Nanonets maakt gebruik van AI-, ML- en Deep Learning-technieken om veelvoorkomende gegevensbeperkingen te overwinnen die een grote invloed hebben op tekstherkenning en -extractie. Nanonets OCR kan handgeschreven tekst herkennen en verwerken, afbeeldingen van tekst in meerdere talen tegelijk, afbeeldingen met lage resolutie, afbeeldingen met nieuwe of cursieve lettertypen en verschillende formaten, afbeeldingen met schaduwtekst, gekantelde tekst, willekeurige ongestructureerde tekst, beeldruis, wazige afbeeldingen en meer. Traditionele OCR-API's zijn gewoon niet uitgerust om onder dergelijke beperkingen te presteren; ze vereisen gegevens met een zeer hoge betrouwbaarheid, wat niet de norm is in scenario's in het echte leven.

6. Vereist geen intern team van ontwikkelaars

U hoeft zich geen zorgen te maken over het inhuren van ontwikkelaars en het werven van talent om Nanonets API te personaliseren voor uw zakelijke vereisten. Nanonets is gebouwd voor probleemloze integratie. U kunt Nanonets ook eenvoudig integreren met de meeste CRM-, ERP- of RPA-software.

7. Aanpassen, aanpassen, aanpassen

U kunt zoveel velden met tekst/gegevens vastleggen als u wilt met Nanonets OCR. U kunt zelfs aangepaste validatieregels maken die geschikt zijn voor uw specifieke vereisten voor tekstherkenning en tekstextractie. Nanonets is helemaal niet gebonden aan de template van uw document. U kunt gegevens vastleggen in tabellen of regelitems of in een ander formaat!

Nanonets heeft veel gebruiksscenario's die uw bedrijfsprestaties kunnen optimaliseren, kosten kunnen besparen en groei kunnen stimuleren. Ontdek hoe de use-cases van Nanonets van toepassing kunnen zijn op uw product.

Of bekijk het Nanonetten OCR-API in actie en begin met het bouwen van maatwerk OCR modellen gratis!

bijwerken juli- 2022: dit bericht is oorspronkelijk gepubliceerd in oktober 2020 en is sindsdien bijgewerkt regelmatig.

Hier is een dia samenvatting van de bevindingen in dit artikel. Hier is een alternatieve versie van dit bericht.

Tijdstempel: 17 juli 202218 juli 2022

Tijdstempel: 10-2023-XNUMX