Come estrarre testo o dati dall'immagine

Ripubblicato da Platone

Seguaci: 0

L'estrazione di testo da un'immagine può essere un processo complicato. La maggior parte delle persone digita manualmente il testo/i dati dall'immagine; ma questo è sia dispendioso in termini di tempo che inefficiente quando hai molte immagini da gestire.

Convertitori da immagine a testo offrono un modo semplice per estrarre il testo dalle immagini.

Sebbene tali strumenti svolgano un buon lavoro, il testo/i dati estratti sono spesso presentati in modo non strutturato che si traduce in un sacco di post-elaborazione.

An OCR basato sull'intelligenza artificiale come Nanonets può estrarre il testo dalle immagini e presentare i dati estratti in modo ordinato, organizzato e strutturato.

Nanonets estrae i dati dalle immagini in modo accurato, su larga scala e in più lingue. Nanonets è l'unico OCR di riconoscimento del testo che presenta il testo estratto in formati ben strutturati e completamente personalizzabili. I dati acquisiti possono essere presentati come tabelle, elementi pubblicitari o qualsiasi altro formato.

Clicca per caricare la tua immagine qui sotto
L'OCR di Nanonets riconosce automaticamente il contenuto del tuo file e lo converte in testo
Scarica il testo estratto come file di testo grezzo o integra tramite API

Sommario

Ecco tre metodi avanzati in cui puoi utilizzare Nanonets OCR per rilevare ed estrarre testo dalle immagini, estrai il testo da PDFs, estrarre i dati dal PDFs o analizzare i PDF e altri tipi di documenti:

Estrazione di testo da un'immagine utilizzando Nanonets

Hai bisogno di un OCR online gratuito per immagine in testo, PDF in tabella, PDF a testo, o Estrazione dati PDF? Dai un'occhiata a Nanonet online API OCR in azione e inizia a creare modelli OCR personalizzati gratuitamente!

Nanonets ha pre-addestrato modelli OCR per i tipi di immagine specifici elencati di seguito. Ogni modello OCR pre-addestrato è addestrato per correlare accuratamente il testo nel tipo di immagine a un campo appropriato come nome, indirizzo, data, scadenza ecc. e presentare il testo estratto in modo ordinato e organizzato.

Fatture
ricevute
Patente di guida (USA)
Passaporti

nanonet OCR online e API OCR hanno molti interessanti casi d'uso.

[Contenuto incorporato]

Nanonet che estraggono testo dalle immagini degli scontrini

Passaggio 1: selezionare un modello OCR appropriato

Accedi su Nanonets e selezionare un modello OCR appropriato all'immagine da cui si desidera estrarre testo e dati. Se nessuno dei modelli OCR pre-addestrati soddisfa le tue esigenze, puoi andare avanti per scoprire come creare un modello OCR personalizzato.

Passaggio 2: aggiungere file

Aggiungi i file/le immagini da cui vuoi estrarre il testo. Puoi aggiungere tutte le immagini che vuoi.

Passo 3: test

Attendere alcuni secondi per l'esecuzione del modello ed estrarre il testo dall'immagine.

Passaggio 4: verifica

Verifica velocemente il testo estratto da ogni file, controllando la vista tabella a destra. Puoi facilmente ricontrollare se il testo è stato riconosciuto correttamente e abbinato a un campo o tag appropriato.

In questa fase puoi anche scegliere di modificare/correggere i valori e le etichette dei campi. Nanonets non è vincolato dal modello dell'immagine.

I dati estratti possono essere visualizzati in un formato "Visualizzazione elenco" o "JSON".

Come estrarre testo o dati dall'immagine PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. — Il testo estratto visualizzato come elenco o output JSON

È possibile selezionare la casella di controllo accanto a ciascun valore o campo verificato o fare clic su "Verifica dati" per procedere immediatamente.

Passaggio 5: esporta

Una volta che tutti i file sono stati verificati. È possibile esportare i dati ben organizzati come file xml, xlsx o csv.

Nanonets è interessante casi d'uso e unico storie di successo dei clienti. Scopri come Nanonets può aiutare la tua azienda ad essere più produttiva.

Costruire un modello OCR personalizzato con Nanonets è facile. In genere puoi creare, addestrare e distribuire un modello per qualsiasi tipo di immagine o documento, in qualsiasi lingua, il tutto in meno di 25 minuti (a seconda del numero di file utilizzati per addestrare il modello).

Guarda il video qui sotto per seguire i primi 4 passaggi di questo metodo:

[Contenuto incorporato]

Come addestrare il proprio modello OCR con Nanonets

Passaggio 1: crea il tuo modello OCR

Accedi su Nanonets e fare clic su "Crea il tuo modello OCR".

Passaggio 2: carica i file / immagini di allenamento

Carica i file di esempio che verranno utilizzati per addestrare i modelli OCR. La precisione del modello OCR che crei dipenderà in gran parte dalla qualità e dalla quantità dei file / immagini caricati in questa fase

Passaggio 3: annota il testo sui file / immagini

Ora annota ogni parte di testo o dati con un campo o un'etichetta appropriati. Questo passaggio cruciale insegnerà al tuo modello OCR ad estrarre il testo appropriato dalle immagini e ad associarlo a campi personalizzati pertinenti alle tue esigenze.

Puoi anche aggiungere una nuova etichetta per annotare il testo o i dati. Ricorda, Nanonets non è vincolato dal modello dell'immagine!

Passaggio 4: addestrare il modello OCR personalizzato

Una volta completata l'annotazione per tutti i file / immagini di allenamento, fare clic su "Train Model". La formazione richiede solitamente tra 20 minuti e 2 ore a seconda del numero di file e dei modelli in coda per la formazione. Puoi upgrade a un piano a pagamento per ottenere risultati più rapidi in questa fase (in genere meno di 20 minuti).

Nanonets sfrutta il deep learning per creare vari modelli OCR e testarli l'uno contro l'altro per verificarne la precisione. Nanonets seleziona quindi il miglior modello OCR (in base ai tuoi input e ai livelli di precisione).

La scheda "Model Metrics" mostra le varie misurazioni e analisi comparative che hanno consentito a Nanonets di scegliere il miglior modello OCR tra tutti quelli costruiti. È possibile riqualificare il modello (fornendo una gamma più ampia di immagini di addestramento e una migliore annotazione) per ottenere livelli di precisione più elevati.

Oppure, se sei soddisfatto della precisione, fai clic su "Test" per testare e verificare se questo modello OCR personalizzato funziona come previsto su un campione di immagini o file da cui è necessario estrarre testo / dati.

Passaggio 5: prova e verifica i dati

Aggiungi un paio di immagini di esempio per testare e verificare il modello OCR personalizzato.

Verifica l'accuratezza del testo estratto — Testare e verificare l'accuratezza del testo estratto

Se il testo è stato riconosciuto, estratto e presentato in modo appropriato, esportare il file. Come puoi vedere di seguito, i dati estratti sono stati organizzati e presentati in un formato ordinato.

Congratulazioni, ora hai creato e addestrato un modello OCR personalizzato per estrarre il testo da determinati tipi di immagini!

La tua azienda si occupa di riconoscimento del testo in documenti digitali, immagini o PDF? Ti sei chiesto come estrarre il testo dalle immagini in modo accurato?

Addestra i tuoi modelli OCR con l'API NanoNets

Ecco un guida dettagliata per allenarsi i tuoi modelli OCR utilizzando il API Nanonets. Nel documentazione, troverai esempi di codice pronti per l'attivazione in Python, Shell, Ruby, Golang, Java e C#, nonché specifiche API dettagliate per diversi endpoint.

Ecco una guida passo passo per addestrare il tuo modello usando l'API Nanonets:

Passaggio 1: clonare il Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Passaggio 2: ottieni la tua chiave API gratuita

Ottieni la tua chiave API gratuita da https://app.nanonets.com/#/keys

Passaggio 3: impostare la chiave API come variabile di ambiente

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Passaggio 4: creare un nuovo modello

python ./code/create-model.py

Nota: questo genera un MODEL_ID necessario per il passaggio successivo

Passaggio 5: aggiungere l'ID modello come variabile di ambiente

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Passaggio 6: carica i dati di allenamento

Raccogliere le immagini dell'oggetto che si desidera rilevare. Dopo aver impostato il set di dati nella cartella images (file di immagine), inizia a caricare il set di dati.

python ./code/upload-training.py

Passaggio 7: modello di treno

Una volta caricate le immagini, inizia ad addestrare il modello

python ./code/train-model.py

Passaggio 8: ottenere lo stato del modello

Il modello impiega circa 30 minuti ad allenarsi. Riceverai un'email una volta che il modello sarà stato addestrato. Nel frattempo controlli lo stato del modello

watch -n 100 python ./code/model-state.py

Passaggio 9: fai una previsione

Una volta che il modello è stato addestrato. È possibile effettuare previsioni utilizzando il modello

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

I vantaggi dell'utilizzo di Nanonets rispetto ad altre API OCR vanno oltre una semplice migliore precisione rispetto all'estrazione di testo dalle immagini. Ecco 7 motivi per cui dovresti prendere in considerazione l'utilizzo di Nanonets OCR per il riconoscimento del testo:

1. Lavorare con i dati personalizzati

La maggior parte dei software OCR sono piuttosto rigidi sul tipo di dati con cui possono lavorare. La formazione di un modello OCR per un caso d'uso richiede un ampio grado di flessibilità rispetto ai suoi requisiti e alle sue specifiche; un OCR per l'elaborazione delle fatture sarà molto diverso da un OCR per i passaporti! Nanonets non è vincolato da limitazioni così rigide. Nanonets utilizza i tuoi dati per addestrare i modelli OCR più adatti a soddisfare le esigenze particolari della tua azienda.

2. Lavorare con lingue diverse dall'inglese o multiple

Poiché Nanonets si concentra sulla formazione con dati personalizzati, è in una posizione unica per creare un unico modello OCR in grado di estrarre testo dalle immagini in qualsiasi lingua o in più lingue contemporaneamente.

3. Non richiede post-elaborazione

Il testo estratto utilizzando i modelli OCR deve essere strutturato in modo intelligente e presentato in un formato comprensibile; altrimenti tempo e risorse considerevoli sono necessari per riorganizzare i dati in informazioni significative. Mentre la maggior parte degli strumenti OCR acquisisce e scarica semplicemente i dati dalle immagini, Nanonets estrae solo i dati rilevanti e li ordina automaticamente in campi strutturati in modo intelligente, semplificando la visualizzazione e la comprensione.

4. Impara continuamente

Le aziende spesso devono far fronte a requisiti ed esigenze in evoluzione dinamica. Per superare potenziali ostacoli, Nanonets ti consente di riqualificare facilmente i tuoi modelli con nuovi dati. Ciò consente al tuo modello OCR di adattarsi a cambiamenti imprevisti.

5. Gestisce facilmente i vincoli di dati comuni

Nanonets sfrutta le tecniche di intelligenza artificiale, machine learning e deep learning per superare i vincoli di dati comuni che influiscono notevolmente sul riconoscimento e l'estrazione del testo. Nanonets OCR è in grado di riconoscere e gestire testo scritto a mano, immagini di testo in più lingue contemporaneamente, immagini a bassa risoluzione, immagini con caratteri nuovi o corsivi e dimensioni variabili, immagini con testo ombreggiato, testo inclinato, testo non strutturato casuale, rumore dell'immagine, immagini sfocate e altro ancora. Le API OCR tradizionali semplicemente non sono attrezzate per funzionare con tali vincoli; richiedono dati a un livello di fedeltà molto elevato che non è la norma negli scenari della vita reale.

6. Non richiede un team interno di sviluppatori

Non c'è bisogno di preoccuparsi di assumere sviluppatori e acquisire talenti per personalizzare l'API Nanonets in base alle tue esigenze aziendali. Nanonets è stato creato per un'integrazione senza problemi. Puoi anche integrare facilmente Nanonets con la maggior parte dei software CRM, ERP o RPA.

7. Personalizza, personalizza, personalizza

Puoi acquisire tutti i campi di testo/dati che desideri con Nanonets OCR. Puoi persino creare regole di convalida personalizzate che funzionano per i tuoi requisiti specifici di riconoscimento del testo ed estrazione del testo. Nanonets non è affatto vincolato dal modello del tuo documento. Puoi acquisire dati in tabelle o elementi pubblicitari o in qualsiasi altro formato!

Nanonets ha molti casi d'uso che potrebbero ottimizzare le prestazioni della tua azienda, risparmiare sui costi e aumentare la crescita. Scoprire come i casi d'uso di Nanonets possono essere applicati al tuo prodotto.

Oppure controlla nanonet API OCR in azione e inizia a costruire personalizzato OCR modelli gratis!

Aggiornanento Luglio 2022: questo post è stato originariamente pubblicato in ottobre 2020 e da allora è stato aggiornato regolarmente.

Ecco una diapositiva riassumendo i risultati di questo articolo. Ecco un versione alternativa di questo post.

Timestamp: Luglio 17, 2022Luglio 18, 2022

Timestamp: APRILE 10, 2023