Πώς να εξαγάγετε κείμενο ή δεδομένα από εικόνα

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Η εξαγωγή κειμένου από μια εικόνα μπορεί να είναι μια επίπονη διαδικασία. Οι περισσότεροι άνθρωποι πληκτρολογούν χειροκίνητα το κείμενο/δεδομένα από την εικόνα. αλλά αυτό είναι και χρονοβόρο και αναποτελεσματικό όταν έχετε πολλές εικόνες να αντιμετωπίσετε.

Μετατροπείς εικόνας σε κείμενο προσφέρουν έναν καθαρό τρόπο εξαγωγής κειμένου από εικόνες.

Ενώ τέτοια εργαλεία κάνουν καλή δουλειά, το εξαγόμενο κείμενο/δεδομένα παρουσιάζονται συχνά με αδόμητο τρόπο που οδηγεί σε πολλή μετα-επεξεργασία.

An OCR που βασίζεται σε AI όπως τα Nanonets μπορούν να αντλήσουν κείμενο από εικόνες και να παρουσιάσουν τα εξαγόμενα δεδομένα με τακτοποιημένο, οργανωμένο και δομημένο τρόπο.

Τα Nanonets εξάγουν δεδομένα από εικόνες με ακρίβεια, σε κλίμακα και σε πολλές γλώσσες. Το Nanonets είναι το μόνο OCR αναγνώρισης κειμένου που παρουσιάζει εξαγόμενο κείμενο σε σωστά δομημένες μορφές που είναι πλήρως προσαρμόσιμες. Τα δεδομένα που συλλέγονται μπορούν να παρουσιαστούν ως πίνακες, στοιχεία γραμμής ή οποιαδήποτε άλλη μορφή.

Κάντε κλικ για να ανεβάσετε την εικόνα σας παρακάτω
Το OCR της Nanonets αναγνωρίζει αυτόματα το περιεχόμενο στο αρχείο σας και το μετατρέπει σε κείμενο
Κατεβάστε το εξαγόμενο κείμενο ως αρχείο μη επεξεργασμένου κειμένου ή ενσωματώστε το μέσω API

Πίνακας περιεχομένων

Ακολουθούν τρεις προηγμένες μέθοδοι με τις οποίες μπορείτε να χρησιμοποιήσετε το Nanonets OCR για τον εντοπισμό και την εξαγωγή κειμένου από εικόνες, εξαγωγή κειμένου από PDFs, εξαγωγή δεδομένων από PDFs ή ανάλυση PDF και άλλους τύπους εγγράφων:

Εξαγωγή κειμένου από μια εικόνα χρησιμοποιώντας Nanonets

Χρειάζεστε ένα δωρεάν online OCR για εικόνα σε κείμενο, PDF σε πίνακα, PDF σε κείμενο, ή Εξαγωγή δεδομένων PDF? Ρίξτε μια ματιά στο Nanonets online API OCR σε δράση και ξεκινήστε να δημιουργείτε προσαρμοσμένα μοντέλα OCR δωρεάν!

Η Nanonets διαθέτει προεκπαιδευμένα μοντέλα OCR για τους συγκεκριμένους τύπους εικόνων που αναφέρονται παρακάτω. Κάθε προεκπαιδευμένο μοντέλο OCR εκπαιδεύεται να συσχετίζει με ακρίβεια το κείμενο στον τύπο εικόνας με ένα κατάλληλο πεδίο όπως όνομα, διεύθυνση, ημερομηνία, λήξη κ.λπ. και να παρουσιάζει το εξαγόμενο κείμενο με τακτοποιημένο και οργανωμένο τρόπο.

Τιμολόγια
Αποδείξεις
Άδεια οδήγησης (ΗΠΑ)
Διαβατήρια

Νανοδίκτυα διαδικτυακό OCR & OCR API έχουν πολλά ενδιαφέροντα περιπτώσεις χρήσης.

[Ενσωματωμένο περιεχόμενο]

Νανοδίκτυα που εξάγουν κείμενο από εικόνες αποδείξεων

Βήμα 1: Επιλέξτε ένα κατάλληλο μοντέλο OCR

Είσοδος στα Nanonets και επιλέξτε ένα μοντέλο OCR που είναι κατάλληλο για την εικόνα από την οποία θέλετε να εξαγάγετε κείμενο και δεδομένα. Εάν κανένα από τα προεκπαιδευμένα μοντέλα OCR δεν ταιριάζει στις απαιτήσεις σας, μπορείτε να προχωρήσετε για να μάθετε πώς να δημιουργήσετε ένα προσαρμοσμένο μοντέλο OCR.

Βήμα 2: Προσθέστε αρχεία

Προσθέστε τα αρχεία/εικόνες από τις οποίες θέλετε να εξαγάγετε κείμενο. Μπορείτε να προσθέσετε όσες εικόνες θέλετε.

Βήμα 3: Δοκιμή

Αφήστε μερικά δευτερόλεπτα για να εκτελεστεί το μοντέλο και να εξαγάγετε κείμενο από την εικόνα.

Βήμα 4: Επαλήθευση

Επαληθεύστε γρήγορα το κείμενο που εξάγεται από κάθε αρχείο, ελέγχοντας την προβολή πίνακα στα δεξιά. Μπορείτε εύκολα να ελέγξετε εάν το κείμενο έχει αναγνωριστεί σωστά και έχει αντιστοιχιστεί με ένα κατάλληλο πεδίο ή ετικέτα.

Μπορείτε ακόμη να επιλέξετε να επεξεργαστείτε/διορθώσετε τις τιμές και τις ετικέτες των πεδίων σε αυτό το στάδιο. Το Nanonets δεν δεσμεύεται από το πρότυπο της εικόνας.

Επεξεργαστείτε το εξαγόμενο κείμενο ή δεδομένα

Τα εξαγόμενα δεδομένα μπορούν να εμφανιστούν σε μορφή "Προβολή λίστας" ή "JSON".

Πώς να εξάγετε κείμενο ή δεδομένα από το Image PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται. — Το εξαγόμενο κείμενο εμφανίζεται ως λίστα ή έξοδος JSON

Μπορείτε να επιλέξετε το πλαίσιο ελέγχου δίπλα σε κάθε τιμή ή πεδίο που επαληθεύετε ή να κάνετε κλικ στο "Επαλήθευση δεδομένων" για να συνεχίσετε αμέσως.

Βήμα 5: Εξαγωγή

Αφού επαληθευτούν όλα τα αρχεία. Μπορείτε να εξαγάγετε τα σωστά οργανωμένα δεδομένα ως αρχείο xml, xlsx ή csv.

Τα Nanonets έχουν ενδιαφέρον περιπτώσεις χρήσης και μοναδικό ιστορίες επιτυχίας πελατών. Μάθετε πώς τα Nanonets μπορούν να ενισχύσουν την επιχείρησή σας για να είναι πιο παραγωγική.

Η δημιουργία ενός προσαρμοσμένου μοντέλου OCR με τα Nanonets είναι εύκολη. Μπορείτε συνήθως να δημιουργήσετε, να εκπαιδεύσετε και να αναπτύξετε ένα μοντέλο για οποιαδήποτε εικόνα ή τύπο εγγράφου, σε οποιαδήποτε γλώσσα, όλα σε λιγότερο από 25 λεπτά (ανάλογα με τον αριθμό των αρχείων που χρησιμοποιούνται για την εκπαίδευση του μοντέλου).

Δείτε το παρακάτω βίντεο για να ακολουθήσετε τα πρώτα 4 βήματα αυτής της μεθόδου:

[Ενσωματωμένο περιεχόμενο]

Πώς να εκπαιδεύσετε το δικό σας μοντέλο OCR με Nanonets

Βήμα 1: Δημιουργήστε το δικό σας μοντέλο OCR

Είσοδος στα Nanonets και κάντε κλικ στο "Δημιουργήστε το δικό σας μοντέλο OCR".

Βήμα 2: Ανεβάστε αρχεία/εικόνες εκπαίδευσης

Ανεβάστε δείγματα αρχείων που θα χρησιμοποιηθούν για την εκπαίδευση των μοντέλων OCR. Η ακρίβεια του μοντέλου OCR που δημιουργείτε θα εξαρτηθεί σε μεγάλο βαθμό από την ποιότητα και την ποσότητα των αρχείων/εικόνων που μεταφορτώνονται σε αυτό το στάδιο

Βήμα 3: Σημειώστε κείμενο στα αρχεία/εικόνες

Τώρα σημειώστε κάθε κομμάτι κειμένου ή δεδομένων με ένα κατάλληλο πεδίο ή ετικέτα. Αυτό το κρίσιμο βήμα θα διδάξει το μοντέλο OCR σας να εξάγει το κατάλληλο κείμενο από εικόνες και να το συσχετίζει με προσαρμοσμένα πεδία που είναι σχετικά με τις ανάγκες σας.

Μπορείτε επίσης να προσθέσετε μια νέα ετικέτα για να σχολιάσετε το κείμενο ή τα δεδομένα. Θυμηθείτε, το Nanonets δεν δεσμεύεται από το πρότυπο της εικόνας!

Βήμα 4: Εκπαιδεύστε το προσαρμοσμένο μοντέλο OCR

Μόλις ολοκληρωθεί ο σχολιασμός για όλα τα αρχεία/εικόνες εκπαίδευσης, κάντε κλικ στο «Μοντέλο τρένου». Η εκπαίδευση διαρκεί συνήθως μεταξύ 20 λεπτών-2 ωρών ανάλογα με τον αριθμό των αρχείων και των μοντέλων στην ουρά για εκπαίδευση. Μπορείς αναβάθμισης σε ένα πρόγραμμα επί πληρωμή για να έχετε ταχύτερα αποτελέσματα σε αυτό το στάδιο (συνήθως κάτω από 20 λεπτά).

Τα Nanonets αξιοποιούν τη βαθιά εκμάθηση για την κατασκευή διαφόρων μοντέλων OCR και τα δοκιμάζουν μεταξύ τους για ακρίβεια. Στη συνέχεια, η Nanonets επιλέγει το καλύτερο μοντέλο OCR (με βάση τις εισόδους και τα επίπεδα ακρίβειας).

Η καρτέλα "Model Metrics" δείχνει τις διάφορες μετρήσεις και συγκριτικές αναλύσεις που επέτρεψαν στα Nanonets να επιλέξουν το καλύτερο μοντέλο OCR μεταξύ όλων των που δημιουργήθηκαν. Μπορείτε να επανεκπαιδεύσετε το μοντέλο (παρέχοντας ένα ευρύτερο φάσμα εικόνων εκπαίδευσης και καλύτερο σχολιασμό) για να επιτύχετε υψηλότερα επίπεδα ακρίβειας.

Ή, εάν είστε ικανοποιημένοι με την ακρίβεια, κάντε κλικ στο "Δοκιμή" για να ελέγξετε και να επαληθεύσετε εάν αυτό το προσαρμοσμένο μοντέλο OCR λειτουργεί όπως αναμένεται σε ένα δείγμα εικόνων ή αρχείων από τα οποία πρέπει να εξαχθεί κείμενο/δεδομένα.

Βήμα 5: Δοκιμή και επαλήθευση δεδομένων

Προσθέστε μερικά δείγματα εικόνων για δοκιμή και επαλήθευση του προσαρμοσμένου μοντέλου OCR.

Επαληθεύστε την ακρίβεια του εξαγόμενου κειμένου — Δοκιμάστε και επαληθεύστε την ακρίβεια του εξαγόμενου κειμένου

Εάν το κείμενο έχει αναγνωριστεί, εξαχθεί και παρουσιαστεί κατάλληλα, τότε εξαγάγετε το αρχείο. Όπως μπορείτε να δείτε παρακάτω, τα εξαγόμενα δεδομένα έχουν οργανωθεί και παρουσιαστεί σε καθαρή μορφή.

Τα εξαγόμενα δεδομένα παρατίθενται τακτοποιημένα

Συγχαρητήρια, έχετε πλέον δημιουργήσει και εκπαιδεύσει ένα προσαρμοσμένο μοντέλο OCR για την εξαγωγή κειμένου από συγκεκριμένους τύπους εικόνων!

Ασχολείται η επιχείρησή σας με την αναγνώριση κειμένου σε ψηφιακά έγγραφα, εικόνες ή PDF; Έχετε αναρωτηθεί πώς να εξαγάγετε κείμενο από εικόνες με ακρίβεια;

Εκπαιδεύστε τα δικά σας μοντέλα OCR με το NanoNets API

Εδώ είναι μια αναλυτικός οδηγός εκπαίδευσης τα δικά σας μοντέλα OCR χρησιμοποιώντας το API Nanonets. Στην τεκμηρίωση, θα βρείτε έτοιμα προς ενεργοποίηση δείγματα κώδικα σε Python, Shell, Ruby, Golang, Java και C#, καθώς και λεπτομερείς προδιαγραφές API για διαφορετικά τελικά σημεία.

Ακολουθεί ένας βήμα προς βήμα οδηγός για να εκπαιδεύσετε το δικό σας μοντέλο χρησιμοποιώντας το Nanonets API:

Βήμα 1: Κλωνοποιήστε το Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Βήμα 2: Αποκτήστε το δωρεάν κλειδί API

Αποκτήστε το δωρεάν κλειδί API σας https://app.nanonets.com/#/keys

Βήμα 3: Ορίστε το κλειδί API ως μεταβλητή περιβάλλοντος

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Βήμα 4: Δημιουργήστε ένα νέο μοντέλο

python ./code/create-model.py

Σημείωση: Αυτό δημιουργεί ένα MODEL_ID που χρειάζεστε για το επόμενο βήμα

Βήμα 5: Προσθέστε το αναγνωριστικό μοντέλου ως μεταβλητή περιβάλλοντος

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Βήμα 6: Ανεβάστε τα δεδομένα εκπαίδευσης

Συλλέξτε τις εικόνες του αντικειμένου που θέλετε να εντοπίσετε. Μόλις έχετε έτοιμο το σύνολο δεδομένων στο φάκελο images (αρχεία εικόνας), ξεκινήστε να ανεβάζετε το σύνολο δεδομένων.

python ./code/upload-training.py

Βήμα 7: Εκπαίδευση μοντέλου

Μετά τη μεταφόρτωση των εικόνων, αρχίστε να εκπαιδεύετε το μοντέλο

python ./code/train-model.py

Βήμα 8: Λήψη κατάστασης μοντέλου

Το μοντέλο διαρκεί ~ 30 λεπτά. Θα λάβετε ένα μήνυμα ηλεκτρονικού ταχυδρομείου μόλις εκπαιδευτεί το μοντέλο. Εν τω μεταξύ, ελέγχετε την κατάσταση του μοντέλου

watch -n 100 python ./code/model-state.py

Βήμα 9: Κάντε πρόβλεψη

Μόλις εκπαιδευτεί το μοντέλο. Μπορείτε να κάνετε προβλέψεις χρησιμοποιώντας το μοντέλο

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Τα οφέλη από τη χρήση Nanonets έναντι άλλων API OCR υπερβαίνουν απλώς την καλύτερη ακρίβεια όσον αφορά την εξαγωγή κειμένου από εικόνες. Ακολουθούν 7 λόγοι για τους οποίους θα πρέπει να εξετάσετε το ενδεχόμενο να χρησιμοποιήσετε το Nanonets OCR για αναγνώριση κειμένου:

1. Εργασία με προσαρμοσμένα δεδομένα

Τα περισσότερα λογισμικά OCR είναι αρκετά άκαμπτα ως προς τον τύπο των δεδομένων με τα οποία μπορούν να εργαστούν. Η εκπαίδευση ενός μοντέλου OCR για μια περίπτωση χρήσης απαιτεί μεγάλο βαθμό ευελιξίας σε σχέση με τις απαιτήσεις και τις προδιαγραφές του. ένα OCR για την επεξεργασία τιμολογίων θα διαφέρει πολύ από ένα OCR για τα διαβατήρια! Τα Nanonets δεν δεσμεύονται από τόσο αυστηρούς περιορισμούς. Η Nanonets χρησιμοποιεί τα δικά σας δεδομένα για να εκπαιδεύσει μοντέλα OCR που ταιριάζουν καλύτερα στις ιδιαίτερες ανάγκες της επιχείρησής σας.

2. Εργασία με μη αγγλικά ή πολλές γλώσσες

Δεδομένου ότι το Nanonets εστιάζει στην εκπαίδευση με προσαρμοσμένα δεδομένα, είναι μοναδικά τοποθετημένο για τη δημιουργία ενός ενιαίου μοντέλου OCR που θα μπορούσε να εξάγει κείμενο από εικόνες σε οποιαδήποτε γλώσσα ή σε πολλές γλώσσες ταυτόχρονα.

3. Δεν απαιτείται μεταγενέστερη επεξεργασία

Το κείμενο που εξάγεται χρησιμοποιώντας μοντέλα OCR πρέπει να είναι έξυπνα δομημένο και να παρουσιάζεται σε κατανοητή μορφή. Διαφορετικά, σημαντικός χρόνος και πόροι διατίθενται για την αναδιοργάνωση των δεδομένων σε σημαντικές πληροφορίες. Ενώ τα περισσότερα εργαλεία OCR απλώς αρπάζουν και απορρίπτουν δεδομένα από εικόνες, το Nanonets εξάγει μόνο τα σχετικά δεδομένα και τα ταξινομεί αυτόματα σε έξυπνα δομημένα πεδία, διευκολύνοντας την προβολή και την κατανόηση.

4. Μαθαίνει συνεχώς

Οι επιχειρήσεις αντιμετωπίζουν συχνά δυναμικά μεταβαλλόμενες απαιτήσεις και ανάγκες. Για να ξεπεράσετε πιθανά εμπόδια, το Nanonets σάς επιτρέπει να εκπαιδεύετε εύκολα τα μοντέλα σας με νέα δεδομένα. Αυτό επιτρέπει στο μοντέλο OCR να προσαρμόζεται σε απρόβλεπτες αλλαγές.

5. Χειρίζεται με ευκολία κοινούς περιορισμούς δεδομένων

Τα Nanonets αξιοποιούν τεχνικές AI, ML και Deep Learning για να ξεπεράσουν κοινούς περιορισμούς δεδομένων που επηρεάζουν σε μεγάλο βαθμό την αναγνώριση και εξαγωγή κειμένου. Το Nanonets OCR μπορεί να αναγνωρίσει και να χειριστεί χειρόγραφο κείμενο, εικόνες κειμένου σε πολλές γλώσσες ταυτόχρονα, εικόνες με χαμηλή ανάλυση, εικόνες με νέες ή κουρδισμένες γραμματοσειρές και διαφορετικά μεγέθη, εικόνες με σκιερό κείμενο, κεκλιμένο κείμενο, τυχαίο μη δομημένο κείμενο, θόρυβο εικόνας, θολές εικόνες κι αλλα. Τα παραδοσιακά API OCR απλώς δεν είναι εξοπλισμένα για απόδοση κάτω από τέτοιους περιορισμούς. απαιτούν δεδομένα σε πολύ υψηλό επίπεδο πιστότητας που δεν είναι ο κανόνας στα σενάρια της πραγματικής ζωής.

6. Δεν απαιτείται εσωτερική ομάδα προγραμματιστών

Δεν χρειάζεται να ανησυχείτε για την πρόσληψη προγραμματιστών και την απόκτηση ταλέντων για την εξατομίκευση του Nanonets API για τις απαιτήσεις της επιχείρησής σας. Τα Nanonets κατασκευάστηκαν για ενσωμάτωση χωρίς προβλήματα. Μπορείτε επίσης να ενσωματώσετε εύκολα τα Nanonets με τα περισσότερα λογισμικά CRM, ERP ή RPA.

7. Προσαρμογή, προσαρμογή, προσαρμογή

Μπορείτε να καταγράψετε όσα πεδία κειμένου/δεδομένων θέλετε με το Nanonets OCR. Μπορείτε ακόμη να δημιουργήσετε προσαρμοσμένους κανόνες επικύρωσης που λειτουργούν για τις συγκεκριμένες απαιτήσεις αναγνώρισης κειμένου και εξαγωγής κειμένου. Το Nanonets δεν δεσμεύεται καθόλου από το πρότυπο του εγγράφου σας. Μπορείτε να καταγράψετε δεδομένα σε πίνακες ή στοιχεία γραμμής ή οποιαδήποτε άλλη μορφή!

Τα Nanonets έχουν πολλές περιπτώσεις χρήσης που θα μπορούσαν να βελτιστοποιήσουν την απόδοση της επιχείρησής σας, να εξοικονομήσουν κόστος και να αυξήσουν την ανάπτυξη. Βρίσκω πώς μπορούν να εφαρμοστούν οι περιπτώσεις χρήσης Nanonets στο προϊόν σας.

Ή ρίξτε μια ματιά Νανοδίκτυα API OCR σε δράση και ξεκινήστε να δημιουργείτε έθιμο OCR δωρεάν μοντέλα!

Ενημέρωση Ιούλιος 2022: αυτή η ανάρτηση δημοσιεύτηκε αρχικά στο Οκτ 2020 και έκτοτε έχει ενημερωθεί τακτικά.

Εδώ είναι μια διαφάνεια συνοψίζοντας τα ευρήματα σε αυτό το άρθρο. Εδώ είναι ένα εναλλακτική έκδοση αυτής της ανάρτησης.

Σφραγίδα ώρας: Ιούλιος 17, 2022Ιούλιος 18, 2022

Σφραγίδα ώρας: 10 Απριλίου 2023