Comment extraire du texte ou des données d'une image PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Comment extraire du texte ou des données d'une image

Extraire du texte d'une image peut être un processus fastidieux. La plupart des gens saisissent manuellement le texte/les données de l'image ; mais cela prend du temps et est inefficace lorsque vous avez beaucoup d'images à traiter.

Convertisseurs d'image en texte offrent un moyen pratique d'extraire du texte à partir d'images.

Bien que ces outils fassent du bon travail, le texte/les données extraits sont souvent présentés de manière non structurée, ce qui entraîne beaucoup de post-traitement.

An OCR basé sur l'IA comme les nanonets peuvent extraire du texte des images et présenter les données extraites de manière soignée, organisée et structurée.

Nanonets extrait les données des images avec précision, à grande échelle et dans plusieurs langues. Nanonets est le seul OCR de reconnaissance de texte qui présente le texte extrait dans des formats parfaitement structurés et entièrement personnalisables. Les données capturées peuvent être présentées sous forme de tableaux, d'éléments de ligne ou de tout autre format.

  1. Cliquez pour télécharger votre image ci-dessous
  2. L'OCR de Nanonets reconnaît automatiquement le contenu de votre fichier et le convertit en texte
  3. Téléchargez le texte extrait sous forme de fichier texte brut ou intégrez-le via l'API


Table des matières

Voici trois méthodes avancées dans lesquelles vous pouvez utiliser Nanonets OCR pour détecter et extraire du texte à partir d'images, extraire le texte du PDFs, extraire des données d'un PDFs ou analyser les fichiers PDF et autres types de documents :

Extraire du texte d'une image à l'aide de Nanonets

Besoin d'un OCR en ligne gratuit pour image en texte, PDF au tableau, PDF en texteou Extraction de données PDF? Découvrez Nanonets en ligne API OCR en action et commencez à créer des modèles OCR personnalisés gratuitement !


Nanonets dispose de modèles OCR pré-formés pour les types d'images spécifiques répertoriés ci-dessous. Chaque modèle OCR pré-formé est formé pour associer avec précision le texte du type d'image à un champ approprié comme le nom, l'adresse, la date, l'expiration, etc. et présenter le texte extrait de manière nette et organisée.

  • Factures
  • Recettes
  • Permis de conduire (États-Unis)
  • Passeports

nanonets API OCR et OCR en ligne avoir beaucoup intéressant cas d'utilisation.


[Contenu intégré]
Nanonets extrayant du texte à partir d'images de reçus

Étape 1: Sélectionnez un modèle OCR approprié

Connexion vers Nanonets et sélectionnez un modèle OCR adapté à l'image à partir de laquelle vous souhaitez extraire du texte et des données. Si aucun des modèles OCR pré-formés ne répond à vos besoins, vous pouvez passer à la suite pour découvrir comment créer un modèle OCR personnalisé.

Étape 2: ajouter des fichiers

Ajoutez les fichiers/images dont vous souhaitez extraire le texte. Vous pouvez ajouter autant d'images que vous le souhaitez.

Étape 3: Test

Attendez quelques secondes pour que le modèle s'exécute et extraie le texte de l'image.

Étape 4: vérifier

Vérifiez rapidement le texte extrait de chaque fichier, en vérifiant la vue du tableau sur la droite. Vous pouvez facilement revérifier si le texte a été correctement reconnu et mis en correspondance avec un champ ou une balise appropriée.

Vous pouvez même choisir de modifier/corriger les valeurs de champ et les étiquettes à ce stade. Nanonets n'est pas lié par le modèle de l'image.

Modifier le texte ou les données extraits
Modifier le texte ou les données extraits

Les données extraites peuvent être affichées dans un format «List View» ou «JSON».

Vous pouvez cocher la case à côté de chaque valeur ou champ que vous vérifiez ou cliquer sur «Vérifier les données» pour continuer instantanément.

Vérifiez les données
Vérifiez les données

Étape 5: Exporter

Une fois que tous les fichiers ont été vérifiés. Vous pouvez exporter les données soigneusement organisées sous forme de fichier xml, xlsx ou csv.

Exporter les données extraites
Exporter les données extraites

Nanonets a intéressant cas d'utilisation et unique histoires de réussite de clients. Découvrez comment les nanonets peuvent permettre à votre entreprise d'être plus productive.


Construire un modèle OCR personnalisé avec Nanonets est facile. Vous pouvez généralement créer, former et déployer un modèle pour n'importe quel type d'image ou de document, dans n'importe quelle langue, le tout en moins de 25 minutes (selon le nombre de fichiers utilisés pour former le modèle).

Regardez la vidéo ci-dessous pour suivre les 4 premières étapes de cette méthode :

[Contenu intégré]
Comment former votre propre modèle OCR avec des nanonets

Étape 1: Créez votre propre modèle OCR

Connexion à Nanonets et cliquez sur «Créer votre propre modèle OCR».

Étape 2: Téléchargez les fichiers / images de formation

Téléchargez des exemples de fichiers qui seront utilisés pour entraîner les modèles OCR. La précision du modèle OCR que vous construisez dépendra en grande partie de la qualité et de la quantité des fichiers / images téléchargés à ce stade

Étape 3: annoter le texte sur les fichiers / images

Annotez maintenant chaque élément de texte ou de données avec un champ ou une étiquette approprié. Cette étape cruciale apprendra à votre modèle OCR à extraire le texte approprié des images et à l'associer à des champs personnalisés correspondant à vos besoins.

Vous pouvez également ajouter une nouvelle étiquette pour annoter le texte ou les données. N'oubliez pas que Nanonets n'est pas lié par le modèle de l'image !

Étape 4: Former le modèle OCR personnalisé

Une fois l'annotation terminée pour tous les fichiers / images de formation, cliquez sur «Train Model». La formation prend généralement entre 20 minutes et 2 heures selon le nombre de fichiers et de modèles en file d'attente pour la formation. Vous pouvez améliorer à un forfait payant pour obtenir des résultats plus rapides à ce stade (généralement moins de 20 minutes).

Nanonets tire parti de l'apprentissage approfondi pour créer divers modèles OCR et les teste les uns par rapport aux autres pour en vérifier la précision. Nanonets sélectionne ensuite le meilleur modèle OCR (en fonction de vos entrées et de vos niveaux de précision).

L'onglet "Model Metrics" montre les différentes mesures et analyses comparatives qui ont permis à Nanonets de choisir le meilleur modèle OCR parmi tous ceux qui ont été construits. Vous pouvez réentraîner le modèle (en fournissant une gamme plus large d'images d'entraînement et une meilleure annotation) pour atteindre des niveaux de précision plus élevés.

Ou, si vous êtes satisfait de la précision, cliquez sur «Test» pour tester et vérifier si ce modèle OCR personnalisé fonctionne comme prévu sur un échantillon d'images ou de fichiers dont le texte / les données doivent être extraits.

Étape 5: Tester et vérifier les données

Ajoutez quelques exemples d'images pour tester et vérifier le modèle OCR personnalisé.

Vérifier l'exactitude du texte extrait
Tester et vérifier l'exactitude du texte extrait

Si le texte a été reconnu, extrait et présenté correctement, exportez le fichier. Comme vous pouvez le voir ci-dessous, les données extraites ont été organisées et présentées dans un format soigné.

Données exportées répertoriées proprement
Données exportées répertoriées proprement

Félicitations, vous avez maintenant créé et entraîné un modèle OCR personnalisé pour extraire du texte de certains types d'images !


Votre entreprise s'occupe de la reconnaissance de texte dans des documents numériques, des images ou des PDF ? Vous êtes-vous demandé comment extraire le texte des images avec précision ?


Entraînez vos propres modèles OCR avec l'API NanoNets

Voici un guide détaillé pour s'entraîner vos propres modèles OCR à l'aide de API Nanonets. Dans le Documentation, vous trouverez des exemples de code prêts à être déclenchés en Python, Shell, Ruby, Golang, Java et C#, ainsi que des spécifications API détaillées pour différents points de terminaison.

Voici un guide étape par étape pour entraîner votre propre modèle à l'aide de l'API Nanonets :

Étape 1: cloner le référentiel

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Étape 2: Obtenez votre clé API gratuite

Obtenez votre clé API gratuite sur https://app.nanonets.com/#/keys

Étape 3: définir la clé API comme variable d'environnement

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Étape 4: créer un nouveau modèle

python ./code/create-model.py

Remarque: cela génère un MODEL_ID dont vous avez besoin pour l'étape suivante

Étape 5: ajouter l'ID de modèle en tant que variable d'environnement

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Étape 6: télécharger les données de formation

Collectez les images de l'objet que vous souhaitez détecter. Une fois que le jeu de données est prêt dans le dossier images (fichiers image), commencez à télécharger l'ensemble de données.

python ./code/upload-training.py

Étape 7: modèle de train

Une fois les images téléchargées, commencez à former le modèle

python ./code/train-model.py

Étape 8: obtenir l'état du modèle

Le modèle prend environ 30 minutes pour s'entraîner. Vous recevrez un e-mail une fois le modèle formé. En attendant, vous vérifiez l'état du modèle

watch -n 100 python ./code/model-state.py

Étape 9: Faire une prédiction

Une fois le modèle formé. Vous pouvez faire des prédictions en utilisant le modèle

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Les avantages de l'utilisation de Nanonets par rapport aux autres API OCR vont au-delà d'une simple précision en ce qui concerne l'extraction de texte à partir d'images. Voici 7 raisons pour lesquelles vous devriez plutôt envisager d'utiliser l'OCR Nanonets pour la reconnaissance de texte :

1. Travailler avec des données personnalisées

La plupart des logiciels OCR sont assez rigides sur le type de données avec lesquelles ils peuvent travailler. La formation d'un modèle OCR pour un cas d'utilisation nécessite une grande flexibilité en ce qui concerne ses exigences et ses spécifications ; un OCR pour le traitement des factures sera très différent d'un OCR pour les passeports ! Les nanonets ne sont pas liés par des limitations aussi rigides. Nanonets utilise vos propres données pour former les modèles OCR les mieux adaptés pour répondre aux besoins particuliers de votre entreprise.

2. Travailler avec des langues autres que l'anglais ou plusieurs langues

Étant donné que Nanonets se concentre sur la formation avec des données personnalisées, il est idéalement placé pour créer un modèle OCR unique qui pourrait extraire du texte à partir d'images dans n'importe quelle langue ou dans plusieurs langues en même temps.

3. Ne nécessite aucun post-traitement

Le texte extrait à l'aide de modèles OCR doit être intelligemment structuré et présenté dans un format intelligible ; sinon, un temps et des ressources considérables sont consacrés à la réorganisation des données en informations significatives. Alors que la plupart des outils OCR saisissent et vident simplement les données des images, Nanonets extrait uniquement les données pertinentes et les trie automatiquement dans des champs intelligemment structurés, ce qui facilite la visualisation et la compréhension.

4. Apprend en continu

Les entreprises sont souvent confrontées à des exigences et à des besoins en constante évolution. Pour surmonter les obstacles potentiels, Nanonets vous permet de réentraîner facilement vos modèles avec de nouvelles données. Cela permet à votre modèle OCR de s'adapter aux changements imprévus.

5. Gère facilement les contraintes de données courantes

Nanonets exploite les techniques d'IA, de ML et d'apprentissage en profondeur pour surmonter les contraintes de données courantes qui affectent considérablement la reconnaissance et l'extraction de texte. Nanonets OCR peut reconnaître et gérer du texte manuscrit, des images de texte dans plusieurs langues à la fois, des images à faible résolution, des images avec des polices nouvelles ou cursives et des tailles variables, des images avec du texte ombré, du texte incliné, du texte aléatoire non structuré, du bruit d'image, des images floues et plus. Les API OCR traditionnelles ne sont tout simplement pas équipées pour fonctionner sous de telles contraintes ; ils nécessitent des données à un niveau de fidélité très élevé, ce qui n'est pas la norme dans les scénarios de la vie réelle.

6. Ne nécessite aucune équipe interne de développeurs

Inutile de vous soucier de l'embauche de développeurs et de l'acquisition de talents pour personnaliser l'API Nanonets en fonction des besoins de votre entreprise. Nanonets a été conçu pour une intégration sans tracas. Vous pouvez également intégrer facilement les Nanonets à la plupart des logiciels CRM, ERP ou RPA.

7. Personnalisez, personnalisez, personnalisez

Vous pouvez capturer autant de champs de texte/données que vous le souhaitez avec Nanonets OCR. Vous pouvez même créer des règles de validation personnalisées adaptées à vos besoins spécifiques en matière de reconnaissance et d'extraction de texte. Nanonets n'est pas du tout lié par le modèle de votre document. Vous pouvez capturer des données dans des tableaux ou des éléments de ligne ou tout autre format !


Nanonets a de nombreux cas d'utilisation qui pourraient optimiser les performances de votre entreprise, réduire les coûts et stimuler la croissance. Découvre ça comment les cas d'utilisation de Nanonets peuvent s'appliquer à votre produit.

Ou consultez nanonets API OCR en action et commencez à construire sur mesure OCR modèles gratuitement!


Mises à jour Juillet 2022: ce message a été initialement publié dans OCT 2020 et a depuis été mis à jour régulièrement.

Voici une diapositive résumant les résultats dans cet article. Voici un version alternative de ce post.

Horodatage:

Plus de AI et apprentissage automatique