Görüntüden Metin veya Veri Nasıl Çıkarılır

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Bir görüntüden metin çıkarmak zahmetli bir süreç olabilir. Çoğu kişi görüntüdeki metni/verileri manuel olarak girer; ancak uğraşacak çok fazla görüntünüz olduğunda bu hem zaman alıcı hem de verimsizdir.

Görüntüden metne dönüştürücüler resimlerden metin çıkarmanın düzgün bir yolunu sunar.

Bu tür araçlar iyi bir iş çıkarsa da, çıkarılan metin/veriler genellikle yapılandırılmamış bir şekilde sunulur ve bu da birçok işlem sonrası ile sonuçlanır.

An AI güdümlü OCR Nanonet'lerin görüntülerden metin çekebilmesi ve ayıklanan verileri düzgün, organize ve yapılandırılmış bir şekilde sunabilmesi gibi.

Nanonetler, görüntülerden verileri doğru, ölçekte ve birden çok dilde ayıklar. Nanonets, ayıklanmış metni tamamen özelleştirilebilir, düzgün yapılandırılmış biçimlerde sunan tek metin tanıma OCR'sidir. Yakalanan veriler tablolar, satır öğeleri veya başka herhangi bir biçimde sunulabilir.

Resminizi aşağıya yüklemek için tıklayın
Nanonets'in OCR'si dosyanızdaki içeriği otomatik olarak tanır ve onu metne dönüştürür
Ayıklanan metni ham metin dosyası olarak indirin veya API aracılığıyla entegre edin

İçindekiler

Görüntülerden metin algılamak ve çıkarmak için Nanonets OCR'yi kullanabileceğiniz üç gelişmiş yöntem, PDF'den metin ayıklas, PDF'den veri als veya PDF'leri ayrıştır ve diğer belge türleri:

Nanonets kullanarak bir görüntüden metin çıkarma

için ücretsiz bir çevrimiçi OCR'ye ihtiyacınız var resimden metne, PDF'den tabloya, PDF'den metneya da PDF veri çıkarma? Nanonets'e çevrimiçi göz atın OCR API'si harekete geçin ve ücretsiz olarak özel OCR modelleri oluşturmaya başlayın!

Nanonets, aşağıda listelenen belirli görüntü türleri için önceden eğitilmiş OCR modellerine sahiptir. Önceden eğitilmiş her bir OCR modeli, görüntü türündeki metni ad, adres, tarih, son kullanma tarihi vb. gibi uygun bir alanla doğru bir şekilde ilişkilendirmek ve çıkarılan metni düzgün ve düzenli bir şekilde sunmak için eğitilmiştir.

Faturalar
makbuzlar
Sürücü belgesi (ABD)
Pasaportlar

Nanonetler çevrimiçi OCR ve OCR API çok ilginç kullanım durumları.

[Gömülü içerik]

Makbuz görüntülerinden metin çıkaran nanonetler

Adım 1: Uygun bir OCR modeli seçin

Giriş Yap Nanonets'e gidin ve metin ve veri çıkarmak istediğiniz görüntüye uygun bir OCR modeli seçin. Önceden eğitilmiş OCR modellerinden hiçbiri gereksinimlerinizi karşılamıyorsa, özel bir OCR modelinin nasıl oluşturulacağını öğrenmek için ilerleyebilirsiniz.

2. Adım: Dosyaları ekleyin

Metin çıkarmak istediğiniz dosyaları/görüntüleri ekleyin. İstediğiniz kadar resim ekleyebilirsiniz.

3 Adımı: Test

Modelin çalışması ve görüntüden metin çıkarması için birkaç saniye bekleyin.

4. Adım: Doğrulayın

Sağdaki tablo görünümünü kontrol ederek her dosyadan çıkarılan metni hızla doğrulayın. Metnin doğru bir şekilde tanınıp tanınmadığını ve uygun bir alan veya etiketle eşleştirilip eşleştirilmediğini kolayca iki kez kontrol edebilirsiniz.

Hatta bu aşamada alan değerlerini ve etiketleri düzenlemeyi/düzeltmeyi seçebilirsiniz. Nanonetler görüntünün şablonuna bağlı değildir.

Çıkarılan metni veya verileri düzenleyin

Çıkarılan veriler "Liste Görünümü" veya "JSON" formatında görüntülenebilir.

Görüntüden Metin veya Veri Nasıl Çıkarılır? PlatoBlockchain Veri Zekası. Dikey Arama. Ai. — Liste veya JSON çıktısı olarak görüntülenen ayıklanan metin

Anında devam etmek için doğruladığınız her bir değerin veya alanın yanındaki onay kutusunu işaretleyebilir veya "Verileri Doğrula" yı tıklayabilirsiniz.

5. Adım: Dışa aktarın

Tüm dosyalar doğrulandıktan sonra. Düzgün bir şekilde düzenlenmiş verileri bir xml, xlsx veya csv dosyası olarak dışa aktarabilirsiniz.

Nanonetlerin ilginç kullanım durumları ve benzersiz müşteri başarı hikayeleri. Nanonet'lerin işletmenizi daha üretken hale getirmesi için nasıl güçlendirebileceğini öğrenin.

Nanonets ile özel bir OCR modeli oluşturmak kolaydır. Genellikle herhangi bir görüntü veya belge türü için herhangi bir dilde, tümü 25 dakikadan kısa bir sürede (modeli eğitmek için kullanılan dosya sayısına bağlı olarak) bir model oluşturabilir, eğitebilir ve dağıtabilirsiniz.

Bu yöntemdeki ilk 4 adımı takip etmek için aşağıdaki videoyu izleyin:

[Gömülü içerik]

Nanonetler ile kendi OCR Modelinizi Nasıl Eğitirsiniz?

1. Adım: Kendi OCR modelinizi oluşturun

Giriş Yap Nanonets'e gidin ve “Kendi OCR modelinizi oluşturun” u tıklayın.

2. Adım: Eğitim dosyalarını / resimlerini yükleyin

OCR modellerini eğitmek için kullanılacak örnek dosyaları yükleyin. Oluşturduğunuz OCR modelinin doğruluğu büyük ölçüde bu aşamada yüklenen dosyaların / görüntülerin kalitesine ve miktarına bağlı olacaktır.

3. Adım: Dosyalar / resimlerdeki metne açıklama ekleyin

Şimdi her bir metin parçasına veya veriye uygun bir alan veya etiket ekleyin. Bu önemli adım, OCR modelinize görüntülerden uygun metni çıkarmayı ve bunu ihtiyaçlarınızla ilgili özel alanlarla ilişkilendirmeyi öğretecektir.

Metne veya verilere açıklama eklemek için yeni bir etiket de ekleyebilirsiniz. Unutmayın, Nanonets görüntünün şablonuna bağlı değildir!

4. Adım: Özel OCR modelini eğitin

Tüm eğitim dosyaları / görüntüleri için açıklama tamamlandıktan sonra, "Modeli Eğit" seçeneğine tıklayın. Eğitim, dosya sayısına ve eğitim için sıraya alınmış modellere bağlı olarak genellikle 20 dakika-2 saat sürer. Yapabilirsin yükseltmek bu aşamada daha hızlı sonuçlar elde etmek için ücretli bir plana (genellikle 20 dakikanın altında).

Nanonets, çeşitli OCR modelleri oluşturmak için derin öğrenmeden yararlanır ve doğruluk açısından bunları birbirine karşı test eder. Nanonetler daha sonra en iyi OCR modelini seçer (girdilerinize ve doğruluk seviyelerinize göre).

"Model Metrikleri" sekmesi, Nanonet'lerin oluşturulmuş tüm modeller arasından en iyi OCR modelini seçmesine olanak tanıyan çeşitli ölçümleri ve karşılaştırmalı analizleri gösterir. Daha yüksek doğruluk seviyeleri elde etmek için modeli yeniden eğitebilirsiniz (daha geniş bir eğitim görüntüsü yelpazesi ve daha iyi açıklama sağlayarak).

Veya, doğruluktan memnunsanız, bu özel OCR modelinin, metin / verilerin çıkarılması gereken bir görüntü veya dosya örneğinde beklendiği gibi performans gösterip göstermediğini test etmek ve doğrulamak için "Test Et" seçeneğine tıklayın.

5. Adım: Verileri test edin ve doğrulayın

Özel OCR modelini test etmek ve doğrulamak için birkaç örnek resim ekleyin.

Çıkarılan metnin doğruluğunu doğrulayın — Çıkarılan metnin doğruluğunu test edin ve doğrulayın

Metin tanınır, ayıklanır ve uygun şekilde sunulursa, dosyayı dışa aktarın. Aşağıda görebileceğiniz gibi, çıkarılan veriler düzenli bir biçimde düzenlenmiş ve sunulmuştur.

Dışa aktarılan veriler düzgün bir şekilde listelenmiştir

Tebrikler, artık belirli görüntü türlerinden metin çıkarmak için özel bir OCR modeli oluşturdunuz ve eğittiniz!

İşletmeniz dijital belgelerde, resimlerde veya PDF'lerde metin tanıma ile ilgileniyor mu? Resimlerden nasıl doğru bir şekilde metin çıkarılacağını merak ettiniz mi?

NanoNets API ile kendi OCR modellerinizi eğitin

İşte bulunuyor detaylı eğitim rehberi kullanarak kendi OCR modellerinizi Nanonetler API'sı. In belgeleme, Python, Shell, Ruby, Golang, Java ve C# kod örneklerini ve farklı uç noktalar için ayrıntılı API özelliklerini çalıştırmaya hazır bulacaksınız.

Nanonets API'sini kullanarak kendi modelinizi eğitmek için adım adım bir kılavuz:

1. Adım: Repo'yu Kopyalayın

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

2. Adım: Ücretsiz API Anahtarınızı edinin

Ücretsiz API Anahtarınızı şuradan alın: https://app.nanonets.com/#/keys

3. Adım: API anahtarını Ortam Değişkeni olarak ayarlayın

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

4. Adım: Yeni Model Oluşturun

python ./code/create-model.py

Not: Bu, bir sonraki adım için ihtiyacınız olan bir MODEL_ID değeri oluşturur

5. Adım: Model Kimliğini Ortam Değişkeni olarak ekleyin

export NANONETS_MODEL_ID=YOUR_MODEL_ID

6. Adım: Egzersiz Verilerini Yükleme

Tespit etmek istediğiniz nesnenin görüntülerini toplayın. Veri kümesini klasörde hazır hale getirdikten sonra images (resim dosyaları), veri kümesini yüklemeye başlayın.

python ./code/upload-training.py

Adım 7: Tren Modeli

Görüntüler yüklendikten sonra Modeli eğitmeye başlayın

python ./code/train-model.py

8. Adım: Model Durumunu Alın

Modelin eğitilmesi ~ 30 dakika sürer. Model eğitildikten sonra bir e-posta alacaksınız. Bu arada modelin durumunu kontrol edersiniz

watch -n 100 python ./code/model-state.py

Adım 9: Tahmin Yap

Model eğitildikten sonra. Modeli kullanarak tahminler yapabilirsiniz

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Nanonet'leri diğer OCR API'lerine göre kullanmanın faydaları, görüntülerden metin çıkarmaya göre daha iyi doğruluğun ötesine geçer. Metin tanıma için Nanonets OCR'yi kullanmayı düşünmeniz için 7 neden:

1. Özel verilerle çalışma

Çoğu OCR yazılımı, çalışabilecekleri veri türü konusunda oldukça katıdır. Bir OCR modelinin bir kullanım senaryosu için eğitilmesi, gereksinimleri ve spesifikasyonları açısından büyük ölçüde esneklik gerektirir; fatura işleme için bir OCR, pasaportlar için bir OCR'den büyük ölçüde farklı olacaktır! Nanonetler bu tür katı sınırlamalara bağlı değildir. Nanonets, işletmenizin özel ihtiyaçlarını karşılamaya en uygun OCR modellerini eğitmek için kendi verilerinizi kullanır.

2. İngilizce olmayan veya birden çok dille çalışma

Nanonets özel verilerle eğitime odaklandığından, aynı anda herhangi bir dilde veya birden çok dilde görüntülerden metin çıkarabilen tek bir OCR modeli oluşturmak için benzersiz bir şekilde yerleştirilmiştir.

3. Son işlem gerektirmez

OCR modelleri kullanılarak çıkarılan metnin akıllıca yapılandırılması ve anlaşılır bir biçimde sunulması gerekir; aksi takdirde, verileri anlamlı bilgiler halinde yeniden düzenlemek için önemli miktarda zaman ve kaynak harcanır. Çoğu OCR aracı görüntülerden veri alıp atarken, Nanonets yalnızca ilgili verileri çıkarır ve bunları otomatik olarak akıllıca yapılandırılmış alanlara sıralayarak görüntülemeyi ve anlamayı kolaylaştırır.

4. Sürekli öğrenir

İşletmeler genellikle dinamik olarak değişen gereksinimler ve ihtiyaçlarla karşı karşıyadır. Potansiyel engelleri aşmak için Nanonets, modellerinizi yeni verilerle kolayca yeniden eğitmenize olanak tanır. Bu, OCR modelinizin öngörülemeyen değişikliklere uyum sağlamasına olanak tanır.

5. Yaygın veri kısıtlamalarını kolaylıkla halleder

Nanonets, metin tanıma ve çıkarmayı büyük ölçüde etkileyen yaygın veri kısıtlamalarının üstesinden gelmek için AI, ML ve Derin Öğrenme tekniklerinden yararlanır. Nanonets OCR, el yazısı metinleri, aynı anda birden fazla dildeki metin görüntülerini, düşük çözünürlüklü görüntüleri, yeni veya bitişik el yazısı yazı tiplerine sahip görüntüleri ve değişen boyutlarda görüntüleri, gölgeli metin içeren görüntüleri, eğik metinleri, rastgele yapılandırılmamış metinleri, görüntü gürültüsünü, bulanık görüntüleri tanıyabilir ve işleyebilir. ve dahası. Geleneksel OCR API'leri bu tür kısıtlamalar altında çalışacak şekilde donatılmamıştır; gerçek yaşam senaryolarında norm olmayan çok yüksek düzeyde bir aslına uygun verilere ihtiyaç duyarlar.

6. Kurum içi geliştirici ekibi gerektirmez

Nanonets API'yi iş gereksinimleriniz için kişiselleştirmek için geliştiricileri işe alma ve yetenek edinme konusunda endişelenmenize gerek yok. Nanonetler sorunsuz entegrasyon için tasarlandı. Ayrıca Nanonet'leri çoğu CRM, ERP veya RPA yazılımıyla kolayca entegre edebilirsiniz.

7. Özelleştirin, özelleştirin, özelleştirin

Nanonets OCR ile istediğiniz kadar metin/veri alanı yakalayabilirsiniz. Özel metin tanıma ve metin çıkarma gereksinimleriniz için çalışan özel doğrulama kuralları bile oluşturabilirsiniz. Nanonets, belgenizin şablonuna bağlı değildir. Verileri tablolarda, satır öğelerinde veya başka herhangi bir biçimde yakalayabilirsiniz!

Nanonets, iş performansınızı optimize edebilecek, maliyetlerden tasarruf edebilecek ve büyümeyi hızlandırabilecek birçok kullanım örneğine sahiptir. Bulmak Nanonetlerin kullanım durumlarının ürününüze nasıl uygulanabileceği.

Veya kontrol edin Nanonetler OCR API'si eylemde ve özel oluşturmaya başlayın OCR ücretsiz modeller!

Güncelleme Temmuz 2022: bu yazı ilk olarak şurada yayınlandı: Ekim 2020 ve o zamandan beri güncellendi düzenli.

İşte bir slayt bu makaledeki bulguları özetlemektedir. İşte bir alternatif versiyon Bu yazının.

Zaman Damgası: Temmuz 17, 2022Temmuz 18, 2022

Zaman Damgası: Nisan 10, 2023