Görüntülerden Veri Çıkarma

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Görüntülerden Veri Çıkarma

Resimleriniz faturalar, makbuzlar, pasaportlar veya ehliyetlerle ilgiliyse Nanonets'e göz atın metin çıkarıcılara önceden eğitilmiş görüntü bedava.

Sadece uygun çıkarıcıyı seçin, görüntüleri yükleyin, metni çıkarın ve dışa aktarın. Şimdi resimlerden metin çıkarın:

Bir görüntüden metin çıkarmak zahmetli bir süreç olabilir. Çoğu kişi görüntüdeki metni/verileri yeniden yazar; ancak uğraşmanız gereken çok sayıda görüntü olduğunda bu hem zaman alıcı hem de verimsizdir.

Genellikle görüntü/belge işleme programlarının bir alt özelliği olarak yerleşik olan görüntüden metne dönüştürücüler, görüntülerden metin çıkarmanın düzgün bir yolunu sunar.

Snagit ve OneNote gibi araçlar, görüntülerden metin çıkarmak için temel OCR özelliklerinden yararlanır. Workbench veya img2text gibi çevrimiçi dönüştürücüler de OCR ile görüntülerden metin çıkarır. (OCR nedir? - işte bir OCR hakkında ayrıntılı açıklayıcı)

Bu tür araçlar iyi bir iş çıkarsa da, çıkarılan metin/veriler genellikle yapılandırılmamış bir şekilde sunulur ve bu da birçok işlem sonrası işlemle sonuçlanır. Bir AI güdümlü OCR Nanonet'lerin görüntülerden metin çekebilmesi ve ayıklanan verileri düzgün, organize ve yapılandırılmış bir şekilde sunabilmesi gibi.

Nanonetler, görüntülerden verileri doğru, ölçekte ve birden çok dilde ayıklar. Nanonets, ayıklanmış metni tamamen özelleştirilebilir, düzgün yapılandırılmış biçimlerde sunan tek metin tanıma OCR'sidir. Yakalanan veriler tablolar, satır öğeleri veya başka herhangi bir biçimde sunulabilir.

Görüntülerden Veri Çıkarma — Nanonets kullanarak bir görüntüden metin çıkarma

Resimlerden metin tespit etmek ve çıkarmak için Nanonets OCR'yi kullanmanın üç yolu: PDF'den metin ayıklas, PDF'den veri als veya PDF'leri ayrıştır ve diğer belge türleri:

İçindekiler

Nanonets'in önceden eğitilmiş OCR modellerini kullanarak görüntüden metin çıkarın
Özel bir Nanonets OCR modeli oluşturarak görüntüden metin çıkarın
NanoNets API ile kendi OCR modellerinizi eğitin
Nanonets neden görüntülerden metin çıkarmak için en iyi OCR'dir?

Görüntüden metne dönüştürme için ücretsiz bir çevrimiçi OCR'ye ihtiyacınız var, PDF'den tabloya, PDF'den metneya da PDF veri çıkarma? Nanonets'e çevrimiçi göz atın OCR API'si harekete geçin ve ücretsiz olarak özel OCR modelleri oluşturmaya başlayın!

Nanonets'in önceden eğitilmiş OCR modellerini kullanarak görüntüden metin çıkarın

Nanonets, aşağıda listelenen belirli görüntü türleri için önceden eğitilmiş OCR modellerine sahiptir. Önceden eğitilmiş her bir OCR modeli, görüntü türündeki metni ad, adres, tarih, son kullanma tarihi vb. gibi uygun bir alanla doğru bir şekilde ilişkilendirmek ve çıkarılan metni düzgün ve düzenli bir şekilde sunmak için eğitilmiştir.

Faturalar
makbuzlar
Sürücü belgesi (ABD)
Pasaportlar

Nanonetler çevrimiçi OCR ve OCR API çok ilginç kullanım durumları.

Makbuz görüntülerinden metin çıkaran nanonetler

Adım 1: Uygun bir OCR modeli seçin

Giriş Yap Nanonets'e gidin ve metin ve veri çıkarmak istediğiniz görüntüye uygun bir OCR modeli seçin. Önceden eğitilmiş OCR modellerinden hiçbiri gereksinimlerinizi karşılamıyorsa, özel bir OCR modelinin nasıl oluşturulacağını öğrenmek için ilerleyebilirsiniz.

2. Adım: Dosyaları ekleyin

Metin çıkarmak istediğiniz dosyaları/görüntüleri ekleyin. İstediğiniz kadar resim ekleyebilirsiniz.

3 Adımı: Test

Modelin çalışması ve görüntüden metin çıkarması için birkaç saniye bekleyin.

4. Adım: Doğrulayın

Sağdaki tablo görünümünü kontrol ederek her dosyadan çıkarılan metni hızla doğrulayın. Metnin doğru bir şekilde tanınıp tanınmadığını ve uygun bir alan veya etiketle eşleştirilip eşleştirilmediğini kolayca iki kez kontrol edebilirsiniz.

Hatta bu aşamada alan değerlerini ve etiketleri düzenlemeyi/düzeltmeyi seçebilirsiniz. Nanonetler görüntünün şablonuna bağlı değildir.

Çıkarılan veriler "Liste Görünümü" veya "JSON" formatında görüntülenebilir.

Anında devam etmek için doğruladığınız her bir değerin veya alanın yanındaki onay kutusunu işaretleyebilir veya "Verileri Doğrula" yı tıklayabilirsiniz.

5. Adım: Dışa aktarın

Tüm dosyalar doğrulandıktan sonra. Düzgün bir şekilde düzenlenmiş verileri bir xml, xlsx veya csv dosyası olarak dışa aktarabilirsiniz.

Nanonetlerin ilginç kullanım durumları ve benzersiz müşteri başarı hikayeleri. Nanonet'lerin işletmenizi daha üretken hale getirmesi için nasıl güçlendirebileceğini öğrenin.

Özel bir Nanonets OCR modeli oluşturarak görüntüden metin çıkarın

Nanonets ile özel bir OCR modeli oluşturmak kolaydır. Genellikle herhangi bir görüntü veya belge türü için herhangi bir dilde, tümü 25 dakikadan kısa bir sürede (modeli eğitmek için kullanılan dosya sayısına bağlı olarak) bir model oluşturabilir, eğitebilir ve dağıtabilirsiniz.

Bu yöntemdeki ilk 4 adımı takip etmek için aşağıdaki videoyu izleyin:

Nanonetler ile kendi OCR Modelinizi Nasıl Eğitirsiniz?

1. Adım: Kendi OCR modelinizi oluşturun

Giriş Yap Nanonets'e gidin ve “Kendi OCR modelinizi oluşturun” u tıklayın.

2. Adım: Eğitim dosyalarını / resimlerini yükleyin

OCR modellerini eğitmek için kullanılacak örnek dosyaları yükleyin. Oluşturduğunuz OCR modelinin doğruluğu büyük ölçüde bu aşamada yüklenen dosyaların / görüntülerin kalitesine ve miktarına bağlı olacaktır.

3. Adım: Dosyalar / resimlerdeki metne açıklama ekleyin

Şimdi her bir metin parçasına veya veriye uygun bir alan veya etiket ekleyin. Bu önemli adım, OCR modelinize görüntülerden uygun metni çıkarmayı ve bunu ihtiyaçlarınızla ilgili özel alanlarla ilişkilendirmeyi öğretecektir.

Metne veya verilere açıklama eklemek için yeni bir etiket de ekleyebilirsiniz. Unutmayın, Nanonets görüntünün şablonuna bağlı değildir!

4. Adım: Özel OCR modelini eğitin

Tüm eğitim dosyaları / görüntüleri için açıklama tamamlandıktan sonra, "Modeli Eğit" seçeneğine tıklayın. Eğitim, dosya sayısına ve eğitim için sıraya alınmış modellere bağlı olarak genellikle 20 dakika-2 saat sürer. Yapabilirsin yükseltmek bu aşamada daha hızlı sonuçlar elde etmek için ücretli bir plana (genellikle 20 dakikanın altında).

Nanonets, çeşitli OCR modelleri oluşturmak için derin öğrenmeden yararlanır ve doğruluk açısından bunları birbirine karşı test eder. Nanonetler daha sonra en iyi OCR modelini seçer (girdilerinize ve doğruluk seviyelerinize göre).

"Model Metrikleri" sekmesi, Nanonet'lerin oluşturulmuş tüm modeller arasından en iyi OCR modelini seçmesine olanak tanıyan çeşitli ölçümleri ve karşılaştırmalı analizleri gösterir. Daha yüksek doğruluk seviyeleri elde etmek için modeli yeniden eğitebilirsiniz (daha geniş bir eğitim görüntüsü yelpazesi ve daha iyi açıklama sağlayarak).

Veya, doğruluktan memnunsanız, bu özel OCR modelinin, metin / verilerin çıkarılması gereken bir görüntü veya dosya örneğinde beklendiği gibi performans gösterip göstermediğini test etmek ve doğrulamak için "Test Et" seçeneğine tıklayın.

5. Adım: Verileri test edin ve doğrulayın

Özel OCR modelini test etmek ve doğrulamak için birkaç örnek resim ekleyin.

Metin tanınır, ayıklanır ve uygun şekilde sunulursa, dosyayı dışa aktarın. Aşağıda görebileceğiniz gibi, çıkarılan veriler düzenli bir biçimde düzenlenmiş ve sunulmuştur.

Tebrikler, artık belirli görüntü türlerinden metin çıkarmak için özel bir OCR modeli oluşturdunuz ve eğittiniz!

İşletmeniz dijital belgelerde, resimlerde veya PDF'lerde metin tanıma ile ilgileniyor mu? Resimlerden nasıl doğru bir şekilde metin çıkarılacağını merak ettiniz mi?

NanoNets API ile kendi OCR modellerinizi eğitin

İşte bulunuyor detaylı eğitim rehberi kullanarak kendi OCR modellerinizi Nanonetler API'sı. In belgeleme, Python, Shell, Ruby, Golang, Java ve C# kod örneklerini ve farklı uç noktalar için ayrıntılı API özelliklerini çalıştırmaya hazır bulacaksınız.

Nanonets API'yi kullanarak kendi modelinizi eğitmek için adım adım bir kılavuz:

1. Adım: Repo'yu Kopyalayın

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

2. Adım: Ücretsiz API Anahtarınızı edinin

Ücretsiz API Anahtarınızı şuradan alın: https://app.nanonets.com/#/keys

3. Adım: API anahtarını Ortam Değişkeni olarak ayarlayın

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

4. Adım: Yeni Model Oluşturun

python ./code/create-model.py

Not: Bu, bir sonraki adım için ihtiyacınız olan bir MODEL_ID değeri oluşturur

5. Adım: Model Kimliğini Ortam Değişkeni olarak ekleyin

export NANONETS_MODEL_ID=YOUR_MODEL_ID

6. Adım: Egzersiz Verilerini Yükleme

Tespit etmek istediğiniz nesnenin görüntülerini toplayın. Veri kümesini klasörde hazır hale getirdikten sonra images (resim dosyaları), veri kümesini yüklemeye başlayın.

python ./code/upload-training.py

Adım 7: Tren Modeli

Görüntüler yüklendikten sonra Modeli eğitmeye başlayın

python ./code/train-model.py

8. Adım: Model Durumunu Alın

Modelin eğitilmesi ~ 30 dakika sürer. Model eğitildikten sonra bir e-posta alacaksınız. Bu arada modelin durumunu kontrol edersiniz

watch -n 100 python ./code/model-state.py

Adım 9: Tahmin Yap

Model eğitildikten sonra. Modeli kullanarak tahminler yapabilirsiniz

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Nanonets neden görüntülerden metin çıkarmak için en iyi OCR'dir?

Nanonet'leri diğer OCR API'lerine göre kullanmanın faydaları, görüntülerden metin çıkarmaya göre daha iyi doğruluğun ötesine geçer. Metin tanıma için Nanonets OCR'yi kullanmayı düşünmeniz için 7 neden:

1. Özel verilerle çalışma

Çoğu OCR yazılımı, çalışabilecekleri veri türü konusunda oldukça katıdır. Bir OCR modelinin bir kullanım senaryosu için eğitilmesi, gereksinimleri ve spesifikasyonları açısından büyük ölçüde esneklik gerektirir; fatura işleme için bir OCR, pasaportlar için bir OCR'den büyük ölçüde farklı olacaktır! Nanonetler bu tür katı sınırlamalara bağlı değildir. Nanonets, işletmenizin özel ihtiyaçlarını karşılamaya en uygun OCR modellerini eğitmek için kendi verilerinizi kullanır.

2. İngilizce olmayan veya birden çok dille çalışma

Nanonets özel verilerle eğitime odaklandığından, aynı anda herhangi bir dilde veya birden çok dilde görüntülerden metin çıkarabilen tek bir OCR modeli oluşturmak için benzersiz bir şekilde yerleştirilmiştir.

3. Son işlem gerektirmez

OCR modelleri kullanılarak çıkarılan metnin akıllıca yapılandırılması ve anlaşılır bir biçimde sunulması gerekir; aksi takdirde, verileri anlamlı bilgiler halinde yeniden düzenlemek için önemli miktarda zaman ve kaynak harcanır. Çoğu OCR aracı görüntülerden veri alıp atarken, Nanonets yalnızca ilgili verileri çıkarır ve bunları otomatik olarak akıllıca yapılandırılmış alanlara sıralayarak görüntülemeyi ve anlamayı kolaylaştırır.

4. Sürekli öğrenir

İşletmeler genellikle dinamik olarak değişen gereksinimler ve ihtiyaçlarla karşı karşıyadır. Potansiyel engelleri aşmak için Nanonets, modellerinizi yeni verilerle kolayca yeniden eğitmenize olanak tanır. Bu, OCR modelinizin öngörülemeyen değişikliklere uyum sağlamasına olanak tanır.

5. Yaygın veri kısıtlamalarını kolaylıkla halleder

Nanonets, metin tanımayı ve çıkarmayı büyük ölçüde etkileyen yaygın veri kısıtlamalarının üstesinden gelmek için AI, ML ve Derin Öğrenme tekniklerinden yararlanır. Nanonets OCR, el yazısı metinleri, aynı anda birden fazla dildeki metin görüntülerini, düşük çözünürlüklü görüntüleri, yeni veya el yazısı yazı tiplerine sahip ve değişen boyutlardaki görüntüleri, gölgeli metin içeren görüntüleri, eğik metni, rastgele yapılandırılmamış metni, görüntü gürültüsünü, bulanık görüntüleri tanıyabilir ve işleyebilir ve dahası. Geleneksel OCR API'leri bu tür kısıtlamalar altında çalışacak donanıma sahip değildir; gerçek hayat senaryolarında norm olmayan, çok yüksek düzeyde aslına uygun verilere ihtiyaç duyarlar.

6. Kurum içi geliştirici ekibi gerektirmez

Nanonets API'yi iş gereksinimleriniz için kişiselleştirmek için geliştiricileri işe alma ve yetenek edinme konusunda endişelenmenize gerek yok. Nanonetler sorunsuz entegrasyon için tasarlandı. Ayrıca Nanonet'leri çoğu CRM, ERP veya RPA yazılımıyla kolayca entegre edebilirsiniz.

7. Özelleştirin, özelleştirin, özelleştirin

Nanonets OCR ile istediğiniz kadar metin/veri alanı yakalayabilirsiniz. Özel metin tanıma ve metin çıkarma gereksinimleriniz için çalışan özel doğrulama kuralları bile oluşturabilirsiniz. Nanonets, belgenizin şablonuna bağlı değildir. Verileri tablolarda, satır öğelerinde veya başka herhangi bir biçimde yakalayabilirsiniz!

Nanonets, iş performansınızı optimize edebilecek, maliyetlerden tasarruf edebilecek ve büyümeyi hızlandırabilecek birçok kullanım örneğine sahiptir. Bulmak Nanonets'in kullanım örnekleri ürününüz için nasıl geçerli olabilir.

Veya kontrol edin Nanonetler OCR API'si eylemde ve özel oluşturmaya başlayın OCR ücretsiz modeller!

Güncelleme Haziran 2022: bu yazı ilk olarak şurada yayınlandı: Ekim 2020 ve o zamandan beri güncellendi düzenli.

İşte bir slayt bu makaledeki bulguları özetlemektedir. İşte bir alternatif versiyon Bu yazının.

Zaman Damgası: Haziran 27, 2022

Zaman Damgası: Aralık 21, 2023