Bir görüntüden metin çıkarmak zahmetli bir süreç olabilir. Çoğu kişi görüntüdeki metni/verileri manuel olarak girer; ancak uğraşacak çok fazla görüntünüz olduğunda bu hem zaman alıcı hem de verimsizdir.
Görüntüden metne dönüştürücüler resimlerden metin çıkarmanın düzgün bir yolunu sunar.
Bu tür araçlar iyi bir iş çıkarsa da, çıkarılan metin/veriler genellikle yapılandırılmamış bir şekilde sunulur ve bu da birçok işlem sonrası ile sonuçlanır.
An AI güdümlü OCR Nanonet'lerin görüntülerden metin çekebilmesi ve ayıklanan verileri düzgün, organize ve yapılandırılmış bir şekilde sunabilmesi gibi.
Nanonetler, görüntülerden verileri doğru, ölçekte ve birden çok dilde ayıklar. Nanonets, ayıklanmış metni tamamen özelleştirilebilir, düzgün yapılandırılmış biçimlerde sunan tek metin tanıma OCR'sidir. Yakalanan veriler tablolar, satır öğeleri veya başka herhangi bir biçimde sunulabilir.
- Resminizi aşağıya yüklemek için tıklayın
- Nanonets'in OCR'si dosyanızdaki içeriği otomatik olarak tanır ve onu metne dönüştürür
- Ayıklanan metni ham metin dosyası olarak indirin veya API aracılığıyla entegre edin
İçindekiler
Görüntülerden metin algılamak ve çıkarmak için Nanonets OCR'yi kullanabileceğiniz üç gelişmiş yöntem, PDF'den metin ayıklas, PDF'den veri als veya PDF'leri ayrıştır ve diğer belge türleri:
için ücretsiz bir çevrimiçi OCR'ye ihtiyacınız var resimden metne, PDF'den tabloya, PDF'den metneya da PDF veri çıkarma? Nanonets'e çevrimiçi göz atın OCR API'si harekete geçin ve ücretsiz olarak özel OCR modelleri oluşturmaya başlayın!
Nanonets, aşağıda listelenen belirli görüntü türleri için önceden eğitilmiş OCR modellerine sahiptir. Önceden eğitilmiş her bir OCR modeli, görüntü türündeki metni ad, adres, tarih, son kullanma tarihi vb. gibi uygun bir alanla doğru bir şekilde ilişkilendirmek ve çıkarılan metni düzgün ve düzenli bir şekilde sunmak için eğitilmiştir.
- Faturalar
- makbuzlar
- Sürücü belgesi (ABD)
- Pasaportlar
Nanonetler çevrimiçi OCR ve OCR API çok ilginç kullanım durumları.
Adım 1: Uygun bir OCR modeli seçin
Giriş Yap Nanonets'e gidin ve metin ve veri çıkarmak istediğiniz görüntüye uygun bir OCR modeli seçin. Önceden eğitilmiş OCR modellerinden hiçbiri gereksinimlerinizi karşılamıyorsa, özel bir OCR modelinin nasıl oluşturulacağını öğrenmek için ilerleyebilirsiniz.
2. Adım: Dosyaları ekleyin
Metin çıkarmak istediğiniz dosyaları/görüntüleri ekleyin. İstediğiniz kadar resim ekleyebilirsiniz.
3 Adımı: Test
Modelin çalışması ve görüntüden metin çıkarması için birkaç saniye bekleyin.
4. Adım: Doğrulayın
Sağdaki tablo görünümünü kontrol ederek her dosyadan çıkarılan metni hızla doğrulayın. Metnin doğru bir şekilde tanınıp tanınmadığını ve uygun bir alan veya etiketle eşleştirilip eşleştirilmediğini kolayca iki kez kontrol edebilirsiniz.
Hatta bu aşamada alan değerlerini ve etiketleri düzenlemeyi/düzeltmeyi seçebilirsiniz. Nanonetler görüntünün şablonuna bağlı değildir.
Çıkarılan veriler "Liste Görünümü" veya "JSON" formatında görüntülenebilir.
Anında devam etmek için doğruladığınız her bir değerin veya alanın yanındaki onay kutusunu işaretleyebilir veya "Verileri Doğrula" yı tıklayabilirsiniz.
5. Adım: Dışa aktarın
Tüm dosyalar doğrulandıktan sonra. Düzgün bir şekilde düzenlenmiş verileri bir xml, xlsx veya csv dosyası olarak dışa aktarabilirsiniz.
Nanonetlerin ilginç kullanım durumları ve benzersiz müşteri başarı hikayeleri. Nanonet'lerin işletmenizi daha üretken hale getirmesi için nasıl güçlendirebileceğini öğrenin.
Nanonets ile özel bir OCR modeli oluşturmak kolaydır. Genellikle herhangi bir görüntü veya belge türü için herhangi bir dilde, tümü 25 dakikadan kısa bir sürede (modeli eğitmek için kullanılan dosya sayısına bağlı olarak) bir model oluşturabilir, eğitebilir ve dağıtabilirsiniz.
Bu yöntemdeki ilk 4 adımı takip etmek için aşağıdaki videoyu izleyin:
1. Adım: Kendi OCR modelinizi oluşturun
Giriş Yap Nanonets'e gidin ve “Kendi OCR modelinizi oluşturun” u tıklayın.
2. Adım: Eğitim dosyalarını / resimlerini yükleyin
OCR modellerini eğitmek için kullanılacak örnek dosyaları yükleyin. Oluşturduğunuz OCR modelinin doğruluğu büyük ölçüde bu aşamada yüklenen dosyaların / görüntülerin kalitesine ve miktarına bağlı olacaktır.
3. Adım: Dosyalar / resimlerdeki metne açıklama ekleyin
Şimdi her bir metin parçasına veya veriye uygun bir alan veya etiket ekleyin. Bu önemli adım, OCR modelinize görüntülerden uygun metni çıkarmayı ve bunu ihtiyaçlarınızla ilgili özel alanlarla ilişkilendirmeyi öğretecektir.
Metne veya verilere açıklama eklemek için yeni bir etiket de ekleyebilirsiniz. Unutmayın, Nanonets görüntünün şablonuna bağlı değildir!
4. Adım: Özel OCR modelini eğitin
Tüm eğitim dosyaları / görüntüleri için açıklama tamamlandıktan sonra, "Modeli Eğit" seçeneğine tıklayın. Eğitim, dosya sayısına ve eğitim için sıraya alınmış modellere bağlı olarak genellikle 20 dakika-2 saat sürer. Yapabilirsin yükseltmek bu aşamada daha hızlı sonuçlar elde etmek için ücretli bir plana (genellikle 20 dakikanın altında).
Nanonets, çeşitli OCR modelleri oluşturmak için derin öğrenmeden yararlanır ve doğruluk açısından bunları birbirine karşı test eder. Nanonetler daha sonra en iyi OCR modelini seçer (girdilerinize ve doğruluk seviyelerinize göre).
"Model Metrikleri" sekmesi, Nanonet'lerin oluşturulmuş tüm modeller arasından en iyi OCR modelini seçmesine olanak tanıyan çeşitli ölçümleri ve karşılaştırmalı analizleri gösterir. Daha yüksek doğruluk seviyeleri elde etmek için modeli yeniden eğitebilirsiniz (daha geniş bir eğitim görüntüsü yelpazesi ve daha iyi açıklama sağlayarak).
Veya, doğruluktan memnunsanız, bu özel OCR modelinin, metin / verilerin çıkarılması gereken bir görüntü veya dosya örneğinde beklendiği gibi performans gösterip göstermediğini test etmek ve doğrulamak için "Test Et" seçeneğine tıklayın.
5. Adım: Verileri test edin ve doğrulayın
Özel OCR modelini test etmek ve doğrulamak için birkaç örnek resim ekleyin.
Metin tanınır, ayıklanır ve uygun şekilde sunulursa, dosyayı dışa aktarın. Aşağıda görebileceğiniz gibi, çıkarılan veriler düzenli bir biçimde düzenlenmiş ve sunulmuştur.
Tebrikler, artık belirli görüntü türlerinden metin çıkarmak için özel bir OCR modeli oluşturdunuz ve eğittiniz!
İşletmeniz dijital belgelerde, resimlerde veya PDF'lerde metin tanıma ile ilgileniyor mu? Resimlerden nasıl doğru bir şekilde metin çıkarılacağını merak ettiniz mi?
NanoNets API ile kendi OCR modellerinizi eğitin
İşte bulunuyor detaylı eğitim rehberi kullanarak kendi OCR modellerinizi Nanonetler API'sı. In belgeleme, Python, Shell, Ruby, Golang, Java ve C# kod örneklerini ve farklı uç noktalar için ayrıntılı API özelliklerini çalıştırmaya hazır bulacaksınız.
Nanonets API'sini kullanarak kendi modelinizi eğitmek için adım adım bir kılavuz:
1. Adım: Repo'yu Kopyalayın
git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm
2. Adım: Ücretsiz API Anahtarınızı edinin
Ücretsiz API Anahtarınızı şuradan alın: https://app.nanonets.com/#/keys
3. Adım: API anahtarını Ortam Değişkeni olarak ayarlayın
export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
4. Adım: Yeni Model Oluşturun
python ./code/create-model.py
Not: Bu, bir sonraki adım için ihtiyacınız olan bir MODEL_ID değeri oluşturur
5. Adım: Model Kimliğini Ortam Değişkeni olarak ekleyin
export NANONETS_MODEL_ID=YOUR_MODEL_ID
6. Adım: Egzersiz Verilerini Yükleme
Tespit etmek istediğiniz nesnenin görüntülerini toplayın. Veri kümesini klasörde hazır hale getirdikten sonra images
(resim dosyaları), veri kümesini yüklemeye başlayın.
python ./code/upload-training.py
Adım 7: Tren Modeli
Görüntüler yüklendikten sonra Modeli eğitmeye başlayın
python ./code/train-model.py
8. Adım: Model Durumunu Alın
Modelin eğitilmesi ~ 30 dakika sürer. Model eğitildikten sonra bir e-posta alacaksınız. Bu arada modelin durumunu kontrol edersiniz
watch -n 100 python ./code/model-state.py
Adım 9: Tahmin Yap
Model eğitildikten sonra. Modeli kullanarak tahminler yapabilirsiniz
python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg
Nanonet'leri diğer OCR API'lerine göre kullanmanın faydaları, görüntülerden metin çıkarmaya göre daha iyi doğruluğun ötesine geçer. Metin tanıma için Nanonets OCR'yi kullanmayı düşünmeniz için 7 neden:
1. Özel verilerle çalışma
Çoğu OCR yazılımı, çalışabilecekleri veri türü konusunda oldukça katıdır. Bir OCR modelinin bir kullanım senaryosu için eğitilmesi, gereksinimleri ve spesifikasyonları açısından büyük ölçüde esneklik gerektirir; fatura işleme için bir OCR, pasaportlar için bir OCR'den büyük ölçüde farklı olacaktır! Nanonetler bu tür katı sınırlamalara bağlı değildir. Nanonets, işletmenizin özel ihtiyaçlarını karşılamaya en uygun OCR modellerini eğitmek için kendi verilerinizi kullanır.
2. İngilizce olmayan veya birden çok dille çalışma
Nanonets özel verilerle eğitime odaklandığından, aynı anda herhangi bir dilde veya birden çok dilde görüntülerden metin çıkarabilen tek bir OCR modeli oluşturmak için benzersiz bir şekilde yerleştirilmiştir.
3. Son işlem gerektirmez
OCR modelleri kullanılarak çıkarılan metnin akıllıca yapılandırılması ve anlaşılır bir biçimde sunulması gerekir; aksi takdirde, verileri anlamlı bilgiler halinde yeniden düzenlemek için önemli miktarda zaman ve kaynak harcanır. Çoğu OCR aracı görüntülerden veri alıp atarken, Nanonets yalnızca ilgili verileri çıkarır ve bunları otomatik olarak akıllıca yapılandırılmış alanlara sıralayarak görüntülemeyi ve anlamayı kolaylaştırır.
4. Sürekli öğrenir
İşletmeler genellikle dinamik olarak değişen gereksinimler ve ihtiyaçlarla karşı karşıyadır. Potansiyel engelleri aşmak için Nanonets, modellerinizi yeni verilerle kolayca yeniden eğitmenize olanak tanır. Bu, OCR modelinizin öngörülemeyen değişikliklere uyum sağlamasına olanak tanır.
5. Yaygın veri kısıtlamalarını kolaylıkla halleder
Nanonets, metin tanıma ve çıkarmayı büyük ölçüde etkileyen yaygın veri kısıtlamalarının üstesinden gelmek için AI, ML ve Derin Öğrenme tekniklerinden yararlanır. Nanonets OCR, el yazısı metinleri, aynı anda birden fazla dildeki metin görüntülerini, düşük çözünürlüklü görüntüleri, yeni veya bitişik el yazısı yazı tiplerine sahip görüntüleri ve değişen boyutlarda görüntüleri, gölgeli metin içeren görüntüleri, eğik metinleri, rastgele yapılandırılmamış metinleri, görüntü gürültüsünü, bulanık görüntüleri tanıyabilir ve işleyebilir. ve dahası. Geleneksel OCR API'leri bu tür kısıtlamalar altında çalışacak şekilde donatılmamıştır; gerçek yaşam senaryolarında norm olmayan çok yüksek düzeyde bir aslına uygun verilere ihtiyaç duyarlar.
6. Kurum içi geliştirici ekibi gerektirmez
Nanonets API'yi iş gereksinimleriniz için kişiselleştirmek için geliştiricileri işe alma ve yetenek edinme konusunda endişelenmenize gerek yok. Nanonetler sorunsuz entegrasyon için tasarlandı. Ayrıca Nanonet'leri çoğu CRM, ERP veya RPA yazılımıyla kolayca entegre edebilirsiniz.
7. Özelleştirin, özelleştirin, özelleştirin
Nanonets OCR ile istediğiniz kadar metin/veri alanı yakalayabilirsiniz. Özel metin tanıma ve metin çıkarma gereksinimleriniz için çalışan özel doğrulama kuralları bile oluşturabilirsiniz. Nanonets, belgenizin şablonuna bağlı değildir. Verileri tablolarda, satır öğelerinde veya başka herhangi bir biçimde yakalayabilirsiniz!
Nanonets, iş performansınızı optimize edebilecek, maliyetlerden tasarruf edebilecek ve büyümeyi hızlandırabilecek birçok kullanım örneğine sahiptir. Bulmak Nanonetlerin kullanım durumlarının ürününüze nasıl uygulanabileceği.
Veya kontrol edin Nanonetler OCR API'si eylemde ve özel oluşturmaya başlayın OCR ücretsiz modeller!
Güncelleme Temmuz 2022: bu yazı ilk olarak şurada yayınlandı: Ekim 2020 ve o zamandan beri güncellendi düzenli.
İşte bir slayt bu makaledeki bulguları özetlemektedir. İşte bir alternatif versiyon Bu yazının.
- AI
- AI ve Makine Öğrenimi
- yapay zeka
- AI sanat üreteci
- yapay zeka robotu
- yapay zeka
- yapay zeka sertifikası
- bankacılıkta yapay zeka
- yapay zeka robotu
- yapay zeka robotları
- yapay zeka yazılımı
- blockchain
- blockchain konferans ai
- zeka
- konuşma yapay zekası
- kripto konferans ai
- dal-e
- derin öğrenme
- google ai
- makine öğrenme
- OCR
- Platon
- plato yapay zekası
- Plato Veri Zekası
- Plato Oyunu
- PlatoVeri
- plato oyunu
- ölçek ai
- sözdizimi
- Metin tanıma
- zefirnet