Cara Mengekstrak Teks atau Data dari Gambar PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Cara Mengekstrak Teks atau Data dari Gambar

Mengekstrak teks dari gambar bisa menjadi proses yang rumit. Kebanyakan orang secara manual memasukkan teks/data dari gambar; tetapi ini memakan waktu dan tidak efisien bila Anda memiliki banyak gambar untuk ditangani.

Konverter gambar ke teks menawarkan cara yang rapi untuk mengekstrak teks dari gambar.

Sementara alat tersebut melakukan pekerjaan dengan baik, teks/data yang diekstraksi sering disajikan secara tidak terstruktur yang menghasilkan banyak pemrosesan pasca.

An OCR yang digerakkan oleh AI seperti Nanonets dapat menarik teks dari gambar dan menyajikan data yang diekstraksi dengan cara yang rapi, terorganisir & terstruktur.

Nanonet mengekstrak data dari gambar secara akurat, dalam skala besar, dan dalam berbagai bahasa. Nanonets adalah satu-satunya OCR pengenalan teks yang menyajikan teks yang diekstraksi dalam format terstruktur rapi yang sepenuhnya dapat disesuaikan. Data yang diambil dapat disajikan sebagai tabel, item baris, atau format lainnya.

  1. Klik untuk mengunggah gambar Anda di bawah ini
  2. OCR Nanonets secara otomatis mengenali konten dalam file Anda dan mengubahnya menjadi teks
  3. Unduh teks yang diekstraksi sebagai file teks mentah atau integrasikan melalui API


Daftar Isi

Berikut adalah tiga metode lanjutan di mana Anda dapat menggunakan Nanonets OCR untuk mendeteksi dan mengekstrak teks dari gambar, ekstrak teks dari PDFs, ekstrak data dari PDFs atau parsing PDF dan jenis dokumen lainnya:

Mengekstrak teks dari gambar menggunakan Nanonets

Butuh OCR online gratis untuk gambar ke teks, PDF ke tabel, PDF ke teks, atau Ekstraksi data PDF? Lihat Nanonets online API OCR beraksi dan mulailah membuat model OCR khusus secara gratis!


Nanonets memiliki model OCR yang telah dilatih sebelumnya untuk jenis gambar tertentu yang tercantum di bawah ini. Setiap model OCR terlatih dilatih untuk secara akurat menghubungkan teks dalam jenis gambar ke bidang yang sesuai seperti nama, alamat, tanggal, kedaluwarsa, dll. Dan menyajikan teks yang diekstraksi dengan cara yang rapi dan terorganisir.

  • Faktur
  • penerimaan
  • Surat Izin Mengemudi (AS)
  • Paspor

Nanonet OCR & OCR API online punya banyak yang menarik gunakan kasing.


[Embedded content]
Nanonet mengekstraksi teks dari gambar tanda terima

Langkah 1: Pilih model OCR yang sesuai

Login ke Nanonets dan pilih model OCR yang sesuai dengan gambar yang ingin Anda ekstrak teks dan datanya. Jika tidak ada model OCR terlatih yang sesuai dengan kebutuhan Anda, Anda dapat melompat ke depan untuk mengetahui cara membuat model OCR khusus.

Langkah 2: Tambahkan file

Tambahkan file/gambar dari mana Anda ingin mengekstrak teks. Anda dapat menambahkan gambar sebanyak yang Anda suka.

Langkah 3: Uji

Biarkan beberapa detik agar model berjalan dan mengekstrak teks dari gambar.

Langkah 4: Verifikasi

Verifikasi teks yang diekstrak dari setiap file dengan cepat, dengan memeriksa tampilan tabel di sebelah kanan. Anda dapat dengan mudah memeriksa ulang apakah teks telah dikenali dengan benar dan dicocokkan dengan bidang atau tag yang sesuai.

Anda bahkan dapat memilih untuk mengedit/memperbaiki nilai dan label bidang pada tahap ini. Nanonet tidak terikat oleh template gambar.

Edit teks atau data yang diekstrak
Edit teks atau data yang diekstrak

Data yang diekstrak dapat ditampilkan dalam format "Tampilan Daftar" atau "JSON".

Anda dapat mencentang kotak di samping setiap nilai atau bidang yang Anda verifikasi atau klik "Verifikasi Data" untuk melanjutkan secara instan.

Memverifikasi data
Memverifikasi data

Langkah 5: Ekspor

Setelah semua file diverifikasi. Anda dapat mengekspor data yang tertata rapi sebagai file xml, xlsx, atau csv.

Ekspor data yang diekstrak
Ekspor data yang diekstrak

Nanonets menarik gunakan kasing dan unik kisah sukses pelanggan. Cari tahu bagaimana Nanonets dapat memberdayakan bisnis Anda menjadi lebih produktif.


Membangun model OCR kustom dengan Nanonets sangatlah mudah. Anda biasanya dapat membuat, melatih, dan menerapkan model untuk gambar atau jenis dokumen apa pun, dalam bahasa apa pun, semuanya dalam waktu kurang dari 25 menit (bergantung pada jumlah file yang digunakan untuk melatih model).

Tonton video di bawah ini untuk mengikuti 4 langkah pertama dalam metode ini:

[Embedded content]
Cara Melatih Model OCR Anda sendiri dengan Nanonet

Langkah 1: Buat model OCR Anda sendiri

Login ke Nanonets dan klik "Buat model OCR Anda sendiri".

Langkah 2: Unggah file / gambar pelatihan

Unggah file contoh yang akan digunakan untuk melatih model OCR. Akurasi model OCR yang Anda buat akan sangat bergantung pada kualitas dan kuantitas file / gambar yang diunggah pada tahap ini

Langkah 3: Beri anotasi teks pada file / gambar

Sekarang beri anotasi pada setiap bagian teks atau data dengan bidang atau label yang sesuai. Langkah penting ini akan mengajarkan model OCR Anda untuk mengekstrak teks yang sesuai dari gambar dan mengaitkannya dengan bidang khusus yang relevan dengan kebutuhan Anda.

Anda juga dapat menambahkan label baru untuk membubuhi keterangan pada teks atau data. Ingat, Nanonets tidak terikat oleh template gambar!

Langkah 4: Latih model OCR kustom

Setelah penjelasan selesai untuk semua file / gambar pelatihan, klik "Train Model". Pelatihan biasanya membutuhkan waktu antara 20 menit-2 jam tergantung pada jumlah file dan model antrian untuk pelatihan. Kamu bisa meningkatkan ke paket berbayar untuk mendapatkan hasil yang lebih cepat pada tahap ini (biasanya di bawah 20 menit).

Nanonets memanfaatkan pembelajaran mendalam untuk membangun berbagai model OCR dan mengujinya satu sama lain untuk akurasi. Nanonet kemudian memilih model OCR terbaik (berdasarkan input dan tingkat akurasi Anda).

Tab "Model Metrics" menunjukkan berbagai pengukuran dan analisis komparatif yang memungkinkan Nanonet memilih model OCR terbaik di antara semua yang dibuat. Anda dapat melatih ulang model (dengan menyediakan gambar pelatihan yang lebih luas dan anotasi yang lebih baik) untuk mencapai tingkat akurasi yang lebih tinggi.

Atau, jika Anda puas dengan akurasinya, klik "Test" untuk menguji & memverifikasi apakah model OCR kustom ini bekerja seperti yang diharapkan pada sampel gambar atau file yang teks / datanya perlu diekstrak.

Langkah 5: Uji & verifikasi data

Tambahkan beberapa gambar contoh untuk menguji & memverifikasi model OCR kustom.

Verifikasi keakuratan teks yang diekstrak
Uji & verifikasi keakuratan teks yang diekstraksi

Jika teks telah dikenali, diekstraksi, dan disajikan dengan tepat, maka ekspor file. Seperti yang Anda lihat di bawah, data yang diekstraksi telah diatur dan disajikan dalam format yang rapi.

Data yang diekspor terdaftar dengan rapi
Data yang diekspor terdaftar dengan rapi

Selamat, Anda sekarang telah membuat dan melatih model OCR khusus untuk mengekstrak teks dari jenis gambar tertentu!


Apakah bisnis Anda berurusan dengan pengenalan teks dalam dokumen digital, gambar, atau PDF? Pernahkah Anda bertanya-tanya bagaimana cara mengekstrak teks dari gambar secara akurat?


Latih model OCR Anda sendiri dengan NanoNets API

Berikut adalah panduan rinci untuk melatih model OCR Anda sendiri menggunakan API Nanonets. di dokumentasi, Anda akan menemukan contoh kode siap untuk dijalankan dalam Python, Shell, Ruby, Golang, Java, dan C#, serta spesifikasi API terperinci untuk titik akhir yang berbeda.

Berikut adalah panduan langkah demi langkah untuk melatih model Anda sendiri menggunakan Nanonets API:

Langkah 1: Mengkloning Repo

git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm

Langkah 2: Dapatkan Kunci API gratis Anda

Dapatkan Kunci API gratis Anda dari https://app.nanonets.com/#/keys

Langkah 3: Tetapkan kunci API sebagai Variabel Lingkungan

export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE

Langkah 4: Buat Model Baru

python ./code/create-model.py

Catatan: Ini menghasilkan MODEL_ID yang Anda butuhkan untuk langkah selanjutnya

Langkah 5: Tambahkan Id Model sebagai Variabel Lingkungan

export NANONETS_MODEL_ID=YOUR_MODEL_ID

Langkah 6: Unggah Data Pelatihan

Kumpulkan gambar objek yang ingin Anda deteksi. Setelah Anda memiliki dataset siap di folder images (file gambar), mulai mengunggah dataset.

python ./code/upload-training.py

Langkah 7: Model Kereta

Setelah Gambar diunggah, mulailah melatih Model

python ./code/train-model.py

Langkah 8: Dapatkan Status Model

Model membutuhkan ~ 30 menit untuk berlatih. Anda akan mendapatkan email setelah model dilatih. Sementara itu Anda memeriksa keadaan model

watch -n 100 python ./code/model-state.py

Langkah 9: Buat Prediksi

Setelah model dilatih. Anda dapat membuat prediksi menggunakan model

python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg

Manfaat menggunakan Nanonets dibandingkan API OCR lainnya melampaui akurasi yang lebih baik sehubungan dengan mengekstraksi teks dari gambar. Berikut adalah 7 alasan mengapa Anda harus mempertimbangkan untuk menggunakan Nanonets OCR untuk pengenalan teks:

1. Bekerja dengan data khusus

Sebagian besar perangkat lunak OCR cukup kaku pada jenis data yang dapat mereka gunakan. Pelatihan model OCR untuk kasus penggunaan membutuhkan tingkat fleksibilitas yang besar sehubungan dengan persyaratan dan spesifikasinya; OCR untuk pemrosesan faktur akan sangat berbeda dari OCR untuk paspor! Nanonet tidak terikat oleh batasan kaku seperti itu. Nanonets menggunakan data Anda sendiri untuk melatih model OCR yang paling sesuai untuk memenuhi kebutuhan khusus bisnis Anda.

2. Bekerja dengan non-Inggris atau beberapa bahasa

Karena Nanonets berfokus pada pelatihan dengan data khusus, Nanonets ditempatkan secara unik untuk membangun model OCR tunggal yang dapat mengekstrak teks dari gambar dalam bahasa apa pun atau beberapa bahasa secara bersamaan.

3. Tidak memerlukan pasca-pemrosesan

Teks yang diekstraksi menggunakan model OCR perlu disusun secara cerdas dan disajikan dalam format yang dapat dipahami; jika tidak, banyak waktu dan sumber daya digunakan untuk mengatur ulang data menjadi informasi yang berarti. Sementara sebagian besar alat OCR hanya mengambil dan membuang data dari gambar, Nanonets hanya mengekstrak data yang relevan dan secara otomatis menyortirnya ke dalam bidang yang terstruktur secara cerdas sehingga lebih mudah dilihat dan dipahami.

4. Belajar terus menerus

Bisnis sering menghadapi persyaratan dan kebutuhan yang berubah secara dinamis. Untuk mengatasi potensi hambatan, Nanonets memungkinkan Anda melatih ulang model dengan data baru dengan mudah. Ini memungkinkan model OCR Anda untuk beradaptasi dengan perubahan yang tidak terduga.

5. Menangani kendala data umum dengan mudah

Nanonets memanfaatkan teknik AI, ML & Deep Learning untuk mengatasi kendala data umum yang sangat memengaruhi pengenalan & ekstraksi teks. Nanonets OCR dapat mengenali dan menangani teks tulisan tangan, gambar teks dalam berbagai bahasa sekaligus, gambar dengan resolusi rendah, gambar dengan font baru atau kursif dan berbagai ukuran, gambar dengan teks bayangan, teks miring, teks acak tidak terstruktur, noise gambar, gambar buram dan banyak lagi. API OCR tradisional tidak dilengkapi untuk bekerja di bawah batasan seperti itu; mereka membutuhkan data pada tingkat kesetiaan yang sangat tinggi yang bukan merupakan norma dalam skenario kehidupan nyata.

6. Tidak memerlukan tim pengembang internal

Tidak perlu khawatir tentang mempekerjakan pengembang dan memperoleh bakat untuk mempersonalisasi Nanonets API untuk kebutuhan bisnis Anda. Nanonets dibuat untuk integrasi tanpa kerumitan. Anda juga dapat dengan mudah mengintegrasikan Nanonets dengan sebagian besar perangkat lunak CRM, ERP, atau RPA.

7. Sesuaikan, sesuaikan, sesuaikan

Anda dapat menangkap sebanyak mungkin bidang teks/data yang Anda suka dengan Nanonets OCR. Anda bahkan dapat membuat aturan validasi khusus yang berfungsi untuk pengenalan teks khusus dan persyaratan ekstraksi teks. Nanonets tidak terikat oleh template dokumen Anda sama sekali. Anda dapat mengambil data dalam tabel atau item baris atau format lainnya!


Nanonets memiliki banyak kasus penggunaan yang dapat mengoptimalkan kinerja bisnis Anda, menghemat biaya, dan meningkatkan pertumbuhan. Temukan bagaimana kasus penggunaan Nanonet dapat diterapkan pada produk Anda.

Atau lihat Nanonet API OCR beraksi dan mulai membangun kebiasaan OCR model gratis!


Memperbarui Juli 2022: posting ini awalnya diterbitkan di Oktober 2020 dan sejak itu telah diperbarui secara teratur.

Berikut slidenya merangkum temuan dalam artikel ini. Berikut adalah versi alternatif dari posting ini.

Stempel Waktu:

Lebih dari AI & Pembelajaran Mesin