Mengekstrak teks dari gambar bisa menjadi proses yang rumit. Kebanyakan orang secara manual memasukkan teks/data dari gambar; tetapi ini memakan waktu dan tidak efisien bila Anda memiliki banyak gambar untuk ditangani.
Konverter gambar ke teks menawarkan cara yang rapi untuk mengekstrak teks dari gambar.
Sementara alat tersebut melakukan pekerjaan dengan baik, teks/data yang diekstraksi sering disajikan secara tidak terstruktur yang menghasilkan banyak pemrosesan pasca.
An OCR yang digerakkan oleh AI seperti Nanonets dapat menarik teks dari gambar dan menyajikan data yang diekstraksi dengan cara yang rapi, terorganisir & terstruktur.
Nanonet mengekstrak data dari gambar secara akurat, dalam skala besar, dan dalam berbagai bahasa. Nanonets adalah satu-satunya OCR pengenalan teks yang menyajikan teks yang diekstraksi dalam format terstruktur rapi yang sepenuhnya dapat disesuaikan. Data yang diambil dapat disajikan sebagai tabel, item baris, atau format lainnya.
- Klik untuk mengunggah gambar Anda di bawah ini
- OCR Nanonets secara otomatis mengenali konten dalam file Anda dan mengubahnya menjadi teks
- Unduh teks yang diekstraksi sebagai file teks mentah atau integrasikan melalui API
Daftar Isi
Berikut adalah tiga metode lanjutan di mana Anda dapat menggunakan Nanonets OCR untuk mendeteksi dan mengekstrak teks dari gambar, ekstrak teks dari PDFs, ekstrak data dari PDFs atau parsing PDF dan jenis dokumen lainnya:
Butuh OCR online gratis untuk gambar ke teks, PDF ke tabel, PDF ke teks, atau Ekstraksi data PDF? Lihat Nanonets online API OCR beraksi dan mulailah membuat model OCR khusus secara gratis!
Nanonets memiliki model OCR yang telah dilatih sebelumnya untuk jenis gambar tertentu yang tercantum di bawah ini. Setiap model OCR terlatih dilatih untuk secara akurat menghubungkan teks dalam jenis gambar ke bidang yang sesuai seperti nama, alamat, tanggal, kedaluwarsa, dll. Dan menyajikan teks yang diekstraksi dengan cara yang rapi dan terorganisir.
- Faktur
- penerimaan
- Surat Izin Mengemudi (AS)
- Paspor
Nanonet OCR & OCR API online punya banyak yang menarik gunakan kasing.
Langkah 1: Pilih model OCR yang sesuai
Login ke Nanonets dan pilih model OCR yang sesuai dengan gambar yang ingin Anda ekstrak teks dan datanya. Jika tidak ada model OCR terlatih yang sesuai dengan kebutuhan Anda, Anda dapat melompat ke depan untuk mengetahui cara membuat model OCR khusus.
Langkah 2: Tambahkan file
Tambahkan file/gambar dari mana Anda ingin mengekstrak teks. Anda dapat menambahkan gambar sebanyak yang Anda suka.
Langkah 3: Uji
Biarkan beberapa detik agar model berjalan dan mengekstrak teks dari gambar.
Langkah 4: Verifikasi
Verifikasi teks yang diekstrak dari setiap file dengan cepat, dengan memeriksa tampilan tabel di sebelah kanan. Anda dapat dengan mudah memeriksa ulang apakah teks telah dikenali dengan benar dan dicocokkan dengan bidang atau tag yang sesuai.
Anda bahkan dapat memilih untuk mengedit/memperbaiki nilai dan label bidang pada tahap ini. Nanonet tidak terikat oleh template gambar.
Data yang diekstrak dapat ditampilkan dalam format "Tampilan Daftar" atau "JSON".
Anda dapat mencentang kotak di samping setiap nilai atau bidang yang Anda verifikasi atau klik "Verifikasi Data" untuk melanjutkan secara instan.
Langkah 5: Ekspor
Setelah semua file diverifikasi. Anda dapat mengekspor data yang tertata rapi sebagai file xml, xlsx, atau csv.
Nanonets menarik gunakan kasing dan unik kisah sukses pelanggan. Cari tahu bagaimana Nanonets dapat memberdayakan bisnis Anda menjadi lebih produktif.
Membangun model OCR kustom dengan Nanonets sangatlah mudah. Anda biasanya dapat membuat, melatih, dan menerapkan model untuk gambar atau jenis dokumen apa pun, dalam bahasa apa pun, semuanya dalam waktu kurang dari 25 menit (bergantung pada jumlah file yang digunakan untuk melatih model).
Tonton video di bawah ini untuk mengikuti 4 langkah pertama dalam metode ini:
Langkah 1: Buat model OCR Anda sendiri
Login ke Nanonets dan klik "Buat model OCR Anda sendiri".
Langkah 2: Unggah file / gambar pelatihan
Unggah file contoh yang akan digunakan untuk melatih model OCR. Akurasi model OCR yang Anda buat akan sangat bergantung pada kualitas dan kuantitas file / gambar yang diunggah pada tahap ini
Langkah 3: Beri anotasi teks pada file / gambar
Sekarang beri anotasi pada setiap bagian teks atau data dengan bidang atau label yang sesuai. Langkah penting ini akan mengajarkan model OCR Anda untuk mengekstrak teks yang sesuai dari gambar dan mengaitkannya dengan bidang khusus yang relevan dengan kebutuhan Anda.
Anda juga dapat menambahkan label baru untuk membubuhi keterangan pada teks atau data. Ingat, Nanonets tidak terikat oleh template gambar!
Langkah 4: Latih model OCR kustom
Setelah penjelasan selesai untuk semua file / gambar pelatihan, klik "Train Model". Pelatihan biasanya membutuhkan waktu antara 20 menit-2 jam tergantung pada jumlah file dan model antrian untuk pelatihan. Kamu bisa meningkatkan ke paket berbayar untuk mendapatkan hasil yang lebih cepat pada tahap ini (biasanya di bawah 20 menit).
Nanonets memanfaatkan pembelajaran mendalam untuk membangun berbagai model OCR dan mengujinya satu sama lain untuk akurasi. Nanonet kemudian memilih model OCR terbaik (berdasarkan input dan tingkat akurasi Anda).
Tab "Model Metrics" menunjukkan berbagai pengukuran dan analisis komparatif yang memungkinkan Nanonet memilih model OCR terbaik di antara semua yang dibuat. Anda dapat melatih ulang model (dengan menyediakan gambar pelatihan yang lebih luas dan anotasi yang lebih baik) untuk mencapai tingkat akurasi yang lebih tinggi.
Atau, jika Anda puas dengan akurasinya, klik "Test" untuk menguji & memverifikasi apakah model OCR kustom ini bekerja seperti yang diharapkan pada sampel gambar atau file yang teks / datanya perlu diekstrak.
Langkah 5: Uji & verifikasi data
Tambahkan beberapa gambar contoh untuk menguji & memverifikasi model OCR kustom.
Jika teks telah dikenali, diekstraksi, dan disajikan dengan tepat, maka ekspor file. Seperti yang Anda lihat di bawah, data yang diekstraksi telah diatur dan disajikan dalam format yang rapi.
Selamat, Anda sekarang telah membuat dan melatih model OCR khusus untuk mengekstrak teks dari jenis gambar tertentu!
Apakah bisnis Anda berurusan dengan pengenalan teks dalam dokumen digital, gambar, atau PDF? Pernahkah Anda bertanya-tanya bagaimana cara mengekstrak teks dari gambar secara akurat?
Latih model OCR Anda sendiri dengan NanoNets API
Berikut adalah panduan rinci untuk melatih model OCR Anda sendiri menggunakan API Nanonets. di dokumentasi, Anda akan menemukan contoh kode siap untuk dijalankan dalam Python, Shell, Ruby, Golang, Java, dan C#, serta spesifikasi API terperinci untuk titik akhir yang berbeda.
Berikut adalah panduan langkah demi langkah untuk melatih model Anda sendiri menggunakan Nanonets API:
Langkah 1: Mengkloning Repo
git clone https://github.com/NanoNets/nanonets-ocr-sample-python
cd nanonets-ocr-sample-python
sudo pip install requests
sudo pip install tqdm
Langkah 2: Dapatkan Kunci API gratis Anda
Dapatkan Kunci API gratis Anda dari https://app.nanonets.com/#/keys
Langkah 3: Tetapkan kunci API sebagai Variabel Lingkungan
export NANONETS_API_KEY=YOUR_API_KEY_GOES_HERE
Langkah 4: Buat Model Baru
python ./code/create-model.py
Catatan: Ini menghasilkan MODEL_ID yang Anda butuhkan untuk langkah selanjutnya
Langkah 5: Tambahkan Id Model sebagai Variabel Lingkungan
export NANONETS_MODEL_ID=YOUR_MODEL_ID
Langkah 6: Unggah Data Pelatihan
Kumpulkan gambar objek yang ingin Anda deteksi. Setelah Anda memiliki dataset siap di folder images
(file gambar), mulai mengunggah dataset.
python ./code/upload-training.py
Langkah 7: Model Kereta
Setelah Gambar diunggah, mulailah melatih Model
python ./code/train-model.py
Langkah 8: Dapatkan Status Model
Model membutuhkan ~ 30 menit untuk berlatih. Anda akan mendapatkan email setelah model dilatih. Sementara itu Anda memeriksa keadaan model
watch -n 100 python ./code/model-state.py
Langkah 9: Buat Prediksi
Setelah model dilatih. Anda dapat membuat prediksi menggunakan model
python ./code/prediction.py PATH_TO_YOUR_IMAGE.jpg
Manfaat menggunakan Nanonets dibandingkan API OCR lainnya melampaui akurasi yang lebih baik sehubungan dengan mengekstraksi teks dari gambar. Berikut adalah 7 alasan mengapa Anda harus mempertimbangkan untuk menggunakan Nanonets OCR untuk pengenalan teks:
1. Bekerja dengan data khusus
Sebagian besar perangkat lunak OCR cukup kaku pada jenis data yang dapat mereka gunakan. Pelatihan model OCR untuk kasus penggunaan membutuhkan tingkat fleksibilitas yang besar sehubungan dengan persyaratan dan spesifikasinya; OCR untuk pemrosesan faktur akan sangat berbeda dari OCR untuk paspor! Nanonet tidak terikat oleh batasan kaku seperti itu. Nanonets menggunakan data Anda sendiri untuk melatih model OCR yang paling sesuai untuk memenuhi kebutuhan khusus bisnis Anda.
2. Bekerja dengan non-Inggris atau beberapa bahasa
Karena Nanonets berfokus pada pelatihan dengan data khusus, Nanonets ditempatkan secara unik untuk membangun model OCR tunggal yang dapat mengekstrak teks dari gambar dalam bahasa apa pun atau beberapa bahasa secara bersamaan.
3. Tidak memerlukan pasca-pemrosesan
Teks yang diekstraksi menggunakan model OCR perlu disusun secara cerdas dan disajikan dalam format yang dapat dipahami; jika tidak, banyak waktu dan sumber daya digunakan untuk mengatur ulang data menjadi informasi yang berarti. Sementara sebagian besar alat OCR hanya mengambil dan membuang data dari gambar, Nanonets hanya mengekstrak data yang relevan dan secara otomatis menyortirnya ke dalam bidang yang terstruktur secara cerdas sehingga lebih mudah dilihat dan dipahami.
4. Belajar terus menerus
Bisnis sering menghadapi persyaratan dan kebutuhan yang berubah secara dinamis. Untuk mengatasi potensi hambatan, Nanonets memungkinkan Anda melatih ulang model dengan data baru dengan mudah. Ini memungkinkan model OCR Anda untuk beradaptasi dengan perubahan yang tidak terduga.
5. Menangani kendala data umum dengan mudah
Nanonets memanfaatkan teknik AI, ML & Deep Learning untuk mengatasi kendala data umum yang sangat memengaruhi pengenalan & ekstraksi teks. Nanonets OCR dapat mengenali dan menangani teks tulisan tangan, gambar teks dalam berbagai bahasa sekaligus, gambar dengan resolusi rendah, gambar dengan font baru atau kursif dan berbagai ukuran, gambar dengan teks bayangan, teks miring, teks acak tidak terstruktur, noise gambar, gambar buram dan banyak lagi. API OCR tradisional tidak dilengkapi untuk bekerja di bawah batasan seperti itu; mereka membutuhkan data pada tingkat kesetiaan yang sangat tinggi yang bukan merupakan norma dalam skenario kehidupan nyata.
6. Tidak memerlukan tim pengembang internal
Tidak perlu khawatir tentang mempekerjakan pengembang dan memperoleh bakat untuk mempersonalisasi Nanonets API untuk kebutuhan bisnis Anda. Nanonets dibuat untuk integrasi tanpa kerumitan. Anda juga dapat dengan mudah mengintegrasikan Nanonets dengan sebagian besar perangkat lunak CRM, ERP, atau RPA.
7. Sesuaikan, sesuaikan, sesuaikan
Anda dapat menangkap sebanyak mungkin bidang teks/data yang Anda suka dengan Nanonets OCR. Anda bahkan dapat membuat aturan validasi khusus yang berfungsi untuk pengenalan teks khusus dan persyaratan ekstraksi teks. Nanonets tidak terikat oleh template dokumen Anda sama sekali. Anda dapat mengambil data dalam tabel atau item baris atau format lainnya!
Nanonets memiliki banyak kasus penggunaan yang dapat mengoptimalkan kinerja bisnis Anda, menghemat biaya, dan meningkatkan pertumbuhan. Temukan bagaimana kasus penggunaan Nanonet dapat diterapkan pada produk Anda.
Atau lihat Nanonet API OCR beraksi dan mulai membangun kebiasaan OCR model gratis!
Memperbarui Juli 2022: posting ini awalnya diterbitkan di Oktober 2020 dan sejak itu telah diperbarui secara teratur.
Berikut slidenya merangkum temuan dalam artikel ini. Berikut adalah versi alternatif dari posting ini.
- AI
- AI & Pembelajaran Mesin
- ai seni
- generator seni ai
- punya robot
- kecerdasan buatan
- sertifikasi kecerdasan buatan
- kecerdasan buatan dalam perbankan
- robot kecerdasan buatan
- robot kecerdasan buatan
- perangkat lunak kecerdasan buatan
- blockchain
- konferensi blockchain
- kecerdasan
- kecerdasan buatan percakapan
- konferensi kripto
- dall's
- belajar mendalam
- google itu
- Mesin belajar
- OCR
- plato
- plato ai
- Kecerdasan Data Plato
- Permainan Plato
- Data Plato
- permainan plato
- skala ai
- sintaksis
- Pengenalan Teks
- zephyrnet.dll