Teks Amazon adalah layanan pembelajaran mesin (ML) yang memungkinkan ekstraksi otomatis teks, tulisan tangan, dan data dari dokumen yang dipindai, melampaui pengenalan karakter optik (OCR) tradisional. Itu dapat mengidentifikasi, memahami, dan mengekstrak data dari tabel dan formulir dengan akurasi luar biasa. Saat ini, beberapa perusahaan mengandalkan metode ekstraksi manual atau perangkat lunak OCR dasar, yang membosankan dan memakan waktu, serta memerlukan konfigurasi manual yang perlu diperbarui ketika formulir berubah. Amazon Textract membantu mengatasi tantangan ini dengan memanfaatkan ML untuk secara otomatis memproses berbagai jenis dokumen dan mengekstrak informasi secara akurat dengan intervensi manual minimal. Hal ini memungkinkan Anda mengotomatiskan pemrosesan dokumen dan menggunakan data yang diekstraksi untuk berbagai tujuan, seperti mengotomatisasi pemrosesan pinjaman atau mengumpulkan informasi dari faktur dan kuitansi.
Ketika perjalanan kembali dilanjutkan pascapandemi, verifikasi status vaksinasi wisatawan mungkin diperlukan dalam banyak kasus. Hotel dan agen perjalanan sering kali perlu meninjau kartu vaksinasi untuk mengumpulkan rincian penting seperti apakah wisatawan telah divaksinasi lengkap, tanggal vaksinasi, dan nama wisatawan. Beberapa lembaga melakukan hal ini melalui verifikasi kartu secara manual, yang dapat memakan waktu lama bagi staf dan memberikan ruang bagi kesalahan manusia. Perusahaan lain telah membuat solusi khusus, namun hal ini memerlukan biaya yang mahal dan sulit untuk diukur, serta memerlukan waktu yang lama untuk diterapkan. Ke depannya, mungkin ada peluang untuk menyederhanakan proses verifikasi status vaksinasi dengan cara yang efisien bagi bisnis dengan tetap menghormati privasi dan kenyamanan wisatawan.
Kueri Amazon Textract membantu mengatasi tantangan-tantangan ini. Kueri Amazon Textract memungkinkan Anda menentukan dan mengekstrak hanya bagian informasi yang Anda perlukan dari dokumen. Ini memberi Anda informasi yang tepat dan akurat dari dokumen tersebut.
Dalam postingan ini, kami memandu Anda melalui panduan penerapan langkah demi langkah untuk membangun solusi verifikasi status vaksinasi menggunakan Amazon Textract Query. Solusi ini menunjukkan cara memproses kartu vaksinasi menggunakan kueri Amazon Textract, memverifikasi status vaksinasi, dan menyimpan informasi untuk penggunaan di masa mendatang.
Ikhtisar solusi
Diagram berikut menggambarkan arsitektur solusi.
Alur kerja meliputi langkah-langkah berikut:
- Pengguna mengambil foto kartu vaksinasi.
- Gambar diunggah ke an Layanan Penyimpanan Sederhana Amazon (Amazon S3).
- Saat gambar disimpan di bucket S3, gambar tersebut akan dipanggil Fungsi Langkah AWS alur kerja:
- Penentu Pertanyaan AWS Lambda function memeriksa dokumen yang diteruskan dan menambahkan informasi tentang tipe mime, jumlah halaman, dan jumlah kueri ke alur kerja Step Functions (untuk contoh kita, kita memiliki empat kueri).
NumberQueriesAndPagesChoice
adalah status Pilihan yang menambahkan logika kondisional ke alur kerja. Jika terdapat antara 15โ31 kueri dan jumlah halaman antara 2โ3,001, maka pemrosesan asinkron Amazon Textract adalah satu-satunya pilihan, karena API sinkron hanya mendukung hingga 15 kueri dan dokumen satu halaman. Untuk semua kasus lainnya, kami mengarahkan ke pemilihan acak pemrosesan sinkron atau asinkron.- Grafik
TextractSync
Fungsi Lambda mengirimkan permintaan ke Amazon Textract untuk menganalisis dokumen berdasarkan kueri Amazon Textract berikut:- Apa itu Status Vaksinasi?
- Apa itu Nama?
- Apa itu Tanggal Lahir?
- Apa itu Nomor Dokumen?
- Amazon Textract menganalisis gambar dan mengirimkan jawaban pertanyaan ini kembali ke fungsi Lambda.
- Fungsi Lambda memverifikasi status vaksinasi pelanggan dan menyimpan hasil akhir dalam format CSV di bucket S3 yang sama (
demoqueries-textractxxx
) Dicsv-output
folder.
Prasyarat
Untuk menyelesaikan solusi ini, Anda harus memiliki akun AWS dan izin yang sesuai untuk membuat sumber daya yang diperlukan sebagai bagian dari solusi.
Unduh kode penerapan dan contoh kartu vaksinasi dari GitHub.
Gunakan fitur Kueri di konsol Amazon Textract
Sebelum Anda membangun solusi verifikasi vaksinasi, mari jelajahi bagaimana Anda dapat menggunakan Kueri Amazon Textract untuk mengekstrak status vaksinasi melalui konsol Amazon Textract. Anda dapat menggunakan contoh kartu vaksinasi yang Anda unduh dari repo GitHub.
- Di konsol Amazon Textract, pilih Analisis Dokumen di panel navigasi.
- Bawah Unggah dokumen, pilih Pilih dokumen untuk mengunggah kartu vaksinasi dari drive lokal Anda.
- Setelah Anda mengunggah dokumen, pilih Pertanyaan dalam Konfigurasikan Dokumen bagian.
- Anda kemudian dapat menambahkan kueri dalam bentuk pertanyaan bahasa alami. Mari tambahkan yang berikut ini:
- Apa itu Status Vaksinasi?
- Apa itu Nama?
- Apa itu Tanggal Lahir?
- Apa itu Nomor Dokumen?
- Setelah Anda menambahkan semua pertanyaan Anda, pilih Terapkan konfigurasi.
- Periksa Pertanyaannya tab untuk melihat jawaban atas pertanyaan.
Anda dapat melihat Amazon Textract mengekstrak jawaban atas pertanyaan Anda dari dokumen.
Terapkan solusi verifikasi vaksinasi
Dalam posting ini, kami menggunakan an AWS Cloud9 instance dan instal dependensi yang diperlukan pada instance dengan Kit Pengembangan AWS Cloud (AWS CDK) dan Docker. AWS Cloud9 adalah lingkungan pengembangan terintegrasi (IDE) berbasis cloud yang memungkinkan Anda menulis, menjalankan, dan men-debug kode hanya dengan browser.
- Di terminal, pilih Unggah File Lokal pada File menu.
- Pilih Pilih folder Dan pilih
vaccination_verification_solution
folder yang Anda unduh dari GitHub. - Di terminal, siapkan aplikasi tanpa server Anda untuk langkah selanjutnya dalam alur kerja pengembangan Anda Model Aplikasi Tanpa Server AWS (AWS SAM) menggunakan perintah berikut:
- Deploy aplikasi menggunakan
cdk deploy
perintah:Tunggu AWS CDK untuk men-deploy model dan membuat sumber daya yang disebutkan dalam templat.
- Ketika penerapan selesai, Anda dapat memeriksa sumber daya yang diterapkan di Formasi AWS Cloud konsol di Sumber tab halaman detail tumpukan.
Uji solusinya
Sekarang saatnya menguji solusinya. Untuk memicu alur kerja, gunakan aws s3 cp
untuk mengunggah vac_card.jpg
file untuk DemoQueries.DocumentUploadLocation
di dalam folder dokumen:
File sertifikat vaksinasi secara otomatis diunggah ke bucket S3 demoqueries-textractxxx
di folder unggahan.
Alur kerja Step Functions dipicu melalui fungsi Lambda segera setelah file sertifikat vaksinasi diunggah ke bucket S3.
Fungsi Lambda Query-Decider memeriksa dokumen dan menambahkan informasi tentang tipe mime, jumlah halaman, dan jumlah kueri ke alur kerja Step Functions (untuk contoh ini, kami menggunakan empat kueriโnomor dokumen, nama pelanggan, tanggal kelahiran, dan status vaksinasi).
Grafik TextractSync
function mengirimkan kueri input ke Amazon Textract dan secara sinkron mengembalikan hasil lengkap sebagai bagian dari respons. Mendukung dokumen 1 halaman (TIFF, PDF, JPG, PNG) dan hingga 15 kueri. Itu GenerateCsvTask
fungsi mengambil output JSON dari Amazon Textract dan mengubahnya menjadi file CSV.
Hasil akhir disimpan dalam bucket S3 yang sama di folder csv-output sebagai file CSV.
Anda dapat mengunduh file ke mesin lokal Anda menggunakan perintah berikut:
Format hasilnya adalah timestamp
, classification
, filename
, page number
, key name
, key_confidence
, value
, value_confidence
, key_bb_top
, key_bb_height
, key_bb.width
, key_bb_left
, value_bb_top
, value_bb_height
, value_bb_width
, value_bb_left
.
Anda dapat menskalakan solusi ke ratusan dokumen sertifikat vaksinasi untuk banyak pelanggan dengan mengunggah sertifikat vaksinasi mereka ke DemoQueries.DocumentUploadLocation
. Hal ini secara otomatis memicu beberapa proses mesin status Step Functions, dan hasil akhirnya disimpan dalam bucket S3 yang sama di folder csv-output.
Untuk mengubah kumpulan kueri awal yang dimasukkan ke Amazon Textract, Anda dapat masuk ke instans AWS Cloud9 dan membuka file start_execution.py. Dalam tampilan file di panel kiri, navigasikan ke lambda, start_queries
, app
, start_execution.py
. Fungsi Lambda ini dipanggil ketika file diunggah DemoQueries.DocumentUploadLocation
. Kueri yang dikirim ke alur kerja ditentukan dalam start_execution.py
; Anda dapat mengubahnya dengan memperbarui kode seperti yang ditunjukkan pada gambar layar berikut.
Membersihkan
Untuk menghindari timbulnya biaya berkelanjutan, hapus sumber daya yang dibuat di postingan ini menggunakan perintah berikut:
Jawab pertanyaannya Are you sure you want to delete: DemoQueries (y/n)?
dengan kamu.
Kesimpulan
Dalam postingan ini, kami menunjukkan kepada Anda cara menggunakan Kueri Amazon Textract untuk membangun solusi verifikasi vaksinasi untuk industri perjalanan. Anda dapat menggunakan Kueri Amazon Textract untuk membangun solusi di industri lain seperti keuangan dan layanan kesehatan, dan mengambil informasi dari dokumen seperti slip pembayaran, catatan hipotek, dan kartu asuransi berdasarkan pertanyaan bahasa alami.
Untuk informasi lebih lanjut, lihat Menganalisis Dokumen, atau periksa konsol Amazon Textract dan coba fitur ini.
Tentang Penulis
Dhiraj Thakur adalah Arsitek Solusi dengan Amazon Web Services. Dia bekerja dengan pelanggan dan mitra AWS untuk memberikan panduan tentang adopsi cloud perusahaan, migrasi, dan strategi. Dia sangat menyukai teknologi dan suka membangun serta bereksperimen dalam ruang analitik dan AI / ML.
Rishabh Yadav adalah arsitek Solusi Mitra di AWS dengan latar belakang luas dalam penawaran DevOps dan Keamanan di AWS. Dia bekerja dengan mitra ASEAN untuk memberikan panduan mengenai adopsi cloud perusahaan dan tinjauan arsitektur serta membangun praktik AWS melalui penerapan Well-Architected Framework. Di luar pekerjaan, ia suka menghabiskan waktunya di bidang olah raga dan bermain game FPS.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/build-a-vaccination-verification-solution-using-the-queries-feature-in-amazon-textract/
- :adalah
- $NAIK
- 001
- 100
- 15%
- 1930
- 2468
- 258
- 7
- 8
- a
- Tentang Kami
- Akun
- ketepatan
- tepat
- akurat
- menambahkan
- alamat
- Menambahkan
- Adopsi
- lembaga
- AI / ML
- Semua
- memungkinkan
- sepanjang
- Amazon
- Teks Amazon
- Amazon Web Services
- an
- analisis
- menganalisa
- analisis
- dan
- menjawab
- jawaban
- Lebah
- Aplikasi
- sesuai
- arsitektur
- ADALAH
- AS
- Asean
- At
- mengotomatisasikan
- secara otomatis
- secara otomatis
- mengotomatisasi
- menghindari
- AWS
- AWS Cloud9
- Formasi AWS Cloud
- kembali
- latar belakang
- berdasarkan
- dasar
- BE
- karena
- antara
- kelahiran
- Browser
- membangun
- Bangunan
- dibangun di
- bisnis
- tapi
- by
- CAN
- kartu
- Kartu-kartu
- kasus
- CD
- sertifikat
- sertifikat
- tantangan
- perubahan
- Perubahan
- karakter
- pengenalan karakter
- beban
- memeriksa
- pilihan
- Pilih
- awan
- adopsi cloud
- Cloud9
- kode
- Perusahaan
- lengkap
- konfigurasi
- konsul
- kenyamanan
- mahal
- membuat
- dibuat
- adat
- pelanggan
- pelanggan
- data
- Tanggal
- Tanggal
- didefinisikan
- ketergantungan
- menyebarkan
- dikerahkan
- penyebaran
- menghancurkan
- rincian
- Pengembangan
- berbeda
- sulit
- do
- Buruh pelabuhan
- dokumen
- dokumen
- Download
- mendorong
- efisien
- memungkinkan
- Enterprise
- Lingkungan Hidup
- kesalahan
- Memeriksa
- contoh
- menyelidiki
- luas
- ekstrak
- ekstraksi
- Ekstrak
- Fitur
- Fed
- bidang
- File
- terakhir
- keuangan
- berikut
- Untuk
- bentuk
- format
- bentuk
- Depan
- empat
- fps
- Kerangka
- dari
- penuh
- sepenuhnya
- fungsi
- fungsi
- masa depan
- game
- mengumpulkan
- pertemuan
- GitHub
- memberikan
- Go
- bimbingan
- membimbing
- Memiliki
- he
- kesehatan
- membantu
- -nya
- hotel
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- HTML
- http
- HTTPS
- manusia
- Ratusan
- mengenali
- if
- menggambarkan
- gambar
- melaksanakan
- implementasi
- penting
- in
- Di lain
- termasuk
- industri
- industri
- informasi
- mulanya
- memasukkan
- dalam
- install
- contoh
- asuransi
- terpadu
- intervensi
- ke
- faktur
- dipanggil
- memanggil
- IT
- jpg
- json
- hanya
- bahasa
- pengetahuan
- meninggalkan
- Lets
- 'like'
- 'like
- Pinjaman
- lokal
- logika
- mesin
- Mesin belajar
- panduan
- banyak
- Mungkin..
- tersebut
- menu
- metode
- migrasi
- minimal
- ML
- model
- lebih
- Hipotek
- bergerak
- beberapa
- nama
- Alam
- Arahkan
- Navigasi
- perlu
- Perlu
- kebutuhan
- Catatan
- jumlah
- OCR
- Perangkat Lunak OCR
- of
- Penawaran
- sering
- on
- terus-menerus
- hanya
- Buka
- Peluang
- optical character recognition
- pilihan
- or
- Lainnya
- Lainnya
- kami
- di luar
- keluaran
- di luar
- halaman
- halaman
- pane
- bagian
- pasangan
- rekan
- Lulus
- bergairah
- Izin
- foto
- bagian
- plato
- Kecerdasan Data Plato
- Data Plato
- Pos
- pasca-pandemi
- praktek
- perlu
- Mempersiapkan
- sekarang
- pribadi
- proses
- pengolahan
- memberikan
- tujuan
- query
- pertanyaan
- Pertanyaan
- acak
- penerimaan
- pengakuan
- mengandalkan
- luar biasa
- permintaan
- wajib
- Persyaratan
- membutuhkan
- Sumber
- menghormati
- tanggapan
- mengakibatkan
- Pengembalian
- ulasan
- Review
- Kamar
- Rute
- Run
- berjalan
- Universitas
- sama
- disimpan
- Skala
- Bagian
- keamanan
- melihat
- memilih
- seleksi
- mengirimkan
- mengirim
- Tanpa Server
- layanan
- Layanan
- set
- beberapa
- harus
- menunjukkan
- ditunjukkan
- penting
- Sederhana
- Perangkat lunak
- larutan
- Solusi
- MEMECAHKAN
- beberapa
- segera
- Space
- menghabiskan
- Olahraga
- tumpukan
- Staf
- Negara
- Status
- Langkah
- Tangga
- penyimpanan
- menyimpan
- tersimpan
- toko
- Penyelarasan
- mempersingkat
- selanjutnya
- seperti itu
- mendukung
- Mendukung
- yakin
- melebihi
- Mengambil
- Dibutuhkan
- Teknologi
- membosankan
- Template
- terminal
- uji
- teks
- bahwa
- Grafik
- informasi
- mereka
- kemudian
- Sana.
- Ini
- ini
- itu
- Melalui
- waktu
- membuang-buang waktu
- untuk
- tradisional
- perjalanan
- industri perjalanan
- wisatawan
- memicu
- dipicu
- mencoba
- mengetik
- jenis
- memahami
- memperbarui
- upload
- Mengunggah
- URL
- menggunakan
- Pengguna
- menggunakan
- Memanfaatkan
- Vaksin
- nilai
- Verifikasi
- memeriksa
- memverifikasi
- melalui
- View
- berjalan
- ingin
- Cara..
- we
- jaringan
- layanan web
- ketika
- apakah
- yang
- sementara
- dengan
- Kerja
- alur kerja
- bekerja
- menulis
- Kamu
- Anda
- zephyrnet.dll