Latih Dan Host Model Computer Vision Untuk Deteksi Gangguan Di Amazon SageMaker: Bagian 2

Diterbitkan Ulang Oleh Plato

Followers: 0

Dalam majalah bagian pertama Dari seri tiga bagian ini, kami menyajikan solusi yang menunjukkan bagaimana Anda dapat mengotomatiskan deteksi gangguan dan penipuan dokumen dalam skala besar menggunakan layanan AI AWS dan pembelajaran mesin (ML) untuk kasus penggunaan penjaminan hipotek.

Dalam postingan ini, kami menyajikan pendekatan untuk mengembangkan model visi komputer berbasis pembelajaran mendalam untuk mendeteksi dan menyoroti gambar palsu dalam penjaminan hipotek. Kami memberikan panduan dalam membangun, melatih, dan menerapkan jaringan pembelajaran mendalam Amazon SageMaker.

Di Bagian 3, kami mendemonstrasikan cara mengimplementasikan solusi tersebut Detektor Penipuan Amazon.

Ikhtisar solusi

Untuk memenuhi tujuan mendeteksi kerusakan dokumen dalam penjaminan hipotek, kami menggunakan model visi komputer yang dihosting di SageMaker untuk solusi deteksi pemalsuan gambar kami. Model ini menerima gambar pengujian sebagai masukan dan menghasilkan prediksi kemungkinan pemalsuan sebagai keluarannya. Arsitektur jaringan seperti yang digambarkan pada diagram berikut.

Arsitektur model deteksi gangguan

Pemalsuan gambar terutama melibatkan empat teknik: penyambungan, pemindahan salinan, penghapusan, dan peningkatan. Tergantung pada karakteristik pemalsuan, petunjuk berbeda dapat digunakan sebagai dasar untuk deteksi dan lokalisasi. Petunjuk ini mencakup artefak kompresi JPEG, inkonsistensi tepi, pola noise, konsistensi warna, kesamaan visual, konsistensi EXIF, dan model kamera.

Mengingat luasnya cakupan deteksi pemalsuan gambar, kami menggunakan algoritma Error Level Analysis (ELA) sebagai metode ilustratif untuk mendeteksi pemalsuan. Kami memilih teknik ELA untuk postingan ini karena alasan berikut:

Ini lebih cepat untuk diterapkan dan dapat dengan mudah menangkap gangguan pada gambar.
Ia bekerja dengan menganalisis tingkat kompresi berbagai bagian gambar. Hal ini memungkinkannya mendeteksi ketidakkonsistenan yang mungkin mengindikasikan adanya gangguan—misalnya, jika satu area disalin dan ditempel dari gambar lain yang telah disimpan pada tingkat kompresi berbeda.
Ini bagus dalam mendeteksi gangguan yang lebih halus dan mulus yang mungkin sulit dikenali dengan mata telanjang. Bahkan perubahan kecil pada gambar dapat menimbulkan anomali kompresi yang terdeteksi.
Itu tidak bergantung pada gambar asli yang tidak dimodifikasi untuk perbandingan. ELA dapat mengidentifikasi tanda-tanda gangguan hanya pada gambar yang dipertanyakan itu sendiri. Teknik lain sering kali memerlukan dokumen asli yang tidak dimodifikasi untuk dibandingkan.
Ini adalah teknik ringan yang hanya mengandalkan analisis artefak kompresi pada data gambar digital. Itu tidak bergantung pada perangkat keras khusus atau keahlian forensik. Hal ini membuat ELA dapat diakses sebagai alat analisis first-pass.
Gambar keluaran ELA dapat dengan jelas menyorot perbedaan tingkat kompresi, membuat area yang rusak terlihat jelas. Hal ini memungkinkan bahkan orang yang bukan ahli sekalipun untuk mengenali tanda-tanda kemungkinan manipulasi.
Ini berfungsi pada banyak jenis gambar (seperti JPEG, PNG, dan GIF) dan hanya memerlukan gambar itu sendiri untuk dianalisis. Teknik forensik lainnya mungkin lebih terbatas dalam format atau persyaratan gambar asli.

Namun, dalam skenario dunia nyata di mana Anda mungkin memiliki kombinasi dokumen masukan (JPEG, PNG, GIF, TIFF, PDF), kami merekomendasikan penggunaan ELA bersamaan dengan berbagai metode lain, seperti mendeteksi ketidakkonsistenan pada tepinya, pola kebisingan, keseragaman warna, Konsistensi data EXIF, identifikasi model kamera, dan keseragaman font. Kami bertujuan untuk memperbarui kode untuk posting ini dengan teknik deteksi pemalsuan tambahan.

Premis dasar ELA mengasumsikan bahwa gambar masukan dalam format JPEG, yang dikenal dengan kompresi lossy. Meskipun demikian, metode ini tetap efektif meskipun gambar masukan awalnya dalam format lossless (seperti PNG, GIF, atau BMP) dan kemudian diubah menjadi JPEG selama proses gangguan. Ketika ELA diterapkan pada format lossless asli, biasanya ELA menunjukkan kualitas gambar yang konsisten tanpa penurunan apa pun, sehingga sulit untuk menentukan area yang diubah. Dalam gambar JPEG, norma yang diharapkan adalah seluruh gambar menunjukkan tingkat kompresi yang serupa. Namun, jika bagian tertentu dalam gambar menampilkan tingkat kesalahan yang sangat berbeda, hal ini sering kali menunjukkan bahwa telah terjadi perubahan digital.

ELA menyoroti perbedaan dalam tingkat kompresi JPEG. Daerah dengan pewarnaan seragam kemungkinan besar akan memiliki hasil ELA yang lebih rendah (misalnya, warnanya lebih gelap dibandingkan tepi dengan kontras tinggi). Hal-hal yang perlu diperhatikan untuk mengidentifikasi gangguan atau modifikasi adalah sebagai berikut:

Tepi yang serupa seharusnya memiliki kecerahan yang sama pada hasil ELA. Semua tepi dengan kontras tinggi akan terlihat serupa satu sama lain, dan semua tepi dengan kontras rendah akan terlihat serupa. Pada foto asli, tepi dengan kontras rendah seharusnya hampir seterang tepi dengan kontras tinggi.
Tekstur serupa harus memiliki warna serupa di bawah ELA. Area dengan permukaan yang lebih detail, seperti gambar bola basket dari jarak dekat, kemungkinan besar akan memiliki hasil ELA yang lebih tinggi dibandingkan permukaan yang halus.
Terlepas dari warna permukaan sebenarnya, semua permukaan datar harus memiliki warna yang sama di bawah ELA.

Gambar JPEG menggunakan sistem kompresi lossy. Setiap pengkodean ulang (penyimpanan ulang) gambar menambah penurunan kualitas gambar. Secara khusus, algoritma JPEG beroperasi pada grid 8x8 piksel. Setiap kotak berukuran 8x8 dikompresi secara independen. Jika gambar tidak dimodifikasi sama sekali, maka semua kotak berukuran 8×8 seharusnya memiliki potensi kesalahan yang sama. Jika gambar tidak dimodifikasi dan disimpan ulang, setiap kotak akan terdegradasi dengan laju yang kira-kira sama.

ELA menyimpan gambar pada tingkat kualitas JPEG tertentu. Penyimpanan ulang ini menimbulkan sejumlah kesalahan yang diketahui di seluruh gambar. Gambar yang disimpan ulang kemudian dibandingkan dengan gambar aslinya. Jika suatu gambar dimodifikasi, maka setiap kotak berukuran 8x8 yang disentuh oleh modifikasi tersebut harus memiliki potensi kesalahan yang lebih tinggi daripada bagian gambar lainnya.

Hasil dari ELA secara langsung bergantung pada kualitas gambar. Anda mungkin ingin tahu apakah ada sesuatu yang ditambahkan, tetapi jika gambar disalin beberapa kali, maka ELA hanya mengizinkan pendeteksian penyimpanan ulang. Cobalah untuk menemukan versi gambar dengan kualitas terbaik.

Dengan pelatihan dan praktik, ELA juga dapat belajar mengidentifikasi penskalaan gambar, kualitas, pemotongan, dan penyimpanan ulang transformasi. Misalnya, jika gambar non-JPEG berisi garis kisi yang terlihat (lebar 1 piksel dalam kotak 8×8), berarti gambar tersebut dimulai sebagai JPEG dan dikonversi ke format non-JPEG (seperti PNG). Jika beberapa area pada gambar tidak memiliki garis kisi atau garis kisi bergeser, hal ini menunjukkan adanya sambungan atau bagian yang digambar pada gambar non-JPEG.

Di bagian berikut, kami mendemonstrasikan langkah-langkah untuk mengonfigurasi, melatih, dan menerapkan model visi komputer.

Prasyarat

Untuk mengikuti postingan ini, lengkapi prasyarat berikut:

Memiliki akun AWS.
Mendirikan Studio Amazon SageMaker. Anda dapat dengan cepat memulai SageMaker Studio menggunakan preset default, sehingga memfasilitasi peluncuran cepat. Untuk informasi lebih lanjut, lihat Amazon SageMaker menyederhanakan pengaturan Amazon SageMaker Studio untuk pengguna individual.
Buka SageMaker Studio dan luncurkan terminal sistem.
Jalankan perintah berikut di terminal:
git clone https://github.com/aws-samples/document-tampering-detection.git
Total biaya menjalankan SageMaker Studio untuk satu pengguna dan konfigurasi lingkungan notebook adalah $7.314 USD per jam.

Siapkan buku catatan pelatihan model

Selesaikan langkah-langkah berikut untuk menyiapkan buku catatan pelatihan Anda:

Buka tampering_detection_training.ipynb file dari direktori deteksi kerusakan dokumen.
Siapkan lingkungan notebook dengan gambar TensorFlow 2.6 Python 3.8 CPU atau GPU Optimized.
Anda mungkin mengalami masalah ketersediaan yang tidak mencukupi atau mencapai batas kuota untuk instans GPU dalam akun AWS Anda saat memilih instans GPU yang dioptimalkan. Untuk menambah kuota, kunjungi konsol Service Quotas dan tingkatkan batas layanan untuk jenis instans spesifik yang Anda perlukan. Anda juga dapat menggunakan lingkungan notebook yang dioptimalkan CPU dalam kasus seperti itu.
Untuk Inti, pilih Python3.
Untuk Jenis instance, pilih ml.m5d.24xbesar atau contoh besar lainnya.

Kami memilih jenis instans yang lebih besar untuk mengurangi waktu pelatihan model. Dengan lingkungan notebook ml.m5d.24xlarge, biaya per jamnya adalah $7.258 USD per jam.

Jalankan buku catatan pelatihan

Jalankan setiap sel di buku catatan tampering_detection_training.ipynb dalam urutan. Kami membahas beberapa sel secara lebih rinci di bagian berikut.

Siapkan kumpulan data dengan daftar gambar asli dan gambar yang diubah

Sebelum Anda menjalankan sel berikut di buku catatan, siapkan himpunan data dokumen asli dan yang diubah berdasarkan kebutuhan spesifik bisnis Anda. Untuk postingan ini, kami menggunakan contoh kumpulan data slip pembayaran yang dirusak, dan laporan bank. Kumpulan data tersedia dalam direktori gambar di Repositori GitHub.

Siapkan kumpulan data

Buku catatan membaca gambar asli dan gambar yang dirusak dari images/training direktori.

Kumpulan data untuk pelatihan dibuat menggunakan file CSV dengan dua kolom: jalur ke file gambar dan label untuk gambar (0 untuk gambar asli dan 1 untuk gambar yang diubah).

Labeli kumpulan data

Memproses dataset dengan menghasilkan hasil ELA dari setiap gambar pelatihan

Pada langkah ini, kami menghasilkan hasil ELA (dengan kualitas 90%) dari gambar pelatihan masukan. Fungsinya convert_to_ela_image mengambil dua parameter: jalur, yang merupakan jalur ke file gambar, dan kualitas, mewakili parameter kualitas untuk kompresi JPEG. Fungsi ini melakukan langkah-langkah berikut:

Konversikan gambar ke format RGB dan simpan kembali gambar sebagai file JPEG dengan kualitas yang ditentukan dengan nama tempresaved.jpg.
Hitung perbedaan antara gambar asli dan gambar JPEG yang disimpan ulang (ELA) untuk menentukan perbedaan maksimum nilai piksel antara gambar asli dan gambar yang disimpan ulang.
Hitung faktor skala berdasarkan perbedaan maksimum untuk mengatur kecerahan gambar ELA.
Tingkatkan kecerahan gambar ELA menggunakan faktor skala yang dihitung.
Ubah ukuran hasil ELA menjadi 128x128x3, dimana 3 mewakili jumlah saluran untuk mengurangi ukuran input untuk pelatihan.
Kembalikan gambar ELA.

Dalam format gambar lossy seperti JPEG, proses penyimpanan awal menyebabkan hilangnya warna yang cukup besar. Namun, ketika gambar dimuat dan kemudian dikodekan ulang dalam format lossy yang sama, degradasi warna yang ditambahkan biasanya lebih sedikit. Hasil ELA menekankan area gambar yang paling rentan terhadap degradasi warna saat disimpan ulang. Secara umum, perubahan tampak jelas di wilayah yang menunjukkan potensi degradasi lebih tinggi dibandingkan wilayah lain pada gambar.

Selanjutnya, gambar tersebut diproses menjadi array NumPy untuk pelatihan. Kami kemudian membagi kumpulan data masukan secara acak menjadi data pelatihan dan pengujian atau validasi (80/20). Anda dapat mengabaikan peringatan apa pun saat menjalankan sel ini.

Konversikan ke ELA untuk pelatihan

Bergantung pada ukuran kumpulan data, menjalankan sel ini mungkin memerlukan waktu hingga selesai. Untuk contoh kumpulan data yang kami sediakan di repositori ini, mungkin memerlukan waktu 5–10 menit.

Konfigurasikan model CNN

Pada langkah ini, kami membuat versi minimal jaringan VGG dengan filter konvolusional kecil. VGG-16 terdiri dari 13 lapisan konvolusional dan tiga lapisan yang terhubung sepenuhnya. Tangkapan layar berikut mengilustrasikan arsitektur model Convolutional Neural Network (CNN) kami.

Arsitektur model Tensorflow

Perhatikan konfigurasi berikut:

Memasukkan – Model mengambil ukuran input gambar 128x128x3.
Lapisan konvolusional – Lapisan konvolusional menggunakan bidang reseptif minimal (3×3), ukuran sekecil mungkin yang masih menangkap atas/bawah dan kiri/kanan. Hal ini diikuti dengan fungsi aktivasi unit linier yang diperbaiki (ReLU) yang mengurangi waktu pelatihan. Ini adalah fungsi linier yang akan mengeluarkan masukan jika positif; jika tidak, outputnya nol. Langkah konvolusi ditetapkan pada default (1 piksel) untuk menjaga resolusi spasial tetap terjaga setelah konvolusi (langkah adalah jumlah pergeseran piksel pada matriks masukan).
Lapisan yang terhubung sepenuhnya – Jaringan memiliki dua lapisan yang terhubung sepenuhnya. Lapisan padat pertama menggunakan aktivasi ReLU, dan lapisan kedua menggunakan softmax untuk mengklasifikasikan gambar sebagai asli atau rusak.

Anda dapat mengabaikan peringatan apa pun saat menjalankan sel ini.

Simpan artefak model

Simpan model terlatih dengan nama file unik—misalnya, berdasarkan tanggal dan waktu saat ini—ke dalam direktori bernama model.

Simpan artefak model tensorflow

Model disimpan dalam format Keras dengan ekstensi .keras. Kami juga menyimpan artefak model sebagai direktori bernama 1 yang berisi tanda tangan berseri dan status yang diperlukan untuk menjalankannya, termasuk nilai variabel dan kosakata untuk diterapkan ke runtime SageMaker (yang akan kita bahas nanti di postingan ini).

Ukur kinerja model

Kurva kerugian berikut menunjukkan perkembangan kerugian model selama periode pelatihan (iterasi).

plot akurasi model

Fungsi kerugian mengukur seberapa cocok prediksi model dengan target sebenarnya. Nilai yang lebih rendah menunjukkan keselarasan yang lebih baik antara prediksi dan nilai sebenarnya. Menurunnya kerugian seiring berjalannya waktu menandakan bahwa model tersebut semakin baik. Kurva akurasi menggambarkan keakuratan model selama periode pelatihan. Akurasi adalah perbandingan prediksi yang benar dengan jumlah total prediksi. Akurasi yang lebih tinggi menunjukkan model berperforma lebih baik. Biasanya, akurasi meningkat selama pelatihan seiring model mempelajari pola dan meningkatkan kemampuan prediktifnya. Hal ini akan membantu Anda menentukan apakah model tersebut overfitting (berperforma baik pada data pelatihan tetapi buruk pada data yang tidak terlihat) atau underfitting (tidak cukup belajar dari data pelatihan).

Matriks konfusi berikut secara visual menunjukkan seberapa baik model secara akurat membedakan antara kelas positif (gambar palsu, direpresentasikan sebagai nilai 1) dan negatif (gambar tidak diubah, direpresentasikan sebagai nilai 0).

Plot matriks kebingungan

Setelah pelatihan model, langkah kami selanjutnya melibatkan penerapan model visi komputer sebagai API. API ini akan diintegrasikan ke dalam aplikasi bisnis sebagai komponen alur kerja penjaminan. Untuk mencapai hal ini, kami menggunakan Amazon SageMaker Inference, layanan yang dikelola sepenuhnya. Layanan ini terintegrasi secara mulus dengan alat MLOps, memungkinkan penerapan model yang skalabel, inferensi hemat biaya, peningkatan manajemen model dalam produksi, dan mengurangi kompleksitas operasional. Dalam postingan ini, kami menerapkan model sebagai titik akhir inferensi waktu nyata. Namun, penting untuk diingat bahwa, bergantung pada alur kerja aplikasi bisnis Anda, penerapan model juga dapat disesuaikan sebagai pemrosesan batch, penanganan asinkron, atau melalui arsitektur penerapan tanpa server.

Siapkan buku catatan penerapan model

Selesaikan langkah-langkah berikut untuk menyiapkan notebook penerapan model Anda:

Buka tampering_detection_model_deploy.ipynb file dari direktori deteksi kerusakan dokumen.
Siapkan lingkungan buku catatan dengan gambar Data Science 3.0.
Untuk Inti, pilih Python3.
Untuk Jenis instance, pilih ml.t3.medium.

Dengan lingkungan notebook ml.t3.medium, biaya per jam adalah $0.056 USD.

Buat kebijakan inline khusus untuk peran SageMaker untuk mengizinkan semua tindakan Amazon S3

Grafik Identitas AWS dan Manajemen Akses Peran (IAM) untuk SageMaker akan ada dalam format AmazonSageMaker- ExecutionRole-<random numbers>. Pastikan Anda menggunakan peran yang benar. Nama peran dapat ditemukan di bawah detail pengguna dalam konfigurasi domain SageMaker.

Latih dan host model visi komputer untuk deteksi gangguan di Amazon SageMaker: Bagian 2 | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Perbarui peran IAM untuk menyertakan kebijakan inline untuk mengizinkan semua Layanan Penyimpanan Sederhana Amazon (Amazon S3) tindakan. Hal ini diperlukan untuk mengotomatiskan pembuatan dan penghapusan bucket S3 yang akan menyimpan artefak model. Anda dapat membatasi akses ke bucket S3 tertentu. Perhatikan bahwa kami menggunakan wildcard untuk nama bucket S3 dalam kebijakan IAM (tamperingdetection*).

Latih dan host model visi komputer untuk deteksi gangguan di Amazon SageMaker: Bagian 2 | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Jalankan buku catatan penerapan

Jalankan setiap sel di buku catatan tampering_detection_model_deploy.ipynb dalam urutan. Kami membahas beberapa sel secara lebih rinci di bagian berikut.

Buat ember S3

Jalankan sel untuk membuat bucket S3. Ember itu akan diberi nama tamperingdetection<current date time> dan di Wilayah AWS yang sama dengan lingkungan SageMaker Studio Anda.

Buat ember Amazon S3

Buat arsip artefak model dan unggah ke Amazon S3

Buat file tar.gz dari artefak model. Kami telah menyimpan artefak model sebagai direktori bernama 1, berisi tanda tangan berseri dan status yang diperlukan untuk menjalankannya, termasuk nilai variabel dan kosakata untuk diterapkan ke runtime SageMaker. Anda juga dapat menyertakan file inferensi khusus bernama inference.py dalam folder kode di artefak model. Inferensi khusus dapat digunakan untuk prapemrosesan dan pascapemrosesan gambar masukan.

Unggah artefak model ke Amazon S3

Buat titik akhir inferensi SageMaker

Sel untuk membuat titik akhir inferensi SageMaker mungkin memerlukan waktu beberapa menit untuk diselesaikan.

Buat titik akhir Inferensi Amazon SageMaker

Uji titik akhir inferensi

Fungsi check_image memproses gambar terlebih dahulu sebagai gambar ELA, mengirimkannya ke titik akhir SageMaker untuk inferensi, mengambil dan memproses prediksi model, dan mencetak hasilnya. Model ini mengambil array NumPy dari gambar masukan sebagai gambar ELA untuk memberikan prediksi. Prediksi dihasilkan sebagai 0, mewakili gambar yang tidak diubah, dan 1, mewakili gambar palsu.

Uji titik akhir Inferensi Amazon SageMaker

Mari kita panggil model dengan gambar slip pembayaran yang belum diubah dan periksa hasilnya.

Uji gambar asli

Model mengeluarkan klasifikasi sebagai 0, mewakili gambar yang tidak diubah.

Sekarang mari kita panggil model dengan gambar slip pembayaran yang dirusak dan periksa hasilnya.

Uji gambar palsu

Model mengeluarkan klasifikasi sebagai 1, mewakili gambar palsu.

keterbatasan

Meskipun ELA adalah alat yang sangat baik untuk membantu mendeteksi modifikasi, terdapat sejumlah keterbatasan, seperti berikut:

Perubahan piksel tunggal atau sedikit penyesuaian warna mungkin tidak menghasilkan perubahan nyata pada ELA karena JPEG beroperasi pada grid.
ELA hanya mengidentifikasi wilayah mana yang memiliki tingkat kompresi berbeda. Jika gambar dengan kualitas lebih rendah disambung ke gambar dengan kualitas lebih tinggi, maka gambar dengan kualitas lebih rendah mungkin tampak sebagai wilayah yang lebih gelap.
Penskalaan, pewarnaan ulang, atau penambahan noise pada gambar akan mengubah keseluruhan gambar, sehingga menciptakan potensi tingkat kesalahan yang lebih tinggi.
Jika suatu gambar disimpan ulang beberapa kali, mungkin seluruhnya berada pada tingkat kesalahan minimum, sehingga lebih banyak penyimpanan ulang tidak akan mengubah gambar tersebut. Dalam hal ini, ELA akan mengembalikan gambar hitam dan tidak ada modifikasi yang dapat diidentifikasi menggunakan algoritma ini.
Dengan Photoshop, tindakan sederhana menyimpan gambar dapat mempertajam tekstur dan tepi secara otomatis, sehingga menciptakan potensi tingkat kesalahan yang lebih tinggi. Artefak ini tidak mengidentifikasi modifikasi yang disengaja; itu mengidentifikasi bahwa produk Adobe digunakan. Secara teknis, ELA muncul sebagai modifikasi karena Adobe secara otomatis melakukan modifikasi, namun modifikasi tersebut belum tentu disengaja oleh pengguna.

Kami merekomendasikan penggunaan ELA bersama dengan teknik lain yang telah dibahas sebelumnya di blog untuk mendeteksi lebih banyak kasus manipulasi gambar. ELA juga dapat berfungsi sebagai alat independen untuk memeriksa disparitas gambar secara visual, terutama ketika melatih model berbasis CNN menjadi suatu tantangan.

Membersihkan

Untuk menghapus sumber daya yang Anda buat sebagai bagian dari solusi ini, selesaikan langkah-langkah berikut:

Jalankan sel buku catatan di bawah Membersihkan bagian. Ini akan menghapus yang berikut ini:
1. Titik akhir inferensi SageMaker – Nama titik akhir inferensi adalah tamperingdetection-<datetime>.
2. Objek dalam bucket S3 dan bucket S3 itu sendiri – Nama embernya adalah tamperingdetection<datetime>.
menutup sumber daya notebook SageMaker Studio.

Kesimpulan

Dalam postingan ini, kami menyajikan solusi menyeluruh untuk mendeteksi gangguan dan penipuan dokumen menggunakan pembelajaran mendalam dan SageMaker. Kami menggunakan ELA untuk memproses gambar terlebih dahulu dan mengidentifikasi perbedaan dalam tingkat kompresi yang mungkin mengindikasikan manipulasi. Kemudian kami melatih model CNN pada kumpulan data yang diproses ini untuk mengklasifikasikan gambar sebagai gambar asli atau gambar yang diubah.

Model ini dapat mencapai performa yang kuat, dengan akurasi lebih dari 95% dengan kumpulan data (palsu dan asli) yang sesuai dengan kebutuhan bisnis Anda. Hal ini menunjukkan bahwa ia dapat mendeteksi dokumen palsu seperti bukti pembayaran dan laporan bank dengan andal. Model terlatih disebarkan ke titik akhir SageMaker untuk mengaktifkan inferensi latensi rendah dalam skala besar. Dengan mengintegrasikan solusi ini ke dalam alur kerja hipotek, institusi dapat secara otomatis menandai dokumen mencurigakan untuk penyelidikan penipuan lebih lanjut.

Meskipun kuat, ELA memiliki beberapa keterbatasan dalam mengidentifikasi jenis manipulasi yang lebih halus. Sebagai langkah selanjutnya, model ini dapat ditingkatkan dengan memasukkan teknik forensik tambahan ke dalam pelatihan dan menggunakan kumpulan data yang lebih besar dan beragam. Secara keseluruhan, solusi ini menunjukkan bagaimana Anda dapat menggunakan pembelajaran mendalam dan layanan AWS untuk membangun solusi berdampak yang meningkatkan efisiensi, mengurangi risiko, dan mencegah penipuan.

Di Bagian 3, kami mendemonstrasikan cara menerapkan solusi di Amazon Fraud Detector.

Tentang penulis

Anup Ravindranath adalah Arsitek Solusi Senior di Amazon Web Services (AWS) yang berbasis di Toronto, Kanada, bekerja dengan organisasi Layanan Keuangan. Dia membantu pelanggan mengubah bisnis mereka dan berinovasi di cloud.

Latih dan host model visi komputer untuk deteksi gangguan di Amazon SageMaker: Bagian 2 | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai. Vinnie Saini adalah Arsitek Solusi Senior di Amazon Web Services (AWS) yang berbasis di Toronto, Kanada. Dia telah membantu pelanggan Layanan Keuangan bertransformasi di cloud, dengan solusi berbasis AI dan ML yang diletakkan di atas pilar dasar Keunggulan Arsitektur yang kuat.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/train-and-host-a-computer-vision-model-for-tampering-detection-on-amazon-sagemaker-part-2/

Stempel Waktu: Januari 31, 2024

Stempel Waktu: Agustus 25, 2022

Diterbitkan Ulang Oleh Plato

Cari jawaban secara akurat menggunakan Amazon Kendra S3 Connector dengan dukungan VPC

Gunakan pembelajaran mesin tanpa menulis satu baris kode pun dengan Amazon SageMaker Canvas | Layanan Web Amazon

Cara menyunting data PII dalam transkrip percakapan

Mengumumkan peluncuran fitur salinan model untuk Label Kustom Amazon Rekognition

Sorot teks saat diucapkan menggunakan Amazon Polly | Layanan Web Amazon

Wawasan dan tema yang dapat ditindaklanjuti berdasarkan AI/ML untuk penjual pihak ketiga Amazon menggunakan AWS

Deteksi transaksi penipuan menggunakan pembelajaran mesin dengan Amazon SageMaker

Aktifkan CI/CD dari titik akhir Amazon SageMaker multi-Wilayah

Bangun alur kerja terjemahan dokumen multibahasa dengan penyesuaian khusus domain dan bahasa tertentu

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun