Amazon SageMaker'da Kurcalama Tespiti İçin Bilgisayarlı Görme Modelini Eğitin ve Barındırın: Bölüm 2

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

içinde İlk bölümde Bu üç bölümlük seride, ipotek sigortalama kullanım senaryosu için AWS AI ve makine öğrenimi (ML) hizmetlerini kullanarak belgelerde tahrifat ve dolandırıcılık tespitini geniş ölçekte nasıl otomatikleştirebileceğinizi gösteren bir çözüm sunduk.

Bu yazıda, ipotek sigortalamasında sahte görüntüleri tespit etmek ve vurgulamak için derin öğrenmeye dayalı bir bilgisayarlı görüntü modeli geliştirmeye yönelik bir yaklaşım sunuyoruz. Derin öğrenme ağlarını oluşturma, eğitme ve dağıtma konusunda rehberlik sağlıyoruz Amazon Adaçayı Yapıcı.

Bölüm 3'te çözümün nasıl uygulanacağını gösteriyoruz. Amazon Sahtekarlık Dedektörü.

Çözüme genel bakış

İpotek sigortalamasında belge tahrifatını tespit etme hedefini karşılamak amacıyla, görüntü sahteciliği tespit çözümümüz için SageMaker'da barındırılan bir bilgisayarlı görme modeli kullanıyoruz. Bu model girdi olarak bir test görüntüsü alır ve çıktı olarak sahteciliğin olasılık tahminini üretir. Ağ mimarisi aşağıdaki diyagramda gösterildiği gibidir.

Kurcalama tespit modeli mimarisi

Görüntü sahteciliği temel olarak dört tekniği içerir: birleştirme, kopyala-taşı, kaldır ve geliştir. Sahteciliğin özelliklerine bağlı olarak, tespit ve lokalizasyonun temeli olarak farklı ipuçları kullanılabilir. Bu ipuçları arasında JPEG sıkıştırma bozuklukları, kenar tutarsızlıkları, gürültü modelleri, renk tutarlılığı, görsel benzerlik, EXIF tutarlılığı ve kamera modeli yer alır.

Görüntü sahteciliği tespitinin geniş alanı göz önüne alındığında, sahteciliği tespit etmek için açıklayıcı bir yöntem olarak Hata Düzeyi Analizi (ELA) algoritmasını kullanıyoruz. Bu yazı için ELA tekniğini aşağıdaki nedenlerden dolayı seçtik:

Uygulaması daha hızlıdır ve görüntülere yapılan müdahaleleri kolayca yakalayabilir.
Bir görüntünün farklı bölümlerinin sıkıştırma seviyelerini analiz ederek çalışır. Bu, izinsiz müdahaleye işaret edebilecek tutarsızlıkları tespit etmesine olanak tanır; örneğin, bir alan farklı bir sıkıştırma düzeyinde kaydedilen başka bir görüntüden kopyalanıp yapıştırılmışsa.
Çıplak gözle fark edilmesi zor olabilecek daha hafif veya kusursuz müdahaleleri tespit etmede iyidir. Bir görüntüde yapılan küçük değişiklikler bile tespit edilebilir sıkıştırma anormalliklerine neden olabilir.
Karşılaştırma için orijinal, değiştirilmemiş görüntünün bulunmasına dayanmaz. ELA, yalnızca sorgulanan görüntünün içindeki kurcalama işaretlerini tespit edebilir. Diğer teknikler genellikle karşılaştırılmak üzere değiştirilmemiş orijinali gerektirir.
Yalnızca dijital görüntü verilerindeki sıkıştırma yapaylıklarının analizine dayanan hafif bir tekniktir. Özel donanıma veya adli tıp uzmanlığına bağlı değildir. Bu, ELA'yı ilk geçiş analiz aracı olarak erişilebilir kılar.
Çıkış ELA görüntüsü, sıkıştırma seviyelerindeki farklılıkları açıkça vurgulayabilir ve kurcalanmış alanları gözle görülür şekilde belirgin hale getirebilir. Bu, uzman olmayan birinin bile olası manipülasyon işaretlerini fark etmesine olanak tanır.
Birçok görüntü türünde (JPEG, PNG ve GIF gibi) çalışır ve analiz edilmesi için yalnızca görüntünün kendisini gerektirir. Diğer adli tıp teknikleri, formatlar veya orijinal görüntü gereksinimleri açısından daha kısıtlı olabilir.

Ancak, giriş belgelerinin (JPEG, PNG, GIF, TIFF, PDF) bir kombinasyonuna sahip olabileceğiniz gerçek dünya senaryolarında, ELA'yı aşağıdakiler gibi diğer çeşitli yöntemlerle birlikte kullanmanızı öneririz: kenarlardaki tutarsızlıkları tespit etmek, gürültü modelleri, renk bütünlüğü, EXIF veri tutarlılığı, kamera modeli tanımlama, ve yazı tipi bütünlüğü. Bu gönderinin kodunu ek sahtecilik tespit teknikleriyle güncellemeyi amaçlıyoruz.

ELA'nın temel varsayımı, giriş görüntülerinin kayıplı sıkıştırmasıyla bilinen JPEG formatında olduğunu varsayar. Bununla birlikte, giriş görüntüleri orijinal olarak kayıpsız bir formatta (PNG, GIF veya BMP gibi) olsa ve daha sonra kurcalama işlemi sırasında JPEG'e dönüştürülse bile yöntem yine de etkili olabilir. ELA, orijinal kayıpsız formatlara uygulandığında, genellikle herhangi bir bozulma olmadan tutarlı görüntü kalitesi gösterir ve değişen alanların tam olarak belirlenmesini zorlaştırır. JPEG görüntülerde beklenen norm, resmin tamamının benzer sıkıştırma seviyeleri sergilemesidir. Bununla birlikte, görüntüdeki belirli bir bölüm önemli ölçüde farklı bir hata düzeyi gösteriyorsa, bu genellikle dijital bir değişiklik yapıldığı anlamına gelir.

ELA, JPEG sıkıştırma oranındaki farklılıkları vurgular. Tek tip renklendirmeye sahip bölgeler muhtemelen daha düşük bir ELA sonucuna sahip olacaktır (örneğin, yüksek kontrastlı kenarlara kıyasla daha koyu bir renk). Kurcalama veya değişiklik tespit etmek için aranacak şeyler aşağıdakileri içerir:

ELA sonucunda benzer kenarlar benzer parlaklığa sahip olmalıdır. Tüm yüksek kontrastlı kenarlar birbirine benzer görünmeli ve tüm düşük kontrastlı kenarlar da benzer görünmelidir. Orijinal bir fotoğrafta düşük kontrastlı kenarlar neredeyse yüksek kontrastlı kenarlar kadar parlak olmalıdır.
Benzer dokular ELA kapsamında benzer renklere sahip olmalıdır. Basketbol topunun yakın çekimi gibi daha fazla yüzey detayına sahip alanlar muhtemelen pürüzsüz bir yüzeye göre daha yüksek bir ELA sonucuna sahip olacaktır.
Yüzeyin gerçek rengi ne olursa olsun, tüm düz yüzeyler ELA altında yaklaşık olarak aynı renge sahip olmalıdır.

JPEG görüntüleri kayıplı bir sıkıştırma sistemi kullanır. Görüntünün her yeniden kodlanması (yeniden kaydedilmesi), görüntüye daha fazla kalite kaybı ekler. Spesifik olarak, JPEG algoritması 8×8 piksellik bir ızgara üzerinde çalışır. Her 8×8 kare bağımsız olarak sıkıştırılır. Görüntü tamamen değiştirilmemişse, 8×8 karelerin tümü benzer hata potansiyeline sahip olmalıdır. Görüntü değiştirilmez ve yeniden kaydedilirse, her karenin yaklaşık olarak aynı oranda bozulması gerekir.

ELA, görüntüyü belirtilen JPEG kalite düzeyinde kaydeder. Bu yeniden kaydetme, görüntünün tamamında bilinen miktarda hataya neden olur. Yeniden kaydedilen görüntü daha sonra orijinal görüntüyle karşılaştırılır. Bir görüntü değiştirilirse, değişiklikle dokunulan her 8×8 kare, görüntünün geri kalanından daha yüksek bir hata potansiyeline sahip olmalıdır.

ELA'nın sonuçları doğrudan görüntü kalitesine bağlıdır. Bir şey eklenip eklenmediğini bilmek isteyebilirsiniz, ancak resim birden çok kez kopyalanırsa ELA yalnızca yeniden kaydetmelerin tespit edilmesine izin verebilir. Resmin en kaliteli versiyonunu bulmaya çalışın.

ELA, eğitim ve pratikle görüntü ölçeklendirmeyi, kaliteyi, kırpmayı ve yeniden kaydetme dönüşümlerini tanımlamayı da öğrenebilir. Örneğin, JPEG olmayan bir görüntü görünür ızgara çizgileri içeriyorsa (1x8 karelerde 8 piksel genişliğinde), bu, resmin JPEG olarak başlatıldığı ve JPEG olmayan formata (PNG gibi) dönüştürüldüğü anlamına gelir. Resmin bazı alanlarında ızgara çizgileri eksikse veya ızgara çizgileri kayıyorsa, bu, JPEG olmayan görüntüde bir ekleme veya çizilmiş kısım anlamına gelir.

Aşağıdaki bölümlerde, bilgisayarlı görme modelini yapılandırma, eğitme ve dağıtma adımlarını gösteriyoruz.

Önkoşullar

Bu gönderiyi takip etmek için aşağıdaki ön koşulları tamamlayın:

Bir AWS hesabınız olsun.
Kurmak Amazon SageMaker Stüdyosu. SageMaker Studio'yu varsayılan ön ayarları kullanarak hızlı bir şekilde başlatabilir ve hızlı bir başlatmayı kolaylaştırabilirsiniz. Daha fazla bilgi için bkz. Amazon SageMaker, bireysel kullanıcılar için Amazon SageMaker Studio kurulumunu basitleştirir.
SageMaker Studio'yu açın ve bir sistem terminali başlatın.
Terminalde aşağıdaki komutu çalıştırın:
git clone https://github.com/aws-samples/document-tampering-detection.git
SageMaker Studio'yu bir kullanıcı ve dizüstü bilgisayar ortamı yapılandırmaları için çalıştırmanın toplam maliyeti saat başına 7.314 USD'dir.

Model eğitim not defterini ayarlama

Eğitim not defterinizi ayarlamak için aşağıdaki adımları tamamlayın:

Açın tampering_detection_training.ipynb belge kurcalama algılama dizininden dosya.
Dizüstü bilgisayar ortamını TensorFlow 2.6 Python 3.8 CPU veya GPU Optimized görüntüsüyle ayarlayın.
GPU için optimize edilmiş bulut sunucularını seçerken, AWS hesabınızdaki GPU bulut sunucuları için yetersiz kullanılabilirlik sorunuyla karşılaşabilir veya kota sınırına ulaşabilirsiniz. Kotayı artırmak için Hizmet Kotaları konsolunu ziyaret edin ve ihtiyacınız olan belirli bulut sunucusu tipine ilişkin hizmet sınırını artırın. Bu gibi durumlarda CPU için optimize edilmiş bir dizüstü bilgisayar ortamı da kullanabilirsiniz.
İçin çekirdek, seçmek Python3.
İçin Örnek türü, seçmek ml.m5d.24xlarge veya başka herhangi bir büyük örnek.

Modelin eğitim süresini azaltmak için daha büyük bir örnek türü seçtik. ml.m5d.24xlarge dizüstü bilgisayar ortamıyla saat başına maliyet 7.258 USD'dir.

Eğitim not defterini çalıştırın

Not defterindeki her hücreyi çalıştır tampering_detection_training.ipynb sırayla. Aşağıdaki bölümlerde bazı hücreleri daha ayrıntılı olarak ele alacağız.

Veri kümesini orijinal ve değiştirilmiş görüntülerin bir listesiyle hazırlayın

Not defterinde aşağıdaki hücreyi çalıştırmadan önce, özel iş gereksinimlerinize göre orijinal ve değiştirilmiş belgelerden oluşan bir veri kümesi hazırlayın. Bu yazı için, tahrif edilmiş maaş bordroları ve banka ekstrelerinden oluşan örnek bir veri seti kullanıyoruz. Veri seti, görseller dizininde mevcuttur. GitHub deposu.

Veri kümesini hazırlayın

Dizüstü bilgisayar, orijinal ve üzerinde oynanmış görüntüleri okur. images/training dizin.

Eğitim için veri kümesi, iki sütunlu bir CSV dosyası kullanılarak oluşturulur: görüntü dosyasının yolu ve görüntünün etiketi (orijinal görüntü için 0 ve tahrif edilmiş görüntü için 1).

Etiket veri kümesi

Her eğitim görüntüsünün ELA sonuçlarını oluşturarak veri kümesini işleyin

Bu adımda, giriş eğitim görüntüsünün ELA sonucunu (%90 kalitede) oluşturuyoruz. İşlev convert_to_ela_image iki parametre alır: bir görüntü dosyasının yolu olan yol ve JPEG sıkıştırması için kalite parametresini temsil eden kalite. İşlev aşağıdaki adımları gerçekleştirir:

Görüntüyü RGB formatına dönüştürün ve görüntüyü tempresaved.jpg adı altında belirtilen kalitede bir JPEG dosyası olarak yeniden kaydedin.
Orijinal ve yeniden kaydedilen görüntüler arasındaki piksel değerleri arasındaki maksimum farkı belirlemek için orijinal görüntü ile yeniden kaydedilen JPEG görüntüsü (ELA) arasındaki farkı hesaplayın.
ELA görüntüsünün parlaklığını ayarlamak için maksimum farkı temel alan bir ölçek faktörü hesaplayın.
Hesaplanan ölçek faktörünü kullanarak ELA görüntüsünün parlaklığını artırın.
ELA sonucunu 128x128x3 olarak yeniden boyutlandırın; burada 3, eğitim için giriş boyutunu küçültecek kanal sayısını temsil eder.
ELA görüntüsünü döndürün.

JPEG gibi kayıplı görüntü formatlarında, ilk kaydetme işlemi önemli ölçüde renk kaybına neden olur. Bununla birlikte, görüntü yüklendiğinde ve daha sonra aynı kayıplı formatta yeniden kodlandığında, genellikle daha az renk bozulması meydana gelir. ELA sonuçları, yeniden kaydetme sonrasında renk bozulmasına en duyarlı görüntü alanlarını vurgular. Genel olarak, görüntünün geri kalanıyla karşılaştırıldığında bozulma potansiyeli daha yüksek olan bölgelerde değişiklikler belirgin şekilde ortaya çıkar.

Daha sonra görüntüler eğitim için bir NumPy dizisine işlenir. Daha sonra girdi veri kümesini rastgele olarak eğitim ve test veya doğrulama verilerine (80/20) böleriz. Bu hücreleri çalıştırırken herhangi bir uyarıyı göz ardı edebilirsiniz.

Eğitim için ELA'ya dönüştürün

Veri kümesinin boyutuna bağlı olarak bu hücrelerin çalıştırılmasının tamamlanması zaman alabilir. Bu depoda sunduğumuz örnek veri kümesi için bu işlem 5-10 dakika sürebilir.

CNN modelini yapılandırma

Bu adımda, küçük evrişimli filtrelerle VGG ağının minimal bir versiyonunu oluşturuyoruz. VGG-16, 13 evrişimli katman ve üç tam bağlantılı katmandan oluşur. Aşağıdaki ekran görüntüsü Evrişimli Sinir Ağı (CNN) modelimizin mimarisini göstermektedir.

Tensorflow model mimarisi

Aşağıdaki yapılandırmalara dikkat edin:

Giriş – Model 128x128x3 görüntü giriş boyutunu almaktadır.
Evrişimli katmanlar – Evrişimli katmanlar, yukarı/aşağı ve sol/sağ'ı yakalayan mümkün olan en küçük boyut olan minimum alıcı alanı (3x3) kullanır. Bunu, eğitim süresini azaltan düzeltilmiş doğrusal birim (ReLU) aktivasyon fonksiyonu takip eder. Bu, pozitif olması durumunda girdiyi verecek doğrusal bir fonksiyondur; aksi halde çıktı sıfırdır. Evrişim adımı, evrişimden sonra uzamsal çözünürlüğün korunmasını sağlamak için varsayılanda (1 piksel) sabitlenir (adım, giriş matrisi üzerindeki piksel kaymalarının sayısıdır).
Tamamen bağlantılı katmanlar – Ağın tamamen bağlantılı iki katmanı vardır. İlk yoğun katman ReLU aktivasyonunu kullanır ve ikincisi görüntüyü orijinal veya tahrif edilmiş olarak sınıflandırmak için softmax'ı kullanır.

Bu hücreleri çalıştırırken herhangi bir uyarıyı göz ardı edebilirsiniz.

Model yapıtlarını kaydedin

Eğitilen modeli benzersiz bir dosya adıyla (örneğin geçerli tarih ve saate göre) model adlı bir dizine kaydedin.

Tensorflow modeli yapıtlarını kaydedin

Model, Keras formatında uzantıyla kaydedilir. .keras. Ayrıca model yapıtlarını, serileştirilmiş imzaları ve bunları çalıştırmak için gereken durumu (bu yazının ilerleyen bölümlerinde tartışacağımız) bir SageMaker çalışma zamanına dağıtılacak değişken değerleri ve sözcükleri içeren 1 adlı bir dizin olarak kaydediyoruz.

Model performansını ölçün

Aşağıdaki kayıp eğrisi, modelin eğitim dönemleri (yinelemeler) boyunca kaybının ilerlemesini gösterir.

model doğruluk grafiği

Kayıp fonksiyonu, modelin tahminlerinin gerçek hedeflerle ne kadar iyi eşleştiğini ölçer. Daha düşük değerler, tahminler ile gerçek değerler arasında daha iyi bir uyum olduğunu gösterir. Dönemler boyunca kaybın azalması, modelin iyileştiği anlamına gelir. Doğruluk eğrisi, modelin eğitim dönemleri üzerindeki doğruluğunu gösterir. Doğruluk, doğru tahminlerin toplam tahmin sayısına oranıdır. Daha yüksek doğruluk, daha iyi performans gösteren bir modele işaret eder. Tipik olarak, model kalıpları öğrendikçe ve tahmin yeteneğini geliştirdikçe doğruluk eğitim sırasında artar. Bunlar, modelin aşırı uyum (eğitim verilerinde iyi performans sergiliyor, ancak görünmeyen verilerde zayıf performans) veya yetersiz uyum (eğitim verilerinden yeterince öğrenmeme) olup olmadığını belirlemenize yardımcı olacaktır.

Aşağıdaki karışıklık matrisi, modelin pozitif (sahte görüntü, değer 1 olarak temsil edilir) ve negatif (kurcalanmamış görüntü, değer 0 olarak temsil edilir) sınıfları arasında ne kadar iyi ayrım yaptığını görsel olarak temsil eder.

Karışıklık matrisi grafiği

Model eğitiminin ardından bir sonraki adımımız bilgisayarlı görme modelini API olarak dağıtmayı içerir. Bu API, sigortacılık iş akışının bir bileşeni olarak iş uygulamalarına entegre edilecektir. Bunu başarmak için tümüyle yönetilen bir hizmet olan Amazon SageMaker Inference'ı kullanıyoruz. Bu hizmet, MLOps araçlarıyla sorunsuz bir şekilde bütünleşerek ölçeklenebilir model dağıtımına, uygun maliyetli çıkarımlara, üretimde gelişmiş model yönetimine ve azaltılmış operasyonel karmaşıklığa olanak tanır. Bu yazıda modeli gerçek zamanlı bir çıkarım uç noktası olarak konuşlandırıyoruz. Ancak iş uygulamalarınızın iş akışına bağlı olarak model dağıtımının toplu işleme, eşzamansız işleme veya sunucusuz dağıtım mimarisi aracılığıyla da özelleştirilebileceğini unutmamak önemlidir.

Model dağıtım not defterini ayarlama

Model dağıtım not defterinizi ayarlamak için aşağıdaki adımları tamamlayın:

Açın tampering_detection_model_deploy.ipynb belge kurcalama tespiti dizinindeki dosya.
Veri Bilimi 3.0 görüntüsüyle dizüstü bilgisayar ortamını kurun.
İçin çekirdek, seçmek Python3.
İçin Örnek türü, seçmek ml.t3.orta.

ml.t3.medium dizüstü bilgisayar ortamıyla saat başına maliyet 0.056 USD'dir.

Tüm Amazon S3 eylemlerine izin vermek amacıyla SageMaker rolü için özel bir satır içi politika oluşturun

The AWS Kimlik ve Erişim Yönetimi SageMaker için (IAM) rolü şu formatta olacaktır: AmazonSageMaker- ExecutionRole-<random numbers>. Doğru rolü kullandığınızdan emin olun. Rol adı, SageMaker etki alanı yapılandırmalarındaki kullanıcı ayrıntıları altında bulunabilir.

Amazon SageMaker'da izinsiz müdahale tespiti için bir görüntü işleme modeli eğitin ve barındırın: Bölüm 2 | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Tüm kullanıcılara izin verecek bir satır içi politika içerecek şekilde IAM rolünü güncelleyin Amazon Basit Depolama Hizmeti (Amazon S3) eylemleri. Model yapıtlarını depolayacak S3 klasörlerinin oluşturulmasını ve silinmesini otomatikleştirmek için bu gerekli olacaktır. Erişimi belirli S3 klasörleriyle sınırlayabilirsiniz. IAM politikasında S3 grubu adı için joker karakter kullandığımızı unutmayın (tamperingdetection*).

Amazon SageMaker'da izinsiz müdahale tespiti için bir görüntü işleme modeli eğitin ve barındırın: Bölüm 2 | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Dağıtım not defterini çalıştırın

Not defterindeki her hücreyi çalıştır tampering_detection_model_deploy.ipynb sırayla. Aşağıdaki bölümlerde bazı hücreleri daha ayrıntılı olarak ele alacağız.

S3 grubu oluşturma

Bir S3 klasörü oluşturmak için hücreyi çalıştırın. Kovaya isim verilecek tamperingdetection<current date time> ve SageMaker Studio ortamınızla aynı AWS Bölgesinde.

Amazon S3 paketi oluşturun

Model yapıt arşivini oluşturun ve Amazon S3'e yükleyin

Model yapıtlarından bir tar.gz dosyası oluşturun. Model yapıtlarını, serileştirilmiş imzaları ve SageMaker çalışma zamanına dağıtılacak değişken değerler ve sözlükler de dahil olmak üzere bunları çalıştırmak için gereken durumu içeren 1 adlı bir dizin olarak kaydettik. Ayrıca, adı verilen özel bir çıkarım dosyası da ekleyebilirsiniz. inference.py model yapıtındaki kod klasöründe. Özel çıkarım, giriş görüntüsünün ön işlenmesi ve son işlenmesi için kullanılabilir.

Model yapılarını Amazon S3'e yükleyin

SageMaker çıkarım uç noktası oluşturma

SageMaker çıkarımı uç noktası oluşturacak hücrenin tamamlanması birkaç dakika sürebilir.

Amazon SageMaker Inference uç noktası oluşturun

Çıkarım uç noktasını test edin

Bu fonksiyon check_image Bir görüntüyü ELA görüntüsü olarak önceden işler, çıkarım için SageMaker uç noktasına gönderir, modelin tahminlerini alıp işler ve sonuçları yazdırır. Model, tahminler sağlamak için giriş görüntüsünün bir NumPy dizisini bir ELA görüntüsü olarak alır. Tahminler, değiştirilmemiş bir görüntüyü temsil eden 0 ve sahte bir görüntüyü temsil eden 1 olarak çıktılanır.

Amazon SageMaker Inference uç noktasını test edin

Modeli, değiştirilmemiş bir maaş bordrosu görüntüsüyle çağıralım ve sonucu kontrol edelim.

Orijinal bir görüntüyü test edin

Model, sınıflandırmayı, değiştirilmemiş bir görüntüyü temsil eden 0 olarak verir.

Şimdi modeli değiştirilmiş bir maaş bordrosu görüntüsüyle çağıralım ve sonucu kontrol edelim.

Sahte bir görüntüyü test edin

Model, sahte bir görüntüyü temsil eden sınıflandırmayı 1 olarak verir.

Sınırlamalar

ELA, değişikliklerin tespit edilmesine yardımcı olmak için mükemmel bir araç olmasına rağmen, aşağıdakiler gibi bir takım sınırlamalar vardır:

JPEG bir ızgara üzerinde çalıştığından, tek bir piksel değişikliği veya küçük bir renk ayarı ELA'da fark edilebilir bir değişiklik yaratmayabilir.
ELA yalnızca hangi bölgelerin farklı sıkıştırma düzeylerine sahip olduğunu tanımlar. Daha düşük kaliteli bir görüntü, daha yüksek kaliteli bir resme eklenirse, düşük kaliteli görüntü daha koyu bir bölge olarak görünebilir.
Bir görüntüyü ölçeklemek, yeniden renklendirmek veya gürültü eklemek görüntünün tamamını değiştirerek daha yüksek hata düzeyi potansiyeli oluşturur.
Bir görüntü birden çok kez yeniden kaydedilirse, daha fazla yeniden kaydetmenin görüntüyü değiştirmediği tamamen minimum hata seviyesinde olabilir. Bu durumda ELA siyah bir görüntü döndürecektir ve bu algoritma kullanılarak hiçbir değişiklik tanımlanamaz.
Photoshop'ta, resmi kaydetmek gibi basit bir işlem dokuları ve kenarları otomatik olarak keskinleştirerek daha yüksek hata düzeyi potansiyeli yaratabilir. Bu yapı, kasıtlı değişikliği tanımlamaz; bir Adobe ürününün kullanıldığını belirtir. Teknik olarak ELA, Adobe'nin otomatik olarak bir değişiklik yapması nedeniyle bir değişiklik olarak görünmektedir, ancak değişikliğin kullanıcı tarafından kasıtlı olarak yapılmış olması gerekmemektedir.

Daha geniş bir yelpazedeki görüntü manipülasyon vakalarını tespit etmek için ELA'yı blogda daha önce tartışılan diğer tekniklerle birlikte kullanmanızı öneririz. ELA, özellikle CNN tabanlı bir modelin eğitimi zorlaştığında, görüntü eşitsizliklerini görsel olarak incelemek için bağımsız bir araç olarak da hizmet verebilir.

Temizlemek

Bu çözümün parçası olarak oluşturduğunuz kaynakları kaldırmak için aşağıdaki adımları tamamlayın:

Dizüstü bilgisayar hücrelerini altında çalıştırın Temizlemek bölüm. Bu, aşağıdakileri silecektir:
1. SageMaker çıkarım uç noktası – Çıkarım uç noktası adı şöyle olacaktır: tamperingdetection-<datetime>.
2. S3 klasöründeki ve S3 klasöründeki nesneler – Paket adı şu şekilde olacaktır: tamperingdetection<datetime>.
kapatmak SageMaker Studio dizüstü bilgisayar kaynakları.

Sonuç

Bu yazıda, derin öğrenmeyi ve SageMaker'ı kullanarak belgelerde tahrifat ve sahtekarlığı tespit etmek için uçtan uca bir çözüm sunduk. Görüntüleri önceden işlemek ve manipülasyona işaret edebilecek sıkıştırma seviyelerindeki tutarsızlıkları belirlemek için ELA'yı kullandık. Daha sonra görüntüleri orijinal veya tahrif edilmiş olarak sınıflandırmak için bu işlenmiş veri kümesi üzerinde bir CNN modeli eğittik.

Model, iş gereksinimlerinize uygun bir veri kümesiyle (sahte ve orijinal) %95'in üzerinde doğrulukla güçlü bir performans elde edebilir. Bu, ödeme makbuzları ve banka ekstreleri gibi sahte belgeleri güvenilir bir şekilde tespit edebildiğini gösteriyor. Eğitilen model, uygun ölçekte düşük gecikme süreli çıkarımı mümkün kılmak için bir SageMaker uç noktasına dağıtılır. Bu çözümü ipotek iş akışlarına entegre ederek kurumlar, daha fazla dolandırıcılık soruşturması için şüpheli belgeleri otomatik olarak işaretleyebilir.

Güçlü olmasına rağmen, ELA'nın daha ince manipülasyonların belirli türlerini tanımlamada bazı sınırlamaları vardır. Sonraki adımlarda, eğitime ek adli tekniklerin dahil edilmesi ve daha büyük, daha çeşitli veri kümelerinin kullanılmasıyla model geliştirilebilir. Genel olarak bu çözüm, verimliliği artıran, riski azaltan ve dolandırıcılığı önleyen etkili çözümler oluşturmak için derin öğrenmeyi ve AWS hizmetlerini nasıl kullanabileceğinizi gösterir.

3. Bölümde çözümün Amazon Fraud Detector'da nasıl uygulanacağını gösteriyoruz.

yazarlar hakkında

Anup Ravindranath Toronto, Kanada merkezli Amazon Web Services'te (AWS) Finansal Hizmetler kuruluşlarıyla birlikte çalışan bir Kıdemli Çözüm Mimarıdır. Müşterilerin işlerini dönüştürmelerine ve bulutta yenilik yapmalarına yardımcı oluyor.

Amazon SageMaker'da izinsiz müdahale tespiti için bir görüntü işleme modeli eğitin ve barındırın: Bölüm 2 | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai. Vinnie Saini Toronto, Kanada merkezli Amazon Web Services'te (AWS) Kıdemli Çözüm Mimarıdır. Mimari Mükemmelliğin güçlü temel direkleri üzerine kurulu yapay zeka ve makine öğrenimi odaklı çözümlerle Finansal Hizmetler müşterilerinin bulutta dönüşmesine yardımcı oluyor.

SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
Kaynak: https://aws.amazon.com/blogs/machine-learning/train-and-host-a-computer-vision-model-for-tampering-detection-on-amazon-sagemaker-part-2/

Zaman Damgası: Ocak 31, 2024

Zaman Damgası: Haziran 7, 2023

Plato tarafından yeniden yayınlandı

AWS ile üretken yapay zekaya güvenli bir yaklaşım | Amazon Web Hizmetleri

Amazon Kendra SSS için sürüm kontrolünü otomatikleştirin ve uygulayın

Amazon Rekognition ve diğer içerik denetleme hizmetlerinde içerik denetlemeyi değerlendirmeye yönelik metrikler

Amazon SageMaker'da MLOps ile güçlü zaman serisi tahmini | Amazon Web Hizmetleri

Üretken yapay zeka ve Amazon SageMaker Canvas'ı kullanarak kodsuz veri hazırlığıyla güvenlik bulgularını daha hızlı analiz edin | Amazon Web Hizmetleri

Amazon SageMaker Autopilot artık zaman serisi verilerini destekliyor

İki aşamalı Amazon Rekognition Custom Labels modellerini kullanarak yüksek çözünürlüklü görüntülerde hata tespiti | Amazon Web Hizmetleri

Test Workbench ile Amazon Lex chatbot geliştirme yaşam döngüsünü hızlandırın | Amazon Web Hizmetleri

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap