Bugün, kişisel olarak tanımlanabilir bilgiler (PII) her yerdedir. Kişisel bilgiler e-postalarda, gevşek mesajlarda, videolarda, PDF'lerde vb. bulunur. Belirli bir kişiyi tanımlamak için kullanılabilecek her türlü veri veya bilgiyi ifade eder. PII doğası gereği hassastır ve isim, iletişim bilgileri, kimlik numaraları, finansal bilgiler, tıbbi bilgiler, biyometrik veriler, doğum tarihi vb. gibi çeşitli türde kişisel verileri içerir.
Kişisel bilgilerin bulunması ve düzenlenmesi; gizliliğin korunması, veri güvenliğinin sağlanması, yasa ve düzenlemelere uyumun yanı sıra müşteriler ve paydaşlar nezdinde güvenin sürdürülmesi açısından çok önemlidir. Modern veri yönetimi ve siber güvenlik uygulamalarının kritik bir bileşenidir. Ancak elektronik veri bataklığında PII'yi bulmak bir kuruluş için zorluklar yaratabilir. Bu zorluklar, verilerin büyük hacmi ve çeşitliliği, veri parçalanması, şifreleme, veri paylaşımı, dinamik içerik, yanlış pozitifler ve negatifler, bağlamsal anlayış, yasal karmaşıklıklar, kaynak kısıtlamaları, gelişen veriler, kullanıcı tarafından oluşturulan içerik ve uyarlanabilir tehditler nedeniyle ortaya çıkmaktadır. Ancak PII'nin doğru bir şekilde tespit edilememesi ve düzeltilememesi kuruluşlar için ciddi sonuçlara yol açabilir. Bunun sonuçları arasında yasal cezalar, davalar, itibar kaybı, veri ihlali maliyetleri, düzenleyici soruşturmalar, operasyonel aksaklıklar, güven erozyonu ve yaptırımlar yer alabilir.
Hukuk sisteminde keşif, herhangi bir tarafın davadaki iddiaları veya savunmalarıyla ilgili imtiyazlı olmayan konuları elde etme hakkını ve üretme yükümlülüğünü düzenleyen yasal süreçtir. eKeşif olarak da bilinen elektronik keşif, bir dava veya soruşturmada üretim talebine yanıt olarak elektronik olarak depolanan bilgilerin (ESI) tanımlanmasının, toplanmasının ve üretilmesinin elektronik yönüdür. Yasal alanda, bir dava veya soruşturma sırasında genellikle ESI'nin tanımlanması, toplanması ve üretilmesi gerekir. Kuruluşlar mahkeme celbi yanıtlarına ilişkin davalar için eKeşif ile uğraşıyorsa, muhtemelen kişisel bilgilerin yanlışlıkla paylaşılmasından endişe duymaktadırlar. Devlet kurumları, okul bölgeleri ve hukuk uzmanları da dahil olmak üzere birçok kuruluş, PII'yi geniş ölçekte doğru bir şekilde tespit etme ve düzenleme zorluğuyla karşı karşıyadır. Özellikle bir hükümet grubunun parçasıysalar, Bilgi Edinme Özgürlüğü Yasası ve Dijital Hizmetler Yasası aracılığıyla PII'nin düzenlenmesi, bireysel gizliliğin korunması, veri koruma yasalarına uygunluğun sağlanması, kimlik hırsızlığının önlenmesi ve devlet ve dijital hizmetlerde güven ve şeffaflığın sürdürülmesi açısından çok önemlidir. Hizmetler. Yasal ve güvenlik risklerini azaltırken şeffaflık ve gizlilik arasında bir denge kurar.
Kuruluşlar, anahtar kelime aramaları, kalıp eşleştirme, veri kaybını önleme araçları, makine öğrenimi (ML), meta veri analizi, veri sınıflandırma yazılımı, optik karakter tanıma (OCR), belge parmak izi alma ve şifreleme gibi yöntemleri kullanarak PII'yi arayabilir.
Artık Reveal'in yapay zeka destekli eDiscovery platformunun bir parçası. Mantıksal hukuk profesyonellerinin bir dava veya soruşturma kapsamında elektronik belgeleri işlemesine, incelemesine, etiketlemesine ve üretmesine olanak tanıyan bir self-servis çözümdür. Bu benzersiz teklif, avukatların eldeki konuyla ilgili değerli bilgileri keşfetmesine yardımcı olurken maliyetleri azaltır, çözümleri hızlandırır ve riskleri azaltır.
Bu yazıda Reveal uzmanları, bu yöntemi nasıl kullandıklarını sergiliyor Amazon Kavramak Bireysel PII parçalarını tespit etmek ve düzenlemek için belge işleme hattında. Amazon Comprehend, bir belgenin veya metnin içeriği hakkında bilgi alabilen, tam olarak yönetilen ve sürekli olarak eğitilen bir doğal dil işleme (NLP) hizmetidir. Müşteri e-postalarında, destek bildirimlerinde, ürün incelemelerinde, sosyal medyada ve daha fazlasındaki kişisel bilgileri tespit etmek ve düzenlemek için Amazon Comprehend ML özelliklerini kullanabilirsiniz.
Çözüme genel bakış
Mühendislik ekibinin genel hedefi, müşterileri için milyonlarca yasal belgeden PII'yi tespit etmek ve çıkarmaktır. Reveal'in Logikcull çözümünü kullanan mühendislik ekibi, ilk geçişte PII tespiti ve ikinci geçişte PII tespiti ve redaksiyonu olmak üzere iki süreç uyguladı. Bu iki geçişli çözüm, aşağıdakilerin kullanılmasıyla mümkün oldu: İçerirPiiVarlıklar ve DetectPiiEntities API'leri.
İlk geçişte PII tespiti
İlk geçişte PII tespitinin amacı, PII içerebilecek belgeleri bulmaktır.
- Kullanıcılar, PII tespiti ve redaksiyonu gerçekleştirmek istedikleri dosyaları Logikcull'un genel web sitesi aracılığıyla bir proje klasörüne yüklerler. Bu dosyalar ofis belgeleri, .pdf dosyaları, e-postalar veya desteklenen tüm dosya türlerini içeren bir .zip dosyası biçiminde olabilir.
- Logikcull bu proje klasörlerini güvenli bir şekilde bir Amazon Basit Depolama Hizmeti (Amazon S3) Kova. Dosyalar daha sonra Logikcull'un üzerinde barındırılan devasa paralel işleme hattından geçer. Amazon Elastik Bilgi İşlem Bulutu (Amazon EC2)dosyaları işleyen, meta verileri çıkaran ve veri incelemesi için metin biçiminde yapılar oluşturan. Logikcull'un işleme hattı, ses ve video dosyaları da dahil olmak üzere çok çeşitli form ve dosyalar için metin çıkarmayı destekler.
- Dosyalar metin formatında kullanıma sunulduktan sonra Logikcull, giriş metnini İngilizce olan dil modeliyle birlikte Amazon Comprehend aracılığıyla iletir. İçerirPiiVarlıklar API çağrısı. Amazon EC2'de barındırılan işleme hattı sunucuları, Amazon Comprehend'in
ContainsPiiEntities
İstek parametrelerini metin ve dil kodu olarak ileterek API çağrısı.ContainsPiiEntities
API çağrısı, giriş metnini PII'nin varlığı açısından analiz eder ve ad, adres, banka hesap numarası veya telefon numarası gibi tanımlanan PII varlık türlerinin etiketlerini döndürür. API yanıtı aynı zamanda Amazon Comprehend'in algılama doğruluğuna atadığı güven düzeyini gösteren bir güven puanı da içerir. Güven puanı 0 ile 1 arasında bir değere sahiptir; 1, yüzde 100 güveni ifade eder. Logikcull, belgelere PII Algılandı etiketini atamak için bu güven puanını kullanır. Logikcull bu etiketi yalnızca güven puanı 0.75'in üzerinde olan belgelere atar. - PII Algılanan etiketli belgeler, kullanıcılarının PII varlıkları içeren belgeleri hızlı bir şekilde tanımlaması için Logikcull'un arama dizini kümesine beslenir.
İkinci geçişte PII tespiti ve düzenlenmesi
İlk geçişte PII tespit süreci, hangi belgelerin PII bilgilerini içerdiğini belirleyerek veri kümesinin kapsamını daraltır. Bu, PII tespit sürecini hızlandırır ve aynı zamanda genel maliyeti azaltır. İkinci geçişte PII tespitinin amacı, bireysel PII örneklerini tanımlamak ve bunları ilk geçişte etiketli belgelerden çıkarmaktır.
- Kullanıcılar, Logikcull'un gelişmiş arama filtreleri özelliğini kullanarak, Logikcull'un PII içeren web sitesi aracılığıyla belgeleri arar.
- İstek, Logikcull'un barındırılan uygulama sunucuları tarafından işlenir. Amazon EC2 ve sunucular belgeleri bulmak için arama indeksi kümesiyle iletişim kurar.
- Logikcull uygulama sunucuları, bireysel PII örneklerini aşağıdakileri yaparak tanımlayabilir: DetectPiiEntities API çağrısı. Sunucular, giriş belgelerinin metnini ve dilini ileterek API çağrısını yapar.
DetectPiiEntities
API eylemi, PII içeren varlıklar için giriş metnini inceler. Yanıt, her varlık için varlık türünü, varlık metninin nerede başladığını ve bittiğini ve Amazon Comprehend'in algılama konusunda sahip olduğu güven düzeyini sağlar. - Kullanıcılar daha sonra Logikcull'un web arayüzünü kullanarak düzenlemek istedikleri belirli varlıkları seçerler. Uygulama sunucusu bu istekleri Logikcull'un işleme hattına gönderir. Aşağıda Logikcull'un uygulamasına yüklenen PDF'nin ekran görüntüsü bulunmaktadır. Aşağıdaki ekran görüntüsünde ad, adres, telefon numarası, e-posta adresi vb. gibi farklı PII varlıklarının vurgulandığını görebilirsiniz.
- PII düzenlemesi, özel iş mantığı kullanılarak Logikcull'un işleme hattında güvenli bir şekilde uygulanır. Aşağıdaki ekran görüntüsünden, kullanıcıların belirli PII varlık türlerini veya düzenlemek istedikleri tüm PII varlık türlerini seçebildiklerini ve ardından tek bir düğmeyi tıklatarak tüm PII bilgilerini çıkarabildiklerini görebilirsiniz.
Sonuçlar
Bir Reveal teknolojisi olan Logikcull, şu anda her hafta 20 milyondan fazla belgeyi işliyor ve algılama kapsamını ContainsPiiEntities
API'yi kullanarak PII varlıklarının ayrı ayrı örneklerini müşterilerine gösterebilir. DetectPiiEntities
API.
"Amazon Comprehend sayesinde Logikcull, güçlü NLP yeteneklerini, özel oluşturulmuş bir çözümün gerektirdiği süreden çok daha kısa bir sürede hızla devreye alabildi."
– Steve Newhouse, Logikcull Ürün Başkan Yardımcısı.
Sonuç
Amazon Kavramak Reveal'in Logikcull teknolojisinin, Amazon Comprehend'i kullanarak nispeten düşük maliyetle büyük ölçekte PII tespitini çalıştırmasına olanak tanır. ContainsPiiEntities
API, milyonlarca belgenin ilk taramasını yapmak için kullanılır. DetectPiiEntities
API, binlerce belgenin ayrıntılı bir analizini yapmak ve belgelerindeki bireysel PII parçalarını tanımlamak için kullanılır.
tüm bir göz atın Amazon Anlamak özellikleri. Özellikleri deneyin ve bize geri bildiriminizi şu şekilde gönderin: AWS forumu Amazon Comprehend için veya her zamanki AWS destek kişileriniz aracılığıyla.
Yazarlar Hakkında
Aman Tiwari AWS'de Dünya Çapında Ticari Satış bölümünde çalışan bir Genel Çözüm Mimarıdır. Dijital Yerel İşletme segmentindeki müşterilerle birlikte çalışıyor ve AWS hizmetlerini kullanarak yenilikçi, dayanıklı ve uygun maliyetli çözümler tasarlamalarına yardımcı oluyor. Northeastern Üniversitesi'nden Telekomünikasyon Ağları alanında yüksek lisans derecesine sahiptir. İş dışında çim tenisi oynamaktan ve kitap okumaktan hoşlanıyor.
Jeff Newburn Logikcull – A Reveal Technology'de Veri Mühendisliği ekibine liderlik eden Kıdemli Yazılım Mühendisliği Yöneticisidir. Veri ambarları, görselleştirmeler, analizler ve makine öğrenimi de dahil olmak üzere şirketin veri girişimlerini denetler. Araç paylaşımından veri sistemlerine kadar alanlardaki geliştirme ve yönetim tecrübesiyle, parlak mühendislerden oluşan ekiplere ve heyecan verici ürünlere liderlik etmekten keyif alıyor.
Søren Sarışın Daugaard Logikcull – A Reveal Technology'de Veri Mühendisliği ekibinde Personel Mühendisidir. Logikcull ürününe yüksek oranda ölçeklenebilir yapay zeka ve makine öğrenimi çözümleri uygulayarak müşterilerimizin işlerini daha verimli ve daha yüksek hassasiyetle yapmalarını sağlıyor. Uzmanlığı veri boru hatlarını, web tabanlı sistemleri ve makine öğrenimi sistemlerini kapsamaktadır.
Kevin Lufkin Logikcull – A Reveal Technology'de Arama Mühendisliği ekibinde Kıdemli Yazılım Mühendisidir ve burada müşteriye yönelik ve aramayla ilgili özelliklerin geliştirilmesine odaklanmaktadır. UI/UX konusundaki kapsamlı uzmanlığı, ürün vizyonlarını hayata geçirmeye güçlü bir şekilde odaklanan tam kapsamlı web geliştirme geçmişiyle tamamlanmaktadır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoData.Network Dikey Üretken Yapay Zeka. Kendine güç ver. Buradan Erişin.
- PlatoAiStream. Web3 Zekası. Bilgi Genişletildi. Buradan Erişin.
- PlatoESG. karbon, temiz teknoloji, Enerji, Çevre, Güneş, Atık Yönetimi. Buradan Erişin.
- PlatoSağlık. Biyoteknoloji ve Klinik Araştırmalar Zekası. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/how-reveals-logikcull-used-amazon-comprehend-to-detect-and-redact-pii-from-legal-documents-at-scale/
- :vardır
- :dır-dir
- :Neresi
- $UP
- 1
- 10
- 100
- 11
- 14
- İNDİRİM
- 150
- 20
- 7
- 75
- a
- Yapabilmek
- Hakkımızda
- Hesap
- doğruluk
- tam olarak
- Hareket
- Action
- adaptif
- adres
- ileri
- ajansları
- AI
- AI destekli
- Türkiye
- veriyor
- boyunca
- Ayrıca
- Amazon
- Amazon Kavramak
- Amazon EC2
- Amazon Web Servisleri
- arasında
- an
- analiz
- analytics
- analizler
- ve
- herhangi
- api
- API'ler
- Uygulama
- uygulamaları
- uygulamalı
- ARE
- alanlar
- ortaya
- AS
- boy
- atanmış
- At
- ses
- mevcut
- AWS
- arka fon
- Bakiye
- Banka
- banka hesabı
- BE
- olmuştur
- altında
- arasında
- biyometrik
- doğum
- Kitaplar
- ihlal
- parlak
- Bringing
- iş
- fakat
- düğmesine tıklayın
- by
- çağrı
- CAN
- yetenekleri
- meydan okuma
- zorluklar
- karakter
- karakter tanıma
- iddia
- sınıflandırma
- tıklayın
- bulut
- Küme
- kod
- toplamak
- Toplama
- ticari
- Şirketin
- karmaşıklıklar
- uyma
- bileşen
- idrak
- hesaplamak
- ilgili
- güven
- Sonuçları
- kısıtlamaları
- UAF ile
- kontaklar
- içermek
- içeren
- içerik
- bağlamsal
- devamlı olarak
- Ücret
- uygun maliyetli
- maliyetler
- kritik
- çok önemli
- Şu anda
- görenek
- Sipariş üzerine yapılmış
- müşteri
- Müşteriler
- Siber güvenlik
- hasar
- veri
- veri ihlali
- Veri Kaybı
- veri yönetimi
- veri koruma
- veri güvenliği
- bilgi paylaşımı
- Tarih
- ilgili
- derece
- dağıtmak
- Dizayn
- detaylı
- belirlemek
- algılandı
- Bulma
- gelişen
- gelişme
- farklı
- dijital
- dijital hizmetler
- keşfetmek
- keşif
- ekran
- Bozulma
- do
- belge
- evraklar
- domain
- aşağı
- gereken
- sırasında
- dinamik
- her
- verimli biçimde
- ya
- Elektronik
- elektronik
- E-posta
- e-postalar
- etkinleştirme
- kapsamak
- şifreleme
- uçları
- mühendis
- Mühendislik
- Mühendisler
- İngilizce
- sağlanması
- kişiler
- varlık
- özellikle
- gerekli
- her yerde
- gelişen
- heyecan verici
- deneyim
- Uzmanlık
- uzmanlara göre
- kapsamlı, geniş
- çıkarmak
- çıkarma
- Hulasa
- Yüz
- karşı
- Başarısızlık
- yanlış
- Özellikler(Hazırlık aşamasında)
- Özellikler
- Fed
- geribesleme
- fileto
- dosyalar
- filtreler
- mali
- finansal bilgi
- bulmak
- bulma
- Parmak İzi
- Ad
- odak
- odaklanır
- takip etme
- şu
- İçin
- Airdrop Formu
- biçim
- formlar
- kesir
- parçalanma
- Freedom
- itibaren
- tamamen
- genel
- üretir
- Vermek
- gol
- yöneten
- Hükümet
- devlet kurumları
- grup
- el
- Var
- he
- yardımcı olur
- daha yüksek
- Vurgulanan
- büyük ölçüde
- onun
- tutar
- ev sahipliği yaptı
- Ne kadar
- Ancak
- HTML
- HTTPS
- Kimlik
- tespit
- belirlemek
- belirlenmesi
- Kimlik
- if
- uygulanan
- uygular
- in
- içerir
- Dahil olmak üzere
- indeks
- gösterir
- bireysel
- bilgi
- ilk
- girişimler
- yenilikçi
- giriş
- içeride
- kavrama
- arayüzey
- içine
- soruşturma
- IT
- ONUN
- jpg
- bilinen
- Etiketler
- dil
- büyük
- Yasalar
- Yasalar ve düzenlemeler
- dava
- Davalar
- öncülük etmek
- önemli
- öğrenme
- Yasal Şartlar
- seviye
- hayat
- sevmek
- Dava
- mantık
- Bakın
- kayıp
- Düşük
- makine
- makine öğrenme
- yapılmış
- Bakımı
- yapmak
- Yapımı
- yönetilen
- yönetim
- müdür
- çok
- kitlesel
- yüksek lisans
- uygun
- Mesele
- medya
- tıbbi
- mesajları
- Metadata
- yöntemleri
- olabilir
- milyon
- milyonlarca
- hafifletici
- riskleri azaltmak
- ML
- model
- Modern
- Daha
- isim
- yani
- dar
- yerli
- Doğal (Madenden)
- Doğal Dil İşleme
- Tabiat
- negatifler
- ağlar
- nlp
- Northeastern Üniversitesi
- numara
- sayılar
- yükümlülük
- elde etmek
- OCR
- of
- teklif
- Office
- sık sık
- on
- bir tek
- işletme
- optik karakter tanıma
- or
- kuruluşlar
- organizasyonlar
- bizim
- dışında
- tekrar
- tüm
- kapsayıcı
- Paralel
- parametreler
- Bölüm
- geçmek
- geçer
- Geçen
- model
- yüzde
- Yapmak
- kişisel
- kişisel bilgi
- telefon
- parçalar
- boru hattı
- platform
- Platon
- Plato Veri Zekası
- PlatoVeri
- oynama
- mümkün
- Çivi
- güçlü
- uygulamalar
- Hassas
- varlık
- mevcut
- önlenmesi
- Önleme
- gizlilik
- muhtemelen
- süreç
- Süreçler
- işleme
- üretmek
- üreten
- PLATFORM
- Ürün Yorumları
- üretim
- Ürünler
- profesyoneller
- proje
- koruyucu
- koruma
- sağlar
- halka açık
- hızla
- hızla
- Okuma
- tanıma
- azaltır
- azaltarak
- ifade eder
- yönetmelik
- düzenleyici
- ilgili
- Nispeten
- uygun
- ün
- talep
- isteklerinizi
- gereklidir
- esnek
- kaynak
- yanıt
- yanıtları
- İade
- açığa vurmak
- yorum
- Yorumları
- Binmek
- krallar gibi yaşamaya
- riskler
- koşmak
- koruma
- güvenli bir şekilde
- satış
- Yaptırımlar
- ölçeklenebilir
- ölçek
- taramak
- Okul
- kapsam
- Gol
- Ara
- aramalar
- İkinci
- Güvenli
- güvenlik
- güvenlik riskleri
- görmek
- bölüm
- Self servis
- göndermek
- gönderir
- kıdemli
- hassas
- sunucu
- Sunucular
- hizmet
- Hizmetler
- şiddetli
- paylaşımı
- vitrin
- Basit
- tek
- gevşek
- So
- Sosyal Medya
- sosyal medya
- Yazılım
- Yazılım Mühendisi
- yazılım Mühendisliği
- çözüm
- Çözümler
- gerginlik
- açıklıklı
- özel
- hızları
- Personel
- paydaşlar
- Steve
- hafızası
- saklı
- mağaza
- Grevler
- güçlü
- mahkeme çağrısı
- böyle
- destek
- destekli
- Destekler
- sistem
- Sistemler
- TAG
- takım
- takım
- Teknoloji
- telekomünikasyon
- metin
- o
- The
- hırsızlık
- ve bazı Asya
- Onları
- sonra
- Bunlar
- onlar
- Re-Tweet
- Binlerce
- tehditler
- İçinden
- bilet
- zaman
- için
- araçlar
- eğitilmiş
- Şeffaflık
- Güven
- denemek
- iki
- tip
- türleri
- anlayış
- benzersiz
- üniversite
- Yüklenen
- us
- kullanım
- Kullanılmış
- kullanıcılar
- kullanım
- kullanma
- olağan
- Değerli
- değer
- çeşitlilik
- çeşitli
- Geniş
- Video
- Videolar
- vizyonlar
- hacim
- vp
- istemek
- oldu
- ağ
- Web geliştirme
- web hizmetleri
- Web tabanlı
- Web sitesi
- hafta
- hangi
- süre
- geniş
- ile
- İş
- çalışma
- çalışır
- Dünya çapında
- olur
- Sen
- zefirnet
- zip