In Bölüm 1 Bu seride akıllı belge işlemeyi (IDP) ve IDP'nin sigorta sektöründe hasar işleme kullanım örneklerini nasıl hızlandırabileceğini tartıştık. Talep belgelerini destekleyici belgelerle birlikte doğru şekilde sınıflandırmak için AWS AI hizmetlerini nasıl kullanabileceğimizi tartıştık. Ayrıca bir sigorta hasar paketindeki formlar, tablolar veya fatura, makbuz veya kimlik belgeleri gibi özel belgeler gibi çeşitli türdeki belgelerin nasıl çıkarılacağını da tartıştık. Zaman alıcı, hataya açık, pahalı ve uygun ölçekte işlenmesi zor olan eski belge süreçlerindeki zorlukları ve IDP işlem hattınızı uygulamaya yardımcı olması için AWS AI hizmetlerini nasıl kullanabileceğinizi inceledik.
Bu yazıda, belge çıkarma, sorgulama ve zenginleştirmeye yönelik gelişmiş IDP özellikleri konusunda size yol göstereceğiz. Ayrıca, AWS Analytics ve görselleştirme hizmetlerini kullanarak içgörüler elde etmek için talep verilerinden çıkarılan yapılandırılmış bilgilerin nasıl daha fazla kullanılacağını da araştırıyoruz. IDP'den çıkarılan yapılandırılmış verilerin, AWS Analytics hizmetlerini kullanan sahte iddialara karşı nasıl yardımcı olabileceğini vurguluyoruz.
Çözüme genel bakış
Aşağıdaki şemada IDP'nin AWS AI hizmetlerini kullanması durumunda aşamalar gösterilmektedir. Bölüm 1'de IDP iş akışının ilk üç aşamasını tartıştık. Bu yazıda, çıkarma adımını ve IDP'nin AWS Analytics hizmetleriyle entegre edilmesini içeren geri kalan aşamaları genişleteceğiz.
Bu analiz hizmetlerini daha fazla bilgi ve görselleştirme sağlamak ve IDP'den gelen yapılandırılmış, normalleştirilmiş verileri kullanarak sahte iddiaları tespit etmek için kullanıyoruz. Aşağıdaki diyagram çözüm mimarisini göstermektedir.
Bu yazıda tartıştığımız aşamalar aşağıdaki temel hizmetleri kullanır:
- Amazon Medikal reçeteler, prosedürler veya teşhisler gibi tıbbi metinlerden sağlık verilerini anlamak ve çıkarmak için önceden eğitilmiş makine öğrenimi (ML) modellerini kullanan, HIPAA'ya uygun bir doğal dil işleme (NLP) hizmetidir.
- AWS Tutkal AWS Analytics hizmetleri yığınının bir parçasıdır ve analiz, makine öğrenimi ve uygulama geliştirme için verilerin keşfedilmesini, hazırlanmasını ve birleştirilmesini kolaylaştıran sunucusuz bir veri entegrasyon hizmetidir.
- Amazon Kırmızıya Kaydırma Analytics yığınındaki başka bir hizmettir. Amazon Redshift, bulutta tam olarak yönetilen, petabayt ölçekli bir veri ambarı hizmetidir.
Önkoşullar
Başlamadan önce, bkz. Bölüm 1 ÜİYOK ile sigorta kullanım durumuna üst düzey bir genel bakış ve veri toplama ve sınıflandırma aşamalarına ilişkin ayrıntılar için.
Kod örnekleriyle ilgili daha fazla bilgi için, bkz. GitHub deposu.
Ekstraksiyon aşaması
1. Bölümde belgelerden form ve tablo gibi bilgileri çıkarmak için Amazon Textract API'lerinin nasıl kullanılacağını, faturaların ve kimlik belgelerinin nasıl analiz edileceğini gördük. Bu yazıda, özel kullanım senaryolarına özel varsayılan ve özel varlıkları çıkarmak için Amazon Comprehend ile çıkarma aşamasını geliştiriyoruz.
Sigorta şirketleri, sigorta talepleri başvurularında sıklıkla hastanın taburcu özet mektubu gibi yoğun metinlerle karşılaşır (aşağıdaki örnek resme bakın). Belirli bir yapının olmadığı bu tür belgelerden otomatik olarak bilgi çıkarmak zor olabilir. Bu sorunu çözmek için, önemli iş bilgilerini belgeden çıkarmak üzere aşağıdaki yöntemleri kullanabiliriz:
Amazon Comprehen DetectEntities API ile varsayılan varlıkları çıkarın
Örnek tıbbi transkripsiyon belgesinde aşağıdaki kodu çalıştırıyoruz:
Aşağıdaki ekran görüntüsü, giriş metninde tanımlanan varlıkların bir koleksiyonunu göstermektedir. Bu yazının amaçları doğrultusunda çıktı kısaltılmıştır. Bakın GitHub repo varlıkların ayrıntılı bir listesi için.
Amazon Comprehen özel varlık tanıma ile özel varlıkları çıkarın
Yanıt DetectEntities
API, varsayılan varlıkları içerir. Ancak hastanın adı (varsayılan varlıkla gösterilir) gibi belirli varlık değerlerini bilmek istiyoruz. PERSON
) veya hastanın kimliği (varsayılan varlıkla gösterilir) OTHER
). Bu özel varlıkları tanımak için bir Amazon Comprehend özel varlık tanıyıcı modeli eğitiyoruz. Özel bir varlık tanıma modelinin nasıl eğitilip dağıtılacağına ilişkin kapsamlı adımları izlemenizi öneririz. GitHub deposu.
Özel modeli dağıttıktan sonra yardımcı işlevi kullanabiliriz get_entities()
gibi özel varlıkları almak için PATIENT_NAME
ve PATIENT_D
API yanıtından:
Aşağıdaki ekran görüntüsü sonuçlarımızı göstermektedir.
Zenginleştirme aşaması
Belge zenginleştirme aşamasında, değerli bilgiler elde etmek için sağlıkla ilgili belgeler üzerinde zenginleştirme işlevleri gerçekleştiriyoruz. Aşağıdaki zenginleştirme türlerine bakıyoruz:
- Etki alanına özgü dili çıkarın – ICD-10-CM, RxNorm ve SNOMED CT gibi tıbbi spesifik ontolojileri çıkarmak için Amazon Comprehend Medical'ı kullanıyoruz
- Hassas bilgileri çıkarın – Kişisel olarak tanımlanabilir bilgileri (PII) düzenlemek için Amazon Comprehend'i ve korunan sağlık bilgilerinin (PHI) düzeltilmesi için Amazon Comprehend Medical'ı kullanıyoruz
Yapılandırılmamış tıbbi metinlerden tıbbi bilgileri çıkarın
Tıbbi sağlayıcıların notları ve klinik araştırma raporları gibi belgeler yoğun tıbbi metinler içerir. Sigorta hasar taşıyıcılarının bu yoğun metinden elde edilen sağlık bilgileri arasındaki ilişkileri tanımlamaları ve bunları ICD-10-CM, RxNorm ve SNOMED CT kodları gibi tıbbi ontolojilere bağlamaları gerekmektedir. Bu, sigorta şirketlerinin talep işlemeyi hızlandırması ve basitleştirmesi için talep yakalama, doğrulama ve onay iş akışlarının otomatikleştirilmesi açısından çok değerlidir. Amazon Comprehend Medical'ı nasıl kullanabileceğimize bakalım InferICD10CM
Olası tıbbi durumları varlık olarak tespit etmek ve bunları kodlarına bağlamak için API:
Amazon Textract'tan aktarabileceğimiz giriş metni için DetectDocumentText
API, InferICD10CM
API aşağıdaki çıktıyı döndürür (çıkış kısa olması için kısaltılmıştır).
Benzer şekilde Amazon Comprehend Medical'ı kullanabiliriz InferRxNorm
İlaçları tanımlamak için API ve InferSNOMEDCT
Sağlıkla ilgili sigorta belgelerindeki tıbbi varlıkları tespit etmek için API.
PII ve PHI redaksiyonunu gerçekleştirin
Sigorta talep paketleri, hem PII hem de PHI verilerini içerdikleri için birçok gizlilik uyumluluğu ve düzenleme gerektirir. Sigorta şirketleri, poliçe numaraları veya hastanın adı gibi bilgileri değiştirerek uyumluluk riskini azaltabilir.
Bir hastanın taburculuk özeti örneğine bakalım. Amazon Comprehend'i kullanıyoruz DetectPiiEntities
Belgedeki PII varlıklarını tespit etmek ve bu varlıkları düzenleyerek hastanın gizliliğini korumak için API:
Gelen yanıtta aşağıdaki PII varlıklarını alıyoruz: detect_pii_entities()
API'si:
Daha sonra, belgedeki varlıkların sınırlayıcı kutu geometrisini kullanarak, belgelerden tespit edilen PII varlıklarını çıkartabiliriz. Bunun için adlı bir yardımcı araç kullanıyoruz. amazon-textract-overlayer
. Daha fazla bilgi için bkz. Metin-Üst Katman. Aşağıdaki ekran görüntüleri bir belgenin redaksiyondan önceki ve sonraki halini karşılaştırmaktadır.
Amazon Comprehend'e benzer DetectPiiEntities
API'yi de kullanabiliriz. DetectPHI
İncelenen klinik metindeki PHI verilerini tespit etmek için API. Daha fazla bilgi için bkz. PHI'yi tespit edin.
İnceleme ve doğrulama aşaması
Belge inceleme ve doğrulama aşamasında artık talep paketinin işletmenin gereksinimlerini karşılayıp karşılamadığını doğrulayabiliyoruz çünkü paketteki belgelerden daha önceki aşamalardan toplanan tüm bilgilere sahibiz. Bunu, paketi alt uygulamalara göndermeden önce tüm alanları inceleyip doğrulayabilecek veya yalnızca düşük dolarlık talepler için otomatik onay sürecini gerçekleştirebilecek bir insanı döngüye dahil ederek yapabiliriz. Kullanabiliriz Amazon Artırılmış AI (Amazon A2I), sigorta taleplerinin işlenmesi için insan incelemesi sürecini otomatikleştirmek için.
Artık IDP için AI hizmetlerini kullanarak talep işlemeden gerekli tüm verileri çıkarıp normalleştirdiğimize göre, ek kullanım örneklerini çözmek ve daha fazla analiz ve görselleştirme sağlamak için çözümü AWS Glue ve Amazon Redshift gibi AWS Analytics hizmetleriyle entegre olacak şekilde genişletebiliriz.
Hileli sigorta taleplerini tespit edin
Bu yazıda, çıkarılan ve işlenen verilerin bir veri gölünde depolandığı ve makine öğrenimi kullanılarak sahte sigorta taleplerini tespit etmek için kullanıldığı sunucusuz bir mimari uyguluyoruz. Kullanırız Amazon Basit Depolama Hizmeti (Amazon S3) işlenen verileri depolamak için. Daha sonra kullanabiliriz AWS Tutkal or Amazon EMR'si verileri temizlemek ve raporlama ve makine öğrenimi için kullanılabilir hale getirmek üzere ek alanlar eklemek. Bundan sonra kullanıyoruz Amazon Redshift ML bir sahtekarlık tespit makine öğrenimi modeli oluşturmak. Son olarak, kullanarak raporlar oluşturuyoruz. Amazon QuickSight verilerle ilgili içgörü elde etmek için.
Amazon Redshift harici şemasını kurun
Bu örneğin amacına uygun olarak, bir oluşturduk. örnek veri kümesi bir ETL (çıkarma, dönüştürme ve yükleme) işleminin çıktısını taklit eder ve meta veri kataloğu olarak AWS Glue Data Catalog'u kullanır. Öncelikle isimli bir veritabanı oluşturuyoruz. idp_demo
Veri Kataloğunda ve Amazon Redshift'te çağrılan harici bir şemada idp_insurance_demo
(aşağıdaki koda bakın). Bir kullanıyoruz AWS Kimlik ve Erişim Yönetimi (IAM) rolü, Amazon Redshift kümesine Amazon S3'e erişim izni verme ve Amazon Adaçayı Yapıcı. Bu IAM rolünün en az ayrıcalıkla nasıl kurulacağı hakkında daha fazla bilgi için bkz. Amazon Redshift ML yönetimi için kümeleme ve yapılandırma kurulumu.
Amazon Redshift harici tablosu oluşturun
Bir sonraki adım, Amazon Redshift'te dosyanın bulunduğu S3 konumuna referans veren harici bir tablo oluşturmaktır. Bu durumda dosyamız virgülle ayrılmış bir metin dosyasıdır. Ayrıca tablo özellikleri bölümünde yapılandırılabilen dosyadaki başlık satırını da atlamak istiyoruz. Aşağıdaki koda bakın:
Eğitim ve test veri kümeleri oluşturun
Harici tabloyu oluşturduktan sonra veri setimizi eğitim seti ve test seti olarak ayırarak ML için veri setimizi hazırlıyoruz. adında yeni bir harici tablo oluşturuyoruz. claim_train
Talep tablosundaki ID <= 85000 olan tüm kayıtlardan oluşur. Bu, ML modelimizi eğittiğimiz eğitim setidir.
adında başka bir harici tablo oluşturuyoruz. claim_test
ML modelini test ettiğimiz test kümesi olacak ID >85000 olan tüm kayıtlardan oluşur:
Amazon Redshift ML ile ML modeli oluşturma
Şimdi modeli kullanarak oluşturuyoruz. MODEL OLUŞTUR komutunu kullanın (aşağıdaki koda bakın). İlgili sütunları seçiyoruz. claims_train
Hileli bir işlemi tespit edebilecek tablo. Bu modelin amacı, değeri tahmin etmektir. fraud
kolon; Öyleyse, fraud
tahmin hedefi olarak eklenir. Model eğitildikten sonra isimli bir fonksiyon oluşturulur. insurance_fraud_model
. Bu işlev, SQL ifadelerinin değerini tahmin etmek için çalıştırılırken çıkarım yapmak için kullanılır. fraud
yeni kayıtlar için sütun.
ML modeli metriklerini değerlendirin
Modeli oluşturduktan sonra modelin doğruluğunu kontrol etmek için sorgular çalıştırabiliriz. biz kullanıyoruz insurance_fraud_model
değerini tahmin etme fonksiyonu fraud
yeni kayıtlar için sütun. Aşağıdaki sorguyu çalıştırın claims_test
karışıklık matrisi oluşturmak için tablo:
ML modelini kullanarak dolandırıcılığı tespit edin
Yeni modeli oluşturduktan sonra veri ambarına veya veri gölüne yeni talep verileri eklendikçe, insurance_fraud_model
Hileli işlemleri hesaplama işlevi. Bunu önce yeni verileri geçici bir tabloya yükleyerek yaparız. Daha sonra şunu kullanırız: insurance_fraud_model
hesaplamak için işlev fraud
her yeni işlem için bayrak ekleyin ve verileri bayrakla birlikte final tablosuna ekleyin; bu durumda bu claims
tablo.
Talep verilerini görselleştirin
Veriler Amazon Redshift'te mevcut olduğunda QuickSight'ı kullanarak görselleştirmeler oluşturabiliriz. Daha sonra QuickSight kontrol panellerini iş kullanıcıları ve analistlerle paylaşabiliriz. QuickSight kontrol panelini oluşturmak için öncelikle QuickSight'ta bir Amazon Redshift veri kümesi oluşturmanız gerekir. Talimatlar için bkz. Veritabanından veri kümesi oluşturma.
Veri kümesini oluşturduktan sonra veri kümesini kullanarak QuickSight'ta yeni bir analiz oluşturabilirsiniz. Aşağıda oluşturduğumuz bazı örnek raporlar yer almaktadır:
- Eyalete göre gruplandırılmış toplam talep sayısı
fraud
alan – Bu grafik bize belirli bir eyaletteki toplam işlem sayısına kıyasla hileli işlemlerin oranını gösteriyor. - Taleplerin toplam dolar değerinin toplamı,
fraud
alan – Bu grafik bize, belirli bir eyaletteki dolandırıcılık işlemlerinin dolar tutarının, işlemlerin toplam dolar tutarına oranını gösterir. - Sigorta şirketi başına toplam işlem sayısı, gruplandırılmış
fraud
alan – Bu grafik bize her bir sigorta şirketi için kaç tane tazminat davası açıldığını ve bunların kaçının dolandırıcılık olduğunu gösteriyor.
- ABD haritasında eyaletlere göre görüntülenen dolandırıcılık işlemlerinin toplam toplamı – Bu grafik yalnızca hileli işlemleri gösterir ve bu işlemlere ilişkin toplam ücretleri eyaletlere göre harita üzerinde görüntüler. Mavinin koyu tonu daha yüksek toplam şarjı gösterir. Trendleri daha iyi anlamak için bunu o eyaletteki şehre ve şehirdeki posta kodlarına göre daha ayrıntılı olarak analiz edebiliriz.
Temizlemek
Gelecekte AWS hesabınıza ücret yansıtılmasını önlemek için kurulumda sağladığınız kaynakları aşağıdaki talimatlara göre silin: Temizleme bölümü bizim repomuzda.
Sonuç
Bu iki bölümlük seride, makine öğrenimi deneyimi çok az olan veya hiç olmayan, uçtan uca bir IDP hattının nasıl oluşturulacağını gördük. Sigorta sektöründeki hasar işleme kullanım senaryosunu ve IDP'nin Amazon Textract, Amazon Comprehend, Amazon Comprehend Medical ve Amazon A2I gibi hizmetleri kullanarak bu kullanım senaryosunu otomatikleştirmeye nasıl yardımcı olabileceğini araştırdık. Bölüm 1'de belge çıkarmak için AWS AI hizmetlerinin nasıl kullanılacağını gösterdik. Bölüm 2'de çıkarma aşamasını genişlettik ve veri zenginleştirme gerçekleştirdik. Son olarak, IDP'den çıkarılan yapılandırılmış verileri daha fazla analiz için genişlettik ve AWS Analytics hizmetlerini kullanarak sahte iddiaları tespit etmek için görselleştirmeler oluşturduk.
güvenlik bölümlerini incelemenizi öneririz. Amazon Metin Yazısı, Amazon Kavramak, ve Amazon A2I belgeler ve sağlanan yönergeleri takip edin. Çözümün fiyatlandırması hakkında daha fazla bilgi edinmek için aşağıdaki fiyatlandırma ayrıntılarını inceleyin: Amazon Metin Yazısı, Amazon Kavramak, ve Amazon A2I.
Yazarlar Hakkında
Chinmaye Rane Amazon Web Services'de AI/ML Uzman Çözüm Mimarıdır. Uygulamalı matematik ve makine öğrenimi konusunda tutkulu. AWS müşterileri için akıllı belge işleme çözümleri tasarlamaya odaklanıyor. İş dışında salsa ve bachata dansından hoşlanıyor.
Uday Narayanan AWS'de Analitik Uzman Çözüm Mimarıdır. Müşterilerin karmaşık iş zorluklarına yenilikçi çözümler bulmalarına yardımcı olmaktan hoşlanıyor. Temel odak alanları veri analitiği, büyük veri sistemleri ve makine öğrenimidir. Boş zamanlarında spor yapmaktan, dizi izlemekten ve seyahat etmekten hoşlanıyor.
Sonali Sahu Amazon Web Services'de Akıllı Belge İşleme AI/ML Çözümleri Mimarı ekibine liderlik ediyor. Tutkulu bir teknoloji tutkunu ve inovasyonu kullanarak karmaşık sorunları çözmek için müşterilerle çalışmaktan keyif alıyor. Temel odak alanı, akıllı belge işleme için yapay zeka ve makine öğrenimidir.
- AI
- yapay zeka
- AI sanat üreteci
- yapay zeka robotu
- Amazon Kavramak
- Amazon Medikal
- Amazon Makine Öğrenimi
- Amazon Metin Yazısı
- analytics
- yapay zeka
- yapay zeka sertifikası
- bankacılıkta yapay zeka
- yapay zeka robotu
- yapay zeka robotları
- yapay zeka yazılımı
- AWS Makine Öğrenimi
- blockchain
- blockchain konferans ai
- zeka
- konuşma yapay zekası
- kripto konferans ai
- dal-e
- derin öğrenme
- google ai
- makine öğrenme
- Platon
- plato yapay zekası
- Plato Veri Zekası
- Plato Oyunu
- PlatoVeri
- plato oyunu
- ölçek ai
- sözdizimi
- Kategorilenmemiş
- zefirnet