AWS AI Services ile Akıllı Belge İşleme: Bölüm 1

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Sağlık, finans ve kredi, hukuk, perakende ve üretim gibi sektörlerdeki kuruluşlar, günlük iş süreçlerinde çoğu zaman çok sayıda belgeyle uğraşmak zorundadır. Bu belgeler, en yüksek müşteri memnuniyetini, daha hızlı müşteri katılımını ve daha düşük müşteri kaybını sürdürmek için zamanında karar vermenin anahtarı olan kritik bilgileri içerir. Çoğu durumda, belgeler zaman alıcı, hataya açık, pahalı ve ölçeklenmesi zor olan bilgi ve öngörüleri çıkarmak için manuel olarak işlenir. Bugün bu belgelerden bilgileri işlemek ve çıkarmak için sınırlı otomasyon mevcuttur. AWS yapay zeka (AI) hizmetlerine sahip akıllı belge işleme (IDP), makine öğrenimi (ML) becerilerine ihtiyaç duymadan farklı tür ve biçimlerdeki belgelerden hızlı ve yüksek doğrulukla bilgi çıkarmayı otomatikleştirmeye yardımcı olur. Yüksek doğrulukla daha hızlı bilgi çıkarma, genel maliyetleri düşürürken kaliteli iş kararlarının zamanında alınmasına yardımcı olur.

Bir IDP iş akışındaki aşamalar değişebilir ve kullanım durumu ve iş gereksinimlerinden etkilenebilse de, aşağıdaki şekil tipik olarak bir IDP iş akışının parçası olan aşamaları göstermektedir. Vergi formları, talepler, tıbbi notlar, yeni müşteri formları, faturalar, yasal sözleşmeler ve daha fazlası gibi belgeleri işleme, IDP için kullanım örneklerinden sadece birkaçıdır.

Bu iki bölümden oluşan dizide, AWS AI hizmetlerini kullanarak belgeleri nasıl otomatikleştirebileceğinizi ve uygun ölçekte nasıl akıllıca işleyebileceğinizi tartışıyoruz. Bu yazıda, IDP iş akışının ilk üç aşamasını tartışıyoruz. İçinde parçası 2, kalan iş akışı aşamalarını tartışıyoruz.

Çözüme genel bakış

Aşağıdaki mimari diyagram, bir IDP iş akışının aşamalarını gösterir. Farklı dosya biçimlerini (PDF, JPEG, PNG, TIFF) ve belge düzenlerini güvenli bir şekilde depolamak ve toplamak için bir veri yakalama aşamasıyla başlar. Bir sonraki aşama, belgelerinizi (sözleşmeler, talep formları, faturalar veya makbuzlar gibi) kategorilere ayırdığınız ve ardından belge çıkardığınız sınıflandırmadır. Çıkarma aşamasında, belgelerinizden anlamlı iş bilgileri çıkarabilirsiniz. Çıkarılan bu veriler genellikle veri analizi yoluyla içgörü toplamak için kullanılır veya veritabanları veya işlem sistemleri gibi alt sistemlere gönderilir. Aşağıdaki aşama, korunan sağlık bilgilerinin (PHI) veya kişisel olarak tanımlanabilir bilgilerin (PII) verilerinin, özel iş terimi çıkarma vb. çıkarılarak belgelerin zenginleştirilebildiği zenginleştirme aşamasıdır. Son olarak, inceleme ve doğrulama aşamasında, sonucun doğru olduğundan emin olmak için belge incelemeleri için bir insan işgücünü dahil edebilirsiniz.

Bu gönderinin amaçları doğrultusunda banka hesap özetleri, faturalar ve mağaza makbuzları gibi bir dizi örnek belgeyi ele alıyoruz. Belge örnekleri, örnek kodla birlikte şu adreste bulunabilir: GitHub deposu. Aşağıdaki bölümlerde, gerçek pratik uygulama ile birlikte bu kod örneklerinde size yol göstereceğiz. ile ML özelliklerini nasıl kullanabileceğinizi gösteriyoruz. Amazon Metin Yazısı, Amazon Kavramak, ve Amazon Artırılmış AI (Amazon A2I) belgeleri işlemek ve onlardan alınan verileri doğrulamak için.

Amazon Textract, taranan belgelerden metin, el yazısı ve verileri otomatik olarak ayıklayan bir makine öğrenimi hizmetidir. Formlardan ve tablolardan verileri tanımlamak, anlamak ve ayıklamak için basit optik karakter tanımanın (OCR) ötesine geçer. Amazon Textract, her tür belgeyi okumak ve işlemek için makine öğrenimi kullanır; metin, el yazısı, tablo ve diğer verileri hiçbir manuel çaba harcamadan doğru şekilde çıkarır.

Amazon Comprehend, belgelerin içeriği hakkında öngörüler çıkarmak için makine öğrenimi kullanan bir doğal dil işleme (NLP) hizmetidir. Amazon Comprehend, dile, kişilere ve yerlere yapılan referanslar dahil olmak üzere belgelerdeki kritik öğeleri tanımlayabilir ve bunları ilgili konulara veya kümelere göre sınıflandırabilir. Tek belge veya toplu algılama kullanarak bir belgenin duyarlılığını gerçek zamanlı olarak belirlemek için duyarlılık analizi yapabilir. Örneğin, okuyucularınızın gönderiyi beğenip beğenmediğini anlamak için bir blog gönderisindeki yorumları analiz edebilir. Amazon Comprehend ayrıca metin belgelerindeki kimlik bilgileri gibi adresleri, banka hesap numaralarını ve telefon numaralarını gerçek zamanlı ve eşzamansız toplu işlerde algılar. Ayrıca, eşzamansız toplu işlerde PII varlıklarını da düzeltebilir.

Amazon A2I, insan incelemesi için gereken iş akışlarını oluşturmayı kolaylaştıran bir makine öğrenimi hizmetidir. Amazon A2I, AWS üzerinde çalışsın veya çalışmasın, insan inceleme sistemleri oluşturmak veya çok sayıda insan incelemeciyi yönetmekle ilişkili farklılaşmamış ağır yükleri ortadan kaldırarak tüm geliştiricilere insan incelemesi sunar. Amazon A2I, her ikisini de Amazon Metin Yazısı ve Amazon Kavramak size akıllı belge işleme iş akışınızda insan incelemesi adımlarını tanıtma yeteneği sağlamak için.

Veri yakalama aşaması

Belgeleri, aşağıdaki gibi yüksek düzeyde ölçeklenebilir ve dayanıklı bir depoda saklayabilirsiniz: Amazon Basit Depolama Hizmeti (Amazon S3). Amazon S3, sektör lideri ölçeklenebilirlik, veri kullanılabilirliği, güvenlik ve performans sunan bir nesne depolama hizmetidir. Amazon S3, 11 9'luk dayanıklılık için tasarlanmıştır ve dünyanın her yerindeki milyonlarca müşteri için veri depolar. Belgeler çeşitli biçimlerde ve düzenlerde gelebilir ve web portalları veya e-posta ekleri gibi farklı kanallardan gelebilir.

sınıflandırma aşaması

Önceki adımda, çeşitli tür ve biçimlerde belgeler topladık. Bu adımda, daha fazla çıkarma yapmadan önce belgeleri kategorilere ayırmamız gerekiyor. Bunun için Amazon Anlamak kullanıyoruz özel sınıflandırma. Belge sınıflandırması iki aşamalı bir süreçtir. İlk olarak, ilginizi çeken sınıfları tanımak için bir Amazon Comprehend özel sınıflandırıcı eğitirsiniz. Ardından, modeli bir özel sınıflandırıcı gerçek zamanlı bitiş noktası ve etiketlenmemiş belgeleri sınıflandırılacak gerçek zamanlı uç noktaya gönderin.

Aşağıdaki şekil, tipik bir belge sınıflandırma iş akışını temsil eder.

sınıflandırma aşaması

Sınıflandırıcıyı eğitmek için ilgilendiğiniz sınıfları belirleyin ve eğitim materyali olarak her bir sınıf için örnek belgeler sağlayın. Amazon Comprehend, belirttiğiniz seçeneklere bağlı olarak, sağladığınız belgelere göre eğittiği özel bir makine öğrenimi modeli oluşturur. Bu özel model (sınıflandırıcı), gönderdiğiniz her belgeyi inceler. İçeriği en iyi temsil eden belirli sınıfı (çoklu sınıf modunu kullanıyorsanız) veya ona uygulanan sınıfları (çoklu etiket modunu kullanıyorsanız) döndürür.

Eğitim verilerini hazırlayın

İlk adım, Amazon Comprehend özel sınıflandırıcı için gereken belgelerden metin çıkarmaktır. Amazon S3'teki tüm belgeler için ham metin bilgilerini çıkarmak için Amazon Textract kullanıyoruz detect_document_text() API. Ayrıca verileri, özel bir Amazon Comprehend sınıflandırıcısını eğitmek için kullanılacak belge türüne göre de etiketliyoruz.

Aşağıdaki kod, basitleştirme amacıyla kısaltılmıştır. Kodun tamamı için GitHub'a bakın. basit kod için textract_extract_text(). İşlev call_textract() çağıran bir wr4apper işlevidir. Analiz etBelge API dahili olarak ve yönteme iletilen parametreler, API'nin çıkarma görevini yürütmek için ihtiyaç duyduğu bazı yapılandırmaları özetler.

def textract_extract_text(document, bucket=data_bucket):        
    try:
        print(f'Processing document: {document}')
        lines = ""
        row = []
        
        # using amazon-textract-caller
        response = call_textract(input_document=f's3://{bucket}/{document}') 
        # using pretty printer to get all the lines
        lines = get_string(textract_json=response, output_type=[Textract_Pretty_Print.LINES])
        
        label = [name for name in names if(name in document)]  
        row.append(label[0])
        row.append(lines)        
        return row
    except Exception as e:
        print (e)

Özel bir sınıflandırıcı eğitin

Bu adımda, belgeleri sınıflandırmak için modelimizi eğitmek için Amazon Comprehend özel sınıflandırmasını kullanırız. kullanıyoruz Belge Sınıflandırıcı Oluştur Etiketli verilerimizi kullanarak özel bir modeli eğiten bir sınıflandırıcı oluşturmak için API. Aşağıdaki koda bakın:

create_response = comprehend.create_document_classifier(
        InputDataConfig={
            'DataFormat': 'COMPREHEND_CSV',
            'S3Uri': f's3://{data_bucket}/{key}'
        },
        DataAccessRoleArn=role,
        DocumentClassifierName=document_classifier_name,
        VersionName=document_classifier_version,
        LanguageCode='en',
        Mode='MULTI_CLASS'
    )

Gerçek zamanlı bir uç nokta dağıtın

Amazon Comprehend özel sınıflandırıcısını kullanmak için aşağıdakileri kullanarak gerçek zamanlı bir uç nokta oluşturuyoruz: CreateEndpoint API:

endpoint_response = comprehend.create_endpoint(
        EndpointName=ep_name,
        ModelArn=model_arn,
        DesiredInferenceUnits=1,    
        DataAccessRoleArn=role
    )
    ENDPOINT_ARN=endpoint_response['EndpointArn']
print(f'Endpoint created with ARN: {ENDPOINT_ARN}')

Belgeleri gerçek zamanlı uç nokta ile sınıflandırın

Amazon Comprehend uç noktası oluşturulduktan sonra belgeleri sınıflandırmak için gerçek zamanlı uç noktayı kullanabiliriz. kullanıyoruz comprehend.classify_document() giriş parametreleri olarak çıkarılan belge metni ve çıkarım bitiş noktası ile işlev:

response = comprehend.classify_document(
      Text= document,
      EndpointArn=ENDPOINT_ARN
      )

Amazon Comprehend, bir dizi anahtar/değer çiftinde (ad-puanı) her sınıfa bağlı bir güven puanıyla tüm belge sınıflarını döndürür. En yüksek güven puanına sahip belge sınıfını seçiyoruz. Aşağıdaki ekran görüntüsü örnek bir yanıttır.

Belgeleri gerçek zamanlı uç nokta ile sınıflandırın

adresindeki ayrıntılı belge sınıflandırma örnek kodunu incelemenizi öneririz. GitHub.

Ekstraksiyon aşaması

Amazon Textract, Amazon Textract'ı kullanarak metin ve yapılandırılmış veri bilgilerini ayıklamanıza olanak tanır DetectDocumentMetin ve Analiz etBelge API'ler sırasıyla. Bu API'ler, KELİMELER, SATIRLAR, FORMLAR, TABLOLAR, geometri veya sınırlayıcı kutu bilgileri, ilişkiler vb. içeren JSON verileriyle yanıt verir. İkisi birden DetectDocumentText ve AnalyzeDocument senkron işlemlerdir. Belgeleri eşzamansız olarak analiz etmek için şunu kullanın: Belge Metni Algılamayı Başlat.

Yapılandırılmış veri çıkarma

Veri yapısını ve algılanan öğeler arasındaki ilişkileri korurken, belgelerden tablolar gibi yapılandırılmış verileri çıkarabilirsiniz. kullanabilirsiniz Analiz etBelge API ile FeatureType as TABLE bir belgedeki tüm tabloları algılamak için. Aşağıdaki şekil bu işlemi göstermektedir.

Yapılandırılmış veri çıkarma

Aşağıdaki koda bakın:

response = textract.analyze_document(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    },
    FeatureTypes=["TABLES"])

çalıştırıyoruz analyze_document() ile yöntem FeatureType as TABLES çalışan geçmişi belgesinde ve aşağıdaki sonuçlarda tablo çıkarımını elde edin.

Tablo çıkarma için belge API yanıtını analiz edin

Yarı yapılandırılmış veri çıkarma

Veri yapısını ve algılanan öğeler arasındaki ilişkileri korurken, belgelerden formlar veya anahtar/değer çiftleri gibi yarı yapılandırılmış verileri çıkarabilirsiniz. kullanabilirsiniz Analiz etBelge API ile FeatureType as FORMS bir belgedeki tüm formları algılamak için. Aşağıdaki diyagram bu işlemi göstermektedir.

Yarı yapılandırılmış veri çıkarma

Aşağıdaki koda bakın:

response = textract.analyze_document(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    },
    FeatureTypes=["FORMS"])

Burada çalıştırıyoruz analyze_document() ile yöntem FeatureType as FORMS çalışan başvuru belgesinde ve sonuçlarda tablo çıkarımını elde edin.

AWS AI hizmetleriyle akıllı belge işleme: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Yapılandırılmamış veri çıkarma

Amazon Textract, sektör lideri OCR doğruluğu ile yoğun metin çıkarma için idealdir. kullanabilirsiniz DetectDocumentMetin Aşağıdaki şekilde gösterildiği gibi, metin satırlarını ve bir metin satırını oluşturan sözcükleri algılamak için API.

Yapılandırılmamış veri çıkarma

Aşağıdaki koda bakın:

response = textract.detect_document_text(Document={'Bytes': imageBytes})

# Print detected text
for item in response["Blocks"]:
	if item["BlockType"] == "LINE":
 		print (item["Text"])

şimdi çalıştırıyoruz detect_document_text() örnek görüntü üzerinde yöntem ve sonuçlarda ham metin çıkarımı elde edin.

AWS AI hizmetleriyle akıllı belge işleme: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Faturalar ve makbuzlar

Amazon Textract, faturaları ve makbuzları geniş ölçekte işlemek için özel destek sağlar. bu Analiz Gider API, herhangi bir şablon veya yapılandırma olmadan hemen hemen tüm faturalardan veya makbuzlardan açıkça etiketlenmiş verileri, ima edilen verileri ve ayrıntılı bir mal veya hizmet listesinden satır öğelerini çıkarabilir. Aşağıdaki şekil bu işlemi göstermektedir.

Fatura ve makbuz çıkarma

Aşağıdaki koda bakın:

response = textract.analyze_expense(
    Document={
        'S3Object': {
            'Bucket': s3BucketName,
            'Name': documentName
        }
    })

Amazon Textract, satıcı adını "satıcı" olarak adlandırılan açık bir etiket olmadan sayfada yalnızca bir logoda belirtilmiş olsa bile makbuzda bulabilir. Ayrıca satır öğeleri için sütun başlıklarıyla etiketlenmemiş gider kalemlerini, miktarı ve fiyatları bulabilir ve çıkarabilir.

Gider API yanıtını analiz edin

Kimlik belgeleri

Amazon Textract Analiz Kimliği API, şablonlara veya yapılandırmaya ihtiyaç duymadan sürücü ehliyetleri ve pasaportlar gibi kimlik belgelerinden bilgileri otomatik olarak çıkarmanıza yardımcı olabilir. Son kullanma tarihi ve doğum tarihi gibi belirli bilgileri çıkarabilir ve ad ve adres gibi zımni bilgileri akıllıca tanımlayabilir ve ayıklayabiliriz. Aşağıdaki diyagram bu işlemi göstermektedir.

Kimlik belgeleri çıkarma

Aşağıdaki koda bakın:

textract_client = boto3.client('textract')
j = call_textract_analyzeid(document_pages=["s3://amazon-textract-public-content/analyzeid/driverlicense.png"],boto3_textract_client=textract_client)

Biz kullanabilirsiniz tabulate güzel bir çıktı almak için:

from tabulate import tabulate

print(tabulate([x[1:3] for x in result]))

AWS AI hizmetleriyle akıllı belge işleme: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Ayrıntılı belge çıkarma işlemini gerçekleştirmenizi öneririz basit kod GitHub'da. Bu gönderideki tam kod örnekleri hakkında daha fazla bilgi için bkz. GitHub repo.

Sonuç

İki bölümlük bir dizinin bu ilk gönderisinde, IDP'nin çeşitli aşamalarını ve bir çözüm mimarisini tartıştık. Ayrıca bir Amazon Comprehend özel sınıflandırıcı kullanarak belge sınıflandırmasını da tartıştık. Ardından, yapılandırılmamış, yarı yapılandırılmış, yapılandırılmış ve özel belge türlerinden bilgi çıkarmak için Amazon Textract'ı kullanmanın yollarını araştırdık.

In parçası 2 Bu seride, tartışmaya Amazon Textract'ın ayıklama ve sorgulama özellikleriyle devam ediyoruz. Yoğun metin içeren belgelerden önemli iş terimlerini çıkarmak için Amazon Comprehend önceden tanımlanmış varlıkları ve özel varlıkları nasıl kullanacağınızı ve bir Amazon A2I döngüdeki insan incelemesini IDP süreçlerinize nasıl entegre edebileceğinizi inceliyoruz.

güvenlik bölümlerini incelemenizi öneririz. Amazon Metin Yazısı, Amazon Kavramak, ve Amazon A2I belgeleri ve sağlanan yönergeleri takip edin. Ayrıca, fiyatlandırmayı incelemek ve anlamak için bir dakikanızı ayırın. Amazon Metin Yazısı, Amazon Kavramak, ve Amazon A2I.

yazarlar hakkında

suprakash dutta Amazon Web Services'te Çözüm Mimarıdır. Dijital dönüşüm stratejisi, uygulama modernizasyonu ve geçişi, veri analitiği ve makine öğrenimi konularına odaklanmaktadır.

Sonali Sahu Amazon Web Services'de Akıllı Belge İşleme AI/ML Çözümleri Mimarı ekibine liderlik ediyor. Tutkulu bir teknoloji tutkunu ve inovasyonu kullanarak karmaşık sorunları çözmek için müşterilerle çalışmaktan keyif alıyor. Temel odak alanı, akıllı belge işleme için yapay zeka ve makine öğrenimidir.

Anjan Biswas AI/ML ve veri analitiğine odaklanan Kıdemli AI Hizmetleri Çözümleri Mimarıdır. Anjan, dünya çapındaki AI hizmetleri ekibinin bir parçasıdır ve AI ve ML ile iş sorunlarını anlamalarına ve bunlara çözümler geliştirmelerine yardımcı olmak için müşterilerle birlikte çalışır. Anjan, küresel tedarik zinciri, üretim ve perakende kuruluşlarıyla çalışma konusunda 14 yılı aşkın bir deneyime sahiptir ve müşterilerin AWS AI hizmetlerini başlatmasına ve ölçeklendirmesine aktif olarak yardımcı olmaktadır.

Chinmaye Rane Amazon Web Services'de AI/ML Uzman Çözüm Mimarıdır. Uygulamalı matematik ve makine öğrenimi konusunda tutkulu. AWS müşterileri için akıllı belge işleme çözümleri tasarlamaya odaklanıyor. İş dışında salsa ve bachata dansından hoşlanıyor.

Zaman Damgası: Ağustos 15, 2022Ağustos 16, 2022

Zaman Damgası: Jan 13, 2023

AWS AI hizmetleriyle akıllı belge işleme: 1. Bölüm

Plato tarafından yeniden yayınlandı

Çözüme genel bakış

Veri yakalama aşaması

sınıflandırma aşaması

Eğitim verilerini hazırlayın

Özel bir sınıflandırıcı eğitin

Gerçek zamanlı bir uç nokta dağıtın

Belgeleri gerçek zamanlı uç nokta ile sınıflandırın

Ekstraksiyon aşaması

Yapılandırılmış veri çıkarma

Yarı yapılandırılmış veri çıkarma

Yapılandırılmamış veri çıkarma

Faturalar ve makbuzlar

Kimlik belgeleri

Sonuç

yazarlar hakkında

Den fazla AWS Makine Öğrenimi

Amazon SageMaker kullanarak maksimum kâr için optimum fiyatlandırma

Amazon Forecast ile tahmin yapmak için belirli zaman serilerini seçin

AWS Amplify ve Amazon Rekognition örnek uygulamalarını kullanarak kimlik doğrulama projelerinizi hızlandırın

Amazon SageMaker model paralel kitaplığı artık PyTorch FSDP iş yüklerini %20'ye kadar hızlandırıyor | Amazon Web Hizmetleri

Amazon SageMaker'ın yerleşik algoritmalarını önceden eğitilmiş modellerle kullanarak makine öğrenimi modeli performansını artırın ve eğitim süresini kısaltın

Uygun maliyetli, yüksek performanslı yapay zeka çıkarımı için Amazon EC2 DL2q bulut sunucusu artık genel kullanıma sunuldu | Amazon Web Hizmetleri

Amazon S3 Object Lambda ile makine öğrenimi ön işlemenin maliyetlerini ve karmaşıklığını azaltın

Amazon SageMaker ile AWS Graviton tabanlı bulut sunucularında makine öğrenimi çıkarım iş yüklerini çalıştırın

Amazon Rekognition ve diğer içerik denetleme hizmetlerinde içerik denetlemeyi değerlendirmeye yönelik metrikler

AWS DeepRacer ile Parsons'ta yapay zeka ve makine öğreniminden yararlanma

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap