보험 업계에서 AWS AI 서비스를 사용한 지능형 문서 처리: 1부

플라톤에 의해 재발행

팔로워 : 0

지능형 문서 처리(IDP)의 목표는 AI를 적용하여 문서 작업을 처리함으로써 조직이 더 빠르고 정확한 결정을 내릴 수 있도록 돕는 것입니다. 이 XNUMX부작 시리즈는 보험 회사가 비즈니스 프로세스의 속도를 높이는 데 사용할 수 있는 AWS AI 기술을 강조합니다. 이러한 AI 기술은 청구, 인수, 고객 서신, 계약 또는 분쟁 해결 처리와 같은 보험 사용 사례 전반에 걸쳐 사용될 수 있습니다. 이 시리즈는 보험 업계의 청구 처리 사용 사례에 중점을 둡니다. AWS IDP 솔루션의 기본 개념에 대한 자세한 내용은 다음을 참조하십시오. 2 부작 시리즈.

청구 처리는 검토, 진위 여부를 확인하고 청구를 판결하기 위한 올바른 재정적 책임을 결정하는 데 필요한 워크플로의 여러 체크포인트로 구성됩니다. 보험 회사는 청구에 대한 판결을 내리기 전에 청구에 대해 이러한 체크포인트를 거칩니다. 청구가 문제 없이 이 모든 체크포인트를 통과하면 보험 회사가 이를 승인하고 모든 지불을 처리합니다. 그러나 청구를 판결하기 위해 추가 지원 정보가 필요할 수 있습니다. 이 청구 처리 프로세스는 종종 수동으로 이루어지기 때문에 비용이 많이 들고 오류가 발생하기 쉬우며 시간이 많이 걸립니다. 보험 고객은 AWS AI 서비스를 사용하여 이 프로세스를 자동화하여 청구 처리를 위한 문서 처리 파이프라인을 자동화할 수 있습니다.

XNUMX부로 구성된 이 시리즈에서는 보험 청구 처리 사용 사례에 대해 AWS AI 서비스를 사용하여 문서를 대규모로 자동화하고 지능적으로 처리하는 방법을 안내합니다.

보험 업계에서 AWS AI 및 Analytics 서비스를 사용한 지능형 문서 처리

솔루션 개요

다음 다이어그램은 일반적으로 IDP 파이프라인에서 볼 수 있는 각 단계를 나타냅니다. 우리는 이러한 각 단계를 살펴보고 신청서가 제출된 시점부터 신청서 조사 및 종료에 이르기까지 청구 신청 프로세스와 관련된 단계에 연결하는 방법을 살펴봅니다. 이 게시물에서는 데이터 캡처, 분류 및 추출 단계의 기술적 세부 사항을 다룹니다. ~ 안에 파트 2, 문서 추출 단계를 확장하고 문서 보강, 검토 및 확인을 계속하고 솔루션을 확장하여 청구 사기 사용 사례에 대한 분석 및 시각화를 제공합니다.

다음 아키텍처 다이어그램은 청구 처리 애플리케이션의 여러 단계에 따라 IDP 파이프라인 단계에서 사용되는 다양한 AWS 서비스를 보여줍니다.

IDP 아키텍처 다이어그램

이 솔루션은 다음과 같은 주요 서비스를 사용합니다.

아마존 텍사스 스캔한 문서에서 텍스트, 필기 및 데이터를 자동으로 추출하는 머신 러닝(ML) 서비스입니다. 단순한 OCR(광학 문자 인식)을 넘어 양식과 테이블에서 데이터를 식별, 이해 및 추출합니다. Amazon Textract는 ML을 사용하여 모든 유형의 문서를 읽고 처리하여 수동 작업 없이 텍스트, 필기, 표 및 기타 데이터를 정확하게 추출합니다.
아마존 이해 ML을 사용하여 텍스트에서 통찰력을 추출하는 자연어 처리(NLP) 서비스입니다. Amazon Comprehend는 사람, 위치, 날짜, 수량 등과 같은 항목을 감지할 수 있습니다. 또한 주요 언어, 개인 식별 정보(PII) 정보를 감지하고 문서를 관련 클래스로 분류할 수 있습니다.
아마존 증강 AI (Amazon A2I)는 인적 검토에 필요한 워크플로를 쉽게 구축할 수 있는 ML 서비스입니다. Amazon A2I는 모든 개발자에게 인적 검토를 제공하여 인적 검토 시스템을 구축하거나 많은 수의 인적 검토자를 관리하는 것과 관련된 획일적인 무거운 작업을 제거합니다. Amazon A2I는 두 가지 모두를 다음과 통합합니다. 아마존 텍사스 과 아마존 이해 IDP 워크플로 내에서 인적 검토 또는 검증을 도입할 수 있는 기능을 제공합니다.

사전 조건

다음 섹션에서는 아키텍처의 처음 세 단계, 즉 데이터 캡처, 분류 및 추출 단계와 관련된 다양한 서비스를 살펴봅니다.

우리를 참조하십시오. GitHub 저장소 청구 처리 패킷의 문서 샘플과 함께 전체 코드 샘플의 경우.

데이터 캡처 단계

클레임 및 지원 문서는 팩스, 이메일, 관리 포털 등과 같은 다양한 채널을 통해 제공될 수 있습니다. 이러한 문서를 다음과 같이 확장성과 내구성이 뛰어난 저장소에 저장할 수 있습니다. 아마존 단순 스토리지 서비스 (아마존 S3). 이러한 문서는 PDF, JPEG, PNG, TIFF 등과 같은 다양한 유형일 수 있습니다. 문서는 다양한 형식과 레이아웃으로 제공될 수 있으며 다양한 채널에서 데이터 저장소로 제공될 수 있습니다.

분류 단계

문서 분류 단계에서 Amazon Comprehend와 Amazon Textract를 결합하여 텍스트를 문서 컨텍스트로 변환하여 데이터 캡처 단계에 저장된 문서를 분류할 수 있습니다. 그런 다음 Amazon Comprehend에서 사용자 지정 분류를 사용하여 클레임 처리 패킷에서 정의한 클래스로 문서를 구성할 수 있습니다. 사용자 지정 분류는 문서 확인 프로세스를 자동화하고 패킷에서 누락된 문서를 식별하는 데에도 유용합니다. 아키텍처 다이어그램에 표시된 대로 사용자 지정 분류에는 두 단계가 있습니다.

데이터 스토리지의 모든 문서에서 Amazon Textract를 사용하여 텍스트를 추출하여 사용자 지정 분류기에 대한 교육 데이터를 준비합니다.
Amazon Comprehend 사용자 지정 분류 모델(또는 문서 분류기) 텍스트 내용을 기반으로 관심 클래스를 인식합니다.

보험금 청구 패킷의 문서 분류

Amazon Comprehend 사용자 지정 분류 모델이 교육된 후 실시간 엔드포인트를 사용하여 문서를 분류할 수 있습니다. Amazon Comprehend는 키-값 쌍(Doc_name - Confidence_score). 자세한 문서 분류 샘플 코드를 살펴보는 것이 좋습니다. GitHub의.

추출 단계

추출 단계에서는 Amazon Textract 및 Amazon Comprehend를 사용하여 문서에서 데이터를 추출합니다. 이 게시물의 경우 청구 처리 패킷에 있는 다음 샘플 문서를 사용하십시오. Center of Medicaid 및 Medicare Services(CMS)-1500 청구 양식, 운전 면허증 및 보험 ID, 청구서.

CMS-1500 청구 양식에서 데이터 추출

CMS-1500 양식은 비기관 제공자 또는 공급업체가 Medicare 사업자에게 청구하는 데 사용하는 표준 청구 양식입니다.

CMS-1500 양식을 정확하게 처리하는 것이 중요합니다. 그렇지 않으면 청구 프로세스가 느려지거나 운송업체의 지불이 지연될 수 있습니다. Amazon Textract 사용 AnalyzeDocument API를 사용하면 청구 양식 내에서 추가 통찰력을 이해하기 위해 문서에서 텍스트를 추출하는 더 높은 정확도로 추출 프로세스의 속도를 높일 수 있습니다. 다음은 CMS-1500 청구 양식의 샘플 문서입니다.

CMS1500 청구 양식

우리는 지금 사용 AnalyzeDocument 두 가지를 추출하는 API FeatureTypes, FORMS 과 TABLES, 문서에서:

from IPython.display import display, JSON
form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": cms_key}}, FeatureTypes=['FORMS', 'TABLES'])

# print tables
print(get_string(textract_json=form_resp, output_type=[Textract_Pretty_Print.TABLES], table_format=Pretty_Print_Table_Format.fancy_grid))

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(form_resp), root="Claim Form"))

다음 결과는 더 나은 가독성을 위해 축약되었습니다. 자세한 내용은 다음을 참조하십시오. GitHub 레포.

XNUMXD덴탈의 FORMS 추출은 키-값 쌍으로 식별됩니다.

XNUMXD덴탈의 TABLES 추출에는 청구 양식에서 감지된 테이블 내의 셀, 병합된 셀 및 열 머리글이 포함됩니다.

CMS1500 형식에서 테이블 추출

신분증에서 데이터 추출

레이아웃이 다를 수 있는 보험 ID와 같은 신원 문서의 경우 Amazon Textract를 사용할 수 있습니다. AnalyzeDocument API. 우리는 사용 FeatureType FORMS 에 대한 구성으로 AnalyzeDocument 보험 ID에서 키-값 쌍을 추출하는 API(다음 샘플 참조):

다음 코드를 실행합니다.

ins_form_resp = textract.analyze_document(Document={'S3Object':{"Bucket": data_bucket, "Name": ins_card_key}}, FeatureTypes=['FORMS'])

# using our constructed helper function - values returned as a dictionary

display(JSON(getformkeyvalue(ins_form_resp), root="Insurance card"))

다음 스크린샷과 같이 결과 배열에서 키-값 쌍을 얻습니다.

미국 운전 면허증 또는 미국 여권과 같은 신분증 문서의 경우 Amazon Textract는 앞서 보험 신분증 예시에서 본 것과 달리 템플릿이나 형식 없이 주요 용어를 자동으로 추출하는 전문적인 지원을 제공합니다. 이랑 AnalyzeID API를 통해 기업은 템플릿이나 형식이 다른 신분증 문서에서 정보를 빠르고 정확하게 추출할 수 있습니다. 그만큼 AnalyzeID API는 두 가지 범주의 데이터 유형을 반환합니다.

생년월일, 발행일, ID 번호, 클래스 및 제한 사항과 같은 ID에서 사용할 수 있는 키-값 쌍
이름, 주소 및 발급자와 같은 명시적 키가 연결되어 있지 않을 수 있는 문서의 암시적 필드

청구 처리 패킷에서 다음 샘플 미국 운전 면허증을 사용합니다.

다음 코드를 실행합니다.

ID_resp = textract.analyze_id(DocumentPages=[{'S3Object':{"Bucket": data_bucket, "Name": key}}])

# once again using the textract response parser
from trp.trp2_analyzeid import TAnalyzeIdDocument, TAnalyzeIdDocumentSchema

t_doc = TAnalyzeIdDocumentSchema().load(ID_resp)

list_of_results = t_doc.get_values_as_list()
print(tabulate([x[1:3] for x in list_of_results]))

다음 스크린샷은 결과를 보여줍니다.

결과 스크린샷에서 운전 면허증 자체에 없는 특정 키가 표시되는 것을 관찰할 수 있습니다. 예를 들어, Veteran 라이센스에 있는 키가 아닙니다. 하지만 미리 채워진 키-값은 AnalyzeID 주 간의 라이센스 차이로 인해 지원됩니다.

송장 및 영수증에서 데이터 추출

받는 유사 AnalyzeID API, AnalyzeExpense API는 송장 및 영수증에 대한 전문적인 지원을 제공하여 모든 형식의 송장 문서에서 공급업체 이름, 소계 및 총액 등과 같은 관련 정보를 추출합니다. 추출을 위한 템플릿이나 구성이 필요하지 않습니다. Amazon Textract는 ML을 사용하여 영수증뿐만 아니라 모호한 송장의 컨텍스트를 이해합니다.

다음은 의료보험 청구서 샘플입니다.

보험 청구서 샘플

우리는을 사용하여 AnalyzeExpense 표준화된 필드 목록을 확인하는 API입니다. 표준 필드로 인식되지 않는 필드는 다음과 같이 분류됩니다. OTHER:

expense_resp = textract.analyze_expense(Document={'S3Object':{"Bucket": data_bucket, "Name": invc_key}})

# print invoice summary

print(get_expensesummary_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

# print invoice line items

print(get_expenselineitemgroups_string(textract_json=expense_resp, table_format=Pretty_Print_Table_Format.fancy_grid))

결과에서 다음 필드 목록을 키-값 쌍으로 가져오고(왼쪽 스크린샷 참조) 구매한 개별 광고 항목의 전체 행(오른쪽 스크린샷 참조)을 얻습니다.

보험 업계에서 AWS AI 서비스를 사용한 지능형 문서 처리: 1부 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

결론

이 게시물에서는 청구 처리의 일반적인 문제와 AWS AI 서비스를 사용하여 지능형 문서 처리 파이프라인을 자동화하여 청구를 자동으로 판정하는 방법을 보여주었습니다. Amazon Comprehend 사용자 지정 분류자를 사용하여 문서를 다양한 문서 클래스로 분류하는 방법과 Amazon Textract를 사용하여 비정형, 반정형, 정형 및 특수 문서 유형을 추출하는 방법을 살펴보았습니다.

In 파트 2, Amazon Textract로 추출 단계를 확장합니다. 또한 Amazon Comprehend 사전 정의 엔터티 및 사용자 지정 엔터티를 사용하여 데이터를 보강하고 추가 처리를 위해 분석 및 시각화 서비스와 통합하도록 IDP 파이프라인을 확장하는 방법을 보여줍니다.

보안 섹션을 검토하는 것이 좋습니다. 아마존 텍스트 랙트, 아마존 이해, 과 아마존 A2I 문서화하고 제공된 지침을 따릅니다. 솔루션 가격에 대해 자세히 알아보려면 다음의 가격 세부 정보를 검토하십시오. 아마존 텍스트 랙트, 아마존 이해및 아마존 A2I.

저자에 관하여

친마이 레인 Amazon Web Services의 AI/ML 전문가 솔루션 아키텍트입니다. 그녀는 응용 수학 및 기계 학습에 열정적입니다. 그녀는 AWS 고객을 위한 지능형 문서 처리 솔루션 설계에 중점을 두고 있습니다. 일 외에는 살사와 바차타 댄스를 즐깁니다.

소날리 사후 Amazon Web Services에서 Intelligent Document Processing AI/ML Solutions Architect 팀을 이끌고 있습니다. 그녀는 열정적인 기술 애호가이며 혁신을 사용하여 복잡한 문제를 해결하기 위해 고객과 함께 일하는 것을 즐깁니다. 그녀의 핵심 초점 영역은 지능형 문서 처리를 위한 인공 지능 및 기계 학습입니다.

팀 콘델로 Amazon Web Services의 수석 AI/ML 전문가 솔루션 아키텍트입니다. 그의 초점은 자연어 처리와 컴퓨터 비전입니다. Tim은 고객의 아이디어를 확장 가능한 솔루션으로 전환하는 것을 즐깁니다.

타임 스탬프 : 2022 년 11 월 3 일2022 년 11 월 4 일

타임 스탬프 : 2023 년 5 월 2 일

보험 업계에서 AWS AI 서비스를 사용한 지능형 문서 처리: 1부

플라톤에 의해 재발행

솔루션 개요

사전 조건

데이터 캡처 단계

분류 단계

추출 단계

CMS-1500 청구 양식에서 데이터 추출

신분증에서 데이터 추출

송장 및 영수증에서 데이터 추출

결론

저자에 관하여

더보기 AWS 기계 학습

Amazon SageMaker Python SDK를 사용하여 Amazon SageMaker 오프라인 Feature Store에서 기계 학습 지원 데이터 세트 구축 | 아마존 웹 서비스

PGA TOUR의 생성적 AI 가상 비서의 여정, 컨셉부터 개발, 프로토타입까지 | 아마존 웹 서비스

소매 업계에서 Amazon Forecast 구현: POC에서 생산으로의 여정

Amazon Personalize에서 비즈니스 규칙을 사용하여 특정 항목을 홍보하여 권장 사항 사용자 지정

Anthropic Claude를 위한 AWS Generative AI Innovation Center의 사용자 지정 모델 프로그램 소개 | 아마존 웹 서비스

Amazon Translate로 구축된 사용자 지정 가능한 번역 솔루션으로 다국어 워크플로 가속화

SageMaker의 모델 호스팅 패턴: SageMaker에서 모델을 테스트하고 업데이트하는 모범 사례

TensorBoard를 사용한 Amazon SageMaker: 호스팅된 TensorBoard 환경 개요

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정