의료 데이터는 복잡하고 격리되어 있으며 다양한 형식으로 존재합니다. 조직 내 데이터의 약 80%는 텍스트, 이메일, PDF 및 스캔한 문서 안에 잠겨 있는 구조화되지 않은 또는 "다크" 데이터로 간주됩니다. 이 데이터는 프로그래밍 방식으로 해석하거나 분석하기 어렵고 조직이 데이터에서 통찰력을 얻고 고객에게 보다 효과적으로 서비스를 제공하는 방법을 제한합니다. 빠른 데이터 생성 속도는 문서 자동화에 투자하지 않는 조직이 수동적이고 느리고 오류가 발생하기 쉽고 확장하기 어려운 레거시 프로세스에 얽매일 위험이 있음을 의미합니다.
이 게시물에서는 이전에 미개척된 PDF와 필기 임상 노트 및 데이터의 수집 및 변환을 자동화하는 솔루션을 제안합니다. 다음을 사용하여 고객 임상 데이터 차트에서 정보를 추출하는 방법을 설명합니다. 아마존 텍사스그런 다음 추출된 원시 텍스트를 사용하여 다음을 사용하여 개별 데이터 요소를 식별합니다. 아마존 종합 의료. FHIR(Fast Healthcare Interoperability Resources) 호환 형식으로 최종 출력을 저장합니다. 아마존 헬스 레이크, 다운스트림 분석에 사용할 수 있습니다.
솔루션 개요
AWS는 의료 서비스 제공자가 데이터의 가치를 활용할 수 있도록 다양한 서비스와 솔루션을 제공합니다. 우리 솔루션의 경우 Amazon Textract를 통해 작은 문서 샘플을 처리하고 추출된 데이터를 Amazon HealthLake에서 적절한 FHIR 리소스로 로드합니다. FHIR 변환을 위한 사용자 지정 프로세스를 생성하고 엔드 투 엔드로 테스트합니다.
데이터가 먼저 로드됩니다. DocumentReference
. 그런 다음 Amazon HealthLake는 이 구조화되지 않은 텍스트를 DocumentReference
에 로드 Condition
, MedicationStatement
및 Observation
자원. FHIR 리소스 내에서 환자 ID, 서비스 날짜, 공급자 유형 및 의료 시설 이름과 같은 몇 가지 데이터 필드를 식별합니다.
A MedicationStatement
환자가 복용하고 있는 약물에 대한 기록입니다. 이는 환자가 현재 약을 복용 중이거나, 과거에 약을 복용했거나, 미래에 약을 복용할 것임을 나타낼 수 있습니다. 이 정보가 캡처되는 일반적인 시나리오는 환자 방문 또는 체류 과정에서 병력 수집 프로세스 중에 발생합니다. 약물 정보의 출처는 환자의 기억, 처방약 병 또는 환자, 임상의 또는 다른 당사자가 유지하는 약물 목록일 수 있습니다.
Observations
진단을 지원하고, 진행 상황을 모니터링하고, 기준선과 패턴을 결정하고, 인구통계학적 특성을 포착하는 데 사용되는 의료 분야의 핵심 요소입니다. 대부분의 관찰은 일부 메타데이터가 포함된 단순한 이름/값 쌍 어설션이지만 일부 관찰은 다른 관찰을 논리적으로 함께 그룹화하거나 다중 구성 요소 관찰일 수도 있습니다.
XNUMXD덴탈의 Condition
리소스는 상태, 문제, 진단 또는 기타 사건, 상황, 문제 또는 우려 수준이 된 임상 개념에 대한 자세한 정보를 기록하는 데 사용됩니다. 조건은 만남의 맥락에서 특정 시점 진단, 의사의 문제 목록에 있는 항목 또는 의사의 문제 목록에 없는 문제일 수 있습니다.
다음 다이어그램은 Amazon HealthLake에서 AI 및 기계 학습(ML) 분석을 위해 구조화되지 않은 데이터를 FHIR로 마이그레이션하는 워크플로를 보여줍니다.
워크플로 단계는 다음과 같습니다.
- 문서가 아마존 단순 스토리지 서비스 (Amazon S3) 버킷.
- Amazon S3의 문서 업로드는 AWS 람다 기능.
- Lambda 함수는 이미지를 Amazon Textract로 보냅니다.
- Amazon Textract는 이미지에서 텍스트를 추출하고 별도의 Amazon Textract 출력 S3 버킷에 출력을 저장합니다.
- 최종 결과는 특정 FHIR 리소스로 저장됩니다(추출된 텍스트는
DocumentReference
base64로 인코딩된 텍스트로) Amazon HealthLake에서 쉽게 검색하고 쿼리할 수 있도록 통합 Amazon Comprehend Medical을 사용하여 구조화되지 않은 데이터에서 의미를 추출합니다. - 사용자는 다음을 사용하여 의미 있는 분석을 생성하고 대화형 분석을 실행할 수 있습니다. 아마존 아테나.
- 사용자는 다음을 사용하여 시각화를 구축하고 임시 분석을 수행하며 신속하게 비즈니스 통찰력을 얻을 수 있습니다. 아마존 퀵 사이트.
- 사용자는 다음을 사용하여 건강 데이터로 예측할 수 있습니다. 아마존 세이지 메이커 ML 모델.
사전 조건
이 게시물은 다음 서비스에 익숙하다고 가정합니다.
기본적으로 Amazon HealthLake 내의 통합 Amazon Comprehend Medical NLP(자연어 처리) 기능은 AWS 계정에서 비활성화되어 있습니다. 활성화하려면 계정 ID, AWS 리전 및 Amazon HealthLake 데이터 스토어 ARN과 함께 지원 사례를 제출하십시오. 자세한 내용은 다음을 참조하십시오. HealthLake의 통합 자연어 처리 기능을 어떻게 켜나요?.
자세한 내용은 GitHub 레포 자세한 배포 세부 정보는
솔루션 아키텍처 배포
솔루션을 설정하려면 다음 단계를 완료하십시오.
- 클론 GitHub 레포, 운영
cdk deploy PdfMapperToFhirWorkflow
명령 프롬프트 또는 터미널에서 README 파일을 따릅니다. 배포는 약 30분 후에 완료됩니다. - Amazon S3 콘솔에서 다음으로 시작하는 버킷으로 이동합니다.
pdfmappertofhirworkflow
-의 일부로 생성되었습니다.cdk deploy
. - 버킷 내부에 uploads라는 폴더를 만들고 샘플 PDF를 업로드합니다(샘플의료기록.pdf).
문서 업로드가 성공하는 즉시 파이프라인이 트리거되고 여러 AWS 도구를 사용하여 쿼리할 수 있는 Amazon HealthLake에서 데이터를 볼 수 있습니다.
데이터 쿼리
데이터를 탐색하려면 다음 단계를 완료하세요.
- CloudWatch 콘솔에서 다음을 검색합니다.
HealthlakeTextract
로그 그룹. - 로그 그룹 세부 정보에서 처리한 문서의 고유 ID를 기록해 둡니다.
- Amazon HealthLake 콘솔에서 다음을 선택합니다. 데이터 저장소 탐색 창에서
- 데이터 저장소를 선택하고 쿼리 실행.
- 럭셔리 쿼리 유형선택한다. GET으로 검색.
- 럭셔리 자원 유형선택한다. 문서 참조.
- 럭셔리 검색 매개변수, 관련된 매개변수 및 값을 입력합니다.
DocumentReference/
고유 ID. - 왼쪽 메뉴에서 쿼리 실행.
- . 응답 본문 섹션에서 리소스 섹션을 최소화하여 XNUMX페이지 PDF 문서용으로 생성된 XNUMX개 리소스만 볼 수 있습니다.
- 다음 스크린샷은 Amazon Comprehend Medical 및 NLP가 활성화된 통합 분석을 보여줍니다. 왼쪽의 스크린샷은 원본 PDF입니다. 오른쪽 스크린샷은 Amazon HealthLake의 NLP 결과입니다.
- 다음을 사용하여 쿼리를 실행할 수도 있습니다. 쿼리 유형 로 설정 읽기 및 자원 유형 로 설정 상태 적절한 리소스 ID를 사용합니다.
다음 스크린샷은 쿼리 결과를 보여줍니다. - Athena 콘솔에서 다음 쿼리를 실행합니다.
마찬가지로 쿼리할 수 있습니다. MedicationStatement
, Condition
및 Observation
자원.
정리
이 솔루션 사용을 마친 후 다음을 실행하십시오. cdk destroy PdfMapperToFhirWorkflow
추가 비용이 발생하지 않도록 합니다. 자세한 내용은 다음을 참조하십시오. AWS CDK 도구 키트(cdk 명령).
결론
AWS AI 서비스와 Amazon HealthLake는 구조화되지 않은 의료 데이터의 통찰력을 저장, 변환, 쿼리 및 분석하는 데 도움이 될 수 있습니다. 이 게시물에서는 PDF 임상 차트만 다루었지만 솔루션을 다른 유형의 의료 PDF, 이미지 및 필기 메모로 확장할 수 있습니다. 데이터가 텍스트 형식으로 추출되고 Amazon Comprehend Medical을 사용하여 개별 데이터 요소로 구문 분석되고 Amazon HealthLake에 저장되면 의미 있고 실행 가능한 의료 정보를 구동하고 궁극적으로 환자 건강 결과를 개선하기 위해 다운스트림 시스템에 의해 더욱 보강될 수 있습니다.
제안된 솔루션은 서버 인프라의 배포 및 유지 관리가 필요하지 않습니다. 모든 서비스는 AWS 또는 서버리스에서 관리합니다. AWS의 사용한 만큼 지불하는 청구 모델과 서비스의 깊이와 폭을 통해 초기 설정 및 실험에 드는 비용과 노력이 기존의 온프레미스 대안보다 훨씬 적습니다.
추가 리소스
Amazon HealthLake에 대한 자세한 내용은 다음을 참조하십시오.
저자에 관하여
쉬라반 부르푸투르 AWS의 선임 솔루션 아키텍트입니다. 신뢰할 수 있는 고객 옹호자로서 그는 조직이 고급 클라우드 기반 아키텍처에 대한 모범 사례를 이해하도록 돕고 교육, 교육, 설계 및 클라우드 솔루션 구축에 대한 열정을 통해 광범위한 기업 고객에게 성공적인 비즈니스 결과를 추진하는 데 도움이 되는 전략에 대한 조언을 제공합니다. 여가 시간에는 독서, 가족과 시간 보내기, 요리하기를 즐깁니다.
라파엘 M. 코이케 남동부의 엔터프라이즈 고객을 지원하는 AWS의 수석 솔루션 설계자이며 스토리지 및 보안 기술 필드 커뮤니티의 일원입니다. Rafael은 구축에 대한 열정이 있으며 보안, 스토리지, 네트워킹 및 애플리케이션 개발에 대한 그의 전문 지식은 고객이 클라우드로 안전하고 빠르게 이동하도록 돕는 데 중요한 역할을 했습니다.
랜디어 겔롯 AWS의 주요 고객 솔루션 관리자입니다. Randheer는 AI/ML 및 HCLS 산업 내 응용 프로그램에 열정적입니다. AWS 빌더로서 대기업과 협력하여 클라우드로의 전략적 마이그레이션을 설계 및 신속하게 구현하고 최신 클라우드 네이티브 솔루션을 구축합니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoAiStream. Web3 데이터 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 미래 만들기 w Adryenn Ashley. 여기에서 액세스하십시오.
- PREIPO®로 PRE-IPO 회사의 주식을 사고 팔 수 있습니다. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- :있다
- :이다
- :어디
- $UP
- 30
- 7
- a
- 소개
- 계정
- 가로질러
- Ad
- 추가
- 많은
- 조언
- 변호사
- 후
- AI
- AI 서비스
- AI / ML
- All
- 또한
- 대안
- 이기는하지만
- 아마존
- 아마존 이해
- 아마존 종합 의료
- 아마존 헬스 레이크
- 아마존 텍사스
- an
- 복수
- 분석
- 분석
- 분석하다
- 및
- 어플리케이션
- 애플리케이션 개발
- 적당한
- 대략
- 있군요
- 약
- AS
- At
- 오토마타
- 자동화
- 가능
- AWS
- BE
- 된
- 존재
- BEST
- 모범 사례
- 청구
- 폭
- 넓은
- 빌드
- 건축업자
- 건물
- 사업
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- by
- 라는
- CAN
- 포착
- 케이스
- 중심적인
- 특성
- 요금
- 거래차트
- 차트
- 왼쪽 메뉴에서
- 객관적인
- 클라우드
- 암호
- 공통의
- 커뮤니티
- 호환
- 완전한
- 복잡한
- 이해하다
- 개념
- 관심
- 조건
- 고려
- 콘솔에서
- 소비
- 문맥
- 매출 상승
- 비용
- 수
- 코스
- 적용
- 만들
- 만든
- 생성
- 관습
- 고객
- 고객 솔루션
- 고객
- 데이터
- 날짜
- 태만
- 인구학의
- 배포
- 전개
- 깊이
- 디자인
- 설계
- 파괴
- 상세한
- 세부설명
- 결정
- 개발
- 어려운
- 사용
- 발견
- do
- 문서
- 문서 자동화
- 서류
- 하지 않습니다
- 한
- 말라
- 아래 (down)
- 드라이브
- ...동안
- 동쪽
- 쉽게
- 교육
- 효과적으로
- 노력
- 중
- 요소
- 요소
- 이메일
- 가능
- 사용 가능
- end
- 풍성한
- 확인
- 엔터 버튼
- Enterprise
- 기업
- 오류
- 예상
- 조차
- 이벤트
- 있다
- 존재
- 전문적 지식
- 설명
- 탐험
- 확장
- 추출물
- 추출물
- 포함내용
- 정통
- 가족
- FAST
- 를
- 들
- Fields
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 최후의
- 먼저,
- 따라
- 수행원
- 다음
- 럭셔리
- 형태
- 체재
- 에
- 기능
- 추가
- 미래
- 세대
- 얻을
- 점점
- 그룹
- he
- 건강
- 건강 관리
- 도움
- 도움이
- 도움이
- 그의
- 방법
- How To
- HTML
- HTTP
- HTTPS
- i
- ID
- 확인
- 영상
- 형상
- 구현
- 개선
- in
- 표시
- 산업
- 정보
- 인프라
- 처음에는
- 통찰력
- 조격
- 통합 된
- 대화형
- 상호 운용성
- 으로
- 투자
- 발행물
- IT
- 그
- JPG
- 다만
- 언어
- 넓은
- 대기업
- 배우기
- 왼쪽 (left)
- 유산
- 레벨
- 처럼
- 제한
- 명부
- 하중
- 잔뜩
- 고정
- 기록
- 절감
- 기계
- 기계 학습
- 유지
- 유지
- 확인
- 유튜브 영상을 만드는 것은
- 관리
- 매니저
- 조작
- XNUMX월..
- 의미
- 의미있는
- 방법
- 의료
- 메모리
- 메타 데이터
- 이전
- 회의록
- ML
- 모델
- 모델
- 현대
- 모니터
- 배우기
- 가장
- 움직임
- name
- 자연의
- 자연 언어 처리
- 이동
- 카테고리
- 네트워킹
- nlp
- 노트
- 지금
- of
- on
- 만
- or
- 조직
- 기타
- 우리의
- 결과
- 출력
- 빵
- 매개 변수
- 부품
- 파티
- 열정
- 열렬한
- 과거
- 환자
- 패턴
- 수행
- 관로
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 게시하다
- 사례
- 예측
- 처방
- 이전에
- 교장
- 문제
- 방법
- 처리됨
- 프로세스
- 처리
- 진행
- 제안
- 제안 된
- 공급자
- 제공
- 제공
- 빨리
- 라파엘
- 빠른
- 빠르게
- 율
- 살갗이 벗어 진
- 읽기
- 기록
- 지방
- 필요
- 의지
- 제품 자료
- 결과
- 결과
- 부활
- 위험
- 달리기
- 규모
- 대본
- 검색
- 섹션
- 섹션
- 안전하게
- 보안
- 보고
- 전송
- 연장자
- 별도의
- 서브
- 서버리스
- 서비스
- 서비스
- 세트
- 설치
- 몇몇의
- 쇼
- 크게
- 단순, 간단, 편리
- 사태
- SIX
- 느리게
- 작은
- 해결책
- 솔루션
- 일부
- 출처
- 남쪽
- 구체적인
- 지출
- 스타트
- 시작 중
- 유지
- 단계
- 저장
- 저장
- 저장
- 상점
- 전략의
- 전략들
- 제출
- 성공한
- SUPPORT
- 지원
- 시스템은
- 복용
- 테크니컬
- 단말기
- test
- 보다
- 그
- XNUMXD덴탈의
- 미래
- 소스
- 그들의
- 그때
- 이
- 을 통하여
- 시간
- 에
- 함께
- 툴킷
- 검색을
- 전통적인
- 트레이닝
- 변환
- 변환
- 트리거
- 신뢰할 수있는
- 회전
- 유형
- 유형
- 궁극적으로
- 이해
- 유일한
- 잠금을 해제
- 미개척
- 업로드
- 사용
- 익숙한
- 사용
- 가치
- 종류
- 여러
- 관측
- 방문
- 였다
- we
- 했다
- 어느
- 의지
- 과
- 이내
- 일
- 자신의
- 너의
- 제퍼 넷