医疗保健数据复杂且孤立,并以各种格式存在。 据估计,组织内 80% 的数据被认为是锁定在文本、电子邮件、PDF 和扫描文档中的非结构化或“暗”数据。 这些数据很难以编程方式解释或分析,并且限制了组织如何从中获得洞察力并更有效地为客户服务。 数据生成速度之快意味着没有投资于文档自动化的组织可能会陷入手动、缓慢、容易出错且难以扩展的旧流程。
在这篇文章中,我们提出了一个解决方案,可以自动摄取和转换以前未开发的 PDF 和手写的临床笔记和数据。 我们解释了如何使用以下方法从客户临床数据图表中提取信息 亚马逊Textract,然后使用原始提取的文本来识别离散数据元素,使用 亚马逊领悟医疗. 我们将最终输出存储在 Fast Healthcare Interoperability Resources (FHIR) 兼容格式中 亚马逊健康湖,使其可用于下游分析。
解决方案概述
AWS 为医疗保健提供商提供各种服务和解决方案,以释放其数据的价值。 对于我们的解决方案,我们通过 Amazon Textract 处理一小部分文档样本,并将提取的数据作为适当的 FHIR 资源加载到 Amazon HealthLake 中。 我们为 FHIR 转换创建自定义流程并对其进行端到端测试。
数据首先加载到 DocumentReference
. Amazon HealthLake 然后在处理此非结构化文本后创建系统生成的资源 DocumentReference
并将其加载到 Condition
, MedicationStatement
及 Observation
资源。 我们在 FHIR 资源中识别了一些数据字段,例如患者 ID、服务日期、提供者类型和医疗机构名称。
A MedicationStatement
是患者服用药物的记录。 它可能表明患者现在正在服用药物、过去服用过药物或将来会服用药物。 捕获此信息的常见场景是在患者就诊或住院期间的病史采集过程中。 药物信息的来源可以是患者的记忆、处方药瓶,或者来自患者、临床医生或其他方维护的药物列表。
Observations
是医疗保健的核心要素,用于支持诊断、监测进展、确定基线和模式,甚至捕捉人口统计特征。 大多数观察是带有一些元数据的简单的名称/值对断言,但一些观察在逻辑上将其他观察组合在一起,或者甚至可能是多组件观察。
Condition
资源用于记录有关已上升到关注级别的状况、问题、诊断或其他事件、情况、问题或临床概念的详细信息。 条件可以是遇到的上下文中的时间点诊断、从业者问题列表中的项目或从业者问题列表中不存在的问题。
下图显示了将非结构化数据迁移到 FHIR 以在 Amazon HealthLake 中进行 AI 和机器学习 (ML) 分析的工作流。
工作流程步骤如下:
- 文件上传到 亚马逊简单存储服务 (Amazon S3)存储桶。
- Amazon S3 中的文档上传会触发一个 AWS Lambda 功能。
- Lambda 函数将图像发送到 Amazon Textract。
- Amazon Textract 从图像中提取文本并将输出存储在单独的 Amazon Textract 输出 S3 存储桶中。
- 最终结果存储为特定的 FHIR 资源(提取的文本加载到
DocumentReference
作为 base64 编码文本)在 Amazon HealthLake 中使用集成的 Amazon Comprehend Medical 从非结构化数据中提取意义,以便于搜索和查询。 - 用户可以使用创建有意义的分析并运行交互式分析 亚马逊雅典娜.
- 用户可以构建可视化效果、执行临时分析并快速获得业务见解 亚马逊QuickSight.
- 用户可以使用健康数据进行预测 亚马逊SageMaker 机器学习模型。
先决条件
这篇文章假设您熟悉以下服务:
默认情况下,Amazon HealthLake 中集成的 Amazon Comprehend Medical 自然语言处理 (NLP) 功能在您的 AWS 账户中处于禁用状态。 要启用它,请提交包含您的账户 ID、AWS 区域和 Amazon HealthLake 数据存储 ARN 的支持案例。 有关详细信息,请参阅 如何打开 HealthLake 的集成自然语言处理功能.
参考 GitHub回购 有关更多部署详细信息。
部署解决方案架构
要设置解决方案,请完成以下步骤:
- 克隆 GitHub回购, 跑
cdk deploy PdfMapperToFhirWorkflow
从您的命令提示符或终端并按照 README 文件进行操作。 部署将在大约 30 分钟内完成。 - 在 Amazon S3 控制台上,导航到以
pdfmappertofhirworkflow
-,这是作为的一部分创建的cdk deploy
. - 在存储桶内,创建一个名为 uploads 的文件夹并上传示例 PDF (病历样本.pdf).
一旦文档上传成功,它就会触发管道,您可以开始在 Amazon HealthLake 中查看数据,您可以使用多种 AWS 工具查询这些数据。
查询数据
要探索您的数据,请完成以下步骤:
- 在 CloudWatch 控制台上,搜索
HealthlakeTextract
日志组。 - 在日志组详细信息中,记下您处理的文档的唯一 ID。
- 在 Amazon HealthLake 控制台上,选择 数据存储 在导航窗格中。
- 选择您的数据存储并选择 运行查询.
- 针对 查询类型,选择 使用 GET 搜索.
- 针对 资源类型,选择 参考文献.
- 针对 搜索参数, 输入相关参数和值
DocumentReference/
唯一身份。 - 运行查询.
- 在 响应体 部分,最小化资源部分以仅查看为六页 PDF 文档创建的六个资源。
- 以下屏幕截图显示了启用了 Amazon Comprehend Medical 和 NLP 的集成分析。 左边的截图是源PDF; 右边的截图是来自 Amazon HealthLake 的 NLP 结果。
- 您还可以运行查询 查询类型 设置 阅读 和 资源类型 设置 Condition 使用适当的资源 ID。
以下屏幕截图显示了查询结果。 - 在 Athena 控制台上,运行以下查询:
同样可以查询 MedicationStatement
, Condition
及 Observation
资源。
清理
使用完此解决方案后,运行 cdk destroy PdfMapperToFhirWorkflow
以确保您不会产生额外费用。 有关详细信息,请参阅 AWS CDK 工具包(cdk 命令).
结论
AWS AI 服务和 Amazon HealthLake 可以帮助存储、转换、查询和分析来自非结构化医疗保健数据的见解。 尽管这篇文章仅涵盖 PDF 临床图表,但您可以将解决方案扩展到其他类型的医疗保健 PDF、图像和手写笔记。 在将数据提取为文本形式、使用 Amazon Comprehend Medical 解析为离散数据元素并存储在 Amazon HealthLake 中之后,下游系统可以进一步丰富数据,以驱动有意义且可操作的医疗保健信息,并最终改善患者的健康结果。
建议的解决方案不需要部署和维护服务器基础设施。 所有服务都由 AWS 或无服务器管理。 借助 AWS 的即用即付计费模式及其服务的深度和广度,初始设置和试验的成本和工作量大大低于传统的本地替代方案。
额外的资源
有关 Amazon HealthLake 的更多信息,请参阅以下内容:
作者简介
什拉万·沃尔普图尔 是 AWS 的高级解决方案架构师。 作为值得信赖的客户倡导者,他帮助组织了解围绕先进的基于云的架构的最佳实践,并提供战略建议,通过他对教育、培训、设计和构建云的热情,帮助在广泛的企业客户中推动成功的业务成果解决方案。 在业余时间,他喜欢阅读、与家人共度时光以及烹饪。
拉斐尔·小池 是 AWS 的首席解决方案架构师,为东南部的企业客户提供支持,并且是存储和安全技术领域社区的一员。 Rafael 热衷于构建,他在安全、存储、网络和应用程序开发方面的专业知识在帮助客户安全、快速地迁移到云方面发挥了重要作用。
兰德赫洛特 是 AWS 的首席客户解决方案经理。 Randheer 热衷于 AI/ML 及其在 HCLS 行业中的应用。 作为一名 AWS 建设者,他与大型企业合作,设计并快速实施向云的战略迁移,并构建现代的云原生解决方案。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- 使用 PREIPO® 买卖 PRE-IPO 公司的股票。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- :具有
- :是
- :在哪里
- $UP
- 30
- 7
- a
- 关于
- 账号管理
- 横过
- Ad
- 额外
- 高级
- 忠告
- 主张
- 后
- AI
- 人工智能服务
- AI / ML
- 所有类型
- 还
- 替代品
- 尽管
- Amazon
- 亚马逊领悟
- 亚马逊领悟医疗
- 亚马逊健康湖
- 亚马逊Textract
- an
- 检测值
- 分析
- 分析
- 分析
- 和
- 应用领域
- 应用程序开发
- 适当
- 约
- 保健
- 围绕
- AS
- At
- 自动化
- 自动化和干细胞工程
- 可使用
- AWS
- BE
- 很
- 作为
- 最佳
- 最佳实践
- 计费
- 宽度
- 广阔
- 建立
- 建设者
- 建筑物
- 商业
- 但是
- by
- 被称为
- CAN
- 捕获
- 案件
- 中央
- 特点
- 收费
- 图表
- 图表
- 临床资料
- 云端技术
- 码
- 相当常见
- 社体的一部分
- 兼容
- 完成
- 复杂
- 理解
- 概念
- 关心
- 流程条件
- 考虑
- 安慰
- 消费
- 上下文
- 转化
- 价格
- 可以
- 套餐
- 覆盖
- 创建信息图
- 创建
- 创建
- 习俗
- 顾客
- 客户解决方案
- 合作伙伴
- data
- 日期
- 默认
- 人口统计学
- 部署
- 部署
- 深度
- 设计
- 设计
- 摧毁
- 详细
- 详情
- 确定
- 研发支持
- 难
- 禁用
- 通过各种方式找到
- do
- 文件
- 文件自动化
- 文件
- 不会
- 完成
- 别
- 向下
- 驾驶
- ,我们将参加
- 东部
- 易
- 教育
- 只
- 努力
- 或
- element
- 分子
- 电子邮件
- enable
- 启用
- 结束
- 丰富
- 确保
- 输入
- 企业
- 企业
- 错误
- 估计
- 甚至
- 活动
- 存在
- 存在
- 专门知识
- 说明
- 探索
- 延长
- 提取
- 提取物
- 诊所
- 熟悉
- 家庭
- 高效率
- 少数
- 部分
- 字段
- 文件
- 最后
- (名字)
- 遵循
- 以下
- 如下
- 针对
- 申请
- 格式
- 止
- 功能
- 进一步
- 未来
- 代
- 得到
- 越来越
- 团队
- he
- 健康管理
- 医疗保健
- 帮助
- 帮助
- 帮助
- 他的
- 创新中心
- How To
- HTML
- HTTP
- HTTPS
- i
- ID
- 鉴定
- 图片
- 图片
- 实施
- 改善
- in
- 表明
- 行业中的应用:
- 信息
- 基础设施
- 初始
- 可行的洞见
- 仪器的
- 集成
- 互动
- 互操作性
- 成
- 投资
- 问题
- IT
- 它的
- JPG
- 只是
- 语言
- 大
- 大企业
- 学习
- 左
- 遗产
- Level
- 喜欢
- 范围
- 清单
- 加载
- 负载
- 锁定
- 日志
- 降低
- 机
- 机器学习
- 维护
- 保养
- 使
- 制作
- 管理
- 经理
- 手册
- 可能..
- 意
- 有意义的
- 手段
- 医生
- 内存
- 元数据
- 迁移
- 分钟
- ML
- 模型
- 模型
- 现代
- 显示器
- 更多
- 最先进的
- 移动
- 姓名
- 自然
- 自然语言处理
- 导航
- 旅游导航
- 工业网络
- NLP
- 现在
- of
- on
- 仅由
- or
- 组织
- 其他名称
- 我们的
- 结果
- 产量
- 面包
- 参数
- 部分
- 党
- 情
- 多情
- 过去
- 病人
- 模式
- 演出
- 管道
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 帖子
- 做法
- 预测
- 处方
- 先前
- 校长
- 市场问题
- 过程
- 处理
- 过程
- 处理
- 进展
- 提供
- 建议
- 提供者
- 供应商
- 提供
- 很快
- 拉斐尔
- 快
- 急速
- 率
- 原
- 阅读
- 记录
- 地区
- 要求
- 资源
- 资源
- 导致
- 成果
- 复活
- 风险
- 运行
- 鳞片
- 脚本
- 搜索
- 部分
- 部分
- 安全
- 保安
- 看到
- 发送
- 前辈
- 分开
- 服务
- 无服务器
- 服务
- 特色服务
- 集
- 格局
- 几个
- 作品
- 显著
- 简易
- 情况
- SIX
- 放慢
- 小
- 方案,
- 解决方案
- 一些
- 来源
- 南部
- 具体的
- 花费
- 开始
- 开始
- 留
- 步骤
- 存储
- 商店
- 存储
- 商店
- 善用
- 策略
- 提交
- 成功
- SUPPORT
- 支持
- 产品
- 服用
- 文案
- 终端
- test
- 比
- 这
- 未来
- 其
- 然后
- Free Introduction
- 通过
- 次
- 至
- 一起
- 工具箱
- 工具
- 传统
- 产品培训
- 改造
- 转型
- 触发
- 信任
- 转
- 类型
- 类型
- 最终
- 理解
- 独特
- 开锁
- 未开发
- 上传
- 使用
- 用过的
- 运用
- 折扣值
- 各种
- 各个
- 查看
- 参观
- 是
- we
- 为
- 这
- 将
- 中
- 合作
- 完全
- 您一站式解决方案
- 和风网