Медицинские данные сложны и разрознены и существуют в различных форматах. По оценкам, 80% данных в организациях считаются неструктурированными или «темными» данными, которые заблокированы внутри текста, электронных писем, PDF-файлов и отсканированных документов. Эти данные трудно интерпретировать или анализировать программно, и они ограничивают способы получения организациями информации и более эффективного обслуживания своих клиентов. Быстрая скорость генерации данных означает, что организации, которые не вкладывают средства в автоматизацию документооборота, рискуют застрять в устаревших процессах, которые являются ручными, медленными, подверженными ошибкам и трудно масштабируемыми.
В этом посте мы предлагаем решение, которое автоматизирует прием и преобразование ранее неиспользованных PDF-файлов, а также рукописных клинических заметок и данных. Мы объясняем, как извлекать информацию из карт клинических данных клиентов, используя Амазонка Текст, затем используйте необработанный извлеченный текст для идентификации дискретных элементов данных, используя Amazon Comprehend Medical. Мы сохраняем конечный результат в формате, совместимом с Fast Healthcare Interoperability Resources (FHIR), в Амазонка ЗдоровьеОзеро, делая его доступным для последующей аналитики.
Обзор решения
AWS предоставляет поставщикам медицинских услуг различные сервисы и решения, которые помогают раскрыть ценность их данных. В нашем решении мы обрабатываем небольшую выборку документов через Amazon Textract и загружаем эти извлеченные данные как соответствующие ресурсы FHIR в Amazon HealthLake. Мы создаем собственный процесс преобразования FHIR и тестируем его от начала до конца.
Данные сначала загружаются в DocumentReference
. Затем Amazon HealthLake создает системные ресурсы после обработки этого неструктурированного текста в DocumentReference
и загружает в Condition
, MedicationStatement
и Observation
Ресурсы. Мы идентифицируем несколько полей данных в ресурсах FHIR, таких как идентификатор пациента, дата обслуживания, тип поставщика и название медицинского учреждения.
A MedicationStatement
представляет собой запись о лекарстве, которое принимает пациент. Это может указывать на то, что пациент принимает лекарство сейчас, принимал лекарство в прошлом или будет принимать лекарство в будущем. Обычный сценарий, когда эта информация фиксируется, - это процесс сбора анамнеза во время визита пациента или пребывания. Источником информации о лекарствах может быть память пациента, бутылочка с рецептом или список лекарств, который ведет пациент, врач или другая сторона.
Observations
являются центральным элементом в здравоохранении, используемым для поддержки диагностики, мониторинга прогресса, определения исходных показателей и закономерностей и даже сбора демографических характеристик. Большинство наблюдений представляют собой простые утверждения пары имя/значение с некоторыми метаданными, но некоторые наблюдения логически группируют другие наблюдения или даже могут быть многокомпонентными наблюдениями.
Ассоциация Condition
Ресурс используется для записи подробной информации о состоянии, проблеме, диагнозе или другом событии, ситуации, проблеме или клинической концепции, которая поднялась до уровня беспокойства. Состояние может быть диагнозом на определенный момент времени в контексте встречи, пунктом в списке проблем практикующего врача или проблемой, которой нет в списке проблем практикующего врача.
На следующей схеме показан рабочий процесс переноса неструктурированных данных в FHIR для анализа ИИ и машинного обучения (ML) в Amazon HealthLake.
Этапы рабочего процесса следующие:
- Документ загружается в Простой сервис хранения Amazon (Amazon S3) ведро.
- Загрузка документа в Amazon S3 вызывает AWS Lambda функции.
- Функция Lambda отправляет изображение в Amazon Textract.
- Amazon Textract извлекает текст из изображения и сохраняет результат в отдельной корзине S3 вывода Amazon Textract.
- Окончательный результат сохраняется в виде конкретных ресурсов FHIR (извлеченный текст загружается в
DocumentReference
как текст в кодировке base64) в Amazon HealthLake для извлечения смысла из неструктурированных данных с помощью встроенного сервиса Amazon Comprehend Medical для удобного поиска и обработки запросов. - Пользователи могут создавать значимые анализы и запускать интерактивную аналитику, используя Амазонка Афина.
- Пользователи могут создавать визуализации, выполнять специальный анализ и быстро получать информацию о бизнесе, используя Amazon QuickSight.
- Пользователи могут делать прогнозы с данными о здоровье, используя Создатель мудреца Амазонки МЛ модели.
Предпосылки
Этот пост предполагает знакомство со следующими сервисами:
По умолчанию встроенная функция обработки естественного языка (NLP) Amazon Comprehend Medical в Amazon HealthLake отключена в вашей учетной записи AWS. Чтобы включить его, отправьте запрос в службу поддержки, указав идентификатор своей учетной записи, регион AWS и ARN хранилища данных Amazon HealthLake. Для получения дополнительной информации см. Как включить встроенную функцию обработки естественного языка HealthLake.
См. Репо GitHub для получения дополнительных сведений о развертывании.
Разверните архитектуру решения
Чтобы настроить решение, выполните следующие действия:
- Клонировать Репо GitHub, бежать
cdk deploy PdfMapperToFhirWorkflow
из командной строки или терминала и следуйте файлу README. Развертывание завершится примерно через 30 минут. - На консоли Amazon S3 перейдите к корзине, начиная с
pdfmappertofhirworkflow
- который был создан в рамкахcdk deploy
. - Внутри ведра создайте папку с именем uploads и загрузите образец PDF (Образец медицинской записи.pdf).
Как только загрузка документа будет успешной, конвейер запустится, и вы сможете увидеть данные в Amazon HealthLake, которые можно запрашивать с помощью нескольких инструментов AWS.
Запросить данные
Чтобы изучить данные, выполните следующие действия:
- В консоли CloudWatch найдите
HealthlakeTextract
группа журнала. - В сведениях о группе журнала запишите уникальный идентификатор документа, который вы обработали.
- В консоли Amazon HealthLake выберите Хранилища данных в навигационной панели.
- Выберите свое хранилище данных и выберите Выполнить запрос.
- Что касается Тип запроса, выберите Поиск с помощью ПОЛУЧИТЬ.
- Что касается Тип ресурса, выберите ДокументСсылка.
- Что касается Параметры поиска, введите параметр как относится к и значение как
DocumentReference/
Уникальный идентификатор. - Выберите Выполнить запрос.
- В Тело ответа раздел, сверните разделы ресурсов, чтобы просто просмотреть шесть ресурсов, созданных для шестистраничного документа PDF.
- На следующем снимке экрана показан интегрированный анализ с включенным Amazon Comprehend Medical и NLP. Скриншот слева — исходный PDF; скриншот справа — это результат NLP от Amazon HealthLake.
- Вы также можете запустить запрос с Тип запроса установить как Читать и Тип ресурса установить как состояние используя соответствующий идентификатор ресурса.
На следующем снимке экрана показаны результаты запроса. - На консоли Athena выполните следующий запрос:
Точно так же вы можете запросить MedicationStatement
, Condition
и Observation
Ресурсы.
Убирать
После того, как вы закончите использовать это решение, запустите cdk destroy PdfMapperToFhirWorkflow
чтобы избежать дополнительных расходов. Для получения дополнительной информации см. Набор инструментов AWS CDK (команда cdk).
Заключение
Сервисы искусственного интеллекта AWS и Amazon HealthLake помогают хранить, преобразовывать, запрашивать и анализировать ценные сведения из неструктурированных медицинских данных. Хотя в этом посте рассматривается только клиническая карта в формате PDF, вы можете распространить решение на другие типы медицинских PDF-файлов, изображений и рукописных заметок. После того как данные будут извлечены в текстовую форму, проанализированы на отдельные элементы данных с помощью Amazon Comprehend Medical и сохранены в Amazon HealthLake, они могут быть дополнительно обогащены нижестоящими системами для получения значимой и полезной медицинской информации и, в конечном итоге, для улучшения результатов лечения пациентов.
Предлагаемое решение не требует развертывания и обслуживания серверной инфраструктуры. Все сервисы либо управляются AWS, либо бессерверны. Благодаря модели выставления счетов AWS с оплатой по мере использования, а также широкому спектру услуг затраты и усилия на первоначальную настройку и экспериментирование значительно ниже, чем при использовании традиционных локальных альтернатив.
Дополнительные ресурсы
Дополнительные сведения об Amazon HealthLake см. в следующих источниках:
Об авторах
Шраван Вурпутур является старшим архитектором решений в AWS. Как доверенный защитник клиентов, он помогает организациям понять лучшие практики в отношении передовых облачных архитектур и дает советы по стратегиям, которые помогут добиться успешных результатов в бизнесе для широкого круга корпоративных клиентов благодаря своей страсти к обучению, обучению, проектированию и созданию облачных вычислений. решения. В свободное время любит читать, проводить время с семьей и готовить.
Рафаэль М. Койке является главным архитектором решений в AWS, поддерживающей корпоративных клиентов на юго-востоке, и является частью технического сообщества по хранению и безопасности. Рафаэль страстно любит строить, а его опыт в области безопасности, хранения данных, сетей и разработки приложений помог клиентам быстро и безопасно перейти в облако.
Рандхир Гехлот является главным менеджером по работе с клиентами в AWS. Randheer увлечен AI/ML и его применением в индустрии HCLS. Как разработчик AWS, он работает с крупными предприятиями над проектированием и быстрой реализацией стратегических миграций в облако и созданием современных облачных решений.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- ПлатонАйСтрим. Анализ данных Web3. Расширение знаний. Доступ здесь.
- Чеканка будущего с Эдриенн Эшли. Доступ здесь.
- Покупайте и продавайте акции компаний PREIPO® с помощью PREIPO®. Доступ здесь.
- Источник: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- :имеет
- :является
- :куда
- $UP
- 30
- 7
- a
- О нас
- Учетная запись
- через
- Ad
- дополнительный
- продвинутый
- совет
- адвокат
- После
- AI
- Услуги искусственного интеллекта
- AI / ML
- Все
- причислены
- альтернативы
- Несмотря на то, что
- Amazon
- Amazon Comprehend
- Amazon Comprehend Medical
- Амазонка ЗдоровьеОзеро
- Амазонка Текст
- an
- Анализ
- анализ
- аналитика
- анализировать
- и
- Применение
- Разработка приложения
- соответствующий
- примерно
- МЫ
- около
- AS
- At
- автоматы
- автоматизация
- доступен
- AWS
- BE
- было
- не являетесь
- ЛУЧШЕЕ
- лучшие практики
- биллинг
- ширина
- широкий
- строить
- строитель
- Строительство
- бизнес
- но
- by
- под названием
- CAN
- захватить
- случаев
- центральный
- характеристика
- расходы
- График
- Графики
- Выберите
- Клинический
- облако
- код
- Общий
- сообщество
- совместим
- полный
- комплекс
- постигать
- сама концепция
- Беспокойство
- состояние
- считается
- Консоли
- потребленный
- контекст
- Конверсия
- Цена
- может
- "Курс"
- покрытый
- Создайте
- создали
- создает
- изготовленный на заказ
- клиент
- Решения для клиентов
- Клиенты
- данным
- Время
- По умолчанию
- демографический
- развертывание
- развертывание
- глубина
- Проект
- проектирование
- уничтожить
- подробный
- подробнее
- Определять
- Развитие
- трудный
- инвалид
- обнаружить
- do
- документ
- Автоматизация документов
- Документация
- не
- сделанный
- Dont
- вниз
- управлять
- в течение
- восток
- легко
- обучение
- фактически
- усилие
- или
- элемент
- элементы
- Писем
- включить
- включен
- конец
- обогащенный
- обеспечивать
- Enter
- Предприятие
- предприятий
- ошибка
- к XNUMX году
- Даже
- События
- существовать
- существует
- опыта
- Объяснять
- Больше
- продлить
- извлечение
- Экстракты
- Объект
- фамильярность
- семья
- БЫСТРО
- несколько
- поле
- Поля
- Файл
- окончательный
- Во-первых,
- следовать
- после
- следующим образом
- Что касается
- форма
- формат
- от
- функция
- далее
- будущее
- поколение
- получить
- получающий
- группы
- he
- Медицина
- здравоохранение
- помощь
- помощь
- помогает
- его
- Как
- How To
- HTML
- HTTP
- HTTPS
- i
- ID
- определения
- изображение
- изображений
- осуществлять
- улучшать
- in
- указывать
- промышленность
- информация
- Инфраструктура
- начальный
- размышления
- инструментальный
- интегрированный
- интерактивный
- Взаимодействие
- в
- инвестирование
- вопрос
- IT
- ЕГО
- JPG
- всего
- язык
- большой
- Крупные предприятия
- изучение
- оставил
- Наследие
- уровень
- такое как
- рамки
- Список
- загрузка
- грузы
- запертый
- журнал
- ниже
- машина
- обучение с помощью машины
- поддерживает
- техническое обслуживание
- сделать
- Создание
- управляемого
- менеджер
- руководство
- Май..
- смысл
- значимым
- означает
- основным медицинским
- Память
- Метаданные
- мигрировать
- Минут
- ML
- модель
- Модели
- Модерн
- монитор
- БОЛЕЕ
- самых
- двигаться
- имя
- натуральный
- Обработка естественного языка
- Откройте
- Навигация
- сетей
- НЛП
- Заметки
- сейчас
- of
- on
- только
- or
- организации
- Другое
- наши
- Результаты
- выходной
- хлеб
- параметр
- часть
- вечеринка
- страсть
- страстный
- мимо
- пациент
- паттеранами
- Выполнять
- трубопровод
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- После
- практиками
- Predictions
- рецепт
- предварительно
- Основной
- Проблема
- процесс
- Обработанный
- Процессы
- обработка
- Прогресс
- предлагает
- предложило
- Недвижимости
- поставщики
- приводит
- быстро
- Рафаэль
- быстро
- быстро
- Обменный курс
- Сырье
- Reading
- запись
- область
- требовать
- ресурс
- Полезные ресурсы
- результат
- Итоги
- Risen
- Снижение
- Run
- Шкала
- сценарий
- Поиск
- Раздел
- разделах
- безопасно
- безопасность
- видя
- посылает
- старший
- отдельный
- служить
- Serverless
- обслуживание
- Услуги
- набор
- установка
- несколько
- Шоу
- существенно
- просто
- ситуация
- ШЕСТЬ
- медленной
- небольшой
- Решение
- Решения
- некоторые
- Источник
- Южная
- конкретный
- Расходы
- Начало
- Начало
- оставаться
- Шаги
- диск
- магазин
- хранить
- магазины
- Стратегический
- стратегий
- отправить
- успешный
- поддержка
- поддержки
- системы
- с
- Технический
- Терминал
- тестXNUMX
- чем
- который
- Ассоциация
- Будущее
- Источник
- их
- тогда
- этой
- Через
- время
- в
- вместе
- Инструментарий
- инструменты
- традиционный
- Обучение
- Transform
- трансформация
- вызвать
- надежных
- ОЧЕРЕДЬ
- напишите
- Типы
- В конечном счете
- понимать
- созданного
- отпереть
- неиспользованный
- загружено
- использование
- используемый
- через
- ценностное
- разнообразие
- различный
- Вид
- Войти
- законопроект
- we
- были
- , которые
- будете
- в
- работает
- Ты
- ВАШЕ
- зефирнет