Развертывание больших языковых моделей для использования в сфере здравоохранения на Amazon SageMaker

Переиздано Платоном

Читают: 0

В 2021, Фармацевтическая промышленность принесла в США доход в $550 млрд.. Фармацевтические компании продают на рынке множество различных, часто новых, лекарств, при которых иногда могут возникнуть непреднамеренные, но серьезные побочные эффекты.

Об этих событиях можно сообщать где угодно, из больниц или дома, и их необходимо ответственно и эффективно отслеживать. Традиционная ручная обработка нежелательных явлений усложняется из-за растущего объема медицинских данных и затрат. В целом к 384 году прогнозируемые затраты на деятельность по фармаконадзору для всей отрасли здравоохранения составят 2022 миллиарда долларов. Для поддержки всеобъемлющей деятельности по фармаконадзору наши фармацевтические клиенты хотят использовать возможности машинного обучения (МО) для автоматизации обнаружения нежелательных явлений из различных источников данных. , такие как ленты социальных сетей, телефонные звонки, электронные письма и рукописные заметки, и запускать соответствующие действия.

В этом посте мы покажем, как разработать решение на основе машинного обучения с использованием Создатель мудреца Амазонки для выявления нежелательных явлений с использованием общедоступного набора данных о побочных реакциях на лекарства на Hugging Face. В этом решении мы настраиваем различные модели Hugging Face, предварительно обученные на медицинских данных, и используем модель BioBERT, предварительно обученную на Опубликованный набор данных и показывает лучшие результаты из опробованных.

Мы реализовали решение с помощью Комплект для разработки облачных сервисов AWS (AWS CDK). Однако в этом посте мы не рассматриваем особенности построения решения. Дополнительную информацию о реализации этого решения см. Создайте систему для выявления нежелательных явлений в режиме реального времени с помощью Amazon SageMaker и Amazon QuickSight..

Этот пост посвящен нескольким ключевым областям, обеспечивая всестороннее исследование следующих тем:

Проблемы с данными, с которыми сталкиваются профессиональные сервисы AWS
Ландшафт и применение больших языковых моделей (LLM):
- Трансформаторы, BERT и GPT
- Обнимая лицо
Точно настроенное решение LLM и его компоненты:
- Подготовка данных
- Модельное обучение

Проблема с данными

Неравномерность данных часто является проблемой при решении задач классификации. В идеале вам хотелось бы иметь сбалансированный набор данных, и этот вариант использования не является исключением.

Мы устраняем этот перекос с помощью генеративный ИИ модели (Falcon-7B и Falcon-40B), которым предлагалось генерировать выборки событий на основе пяти примеров из обучающего набора для повышения семантического разнообразия и увеличения размера выборки помеченных нежелательных явлений. Нам выгодно использовать здесь модели Falcon, потому что, в отличие от некоторых LLM на Hugging Face, Falcon предоставляет вам набор обучающих данных, которые они используют, поэтому вы можете быть уверены, что ни один из ваших примеров тестового набора не содержится в обучающем наборе Falcon, и избегайте данных. загрязнение.

Другая проблема с данными для клиентов здравоохранения — это требования соответствия HIPAA. Для удовлетворения этих требований в решение должно быть включено шифрование при хранении и передаче.

Трансформаторы, BERT и GPT

Архитектура преобразователя — это архитектура нейронной сети, которая используется для задач обработки естественного языка (NLP). Впервые он был представлен в статье «Внимание - все, что вам нужно» Васвани и др. (2017). Архитектура преобразователя основана на механизме внимания, который позволяет модели изучать долгосрочные зависимости между словами. Трансформаторы, как указано в оригинальной статье, состоят из двух основных компонентов: кодера и декодера. Кодер принимает входную последовательность в качестве входных данных и создает последовательность скрытых состояний. Затем декодер принимает эти скрытые состояния в качестве входных данных и создает выходную последовательность. Механизм внимания используется как в кодере, так и в декодере. Механизм внимания позволяет модели обращать внимание на определенные слова во входной последовательности при создании выходной последовательности. Это позволяет модели изучать долгосрочные зависимости между словами, что важно для многих задач НЛП, таких как машинный перевод и обобщение текста.

Одна из наиболее популярных и полезных архитектур преобразователей, двунаправленные представления кодировщиков из трансформаторов (BERT), представляет собой модель языкового представления, которая была представлен в 2018 году. BERT обучается на последовательностях, в которых некоторые слова в предложении замаскированы, и ему приходится заполнять эти слова, принимая во внимание слова до и после замаскированных слов. BERT можно настроить для различных задач НЛП, включая ответы на вопросы, вывод на естественном языке и анализ настроений.

Другая популярная архитектура трансформаторов, покорившая мир, — это генеративный предварительно обученный трансформатор (GPT). Первая модель GPT была представлен OpenAI в 2018 году. Он работает, обучаясь строго предсказывать следующее слово в последовательности, зная только контекст перед словом. Модели GPT обучаются на огромном наборе данных текста и кода, и их можно точно настроить для ряда задач НЛП, включая генерацию текста, ответы на вопросы и обобщение.

В целом BERT лучше справляется с задачами, требующими более глубокого понимания контекста слов, тогда как GPT лучше подходит для задач, требующих создания текста..

Обнимая лицо

Hugging Face — компания искусственного интеллекта, специализирующаяся на НЛП. Он предоставляет платформу с инструментами и ресурсами, которые позволяют разработчикам создавать, обучать и развертывать модели машинного обучения, ориентированные на задачи НЛП. Одним из ключевых предложений Hugging Face является его библиотека. Трансформаторы, который включает предварительно обученные модели, которые можно настроить для различных языковых задач, таких как классификация текста, перевод, обобщение и ответы на вопросы.

Hugging Face легко интегрируется с SageMaker — полностью управляемым сервисом, который позволяет разработчикам и специалистам по обработке данных создавать, обучать и развертывать модели машинного обучения в любом масштабе. Эта синергия приносит пользу пользователям, предоставляя надежную и масштабируемую инфраструктуру для решения задач НЛП с помощью самых современных моделей, которые предлагает Hugging Face, в сочетании с мощными и гибкими сервисами машинного обучения от AWS. Вы также можете получить доступ к моделям Hugging Face непосредственно из Amazon SageMaker JumpStart, что позволяет удобно начинать с готовых решений.

Обзор решения

Мы использовали библиотеку Hugging Face Transformers для точной настройки моделей трансформаторов в SageMaker для классификации неблагоприятных событий. Учебное задание создается с использованием оценщика SageMaker PyTorch. SageMaker JumpStart также имеет несколько дополнительных интеграций с Hugging Face, которые упрощает внедрение. В этом разделе мы описываем основные этапы подготовки данных и обучения модели.

Подготовка данных

Мы использовали данные о побочных реакциях на лекарства (ade_corpus_v2) в наборе данных Hugging Face с разделением обучения/тестирования 80/20. Требуемая структура данных для обучения и вывода нашей модели имеет два столбца:

Один столбец для текстового содержимого в качестве входных данных модели.
Еще один столбец для класса меток. У нас есть два возможных класса текста: Not_AE и Adverse_Event.

Обучение модели и экспериментирование

Чтобы эффективно изучить пространство возможных моделей «Обнимающего лица» для точной настройки наших объединенных данных о нежелательных явлениях, мы создали задание по оптимизации гиперпараметров (HPO) SageMaker и передали различные модели «Обнимающего лица» в качестве гиперпараметра вместе с другими важными гиперпараметрами. такие как размер обучающего пакета, длина последовательности, модели и скорость обучения. В заданиях обучения использовался экземпляр ml.p3dn.24xlarge, и каждое задание с этим типом экземпляра занимало в среднем 30 минут. Показатели обучения были зафиксированы, хотя Эксперименты с Amazon SageMaker инструмент, и каждое обучающее задание длилось 10 эпох.

В нашем коде мы указываем следующее:

Размер обучающего пакета – Количество выборок, которые обрабатываются вместе перед обновлением весов модели.
Длина последовательности – Максимальная длина входной последовательности, которую может обработать BERT.
Скорость обучения – Как быстро модель обновляет свои веса во время тренировки
Модели - Предварительно обученные модели Hugging Face

# we use the Hyperparameter Tuner
from sagemaker.tuner import IntegerParameter,ContinuousParameter, CategoricalParameter
tuning_job_name = 'ade-hpo'
# Define exploration boundaries
hyperparameter_ranges = { 'learning_rate': ContinuousParameter(5e-6,5e-4), 'max_seq_length': CategoricalParameter(['16', '32', '64', '128', '256']), 'train_batch_size': CategoricalParameter(['16', '32', '64', '128', '256']), 'model_name': CategoricalParameter(["emilyalsentzer/Bio_ClinicalBERT", "dmis-lab/biobert-base-cased-v1.2", "monologg/biobert_v1.1_pubmed", "pritamdeka/BioBert-PubMed200kRCT", "saidhr20/pubmed-biobert-text-classification" ])
} # create Optimizer
Optimizer = sagemaker.tuner.HyperparameterTuner( estimator=bert_estimator, hyperparameter_ranges=hyperparameter_ranges, base_tuning_job_name=tuning_job_name, objective_type='Maximize', objective_metric_name='f1', metric_definitions=[ {'Name': 'f1', 'Regex': "f1: ([0-9.]+).*$"}], max_jobs=40, max_parallel_jobs=4,
) Optimizer.fit({'training': inputs_data}, wait=False)

Итоги

В нашем случае лучше всего показала себя модель monologg/biobert_v1.1_pubmed Модель размещена на Hugging Face, которая представляет собой версию архитектуры BERT, предварительно обученную на наборе данных Pubmed, состоящем из 19,717 XNUMX научных публикаций. Предварительное обучение BERT на этом наборе данных дает этой модели дополнительные знания, когда дело доходит до определения контекста вокруг научных терминов, связанных с медициной. Это повышает производительность модели при решении задачи обнаружения нежелательных явлений, поскольку она предварительно обучена специальному медицинскому синтаксису, который часто встречается в нашем наборе данных.

В следующей таблице приведены наши показатели оценки.

Модель	Точность	Вспоминать	F1
Базовый БЕРТ	0.87	0.95	0.91
БиоБерт	0.89	0.95	0.92
БиоБЕРТ с ГПО	0.89	0.96	0.929
BioBERT с HPO и синтетически сгенерированными нежелательными явлениями	0.90	0.96	0.933

Хотя это относительно небольшие и постепенные улучшения по сравнению с базовой моделью BERT, тем не менее, они демонстрируют некоторые жизнеспособные стратегии повышения производительности модели с помощью этих методов. Генерация синтетических данных с помощью Falcon, по-видимому, имеет многообещающий потенциал для повышения производительности, особенно с учетом того, что эти генеративные модели искусственного интеллекта со временем становятся лучше.

Убирать

Чтобы избежать будущих расходов, удалите все ресурсы, созданные как модель, и конечные точки модели, созданные вами с помощью следующего кода:

# Delete resources
model_predictor.delete_model()
model_predictor.delete_endpoint()

Заключение

Многие фармацевтические компании сегодня хотели бы систематически автоматизировать процесс выявления нежелательных явлений при взаимодействии с клиентами, чтобы повысить безопасность клиентов и улучшить результаты. Как мы показали в этом посте, точно настроенный LLM BioBERT с синтетически сгенерированными нежелательными явлениями, добавленными к данным, классифицирует нежелательные явления с высокими показателями F1 и может использоваться для создания решения, соответствующего требованиям HIPAA, для наших клиентов.

Как всегда, AWS будет рад вашим отзывам. Пожалуйста, оставляйте свои мысли и вопросы в разделе комментариев.

Об авторах

Развертывание больших языковых моделей для использования в сфере здравоохранения на Amazon SageMaker | Веб-сервисы Amazon PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Зак Петерсон — специалист по данным в AWS Professional Services. Он уже много лет занимается предоставлением клиентам решений в области машинного обучения и имеет степень магистра экономики.

Развертывание больших языковых моделей для использования в сфере здравоохранения на Amazon SageMaker | Веб-сервисы Amazon PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Доктор Адевале Акинфадерин — старший специалист по данным в отделе здравоохранения и биологических наук в AWS. Его опыт заключается в воспроизводимых и комплексных методах искусственного интеллекта и машинного обучения, их практическом внедрении и оказании помощи клиентам здравоохранения по всему миру в формулировании и разработке масштабируемых решений междисциплинарных проблем. Имеет две ученые степени по физике и степень доктора технических наук.

Развертывание больших языковых моделей для использования в сфере здравоохранения на Amazon SageMaker | Веб-сервисы Amazon PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Экта Валия Бхуллар, доктор философии, старший консультант по искусственному интеллекту и машинному обучению в бизнес-подразделении профессиональных услуг AWS в сфере здравоохранения и биологических наук (HCLS). Она имеет обширный опыт применения ИИ/МО в сфере здравоохранения, особенно в радиологии. Вне работы, когда она не обсуждает искусственный интеллект в радиологии, она любит бегать и ходить в походы.

Развертывание больших языковых моделей для использования в сфере здравоохранения на Amazon SageMaker | Веб-сервисы Amazon PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Хан Ман — старший менеджер по обработке данных и машинному обучению в компании AWS Professional Services в Сан-Диего, Калифорния. Он получил степень доктора технических наук в Северо-Западном университете и имеет несколько лет опыта работы консультантом по управлению, консультируя клиентов в сфере производства, финансовых услуг и энергетики. Сегодня он увлеченно работает с ключевыми клиентами из различных отраслей промышленности над разработкой и внедрением решений машинного обучения и генеративного искусственного интеллекта на AWS.

SEO-контент и PR-распределение. Получите усиление сегодня.
PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
Источник: https://aws.amazon.com/blogs/machine-learning/deploy-large-language-models-for-a-healthtech-use-case-on-amazon-sagemaker/

Отметка времени: 6 февраля 2024

Отметка времени: 6 октября, 2022

Переиздано Платоном

Выявление потенциальной первопричины критически важных для бизнеса аномалий с помощью Amazon Lookout for Metrics

Выделение текста во время произнесения с помощью Amazon Polly | Веб-сервисы Амазонки

Создайте конвейер анализа тональности MLOps с помощью Amazon SageMaker Ground Truth и Databricks MLflow.

Обеспечьте хостинг с низкой задержкой для моделей машинного обучения на основе дерева решений на сервере NVIDIA Triton Inference Server в Amazon SageMaker.

Используйте машинное обучение, не написав ни единой строки кода, с помощью Amazon SageMaker Canvas | Веб-сервисы Amazon

Экономичная подготовка данных для машинного обучения с помощью SageMaker Data Wrangler

Amazon SageMaker с TensorBoard: обзор хостинга TensorBoard

InformedIQ автоматизирует проверки автокредитования Origence с помощью машинного обучения

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись