Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify

Republié par Platon

Suiveurs: 0

L’explicabilité des modèles d’apprentissage automatique (ML) utilisés dans le domaine médical devient de plus en plus importante car les modèles doivent être expliqués sous plusieurs angles afin d’être adoptés. Ces perspectives vont du point de vue médical, technologique, juridique et le point de vue le plus important : celui du patient. Les modèles développés à partir de textes dans le domaine médical sont devenus statistiquement précis, mais les cliniciens sont tenus, sur le plan éthique, d'évaluer les points faibles liés à ces prédictions afin de fournir les meilleurs soins à chaque patient. L’explicabilité de ces prédictions est nécessaire pour que les cliniciens puissent faire les bons choix patient par patient.

Dans cet article, nous montrons comment améliorer l'explicabilité du modèle en milieu clinique à l'aide de Amazon SageMaker Clarifier.

Contexte

Une application spécifique des algorithmes ML dans le domaine médical, qui utilise de grands volumes de texte, concerne les systèmes d’aide à la décision clinique (CDSS) pour le triage. Au quotidien, des patients sont admis à l'hôpital et des notes d'admission sont prises. Une fois ces notes prises, le processus de triage est lancé et les modèles ML peuvent aider les cliniciens à estimer les résultats cliniques. Cela peut contribuer à réduire les frais généraux opérationnels et à fournir des soins optimaux aux patients. Comprendre pourquoi ces décisions sont suggérées par les modèles ML est extrêmement important pour la prise de décision liée aux patients individuels.

Le but de cet article est de décrire comment déployer des modèles prédictifs avec Amazon Sage Maker à des fins de triage en milieu hospitalier et utilisez SageMaker Clarify pour expliquer ces prédictions. L’objectif est d’offrir une voie accélérée vers l’adoption de techniques prédictives au sein des CDSS pour de nombreux organismes de santé.

Le cahier et le code de cet article sont disponibles sur GitHub. Pour l'exécuter vous-même, clonez le référentiel GitHub et ouvrez le fichier du notebook Jupyter.

Contexte technique

Les notes cliniques constituent un atout majeur pour toute organisation de soins de santé aiguë. Au moment de l'admission au sein d'un hôpital, des notes d'admission sont prises. Un certain nombre d'études récentes ont montré la prévisibilité d'indicateurs clés tels que les diagnostics, les procédures, la durée du séjour et la mortalité hospitalière. Leurs prédictions sont désormais hautement réalisables à partir des seules notes d'admission, grâce à l'utilisation d'algorithmes de traitement du langage naturel (NLP) [1].

Les progrès des modèles PNL, tels que les représentations d'encodeurs bidirectionnels à partir de transformateurs (BERT), ont permis des prédictions très précises sur un corpus de texte, tel que les notes d'admission, dont il était auparavant difficile d'obtenir de la valeur. Leur prédiction des indicateurs cliniques est hautement applicable pour une utilisation dans un CDSS.

Cependant, afin d’utiliser efficacement les nouvelles prédictions, il reste encore à expliquer comment ces modèles BERT précis réalisent leurs prédictions. Il existe plusieurs techniques pour expliquer les prédictions de tels modèles. L'une de ces techniques est SHAP (SHapley Additive exPlanations), qui est une technique indépendante du modèle pour expliquer la sortie des modèles ML.

Qu'est-ce que SHAP

Les valeurs SHAP sont une technique pour expliquer la sortie des modèles ML. Il fournit un moyen de décomposer la prédiction d'un modèle ML et de comprendre dans quelle mesure chaque fonctionnalité d'entrée contribue à la prédiction finale.

Les valeurs SHAP sont basées sur la théorie des jeux, en particulier le concept des valeurs de Shapley, qui ont été initialement proposées pour répartir les gains d'un jeu coopératif entre ses joueurs [2]. Dans le contexte du ML, chaque fonctionnalité de l’espace d’entrée est considérée comme un joueur dans un jeu coopératif, et la prédiction du modèle est le paiement. Les valeurs SHAP sont calculées en examinant la contribution de chaque fonctionnalité à la prédiction du modèle pour chaque combinaison possible de fonctionnalités. La contribution moyenne de chaque fonctionnalité sur toutes les combinaisons de fonctionnalités possibles est ensuite calculée, et cela devient la valeur SHAP pour cette fonctionnalité.

SHAP permet aux modèles d'expliquer les prédictions sans comprendre le fonctionnement interne du modèle. De plus, il existe des techniques pour afficher ces explications SHAP sous forme de texte, afin que les points de vue du médecin et du patient puissent tous avoir une visibilité intuitive sur la manière dont les algorithmes parviennent à leurs prédictions.

Avec de nouveaux ajouts à SageMaker Clarify et l'utilisation de modèles pré-entraînés de Étreindre le visage qui sont facilement utilisés et implémentés dans SageMaker, la formation et l'explicabilité des modèles peuvent toutes être facilement réalisées dans AWS.

Dans le but d'un exemple de bout en bout, nous prenons le résultat clinique de la mortalité à l'hôpital et montrons comment ce processus peut être facilement implémenté dans AWS à l'aide d'un modèle Hugging Face BERT pré-entraîné, et les prédictions seront expliquées à l'aide de SageMaker clarifier.

Choix du modèle de visage câlin

Hugging Face propose une variété de modèles BERT pré-entraînés qui ont été spécialisés pour être utilisés sur des notes cliniques. Pour cet article, nous utilisons le bigbird-base-mimic-mortalité modèle. Ce modèle est une version affinée du modèle BigBird de Google, spécifiquement adapté pour prédire la mortalité à l'aide des notes d'admission MIMIC ICU. La tâche du modèle est de déterminer la probabilité qu'un patient ne survive pas à un séjour particulier en soins intensifs sur la base des notes d'admission. L'un des avantages significatifs de l'utilisation de ce modèle BigBird est sa capacité à traiter des longueurs de contexte plus grandes, ce qui signifie que nous pouvons saisir les notes d'admission complètes sans avoir besoin de troncature.

Nos étapes consistent à déployer ce modèle affiné sur SageMaker. Nous intégrons ensuite ce modèle dans une configuration permettant une explication en temps réel de ses prédictions. Pour atteindre ce niveau d'explicabilité, nous utilisons SageMaker Clarify.

Vue d'ensemble de la solution

SageMaker Clarify fournit aux développeurs ML des outils spécialement conçus pour mieux comprendre leurs données et modèles de formation ML. SageMaker Clarify explique les prédictions globales et locales et explique les décisions prises par la vision par ordinateur (CV) et les modèles NLP.

Le diagramme suivant montre l'architecture SageMaker pour héberger un point de terminaison qui répond aux demandes d'explicabilité. Il inclut les interactions entre un point de terminaison, le conteneur de modèle et l'explicateur SageMaker Clarify.

SageMaker clarifie le blog

Dans l'exemple de code, nous utilisons un notebook Jupyter pour présenter la fonctionnalité. Cependant, dans un cas d'utilisation réel, les dossiers de santé électroniques (DSE) ou d'autres applications de soins hospitaliers appelleraient directement le point de terminaison SageMaker pour obtenir la même réponse. Dans le notebook Jupyter, nous déployons un conteneur de modèle Hugging Face sur un point de terminaison SageMaker. Ensuite, nous utilisons SageMaker Clarify pour expliquer les résultats que nous obtenons du modèle déployé.

Pré-requis

Vous avez besoin des prérequis suivants :

Accédez au code depuis le GitHub référentiel et téléchargez-le sur votre instance de notebook. Vous pouvez également exécuter le notebook dans un Amazon SageMakerStudio environnement, qui est un environnement de développement intégré (IDE) pour le développement ML. Nous recommandons d'utiliser un noyau Python 3 (Data Science) sur Studio SageMaker ou un noyau conda_python3 sur une instance de notebook SageMaker.

Déployer le modèle avec SageMaker Clarify activé

Dans un premier temps, téléchargez le modèle depuis Hugging Face et téléchargez-le sur un Service de stockage simple Amazon (Amazon S3). Créez ensuite un objet modèle à l'aide de la classe HuggingFaceModel. Cela utilise un conteneur prédéfini pour simplifier le processus de déploiement des modèles Hugging Face sur SageMaker. Vous utilisez également un script d'inférence personnalisé pour effectuer les prédictions dans le conteneur. Le code suivant illustre le script passé en argument à la classe HuggingFaceModel :

from sagemaker.huggingface import HuggingFaceModel # create Hugging Face Model Class
huggingface_model = HuggingFaceModel(
model_data = model_path_s3,
transformers_version='4.6.1',
pytorch_version='1.7.1',
py_version='py36',
role=role,
source_dir = "./{}/code".format(model_id),
entry_point = "inference.py"
)

Vous pouvez ensuite définir le type d'instance sur lequel vous déployez ce modèle :

instance_type = "ml.g4dn.xlarge"
container_def = huggingface_model.prepare_container_def(instance_type=instance_type)
container_def

Nous remplissons ensuite ExecutionRoleArn, ModelName ainsi que le PrimaryContainer champs pour créer un modèle.

model_name = "hospital-triage-model" sagemaker_client.create_model(
ExecutionRoleArn=role,
ModelName=model_name,
PrimaryContainer=container_def,
)
print(f"Model created: {model_name}")

Ensuite, créez une configuration de point de terminaison en appelant le create_endpoint_config API. Ici, vous fournissez la même chose model_name Utilisé dans le create_model Appel API. Le create_endpoint_config prend désormais en charge le paramètre supplémentaire ClarifyExplainerConfig pour activer l'explication SageMaker Clarify. La référence SHAP est obligatoire ; vous pouvez le fournir soit sous forme de données de base en ligne (le paramètre ShapBaseline), soit via un fichier de base S3 (le paramètre ShapBaselineUri). Pour les paramètres facultatifs, voir le guide du développeur.

Dans le code suivant, nous utilisons un jeton spécial comme référence :

baseline = [["<UNK>"]]
print(f"SHAP baseline: {baseline}")

TextConfig est configuré avec une granularité au niveau des phrases (chaque phrase est une fonctionnalité, et nous avons besoin de quelques phrases par révision pour une bonne visualisation) et la langue est l'anglais :

endpoint_config_name = "hospital-triage-model-ep-config"
csv_serializer = sagemaker.serializers.CSVSerializer()
json_deserializer = sagemaker.deserializers.JSONDeserializer() sagemaker_client.create_endpoint_config(
EndpointConfigName=endpoint_config_name,
ProductionVariants=[
{ "VariantName": "MainVariant", "ModelName": model_name, "InitialInstanceCount": 1, "InstanceType": instance_type,
}
],
ExplainerConfig={ "ClarifyExplainerConfig": { "InferenceConfig": {"FeatureTypes": ["text"]}, "ShapConfig": { "ShapBaselineConfig": {"ShapBaseline": csv_serializer.serialize(baseline)}, "TextConfig": {"Granularity": "sentence", "Language": "en"},
},
}
},
)

Enfin, une fois que la configuration du modèle et du point de terminaison est prête, utilisez le create_endpoint API pour créer votre point de terminaison. Le endpoint_name doit être unique dans une région de votre compte AWS. Le create_endpoint L'API est de nature synchrone et renvoie une réponse immédiate, le statut du point de terminaison étant à l'état Création.

endpoint_name = "hospital-triage-prediction-endpoint"
sagemaker_client.create_endpoint(
EndpointName=endpoint_name,
EndpointConfigName=endpoint_config_name,
)

Expliquez la prédiction

Maintenant que vous avez déployé le point de terminaison avec l'explicabilité en ligne activée, vous pouvez essayer quelques exemples. Vous pouvez appeler le point de terminaison en temps réel à l'aide du invoke_endpoint méthode en fournissant la charge utile sérialisée, qui dans ce cas est quelques exemples de notes d'admission :

response = sagemaker_runtime_client.invoke_endpoint(
EndpointName=endpoint_name,
ContentType="text/csv",
Accept="text/csv",
Body=csv_serializer.serialize(sample_admission_note.iloc[:1, :].to_numpy())
) result = json_deserializer.deserialize(response["Body"], content_type=response["ContentType"])
pprint.pprint(result)

Dans le premier scénario, supposons que la note d'admission médicale suivante ait été prise par un professionnel de la santé :

“Patient is a 25-year-old male with a chief complaint of acute chest pain. Patient reports the pain began suddenly while at work and has been constant since. Patient rates the pain as 8/10 in severity. Patient denies any radiation of pain, shortness of breath, nausea, or vomiting. Patient reports no previous history of chest pain. Vital signs are as follows: blood pressure 140/90 mmH. Heart rate 92 beats per minute. Respiratory rate 18 breaths per minute. Oxygen saturation 96% on room air. Physical examination reveals mild tenderness to palpation over the precordium and clear lung fields. EKG shows sinus tachycardia with no ST-elevations or depressions.”

La capture d'écran suivante montre les résultats du modèle.

Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Une fois que cela a été transmis au point final SageMaker, l'étiquette a été prédite comme étant 0, ce qui indique que le risque de mortalité est faible. En d’autres termes, 0 implique que le patient admis est dans un état non aigu selon le modèle. Cependant, nous avons besoin du raisonnement qui sous-tend cette prédiction. Pour cela, vous pouvez utiliser les valeurs SHAP comme réponse. La réponse comprend les valeurs SHAP correspondant aux phrases de la note d'entrée, qui peuvent en outre être codées par couleur en vert ou en rouge en fonction de la façon dont les valeurs SHAP contribuent à la prédiction. Dans ce cas, nous voyons plus de phrases en vert, telles que « Le patient ne signale aucun antécédent de douleur thoracique » et « L'ECG montre une tachycardie sinusale sans élévation ni dépression du segment ST », par opposition au rouge, ce qui correspond à la prévision de mortalité de 0. .

Dans le deuxième scénario, supposons que la note d'admission médicale suivante ait été prise par un professionnel de la santé :

“Patient is a 72-year-old female with a chief complaint of severe sepsis and septic shock. Patient reports a fever, chills, and weakness for the past 3 days, as well as decreased urine output and confusion. Patient has a history of chronic obstructive pulmonary disease (COPD) and a recent hospitalization for pneumonia. Vital signs are as follows: blood pressure 80/40 mmHg. Heart rate 130 beats per minute. Respiratory rate 30 breaths per minute. Oxygen saturation 82% on 4L of oxygen via nasal cannula. Physical examination reveals diffuse erythema and warmth over the lower extremities and positive findings for sepsis such as altered mental status, tachycardia, and tachypnea. Blood cultures were taken and antibiotic therapy was started with appropriate coverage.”

La capture d'écran suivante montre nos résultats.

Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Une fois que cela a été transmis au point final SageMaker, l'étiquette a été prédite à 1, ce qui indique que le risque de mortalité est élevé. Cela implique que le patient admis est dans un état aigu selon le modèle. Cependant, nous avons besoin du raisonnement qui sous-tend cette prédiction. Encore une fois, vous pouvez utiliser les valeurs SHAP comme réponse. La réponse comprend les valeurs SHAP correspondant aux phrases de la note d'entrée, qui peuvent être en outre codées par couleur. Dans ce cas, nous voyons plus de phrases en rouge, telles que « Le patient signale de la fièvre, des frissons et une faiblesse au cours des 3 derniers jours, ainsi qu'une diminution du débit urinaire et de la confusion » et « Le patient est une femme de 72 ans avec une plainte principale de choc septique sévère », par opposition au vert, ce qui correspond à la prévision de mortalité de 1.

L'équipe de soins cliniques peut utiliser ces explications pour l'aider à prendre des décisions sur le processus de soins pour chaque patient.

Nettoyer

Pour nettoyer les ressources créées dans le cadre de cette solution, exécutez les instructions suivantes :

huggingface_model.delete_model() predictor = sagemaker.Predictor(endpoint_name="triage-prediction-endpoint") predictor.delete_endpoint()

Conclusion

Cet article vous a montré comment utiliser SageMaker Clarify pour expliquer les décisions dans un cas d'utilisation de soins de santé sur la base des notes médicales capturées au cours des différentes étapes du processus de triage. Cette solution peut être intégrée aux systèmes d'aide à la décision existants pour fournir un autre point de données aux cliniciens lors de l'évaluation des patients en vue de leur admission à l'USI. Pour en savoir plus sur l'utilisation des services AWS dans le secteur de la santé, consultez les articles de blog suivants :

Bibliographie

https://aclanthology.org/2021.eacl-main.75/

https://arxiv.org/pdf/1705.07874.pdf

À propos des auteurs

Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Shamika Ariyawansa, en tant qu'architecte principal de solutions IA/ML au sein de la division mondiale de la santé et des sciences de la vie d'Amazon Web Services (AWS), se concentre particulièrement sur l'IA générative. Il aide les clients à intégrer l'IA générative dans leurs projets, en soulignant l'importance de l'explicabilité au sein de leurs initiatives basées sur l'IA. Au-delà de ses engagements professionnels, Shamika poursuit avec passion les aventures de ski et de tout-terrain.

Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Ted SpenceR est un architecte de solutions expérimenté possédant une vaste expérience en matière de soins de santé aigus. Il est passionné par l'application de l'apprentissage automatique pour résoudre de nouveaux cas d'utilisation et élabore des solutions en tenant compte à la fois du consommateur final et de son contexte commercial/clinique. Il vit à Toronto, Ontario, Canada, et aime voyager avec sa famille et s'entraîner aux triathlons lorsque le temps le permet.

Expliquer les décisions médicales en milieu clinique à l'aide d'Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Ram Pathangi est architecte de solutions chez AWS qui soutient les clients des soins de santé et des sciences de la vie dans la région de la baie de San Francisco. Il a aidé des clients des secteurs verticaux de la finance, de la santé, des sciences de la vie et de la haute technologie à gérer avec succès leur entreprise sur le cloud AWS. Il se spécialise dans les bases de données, l'analyse et l'apprentissage automatique.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Automobile / VE, Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
GraphiquePrime. Élevez votre jeu de trading avec ChartPrime. Accéder ici.
Décalages de bloc. Modernisation de la propriété des compensations environnementales. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/explain-medical-decisions-in-clinical-settings-using-amazon-sagemaker-clarify/

Horodatage: 21 août 2023

Horodatage: 10 août 2022

Republié par Platon

Permettre aux malvoyants d'entendre des documents à l'aide d'Amazon Textract et d'Amazon Polly

Comment Amazon Search exécute des projets de machine learning résilients à grande échelle avec Amazon SageMaker

Prévision simple et précise avec AutoGluon-TimeSeries

Amazon SageMaker Automatic Model Tuning prend désormais en charge les solutions de repli des instances de formation SageMaker

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte