Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify

Ripubblicato da Platone

Seguaci: 0

La spiegabilità dei modelli di machine learning (ML) utilizzati in ambito medico sta diventando sempre più importante perché i modelli devono essere spiegati da diverse prospettive per ottenere l'adozione. Queste prospettive spaziano dalla prospettiva medica, tecnologica, legale e, la più importante, quella del paziente. I modelli sviluppati su testo in ambito medico sono diventati accurati dal punto di vista statistico, ma i medici sono eticamente tenuti a valutare le aree di debolezza relative a queste previsioni al fine di fornire la migliore assistenza ai singoli pazienti. La spiegabilità di queste previsioni è necessaria affinché i medici possano fare le scelte corrette paziente per paziente.

In questo post, mostriamo come migliorare la spiegabilità del modello in contesti clinici utilizzando Amazon SageMaker Chiarire.

sfondo

Un'applicazione specifica degli algoritmi ML nel dominio medico, che utilizza grandi volumi di testo, sono i sistemi di supporto alle decisioni cliniche (CDSS) per il triage. Ogni giorno i pazienti vengono ricoverati negli ospedali e vengono presi i verbali di ammissione. Dopo aver preso queste note, viene avviato il processo di triage e i modelli ML possono assistere i medici nella stima dei risultati clinici. Ciò può contribuire a ridurre i costi operativi generali e a fornire un’assistenza ottimale ai pazienti. Comprendere perché queste decisioni sono suggerite dai modelli ML è estremamente importante per il processo decisionale relativo ai singoli pazienti.

Lo scopo di questo post è delineare come è possibile distribuire modelli predittivi Amazon Sage Maker ai fini del triage in ambito ospedaliero e utilizzare SageMaker Clarify per spiegare queste previsioni. L'intento è quello di offrire un percorso accelerato verso l'adozione di tecniche predittive all'interno dei CDSS per molte organizzazioni sanitarie.

Il taccuino e il codice di questo post sono disponibili su GitHub. Per eseguirlo da solo, clona il repository GitHub e apri il file del notebook Jupyter.

Background tecnico

Una grande risorsa per qualsiasi organizzazione sanitaria acuta sono le sue note cliniche. Al momento del ricovero all'interno di un ospedale vengono redatti i verbali di ricovero. Numerosi studi recenti hanno dimostrato la prevedibilità di indicatori chiave quali diagnosi, procedure, durata della degenza e mortalità ospedaliera. Previsioni di questi sono ora facilmente ottenibili solo dalle note di ammissione, attraverso l’uso di algoritmi di elaborazione del linguaggio naturale (NLP) [1].

I progressi nei modelli PNL, come le rappresentazioni di codificatori bidirezionali di Transformers (BERT), hanno consentito previsioni altamente accurate su un corpus di testo, come le note di ammissione, da cui in precedenza era difficile ottenere valore. La loro previsione degli indicatori clinici è altamente applicabile per l'uso in un CDSS.

Tuttavia, per poter utilizzare le nuove previsioni in modo efficace, è ancora necessario spiegare il modo in cui questi modelli BERT accurati riescono a raggiungere le loro previsioni. Esistono diverse tecniche per spiegare le previsioni di tali modelli. Una di queste tecniche è SHAP (SHapley Additive exPlanations), che è una tecnica indipendente dal modello per spiegare l'output dei modelli ML.

Cos'è SHAP

I valori SHAP sono una tecnica per spiegare l'output dei modelli ML. Fornisce un modo per scomporre la previsione di un modello ML e comprendere in che misura ciascuna funzionalità di input contribuisce alla previsione finale.

I valori SHAP si basano sulla teoria dei giochi, in particolare sul concetto di valori Shapley, originariamente proposti per distribuire la vincita di un gioco cooperativo tra i suoi giocatori [2]. Nel contesto del ML, ogni caratteristica nello spazio di input è considerata un giocatore in un gioco cooperativo e la previsione del modello rappresenta la vincita. I valori SHAP vengono calcolati esaminando il contributo di ciascuna caratteristica alla previsione del modello per ogni possibile combinazione di caratteristiche. Viene quindi calcolato il contributo medio di ciascuna caratteristica in tutte le possibili combinazioni di caratteristiche e questo diventa il valore SHAP per quella caratteristica.

SHAP consente ai modelli di spiegare le previsioni senza comprendere il funzionamento interno del modello. Inoltre, esistono tecniche per visualizzare queste spiegazioni SHAP nel testo, in modo che tutti i punti di vista medico e paziente possano avere una visibilità intuitiva su come gli algoritmi arrivano alle loro previsioni.

Con le nuove aggiunte a SageMaker Clarify e l'uso di modelli preaddestrati da Abbracciare il viso che sono facilmente utilizzabili e implementati in SageMaker, l'addestramento e la spiegabilità del modello possono essere eseguiti facilmente in AWS.

Ai fini di un esempio end-to-end, prendiamo l'esito clinico della mortalità intraospedaliera e mostriamo come questo processo può essere implementato facilmente in AWS utilizzando un modello BERT Hugging Face pre-addestrato e le previsioni verranno spiegate utilizzando SageMaker Chiarire.

Scelte del modello Hugging Face

Hugging Face offre una varietà di modelli BERT pre-addestrati specializzati per l'uso su note cliniche. Per questo post utilizziamo il file bigbird-base-mimica-mortalità modello. Questo modello è una versione perfezionata del modello BigBird di Google, specificamente adattato per prevedere la mortalità utilizzando le note di ammissione al MIMIC ICU. Il compito del modello è determinare la probabilità che un paziente non sopravviva a un particolare ricovero in terapia intensiva sulla base delle note di ricovero. Uno dei vantaggi significativi dell'utilizzo di questo modello BigBird è la sua capacità di elaborare contesti di maggiore lunghezza, il che significa che possiamo inserire le note di ammissione complete senza la necessità di troncarle.

I nostri passaggi prevedono la distribuzione di questo modello ottimizzato su SageMaker. Incorporiamo quindi questo modello in una configurazione che consente la spiegazione in tempo reale delle sue previsioni. Per raggiungere questo livello di spiegabilità, utilizziamo SageMaker Clarify.

Panoramica della soluzione

SageMaker Clarify fornisce agli sviluppatori di ML strumenti specifici per ottenere maggiori informazioni sui dati e sui modelli di addestramento ML. SageMaker Clarify spiega sia le previsioni globali che locali e spiega le decisioni prese dai modelli di visione artificiale (CV) e PNL.

Il diagramma seguente mostra l'architettura SageMaker per ospitare un endpoint che serve richieste di spiegazione. Include le interazioni tra un endpoint, il contenitore del modello e la spiegazione di SageMaker Clarify.

SageMaker Chiarisce il blog

Nel codice di esempio utilizziamo un notebook Jupyter per mostrare la funzionalità. Tuttavia, in un caso d'uso reale, le cartelle cliniche elettroniche (EHR) o altre applicazioni di assistenza ospedaliera invocherebbero direttamente l'endpoint SageMaker per ottenere la stessa risposta. Nel notebook Jupyter distribuiamo un contenitore del modello Hugging Face su un endpoint SageMaker. Quindi utilizziamo SageMaker Clarify per spiegare i risultati che otteniamo dal modello distribuito.

Prerequisiti

Sono necessari i seguenti prerequisiti:

Accedi al codice da Repository GitHub e caricalo sull'istanza del tuo notebook. È anche possibile eseguire il notebook in un formato Amazon Sage Maker Studio ambiente, che è un ambiente di sviluppo integrato (IDE) per lo sviluppo ML. Ti consigliamo di utilizzare un kernel Python 3 (Data Science) su Sage Maker Studio o un kernel conda_python3 su un'istanza notebook SageMaker.

Distribuisci il modello con SageMaker Clarify abilitato

Come primo passo, scarica il modello da Hugging Face e caricalo su un file Servizio di archiviazione semplice Amazon (Amazon S3) secchio. Quindi crea un oggetto modello utilizzando la classe HuggingFaceModel. Utilizza un contenitore predefinito per semplificare il processo di distribuzione dei modelli Hugging Face su SageMaker. Utilizzi anche uno script di inferenza personalizzato per eseguire le previsioni all'interno del contenitore. Il codice seguente illustra lo script passato come argomento alla classe HuggingFaceModel:

from sagemaker.huggingface import HuggingFaceModel # create Hugging Face Model Class
huggingface_model = HuggingFaceModel(
model_data = model_path_s3,
transformers_version='4.6.1',
pytorch_version='1.7.1',
py_version='py36',
role=role,
source_dir = "./{}/code".format(model_id),
entry_point = "inference.py"
)

Quindi puoi definire il tipo di istanza su cui distribuire questo modello:

instance_type = "ml.g4dn.xlarge"
container_def = huggingface_model.prepare_container_def(instance_type=instance_type)
container_def

Poi popoliamo ExecutionRoleArn, ModelName ed PrimaryContainer campi per creare un modello.

model_name = "hospital-triage-model" sagemaker_client.create_model(
ExecutionRoleArn=role,
ModelName=model_name,
PrimaryContainer=container_def,
)
print(f"Model created: {model_name}")

Successivamente, crea una configurazione endpoint chiamando il file create_endpoint_config API. Ecco, fornisci lo stesso model_name Utilizzata nella create_model Chiamata API. IL create_endpoint_config ora supporta il parametro aggiuntivo ClarifyExplainerConfig per abilitare la spiegazione di SageMaker Clarify. La linea di base SHAP è obbligatoria; è possibile fornirli come dati di base in linea (il parametro ShapBaseline) o tramite un file di base S3 (il parametro ShapBaselineUri). Per i parametri opzionali, vedere la guida per gli sviluppatori.

Nel codice seguente utilizziamo un token speciale come base:

baseline = [["<UNK>"]]
print(f"SHAP baseline: {baseline}")

TextConfig è configurato con granularità a livello di frase (ogni frase è una funzionalità e abbiamo bisogno di alcune frasi per recensione per una buona visualizzazione) e la lingua è l'inglese:

endpoint_config_name = "hospital-triage-model-ep-config"
csv_serializer = sagemaker.serializers.CSVSerializer()
json_deserializer = sagemaker.deserializers.JSONDeserializer() sagemaker_client.create_endpoint_config(
EndpointConfigName=endpoint_config_name,
ProductionVariants=[
{ "VariantName": "MainVariant", "ModelName": model_name, "InitialInstanceCount": 1, "InstanceType": instance_type,
}
],
ExplainerConfig={ "ClarifyExplainerConfig": { "InferenceConfig": {"FeatureTypes": ["text"]}, "ShapConfig": { "ShapBaselineConfig": {"ShapBaseline": csv_serializer.serialize(baseline)}, "TextConfig": {"Granularity": "sentence", "Language": "en"},
},
}
},
)

Infine, dopo aver pronto la configurazione del modello e dell'endpoint, utilizzare il file create_endpoint API per creare il tuo endpoint. IL endpoint_name deve essere univoco all'interno di una regione nel tuo account AWS. IL create_endpoint L'API è di natura sincrona e restituisce una risposta immediata con lo stato dell'endpoint nello stato Creazione.

endpoint_name = "hospital-triage-prediction-endpoint"
sagemaker_client.create_endpoint(
EndpointName=endpoint_name,
EndpointConfigName=endpoint_config_name,
)

Spiega la previsione

Ora che hai distribuito l'endpoint con la spiegabilità online abilitata, puoi provare alcuni esempi. Puoi richiamare l'endpoint in tempo reale utilizzando il file invoke_endpoint metodo fornendo il payload serializzato, che in questo caso è costituito da alcune note di ammissione di esempio:

response = sagemaker_runtime_client.invoke_endpoint(
EndpointName=endpoint_name,
ContentType="text/csv",
Accept="text/csv",
Body=csv_serializer.serialize(sample_admission_note.iloc[:1, :].to_numpy())
) result = json_deserializer.deserialize(response["Body"], content_type=response["ContentType"])
pprint.pprint(result)

Nel primo scenario, supponiamo che la seguente nota di ricovero medico sia stata redatta da un operatore sanitario:

“Patient is a 25-year-old male with a chief complaint of acute chest pain. Patient reports the pain began suddenly while at work and has been constant since. Patient rates the pain as 8/10 in severity. Patient denies any radiation of pain, shortness of breath, nausea, or vomiting. Patient reports no previous history of chest pain. Vital signs are as follows: blood pressure 140/90 mmH. Heart rate 92 beats per minute. Respiratory rate 18 breaths per minute. Oxygen saturation 96% on room air. Physical examination reveals mild tenderness to palpation over the precordium and clear lung fields. EKG shows sinus tachycardia with no ST-elevations or depressions.”

Lo screenshot seguente mostra i risultati del modello.

Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Dopo che questo è stato inoltrato all'endpoint SageMaker, l'etichetta è stata prevista come 0, il che indica che il rischio di mortalità è basso. In altre parole, 0 implica che il paziente ricoverato è in condizioni non acute secondo il modello. Tuttavia, abbiamo bisogno del ragionamento alla base di tale previsione. Per questo, puoi utilizzare i valori SHAP come risposta. La risposta include i valori SHAP corrispondenti alle frasi della nota in input, che possono essere ulteriormente codificati a colori come verde o rosso in base a come i valori SHAP contribuiscono alla previsione. In questo caso, vediamo più frasi in verde, come "Il paziente non riferisce alcuna storia precedente di dolore toracico" e "L'ECG mostra tachicardia sinusale senza sopraslivellamenti o sottoslivellamenti del tratto ST", rispetto al rosso, in linea con la previsione di mortalità di 0 .

Nel secondo scenario, supponiamo che la seguente nota di ricovero medico sia stata redatta da un operatore sanitario:

“Patient is a 72-year-old female with a chief complaint of severe sepsis and septic shock. Patient reports a fever, chills, and weakness for the past 3 days, as well as decreased urine output and confusion. Patient has a history of chronic obstructive pulmonary disease (COPD) and a recent hospitalization for pneumonia. Vital signs are as follows: blood pressure 80/40 mmHg. Heart rate 130 beats per minute. Respiratory rate 30 breaths per minute. Oxygen saturation 82% on 4L of oxygen via nasal cannula. Physical examination reveals diffuse erythema and warmth over the lower extremities and positive findings for sepsis such as altered mental status, tachycardia, and tachypnea. Blood cultures were taken and antibiotic therapy was started with appropriate coverage.”

Lo screenshot seguente mostra i nostri risultati.

Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai.

Dopo che questo è stato inoltrato all'endpoint SageMaker, l'etichetta è stata prevista come 1, il che indica che il rischio di mortalità è elevato. Ciò implica che il paziente ricoverato sia in condizioni acute secondo il modello. Tuttavia, abbiamo bisogno del ragionamento alla base di tale previsione. Ancora una volta, puoi utilizzare i valori SHAP come risposta. La risposta include i valori SHAP corrispondenti alle frasi della nota in input, che possono essere ulteriormente codificati a colori. In questo caso, vediamo più frasi in rosso, come “Il paziente riferisce febbre, brividi e debolezza negli ultimi 3 giorni, nonché diminuzione della produzione di urina e confusione” e “La paziente è una donna di 72 anni con una lamentela principale di grave shock da sepsi", in contrapposizione al verde, in linea con la previsione di mortalità di 1.

Il team di assistenza clinica può utilizzare queste spiegazioni per assistere nelle proprie decisioni sul processo di assistenza per ogni singolo paziente.

ripulire

Per pulire le risorse che sono state create come parte di questa soluzione, eseguire le seguenti istruzioni:

huggingface_model.delete_model() predictor = sagemaker.Predictor(endpoint_name="triage-prediction-endpoint") predictor.delete_endpoint()

Conclusione

Questo post ti ha mostrato come utilizzare SageMaker Clarify per spiegare le decisioni in un caso d'uso sanitario sulla base delle note mediche acquisite durante le varie fasi del processo di triage. Questa soluzione può essere integrata nei sistemi di supporto decisionale esistenti per fornire un altro punto dati ai medici mentre valutano i pazienti per il ricovero in terapia intensiva. Per ulteriori informazioni sull'utilizzo dei servizi AWS nel settore sanitario, consulta i seguenti post del blog:

Riferimenti

, https://aclanthology.org/2021.eacl-main.75/

, https://arxiv.org/pdf/1705.07874.pdf

Circa gli autori

Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Shamika Ariyawansa, che ricopre il ruolo di Senior AI/ML Solutions Architect nella divisione Global Healthcare and Life Sciences di Amazon Web Services (AWS), si concentra fortemente sull'intelligenza artificiale generativa. Assiste i clienti nell'integrazione dell'intelligenza artificiale generativa nei loro progetti, sottolineando l'importanza della spiegabilità all'interno delle loro iniziative guidate dall'intelligenza artificiale. Al di là dei suoi impegni professionali, Shamika persegue con passione le avventure sugli sci e fuoristrada.

Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Ted Spencer è un Solutions Architect esperto con una vasta esperienza nel settore sanitario acuto. È appassionato di applicazione dell'apprendimento automatico per risolvere nuovi casi d'uso e completa soluzioni pensando sia al consumatore finale che al suo contesto aziendale/clinico. Vive a Toronto, Ontario, Canada, e gli piace viaggiare con la sua famiglia e allenarsi per il triathlon quando il tempo lo consente.

Spiegare le decisioni mediche in contesti clinici utilizzando Amazon SageMaker Clarify | Amazon Web Services PlatoBlockchain Data Intelligence. Ricerca verticale. Ai. Ram Pathangi è un Solutions Architect presso AWS che supporta i clienti del settore sanitario e delle scienze della vita nell'area della Baia di San Francisco. Ha aiutato clienti nei settori finanziario, sanitario, delle scienze della vita e dei settori verticali hi-tech a gestire con successo le proprie attività sul cloud AWS. È specializzato in database, analisi e machine learning.