Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake

Republié par Platon

Suiveurs: 0

Les données de santé sont complexes et cloisonnées et existent sous différents formats. On estime que 80 % des données au sein des organisations sont considérées comme des données non structurées ou « obscures » qui sont verrouillées dans du texte, des e-mails, des PDF et des documents numérisés. Ces données sont difficiles à interpréter ou à analyser par programmation et limitent la manière dont les organisations peuvent en tirer des informations et servir leurs clients plus efficacement. Le rythme rapide de génération de données signifie que les organisations qui n'investissent pas dans l'automatisation des documents risquent de se retrouver avec des processus hérités qui sont manuels, lents, sujets aux erreurs et difficiles à mettre à l'échelle.

Dans cet article, nous proposons une solution qui automatise l'ingestion et la transformation de fichiers PDF jusqu'alors inexploités et de notes et données cliniques manuscrites. Nous expliquons comment extraire des informations des tableaux de données cliniques des clients à l'aide de Extrait d'Amazon, puis utilisez le texte brut extrait pour identifier des éléments de données discrets à l'aide Amazon Comprehend Medical. Nous stockons la sortie finale au format compatible FHIR (Fast Healthcare Interoperability Resources) dans Amazon Health Lake, ce qui le rend disponible pour l'analyse en aval.

Vue d'ensemble de la solution

AWS fournit une variété de services et de solutions aux prestataires de soins de santé pour libérer la valeur de leurs données. Pour notre solution, nous traitons un petit échantillon de documents via Amazon Textract et chargeons les données extraites en tant que ressources FHIR appropriées dans Amazon HealthLake. Nous créons un processus personnalisé pour la conversion FHIR et le testons de bout en bout.

Les données sont d'abord chargées dans DocumentReference. Amazon HealthLake crée ensuite des ressources générées par le système après avoir traité ce texte non structuré dans DocumentReference et le charge dans Condition, MedicationStatementet une Observation ressources. Nous identifions quelques champs de données dans les ressources FHIR comme l'ID du patient, la date du service, le type de fournisseur et le nom de l'établissement médical.

A MedicationStatement est un enregistrement d'un médicament qui est consommé par un patient. Cela peut indiquer que le patient prend le médicament maintenant, a pris le médicament dans le passé ou prendra le médicament à l'avenir. Un scénario courant où ces informations sont capturées est lors du processus d'anamnèse au cours d'une visite ou d'un séjour d'un patient. La source d'informations sur les médicaments peut être la mémoire du patient, un flacon d'ordonnance ou une liste de médicaments conservée par le patient, le clinicien ou une autre partie.

Observations sont un élément central des soins de santé, utilisés pour soutenir le diagnostic, surveiller les progrès, déterminer les lignes de base et les modèles, et même saisir les caractéristiques démographiques. La plupart des observations sont de simples assertions de paires nom/valeur avec quelques métadonnées, mais certaines observations regroupent logiquement d'autres observations, ou peuvent même être des observations à plusieurs composants.

Le Condition ressource est utilisée pour enregistrer des informations détaillées sur une condition, un problème, un diagnostic ou un autre événement, une situation, un problème ou un concept clinique qui a atteint un niveau de préoccupation. La condition peut être un diagnostic ponctuel dans le contexte d'une rencontre, un élément sur la liste des problèmes du praticien ou une préoccupation qui n'existe pas sur la liste des problèmes du praticien.

Le diagramme suivant montre le flux de travail pour migrer des données non structurées vers FHIR pour l'IA et l'analyse d'apprentissage automatique (ML) dans Amazon HealthLake.

Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Les étapes du flux de travail sont les suivantes :

Un document est téléchargé sur un Service de stockage simple Amazon (Amazon S3) seau.
Le téléchargement du document dans Amazon S3 déclenche une AWS Lambda la fonction.
La fonction Lambda envoie l'image à Amazon Textract.
Amazon Textract extrait le texte de l'image et stocke la sortie dans un compartiment S3 de sortie Amazon Textract séparé.
Le résultat final est stocké sous forme de ressources FHIR spécifiques (le texte extrait est chargé dans DocumentReference sous forme de texte encodé en base64) dans Amazon HealthLake pour extraire le sens des données non structurées avec Amazon Comprehend Medical intégré pour une recherche et une interrogation faciles.
Les utilisateurs peuvent créer des analyses significatives et exécuter des analyses interactives à l'aide de Amazone Athéna.
Les utilisateurs peuvent créer des visualisations, effectuer des analyses ad hoc et obtenir rapidement des informations commerciales à l'aide de Amazon QuickSight.
Les utilisateurs peuvent faire des prédictions avec des données de santé en utilisant Amazon Sage Maker Modèles de ML.

Pré-requis

Ce poste suppose une connaissance des services suivants :

Par défaut, la capacité intégrée de traitement du langage naturel (NLP) d'Amazon Comprehend Medical dans Amazon HealthLake est désactivée dans votre compte AWS. Pour l'activer, soumettez une demande d'assistance avec votre ID de compte, votre région AWS et l'ARN du magasin de données Amazon HealthLake. Pour plus d'informations, reportez-vous à Comment activer la fonction intégrée de traitement du langage naturel de HealthLake.

Reportez-vous à GitHub repo pour plus de détails sur le déploiement.

Déployer l'architecture de la solution

Pour configurer la solution, procédez comme suit :

Cloner le GitHub repo, courir cdk deploy PdfMapperToFhirWorkflow depuis votre invite de commande ou votre terminal et suivez le fichier README. Le déploiement se terminera en 30 minutes environ.
Sur la console Amazon S3, accédez au compartiment commençant par pdfmappertofhirworkflow-, qui a été créé dans le cadre de cdk deploy.
Dans le bucket, créez un dossier appelé uploads et importez l'exemple de PDF (Exemple de dossier médical.pdf).

Dès que le téléchargement du document est réussi, il déclenche le pipeline et vous pouvez commencer à voir les données dans Amazon HealthLake, que vous pouvez interroger à l'aide de plusieurs outils AWS.

Interroger les données

Pour explorer vos données, procédez comme suit :

Sur la console CloudWatch, recherchez le HealthlakeTextract groupe de journaux.
Dans les détails du groupe de journaux, notez l'ID unique du document que vous avez traité.
Sur la console Amazon HealthLake, choisissez Magasins de données dans le volet de navigation.
Sélectionnez votre magasin de données et choisissez Exécuter une requête.
Pour Type de requête, choisissez Rechercher avec GET.
Pour Type de ressource, choisissez Référence de document.
Pour Paramètres de recherche, saisissez le paramètre relatif à et la valeur relative à DocumentReference/Identifiant unique.
Selectionnez Exécuter une requête.
Dans le Organe de réponse , réduisez les sections de ressources pour afficher uniquement les six ressources qui ont été créées pour le document PDF de six pages.
La capture d'écran suivante montre l'analyse intégrée avec Amazon Comprehend Medical et NLP activés. La capture d'écran à gauche est le PDF source ; la capture d'écran à droite est le résultat NLP d'Amazon HealthLake.
Vous pouvez également exécuter une requête avec Type de requête définir comme Lire et les Type de ressource définir comme État à l'aide de l'ID de ressource approprié.

La capture d'écran suivante montre les résultats de la requête.
Sur la console Athena, exécutez la requête suivante :
```
SELECT * FROM "healthlakestore"."documentreference";
```

De même, vous pouvez interroger MedicationStatement, Conditionet une Observation Ressources.

Nettoyer

Une fois que vous avez terminé d'utiliser cette solution, exécutez cdk destroy PdfMapperToFhirWorkflow pour vous assurer de ne pas encourir de frais supplémentaires. Pour plus d'informations, reportez-vous à Boîte à outils AWS CDK (commande cdk).

Conclusion

Les services d'AWS AI et Amazon HealthLake peuvent aider à stocker, transformer, interroger et analyser les informations issues de données de santé non structurées. Bien que cet article ne couvre qu'un tableau clinique PDF, vous pouvez étendre la solution à d'autres types de PDF, d'images et de notes manuscrites de soins de santé. Une fois les données extraites sous forme de texte, analysées en éléments de données discrets à l'aide d'Amazon Comprehend Medical et stockées dans Amazon HealthLake, elles pourraient être encore enrichies par des systèmes en aval pour générer des informations de santé significatives et exploitables et, en fin de compte, améliorer les résultats de santé des patients.

La solution proposée ne nécessite pas le déploiement et la maintenance d'une infrastructure serveur. Tous les services sont soit gérés par AWS, soit sans serveur. Avec le modèle de facturation à l'utilisation d'AWS et la profondeur et l'étendue de ses services, le coût et l'effort de configuration initiale et d'expérimentation sont nettement inférieurs aux alternatives traditionnelles sur site.

Ressources additionnelles

Pour plus d'informations sur Amazon HealthLake, reportez-vous à ce qui suit :

À propos des auteurs

Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Shravan Vurputour est architecte de solutions senior chez AWS. En tant que défenseur de confiance des clients, il aide les organisations à comprendre les meilleures pratiques en matière d'architectures avancées basées sur le cloud et fournit des conseils sur les stratégies pour aider à obtenir des résultats commerciaux réussis pour un large éventail d'entreprises clientes grâce à sa passion pour l'éducation, la formation, la conception et la construction de cloud. solutions. Dans ses temps libres, il aime lire, passer du temps avec sa famille et cuisiner.

Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Rafael M. Koike est un architecte principal de solutions chez AWS qui soutient les clients Enterprise dans le sud-est et fait partie de la communauté de terrain technique de stockage et de sécurité. Rafael a la passion de construire, et son expertise en matière de sécurité, de stockage, de mise en réseau et de développement d'applications a été déterminante pour aider les clients à migrer vers le cloud en toute sécurité et rapidement.

Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake PlatoBlockchain Data Intelligence. Recherche verticale. Aï. Randheer Gehlot est Principal Customer Solutions Manager chez AWS. Randheer est passionné par l'IA/ML et son application dans l'industrie HCLS. En tant que constructeur AWS, il travaille avec de grandes entreprises pour concevoir et mettre en œuvre rapidement des migrations stratégiques vers le cloud et créer des solutions cloud natives modernes.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
Frapper l'avenir avec Adryenn Ashley. Accéder ici.
Achetez et vendez des actions de sociétés PRE-IPO avec PREIPO®. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/

Horodatage: 9 mai 2023

Horodatage: 10 Mar 2023

Transformez, analysez et découvrez des informations à partir de données de santé non structurées à l'aide d'Amazon HealthLake

Republié par Platon

Vue d'ensemble de la solution

Pré-requis

Déployer l'architecture de la solution

Interroger les données

Nettoyer

Conclusion

Ressources additionnelles

À propos des auteurs

Plus de Apprentissage automatique AWS

Abode utilise Amazon Rekognition Streaming Video Events pour fournir des notifications en temps réel à ses clients de maison intelligente

Déployer et gérer des pipelines d'apprentissage automatique avec Terraform à l'aide d'Amazon SageMaker

Mise à l'échelle de la formation et de l'inférence de milliers de modèles ML avec Amazon SageMaker | Services Web Amazon

MDaudit utilise l'IA pour améliorer les revenus des clients du secteur de la santé | Services Web Amazon

Premiers pas avec le connecteur Amazon Kendra Box

L'instance Amazon EC2 DL2q pour une inférence d'IA rentable et hautes performances est désormais généralement disponible | Services Web Amazon

Créez, entraînez et déployez un modèle de langage d'un milliard de paramètres sur des téraoctets de données avec TensorFlow et Amazon SageMaker

Détection des fraudes en temps réel à l'aide des services sans serveur et d'apprentissage automatique d'AWS

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte