Les données de santé sont complexes et cloisonnées et existent sous différents formats. On estime que 80 % des données au sein des organisations sont considérées comme des données non structurées ou « obscures » qui sont verrouillées dans du texte, des e-mails, des PDF et des documents numérisés. Ces données sont difficiles à interpréter ou à analyser par programmation et limitent la manière dont les organisations peuvent en tirer des informations et servir leurs clients plus efficacement. Le rythme rapide de génération de données signifie que les organisations qui n'investissent pas dans l'automatisation des documents risquent de se retrouver avec des processus hérités qui sont manuels, lents, sujets aux erreurs et difficiles à mettre à l'échelle.
Dans cet article, nous proposons une solution qui automatise l'ingestion et la transformation de fichiers PDF jusqu'alors inexploités et de notes et données cliniques manuscrites. Nous expliquons comment extraire des informations des tableaux de données cliniques des clients à l'aide de Extrait d'Amazon, puis utilisez le texte brut extrait pour identifier des éléments de données discrets à l'aide Amazon Comprehend Medical. Nous stockons la sortie finale au format compatible FHIR (Fast Healthcare Interoperability Resources) dans Amazon Health Lake, ce qui le rend disponible pour l'analyse en aval.
Vue d'ensemble de la solution
AWS fournit une variété de services et de solutions aux prestataires de soins de santé pour libérer la valeur de leurs données. Pour notre solution, nous traitons un petit échantillon de documents via Amazon Textract et chargeons les données extraites en tant que ressources FHIR appropriées dans Amazon HealthLake. Nous créons un processus personnalisé pour la conversion FHIR et le testons de bout en bout.
Les données sont d'abord chargées dans DocumentReference
. Amazon HealthLake crée ensuite des ressources générées par le système après avoir traité ce texte non structuré dans DocumentReference
et le charge dans Condition
, MedicationStatement
et une Observation
ressources. Nous identifions quelques champs de données dans les ressources FHIR comme l'ID du patient, la date du service, le type de fournisseur et le nom de l'établissement médical.
A MedicationStatement
est un enregistrement d'un médicament qui est consommé par un patient. Cela peut indiquer que le patient prend le médicament maintenant, a pris le médicament dans le passé ou prendra le médicament à l'avenir. Un scénario courant où ces informations sont capturées est lors du processus d'anamnèse au cours d'une visite ou d'un séjour d'un patient. La source d'informations sur les médicaments peut être la mémoire du patient, un flacon d'ordonnance ou une liste de médicaments conservée par le patient, le clinicien ou une autre partie.
Observations
sont un élément central des soins de santé, utilisés pour soutenir le diagnostic, surveiller les progrès, déterminer les lignes de base et les modèles, et même saisir les caractéristiques démographiques. La plupart des observations sont de simples assertions de paires nom/valeur avec quelques métadonnées, mais certaines observations regroupent logiquement d'autres observations, ou peuvent même être des observations à plusieurs composants.
Le Condition
ressource est utilisée pour enregistrer des informations détaillées sur une condition, un problème, un diagnostic ou un autre événement, une situation, un problème ou un concept clinique qui a atteint un niveau de préoccupation. La condition peut être un diagnostic ponctuel dans le contexte d'une rencontre, un élément sur la liste des problèmes du praticien ou une préoccupation qui n'existe pas sur la liste des problèmes du praticien.
Le diagramme suivant montre le flux de travail pour migrer des données non structurées vers FHIR pour l'IA et l'analyse d'apprentissage automatique (ML) dans Amazon HealthLake.
Les étapes du flux de travail sont les suivantes :
- Un document est téléchargé sur un Service de stockage simple Amazon (Amazon S3) seau.
- Le téléchargement du document dans Amazon S3 déclenche une AWS Lambda la fonction.
- La fonction Lambda envoie l'image à Amazon Textract.
- Amazon Textract extrait le texte de l'image et stocke la sortie dans un compartiment S3 de sortie Amazon Textract séparé.
- Le résultat final est stocké sous forme de ressources FHIR spécifiques (le texte extrait est chargé dans
DocumentReference
sous forme de texte encodé en base64) dans Amazon HealthLake pour extraire le sens des données non structurées avec Amazon Comprehend Medical intégré pour une recherche et une interrogation faciles. - Les utilisateurs peuvent créer des analyses significatives et exécuter des analyses interactives à l'aide de Amazone Athéna.
- Les utilisateurs peuvent créer des visualisations, effectuer des analyses ad hoc et obtenir rapidement des informations commerciales à l'aide de Amazon QuickSight.
- Les utilisateurs peuvent faire des prédictions avec des données de santé en utilisant Amazon Sage Maker Modèles de ML.
Pré-requis
Ce poste suppose une connaissance des services suivants :
Par défaut, la capacité intégrée de traitement du langage naturel (NLP) d'Amazon Comprehend Medical dans Amazon HealthLake est désactivée dans votre compte AWS. Pour l'activer, soumettez une demande d'assistance avec votre ID de compte, votre région AWS et l'ARN du magasin de données Amazon HealthLake. Pour plus d'informations, reportez-vous à Comment activer la fonction intégrée de traitement du langage naturel de HealthLake.
Reportez-vous à GitHub repo pour plus de détails sur le déploiement.
Déployer l'architecture de la solution
Pour configurer la solution, procédez comme suit :
- Cloner le GitHub repo, courir
cdk deploy PdfMapperToFhirWorkflow
depuis votre invite de commande ou votre terminal et suivez le fichier README. Le déploiement se terminera en 30 minutes environ. - Sur la console Amazon S3, accédez au compartiment commençant par
pdfmappertofhirworkflow
-, qui a été créé dans le cadre decdk deploy
. - Dans le bucket, créez un dossier appelé uploads et importez l'exemple de PDF (Exemple de dossier médical.pdf).
Dès que le téléchargement du document est réussi, il déclenche le pipeline et vous pouvez commencer à voir les données dans Amazon HealthLake, que vous pouvez interroger à l'aide de plusieurs outils AWS.
Interroger les données
Pour explorer vos données, procédez comme suit :
- Sur la console CloudWatch, recherchez le
HealthlakeTextract
groupe de journaux. - Dans les détails du groupe de journaux, notez l'ID unique du document que vous avez traité.
- Sur la console Amazon HealthLake, choisissez Magasins de données dans le volet de navigation.
- Sélectionnez votre magasin de données et choisissez Exécuter une requête.
- Pour Type de requête, choisissez Rechercher avec GET.
- Pour Type de ressource, choisissez Référence de document.
- Pour Paramètres de recherche, saisissez le paramètre relatif à et la valeur relative à
DocumentReference/
Identifiant unique. - Selectionnez Exécuter une requête.
- Dans le Organe de réponse , réduisez les sections de ressources pour afficher uniquement les six ressources qui ont été créées pour le document PDF de six pages.
- La capture d'écran suivante montre l'analyse intégrée avec Amazon Comprehend Medical et NLP activés. La capture d'écran à gauche est le PDF source ; la capture d'écran à droite est le résultat NLP d'Amazon HealthLake.
- Vous pouvez également exécuter une requête avec Type de requête définir comme Lire et les Type de ressource définir comme État à l'aide de l'ID de ressource approprié.
La capture d'écran suivante montre les résultats de la requête. - Sur la console Athena, exécutez la requête suivante :
De même, vous pouvez interroger MedicationStatement
, Condition
et une Observation
Ressources.
Nettoyer
Une fois que vous avez terminé d'utiliser cette solution, exécutez cdk destroy PdfMapperToFhirWorkflow
pour vous assurer de ne pas encourir de frais supplémentaires. Pour plus d'informations, reportez-vous à Boîte à outils AWS CDK (commande cdk).
Conclusion
Les services d'AWS AI et Amazon HealthLake peuvent aider à stocker, transformer, interroger et analyser les informations issues de données de santé non structurées. Bien que cet article ne couvre qu'un tableau clinique PDF, vous pouvez étendre la solution à d'autres types de PDF, d'images et de notes manuscrites de soins de santé. Une fois les données extraites sous forme de texte, analysées en éléments de données discrets à l'aide d'Amazon Comprehend Medical et stockées dans Amazon HealthLake, elles pourraient être encore enrichies par des systèmes en aval pour générer des informations de santé significatives et exploitables et, en fin de compte, améliorer les résultats de santé des patients.
La solution proposée ne nécessite pas le déploiement et la maintenance d'une infrastructure serveur. Tous les services sont soit gérés par AWS, soit sans serveur. Avec le modèle de facturation à l'utilisation d'AWS et la profondeur et l'étendue de ses services, le coût et l'effort de configuration initiale et d'expérimentation sont nettement inférieurs aux alternatives traditionnelles sur site.
Ressources additionnelles
Pour plus d'informations sur Amazon HealthLake, reportez-vous à ce qui suit :
À propos des auteurs
Shravan Vurputour est architecte de solutions senior chez AWS. En tant que défenseur de confiance des clients, il aide les organisations à comprendre les meilleures pratiques en matière d'architectures avancées basées sur le cloud et fournit des conseils sur les stratégies pour aider à obtenir des résultats commerciaux réussis pour un large éventail d'entreprises clientes grâce à sa passion pour l'éducation, la formation, la conception et la construction de cloud. solutions. Dans ses temps libres, il aime lire, passer du temps avec sa famille et cuisiner.
Rafael M. Koike est un architecte principal de solutions chez AWS qui soutient les clients Enterprise dans le sud-est et fait partie de la communauté de terrain technique de stockage et de sécurité. Rafael a la passion de construire, et son expertise en matière de sécurité, de stockage, de mise en réseau et de développement d'applications a été déterminante pour aider les clients à migrer vers le cloud en toute sécurité et rapidement.
Randheer Gehlot est Principal Customer Solutions Manager chez AWS. Randheer est passionné par l'IA/ML et son application dans l'industrie HCLS. En tant que constructeur AWS, il travaille avec de grandes entreprises pour concevoir et mettre en œuvre rapidement des migrations stratégiques vers le cloud et créer des solutions cloud natives modernes.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- PlatoAiStream. Intelligence des données Web3. Connaissance Amplifiée. Accéder ici.
- Frapper l'avenir avec Adryenn Ashley. Accéder ici.
- Achetez et vendez des actions de sociétés PRE-IPO avec PREIPO®. Accéder ici.
- La source: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- :possède
- :est
- :où
- $UP
- 30
- 7
- a
- A Propos
- Compte
- à travers
- Ad
- Supplémentaire
- Avancée
- conseils
- avocat
- Après
- AI
- Services d'IA
- AI / ML
- Tous
- aussi
- des alternatives
- Bien que
- Amazon
- Amazon comprendre
- Amazon Comprehend Medical
- Amazon Health Lake
- Extrait d'Amazon
- an
- Analyses
- selon une analyse de l’Université de Princeton
- analytique
- il analyse
- et les
- Application
- Le développement d'applications
- approprié
- d'environ
- SONT
- autour
- AS
- At
- Automates
- Automation
- disponibles
- AWS
- BE
- était
- va
- LES MEILLEURS
- les meilleures pratiques
- facturation
- largeur
- vaste
- construire
- constructeur
- Développement
- la performance des entreprises
- mais
- by
- appelé
- CAN
- capturer
- maisons
- central
- caractéristiques
- des charges
- Graphique
- Charts
- Selectionnez
- Infos sur les
- le cloud
- code
- Commun
- Communautés
- compatible
- complet
- complexe
- comprendre
- concept
- PROBLÈMES DE PEAU
- condition
- considéré
- Console
- consommées
- contexte
- Conversion
- Prix
- pourriez
- Cours
- couvert
- engendrent
- créée
- crée des
- Customiser
- des clients
- Solutions clients
- Clients
- données
- Date
- Réglage par défaut
- démographique
- déployer
- déploiement
- profondeur
- Conception
- conception
- détruire
- détaillé
- détails
- Déterminer
- Développement
- difficile
- handicapé
- découvrez
- do
- document
- Automatisation des documents
- INSTITUTIONNELS
- Ne fait pas
- fait
- Ne pas
- down
- motivation
- pendant
- Est
- Easy
- l'éducation
- de manière efficace
- effort
- non plus
- élément
- éléments
- emails
- permettre
- activé
- fin
- enrichi
- assurer
- Entrer
- Entreprise
- entreprises
- erreur
- estimé
- Pourtant, la
- événement
- exister
- existe
- nous a permis de concevoir
- Expliquer
- explorez
- étendre
- extrait
- Extraits
- Facilité
- Familiarité
- famille
- RAPIDE
- few
- champ
- Des champs
- Déposez votre dernière attestation
- finale
- Prénom
- suivre
- Abonnement
- suit
- Pour
- formulaire
- le format
- De
- fonction
- plus
- avenir
- génération
- obtenez
- obtention
- Réservation de groupe
- he
- Santé
- la médecine
- vous aider
- aider
- aide
- sa
- Comment
- How To
- HTML
- http
- HTTPS
- i
- ID
- identifier
- image
- satellite
- Mettre en oeuvre
- améliorer
- in
- indiquer
- industrie
- d'information
- Infrastructure
- initiale
- idées.
- instrumental
- des services
- Interactif
- Interopérabilité
- développement
- sueñortiendo
- aide
- IT
- SES
- jpg
- juste
- langue
- gros
- Grandes entreprises
- apprentissage
- à gauche
- Legacy
- Niveau
- comme
- limites
- Liste
- charge
- charges
- fermé
- enregistrer
- baisser
- click
- machine learning
- maintient
- facile
- a prendre une
- Fabrication
- gérés
- manager
- Manuel
- Mai..
- sens
- significative
- veux dire
- médical
- Mémoire
- Métadonnées
- émigrer
- Minutes
- ML
- modèle
- numériques jumeaux (digital twin models)
- Villas Modernes
- Surveiller
- PLUS
- (en fait, presque toutes)
- Bougez
- prénom
- Nature
- Traitement du langage naturel
- NAVIGUER
- Navigation
- de mise en réseau
- nlp
- Notes
- maintenant
- of
- on
- uniquement
- or
- organisations
- Autre
- nos
- les résultats
- sortie
- pain
- paramètre
- partie
- fête
- passion
- passionné
- passé
- patientforward
- motifs
- Effectuer
- pipeline
- Platon
- Intelligence des données Platon
- PlatonDonnées
- Post
- pratiques
- Prédictions
- prescription
- précédemment
- Directeur
- Problème
- processus
- Traité
- les process
- traitement
- Progrès
- proposer
- proposé
- de voiture.
- fournisseurs
- fournit
- vite.
- Rafael
- Nos tests de diagnostic produisent des résultats rapides et précis sans nécessiter d'équipement de laboratoire complexe et coûteux,
- rapidement
- Tarif
- raw
- en cours
- record
- région
- exigent
- ressource
- Resources
- résultat
- Résultats
- Ressuscité
- Analyse
- Courir
- Escaliers intérieurs
- scénario
- Rechercher
- Section
- les sections
- en toute sécurité
- sécurité
- voir
- envoie
- supérieur
- séparé
- besoin
- Sans serveur
- service
- Services
- set
- installation
- plusieurs
- Spectacles
- de façon significative
- étapes
- situation
- SIX
- lent
- petit
- sur mesure
- Solutions
- quelques
- Identifier
- Région Sud
- groupe de neurones
- Dépenses
- Commencer
- Commencez
- rester
- Étapes
- storage
- Boutique
- stockée
- STORES
- Stratégique
- les stratégies
- soumettre
- réussi
- Support
- Appuyer
- Système
- prise
- Technique
- terminal
- tester
- que
- qui
- Le
- El futuro
- La Source
- leur
- puis
- this
- Avec
- fiable
- à
- ensemble
- Boîte à outils
- les outils
- traditionnel
- Formation
- Transformer
- De La Carrosserie
- déclencher
- confiance
- TOUR
- type
- types
- En fin de compte
- comprendre
- expérience unique et authentique
- ouvrir
- inexploité
- téléchargé
- utilisé
- d'utiliser
- en utilisant
- Plus-value
- variété
- divers
- Voir
- Visiter
- était
- we
- ont été
- qui
- sera
- comprenant
- dans les
- vos contrats
- Vous n'avez
- Votre
- zéphyrnet