Sundhedsdata er komplekse og siloformede og findes i forskellige formater. Anslået 80 % af data inden for organisationer anses for at være ustrukturerede eller "mørke" data, der er låst inde i tekst, e-mails, PDF'er og scannede dokumenter. Disse data er svære at fortolke eller analysere programmatisk og begrænser, hvordan organisationer kan udlede indsigt fra dem og betjene deres kunder mere effektivt. Den hurtige datagenereringshastighed betyder, at organisationer, der ikke investerer i dokumentautomatisering, risikerer at sidde fast med ældre processer, der er manuelle, langsomme, fejltilbøjelige og svære at skalere.
I dette indlæg foreslår vi en løsning, der automatiserer indtagelse og transformation af tidligere uudnyttede PDF'er og håndskrevne kliniske noter og data. Vi forklarer, hvordan man udtrækker information fra kundedatadiagrammer ved hjælp af amazontekst, og brug derefter den rå udtrukne tekst til at identificere diskrete dataelementer ved hjælp af Amazon Comprehend Medical. Vi gemmer det endelige output i Fast Healthcare Interoperability Resources (FHIR) kompatibelt format i Amazon HealthLake, hvilket gør det tilgængeligt for downstream-analyse.
Løsningsoversigt
AWS leverer en række tjenester og løsninger til sundhedsudbydere for at låse op for værdien af deres data. Til vores løsning behandler vi et lille udsnit af dokumenter gennem Amazon Textract og indlæser de udtrukne data som passende FHIR-ressourcer i Amazon HealthLake. Vi opretter en tilpasset proces til FHIR-konvertering og tester den fra ende til anden.
Dataene indlæses først DocumentReference
. Amazon HealthLake opretter derefter systemgenererede ressourcer efter at have behandlet denne ustrukturerede tekst DocumentReference
og indlæser det Condition
, MedicationStatement
og Observation
ressourcer. Vi identificerer nogle få datafelter inden for FHIR-ressourcer som patient-id, servicedato, udbydertype og navn på medicinsk facilitet.
A MedicationStatement
er en registrering af en medicin, der bliver indtaget af en patient. Det kan tyde på, at patienten tager medicinen nu, har taget medicinen tidligere eller vil tage medicinen i fremtiden. Et almindeligt scenarie, hvor denne information fanges, er under historikoptagelsesprocessen i løbet af et patientbesøg eller ophold. Kilden til medicininformation kan være patientens hukommelse, en receptbelagt flaske eller fra en liste over medicin, som patienten, klinikeren eller anden part vedligeholder.
Observations
er et centralt element i sundhedsvæsenet, der bruges til at understøtte diagnose, overvåge fremskridt, bestemme basislinjer og mønstre og endda fange demografiske karakteristika. De fleste observationer er simple navn/værdipar-påstande med nogle metadata, men nogle observationer grupperer andre observationer logisk eller kan endda være multi-komponent observationer.
Condition
ressource bruges til at registrere detaljerede oplysninger om en tilstand, problem, diagnose eller anden hændelse, situation, problem eller klinisk koncept, der er steget til et niveau af bekymring. Tilstanden kan være en diagnose på tidspunktet i forbindelse med et møde, et punkt på lægens problemliste eller en bekymring, der ikke findes på lægens problemliste.
Følgende diagram viser arbejdsgangen til at migrere ustrukturerede data til FHIR til AI og maskinlæringsanalyse (ML) i Amazon HealthLake.
Workflow-trinene er som følger:
- Et dokument uploades til en Amazon Simple Storage Service (Amazon S3) spand.
- Dokumentuploaden i Amazon S3 udløser en AWS Lambda funktion.
- Lambda-funktionen sender billedet til Amazon Textract.
- Amazon Textract udtrækker tekst fra billedet og gemmer outputtet i en separat Amazon Textract output S3-spand.
- Det endelige resultat gemmes som specifikke FHIR-ressourcer (den udtrukne tekst indlæses
DocumentReference
som base64-kodet tekst) i Amazon HealthLake for at udtrække mening fra de ustrukturerede data med integreret Amazon Comprehend Medical for nem søgning og forespørgsler. - Brugere kan skabe meningsfulde analyser og køre interaktive analyser vha Amazonas Athena.
- Brugere kan bygge visualiseringer, udføre ad hoc-analyser og hurtigt få forretningsindsigt ved hjælp af Amazon QuickSight.
- Brugere kan lave forudsigelser med sundhedsdata ved hjælp af Amazon SageMaker ML modeller.
Forudsætninger
Dette indlæg forudsætter kendskab til følgende tjenester:
Som standard er den integrerede Amazon Comprehend Medical NLP-funktion (natural language processing) i Amazon HealthLake deaktiveret på din AWS-konto. For at aktivere det, indsend en supportsag med dit konto-id, AWS-region og Amazon HealthLake-datalageret ARN. For mere information, se Hvordan slår jeg HealthLakes integrerede naturlige sprogbehandlingsfunktion til.
Se i GitHub repo for flere installationsdetaljer.
Implementer løsningsarkitekturen
For at konfigurere løsningen skal du udføre følgende trin:
- Klon GitHub repo, løb
cdk deploy PdfMapperToFhirWorkflow
fra din kommandoprompt eller terminal og følg README-filen. Implementeringen afsluttes om cirka 30 minutter. - På Amazon S3-konsollen skal du navigere til bøtten, der starter med
pdfmappertofhirworkflow
-, som blev skabt som en del afcdk deploy
. - Inde i bøtten skal du oprette en mappe kaldet uploads og uploade eksempel-PDFen (SampleMedicalRecord.pdf).
Så snart dokumentuploadet er vellykket, vil det udløse pipelinen, og du kan begynde at se data i Amazon HealthLake, som du kan forespørge ved hjælp af flere AWS-værktøjer.
Spørg dataene
Udfør følgende trin for at udforske dine data:
- På CloudWatch-konsollen skal du søge efter
HealthlakeTextract
log gruppe. - I loggruppeoplysningerne skal du notere det unikke ID for det dokument, du behandlede.
- Vælg på Amazon HealthLake-konsollen Databutikker i navigationsruden.
- Vælg dit datalager og vælg Kør forespørgsel.
- Til Forespørgselstype, vælg Søg med GET.
- Til Ressourcetype, vælg Dokumentreference.
- Til Søgeparametre, indtast parameteren som relaterer til og værdien som
DocumentReference/
Unikt ID. - Vælg Kør forespørgsel.
- I Reaktionsorgan sektionen skal du minimere ressourcesektionerne for kun at se de seks ressourcer, der blev oprettet til det seks-siders PDF-dokument.
- Følgende skærmbillede viser den integrerede analyse med Amazon Comprehend Medical og NLP aktiveret. Skærmbilledet til venstre er kilde-PDFen; skærmbilledet til højre er NLP-resultatet fra Amazon HealthLake.
- Du kan også køre en forespørgsel med Forespørgselstype angivet som Læs , Ressourcetype angivet som Betingelse ved at bruge det relevante ressource-id.
Følgende skærmbillede viser forespørgselsresultaterne. - Kør følgende forespørgsel på Athena-konsollen:
På samme måde kan du forespørge MedicationStatement
, Condition
og Observation
ressourcer.
Ryd op
Når du er færdig med at bruge denne løsning, skal du køre cdk destroy PdfMapperToFhirWorkflow
for at sikre, at du ikke pådrager dig yderligere omkostninger. For mere information, se AWS CDK Toolkit (cdk kommando).
Konklusion
AWS AI-tjenester og Amazon HealthLake kan hjælpe med at lagre, transformere, forespørge og analysere indsigt fra ustrukturerede sundhedsdata. Selvom dette indlæg kun dækkede et klinisk PDF-diagram, kan du udvide løsningen til andre typer sundhedspleje-PDF'er, billeder og håndskrevne noter. Efter at dataene er ekstraheret til tekstform, parset til diskrete dataelementer ved hjælp af Amazon Comprehend Medical og gemt i Amazon HealthLake, kan de blive yderligere beriget af downstream-systemer for at drive meningsfuld og brugbar sundhedsinformation og i sidste ende forbedre patienternes helbredsresultater.
Den foreslåede løsning kræver ikke installation og vedligeholdelse af serverinfrastruktur. Alle tjenester er enten administreret af AWS eller serverløse. Med AWS's pay-as-you-go-faktureringsmodel og dens dybde og bredde af tjenester er omkostningerne og indsatsen ved indledende opsætning og eksperimenter væsentligt lavere end traditionelle lokale alternativer.
Yderligere ressourcer
For mere information om Amazon HealthLake, se følgende:
Om forfatterne
Shravan Vurputoor er Senior Solutions Architect hos AWS. Som en betroet kundeadvokat hjælper han organisationer med at forstå bedste praksis omkring avancerede cloud-baserede arkitekturer og giver råd om strategier, der kan hjælpe med at skabe succesfulde forretningsresultater på tværs af en bred vifte af virksomhedskunder gennem hans passion for at uddanne, træne, designe og bygge cloud. løsninger. I sin fritid nyder han at læse, tilbringe tid med sin familie og lave mad.
Rafael M. Koike er en Principal Solutions Architect hos AWS, der understøtter Enterprise-kunder i det sydøstlige, og er en del af Storage and Security Technical Field Community. Rafael har en passion for at bygge, og hans ekspertise inden for sikkerhed, opbevaring, netværk og applikationsudvikling har været medvirkende til at hjælpe kunder med at flytte til skyen sikkert og hurtigt.
Randheer Gehlot er Principal Customer Solutions Manager hos AWS. Randheer brænder for AI/ML og dets anvendelse inden for HCLS-industrien. Som AWS-bygger arbejder han med store virksomheder for at designe og hurtigt implementere strategiske migreringer til skyen og bygge moderne, cloud-native løsninger.
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- PlatoAiStream. Web3 Data Intelligence. Viden forstærket. Adgang her.
- Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
- Køb og sælg aktier i PRE-IPO-virksomheder med PREIPO®. Adgang her.
- Kilde: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- :har
- :er
- :hvor
- $OP
- 30
- 7
- a
- Om
- Konto
- tværs
- Ad
- Yderligere
- fremskreden
- rådgivning
- fortaler
- Efter
- AI
- AI-tjenester
- AI / ML
- Alle
- også
- alternativer
- Skønt
- Amazon
- Amazon Comprehend
- Amazon Comprehend Medical
- Amazon HealthLake
- amazontekst
- an
- Analyser
- analyse
- analytics
- analysere
- ,
- Anvendelse
- Application Development
- passende
- cirka
- ER
- omkring
- AS
- At
- automater
- Automation
- til rådighed
- AWS
- BE
- været
- være
- BEDSTE
- bedste praksis
- fakturerings- og
- bredde
- bred
- bygge
- Builder
- Bygning
- virksomhed
- men
- by
- kaldet
- CAN
- fange
- tilfælde
- central
- karakteristika
- afgifter
- Chart
- Diagrammer
- Vælg
- Klinisk
- Cloud
- kode
- Fælles
- samfund
- kompatibel
- fuldføre
- komplekse
- forstå
- Konceptet
- Bekymring
- betingelse
- betragtes
- Konsol
- forbruges
- sammenhæng
- Konvertering
- Koste
- kunne
- Kursus
- dækket
- skabe
- oprettet
- skaber
- skik
- kunde
- Kundeløsninger
- Kunder
- data
- Dato
- Standard
- demografiske
- indsætte
- implementering
- dybde
- Design
- designe
- ødelægge
- detaljeret
- detaljer
- Bestem
- Udvikling
- svært
- deaktiveret
- opdage
- do
- dokumentet
- Dokumentautomatisering
- dokumenter
- Er ikke
- færdig
- Dont
- ned
- køre
- i løbet af
- Øst
- let
- uddanne
- effektivt
- indsats
- enten
- element
- elementer
- emails
- muliggøre
- aktiveret
- ende
- beriget
- sikre
- Indtast
- Enterprise
- virksomheder
- fejl
- anslået
- Endog
- begivenhed
- eksisterer
- eksisterer
- ekspertise
- Forklar
- udforske
- udvide
- ekstrakt
- Uddrag
- Facility
- Kendskab
- familie
- FAST
- få
- felt
- Fields
- File (Felt)
- endelige
- Fornavn
- følger
- efter
- følger
- Til
- formular
- format
- fra
- funktion
- yderligere
- fremtiden
- generation
- få
- få
- gruppe
- he
- Helse
- sundhedspleje
- hjælpe
- hjælpe
- hjælper
- hans
- Hvordan
- How To
- HTML
- http
- HTTPS
- i
- ID
- identificere
- billede
- billeder
- gennemføre
- Forbedre
- in
- angiver
- industrien
- oplysninger
- Infrastruktur
- initial
- indsigt
- medvirkende
- integreret
- interaktiv
- Interoperabilitet
- ind
- investere
- spørgsmål
- IT
- ITS
- jpg
- lige
- Sprog
- stor
- Store virksomheder
- læring
- til venstre
- Legacy
- Niveau
- ligesom
- grænser
- Liste
- belastning
- belastninger
- låst
- log
- lavere
- maskine
- machine learning
- fastholder
- vedligeholdelse
- lave
- Making
- lykkedes
- leder
- manuel
- Kan..
- betyder
- meningsfuld
- midler
- medicinsk
- Hukommelse
- Metadata
- migrere
- minutter
- ML
- model
- modeller
- Moderne
- Overvåg
- mere
- mest
- bevæge sig
- navn
- Natural
- Natural Language Processing
- Naviger
- Navigation
- netværk
- NLP
- Noter
- nu
- of
- on
- kun
- or
- organisationer
- Andet
- vores
- udfald
- output
- brød
- parameter
- del
- part
- lidenskab
- lidenskabelige
- forbi
- patient
- mønstre
- Udfør
- pipeline
- plato
- Platon Data Intelligence
- PlatoData
- Indlæg
- praksis
- Forudsigelser
- recept
- tidligere
- Main
- Problem
- behandle
- Behandlet
- Processer
- forarbejdning
- Progress
- foreslå
- foreslog
- udbyder
- udbydere
- giver
- hurtigt
- Rafael
- hurtige
- hurtigt
- Sats
- Raw
- Læsning
- optage
- region
- kræver
- ressource
- Ressourcer
- resultere
- Resultater
- Risen
- Risiko
- Kør
- Scale
- scenarie
- Søg
- Sektion
- sektioner
- sikkert
- sikkerhed
- se
- sender
- senior
- adskille
- tjener
- Serverless
- tjeneste
- Tjenester
- sæt
- setup
- flere
- Shows
- betydeligt
- Simpelt
- Situationen
- SIX
- langsom
- lille
- løsninger
- Løsninger
- nogle
- Kilde
- Syd
- specifikke
- udgifterne
- starte
- Starter
- forblive
- Steps
- opbevaring
- butik
- opbevaret
- forhandler
- Strategisk
- strategier
- indsende
- vellykket
- support
- Støtte
- Systemer
- tager
- Teknisk
- terminal
- prøve
- end
- at
- Fremtiden
- The Source
- deres
- derefter
- denne
- Gennem
- tid
- til
- sammen
- toolkit
- værktøjer
- traditionelle
- Kurser
- Transform
- Transformation
- udløse
- betroet
- TUR
- typen
- typer
- Ultimativt
- forstå
- enestående
- låse
- uudnyttet
- uploadet
- brug
- anvendte
- ved brug af
- værdi
- række
- forskellige
- Specifikation
- Besøg
- var
- we
- var
- som
- vilje
- med
- inden for
- virker
- Du
- Din
- zephyrnet