Helsedata er komplekse og siloer, og finnes i ulike formater. Anslagsvis 80 % av dataene i organisasjoner anses å være ustrukturerte eller "mørke" data som er låst inne i tekst, e-poster, PDF-er og skannede dokumenter. Disse dataene er vanskelige å tolke eller analysere programmatisk og begrenser hvordan organisasjoner kan hente innsikt fra dem og betjene kundene sine mer effektivt. Den raske datagenereringshastigheten betyr at organisasjoner som ikke investerer i dokumentautomatisering risikerer å bli sittende fast med eldre prosesser som er manuelle, langsomme, feilutsatte og vanskelige å skalere.
I dette innlegget foreslår vi en løsning som automatiserer inntak og transformasjon av tidligere uutnyttede PDF-er og håndskrevne kliniske notater og data. Vi forklarer hvordan du trekker ut informasjon fra kundedatadiagrammer ved hjelp av amazontekst, bruk deretter den rå utpakkede teksten til å identifisere diskrete dataelementer ved hjelp av Amazon Comprehend Medical. Vi lagrer det endelige resultatet i Fast Healthcare Interoperability Resources (FHIR)-kompatibelt format i Amazon HealthLake, noe som gjør den tilgjengelig for nedstrømsanalyse.
Løsningsoversikt
AWS tilbyr en rekke tjenester og løsninger for helsepersonell for å låse opp verdien av dataene deres. For løsningen vår behandler vi et lite utvalg av dokumenter gjennom Amazon Textract og laster de utpakkede dataene som passende FHIR-ressurser i Amazon HealthLake. Vi lager en tilpasset prosess for FHIR-konvertering og tester den fra ende til annen.
Dataene lastes først inn DocumentReference
. Amazon HealthLake oppretter deretter systemgenererte ressurser etter å ha behandlet denne ustrukturerte teksten DocumentReference
og laster den inn Condition
, MedicationStatement
og Observation
ressurser. Vi identifiserer noen få datafelt i FHIR-ressurser som pasient-ID, dato for tjenesten, leverandørtype og navn på medisinsk institusjon.
A MedicationStatement
er en oversikt over en medisin som blir konsumert av en pasient. Det kan tyde på at pasienten tar medisinen nå, har tatt medisinen tidligere, eller kommer til å ta medisinen i fremtiden. Et vanlig scenario hvor denne informasjonen fanges opp er under historikkprosessen i løpet av et pasientbesøk eller opphold. Kilden til medisininformasjon kan være pasientens hukommelse, en reseptbelagt flaske eller fra en liste over medisiner pasienten, klinikeren eller annen part vedlikeholder.
Observations
er et sentralt element i helsevesenet, brukes til å støtte diagnose, overvåke fremgang, bestemme grunnlinjer og mønstre, og til og med fange demografiske kjennetegn. De fleste observasjoner er enkle navn/verdipar-påstander med noen metadata, men noen observasjoner grupperer andre observasjoner logisk, eller kan til og med være flerkomponentobservasjoner.
De Condition
ressurs brukes til å registrere detaljert informasjon om en tilstand, problem, diagnose eller annen hendelse, situasjon, problemstilling eller klinisk konsept som har økt til et bekymringsnivå. Tilstanden kan være en punkt-i-tidsdiagnose i sammenheng med et møte, et punkt på behandlerens problemliste eller en bekymring som ikke finnes på behandlerens problemliste.
Følgende diagram viser arbeidsflyten for å migrere ustrukturerte data til FHIR for AI og maskinlæring (ML)-analyse i Amazon HealthLake.
Arbeidsflyttrinnene er som følger:
- Et dokument lastes opp til en Amazon enkel lagringstjeneste (Amazon S3) bøtte.
- Dokumentopplastingen i Amazon S3 utløser en AWS Lambda funksjon.
- Lambda-funksjonen sender bildet til Amazon Textract.
- Amazon Textract trekker ut tekst fra bildet og lagrer utdataene i en separat Amazon Textract output S3-bøtte.
- Det endelige resultatet lagres som spesifikke FHIR-ressurser (den utpakkede teksten lastes inn
DocumentReference
som base64-kodet tekst) i Amazon HealthLake for å trekke ut mening fra de ustrukturerte dataene med integrert Amazon Comprehend Medical for enkelt søk og spørring. - Brukere kan lage meningsfulle analyser og kjøre interaktive analyser ved hjelp av Amazonas Athena.
- Brukere kan bygge visualiseringer, utføre ad hoc-analyser og raskt få forretningsinnsikt ved å bruke Amazon QuickSight.
- Brukere kan lage spådommer med helsedata ved å bruke Amazon SageMaker ML-modeller.
Forutsetninger
Dette innlegget forutsetter kjennskap til følgende tjenester:
Som standard er den integrerte Amazon Comprehend Medical-funksjonen for naturlig språkbehandling (NLP) i Amazon HealthLake deaktivert i AWS-kontoen din. For å aktivere det, send inn en støttesak med din konto-ID, AWS-regionen og Amazon HealthLake-datalageret ARN. For mer informasjon, se Hvordan slår jeg på HealthLakes integrerte funksjon for naturlig språkbehandling.
Referere til GitHub repo for flere distribusjonsdetaljer.
Distribuer løsningsarkitekturen
For å sette opp løsningen, fullfør følgende trinn:
- Klone GitHub repo, løpe
cdk deploy PdfMapperToFhirWorkflow
fra ledeteksten eller terminalen og følg README-filen. Utrullingen vil fullføres om omtrent 30 minutter. - På Amazon S3-konsollen, naviger til bøtta som starter med
pdfmappertofhirworkflow
-, som ble opprettet som en del avcdk deploy
. - Inne i bøtta, lag en mappe kalt opplastinger og last opp eksempel-PDF-en (SampleMedicalRecord.pdf).
Så snart dokumentopplastingen er vellykket, vil den utløse rørledningen, og du kan begynne å se data i Amazon HealthLake, som du kan spørre etter ved hjelp av flere AWS-verktøy.
Spør dataene
For å utforske dataene dine, fullfør følgende trinn:
- På CloudWatch-konsollen, søk etter
HealthlakeTextract
logggruppe. - I logggruppedetaljene noterer du den unike ID-en til dokumentet du behandlet.
- På Amazon HealthLake-konsollen velger du Datalagre i navigasjonsruten.
- Velg datalageret ditt og velg Kjør spørringen.
- Til Søketype, velg Søk med GET.
- Til Ressurs type, velg Dokumentreferanse.
- Til Søkeparametere, skriv inn parameteren som er relatert til og verdien som
DocumentReference/
Unik ID. - Velg Kjør spørringen.
- på Responsorgan minimere ressursseksjonene for bare å vise de seks ressursene som ble opprettet for det seks-siders PDF-dokumentet.
- Følgende skjermbilde viser den integrerte analysen med Amazon Comprehend Medical og NLP aktivert. Skjermbildet til venstre er kilde-PDFen; skjermbildet til høyre er NLP-resultatet fra Amazon HealthLake.
- Du kan også kjøre en spørring med Søketype angitt som Lese og Ressurs type angitt som Betingelse ved å bruke riktig ressurs-ID.
Følgende skjermbilde viser søkeresultatene. - Kjør følgende spørring på Athena-konsollen:
På samme måte kan du spørre MedicationStatement
, Condition
og Observation
ressurser.
Rydd opp
Etter at du er ferdig med å bruke denne løsningen, kjør cdk destroy PdfMapperToFhirWorkflow
for å sikre at du ikke pådrar deg ekstra kostnader. For mer informasjon, se AWS CDK Toolkit (cdk-kommando).
konklusjonen
AWS AI-tjenester og Amazon HealthLake kan hjelpe med å lagre, transformere, søke etter og analysere innsikt fra ustrukturerte helsedata. Selv om dette innlegget bare dekket et klinisk PDF-diagram, kan du utvide løsningen til andre typer helsetjenester PDF-er, bilder og håndskrevne notater. Etter at dataene er trukket ut i tekstform, analysert til diskrete dataelementer ved hjelp av Amazon Comprehend Medical og lagret i Amazon HealthLake, kan de berikes ytterligere av nedstrømssystemer for å drive meningsfull og handlingsdyktig helseinformasjon og til slutt forbedre pasientens helseresultater.
Den foreslåtte løsningen krever ikke distribusjon og vedlikehold av serverinfrastruktur. Alle tjenester er enten administrert av AWS eller serverløse. Med AWS sin pay-as-you-go-faktureringsmodell og dens dybde og bredde av tjenester, er kostnadene og innsatsen ved innledende oppsett og eksperimentering betydelig lavere enn tradisjonelle lokale alternativer.
Tilleggsressurser
For mer informasjon om Amazon HealthLake, se følgende:
Om forfatterne
Shravan Vurputoor er Senior Solutions Architect hos AWS. Som en pålitelig kundeadvokat hjelper han organisasjoner med å forstå beste praksis rundt avanserte skybaserte arkitekturer, og gir råd om strategier for å bidra til å oppnå vellykkede forretningsresultater på tvers av et bredt sett av bedriftskunder gjennom sin lidenskap for utdanning, opplæring, design og bygging av sky. løsninger. På fritiden liker han å lese, tilbringe tid med familien og lage mat.
Rafael M. Koike er en Principal Solutions Architect hos AWS som støtter Enterprise-kunder i Sørøst, og er en del av Storage and Security Technical Field Community. Rafael har en lidenskap for å bygge, og hans ekspertise innen sikkerhet, lagring, nettverk og applikasjonsutvikling har vært avgjørende for å hjelpe kunder med å flytte til skyen sikkert og raskt.
Randheer Gehlot er hovedansvarlig for kundeløsninger hos AWS. Randheer er lidenskapelig opptatt av AI/ML og dens anvendelse innen HCLS-industrien. Som en AWS-bygger jobber han med store bedrifter for å designe og raskt implementere strategiske migrasjoner til skyen og bygge moderne, skybaserte løsninger.
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- PlatoAiStream. Web3 Data Intelligence. Kunnskap forsterket. Tilgang her.
- Minting the Future med Adryenn Ashley. Tilgang her.
- Kjøp og selg aksjer i PRE-IPO-selskaper med PREIPO®. Tilgang her.
- kilde: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/
- : har
- :er
- :hvor
- $OPP
- 30
- 7
- a
- Om oss
- Logg inn
- tvers
- Ad
- Ytterligere
- avansert
- råd
- advokat
- Etter
- AI
- AI-tjenester
- AI / ML
- Alle
- også
- alternativer
- Selv
- Amazon
- Amazon Comprehend
- Amazon Comprehend Medical
- Amazon HealthLake
- amazontekst
- an
- analyser
- analyse
- analytics
- analysere
- og
- Søknad
- Applikasjonutvikling
- hensiktsmessig
- ca
- ER
- rundt
- AS
- At
- automatiserer
- Automatisering
- tilgjengelig
- AWS
- BE
- vært
- være
- BEST
- beste praksis
- fakturering
- bredde
- bred
- bygge
- bygger
- Bygning
- virksomhet
- men
- by
- som heter
- CAN
- fangst
- saken
- sentral
- egenskaper
- avgifter
- Figur
- Topplisten
- Velg
- Klinisk
- Cloud
- kode
- Felles
- samfunnet
- kompatibel
- fullføre
- komplekse
- fatte
- konsept
- Bekymring
- tilstand
- ansett
- Konsoll
- forbrukes
- kontekst
- Konvertering
- Kostnad
- kunne
- Kurs
- dekket
- skape
- opprettet
- skaper
- skikk
- kunde
- Kundeløsninger
- Kunder
- dato
- Dato
- Misligholde
- demografiske
- utplassere
- distribusjon
- dybde
- utforming
- utforme
- ødelegge
- detaljert
- detaljer
- Bestem
- Utvikling
- vanskelig
- deaktivert
- oppdage
- do
- dokument
- Dokumentautomatisering
- dokumenter
- ikke
- gjort
- ikke
- ned
- stasjonen
- under
- øst
- lett
- utdanne
- effektivt
- innsats
- enten
- element
- elementer
- e-post
- muliggjøre
- aktivert
- slutt
- anriket
- sikre
- Enter
- Enterprise
- bedrifter
- feil
- anslått
- Selv
- Event
- eksisterer
- finnes
- ekspertise
- Forklar
- utforske
- utvide
- trekke ut
- ekstrakter
- Facility
- Familiær
- familie
- FAST
- Noen få
- felt
- Felt
- filet
- slutt~~POS=TRUNC
- Først
- følge
- etter
- følger
- Til
- skjema
- format
- fra
- funksjon
- videre
- framtid
- generasjonen
- få
- få
- Gruppe
- he
- Helse
- helsetjenester
- hjelpe
- hjelpe
- hjelper
- hans
- Hvordan
- Hvordan
- HTML
- http
- HTTPS
- i
- ID
- identifisere
- bilde
- bilder
- iverksette
- forbedre
- in
- indikerer
- industri
- informasjon
- Infrastruktur
- innledende
- innsikt
- instrumental
- integrert
- interaktiv
- Interoperabilitet
- inn
- investere
- utstedelse
- IT
- DET ER
- jpg
- bare
- Språk
- stor
- Store bedrifter
- læring
- venstre
- Legacy
- Nivå
- i likhet med
- grenser
- Liste
- laste
- laster
- låst
- logg
- lavere
- maskin
- maskinlæring
- opprettholder
- vedlikehold
- gjøre
- Making
- fikk til
- leder
- håndbok
- Kan..
- betyr
- meningsfylt
- midler
- medisinsk
- Minne
- metadata
- migrere
- minutter
- ML
- modell
- modeller
- Moderne
- Overvåke
- mer
- mest
- flytte
- navn
- Naturlig
- Natural Language Processing
- Naviger
- Navigasjon
- nettverk
- nlp
- Merknader
- nå
- of
- on
- bare
- or
- organisasjoner
- Annen
- vår
- utfall
- produksjon
- brød
- parameter
- del
- parti
- lidenskap
- lidenskapelig
- Past
- pasient
- mønstre
- Utfør
- rørledning
- plato
- Platon Data Intelligence
- PlatonData
- Post
- praksis
- Spådommer
- resept
- tidligere
- Principal
- Problem
- prosess
- Bearbeidet
- Prosesser
- prosessering
- Progress
- foreslå
- foreslått
- leverandør
- tilbydere
- gir
- raskt
- Rafael
- rask
- raskt
- Sats
- Raw
- Lesning
- rekord
- region
- krever
- ressurs
- Ressurser
- resultere
- Resultater
- Risen
- Risiko
- Kjør
- Skala
- scenario
- Søk
- Seksjon
- seksjoner
- sikkert
- sikkerhet
- se
- sender
- senior
- separat
- betjene
- server~~POS=TRUNC
- tjeneste
- Tjenester
- sett
- oppsett
- flere
- Viser
- betydelig
- Enkelt
- situasjon
- SIX
- langsom
- liten
- løsning
- Solutions
- noen
- kilde
- Sør
- spesifikk
- utgifter
- Begynn
- Start
- opphold
- Steps
- lagring
- oppbevare
- lagret
- butikker
- Strategisk
- strategier
- send
- vellykket
- støtte
- Støtte
- Systemer
- ta
- Teknisk
- terminal
- test
- enn
- Det
- De
- Fremtiden
- Kilden
- deres
- deretter
- denne
- Gjennom
- tid
- til
- sammen
- verktøykasse
- verktøy
- tradisjonelle
- Kurs
- Transform
- Transformation
- utløse
- klarert
- SVING
- typen
- typer
- Til syvende og sist
- forstå
- unik
- låse opp
- uutnyttet
- lastet opp
- bruke
- brukt
- ved hjelp av
- verdi
- variasjon
- ulike
- Se
- Besøk
- var
- we
- var
- hvilken
- vil
- med
- innenfor
- virker
- Du
- Din
- zephyrnet