Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake

Publisert av Platon

Følgere: 0

Helsedata er komplekse og siloer, og finnes i ulike formater. Anslagsvis 80 % av dataene i organisasjoner anses å være ustrukturerte eller "mørke" data som er låst inne i tekst, e-poster, PDF-er og skannede dokumenter. Disse dataene er vanskelige å tolke eller analysere programmatisk og begrenser hvordan organisasjoner kan hente innsikt fra dem og betjene kundene sine mer effektivt. Den raske datagenereringshastigheten betyr at organisasjoner som ikke investerer i dokumentautomatisering risikerer å bli sittende fast med eldre prosesser som er manuelle, langsomme, feilutsatte og vanskelige å skalere.

I dette innlegget foreslår vi en løsning som automatiserer inntak og transformasjon av tidligere uutnyttede PDF-er og håndskrevne kliniske notater og data. Vi forklarer hvordan du trekker ut informasjon fra kundedatadiagrammer ved hjelp av amazontekst, bruk deretter den rå utpakkede teksten til å identifisere diskrete dataelementer ved hjelp av Amazon Comprehend Medical. Vi lagrer det endelige resultatet i Fast Healthcare Interoperability Resources (FHIR)-kompatibelt format i Amazon HealthLake, noe som gjør den tilgjengelig for nedstrømsanalyse.

Løsningsoversikt

AWS tilbyr en rekke tjenester og løsninger for helsepersonell for å låse opp verdien av dataene deres. For løsningen vår behandler vi et lite utvalg av dokumenter gjennom Amazon Textract og laster de utpakkede dataene som passende FHIR-ressurser i Amazon HealthLake. Vi lager en tilpasset prosess for FHIR-konvertering og tester den fra ende til annen.

Dataene lastes først inn DocumentReference. Amazon HealthLake oppretter deretter systemgenererte ressurser etter å ha behandlet denne ustrukturerte teksten DocumentReference og laster den inn Condition, MedicationStatementog Observation ressurser. Vi identifiserer noen få datafelt i FHIR-ressurser som pasient-ID, dato for tjenesten, leverandørtype og navn på medisinsk institusjon.

A MedicationStatement er en oversikt over en medisin som blir konsumert av en pasient. Det kan tyde på at pasienten tar medisinen nå, har tatt medisinen tidligere, eller kommer til å ta medisinen i fremtiden. Et vanlig scenario hvor denne informasjonen fanges opp er under historikkprosessen i løpet av et pasientbesøk eller opphold. Kilden til medisininformasjon kan være pasientens hukommelse, en reseptbelagt flaske eller fra en liste over medisiner pasienten, klinikeren eller annen part vedlikeholder.

Observations er et sentralt element i helsevesenet, brukes til å støtte diagnose, overvåke fremgang, bestemme grunnlinjer og mønstre, og til og med fange demografiske kjennetegn. De fleste observasjoner er enkle navn/verdipar-påstander med noen metadata, men noen observasjoner grupperer andre observasjoner logisk, eller kan til og med være flerkomponentobservasjoner.

De Condition ressurs brukes til å registrere detaljert informasjon om en tilstand, problem, diagnose eller annen hendelse, situasjon, problemstilling eller klinisk konsept som har økt til et bekymringsnivå. Tilstanden kan være en punkt-i-tidsdiagnose i sammenheng med et møte, et punkt på behandlerens problemliste eller en bekymring som ikke finnes på behandlerens problemliste.

Følgende diagram viser arbeidsflyten for å migrere ustrukturerte data til FHIR for AI og maskinlæring (ML)-analyse i Amazon HealthLake.

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Arbeidsflyttrinnene er som følger:

Et dokument lastes opp til en Amazon enkel lagringstjeneste (Amazon S3) bøtte.
Dokumentopplastingen i Amazon S3 utløser en AWS Lambda funksjon.
Lambda-funksjonen sender bildet til Amazon Textract.
Amazon Textract trekker ut tekst fra bildet og lagrer utdataene i en separat Amazon Textract output S3-bøtte.
Det endelige resultatet lagres som spesifikke FHIR-ressurser (den utpakkede teksten lastes inn DocumentReference som base64-kodet tekst) i Amazon HealthLake for å trekke ut mening fra de ustrukturerte dataene med integrert Amazon Comprehend Medical for enkelt søk og spørring.
Brukere kan lage meningsfulle analyser og kjøre interaktive analyser ved hjelp av Amazonas Athena.
Brukere kan bygge visualiseringer, utføre ad hoc-analyser og raskt få forretningsinnsikt ved å bruke Amazon QuickSight.
Brukere kan lage spådommer med helsedata ved å bruke Amazon SageMaker ML-modeller.

Forutsetninger

Dette innlegget forutsetter kjennskap til følgende tjenester:

Som standard er den integrerte Amazon Comprehend Medical-funksjonen for naturlig språkbehandling (NLP) i Amazon HealthLake deaktivert i AWS-kontoen din. For å aktivere det, send inn en støttesak med din konto-ID, AWS-regionen og Amazon HealthLake-datalageret ARN. For mer informasjon, se Hvordan slår jeg på HealthLakes integrerte funksjon for naturlig språkbehandling.

Referere til GitHub repo for flere distribusjonsdetaljer.

Distribuer løsningsarkitekturen

For å sette opp løsningen, fullfør følgende trinn:

Klone GitHub repo, løpe cdk deploy PdfMapperToFhirWorkflow fra ledeteksten eller terminalen og følg README-filen. Utrullingen vil fullføres om omtrent 30 minutter.
På Amazon S3-konsollen, naviger til bøtta som starter med pdfmappertofhirworkflow-, som ble opprettet som en del av cdk deploy.
Inne i bøtta, lag en mappe kalt opplastinger og last opp eksempel-PDF-en (SampleMedicalRecord.pdf).

Så snart dokumentopplastingen er vellykket, vil den utløse rørledningen, og du kan begynne å se data i Amazon HealthLake, som du kan spørre etter ved hjelp av flere AWS-verktøy.

Spør dataene

For å utforske dataene dine, fullfør følgende trinn:

På CloudWatch-konsollen, søk etter HealthlakeTextract logggruppe.
I logggruppedetaljene noterer du den unike ID-en til dokumentet du behandlet.
På Amazon HealthLake-konsollen velger du Datalagre i navigasjonsruten.
Velg datalageret ditt og velg Kjør spørringen.
Til Søketype, velg Søk med GET.
Til Ressurs type, velg Dokumentreferanse.
Til Søkeparametere, skriv inn parameteren som er relatert til og verdien som DocumentReference/Unik ID.
Velg Kjør spørringen.
på Responsorgan minimere ressursseksjonene for bare å vise de seks ressursene som ble opprettet for det seks-siders PDF-dokumentet.
Følgende skjermbilde viser den integrerte analysen med Amazon Comprehend Medical og NLP aktivert. Skjermbildet til venstre er kilde-PDFen; skjermbildet til høyre er NLP-resultatet fra Amazon HealthLake.
Du kan også kjøre en spørring med Søketype angitt som Lese og Ressurs type angitt som Betingelse ved å bruke riktig ressurs-ID.

Følgende skjermbilde viser søkeresultatene.

Kjør følgende spørring på Athena-konsollen:

SELECT * FROM "healthlakestore"."documentreference";

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

På samme måte kan du spørre MedicationStatement, Conditionog Observation ressurser.

Rydd opp

Etter at du er ferdig med å bruke denne løsningen, kjør cdk destroy PdfMapperToFhirWorkflow for å sikre at du ikke pådrar deg ekstra kostnader. For mer informasjon, se AWS CDK Toolkit (cdk-kommando).

konklusjonen

AWS AI-tjenester og Amazon HealthLake kan hjelpe med å lagre, transformere, søke etter og analysere innsikt fra ustrukturerte helsedata. Selv om dette innlegget bare dekket et klinisk PDF-diagram, kan du utvide løsningen til andre typer helsetjenester PDF-er, bilder og håndskrevne notater. Etter at dataene er trukket ut i tekstform, analysert til diskrete dataelementer ved hjelp av Amazon Comprehend Medical og lagret i Amazon HealthLake, kan de berikes ytterligere av nedstrømssystemer for å drive meningsfull og handlingsdyktig helseinformasjon og til slutt forbedre pasientens helseresultater.

Den foreslåtte løsningen krever ikke distribusjon og vedlikehold av serverinfrastruktur. Alle tjenester er enten administrert av AWS eller serverløse. Med AWS sin pay-as-you-go-faktureringsmodell og dens dybde og bredde av tjenester, er kostnadene og innsatsen ved innledende oppsett og eksperimentering betydelig lavere enn tradisjonelle lokale alternativer.

Tilleggsressurser

For mer informasjon om Amazon HealthLake, se følgende:

Om forfatterne

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Shravan Vurputoor er Senior Solutions Architect hos AWS. Som en pålitelig kundeadvokat hjelper han organisasjoner med å forstå beste praksis rundt avanserte skybaserte arkitekturer, og gir råd om strategier for å bidra til å oppnå vellykkede forretningsresultater på tvers av et bredt sett av bedriftskunder gjennom sin lidenskap for utdanning, opplæring, design og bygging av sky. løsninger. På fritiden liker han å lese, tilbringe tid med familien og lage mat.

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Rafael M. Koike er en Principal Solutions Architect hos AWS som støtter Enterprise-kunder i Sørøst, og er en del av Storage and Security Technical Field Community. Rafael har en lidenskap for å bygge, og hans ekspertise innen sikkerhet, lagring, nettverk og applikasjonsutvikling har vært avgjørende for å hjelpe kunder med å flytte til skyen sikkert og raskt.

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Randheer Gehlot er hovedansvarlig for kundeløsninger hos AWS. Randheer er lidenskapelig opptatt av AI/ML og dens anvendelse innen HCLS-industrien. Som en AWS-bygger jobber han med store bedrifter for å designe og raskt implementere strategiske migrasjoner til skyen og bygge moderne, skybaserte løsninger.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoAiStream. Web3 Data Intelligence. Kunnskap forsterket. Tilgang her.
Minting the Future med Adryenn Ashley. Tilgang her.
Kjøp og selg aksjer i PRE-IPO-selskaper med PREIPO®. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/transform-analyze-and-discover-insights-from-unstructured-healthcare-data-using-amazon-healthlake/

Tidstempel: Kan 9, 2023

Tidstempel: Mar 10, 2023

Transformer, analyser og oppdag innsikt fra ustrukturerte helsedata ved å bruke Amazon HealthLake

Publisert av Platon

Løsningsoversikt

Forutsetninger

Distribuer løsningsarkitekturen

Spør dataene

Rydd opp

konklusjonen

Tilleggsressurser

Om forfatterne

Mer fra AWS maskinlæring

Abode bruker Amazon Rekognition Streaming Video Events for å gi sanntidsvarsler til sine smarthuskunder

Distribuer og administrer pipelines for maskinlæring med Terraform ved å bruke Amazon SageMaker

Skalertrening og slutninger av tusenvis av ML-modeller med Amazon SageMaker | Amazon Web Services

MDaudit bruker AI for å forbedre inntektsresultatene for helsekunder | Amazon Web Services

Komme i gang med Amazon Kendra Box-kontakten

Amazon EC2 DL2q-forekomst for kostnadseffektiv, høyytelses AI-slutning er nå generelt tilgjengelig | Amazon Web Services

Opprett, tren og distribuer en milliard-parameter språkmodell på terabyte med data med TensorFlow og Amazon SageMaker

Sanntidsoppdagelse av svindel ved hjelp av AWS-serverløse og maskinlæringstjenester

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn