Kilder til store data i medisin

store data, Genome Project, sosiale medier, stor dataanalyse, data medisin, Facebook Twitter

  • Geriatrisk pleie
  • Helsekompensasjon
  • Kontoradministrasjon
  • Medisinske forsyninger
  • En enkel definisjon av store data i medisin er "totaliteten av data knyttet til pasienthelse og velvære" (Raghupathi 2014). Men hva er disse typer data, og hvor kommer de fra?

    Følgende er en bred oversikt over typer og kilder til store data av interesse for helsepersonell, forskere, betalere, beslutningstakere og næringsliv.

    Disse kategoriene er ikke hverandre ekskluderende, fordi de samme dataene kan stamme fra en rekke kilder.

    Også denne listen er uttømmende, fordi den praktiske anvendelsen av stor dataanalyse vil sikkert fortsette å utvide.

    Kliniske informasjonssystemer

    Dette er tradisjonelle kilder til kliniske data som helsepersonell er vant til å se på.

    • Elektroniske helsetjenester (EHR) samler, lagrer og viser informasjon som demografi, tidligere medisinsk historie, aktive medisinske problemer, immuniseringer, allergier, medisiner, vitale tegn, resultater fra laboratorie- og radiologi tester, patologiske rapporter, fremgangsmessige notater opprettet av helse omsorgsleverandører og administrative og økonomiske dokumenter
    • Elektroniske medisinske journaler (EMRs) er ikke identiske med EHRs og gjelder vanligvis data lagret hos en bestemt lege.
    • Utveksling av helsevesenet fungerer som hubber mellom ulike kliniske informasjonssystemer.
    • Pasientregister, vedlikeholdt av helsevesenets organisasjoner på egne pasienter, er ofte knyttet til EHR. Andre registre sporer immuniseringer, kreft, traumer og andre helseproblemer på en bredere skala.
    • Pasientportaler gjør det mulig for pasienter å få tilgang til personlig helseinformasjon lagret i en helsevesenets organisasjon. Noen pasientportaler tillater også brukere å be om reseptbelagte påfyll og utveksle sikre elektroniske meldinger med helsepersonellet.
    • Kliniske datalagre samlet data fra pasientnivå fra flere kliniske informasjonssystemer, som EHRs og andre kilder som er oppført ovenfor. Krav til data fra betalere

    Offentlige betalere (for eksempel Medicare) og private betalere har store lagre av kravdata på mottakerne. Noen helseforsikringsselskaper tilbyr nå også incentiver for å dele helsedataene dine. Forskningsstudier

    Forskningsdatabaser inneholder informasjon om studiedeltakere, eksperimentelle behandlinger og kliniske utfall. Store studier er vanligvis sponset av farmasøytiske selskaper eller myndigheter. En applikasjon av personlig medisin er å matche individuelle pasienter med effektive behandlinger, basert på mønstre i kliniske forsøksdata.

    Denne tilnærmingen beveger seg utover å bruke bevisbaserte medisinprinsipper, hvorved en helsepersonell bestemmer om en pasient deler brede egenskaper (for eksempel alder, kjønn, rase, klinisk status) med prøvedeltakere. Med stor dataanalyse er det mulig å velge en behandling basert på mye mer granulær informasjon, for eksempel den genetiske profilen til pasientens kreft (se nedenfor).

    Kliniske beslutningsstøttesystemer (CDSS) har også utviklet seg raskt og representerer nå en stor del av kunstig intelligens (AI) i medisin.

    De bruker pasientdata for å hjelpe klinikere med sin beslutningsprosess og blir ofte kombinert med EHR.

    Genetiske databaser

    Beholderen for menneskelig genetisk informasjon fortsetter å samle seg i et raskt tempo. Siden Human Genome Project ble fullført i 2003, har kostnaden for human DNA-sekvensering blitt redusert med en million ganger. Personal Genome Project (PGP), lansert i 2005 av Harvard Medical School, søker å sekvensere og publisere de komplette genomene på 100.000 frivillige fra hele verden. Selve PGP er et godt eksempel på stort dataprosjekt på grunn av det store volumet og mangfoldet av data.

    Et personlig genom inneholder omtrent 100 gigabyte data. I tillegg til sekvenseringsgenerene samler PGP også data fra EHR, undersøkelser og mikrobiome profiler.

    En rekke selskaper tilbyr genetisk sekvensering direkte til forbrukere for helse, personlige egenskaper og farmakogenetikk på kommersiell basis.

    Denne personlige informasjonen kan underkastes stor dataanalyse. For eksempel stoppet 23andMe å tilby helsemessige genetiske rapporter til nye kunder per 22. november 2013, for å overholde US Food and Drug Administration. Imidlertid begynte selskapet i 2015 å tilby visse helsekomponenter av deres genetiske spyttprøve igjen, denne gangen med FDAs godkjenning.

    Offentlige Records

    Regjeringen holder detaljerte oversikt over hendelser knyttet til helse, som innvandring, ekteskap, fødsel og død. US-folketellingen har samlet enorme mengder informasjon hvert 10. år siden 1790. Statens statistikkwebside hadde 370 milliarder celler fra 2013, med ca 11 milliarder kroner lagt til årlig.

    Websøk

    Websøkinformasjon samlet av Google og andre nettsøkleverandører kan gi sanntidssikret informasjon knyttet til befolkningens helse. Verdien av store data fra nettsøkemønstre kan imidlertid forbedres ved å kombinere den med tradisjonelle kilder til helsedata.

    Sosiale medier

    Facebook, Twitter og andre sosiale medieplattformer genererer et rikt utvalg av data døgnet rundt, og gir en oversikt over plasseringene, helsesituasjonen, følelsene og sosiale samspillet mellom brukerne. Anvendelsen av sosiale medier store data til folkehelsen har blitt referert til som digital sykdomsdeteksjon eller digital epidemiologi. Twitter, for eksempel, har blitt brukt til å analysere influensaepidemier blant befolkningen generelt.

    Verdens velværeprosjekt som startet ved University of Pennsylvania er et annet eksempel på å studere sosiale medier for å forstå folks opplevelse og helse bedre. Prosjektet samler psykologer, statistikere og datavitenskapere som analyserer språk som brukes når de samhandler på nettet, for eksempel når man skriver statusoppdateringer på Facebook og Twitter. Forskere ser på hvordan brukeres språk relaterer seg til helse og lykke. Fremskritt i naturlig språkbehandling og maskinlæring bidrar til deres bestrebelser. En fersk publikasjon fra University of Pennsylvania så på måter å forutsi psykisk lidelse ved å analysere sosiale medier. Det ser ut som at symptomer på depresjon og andre psykiske helseforhold kan oppdages ved å studere bruken av Internett. Forskere håper i fremtiden at disse metodene vil kunne bedre identifisere og bistå risikofylte personer.

    Internett av ting (IoT)

    Massive trover av helsemessig informasjon samles også inn og lagres på mobile og hjemme enheter.

    Smartphones: Tusenvis av mHealth-apper fanger opp informasjon om brukerens fysiske aktivitet, næringsinntak, søvnmønstre, følelser og andre parametere. Native cellular apps (for eksempel GPS, e-post, teksting) kan også gi ledetråder om en persons helse status.

    Slitesterk skjermer og enheter: Pedometre, akselerometre, briller, klokker, og sjetonger som er innebygd under huden, samler også helsemessig informasjon og kan også sende dem inn i skyen.

    • Telemedisin-enheter tillater helsepersonell å overvåke pasientens parametere som blodtrykk, hjertefrekvens, respirasjonsfrekvens, oksygenering, temperatur, EKG-spor og vekt.
    • Finansielle transaksjoner
    • Pasientens kredittkorttransaksjoner inngår i de prediktive modellene som brukes av Carolinas HealthCare System for å identifisere pasienter som har høy risiko for å bli tilbakestilt til sykehuset. Den Charlotte-baserte helsepersonell bruker store data for å dele pasienter i ulike grupper, for eksempel basert på sykdom og geografisk plassering.

    Etiske og personvernimplikasjoner

    Det må understrekes at det i enkelte tilfeller kan være viktige etiske og personvernimplikasjoner ved innsamling og tilgang til data i helsevesenet. Nye kilder til store data kan forbedre vår forståelse av hva som påvirker individer og befolkningshelse, men ulike risikoer må nøye vurderes og overvåkes. Det har nå også blitt anerkjent at data som tidligere ble ansett anonyme, kan omdefineres. For eksempel har professor Latanya Sweeney fra Harvards Data Privacy Lab gjennomgått 1 120 frivillige som er involvert i Personal Genome Project. Hun og hennes team kunne korrekt navn 42 prosent av deltakerne ut fra informasjonen de delte (postnummer, fødselsdato, kjønn). Denne kunnskapen kan øke bevisstheten om potensielle farer og hjelpe oss med å bedre beslutninger om deling av data.

    Like this post? Please share to your friends: