Zdroje velkých dat v medicíně

Zdroje velkých dat v medicíně

Jednoduchá definice velkých dat v medicíně je "souhrn údajů týkajících se zdravotní péče a pohody pacienta" (Raghupathi 2014). Ale co přesně jsou tyto typy dat a odkud pocházejí?

Následující je široký přehled o typech a zdrojích velkých dat, které jsou zajímavé pro poskytovatele zdravotní péče, výzkumníky, plátce, tvůrce politik a průmyslu.

Tyto kategorie se vzájemně nevylučují, protože stejné údaje mohou pocházet z různých zdrojů.

Ani tento seznam není vyčerpávající, protože praktická aplikace rozsáhlých datových analýz bude jistě i nadále rozšiřovat.

Klinické informační systémy

Jedná se o tradiční zdroje klinických údajů, které jsou poskytovatelé zdravotní péče zvyklí na prohlížení.

Vyžaduje údaje od plátců

Veřejní plátci (např. Medicare) a soukromí plátci mají velké úložiště údajů o nárocích svých příjemců. Některé zdravotní pojišťovny nyní také nabízejí pobídky pro sdílení vašich zdravotních údajů.

Výzkumné studie

Databáze výzkumu obsahují informace o účastnících studie, experimentální léčbě a klinických výsledcích. Velké studie jsou zpravidla sponzorovány farmaceutickými společnostmi nebo vládními agenturami. Aplikace personalizovaného léku je vhodná pro individuální pacienty s účinnou léčbou založenou na vzorcích v klinických studiích.

Tento přístup přesahuje použití principů medicíny založených na důkazech, podle kterých poskytovatel zdravotní péče určuje, zda pacient sdílí široké spektrum charakteristik (např. Věk, pohlaví, rasu, klinický stav) s účastníky hodnocení. S rozsáhlou analýzou dat je možné zvolit léčbu založenou na mnohem podrobnějších informacích, jako je genetický profil rakoviny pacienta (viz níže).

Systémy podpory klinického rozhodování (CDSS) se také rychle rozvíjejí a nyní představují velkou část umělé inteligence (AI) v medicíně.

Používají údaje o pacientech k tomu, aby pomáhali klinickým lékařům při rozhodování a jsou často kombinováni s EHR.

Genetické databáze

Úložiště lidských genetických informací se i nadále hromadí rychlým tempem. Od dokončení projektu lidského genomu v roce 2003 se náklady na sekvenování lidských DNA snížily o miliónkrát. Osobní projekt genomu (PGP), který byl zahájen v roce 2005 Harvardskou lékařskou školou, usiluje o sekvenci a propagaci všech genomů 100 000 dobrovolníků z celého světa. Samotný PGP je příkladem velkého datového projektu kvůli naprostému objemu a rozmanitosti dat.

Osobní genom obsahuje asi 100 gigabajtů dat. Vedle sekvenačních genomů PGP shromažďuje také údaje z EHR, průzkumů a mikrobiologických profilů.

Řada společností nabízí genetické poradenství pro zdraví, osobní vlastnosti a farmakogenetiku na komerční bázi.

Tyto osobní informace by mohly být podrobeny velké datové analýze. Například společnost 23andMe od 22. listopadu 2013 přestala nabízet genetické zprávy týkající se zdraví novým zákazníkům, aby vyhověla US Food and Drug Administration. V roce 2015 však společnost opět začala nabízet některé zdravotní složky genetického testu slin, tentokrát s povolením FDA.

Veřejné záznamy

Vláda vede podrobné záznamy o událostech souvisejících se zdravím, jako je přistěhovalectví, manželství, narození a smrt. Sčítání lidu v USA shromažďovalo obrovské množství informací každých 10 let od roku 1790. Statistická internetová stránka Census měla od roku 2013 370 miliard buněk a dalších 11 miliard dalších ročně.

Webové vyhledávání

Webové vyhledávací informace shromážděné společností Google a dalšími poskytovateli vyhledávání na webu by mohly poskytnout informace v reálném čase týkající se zdraví obyvatel. Hodnota velkých dat z webových vyhledávacích vzorů se však může zlepšit kombinací s tradičními zdroji zdravotních dat.

Sociální média

Facebook, Twitter a další platformy sociálních médií generují bohatou škálu dat nepřetržitě a poskytují pohled na umístění, zdravotní chování, emoce a sociální interakce uživatelů. Aplikace významných dat sociálních médií na veřejné zdraví je označována jako digitální detekce onemocnění nebo digitální epidemiologie. Twitter, například, byl používán k analýze chřipkových epidemií u celé populace.

Projekt světového blahobytu, který začal na univerzitě v Pensylvánii, je dalším příkladem studie sociálních médií, aby lépe pochopili zkušenosti a zdraví lidí. Projekt sdružuje psychology, statistiky a vědce v oblasti výpočetní techniky, kteří analyzují jazyk použitý při interakci online, například při psaní aktualizací stavu na Facebooku a Twitteru. Vědci zjišťují, jak se jazyk uživatelů vztahuje k jejich zdraví a štěstí. Pokroky v oblasti zpracování přirozeného jazyka a strojového učení pomáhají s jejich snahou. Nedávná publikace od Pennsylvánské univerzity se zabývala způsoby předvídání duševních chorob analýzou sociálních médií. Zdá se, že příznaky deprese a dalších duševních stavů lze zjistit studiem našeho používání internetu. Vědci doufají, že tyto metody budou schopny lépe identifikovat a pomáhat rizikovým jedincům.

Internet věcí (IoT)

Velké množství zdravotních informací se také shromažďuje a ukládá na mobilních a domácích zařízeních .

Finanční transakce

Transakce kreditních karet pacienta jsou zahrnuty do prediktivních modelů používaných systémem Carolinas HealthCare, který identifikuje pacienty, kteří jsou vysoce rizikoví, protože jsou opětovně přijati do nemocnice. Poskytovatel zdravotní péče založený na Charlotte používá velké údaje k rozdělení pacientů do různých skupin, například na základě nemoci a geografické polohy.

Etické a soukromé důsledky

Je třeba zdůraznit, že v některých případech mohou mít při shromažďování a přístupu k údajům v oblasti zdravotní péče významné etické a soukromé důsledky. Nové zdroje velkých dat mohou zlepšit naše chápání toho, co ovlivňuje zdraví jednotlivců a obyvatelstva, nicméně je třeba pečlivě zvážit a sledovat různá rizika. Nyní bylo také uznáno, že údaje dříve považované za anonymní, lze znovu identifikovat. Například profesor Latanya Sweeney z laboratoře Harvard Data Privacy Lab posoudil 1130 dobrovolníků zapojených do projektu osobního genomu. Ona a její tým dokázali správně pojmenovat 42 procent účastníků na základě informací, které sdíleli (PSČ, datum narození, pohlaví). Tyto znalosti mohou zvýšit naše povědomí o možných rizicích a pomohou nám při rozhodování o sdílení dat lépe.

> Zdroje:

> Conway M, O'Connor D. Sociální média, velké údaje a duševní zdraví: současné pokroky a etické důsledky. Současné stanovisko v psychologii 2016; 9: 77-82.

> Fernandes L, O'Connor M, Weaver V. Velké údaje, větší výsledky. Journal of the American Health Information Management Association , 83 (10): 38-43

> Guntuku S, Yaden D, Kern M., Ungar L, Eichstaedt J. Detekce deprese a duševních onemocnění na sociálních médiích: integrativní přehled . Současné stanovisko ve vědách o chování 2017; 18: 43-49.

> Lazer D, Kennedy R, Král G, Vespignani A. Podobenství Chřipky Google: Trapů ve velké analýze dat . Science 2014; 343 (6176): 1203-1205.

> Raghupathi W, Raghupathi V. Velká analýza dat ve zdravotnictví: slib a potenciál. Zdravotnická informační věda a systémy 2014; 2: 3.

> Sweeney L, Abu A, Winn J. Identifikace účastníků projektu osobního genomu podle jména . Harvardská Univerzita. Laboratoř ochrany osobních údajů. Bílá kniha 1021-1. 24. dubna 2013.