大数据与临床科研
导读:本文共2653字符,通常情况下阅读需要9分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要:大数据是所涉及的数据量规模巨大到无法通过人工,在合理时间内截取、管理、处理、并整理成为人类所能解读的信息。大数据时代的到来,在商业、经济、医学及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。医疗领域的大数据是指因为临床或者可以需要收集起来的有关健康或者诊疗的信息。其产生来源于日常诊疗过程,其中的数据都是未加修饰的纯天然数据,没有任何排除纳入标准,是一种普查数据。能直接反应临床疗... ...
目录
(为您整理了一些要点),点击可以直达。大数据是所涉及的数据量规模巨大到无法通过人工,在合理时间内截取、管理、处理、并整理成为人类所能解读的信息。
大数据时代的到来,在商业、经济、医学及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。
医疗领域的大数据是指因为临床或者可以需要收集起来的有关健康或者诊疗的信息。其产生来源于日常诊疗过程,其中的数据都是未加修饰的纯天然数据,没有任何排除纳入标准,是一种普查数据。能直接反应临床疗效。
医疗大数据包括电子病历系统、慢性病及传染病注册登记系统、医疗保险信息系统、出生死亡登记系统等等。对于临床医生最关键的是电子病历系统,该系统包括了人口学特征(性别、年龄)、实验室检查、微生物检测、医嘱、诊疗操作、手术资料和临床转归等信息。
临床研究大体分为干预性研究和观察性研究。
干预性研究,又称随机对照临床试验(RCT),需要主动的、有目的地对受试者进行试验干预,一般有严格的纳入排除标准,采用随机化的方法来最大程度地消除混杂因素的干扰。
目前临床科研面临的困境:RCT与观察性研究两者差别较大,两者干预效应不一致。RCT得出的是一种生物学疗效,这反应了干预手段在严格的实验条件下的生物学作用。这种作用可能很弱或者实际的临床中无法发挥出来,生物学效应不能转化成临床疗效。
但基于大数据的临床研究(BCT)在未来可能成为一种研究的主流方式与RCT形成互补。
大数据的临床研究(BCT)其实属于观察性研究,因此必然存在观察性的缺陷,例如存在较多偏绮、混杂因素难以控制、基线资料不均衡等。如果分析了存在偏绮的数据,得出的结论有可能被夸大,目前尚不存在一种万能的统计学解决方案,但视乎可以通过采用随机效应模型或者bootstrap抽样法在一定程度上提高预测模型的准确度。
如何利用大数据进行临床研究:以MIMIC-II数据库为例
(1)、MIMIC-II数据库全称为重症监护多参数智能检测数据库II。该数据库是对公众开放的免费数据库,主要用于重症医学的各种临床研究。该数据库包含的信息来自于美国波士顿beth israel deaconess medical center。该数据库是不断更新的,已经收集了3万多ICU患者的住院信息。该数据库信息由人口学特征、实验室检查、液体及药物医嘱、病历信息、心电监护、呼吸波形监护、血压、血氧饱和度和护理记录。
(2)、MIMIC-II数据库使用步骤:访问网站physionte.org/mimic2/MIMIC-II --注册账号--通过伦理考试--提交申请--下载数据库--安装虚拟机(linux系统、sql语言)--进行临床研究--选择统计方法--对研究结论进行解释--发表论文。
运用大数据可以进行以下几种类型的研究。
如何凝练出实际可行的临床研究问题,有两种主要方式:
(1)、从数据中找灵感。
(2)、从要研究的内容去找数据。
数据提取之后,选用你熟悉常用统计软件(SAS,STATA,SPSS,R语言)对数据进行分析,以STATA为例对数据进行调研和分析。
使用STATA进行大数据分析时主要包括两个部分,数据处理和统计分析。
数据处理包括:
(1)、数变量的产生,比如希望把年龄变量转化成二分类变量;
(2)、数据核查,比如采用sum模块查看是否存在一些不合逻辑的错误值;
(3)、变量类型的调整,比如有些字符变量转化成数据变量;
(4)、数据库合并,患者的不同信息往往是存储在不同的关联表格中,需要合并,可以使用stata的merge或append命令执行。统计分析在数据处理的基础上进行,一个完好的数据处理前期准备是进行可靠统计分析的基础。
(5)、采用do-file方式进行数据统计可以完整记录数据分析的全过程,这样文章修回或发现统计结果错误的时候可以随时查看调用的命令。
下图是完整的大数据分析流程图
问答环节
1、目前各种指南以及高级别循证医学证据是怎么来的?
答:参考随机对照临床试验及相关的荟萃分析。
2、目前为什么生物学疗效不能转化为临床疗效?
答:(1)、RCT条件下干预措施执行比较严格,其中包括纳入的人群(没有大量的合并症和并发症,是所谓的单病种,这就剔除了大量的混杂因素)。
(2)、RCT有严格的治疗时机,而现实中繁忙的临床工作可能会延误给药时机。
(3)、RCT一般都在大医院进行,其结果无法推广到中小医院。
(4)、RCT只是对20%的患者进行研究,不能把这样的结论去治疗其余80%的患者。
(5)、观察性研究存在选择偏绮、混杂因素难以控制、基线资料不均衡等各种缺点。
大数据与临床科研的详细内容,希望对您有所帮助,信息来源于网络。