临床医生们如何开展回顾性队列研究?有些误区,需要澄清!

本人主持的“30天学会医学统计学与SPSS”越来与受欢迎(高校公益课程“30天学会医学统计与SPSS”新一期即将开课,欢迎参与学习!),其中,有一道选择题:
这个问题困扰了一些人,你选择哪一项呢?
队列研究分为三类型,前瞻性队列研究,回顾性队列研究,双向性队列研究。回顾性队列研究的研究对象是根据其在过去某时点的特征或暴露情况而入选并分组的,然后从已有的记录中追溯从那时开始到其后某一时点或直到研究当时为止这一期间内,每一成员的死亡或发病情况,在此基础上,评价暴露因素与医学研究结局的因果关联性。
回顾性队列研究与前瞻性队列研究相比;人力、物力可以大为节省,特别是因为研究开始时所研究的疾病已经发生。因此,在临床上,回顾性队列研究非常受欢迎,利用回顾性队列研究发表临床研究文章相对方便,甚至是唾手可得。
但很多人对回顾性队列研究还是懂得不多,也存在着很多错误的理解!
因此,今天我在这里谈谈关于回顾性队列研究的令人困惑的几个问题,然后再说说在临床中开展回顾性队列研究的几个关键要点。
1. 回顾性队列研究更准确的说法是历史性队列研究
回顾性研究并不是回顾性调查,而是基于历史资料开展的研究,所以回顾性队列研究更准确和不容易引起误导的是“历史性队列研究”。
2.回顾性队列研究是不是前瞻性研究?
是的!
队列研究包括前瞻性队列研究,回顾性队列研究,很多人不理解!其实所有队列研究都是前瞻性研究。
前瞻性队列研究和回顾性队列研究区别在于一个是根据过去的历史资料获得数据,一个是根据未来的信息获得数据;一个研究者需要站在过去的某个时间点去随访研究对象,一个是站在现在的时间点去随访研究对象。
两类研究都是先获取病因信息,再顺着病因随访获取结果信息的研究,因此都是符合先有因、再有果的时间逻辑顺序。因此,他们都称之为前瞻性研究。
3. 回顾性队列研究和病例对照研究的区别大吗?
非常大!
病例对照研究称之为回顾性调查,也是回顾性研究,是真的回顾性研究。它和回顾性队列研究的主要区别如下:
(1) 病例对照研究是现有研究结局,再回顾性调查病因;这和回顾性队列研究刚好相反。
(2) 病例对照研究允许病因是研究对象回忆的,但是回顾性队列研究是不允许的,回顾性队列研究的病因(包括治疗措施)等信息,必须是早已经保存在历史档案里。
(3) 病例对照研究根据研究结局分为病例组(或阳性组)、对照组(阴性组),并比较两组暴露情况的差异;回顾性队列研究是根据历史资料将人群分出暴露组和对照组,并进行随访,比较两组人群有阳性率的差异性。因此他们的出发点、立足点不同,研究者站在的时间点不同。
(4)病例对照研究的对象不具有代表性,不能很好反映源人群的特征(下文)。
(5) 回顾性队列研究必然伴随缺失现象(下文解释)
4. 为什么病例对照研究的对象不具有代表性,不能很好反映源人群的特征?
一项研究结论是否可靠,就必须满足抽样人群的代表性问题。往往,队列研究相对病例对照研究更具有代表性,这是回顾性队列研究和病例对照研究重大区别之一。我这里做一些详细的介绍。
讨论代表性问题,首先必须提出三个人群的概念,目标人群,源人群和研究对象。流行病学领域中样本代表性通常是指最终纳入的研究人群能否代表目标人群。在流行病学研究中,人群可分为目标人群、源人群和研究人群。目标人群为研究结果想要外推适用的人群, 源人群则是研究特定问题实际选取样本的人群( 也即特定研究假设的总体) , 而研究人群则为最终具体实施项目时所纳入的人群( 也即特定研究的样本) 。其中, 定义清晰的源人群是开展所有流行病学研究工作的重要基础 。
例如,以著名的弗明汉心脏研究( Framingham heart study) 为例, 其研究的主要目的是探索美国人群中心血管疾病的关键风险因素, 因此其目标人群是美国一般居民, 源人群则是为了研究这个问题选取的某一地区居民 ( 此处为弗明汉小镇居民) ,而研究人群则为根据纳入和排除标准最终入组研究的五千多人。
基于医院开展的疾病预后的病例对照研究所采集的研究人群是否从源人群抽样的得到?基本上不是的。
比如,探讨冠心病预后的影响因素(包括入院特征和治疗),结局是一年内复发或不复发。这个案例的目标人群,是所有中国的冠心病患者,源人群是该医院的患者,而目标人群就从源人群抽取出来的代表性样本。
不过在具体研究人群选择上,很多临床医生一般会自己手里掌握的患者,分为阳性组(复发)和阴性组(没有复发),开展分析。
这样的研究人群,其实不能反映源人群,它不是随机抽样产生。真正的样本应该是从该医院某段时间所有的冠心病患者(源人群)抽样产生,或者从从该科室甚至该医生某段时间所有的冠心病患者(源人群)抽样产生。
而回顾性队列研究则不同。理论上基于医院的回顾性队列研究是查询医院的电子病例开始着手,并将人群分为暴露组或者对照组,开始随访分析。这么一查,往往是查了某一个时间段某个科室,甚至全部医院的冠心病患者,那就对源人群有更好的代表性了。
因此,回顾性队列研究相对病例对照研究,由于研究视角和流程不同,往往人群来源于源人群,往往选择偏倚会低一些。
而理想的病例对照研究设计通常在确定源人群后,再选定相应病例和具有代表性的对照,这样能降低选择偏倚, 基于这种考虑, 较好的病例对照研究常常在队列人群之中开展, 如巢式病例对照或病例队列研究。相反,很多设计欠佳的病例对照研究可能并未考虑到源人群的选择,病例选择随意,导致源人群范围不明确, 此时就无从谈及对照能否代表源人群了。
(5) 回顾性队列研究必然伴随缺失现象
第(4)点说过,回顾性队列研究,一般基于医院的回顾性队列研究是查询医院的电子病例开始着手,将人群分为暴露和对照组,然后顺着时间轴,顺藤摸瓜,去了解患者的发病或者预后。
但这一顺藤,却经常摸不到瓜。因为回顾性队列研究不像前瞻性队列研究那样设计严谨,随访制度规范,回顾性队列研究在开始研究之前,那些患者处于自生自灭的状态,根本没有相应的跟踪随访,你现在要回过来查询或者随访他们的发病或者结局,那简直是酸爽。。。估计大半数都是失访了。
 回顾性队列研究必然伴随缺失现象,研究人群必须正视、接受它,再想办法减少缺失。此外,研究人群在撰写文章时,必须写明失访的现象、失访率等情况,这样的回顾性队列研究才是合格的研究。
(6)我手里头有已有的病例,是否可以直接拿过来做队列研究?
还是探讨冠心病预后,临床医生会自己手里掌握的患者开展分析,我们能不能查询患者的电子档案,来将他们分为暴露组和对照组,开展回顾性队列研究呢?
不是不能,但是不严谨!
这样的病例,不能反映源人群,只能开展病例对照研究。你想想好了,没有缺失的研究会是回顾性队列研究吗?回顾性队列研究对象最好能够代表源人群,但肯定会不少失访。
临床研究如何开展回顾性队列研究
1. 确定好源人群
是一个医院的病例,还是一个科室,还是一个人群的病例?
2. 穷其所有
明确源人群中的某一个时间段的所有患者应该被纳入候选研究人群并根据纳排标准进行删选合格的研究对象。
3.建立队列研究的视角,将人群进行分组
根据研究对象在研究起点(过去)的暴露状态确定暴露组(或者治疗组)–对照组
4. 顺藤摸瓜,在过去的时间长河里进行随访
虽然回顾性队列研究的是过去式研究,但是研究对象也应建立前瞻性的思维方式,每个合格对象都应该顺着时间去随访患者的疾病的发生发展预后。研究者想办法获得研究结局,但也要记录好失访情况和失访时间点。
5. 进行缺失数据的处理
回顾性研究,无论结局、暴露因素、还是协变量,都存在大量的缺失数据,必须,必须要开展数据缺失的处理。

如同古董花瓶一样,一般有三种缺失数据处理模式
(1)破而不损,尽力复原
(2)残缺过多,不修而展
(3)局部破损且弥足珍贵,修复似初
6.绘制研究对象筛选的流程图
从源人群、到研究对象、到分析对象,尽量将整个过程写出来,一清二楚,让审稿人知道,你是在真真切切开展回顾性队列研究。
总结来说,回顾性队列研究
·数据的分析永远是回顾性的
·数据的产生永远是前瞻性的
·人群应从源人群而来
·不能只利用手头能够摸到的病例开展队列研究

更多信息

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.2006-2020中国卫生统计年鉴完整合集免费下载
6.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
7.“如何在90分钟学会统计分析?” 来下载PPT学习吧!还有免费直播视频
特别提醒:上述资源每天限分享和下载一个。

培训通告

2021年,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班。如果您有需求,不妨点击查看:
来参加吧,通俗易懂的统计培训课:R、SPSS、Meta、重复测量以及量表分析
如果您觉得文章不错,
为我们打“call”,
点击“分享”吧
(0)

相关推荐