如何获得连续型变量的RR和校正的RR

转自个人微信公众号【Memo_Cleon】的统计学习笔记:如何获得连续型变量的RR和校正的RR。

在观察性研究中,相对危险比RR和优势比OR是我们经常使用到的指标,RR表示暴露/干预因素下患者发生疾病的风险是非暴露/干预因素患者的多少倍,OR表示病例组中暴露在某危险因子下的发病率与不发病率之比 与未暴露在该危险因子下的发病率与不发病率之比 的比值。两者具有结果一致性,当阳性结果出现概率较小时或者较大时,OR≈RR,为更通俗地解释OR,常用RR的定义,但需要要加上大约、左右等近似描述的语言。OR常用于病例对照研究,而RR常用于队列研究。单个自变量的OR可在交叉表分析或者单因素的logistic回归中获得,其中交叉表分析仅能实现分类变量的粗OR的计算,logistic回归不仅可以通过单因素的分析获得分类变量和连续变量的粗OR,也可以通过多因素分析获得校正的OR。在交叉表分析时也可以获得单个分类变量的RR,但有时候我们也想获得连续变量的RR,或者是校正的RR,这时候不论是交叉表分析还是logistic回归就都无能为力了。咋办呢?借助其他能计算RR的模型是一个不错的选择。

哪些模型可以计算RR?我们常用的有两个,一个是COX回归模型,另外一个是泊松回归/负二项回归模型。
示例同<<因变量二分类资料的Probit回归>>案例。出自SPSS统计分析高级教程(第2版)/张文彤,董伟主编.北京:高等教育出版社,2013.3.:低出生体重婴儿的影响因素因素研究。该研究原设计是一个病例对照研究,适合采用logistic回归。我们只是利用其数据,为方便解读,我们只考察连续变量年龄[age]和分类变量是否吸烟[smoke]对新生儿出生体重[low,二分类]的影响。假设该临床观察为一个队列研究,想考察一下孕母吸烟是否为会引起低体重新生儿,年龄为混杂因素。

队列研究可以采用logistic回归吗?我觉得没问题,只是你只能获得exp(β)=OR。如果你就是想计算RR,可以借助结合COX回归模型或泊松回归模型。COX回归模型可直接获得HR=exp(β),HR是考虑了时间因素的RR。但在非生存分析的研究中想通过COX回归模型求得RR,需要先虚拟一个生存时间变量。本例可新建一个虚拟的生存时间变量,并根据结局变量新生儿体重来取值,但需要注意不能直接使用原来的取值(原取值正常=0,低体重=1),而且要求正常体重新生儿的取值>低体重新生儿的取值,本例可把正常体重新生儿的生存时间全部取值1,低体重新生儿的生存时间全部取值2。为何如此呢?因为SPSS中会把最短失效事件生存时间之前的删失值全部去掉不参加分析。状态变量status就是结局变量,其中体重正常取值为0相当于删失值,低体重为1代表失效事件

(1)建立生存时间变量

Transform>>Recode into Different Variables…

数据窗口中多了一个变量time,我们可以在变量窗口中将其测量改为度量(scale)

(2)借助COX回归获取RR

Analyze>>Survival>>Cox Regression…

将分类变量吸烟与否与连续变量年龄分别纳入COX回归模型获得未校正的RR。吸烟与否单因素分析步骤如下:

(3)结果

不校正混杂因素,孕期吸烟新生儿出现低体重的可能性是不吸烟的1.608倍,但结果不具有统计学意义(wald chi2=3.324,P=0.068),95%CI为[0.965,2.678],区间包含了1也意味着无统计学意义。

同样道理我们可以获得年龄(age)的RR=0.967,无统计学意义(wald chi2=1.653,P=0.199)。

当自变量为单个分类变量时,SPSS可在交叉表直接获得RR和OR。

Analyze>>Descriptive Crosstabs…

Row(s):smoke;Column(s):low;【Statistic】:选中Chi-square、Risk

结果如下:

通过交叉表和COX回归获得的RR值是一致的,只是由于赋值的原因交叉表中直接获得的是孕期不吸烟对新生儿低体重的RR,可以直接换算得到孕期吸烟对新生儿低体重的RR=1.608,95%CI[1.06,2.44]。两种方法95%的置信区间相差较大,而且通过COX回归获得的RR是没有统计学意义的(Wald Chi2=3.324,P=0.068),但卡方分析中结果显示具有统计学意义(可通过Pearson卡方检验结果或者95%CI是否包含1来判定),怎么解?

最主要的原因是生存结局中存在大量的“结”,结就是同一个时间点上存在相同结果。本例COX回归采用的是虚拟的生存时间,只有1和2两个生存时间。存在大量的结是需要进行校正的,比较遗憾SPSS中并未提供此类校正的结果。我们可以使用STATA。STATA操作步骤如下:

统计>>生存分析>>回归模型>>Cox比例风险模型

默认的结处理方法是Breslow,但This approximation is fast and is the default method for handling ties. If there are many ties in the dataset, this approximation will not be accurate because the risk pools include too many observations. 本例结较多,可以采用其他校正方法。为了得到与SPSS卡方分析一致的结果,我们采用了默认的结处理方法,但对标准误进行稳健估计。结果如下:HR=1.608(Z=2.22,P=0.026),95%CI:[1.058,2.443]。

同样我们可以获得连续变量年龄(age)的RR及其统计学检验结果:
也可以获得多因素的Cox回归的校正结果:在校正年龄因素的影响后,孕期吸烟新生儿出现低体重的可能性是不吸烟的1.585倍(Z=2.15,P=0.031),95%CI:[1.042,2.409]。

除了COX回归,在Poisson回归中的可获得事件发生率比值(incidence-rate ratios,IRR),意同RR,因此也可以利用Poisson回归来获取RR。Poisson回归我们在《泊松回归》、《广义线性模型拟合泊松回归》、《泊松回归与负二项回归》都有介绍,建议使用广义线性模型来拟合,感兴趣的可以试一下。

转自个人微信公众号【Memo_Cleon】的统计学习笔记:如何获得连续型变量的RR和校正的RR。

END

(0)

相关推荐