Log binomial 回归,几十年的老方法为什么不流行呢!

系列文章“log binomial and Poisson 回归”

1.时代变了,回归分析你还首选logistic回归吗?out了!

2.Poisson回归,研究离散事件的重要回归方法

3.SPSS 也能轻松搞定!Poisson回归在二分类结局的应用

4.JAMA文献解读:如何在队列研究使用Poisson 回归?

第五篇

当结局是二分类的医学研究,特别是队列研究和随机对照研究,当结局发生率较大时,再使用logistic计算OR来估计RR时会不准确。在上一篇,我已经介绍过,可以通过Poisson回归进行分析,除此之外,也可以使用log-binomial回归方法替代logistic回归。Log-binomial 回归模型是广义线性模型的一种特殊类型,由于它很容易得到某一因素率比( rate ratio, RR) 的最大似然估计值。

Log-binomial 回归这种方法,与 Poisson 回归相比,对回归系数的估计,在一定场合下,标准误更小,因此也值得推荐。

log binomial 回归,不同于logistic回归,它直接以研究对象阳性事件的概率预测值做结局,log(P)转换,建立线性回归方程。

举例: 吸烟与肺癌发病关系的队列研究

如果手工,计算RR值如下:

对于这样的队列研究数据,如果我们采用logistic回归,会得到一下结果:

OR=15.85,由于肺癌发生率较低,因此OR值与RR值比较接近,但也高估了RR值。

现在我们采用上一文的修正Poisson回归的方法进行,RR值为13.5, 回归系数的标准误为0.4670,95%CI置信区间为5.406-33.714.

现在我采用Log-binomial 回归方法进行

对于SAS,可以 调用genmod 函数。

proc genmod data=lungcancer descending;

model cancer=smoking1/ dist=bin link=log;

estimate ‘smoking1 label’ smoking1  1 /exp;

如果是R语言,则调用glm() 函数

glm(y~x+z,family=binomial(log))

对于SPSS软件,调用广义线性模型

结果如下:

RR值同样为13.5,回归系数的标准误为0.4670,95%CI置信区间为5.406-33.714,与Poisson回归一模一样!

同样,可基于Log-binomial 可以开展多因素的回归

举例:某医师基于某医院开展前瞻性队列研究,探讨冠心病患者复发有关的影响因素,收集新发冠心病患者作为病例组,收集同期医院非循环系统疾病患者作为对照组,研究的暴露因素是病人的年龄age、性别sex、心电图检验是否异常ecg、高血压hyper、糖尿病diabetes。

采用Log-binomial 得到以下多因素回归分析的结果:

如果用Poisson回归,分析结果如下:

多因素回归分析,log binomial 在置信区间的估计方面,略好于Poisson回归!

log binomial 回归的命门在哪里?

当然,log binomial也不完美,当存在连续自变量时或多个变量时 ,参数估计值通常在参数所限制范围的边界上 ,导致模型不能收敛,建模失败。

A disadvantage of log–binomial regression is that the model does not converge in certain situations (i.e., the model cannot find a solution and therefore the risk ratio cannot be calculated). These convergence problems mainly come up if several continuous covariates are included in the model and if the incidence of the outcome is high.

这种情况经常出现!怎么办?实际工作中经验性地设置截距 β0 = - 4 可能效果较好, Deddens 建议也可先对原始数据集调整扩充后再拟合Log-binomial 模型,即可得到参数的近似最大似然估计( maximum-likelihood estimation, 简 称 MLE ) 值, 称 为COPY 算法 ,独立数据情况下,其收敛性和近似 MLE的唯一性已有严格的理论证明。

(0)

相关推荐