SPSS 也能轻松搞定!Poisson回归在二分类结局的应用

第三篇

在上一篇文章中,我介绍了Poisson回归在离散定量Poisson分布数据的应用。不过,更多的时候,包括横截面调查、队列研究、随机对照研究,研究结局为二分类结局,这一结局不符合Poisson分布数据的特征,往往数据出现过度离散的情况。

在观察性研究的队列研究和横截面调查中,通常是分类结局的随访资料,研究者习惯于应用 logistic回归分析来控制混杂变量计算调整优势比( aOR)作为调整相对危险度( aRR) 的估计值。然而这样做却忽略了一个基本的假设:即只有在研究的结局事件较为罕见的条件下, OR 才近似等于 RR ;反之, 当结局事件的发生率较为常见 ( >10 %) 时,OR 往往会明显的高估或低估真实的 RR 值。对于此类资料如何调整混杂因素合理计算 aRR 的点和区间估计值, 2004 年 Zou提出可利用修正 poisson回归法来加以处理,使得 aRR 区间估计值的精确度有了很大的提高, 获得了较为满意的效果, 本文拟对该法加以介绍,并给出例子行具体说明 。

Poisson 回归通常适合于处理罕见结局事件的前瞻性研究资料,即服从 poisson 分布的资料。当将其应用于服从二项分布的资料时, 对 RR 的估计误差便会增大, 但是这个问题可以通过一种稳健的误差方差估计法( sandwich variance estimator,俗称三明治法) 得到矫正, 这被称之为Modified poisson 回归。

举例: 吸烟与肺癌发病关系的队列研究

如果手工,计算RR值如下:

我们通过M-H方法计算RR值和95%CI 结果如下:RR=13.5,95%CI: 5.41-33.41。RR值置信区间不包括1,也说明RR总体不等于1。

对于这样的队列研究数据,如果我们采用logistic回归,会得到一下结果:

OR=15.85,由于肺癌发生率较低,因此OR值与RR值比较接近,但也高估了RR值。

如果我们采用普通的Poisson回归,则会得到一下结果:

可以看出,RR=13.5,但其置信区间较M-H方法计算得到要宽些。

现在我们采用修正Poisson回归的方法进行

对于SAS,可以 调用genmod 函数。

值得一提的是在进行修正 poisson 回归分析时, 要求以原始资料的格式来创 即一名研究对象为一条观测, 并且需增加一个变量( 如 id 等) 来表示研究对象的编号, 不能以频数表的形式来建立数据集 同时需要增加一个repeated 过程

proc genmod data = A ;

model cancer = smoking  /link = log dist = poisson;

REPEATED SUBJECT =id ;

run;

对于SPSS软件,调用广义线性模型

结果如下

RR值同样为13.5,但是置信区间便窄于一般的Poisson回归,而与M-H分析结果相同了。

当然Poisson回归更多的作用是可以开展多因素回归,或者控制混杂偏倚,这是普通的单因素M-H方法所不能比拟的。

多因素Poisson 回归

某医师基于某医院开展前瞻性队列研究,探讨冠心病患者复发有关的影响因素,收集新发冠心病患者作为病例组,收集同期医院非循环系统疾病患者作为对照组,研究的暴露因素是病人的年龄age、性别sex、心电图检验是否异常ecg、高血压hyper、糖尿病diabetes。

通过构建多因素Poisson 回归,得到以下多因素回归分析的结果:

-本文毕-

(0)

相关推荐