无论是均数、中位数、率的置信区间,都应该在统计分析结果中强化。均数的置信区间一般的统计分析软件都可方便计算。比如SPSS软件,统计描述时会给出均数的95%置信区间,t检验时会给出均数差值的95%置信区间。率的置信区间,我们在之前一篇推文已经介绍过:小技巧!如何用SPSS计算率的置信区间那么如果是偏态分布,采用中位数描述和非参数秩和检验,如何估计中位数差值的置信区间呢?答案是:Hodges-Lehmann估计法或bootstrap估计法。SPSS能否操作呢?能!现在,本文结合一篇临床试验论文来探讨下如何利用SPSS和R语言基于Hodges-Lehmann法开展中位数差值的置信区间估计。案例所采用的文章是2019年9月5日发表在《新英格兰医学杂志》的一篇临床试验论文。它大多数定量指标差值的置信区间采用HodgesLehmann法估计得到。肺泡蛋白沉积症是一种以肺泡中表面活性剂异常积聚为特征的疾病。大多数病例是自身免疫性的,并且与抗粒细胞巨噬细胞集落刺激因子(GM-CSF)的自身抗体有关,该自身抗体可防止肺泡巨噬细胞清除肺表面活性物质。一项开放标签的2期研究显示吸入重组人GM-CSF对严重肺泡蛋白沉积症患者有一定疗效;然而,轻度至中度疾病患者的疗效尚不清楚。为此,研究人员进行了一项双盲、安慰剂对照试验。64例自身免疫性肺病患者肺泡蛋白沉积症每日吸入重组人GM-CSF(sargramostim),剂量为125 g,每日两次,共7天,隔周一次,共24周,或安慰剂治疗,这些患者当呼吸环境空气低于70毫米汞柱(或症状患者<75毫米汞柱)时,记录了动脉氧分压(Pao2)。排除患有严重肺泡蛋白沉积症(Pao2<50 mmHg)的患者,以避免被指定接受安慰剂治疗的患者可能加剧该疾病。该研究的主要终点是基线和第25周之间的肺泡血氧梯度的变化。一句话:RCT研究,患者共64例,随机分为两组,比较重组人GM-CSF与安慰剂组肺泡血氧梯度的变化。结果发现,GM-CSF组(33例患者)的平均(SD)肺泡血氧梯度变化明显好于安慰剂组(30例)(平均从基线变化为-4.50±9.03 mmHg vs. 0.17±10.50 mmHg; P=0.02)。CT扫描肺野密度的基线和第25周之间的变化在GM-CSF组中也更好(组间差异为-36.08 95%置信区间为-61.58至-6.99,使用MannWhitney U检验和HodgesLehmann估计伪中位数的置信区间)。GM-CSF组6例患者和安慰剂组3例患者出现严重不良事件。该研究统计描述采用均数加减标准差,差异性比较采用两样本秩和检验,置信区间采用Hodges-Lehmann估计法估计文章最后结论是:在这项随机对照试验中,吸入重组人GM-CSF与动脉氧张力实验室结果改善相关,但未发现临床益处。Numerical results are presented as means (±SD) or medians with interquartile ranges.The Mann–Whitney U test was used to assess the difference between
the two groups, and the sign test was used to assess the differences from baseline to week 25 within each group.For categorical end points, the data were compared with the use of either the chi-square test or Fisher’s exact test. For continuous variables, the medians were compared with a Mann–Whitney U test.The P value was two-sided and used for the primary end point only. A P value of less than 0.05 was considered to indicate statistical significance.郑老师:从统计分析来看,作者直接采用Mann–Whitney U test方法进行分析,这个方法即两样本秩和检验。有些人好奇了,那么正态分布的怎么办?结局指标既有正态分布,又有偏态分布,是不是要t检验和秩和检验结合呢? 其实也大可不必,因为秩和检验即可以用于正态分布数据比较,也可以用于偏态分布数据比较,为了统一用一种方法,研究人员干脆就统一用了两样本秩和检验。统计方法还采用了比如混合效应模型来提供支持性的数据,这里不再做介绍。方法里面未提及置信区间的估计,作者在结果的表和论文的摘要中提到了置信区间估计的方法“a pseudo-median difference calculated with the use of the Hodges–Lehmann estimate based on the Mann–Whitney U test”
SPSS如何进行中位数差值置信区间估计呢?我们以下案例为例,进行Hodges–Lehmann估计。该方法就镶嵌在两样本秩和检验的SPSS操作界面之中。
某研究者将小鼠随机分为两组,观察局部加热治疗小鼠移植肿瘤的疗效,以生存时间(日)作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别?
局部加热组:10,12,15, 15, 15,16,20,23 30,40
空白对照组:2,3, 3, 3,4, 4, 4,6,9,11,12,14
Hodges–Lehmann法的界面:它在SPSS 的非参数检验方法中。首先,非参数检验,在“字段”界面,设置检验变量(生产日期)和分组变量(分组)
然后,在“设置”界面中,定制检验,选择“曼-惠特尼”(即两样本秩和检验),界面底部选择“霍奇斯-莱曼估算”(即Hodges–Lehmann)计算置信区间。
最后得到,中位数差值的置信区间了!首先,展现给我们的是一个总表,,是秩和检验的P值。
接着,双击总表,得到下图后,选择下图左侧底部“置信区间汇总视图”,即可
最后,基于秩和检验的得到中位数差值置信区间估计值,95%CI为7.00-18.00。
library(foreign) # 利用foreign直接将数据库从SPSS中导入e3=read.spss("rat.sav") #读取数据集,is.factor(e3$group)# group变量是因子吗?is.numeric(e3$time)# group变量是数值吗?wilcox.test(time~group,data=e3,mu=0,exact = F,paired = FALSE,conf.int = T, conf.level = 0.95)Ryushi Tazawa,et al.Inhaled GM-CSF for Pulmonary Alveolar Proteinosis. NEJM.2019.另外有两篇中文的翻译,也探讨了中位数差别的置信区间,有兴趣可以看看http://kuaibao.qq.com/s/20190902AZPJJ200https://xw.qq.com/cmsid/20181213A0A7PL00本文毕,更多基于论文的案例解读请点击下方“统计技巧”。
本公众号在传播统计学知识的同时,也放置了一些常用的资源来方便大家科研。所有资源全部免费下载,有兴趣的朋友可以关注下载。