本日学习任务
分类数据中,等级资料相对特殊。由于它兼具了定量数据和分类数据的一些特点,分析策略更为灵活。研究目的不同,采用的统计策略将有所区别。本文就卡方检验和秩和检验方法的在等级资料中的应用进行比较分析。·例1:某医生用某种中药治疗糖尿病患者共45例,随机分为两组结果如下,问该中药对两型糖尿病的疗效有无差异?见diabete.sav
·例2:某医生用某种中药治疗糖尿病患者共67例,随机分为三组结果如下,问三种治疗方案对两型糖尿病的疗效有无差异?详见diabetethree.sav
案情分析
两个案例均为随机化设计的实验性研究,结局指标为等级资料(无效/好转/显效)的分析比较。不同的是,第一个案例处理因素为2水平;第二个资料处理因素为3水平。研究目的是探讨疗效的差异。
统计分析策略
两个案例在本质上无太大区别,因此统计分析方法相似。本文以案例1为例介绍其统计分析策略。案例1的数据,实际上是2组等级数据的比较,由于是随机对照试验,一般可以应用基本统计学方法的t、F、卡方、秩和检验中某一合适的方法进行分析。假设检验方法不仅可论证两组的差异性,且可以直接探讨分组变量与结局变量的因果关系。等级数据属于分类数据,分类数常见的比较方法便是卡方检验,因此,等级数据的第一种分析策略是应用卡方检验进行分析。比如本例,采用卡方检验(实际为Fisher法)结果如下:结果显示,P=0.002,两组分类数据存在着统计学差异。这里请注意,此处差异指的是构成比分布的差异性。很明显,中医组和西医组在疗效的构成比分布是显著不同的,西医组主要人群集中在好转(占87.0%),中医组无效、好转、显效分布接近(30%左右)。如果您是糖尿病患者,你会选择那一种方案?西医是一种保守方案,而中医则是一种冒险方案。看似有差别,但从上表来看,从两组人群的平均水平来说,疗效应该差别不大。因为,卡方检验无法体现平均水平或者平均程度的差异性。卡方检验统计学差异的结果,无法认定两组患者的治疗效果平均水平是否一致。平均水平的描述,统计学常用均数和中位数;平均水平的假设检验,常用参数检验中的t检验和F检验,非参数检验的秩和检验。由于等级资料往往属于半定量数据且偏态分布,因此,平均水平的比较推荐秩和检验。对于本文2个案例,研究目的倾向于探讨平均水平而非构成比,因此推荐使用秩和检验,案例1为2样本秩和检验(wilcoxon秩和),案例2为多样本秩和检验(Kruskal Waillis秩和检验)。总的来说,等级数据的比较,若探讨构成比分布有无差异性,则考虑卡方和Fisher足矣。等级数据的比较,若探讨总体平均水平或者总的程度上差异性,则可以采用秩和检验本文针对第一例和第二例进行秩和检验分析,更详细的秩和检验介绍,请见
两样本样本秩和检验
两样本秩和检验SPSS分析入口:分析-非参数-旧对话框-2个独立样本两样本秩和检验SPSS主界面:结局指标放入“检验变量列表”,处理因素放入“分组变量”中,同时根据各处理组在数据库的赋值进行定义组。两样本秩和检验的分析结果:结果显示,z=0.367(结果中的正负号请忽略,它和差值谁减谁有关),P=0.713,两组数据疗效的平均水平(总的程度)没有统计学差异。该结果与先前卡方检验结果不同。此处为阴性结果,而卡方检验结果是阳性的。
多样本秩和检验
多样本秩和检验SPSS分析入口:分析-非参数-旧对话框-K个独立样本多样本秩和检验SPSS主界面:结局指标放入“检验变量列表”,处理因素放入“分组变量”中,同时根据各处理组在数据库的赋值进行定义范围(分别填入处理因素的最小值和最大值)多样本秩和检验的分析结果:结果显示,H=5.954,P=0.051,三组数据疗效的平均水平(总的程度)方面没有统计学差异。但是,卡方检验探讨的是构成比分布,准确来说是分布轮廓的差异性;
秩和检验探讨的是分布位置差异性,比较的是平均位置的差别。
对于等级资料,诸多教材一般推荐采用秩和检验,但这不是绝对。等级资料的分析目的,其实更多的时候,是探讨构成比的分布轮廓有无统计学差异,因此卡方检验反而是首选方法。当等级资料作为一个疗效结局或者疾病病情程度时,研究目的是探讨平均程度差异性时,才推荐使用秩和检验来分析。在一些场合,等级资料是不等距的,各等级之间的程度递增不一致,此时谨慎采用秩和检验分析。比如,对于本文案例1的资料,如果结局不是无效、有效、显效,而是死亡、无效、有效,则秩和检验结果不可靠。对于该结局,死亡、无效、有效之间,疗效递增程度不一致。很显然,虽然中、西医治疗效果从秩和检验角度来说无统计学差异,但是显然中医治疗方案不值得推荐(死亡率过高)。对此,应对等级资料进一步进行归类,比如形成2分类资料再进行统计分析。
-本讲结束-