30天打卡学习医学统计与SPSS(Day 5):配对设计资料的统计分析
30天打卡学习医学统计与SPSS
Day 5: 配对设计资料的统计分析
隶属第二章:实验性研究定量数据的统计分析策略
实验性性研究常见包括随机设计和配对(配伍)设计两种实现均衡可比的设计方法。随机设计一般情况两组数据相互独立,而配对(配伍)设计两组数据则往往不独立,存在着相关性。
配对设计
配对设计是将受试对象配成对子,随机给予每对中的两个体以不同处理。配对条件为主要的非处理因素。
在动物试验中,常将种属、性别、年龄、体重相近的两动物配成对子;临床试验中,常将性别相同,年龄,生活条件、病情轻重等相似的两个病人配成对子。
配对设计常见有两种形式:
自身配对:同一对象接受两种处理,如同一标本用两种方法进行检验同一患者接受两种处理方法。自身配对又包括自身前后配对和自身平行配对。
异体配对:将条件相近的实验对象配对,并分别给予两种处理。常见形式包括:
-同一受试对象处理前后的数据
-同一受试对象两个部位的数据
-同一样品用两种方法(仪器等)检验的结果
-配对两个受试对象分别接受两种处理后的数据
配对设计的优点(自身前后配对除外)是它可以保证非常好的可比性,而均衡可比的各处理组比进行比较分析,探讨干预措施与结局的因果关系,结论更可靠。
实例分析
·某项研究评估咖啡因对人体心肌血流量的影响,将24名年龄、BMI、专业相似的男性大学生配成12对,每组的两个成员随机分配到咖啡干预组、空白对照组,两组成员实验后测定心肌血流量[ml/(min·g)],问干预后心肌血流量有无差异。数据库见kafei.sav。
思考
这个案例需要思考:
-该研究属于何种类型的研究设计
-如果是匹配设计,是配伍还是配对?
-结局变量属于什么类型的变量?
-正态性问题如何考虑?
案情分析
对于本案例,初学者往往有两种不分青红皂白的直觉:第一种,既然分为两组,那么属于成组两样本的研究,可能采用两样本t检验;第二种,两组样本量一样,若数据形成本案例类似的表格形式,肯定是配对设计。
直觉害死人!到底是成组两样本还是配对设计,一定要看研究者的文字说明,如果配对设计,必然有相应配置成对、成伍的意思。
饮用咖啡前后得到的资料属于异体配对,其结局心肌血流量为定量数据,因此若要探讨干预组和对照组心肌血流量有无差异,虽然是定量数据,则不能考虑两样本t检验,这是因为干预组和对照组两组数据不再符合两样本t检验三个重要条件“正态性、独立性、方差齐性”中的独立性。
配对设计产生的两组数据是相关的。可以发现,大致上干预组血流量变量值越高,则对照组变量值也会高于其它运动员。比如运动员第4对,干预组变量值为5.7,而对照组为5.4;相反,运动员第10对,干预组变量值为3.5,而对照组为3.2。这一现象表明两组数据存在不符合独立性的条件。此时,不宜采用两样本t检验进行分析
统计分析策略
对于本例,则要考虑两种新的统计学方法:配对t检验或者符号秩和检验。配对t检验和符号秩和检验两种方法的选择,关键在于数据“正态性”的问题。这里的“正态性”不是两组数据的正态性”,是两组数据差值的正态性”。本例中,差值即12对运动员干预组、空白对照血流量的差值。
若差值为正态或者近似正态分布,则采用配对t检验;若差值为严重偏态分布,则采用wilcoxon符合秩和检验(对了,本方法又出自统计学家Wilcoxon之手)。
总结来说,
或者
差值的计算与正态性检验
正态性检验结果:
结果如下,差值d夏皮洛-威尔克(SW)正态性检验显示,P=0.080,还不能认为数据是偏态分布的,因此,本案例的两组比较可以采用配对t检验进行统计分析。
如何利用SPSS进行配对t检验
配对t检验入口界面
分析-比较均值 -配对样本t检验
配对样本t检验对话框
配对t检验操作非常简单,直接将左侧“干预组、对照组心肌血流量”同时选中,放到右边选框中即可。
统计分析结果与解释
配对t检验结果有3张表。
第1表:分组统计描述结果,干预组心肌血流量为5.13±0.69ml/(min·g),对照组心肌血流量为4.33±0.86ml/(min·g)
第2表为两组数据相关性的统计学检验。本表不重要,它描述了配对数据的相关性程度和P值,本例相关性系数为0.56(该值范围从0-1,越大相关性越强,0.56属于具有一定的相关性),P=0.060,表明还没有明显的证据能说明它们存在着统计学的相关(P值大于0.04,是因为样本量小)。在这里,P值不太有价值,关注相关系数即可。
第3表为配对t检验的结果,如下表:配对差值为0.80(95%CI: 0.33-1.27);检验统计量t=3.740,P=0.003,配对差值与0值相比,差异具有统计学意义。
如何利用SPSS进行符号秩和检验
符号秩和检验入口界面
本文“心肌血流量”案例原则上应以配对t检验进行分析,但本文就本例也对符号秩和检验进行介绍,方便初学者学习和使用符合秩和检验。
配对样本符合秩和检验对话框
副和秩和检验操作与配对t检验完全一致
符合秩和检验统计分析结果与解释
SPSS软件中,符合秩和检验一般默认采用正态近似法进行统计分析,它将计算检验统计量z值和p值,本题z=-2.85,P=0.004,配对差值中位数与0值相比,差异具有统计学意义。该结果与配对t检验相似,但这里主要探讨总体中位数而不是总体均数。
结果及表格的规范表达
规范的统计表(其中一种形式)为:
配对设计的优缺点
1.配对设计较之随即对照研究的优点
配对设计由于配对个体之间变异性较小,采用对子间计算差值的方式开展统计分析,其抽样误差略小,因此配对设计的检验效能更好,更容易得到阳性结果。因此配对设计资料,应采用配对t检验或者配对秩和检验
2.配对设计的缺点
找配对对象难哦。我拿结婚找对象作比较,一般的随即对照研究,就如自由恋爱,选择的余地较多;配对设计,是门当户对的相亲,要凑上对比较难。一般动物实验多见,而人群的RCT研究很少采用异体配对设计。
3.自身配对的结果可靠性的问题
自身配对包括自身平行配对和自身前后配对。
自身平行配对,符合高质量实验性研究三原则的(随机、平行对照和重复)。你这里估计纳闷了,配对怎么就随机了呢。平行配对其实也是随机化方法,它基本的过程是先配对,再随机将对象分配到实验组和对照组。对照组对象是与干预组同时同地相似的对象,是均衡可比的对象。因此自身平行配对结论可靠。
自身前后配对实验性研究,不符合随机、平行对照的要求。干预前往往是对照,而这个对照与干预后在时间上不可比,因此自身前后比较的结论难说可靠。一般自身前后配对实验性研究的结论都是补充性、辅助性的。
那么,既然自身前后配对结论不可靠,我们还可以开展此类研究、发表论文么?可以的,一般这样的研究都是:第一,探索性的研究;第二,针对难以自我改善的疾病的研究;或者第三,质量不高的研究。
SPSS 操作录录屏
-本讲结束-,敬请阅读同期R语言教程推文-
更多信息: