30天打卡学习医学统计与SPSS(Day 4):两样本秩和检验

30天打卡学习医学统计与SPSS

欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇、大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频、SPSS操作录屏、文字版教程进行学习。如果你能跟得上节奏,我相信,在这个冬天您将会掌握医学数据分析。
1.打卡所需的SPSS全套视频、数据库、讲义下载(点击链接)
寒假到来宅们来学习统计吧!无偿奉上我们精心制作的医学统计学全套资料【配字幕】
2.如果您真的能够坚持,发送关键词“打卡”两字到公众号对话框,加入公益免费的打卡群吧。骗人?不存在的。

Day 4: 两样本秩和检验

隶属第二章:实验性研究定量数据的统计分析策略

之前文章已经介绍过,非参数检验是参数检验重要的补充。秩和检验是非参数检验的重要方法。两组定量数据的比较,主要的方法有两种。一种是t检验,一种是属于非参数检验的秩和检验(wilcoxon 秩和检验)。

一般来说两样本秩和检验是t检验的补充,如果t检验不能做,就会考虑用两样本秩和检验。当t检验条件不符合,特别是达不到正态或者近似正态分布的条件时,可考虑过两样本秩和检验。

何为秩和检验

1

何为非参数检验?

假设检验分为两种,一种称之为参数检验(parameter test),另外一种是非参数检验(Non-parameter test)。

参数检验:以特定的总体分布(如正态分布)作为前提,对其总体参数作假设检验。  如: t 检验、z检验和 F 检验。

非参数检验:对总体分布不作严格假定,又称任意分布检验,它直接对总体分布作假设检验,可能是分布轮廓,也可能是分布位置。非参数检验在我们课程中提到的主要是两类,一类是秩和检验,还有一类是卡方检验。它不依赖于总体分布的具体形式,应用时可以不考虑被研究对象为何种分布以及分布是否以知,因而实用性较强 。

2

何为秩和检验?

秩和检验为非参数检验方法中的一类,包括用于配对设计研究的符合秩和检验,用于两组独立样本的两样本秩和检验,用于多个样本的多样本秩和检验。主要主要以秩次为基础的研究。秩次(rank)指的是将数值变量值或等级变量值按一定顺序(一般是从小到大)所排列的序号,通俗理解也就是排名。秩和(rank sum)的意思是秩次之和。因此秩和检验就是比较两组数据的排名有没差别。

两样本秩和检验,又称成组2样本秩和检验或者两独立样本秩和检验,英文为Wilcoxon Mann-Whitney 检验,是Wilcoxon Mann Whitney 三人证明,可简写为Wilcoxon检验或者W M-W检验。

形象来区分两样本t检验和秩和检验

举例:若比较医学统计学班级男生成绩好还是女生好。此时,有两种方法,一种是分别计算男生的平均值和女生的平均值,那么这就是t检验;另外一种将所有人成绩从高到底进行排名,求出男生排名的总和和女生排名的总和,再除以各自人数得到平均排名,最后是平均排名越小,说明成绩越好,这便是秩和检验。

实例分析

某研究者将小鼠随机分为两组,观察局部加热治疗小鼠移植肿瘤的疗效,以生存时间(日)作为观察指标,实验结果见下表,试检验两组小鼠生存日数有无差别?详见rat.sav

局部加热组:10,12,15, 15, 15,16,20,23 30,40

空白对照组:2,3, 3, 3,4, 4, 4,6,9,11,12,14


1



思考

对此案例的统计需要思考:

-这是何种研究设计类型?

-研究的结局变量是什么?

-结局变量属于什么类型的变量?

-如果是定量变量数据,是偏态还是正态分布?

-研究目的是比较,那比较的组数是多少?


2



案情分析

本案例属于随机对照的实验性研究。主要研究的结局指标是生存时间,为定量变量数据;比较的组数是两组(局部加热组和空白对照组)。本案例目的是比较两组总体生存时间分布有无统计学差异。


3



统计分析策略

两组定量数据的比较,主要的方法有两种。一种是成组两样本t检验,一种是非参数秩和检验(wilcoxon 两样本秩和检验)。一般来说,秩和检验是t检验的补充,如果t检验不适合,就会考虑秩和检验。所以统计分析时,要考虑t检验是否合适?条件是否满足?

t检验要求的两组、定量、独立、方差齐、正态的数据比较。前面4个要求与wilcoxon 两样本秩和检验相同,差别在于t检验要求数据符合正态性。若不满足,应该考虑秩和检验。

总结来说:


正态性分析结果如何?
采用多样本正态性检验方法,探讨各组是否均来自于正态分布总体。具体SPSS方法可见正态性检验一讲。结果分析如下:
经SW检验,结果为:局部加热组P=0.063,空白对照组体重P=0.028,两组数据正态性不全符合,秩和检验方法是正确的方法。

两组的直方图分布如下:

SPSS 操作

1

两样本秩和检验SPSS操作界面:

分析—比较均值—非参数检验--旧对话框--2个独立样本

2

两样本秩和检验具体参数设置

“检验变量”放入生存日期(time),“分组变量”放入分组(group),同时进行“定义组”。

①检验类型:曼-惠特尼(Man-whttey),即为最常见的wilcoxon Man-whttey两样本秩和检验

②检验变量:即放入结局指标,本例为生存日期(time)

③分组变量:放入group。这里“定义组”需要进一步明确,见下图:

定义组:即指定比较哪两组。在本例,我们比较高蛋白和低蛋白组,他们在数据库赋值为1和2,因此这里填写1,2;此处填什么数据,需要和数据库的赋值对应起来,且不能填写文字或者字母,只能填数字。因此提醒诸位:构建SPSS数据库时一般赋值建议用数字,不要用文字或者字母。

④选项:可以对总体数据进行基本的统计描述

3

两样本秩和检验分析结果及解释

根据上述SPSS操作,秩和检验将提供3张表格。
表1:提供对生产日期的总体描述
表2:提供分组描述生存时间平均排名(秩平均值)和总排名(秩总和)

表3:秩和检验分析结果

① 曼-惠特尼/威尔科克森:即提出秩和检验的三人中文翻译,这里提供得是秩和检验的原始检验统计量(请自动忽略)
② 此处提供最常见的秩和检验统计量z值和P值(双侧)。z>1.96,P<0.05。渐进显著性(双尾)即双侧假设检验的P值(此外正态近似法结果(未矫正));精确显著性,则直接计算概率的方法(样本量<50,若与渐进法存在冲突,此结果更准确)

结果的规范表达

根据上表,我们可以得到以下的规范的文字和表格表达:
规范文字:局部加热组小鼠生存时间中位数为15.5(14.3,24.8)g,空白对照组小鼠生存时间中位数为4.0(3.0,10.5)g,两组总体生存时间分布存在着统计差异(z=3.67,P<0.001)。

规范的统计表(其中一种形式)为:

①此处提供的为中位数和上下四分位数:M(P25,P75),也可以采用中位数(四分位数间距):M(IQR)来表达。

② 统计分析中,置信区间与P值地位同等重要。偏态分布差值置信区间可以Hodges-Lehmann方法。具体方法不再本篇分析。

两样本检验的实际应用

1.两样本秩和检验应用范围如下

①非正态定量数据比较

②两组小样本分布不明的定量数据

③两组一端或二端存在着不确定数值的数据

④两组有序分类资料(等级资料)

值得注意的是,两样本秩和检验主要探讨的总体分布位置,而不是总体均数。

2.偏态分布秩和检验的用途
作为两样本t检验重要的补充,两样本秩和检验用途广泛。一般来说,两组数据比较,用t检验还是秩和检验没有明显的界限,特别是近似正态分布的数据(正态性检验P<0.05),秩和检验和t检验很难说必须选择哪一种方法。虽然任何一组正态性检验P<0.05,均可以放弃t检验而选择秩和检验,但我也很少这么做。以下我列出优先考虑秩和检验的场合。
3.近似正态分布,可以考虑秩和检验吗?
Day 3 t检验说过,近似正态分布要用t检验,那么可以用秩和吗?没有问题呀,秩和检验广泛应用在定量数据比较。

以下本人的分析习惯,仅供参考:

  • 近似正态分布可以选择t检验或秩和检验;

  • 严重偏态分布必须选择秩和检验

  • 如果研究变量理论上属于偏态分布,无论正态性检验P值,优先考虑秩和检验

  • 无论正态性检验P值大小,如果研究变量分布直方图呈一边倒趋势,或者存在若干个极端异常值,优先考虑秩和检验

  • 若至少一组数据正态性检验P值接近0.01或者<0.01,优先考虑秩和检验

更多的场合,到底用t检验还是秩和,不妨请学习本系列课程两样本t检验一讲。

SPSS 课程视频和操作录屏

SPSS课程录屏

-本讲结束-

更多信息:

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.2006-2020中国卫生统计年鉴完整合集免费下载
6.疫情时代,健康研究必备!全国各省市县矢量地图(shp)免费下载!
7.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
8.别看视频学习了!Word版全套SPSS 教程免费下载,分分钟学会SPSS
9.“如何在90分钟学会统计分析?” 来下载PPT学习吧!还有免费直播视频
特别提醒:上述列表资源每天限分享和下载一个。
如果您觉得文章不错,
为我们打“call”,
点击“分享”吧
(0)

相关推荐

  • 非参数检验综述

    作者:悦菁   审稿:石鹏   封面:吉江 基本概念 非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容.由于参数检验必须是在总体 ...

  • spss-独立样本t检验

    spss-独立样本t检验 目录 (一)适用情况 (二)spss操作及结果 (1)数据 (2)spss操作 (3)结果 (一)适用情况 (1)两样本总体正态分布,两样本总体方差未知 (二)spss操作及 ...

  • SPSS如何对数据进行正态检验?

    正态检验是对数据的分布进行统计的一种方式,往往用于方差检验的前提条件,今 天小编就来教大家如何通过SPSS对数据进行正态检验吧! 我们对三组同学的成绩进行统计分析,检验他们的成绩是否符合正态分布. 我 ...

  • 连续变量假设检验 之 两独立样本t检验

    统计概述 前面一节讲到的是单样本t检验是针对一个样本与已知总体样本均值之间的检验,但在实际工作中,我们会遇到两个样本之间的均值检验,这个如何解决呢?我们有法宝,SPSS提供的两独立样本t检验. 两独立 ...

  • spss-配对样本t检验

    spss-配对样本t检验 目录 (一)适用情况 (二)spss操作及结果 (1)数据 (2)spss操作 (3)结果 (一)适用情况 (1)两样本总体正态分布,两样本总体方差未知 (二)spss操作及 ...

  • 三种T检验统计方法的使用条件|数据小兵博客

    t检验有三种基本类型,即单样本t检验,独立样本t检验和配对样本t检验. 这三种差异比较的假设检验方法,均有自己的使用条件,或基本假设条件,有时候也称之为适用条件,满足这些条件下t检验的结果才是可靠的. ...

  • 30天打卡学习医学统计与SPSS(Day 11):多组率比较的统计方法​

    Day 11: 多组率比较的统计方法 隶属第三章:实验性研究定性数据的统计分析策略 从第10日开始,介绍实验性分类数据结局的统计分析方法.第10日介绍了两组二分类结局的比较,即两组率的比较,俗称四格表 ...

  • 30天打卡学习医学统计与SPSS(Day 10):两组率比较的统计方法​

    Day 10: 两组率比较的统计方法 隶属第三章:实验性研究定性数据的统计分析策略 系列课程前面2-9日为实验性定量数据统计分析策略.从第10日开始,介绍实验性分类数据结局的基本统计分析方法. 分类结 ...

  • 30天打卡学习医学统计与SPSS(Day 13):实验性研究综合案例分析

    30天打卡学习医学统计与SPSS 本课程是高校医学统计学教授的公益公开课!如假包换!我将在公众号每天推送一篇文章,讲述基于不同医学研究类型的各种统计分析策略.诸位可以结合视频.SPSS操作录屏.文字版 ...

  • 30天打卡学习医学统计与SPSS(Day 8):小统计大文章(上)

    Day 8: 小统计大文章(上) 隶属第二章:实验性研究定量数据的统计分析策略 系列文章已经连续介绍了t.F检验.秩和检验等常见的假设检验方法.很多人学了统计学,却不知道怎么利用它进行数据分析.本科也 ...

  • 30天打卡学习医学统计与SPSS(Day 5):配对设计资料的统计分析

    30天打卡学习医学统计与SPSS 欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇.大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频.SPSS操作录屏.文字版 ...

  • 30天打卡学习医学统计与SPSS(Day 3):成组两样本t检验

    30天打卡学习医学统计与SPSS 欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇.大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频.SPSS操作录屏.文字版 ...

  • 30天打卡学习医学统计与SPSS(Day 2):正态性检验与判断

    30天打卡学习医学统计与SPSS 欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇.大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频.SPSS操作录屏.文字版 ...

  • 30天学习医学统计与SPSS(Day 12):等级资料的比较,秩和还是卡方?

    Day 12:等级资料的比较,秩和还是卡方? 隶属第三章:实验性研究定性数据的统计分析策略 分类数据中,等级资料相对特殊.由于它兼具了定量数据和分类数据的一些特点,分析策略更为灵活.研究目的不同,采用 ...

  • 30天学习医学统计与SPSS(Day 7): 多样本秩和检验

    30天打卡学习医学统计与SPSS 欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇.大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频.SPSS操作录屏.文字版 ...