统计分析到底该用参数检验?还是非参数检验?

《孟子·告子上》有篇著名的文章《鱼我所欲也》,这篇著名的文章有句著名的话:“鱼,我所欲也;熊掌,亦我所欲也。二者不可得兼,舍鱼而取熊掌者也。”对于理工科的科研狗来说,在对采集数据进行统计分析时,是选用参数检验方法还是非参数检验方法,是一个非常让人脑裂的问题。本文将根据本笔者粗鄙的统计学知识,讲一些有关的心得体会。

图片来自网络

对于样本数据,统计分析主要有参数检验和非参数检验两种方法:

参数检验(parameter test)全称参数假设检验,是指对样本数据的平均值、方差等参数进行的统计检验,主要包括U检验、T检验,方差分析(变量要求有方差齐性,是正态分布)。

非参数检验(Nonparametric tests)是与参数检验共同构成统计推断的基本内容。非参数检验是在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法,主要方法包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。

参数检验和非参数检验主要的区别是:

1、参数检验是针对参数做的假设;非参数检验是针对总体分布情况做的假设,这是区分的一个重要特征;

2、根本区别在于,参数检验要利用到总体的信息(总体的分布、总体的一些参数特征,如方差),以总体分布和样本信息对总体参数做出推断;

非参数检验不需要利用总体信息,直接以样本信息对总体分布做出推断;

3、正态分布用参数检验,非正态分布用非参数检验。

那么根据从总体中抽样获得的样本及其需要验证的变量,可以选择最适合的参数或非参数的检验方法。

选择参数检验:检验回归(regression)、比较(comparison)或相关(correlation)三种关系。

参数检验通常比非参数检验有更严格的要求,并且能够从数据中做出更强的推断。它们只能用符合统计检验常见假设的数据进行

最常见的参数检验包括回归系数检验比较检验相关性检验

1.回归系数检验

回归系数检验用于检验/测试样本数据的变量之间因果关系,即自变量对因变量的影响是否显著。这种方法通常可以寻找到一个或多个连续变量对另一个变量的影响。三种回归系数检验方法使用条件及实例如下:

2.比较检验

比较检验是用来寻找群体平均数之间的差异。这种方法可以用来检验/测试定性(分类)变量对其他特征均值的影响。

在比较两组的平均值(例如男性和女性的平均身高)时,一般使用T检验。当比较两个以上组(例如儿童、青少年和成人的平均身高)的平均值时,使用方差分析和方差分析检验。

四种比较检验方法使用条件及实例如下:

3. 相关性检验

相关性检验(Correlation Test)是对变量之间是否相关以及相关的程度如何所进行的统计检验,主要用来检查/测试两个变量是否相关,而不假设因果关系。

相关性检验一般是对两个或多个具备相关性的变量进行分析,从而衡量变量的相关密切程度。相关性的变量之间需要存在一定的联系或者概率才可以进行相关性检验。

相关性检验方法使用条件及实例如下:

选择非参数检验:

非参数检验(Nonparametric tests) 针对的是总体分布不易确定,或分布呈明显偏态、方差不齐又无适当的变量转换方法以满足参数检验条件的样本数据。

需要注意的是:非参数检验的是比较分布而不是比较参数。非参数检验的方法是五花八门,名字也是千奇百怪,但是,这些方法有它们的共性。上面介绍了,就是因为对总体的分布形态不清楚或总体分布不是正态分布,所以无法用参数检验来推断总体的集中趋势和离散程度的参数。非参数检验不会对样本数据做太多的假设,当进行一个或多个常见的统计假设时,那么非参数检验是有用的。然而,从统计学上来讲,非参数检验的推论结果并不像参数检验那么有力。

三种不同的分布,右(左)偏态/负(正)偏态适合用非参数检验,正态分布适合用参数检验

非参数检验方法使用条件及替代的参数检验方法如下:

结语

《论语·八佾》里有一句话称为:“于天下之事,如指示掌中之物,言其易了。”对于样本数据在进行统计分析时,使用参数检验还是非参数检验方法,就必须对基本的统计验证方法有一些基本的了解。无论是哪种情况,只有“如指示掌中之物”,才能“言其易了”。

(0)

相关推荐

  • 现况调查统计方法

    Day 14:现况调查的基本统计分析策略 隶属第四章:现况调查的统计分析策略 观察性研究主要包括横截面研究.病例对照研究.队列研究.其中,横截面研究这一研究设计类型中,最常见的是现况调查. 现况调查( ...

  • 《多元统计分析》第四章作业

    回复关键词:多元统计分析 即可获取更多详细其他章节答案 <多元统计分析>课后答案||何晓群版(第二章) <多元统计分析>第一章课后答案(何晓群编第五版) <多元统计分析& ...

  • 相关分析方法

    Day 15:相关分析:直线相关VS秩相关隶属第四章:现况调查的统计分析策略无论实验性研究还是观察性研究,都少不了相关分析的身影,尤其是现况调查和队列研究.在现况调查中,相关分析往往可以用于多个指标之 ...

  • 非参数检验综述

    作者:悦菁   审稿:石鹏   封面:吉江 基本概念 非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容.由于参数检验必须是在总体 ...

  • SPSS统计分析案例:曼惠特尼独立样本非参数检验

    前面我给大家推荐过Wilcoxon符号秩检验的案例,它可以很好的替代配对样本T检验,那么独立样本T检验呢?有没有与之对应的非参数检验方法? 有,这个方法就是Mann-Whitney U 检验,SPSS ...

  • 到底是为什么练习瑜伽?走了那么多弯路才搞清楚....

    为什么练习瑜伽? 其实,每个人练习瑜伽都会有目的,只不过有的人的目的比较明确,有的不是很明确而已:大多数人的通常的目的都是健身,比如让身体更健康,愈疗身体的疾病,或者是增加身体的力量,柔软性和活力.但 ...

  • 装修到底选半包还是全包?看完这篇详细解答,完美避坑!

    稍微了解过装修的朋友肯定都听过"半包"和"全包"这两个词,但是对装修新手来说却是一个很大的疑问,这两者之间到底有什么区别?自家装修到底选哪种比较好?今天我们就来 ...

  • 古人为何将13岁的少女,称为“豆蔻年华”,豆蔻到底代表着什么?

    "头上金钗十二行,足下丝履五文章",这是南朝梁武帝萧衍在<河中之水歌>中描写女主人公"莫愁"的诗句.诗中的莫愁,是一位美丽精致的女孩.在那个年代,女 ...

  • 宇宙大千世界到底有多大?这是数据,慢慢看吧!

    宇宙大千世界,它到底有多大,下面就让我们以星球大小对比的方式来看看这三千大千世界吧.虽然我们以为自己的星球非常之大,但殊不知在茫茫大千世界里,地球也不过沧海一粟,而人类呢可想而知. 宇宙大千世界,它到 ...

  • 陈忠实: 命运终归到底, 其实就2个字

    卷首语 陈忠实先生说过:"一个人的一生,是一长串的生命体验.幸福或悲伤是人生都是人生的必经之路." 2016年4月29日,陈忠实先生永远离开了我们.一颗璀璨的新星在中国文学界的历史 ...

  • 直博到底好不好,为什么那么多人不愿意直博?

    对保研er来说,"专硕"."学硕"or"直博"是每个人应该考虑的问题,有的小伙伴在选择的时候一头雾水,有的小伙伴到最后也没有搞懂它们之间的区 ...

  • 到底为什么要调休啊?!

    看理想 公众号"看理想",探寻文化生活的另一种可能.22分钟前 " 如果真的希望通过"小长假"提振内需.促进消费,或许我们需要的是,让大家不仅拥有消费 ...

  • 有一种成功,叫永不言弃;有一种成功,叫坚持到底

    在电视剧<我是特种兵>中我记忆最深刻的一句话是:"以前的路是我一步一步走出来的,以后也会是这样". 是的,路是自己选的,即使跪着也要走完:不知不觉自己已经26岁了,回头 ...