如何进行正态性检验?
Day 2-1: 正态性检验及其应用
本日学习任务
从本讲开始,我将利用8讲左右,介绍实验性研究定量数据的统计分析策略。在Day 1的视频我已经说过,统计分析测量最重要的三个决定因素是研究设计类型、数据类型和数据的分布,因此,本讲在介绍实验性研究定量数据的统计分析策略,首先解决的是定量变量的分布是否正态的问题。
实例分析
将出生28天的20只大鼠随机分成两组,分别饲以高蛋白和低蛋白饲料,8周后观察其体重(g)。问两种不同饲料组别的大鼠体重正态性情况如何?数据见数据库weight.sav.
思考
案情分析
本案例包括2个变量,一个是大鼠体重(g),另外一个是分组变量(高蛋白组和低蛋白组)。主要研究的结局指标是大鼠体重,定量数据。
统计分析策略
数据的正态性问题,可从两个层面来探讨。第一个层面是所有大鼠体重值放在一起的整体正态性,另外一个层面是高蛋白组和低蛋白组两组数据各自正态性。前者被称为单样本正态性,后者为两样本正态性。
SPSS 操作
本日软件操作的SPSS数据库是weight.sav,加入课程群即可获得。
正态性检验界面:分析—描述统计—探索
单样本正态性检验界面,选入“体重”至“因变量列表”,“图”模块进行正态性检验
① 因变量列表(dependent variable):这一选框选入检验变量、或者结局变量(是希望去探讨的目标变量)
② 图:见下图:选“含检验的正态图、茎叶图、直方图”
① 茎叶图和直方图,两者都√上。特别是直方图,可以直观地看出数据的分布形态。
② 含检验的正态图:这一选项即进行正态性检验。
单样本正态性分析结果及解释
多样本正态性检验界面
① 因子列表(Factor variable):这一选框选入分组变量、或者原因变量。本研究分组变量为group(饲料类型),可以分为2组。
② 图:见单样本正态性检验,此处略
多样本正态性检验结果及解释
正态性检验的实际应用
总结来说,判断数据正态性,需要结合直方图和正态性检验,将数据分布分为三大类,在此基础上分别选择不同的统计方法进行统计描述和统计推断。
不过,要略显麻烦的是,这种近似正态没有标准来判定,是经验之谈。初学者判定的时候,如果遇到十分模棱两可的图,可以视为严重偏态分布。
最后,你猜猜,下面哪些图可以认为是严重偏态,哪些是近似正态分布的?
-本讲结束-
更多信息