非参数检验 之 二项分布检验

序曲

出塞二首 其一

【唐】

秦时明月汉时关,万里长征人未还。

但使龙城飞将在,不教胡马度阴山。

这是一首边塞诗,昌龄从描写景物景入手,首句勾勒出一幅冷月照边关的苍凉景象。'秦时明月汉时关'暗示了这里的战事自秦汉以来一直未间歇过,突出了时间的久远。次句'万里长征人未还','万里'指边塞和内陆相距万里,虽属虚指,却突出了空间辽阔。'人未还'使人联想到战争给人带来的灾难,表达了诗人悲愤的情感。 '但使龙城飞将在,不教胡马度阴山'两句,融抒情与议论为一体,直接抒发戍边战士巩固边防的愿望和保卫国家的壮志,洋溢着爱国激情和民族自豪感。写得气势豪迈,铿锵有力。

这首诗虽然只有短短四行,但是通过对边疆景物和征人心理的描绘,表现的内容是复杂的。既有对久戍士卒的浓厚同情和结束这种边防不顾局面的愿望;又流露了对朝廷不能选贤任能的不满,同时又以大局为重,认识到战争的正义性,因而个人利益服从国家安全的需要,发出了'不教胡马度阴山'的誓言,洋溢着爱国激情。 

二项分布检验简介

我们在实际数据处理中,会遇到很多数据,其中只有两类的数据占据多数,如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果,要么是对立分类中的这一类,要么是另一类,其频数分布称为二项分布。SPSS提供的二项分布检验(Binomial)可对样本资料进行二项分布分析。

SPSS二项分布检验就是根据收集到的样本数据推断总体分布是否服从某个指定的二项分布。其零假设是H0:样本来自的总体与所指定的某个二项分布不存在显著的差异。

SPSS中的二项分布检验,

  • 样本小于或等于30时,按照计算二项分布概率的公式进行计算;
  • 样本数大于30时,计算的是Z统计量,认为在零假设下,Z统计量服从正态分布。SPSS将自动计算Z统计量,并给出相应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α,则应拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设H0,认为样本来自的总体分布形态与指定的二项分布不存在显著差异。

SPSS二项分布检验的数据是实际收集到的样本数据,而非频数数据

SPSS实现二项分布检验

示例1:某医院近几年出生婴儿的性别,问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?

1. 数据录入:

· 在SPSS中设置一个变量,为 性别。

2. 建立假设:建立检验假设,确定检验水准 α

  • H0:出生婴儿性别比等于0.5
  • H1:出生婴儿性别比不等于0.5
  • α = 0.05,即置信区间为95%

3. 参数选择

(1) 选择 分析—非参数检验—旧对话框—二项检验

(2) 参数说明与选择

  • 检验变量:选择要分析的变量,本例中为 性别
  • 定义二分法:设置数据分为两个类别的方式,有两个选择一是从数据中获取,默认选项;二是分割点,由用户指定一个临界值,检验变量的取值大于此临界值的观测归为一个类别其他的归为另一个类别
  • 检验比例:指定待检验的期望概率值,对应数据中第一个类别的概率值,系统默认将第一个记录行的变量取值作为第一个类别另一个取值归为第二个类别。由于本例中1-代表男性,所以男性比例=0.5
  • 选项:对数据进行描述性描述,及缺失值处理
  • 精确检验:跟之前的选项相同,在此不再赘述

4. 数据结果与说明

(1) 数据基本描述:显示总样本数、平均值、标准差、最小值、最大z值

(2) 检验结果

  • 从下表可知,二项检验的p=0.414>0.05,认为性别符合0.5比例的二项分布。。

5. 语法:

*****************二项分布检验 *******************.NPAR TESTS/BINOMIAL (0.50)=性别/STATISTICS DESCRIPTIVES/MISSING ANALYSIS.
(0)

相关推荐