金融、保险行业 案例
概述
假设检验是统计学和六西格玛管理中非常重要的一种方法。假设检验评估关于总体的两个相互排斥的陈述(原假设和备择假设),以确定样本数据最佳支持哪个陈述。当我们说-发现具有统计学意义时,这要归功于一个假设检验。那么这些检验是如何真正起作用呢?统计意义究竟意味着什么呢?我会更新<假设检验>系列文章向大家进行介绍,我将通过关注概念和图形而不是方程式和数字来帮助您直观地理解假设检验的工作原理。毕竟,使用像Minitab这样的统计软件的一个关键原因是你不会陷入计算困境,而是专注于理解你的结果。为了解释假设检验中的一些问题,我将通过一个具体的案例开始介绍,如果你想跟我一起操作,请下载数据文件。
01
情景再现
一位经济学家想确定家庭每月的能源成本与去年每月的平均成本 260 美元相比是否有所改变。这位经济学家随机抽取了 25 个家庭作为样本,并记录了他们当年的能源成本。
我们先来了解一下这个样本数据,计算一些样本统计量。如果你还不知道怎么计算,请看我们之前发布的这个视频教程:【Minitab视频教程】描述性统计量的计算
我将使用这些描述性统计数据创建一个概率分布图,向您展示假设检验的重要性。
02
假设检验的必要性
通过上面描述性统计量的计算,我们可以看到此随机获取的样本均值330.6美元,它不等于260美元。这是不同的,对吧?但请注意,抽样是有误差的,由于抽样误差,完全有可能虽然我们的样本均值为330.6美元,但总体平均值仍然可能是260美元或者换句话说,如果我们重复实验,第二个样本均值可能接近260美元,而假设检验有助于评估这种结果的可能性!
03
使用概率分布图了解抽样分布
对于任何给定的随机样本,由于抽样误差,样本的平均值几乎肯定不等于总体的真实均值。就我们的例子而言,整个人口的平均成本不太可能是330.6美元。实际上,如果我们从同一群体中采集相同大小的多个随机样本,我们可以绘制样本均值的分布。
抽样分布通过重复地从一个特定人口的大量样品中获得。此分布允许您确定获取样本统计信息的概率。幸运的是,这里我可以创建一个样本均值的分布图,而无需收集许多不同的随机样本!
我们的目标是确定我们的样本均值是否与零假设均值显著不同。因此,我们将使用概率分布图来确定我们的样本均值330.6美元是否不太可能等于假设总体均值的260美元。
对于上面这个图形,为了方便说明问题,我重新编辑了一下X轴(这里关于到t值与样本均值的计算和如何在Minitab中编辑X尺度,我会在后面文章中做介绍)。
从上面这张图中可以看出,尽管我们的样本均值330.6美元不是最可能的,但它仍然在可能范围之内。
04
小结
对于假设检验中的一系列问题,我将在后续几篇文章中继续使用图形框架并解释显著性水平,P值和置信区间,以显示假设检验的工作原理以及统计意义的真正含义。