统计学知识闯关!一共10关你能到哪?

来源:中国统计网
1

第1关:自由度是什么?怎样确定?

答:(定义)构成样本统计量的独立的样本观测值的数目或自由变动的样本观测值的数目。用df表示。

自由度的设定是出于这样一个理由:在总体平均数未知时,用样本平均数去计算离差(常用小s)会受到一个限制——要计算标准差(小s)就必须先知道样本平均数,而样本平均数和n都知道的情况下,数据的总和就是一个常数了。

所以,“最后一个”样本数据就不可以变了,因为它要是变,总和就变了,而这是不允许的

通俗点说,一个班上有50个人,我们知道他们语文成绩平均分为80,现在只需要知道49个人的成绩就能推断出剩下那个人的成绩。你可以随便报出49个人的成绩,但是最后一个人的你不能瞎说,因为平均分已经固定下来,自由度少一个。

2

第2关:正态分布检验中自由度问题

答:在正态分布检验中,这里的M(三个统计量)为:N(总数)、平均数和标准差。

因为我们在做正态检验时,要使用到平均数和标准差以确定该正态分布形态,此外,要计算出各个区间的理论次数,我们还需要使用到N。
所以在正态分布检验中,自由度为K-3

3

第3关:t检验


答:
t检验适用于两个变量均数间的差异检验,多于两个变量间的均数比较要用方差分析。

无论哪种类型的t检验,都必须在满足特定的前提条件下: 正态性和方差齐性,应用才是合理的。这是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。

t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。

4

第4关:统计学意义(P值) 


答:
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。

P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联

我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)

在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。

5

第5关:如何判定结果具有真实的显著性


答:
在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。

实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。

通常,许多的科学领域中产生P值的结果≤0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果 0.05≥P>0.01被认为是具有统计学意义,而0.01≥P≥0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。

6

第6关:所有的检验统计都是正态分布的吗?


答:
并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、F检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。

随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

7

第7关:假设检验的内涵及步骤


答:
在假设检验中,由于随机性我们可能在决策上犯两类错误。

一类是假设正确,但我们拒绝了假设,这类错误是“弃真”错误,被称为第一类错误;

一类是假设不正确,但我们没拒绝假设,这类错误是“取伪”错误,被称为第二类错误。

一般来说,在样本确定的情况下,任何决策无法同时避免两类错误的发生,即在避免第一类错误发生机率的同时,会增大第二类错误发生的机率;或者在避免第二类错误发生机率的同时,会增大第一类错误发生的机率。人们往往根据需要选择对那类错误进行控制,以减少发生这类错误的机率。大多数情况下,人们会控制第一类错误发生的概率。

发生第一类错误的概率被称作显著性水平,一般用α表示,在进行假设检验时,是通过事先给定显著性水平α的值而来控制第一类错误发生的概率。

在这个前提下,假设检验按下列步骤进行:

  • 确定假设

  • 进行抽样,得到一定的数据

  • 根据假设条件下,构造检验统计量,并根据抽样得到的数据计算检验统计量在这次抽样中的具体值

  • 依据所构造的检验统计量的抽样分布,和给定的显著性水平确定拒绝域及其临界值

  • 比较这次抽样中检验统计量的值与临界值的大小,如果检验统计量的值在拒绝域内,则拒绝假设

到这一步,假设检验已经基本完成,但是由于检验是利用事先给定显著性水平的方法来控制犯错概率的,所以对于两个数据比较相近的假设检验,我们无法知道那一个假设更容易犯错,即我们通过这种方法只能知道根据这次抽样而犯第一类错误的最大概率(即给定的显著性水平),而无法知道具体在多大概率水平上犯错

计算 P值有效的解决了这个问题,P值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的。通过直接比较P值与给定的显著性水平α的大小就可以知道是否拒绝假设,显然这就代替了比较检验统计量的值与临界值的大小的方法。

而且通过这种方法,我们还可以知道在p值小于α的情况下犯第一类错误的实际概率是多少,p=0.03<α=0.05,那么拒绝假设,这一决策可能犯错的概率是0.03。需要指出的是,如果P>α,那么假设不被拒绝,在这种情况下,第一类错误并不会发生。

8

第8关:卡方检验的结果,值是越大越好,还是越小越好?


答:
与其它检验一样,所计算出的统计量越大,在分布中越接近分布的尾端,所对应的概率值越小。如果试验设计合理、数据正确,显著或不显著都是客观反映。没有什么好与不好

9

第9关:在比较两组数据的率是否相同时,二项分布和卡方检验有什么不同?


答:
卡方分布主要用于多组多类的比较,是检验研究对象总数与某一类别组的观察频数和期望频数之间是否存在显著差异,要求每格中频数不小于5,如果小于5则合并相邻组。

二项分布则没有这个要求。如果分类中只有两类还是采用二项检验为好。如果是2*2表格可以用fisher精确检验,在小样本下效果更好。

10

第10关:如何比较两组数据之间的差异性


答:
从三个方面来回答

1. 设计类型是完全随机设计两组数据比较,不知道数据是否是连续性变量?

2. 比较方法:如果数据是连续性数据,且两组数据分别服从正态分布和方差齐性检验,则可以采用t检验,如果不服从以上条件可以采用其他检验。

3. 想知道两组数据是否有明显差异?不知道这个明显差异是什么意思?是问差别有无统计学意义(即差别的概率有多大)还是两总体均数差值在哪个范围波动?如果是前者则可以用第2步可以得到P值,如果是后者,则是用均数差值的置信区间来完成的。

能全部答对的小伙伴,恭喜你通关啦!为了巩固你的统计学知识,小编为大家准备了统计学的知识思维导图,扫描下方图片就能领取啦~

End.

作者:黎嫣

整理自:https://www.cnblogs.com/Acceptyly/p/3930006.html

本文为转载分享,若侵权请联系后台删除

(0)

相关推荐

  • 医学统计学考前复习提纲

    第1章 绪论 一.名解 1.Statistic统计量:由样本观测值获得的统计指标称为统计量. 2.Statistics统计学:收集.分析.解释与呈现数据资料同时处理数据中变异的一门学科. 3.Medi ...

  • 不要再问统计学了!

    大家好,我是宝器! 昨天在知乎看到一个问题:从零开始学数据分析,什么程度可以找工作,如何计划学习方案? 提问者背景是:在coursera 上面学data science 中的R programming ...

  • 显著性水平究竟是何方神圣?

    用数据来证明意味着什么? 如果你作为一所重点大学的院长,收到一份令人担忧的报告,显示学生每晚平均睡眠时间6.80小时,而全国大学生的平均睡眠时间为7.02小时.学生会主席担心学生的健康,并指出这项研究 ...

  • 一学不会,一用就废!统计学知识闯关,测验自己可以“过几关”!

    一学不会,一用就废!统计学知识闯关,测验自己可以“过几关”!

  • 史上最难眼力测试!一共五关,你能闯到第几关?

    . 眼力大测试开始啦!看看你的眼神好不好!一共五关,闯过第一关的是聪明人,闯过三关的是高人,如果五关都闯过的,那绝对是神人! 测试规则:1~3号,每幅图片你有10秒钟的观察时间:4 ~5号,你有15秒 ...

  • 社区考试公共基础知识:中国四大名关

    社区考试公共基础知识:中国四大名关

  • “锚点”事件还未平息,关菲菲10年黑历史遭扒,这次天美也保不了

    曼姐出品,必属优品.大家好,我是人见人爱的小曼姐.想必这几天,大家都在关注关菲菲的事情吧?作为王者荣耀的高级策划运营,关菲菲一些对皮肤的改动,确实是引起了玩家的不满.当然了,在王者荣耀这五年的时间里, ...

  • 《论语他说》10关于八佾

    八佾第三 [01]孔子谓季氏:"八佾舞于庭,是可忍也,孰不可忍也!" 10关于八佾 八佾是周朝时候舞蹈的一种规格,就像现在的健身舞一样,横向8人,纵向8人,整个是一个64人的大型舞 ...

  • 【知识文库】企业年底关账风险防范与预期筹划

    前言 不知不觉,2020年接近尾声了,年终关账是财务人的一件大事儿,要提前做好准备和筹划,下面从:筹划.往来.成本费用.收入.损失等五大方面对年终关账的实操难点进行梳理,以便及为明年所得税汇算清缴做好 ...

  • 让人崩溃!Windows 10 关不掉的更新

    最近几天,我的电脑Win10系统,又莫名其妙地更新了,提示我要重启更新. 这让我觉得非常奇怪,因为我之前在网上搜过方法,已经设置过了停止更新, 怎么又会要我更新呢?不禁扪心自问,这电脑不是我的吗?我怎 ...

  • 顶级特工:这款有意思的游戏,第10关就卡住我了!求助

    <顶级特工> 关键词:休闲.射击.特工.益智.微操.微信小游戏! 推荐星数:4.5星 难度星数:4.5星 沐沐简评:<顶级特工>是一款射击+一点益智+一点操作的微信小游戏! 沐 ...

  • 《穿越寻宝记》第10关—深山炼炉出处

    万众期待的石窟钥匙配方出来啦! 万众期待的石窟钥匙配方出来啦! 万众期待的石窟钥匙配方出来啦! (重要的事情说三遍) 这个道具不知道卡哭了多少人 一点提示都没有 沐沐试了好久都没试出来 今天的攻略开始 ...