统计计量 | 显著性水平究竟是何方神圣?
本文来源:量化研究方法
原文链接:https://towardsdatascience.com/statistical-significance-hypothesis-testing-the-normal-curve-and-p-values-93274fa32687
备择假设:本大学学生的平均睡眠时间低于全国大学生的平均睡眠时间
零假设:本大学学生的平均睡眠时间不低于全国大学生的平均睡眠时间
68%的数据与均值的偏差在± 1个标准差之内
95%的数据与均值的偏差在± 2个标准差之内
99.7%的数据与均值的偏差在± 3个标准差之内
假设检验:用来检验理论的一种技术
正态分布:假设检验中数据的近似表示
p值:如果原假设为真,则出现至少与观测值一样极端的结果的概率
根据国家睡眠基金会的数据,全国的学生平均每晚睡眠7.02小时
在本校对202名学生的调查中,平均每晚睡眠时间为6.90小时,标准差为0.84小时
备择假设是,本校学生的平均睡眠时间低于全国大学生的平均睡眠时间
使用α=0.05,这意味着当p值小于0.05时,结果是显著的
# Calculate the resultsz_score = (6.90 - 7.02) / (0.84 / sqrt(202)) p_value = pnorm(z_score)# Print our resultssprintf('The p-value is %0:5f for a z-score of %0.5f.', p_value, z_score)'The p-value is 0.02116 for a z-score of -2.03038.'
赞 (0)