0.0005:估计系数太小怎么办?
🍎 连享会主页:lianxh.cn
连享会 · 计量专题
🍓 因果推断-内生性 专题
⌚ 2020.11.12-15
🌲 主讲: 王存同 (中央财经大学);司继春(上海对外经贸大学)
👉 课程主页:https://gitee.com/arlionn/YG
连享会 · 名师讲坛
🍓 空间计量 专题
⌚ 2020.12.10-13🌲 主讲:杨海生 (中山大学);范巧 (兰州大学)
👉 课程主页:https://gitee.com/arlionn/SP
作者: 刘欣妍(香港中文大学)
邮箱: liuxinyan@link.cuhk.edu.hk
目录
1. 问题背景
2. 方法 1:改变数据单位
3. 方法 2:将变量进行标准化
4. 方法 3:将变量进行对数转换
5. 总结
1. 问题背景
在做实证研究时,我们经常会遇到这样的问题,即回归系数非常小,如 0.00000012,若以小数点后三位或四位报告结果,则系数为 0。那么系数小,是不是就代表该变量不重要?答案是否定的。一个变量的重要性与其显著性有关,与回归系数大小无关。至于回归系数过小,往往是由于数据导致。接下来,本文将为大家介绍三种处理回归系数过小的方法。
2. 方法 1:改变数据单位
具体示例:
sysuse auto.dta, clear
reg price mpg, robust noheader
------------------------------------------------------------------------------ | Robust price | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- mpg | -238.8943 57.47701 -4.16 0.000 -353.4727 -124.316 _cons | 11253.06 1376.393 8.18 0.000 8509.272 13996.85------------------------------------------------------------------------------
在上例中,我们将 price 对 mpg 进行回归,mpg 系数为 -238.8943。如果将 mpg 放大 100 倍,则估计系数和标准误对应缩小 100 倍,t 值不变。
sysuse auto.dta, clear
gen mpg2 = mpg*100
reg price mpg2, robust noheader
------------------------------------------------------------------------------ | Robust price | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- mpg2 | -2.388943 .5747701 -4.16 0.000 -3.534727 -1.24316 _cons | 11253.06 1376.393 8.18 0.000 8509.272 13996.85------------------------------------------------------------------------------
可以看到,由于 ,改变量纲后,系数统计推断并不会改变,但系数含义发生了变化,比如之前 mpg 每增加 1 单位,price 降低 238.894 单位, 现在变为 mpg 每增加 0.01 个单位,price 降低 2.389 单位。
3. 方法 2:将变量进行标准化
具体示例:
stasysuse auto.dta, clear
center price mpg, prefix(z_) standardize
reg z_price z_mpg, robust noheaderta
------------------------------------------------------------------------------ | Robust z_price | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+---------------------------------------------------------------- z_mpg | -.4685967 .1127425 -4.16 0.000 -.6933446 -.2438487 _cons | 3.24e-08 .1034053 0.00 1.000 -.2061346 .2061347------------------------------------------------------------------------------
标准化方法有很多,在这里我们以正规化方法进行演示。并且,需要注意的是,标准化之后得到的回归系数被称作为标准化系数,解释为 mpg 每增加 1 个标准差,price 减少 0.469 个标准差。
Note: 更多标准化方法,详见「三种常用数据标准化方法」。当回归中包含交互项或多项式时,最好将相关变量进行标准化,以减轻变量间相关性。关于该问题更多介绍,详见「When Do You Need to Standardize the Variables in a Regression Model?」 和 「如何比较解释变量的系数相对大小?」。