0.0005:估计系数太小怎么办?

🍎 连享会主页:lianxh.cn

连享会 · 计量专题


🍓 因果推断-内生性 专题
⌚   2020.11.12-15

🌲 主讲: 王存同 (中央财经大学);司继春(上海对外经贸大学)
👉 课程主页https://gitee.com/arlionn/YG

连享会 · 名师讲坛


🍓 空间计量 专题
⌚ 2020.12.10-13

🌲 主讲:杨海生 (中山大学);范巧 (兰州大学)

👉 课程主页https://gitee.com/arlionn/SP

作者: 刘欣妍(香港中文大学)
邮箱:  liuxinyan@link.cuhk.edu.hk


目录

  • 1. 问题背景

  • 2. 方法 1:改变数据单位

  • 3. 方法 2:将变量进行标准化

  • 4. 方法 3:将变量进行对数转换

  • 5. 总结


1. 问题背景

在做实证研究时,我们经常会遇到这样的问题,即回归系数非常小,如 0.00000012,若以小数点后三位或四位报告结果,则系数为 0。那么系数小,是不是就代表该变量不重要?答案是否定的。一个变量的重要性与其显著性有关,与回归系数大小无关。至于回归系数过小,往往是由于数据导致。接下来,本文将为大家介绍三种处理回归系数过小的方法。

2. 方法 1:改变数据单位

具体示例:

sysuse auto.dta, clear
reg price mpg, robust noheader
------------------------------------------------------------------------------             |               Robust       price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]-------------+----------------------------------------------------------------         mpg |  -238.8943   57.47701    -4.16   0.000    -353.4727    -124.316       _cons |   11253.06   1376.393     8.18   0.000     8509.272    13996.85------------------------------------------------------------------------------

在上例中,我们将 pricempg 进行回归,mpg 系数为 -238.8943。如果将 mpg 放大 100 倍,则估计系数和标准误对应缩小 100 倍,t 值不变。

sysuse auto.dta, clear
gen mpg2 = mpg*100
reg price mpg2, robust noheader
------------------------------------------------------------------------------             |               Robust       price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]-------------+----------------------------------------------------------------        mpg2 |  -2.388943   .5747701    -4.16   0.000    -3.534727    -1.24316       _cons |   11253.06   1376.393     8.18   0.000     8509.272    13996.85------------------------------------------------------------------------------

可以看到,由于 ,改变量纲后,系数统计推断并不会改变,但系数含义发生了变化,比如之前 mpg 每增加 1 单位,price 降低 238.894 单位, 现在变为 mpg 每增加 0.01 个单位,price 降低 2.389 单位。

3. 方法 2:将变量进行标准化

具体示例:

stasysuse auto.dta, clear
center price mpg, prefix(z_) standardize
reg z_price z_mpg, robust noheaderta
------------------------------------------------------------------------------             |               Robust     z_price |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]-------------+----------------------------------------------------------------       z_mpg |  -.4685967   .1127425    -4.16   0.000    -.6933446   -.2438487       _cons |   3.24e-08   .1034053     0.00   1.000    -.2061346    .2061347------------------------------------------------------------------------------

标准化方法有很多,在这里我们以正规化方法进行演示。并且,需要注意的是,标准化之后得到的回归系数被称作为标准化系数,解释为 mpg 每增加 1 个标准差,price 减少 0.469 个标准差。

Note: 更多标准化方法,详见「三种常用数据标准化方法」。当回归中包含交互项或多项式时,最好将相关变量进行标准化,以减轻变量间相关性。关于该问题更多介绍,详见「When Do You Need to Standardize the Variables in a Regression Model?」 和 「如何比较解释变量的系数相对大小?」。

(0)

相关推荐