回归系数不显著怎么办?也许是打开方式不对

来源:知乎、数据分析、计量经济学
看JF、JFE、RFS上面的文章,实证结果总是相当地显著,不论作者采用何种思路做稳健性检验,都是怎么做怎么显著。这不得不让我深深地感到惊讶,他们是怎么做到的呢。
在我做实证的经历中,不显著是常态,显著反而稀缺。一般的论文或许我可以先放一放,继续push自己的idea。但博士论文实在是放不起,一不留神就快到毕业季了,再放一放,学位就不用拿了。因此面对种种不显著的挑战,只得想办法去解决它们。
实证结果不显著怎么办。
(1)选方程。同样的问题,有时会有不同的模型。某篇经典文献用的是A模型,另外一个大牛可能用的是B模型。倒底哪个模型更好,取决于你对模型背后理论的信念。如果你更认可A模型背后的理论,就用A模型;同理对B模型也是如此。而选择不同的模型时,得到的实证结果往往会存在差别。有时候差别仅仅体现在系数的大小上,而有时候差别体现在系数的显著性上。
(2)选变量。同一个财务变量,可能有多个指标能衡量。比如融资约束的度量,在文献经常出现的包括:公司规模、是否支付股利、产权性质、KZ指数、WW指数、信用评级、票据评级、利息偿付倍数、资产的可抵押能力、是否是集团公司等等。再比如掠夺风险的度量,包括:HHI、主营业务利润、价格-成本边际、超额价格-成本边际、勒纳指数、交叉弹性、熵指数、资本-劳动比偏离行业均值的绝对值、股票收益和行业组合收益的协方差、行业内最大四家企业的集中度等等。选择不同的指标衡量某个变量,得到的结果也存在差别。所以也可以采用这种思路来获得显著的结果。不过稳健性检验往往要求对某个无法精确度量的变量采取多种指标衡量,而且有时候还要检验这些指标的一致性(通过相关系数和交叉统计)。
(3)选样本。数据处理的过程包含了选择样本的过程。删除ST、PT公司,删除交叉上市的公司,删除IPO当年的数据,删除资不抵债的公司,对离群值进行Winsor处理。样本处理也是五花八门,值得细细琢磨一番。
(4)选方法。OLS、FE、GMM、3SLS、IV、Probit、DID,方法有很多,理论上可以改变不同的方法来做实证,但事实上每一种方法都有自己的限定条件和使用范围。所以选方法的可行性不太高。
上面所说的四种办法,其实更严格地来看,应该也是稳健性检验要做的工作。
首先,回归系数不显著不能简单的认为对应的解释变量对被解释变量没有影响。先观察下F检验值,如果整体线性检验不显著,那么说明模型设定为线性不合适,需采用其他模型形式。如非线性回归模型。如果替代模型的回归系数t检验拒绝原假设(显著),那么说明是模型设定问题。
再者,对残差进行异方差检验以及自相关检验,如果存在异方差或者自回归,则用广义OLS法消除后,再做参数显著性检验。异方差和自回归的存在均会使得t检验失效。
如果仍然不显著,那么就要考虑是否将该变量从模型中剔除了。若剔除该变量后的回归结果使得三个信息准则值均下降,那么就该剔除该变量。
数据挖掘是一个技术活,一下子就显著的是不是要思考一下是不是伪回归的可能。不显著可能的原因很多,比如共线、变量度量的问题,样本的自选择偏误等等。如果实在需要显著的结果,有两个重要的方法,首先是看变量本身的度量,有没有其他度量的方法和调整的空间、比如楼上已经提到的融资约束的度量、分组的化哑变量的设置等等;另一个就是样本的选择和缺失值的处理,是替换成零(经济学上是否有意义),或者直接作为缺失删掉,这些都会显著的影响结果的显著程度甚至方向。当然,显著与否这些调整之后也许依然差的好远,那么就需要思考理论上是否成立了,或者是不是一个伪命题了。不显著就应该剔除,除非你想硬塞进这个自变量,那你只有改数据了要么剔除某些看起来就很跨装的数据,要么找个理由去掉常数项,你就会发现一下子就好显著啊~
(0)

相关推荐