关于内生性问题中寻找工具变量思路手册
来源:计量经济圈、 经管定量笔记

NO.01
内生性来源

假设对于得到参数的一致估计至关重要,该假设意味着解释变量与扰动项不相关。事实上,该假设是OLS能够成立的最为重要的条件。但与此同时,该假设又过于严格或者过于理想化,实际的经济问题研究中经常会发现解释变量与扰动项相关。由于

会导致参数估计不一致,因此,解释变量与扰动项相关便产生了我们常说的内生性问题。又由于

在实践中很难得到满足,因此,内生性问题是一个大家都普遍面临和绕不开的问题。

:

,也就是说,实际观测到的是

,真实无偏差的却是

,当对模型进行估计时,测量误差项

会进入扰动项,进而使得

,因此,解释变量的测量误差会导致内生性。陆铭老师以前特意写了个短评,强调对于核心解释变量一定要能够准确地度量,不要似是而非含糊不清,更不要用“用xxx来代理核心解释变量”。

。

。在实际做论文的过程中,反向因果问题应当是最需要重点关注和考虑的内生性问题了,这一点在公司财务问题研究中表现得似乎更为明显,主要是因为财务报表里的各项基本都相互联系和影响。
NO.02
工具变量法介绍

。为了比较直观地感受内生性的存在对参数估计一致性的影响,下面以遗漏变量偏误为例简单推导一下。



。对于模型(2),变量X的参数估计值为:

,将模型(1)中真实的Y代入到这个表达式里有:

。

时,有

,此时解释变量X的参数一致性不受影响。反之,当遗漏的变量T与X相关时,有

。

;

。该条件意味着,工具变量只能通过内生变量对被解释变量产生影响,而不能有其他的路径或渠道。


,从而

,当工具变量的相关性满足时(保证分母不为0),有下式成立:

。将模型(1)中真实的Y代入到这个表达式里,我们便可以进一步得到:


,而工具变量估计量为:

。通过对比我们可以得到几点结论:

,则无法定义工具变量法;

,

,进行OLS回归之后得到X的拟合值

。因为工具变量Z与扰动项v不相关,从而拟合值

也与扰动项v不相关。在第二阶段时,我们有

,此时便能得到一致估计。

以及余下的与扰动项相关的部分

,然后被解释变量仅对外生的部分

进行回归。这一逻辑还可以这样理解:


,这时有:

NO.03
寻找工具变量的思路


NO.04
工具变量发的相关检验与注意事项