政治科学中的工具变量:一份读者使用指南
文献来源:Sovey, A. J., & Green, D. P. (2011). Instrumental variables estimation in political science: A readers’ guide. American Journal of Political Science, 55(1), 188-200.
作者简介:
Allison J. Sovey:耶鲁大学博士研究生。
Donald P. Green:目前为哥伦比亚大学教授,研究兴趣为美国政治和政治科学研究方法,是美国政治学会实验研究分会的创始人。
为了避免解释变量和扰动项相关的内生性问题,从上世纪70年代开始,许多政治学家开始转向基于工具变量的回归分析。政治科学中,工具变量的使用也逐渐从晦涩的技术变成了政治科学家们的必备技巧。但是工具变量的合理应用也基于一些前提假设。工具变量是否优于传统的普通最小二乘法(OLS)要看在具体研究中,工具变量的前提假设能否得到满足。这篇文章不仅回顾了工具变量的前提假设,还归纳总结了APSR、AJPS和WP三大政治学顶级刊物在1985年-2008年间使用工具变量的文章。最后,作者提供了在研究中使用工具变量时需要注意的事项清单。
何为工具变量?为何以及如何使用它?
公式一是一个经典的回归模型,表明了因变量Yi和自变量Xi之间的线性关系。其中Q1i,Q2i….Qki是控制变量,ui是扰动项。β1是我们感兴趣的参数,反映了Xi对Yi的效应。如果扰动项和Xi不相关,那么使用OLS就能得到对β1的最佳线性无偏估计。
但现实中,受制于数据可得性等因素,有一些能够影响Yi同时又和Xi相关的因素可能并没有被我们纳入到模型中。这些没有被纳入到模型中的因素就会跑到扰动项中造成扰动项和Xi相关的问题。我们对Xi得测量可能也会存在测量偏误,这些测量偏误会跑到扰动项中造成Xi和扰动项相关。这些都会使得我们无法得出对β1的一致估计量。工具变量则是克服这一难题的有效办法。
公式二中,Zi就是工具变量。工具变量经常在2LS(两阶段最小二乘法)中使用。第一阶段的回归是Xi和工具变量以及公式一中的其他控制变量进行回归。之后用第一阶段回归得出的系数和Zi来得出Xi的估计值,用这个估计值和其他控制变量再对Yi进行回归,从而形成第二阶段回归。两阶段回归之所以能够克服解释变量和扰动项相关的问题,就在于我们所使用的工具变量Zi和Xi相关但又和扰动项不相关。这也是工具变量有效使用的最重要前提。
在实验研究中,我们将实验对象随机分成实验组和控制组就形成了一个取值为0或1的工具变量,我们对实验组所施加的treatment一般是我们的解释变量。由于我们实验组和控制组的区分是随机的,所以这里的工具变量不会和任何扰动项相关。但是,工具变量想要有效还必须保证它仅仅通过Xi来影响Yi。例如在实验研究中,为了鼓励被试者持续接受treatment,实验者可能会给予一定的物质奖励或进行日常提醒,要确保Zi对Yi的作用不是通过这些奖励或提醒实现的。
在非实验研究中,工具变量有效的前提则更为复杂。首先,我们必须要证明工具变量不与扰动项相关。学者通常要对这一点进行明确的说明。然而,根据作者下文的归纳,实际上很少有研究真正说明了这一问题。即便是证明工具变量和因变量没有显著的相关关系也不能很可靠的说明工具变量是完全的外生变量。其次,工具变量和解释变量之间的关系如果太弱了也会影响我们的估计。这也是所谓的弱工具变量问题。幸好,这一点可以通过定量的检验来识别。一般而言,如果针对工具变量的F检验值小于10就会被认为存在弱工具变量问题。
工具变量应用中还有一个问题就是局部平均效应(Local Average Treatment Effect)。我们对于解释变量Xi的假设是他对所有观测值的影响都是相同的。例如有学者为了研究福克斯新闻对于平权行动支持度的影响,将人群随机分成了看福克斯和不看福克斯两组。看不看福克斯作为treatment是这项研究中的Xi。但是在人群中,存在着看不看福克斯都会给支持平权行动的人,以及看不看福克斯都会不支持平权行动的人。还存在着虽然被分入看福克斯组却实际没有看的人,以及被分入到不看福克斯却实际上看了的人。Xi对这些人的影响显然是不同的,但是我们在计算Xi的影响时只会基于那些因为看了福克斯才支持平权运动的人,这显然与Xi在总人口中起到的作用不同。
政治科学研究中的工具变量
在这部分中,作者归纳了1985-2008年间在AJPS, APSR, WP这三大政治科学顶级刊物上的工具变量研究。作者将工具变量使用的理由归为7类,并以5年为一个阶段进行了分类整理。
第一类是基于实验使用的工具变量,指的是根据随机分配treatment形成的工具变量(0、1)。
第二类是基于自然实验形成的工具变量,虽然实验组和控制组的形成并不是随机分配的结果,但可以被认为是近似随机(plausibly random)的。
第三类是基于理论形成的工具变量。即基于某种理论认为自己所选定的工具变量和解释变量相关的同时和扰动项不相关。Tsai(2007)使用1949年前中国乡村宗族的活动作为当前宗族存在的工具变量,并以此来解释公共物品提供的问题。由于毛时代宗族的活动几乎被完全清除了,因此解放前乡村宗族的活动除了能为宗族的重新组织提供模版外几乎不可能以其他方式影响当前村政府的绩效。
第四类是使用因变量或自变量的滞后项作为工具变量。例如Gerber(1998)为了估计竞选花费对参议院选举结果的影响,使用了竞选花费的滞后项作为工具变量。因为不同届的参议员选举很少涉及相同的在任者和挑战者,但是不同届的竞选花费之间可能会存在一定的相关关系。
第五类是基于经验检验形成的工具变量。研究者将被解释变量与工具变量做回归,证明二者之间没有显著的相关关系,又将工具变量与解释变量做回归,以证明二者之间存在显著的相关关系。但作者认为,即便工具变量与因变量没有显著的相关关系也不能令人信服的证明工具变量不存在与扰动项相关的问题。
第六类研究是引用其他人研究中使用过的工具变量。
最后一类则没有为工具变量的使用提供任何理由。但如表中所示,这类研究反而是最多的。但总体而言没有基于任何理由使用工具变量的情况正变得越来越少。
检验工具变量结果的事项清单
最后作者归纳了我们在检验工具变量结果时所需要注意的事项,以及检验工具变量合理使用的相应假设的做法。
作者在文末也预言到,由于工具变量在解决内生性问题上具备良好的性质,未来将会有更多研究使用工具变量法。
编译:赵德昊
审读:陆屹洲
编辑:吴温泉