统计计量丨你不可不知的工具变量研究方法综述

本文转载自公众号计量经济学服务中心

来源:《微观计量方法在公共政策效应评估中的应用研究》

作者:刘志红

计量经济学在进行政策效应评估时一般采用两个思路一虚拟变量法和工具变量法。虚拟变量法是将政策变量作为外生变量进行处理,用虚拟变量的系数近似政策效应,该方法因估计简单且简洁明了,在早期的政策效应评估中应用较多,但其隐含一个重要假定,即虚拟变量是外生的,并且与误差项是相互独立的。在实际情况中,个体的经济决策以及经济运行系统存在的复杂性均决定了政策变量并非外生,会表现出明显的内生性。所以,在存在内生性问题的条件下,虚拟变量不适用于政策效应评估。

工具变量(IV)作为计量经济学中重要的估计方法之一,可有效解决内生性问题。工具变量必须与内生解释变量具有高度的相关性,否则会导致弱工具变量问题,进而使估计量出现不一致性( Staiger和Yogo,2005)。所以,选择合适的工具变量至关重要,现有文献也基本集中于工具变量选取的研究。对于工具变量的选择问题,最早可追至 Andrews(1999)提出的广义矩估计中矩条件的选择问题, Donald和 Newey(2001)主要研究了在包含内生解释变量的线性回归模型中如何选取工具变量,提出了针对该类模型的最优工具变量选择标准,为工具变量的选择问题提供了基本模式;okui(2009)基于 Donald和 Newey(2001)方法,提出了动态面板模型中最优工具变量的选择标准。虽然这些方法存在一些不足,但却为工具变量问题的研究提供了重要息示甚至灵感。具体的,现有文献中选择的工具变量主要有以下几个方面

1、将聚集数据作为工具变量

Card和 Krueger(1996)为了解决同效应( peer effect)的内生性问题,将州、郡等分析层面的集聚数据作为学校、班级以及邻里等层面解释变量的工具变量。Evans等(1992)在研究学校贫困生比例是否对学生怀孕或辍学具有显著影响的实证过程中,为学校贫困生比例选取的工具变量为失业率、贫困率以及家庭收入中位数,认为这三个因素必然与学校贫困生比例有关,但却不直接影响学生怀孕或辍学等行为;Bentolima等(2010)将联邦就业率作为“使用社会关系”的工具变量,以考察其对个人收入的影响效应,其理由是:联邦就业率与收入之间并未存在直接关系,但如果就业率较高,则在联邦内利用关系求职的必要性相对较低。虽然将集聚数据作为工具变量会克服内生性问题,但由于无法保证集聚数据具有完全外生性,所以可能会引入噪音,甚至导致遗漏偏误( Grogger,1996; Rivkin,2001),所以,使用该类工具变量的研究呈减少趋势。

2、将自然现象作为工具变量

通常认为在一定的区域范围内,河流、降雨、自然灾害等现象具有高度的随机性、外生性等特征,可被假设为与个人、群体的异质性无关,但与此同时又会影响某些社会过程。Hoxby(2000)将区域内的河流数量作为学校数量的工具变量,用于验证学区内学校之间的竞争能否提高教学质量。由于历史积累的某种特征可能会导致学校数量存在内生性,而将河流数量作为学校数量的工具变量具有很强的说服力,即河流数量发的交通问题会直接影响学校的设立数量,而河流是自然形成,其与教学质量并无直接关系; Culter和 Glaeser(1997)同样将河流数量作为邻里区隔的工具变量,考察邻里之间的区隔程度对居住者产生的影响。该工具变量的合法性体现在,河流越多必将导致邻里之间的区隔程度越严重,但河流数量却与居住者的收入无关。此外,除了河流,经济学家还将其他自然现象作为工具变量进行实证研究。Munshi(2003)在研究国际移民的问题中,将移民数量的工具变量设定为墨西哥移民来源地的降水量,用于考察移民数量与其收入之间的关系。选取移民来源地的降雨量作为工具变量有其合理性,墨西哥某地区的降雨量与美国的劳动力市场并未存在任何联系,但却与该地区的农业收入息息相关,通过影响农业预期收入进而影响移民政策; Cipollone和 Rosolia(2007)试图考察意大利班级学生的性别构成对女生成绩会产生何种影响,为高中班级性别构成选取的工具变量是地震导致的男性免征兵政策,因为地震作为自然现象是随机且外生的;陈云松(2012)将中国农民工来源村庄的自然灾害程度作为外出打工者数量的工具变量,分析了同村打工网的规模与农民工收入之间的关系。工具变量选取的合法性在于,自然灾害越严重,外出打工的村民越多,在控制地区间应对自然灾害能力以及来源省份之后,自然灾害可被视为外生的。

3、将生理现象作为工具变量

人类的生老病死这一生理上的自然历程,既具有随机性,又与特定的经济社会紧密相关,所以,经济学家将其作为工具变量,巧妙地运用在因果推断中。Angrist和 Evans(1998)试图分析家庭中孩子的数量对母亲就业的影响效应,但由于孩子数量可随机选取,导致解释变量存在内生性,为了解决该问题,巧妙地运用人类生育行为中对儿子、女儿偏好的特征,将子女中的“老大”和“老二”的性别组合情况作为孩子数量的工具变量,认为孩子性别是完全随机的,如果前两个孩子是同性别双胞胎的话,会提高生第三个孩子的可能性,从而增加孩子数量; Acemoglu等(2001)将殖民地国家的自然死亡率作为该国制度的工具变量,他认为,如果某国的死亡率较高,那么殖民者就相对不愿留在该国,并在当地建立具有掠夺性的制度。由于制度存在路径依赖,殖民时代的制度与当代的制度具有密切联系,将历史上的自然死亡率作为工具变量,虽然与当今制度相关,但与目前的人均收入并不存在直接关系; Maurin和 Moschion(2009)分析了法国邻里中其他母亲的就业对单身母亲就业的影响。为了解决内生性间题,将邻里前两个子女的性别组合作为邻里母亲就业的工具变量,认为这两个变量之间存在直接关系,但邻里子女的性别组合是随机的,并不能直接决定单身母亲的就业。Bentolila等(2010)将年长的兄弟姐妹数量作为使用社会关系的工具变量,认为兄弟姐妹的数量是随机的,但如果兄弟姐妹的数量越多,社会关系网就越大,那么使用社会关系进行求职的可能性也相对越大。

4、将社会空间作为工具变量

社会空间包括地理空间、市场空间等,其在特定的分析层面上具有随机独立性,但却与人类行为及其社会结果密切相关。Card(1995)在分析教育是否能够增加个人收、提高个人地位的研究中,由于教育具有随机性,所以将其作为解释变量会产生内生性问题,家到大学的距离会在一定程度上影响是否上大学的决定,但其作为城市空间要与个人的社会经济结果并无直接关系,所以将调查对象家到最近大学的距离为教育的工具变量。但地理空间的距离对上学意愿的影响比较微弱,或者只影部分人的决定,从而导致弱工具变量与局部预效应问题;al和n(199在其制度分析的研究中,将各国到赤道的距离作为工具变量,显然、该距离是外生的,但可大致反映各国受西方制度影响的程度。除了社会空间要素,市场要素也会与某些现象紧密联系,但却不直接影响个体的具体社会特征。Qian(2008)在考察家庭收入性别结构与中国家庭男女出生性别比例关系的研究中,根据茶叶价格的提高可巩固女性的经济地位,进而降低家庭女胎被流产的几率,而茶叶的价格与家庭男女出生性别比例之间并不存在直接的逻关系,所以将茶叶价格作为家庭收入性别结构的工具变量。

5、将实验作为工具变量

实验作为一种外来干预,虽然会对被考察的解释变量产生冲击,但是却可置身模型之外,从而为实证研究提供工具变量,其中包括政策干预、改革创新等社会实验。Angrist(1990、1993)、 Angrist等(1996、2010)陆续考察了越南战争期间,美国青年服兵役对当年的参战者和今天的退伍老兵在收入、健康及后续教育方面产生的影响。由于是否服兵役取决于生日抽签,小于某一國值则参加兵役,大于该國值则可免于兵役,而抽签则是完全随机的,但却对是否服兵役具有直接影响,所以将抽签号作为工具变量。Boozer和 Cacciola(2001)考察了班级平均成绩是否对个体成绩具有同侪效应,将班级中参与小班实验的人数比例作为班级平均成绩的工具变量。认为小班实验是学校从各班随机抽取人员组成,是随机且外生的,但小班教育在提高这部分学生成绩的同时必然会影响班级的平均成绩; Bohonis和 Finan(2008)采用类似的方法研究了墨西哥教育情况。将参与国家给生活困难的母亲补助项目的比例作为平均儿童人学率的工具变量,用于分析同龄人的入学率是否会对个体入学决定产生影响。章元和陆铭(2009)分析了农民工社会关系网与收入之间的关系,将农民工祖辈的社会背景是否来自老区作为社会关系网的工具变量,认为两者之间具有直接联系,但该关系并不会影响农民工在外地的收入。方颖和赵扬(2011)在各地产权保护制度对经济增长影响的研究中,将1919年中国不同城市基督教初级教会小学注册人数占当地人口比例作为工具变量,主要原因是,该比例可在一定程度上代表在历史上该地区受西方影响的程度,入读教会小学的比例越高,表明该地区受西方影响越大,建立产权保护制度的意识较强,而建立教会小学的初衷是布道,与经济发展水平并不直接相关。

工具变量方法功能强大且简洁明了,但其本身存在的局限性在一定程度上限制了该方法的推广:(1)工具变量的选择存在很大困难,在政策效应评估的过程中,找出合适的工具变量非常不容易。在实际操作中,在能够获得政策实施前后数据的情况下,研究者通常将因变量的滞后变量作为工具变量,可能会导致相关性,无法从根本上解决内生性问题:(2)工具变量的随机外生性无法用统计方法进行验证,其合法性容易被质疑,若提供不出有力证据,则后续实证分析将完全失去说服力;(3)工具变量对样本往往具有非均质的影响导致估计量带有权重性特征,使得到的结论仅适用于一部分样本,降低了科学分析的政策意义( Deaton,2010)。

在使用工具变量方法时,应持审慎的态度,清楚说明所需假设前提,并指明一无法满足工具变量的外生性假设时,估计量将如何偏移,只有将理论党与前人的经验教训进行充分结合,工具变量方法才能为因果推断与政策评提供更强的说服力以及更高的可信度。

(0)

相关推荐

  • 有趣的工具变量

    一.内生性与工具变量 当回归方程中的解释变量内生时,直接使用 OLS估计的系数是有偏的.工具变量法是处理内生性问题的主要方法,为此我们寻找内生变量X的工具变量Z进行2SLS回归: 首先利用OLS估计: ...

  • 互助问答第434期:关于内生性检验的问题

    关于内生性检验的问题 尊敬的老师: 您好! 能否具体解释一下xtivreg2命令的具体用法以及所得结果的分析? 问题很不具体,建议这样的问题直接要求具体问题.一般来说,主要是看两方面的结果:一个是工具 ...

  • 互助问答第524期:关于内生性检验的工具变量问题

    关于内生性检验的工具变量问题 尊敬的老师: 您好! 我是一名在做实证研究的大学在读本科生.关于内生性检验的工具变量问题,想请教您,以下是问题描述: 受您在B站互动回答的第383期"内生性检验 ...

  • 实证研究中自选择基础上的内生性问题回顾, 建议和纠正措施!

    邮箱:econometrics666@126.com 所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问. 关于相关计量方法视频课程,文章,数据和代码, ...

  • 最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用

    邮箱:econometrics666@126.com 所有计量经济圈方法论丛的do文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问. 关于相关计量方法视频课程,文章,数据和代码, ...

  • 统计计量丨​一文详细解读回归模型中的异方差问题,让您不再困惑!

    本文转载自公众号简单易学的计量经济学 当你在写实证论文的时候,经常会发现回归模型参数显著性在很多时候并不符合预期,当然这存在很多方面的影响, 比如变量间存在多重共线性.残差存在一阶或高阶自相关或者残差 ...

  • 一天一学丨Lambert计量系列137 内生性与工具变量

    视频简介 本视频提供了本科阶段计量经济学的概述.计量经济学帮助评估我们某种感兴趣的关系,其思想是使用某种统计或数学工具来研究样本,使我们能够推断出总体中发生了什么或者对总体参数进行估计.课程的第一部分 ...

  • 统计计量 | 内生性与工具变量,你不可不知的9个问题汇总

    本文转载自公众号经管学苑 来源:网络 计量经济学中,线性回归模型的本意是给定x值,然后预测(或估计)y的条件均值.在给定的x值下,y值可能忽高忽低(即y是随机变量),其变化程度也可大可小(即y有方差) ...

  • 统计计量 | 回归分析不可不知的关键词和统计量

    本文转载自公众号经管学苑 计量经济学服务中心整理 本文第一部分关键词来源:统计课是纸老虎. 词汇表内容取自<回归分析>(谢宇,2010) 第二部分统计量来源于计量经济学 NO.1回归分析关 ...

  • 一天一学丨Lambert计量系列136 工具变量简介

    视频简介 本视频提供了本科阶段计量经济学的概述.计量经济学帮助评估我们某种感兴趣的关系,其思想是使用某种统计或数学工具来研究样本,使我们能够推断出总体中发生了什么或者对总体参数进行估计.课程的第一部分 ...

  • 统计计量 | 回归系数不显著,其原因和解决思路有哪些?

    本文转载自公众号林林山川 相信大家在做数据分析时,一定遇见过数据不显著的问题,不要气馁,因为不显著才是常态,显著反而是少数. 需要注意的是,当遇见回归系数不显著时,我们不能简单的认为对应的解释变量对被 ...

  • 二十四节气之立夏丨连雨不知春去,一晴方觉夏来

    二十四节气 山中立夏用坐客韵 [宋]文天祥 归来泉石国,日月共溪翁. 夏气重渊底,春光万象中. 穷吟到云黑,淡饮胜裙红. 一阵弦声好,人间解愠风. 文物介绍 荷叶形端砚    清 石质,砚呈自然荷叶形 ...

  • 统计计量 | 显著性水平究竟是何方神圣?

    本文来源:量化研究方法 原文链接:https://towardsdatascience.com/statistical-significance-hypothesis-testing-the-norm ...

  • 统计计量 | 回归分析中15个统计量解释

    本文来源:计量经济学综合整理(转载请注明来源) 回归系数 注意回归系数的正负要符合理论和实际.截距项的回归系数无论是否通过T检验都没有实际的经济意义. 回归系数的标准差 标准误差越大,回归系数的估计值 ...