稿件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
在这篇QJE新任主编AER上"非洲奴隶贸易与不信任的起源", 一篇堪称经典的截面数据实证论文里,作者认为那些深受奴隶贸易影响的非洲族群具有极高的不信任感。在稳健性检验部分,作者通过使用一种方法度量了不可观测变量遗漏对文章结论估计的严重程度,详见,TOP5期刊上如何检验由不可观测因素导致的估计偏误呢?。今天,着重介绍一下作者的工具变量估计策略,尤其需要强调的是作者对IV变量合理性的分析。经典文章,在于作者自己就提出了一个创造性的工具变量,并且受到读者的普遍信任,而让读者信服的策略就值得我们学习。
正文
这次引荐的文章在论证IV合理性方面较充分,尤其是在考虑exclusion restriction条件时,作者进行了反复的论证直到审稿人相信为止(TOP5期刊的特色之一就在于结果看起来极为稳健)。在现实研究中,工具变量的排他性约束条件是很难去证实,即对于工具变量Z——内生变量X——结果变量Y路径,没有任何学者有信心去证明Z只会通过X影响Y。毕竟,世间万物都处于普遍联系中,工具变量Z可能会影响A和B变量,而A和B变量又与Y相关,因此工具变量Z只通过X影响Y的条件被推翻了。此时,怎么办呢?作者是这样做的,首先,把A和B这种混淆路径变量放到工具变量回归的控制变量中,从而使工具变量Z尽可能通过X影响Y。此外,还可以通过证伪其他可能的影响路径,从而间接证实工具变量Z通过影响X再影响Y的路径。作者最后的策略是使用工具变量(IV)。它需要满足相关性和外生性,即与从一个种族中带走的奴隶数量相关,同时与该种族可能影响后代信任的任何其他特征无关。作者使用了奴隶贸易期间个体所在族群到海岸的距离作为奴隶贸易的工具变量。由于在奴隶被运往海外之前都在海岸地区进行买卖成交,因此这个IV捕捉了一个族群在“外界对奴隶的外部需求”中的暴露程度。此外,到海岸的距离似乎与影响后代信任的其他因素无关。从非洲奴隶贸易的历史看,毫无疑问,这是一个有效的工具变量。许多作者都将奴隶贸易描述为源于海岸的破坏性潮浪。关键问题是,一个族群历史上与海岸的距离是否与奴隶贸易以外的其他因素无关,尤其是,与那些可能会影响到今天该族群信任程度的因素无关,例如最初的繁荣,可能会影响一个族群是否更容易受到奴隶贸易冲击,以及随后的信任。一般来说,到海岸的距离与海外贸易有关,因此也就与初期的繁荣有关。但是,由于非洲的特殊历史,并不需要特别担心该问题。在作者的样本中,在跨大西洋和印度洋奴隶贸易之前并没有出现什么大的海外贸易。因此,就不用担心这个问题:到海岸的初始距离可能通过先前存在的贸易对初始发展产生直接影响。意思就是,作者和读者都可能会担心,到海岸的初始距离可能会影响到最初繁荣,从而对今天的信任产生影响,但作者通过历史资料论证这一路径是不可能的。尽管如此,仍有许多其他原因可能使排他性约束假定无法满足。首先,到海岸的距离可能与其他形式的“与欧洲接触”有关,比如奴隶贸易之后的殖民统治。出于这个原因,在IV估计中作者控制了所有族群层面的殖民控制变量。其次,靠近海岸的地区更有可能依靠捕鱼来维持生计。虽然如何影响到未来的信任还不明显,但为了尽可能彻底地排除这一影响,作者控制了族群在历史上对渔业的依赖度。第三,对于非洲的一些地区来说,靠近海岸意味着与穿越撒哈拉沙漠的古代贸易网络的距离更长。因为长期的信任可能受到了一个团体参与这种内陆贸易的影响,因此作者还控制了到撒哈拉贸易中最近城市的平均距离,以及到撒哈拉贸易最近路线的平均距离。在表5和表6中报告了IV估计结果。在控制了基准控制变量、族群层面的殖民控制变量和殖民地人口密度后。第一阶段的估计结果表明,距海岸的历史距离与奴隶出口呈负相关。与历史记录一致,离海岸越远的族群输出的奴隶也就越少。第二阶段的估计结果显示奴隶贸易对当前信任产生了非常显著的负面影响。此外,IV估计值的大小与 OLS 估计非常相似。事实上,在所有模型中中,Durbin-Wu-Hausman 检验都不能拒绝 OLS 估计在 5% 或更低水平上的一致性的原假设。这些结果表明,奴隶贸易的选择效应并没有严重地影响到OLS估计。这与上一节的发现和Nunn(2008)的发现是一致的,奴隶贸易对各国人均收入影响的IV估计值、与OLS的估计相似。在控制了每个族群历史上对渔业的依赖以及与撒哈拉贸易的距离变量后,表6报告了IV估计值。在控制了这些额外因素后,奴隶贸易系数的估计值仍很相似,也显著为负,并且幅度上几乎相同。对于样本中的西部、中西部和南部非洲国家,在1400年之前不存在海外贸易。然而,印度洋奴隶贸易和合法商品的海外贸易却早于 1400 年,这是拥有奴隶数据的首个时期。因此,对于这个非洲地区,在分析的第一年之前,到海岸的距离可能直接影响了族群的特征。然而,在剔除了东非沿海的种族群体后,IV 估计值产生了类似的结果。
为进一步验证IV的合理性,作者做了两个证伪检验falsification tests。当作者检验简化形式时,发现族群到海岸的历史距离与他们今天的信任水平之间存在很强的正相关关系。这种相关性与表5和表6中报告的第一和第二阶段的估计是一致的:居住在沿海地区的族群更容易受到奴隶贸易的影响,今天他们的后代更缺乏信任。而IV策略是基于这样一个假设:奴隶贸易是到海岸的距离影响当前族群信任的唯一渠道。如果这个假设是正确的,那么在世界上没有奴隶贸易的地区,距离海岸和信任之间不应该存在正相关关系。为了评估IV估计值的有效性,作者进行了如下的安慰剂检验:作者使用两个调查数据,包括与非洲晴雨表调查相同或类似的信任问题。第一个样本来自2003年的亚洲晴雨表,包括来自以下十个亚洲国家的样本:日本、韩国、中国、马来西亚、泰国、越南、缅甸、印度、斯里兰卡和乌兹别克斯坦。利用调查对象所在位置的数据,作者计算出每个人目前离最近的海岸线的距离。同时,“亚洲晴雨表”中有一个问题询问了受访者对当地政府的信任度。表7的前两列报告了非洲样本中族群到海岸的距离与对当地政府信任之间的关系。不管有没有控制变量,族群到沿海地区的距离与他们对当地议会的信任之间存在着很强的正相关关系。而第3和第4列报告了亚洲地区同样的估算结果。与非洲样本不同,基于亚洲样本的估计结果显示个体到海岸的距离与当前的信任之间并不存在显著关系。表中也显示,在亚洲样本中,这两个点的估计结果都接近于零,可以说非常微不足道。
关于IV工具变量方法
1.内生性问题操作指南, 广为流传的22篇文章,2.看完顶级期刊文章后, 整理了内生性处理小册子,3.如何寻找工具变量?得工具者得实证计量,4.内生性处理的秘密武器-工具变量估,5.工具变量在社会科学因果推断中的应用,6.为你的"工具变量"合理性进行辩护, 此文献可以作为范例,7.没有工具变量、断点和随机冲击,也可以推断归因,8.工具变量与因果推断, 明尼苏达Bellemare关于IV的分析,9.工具变量IV与内生性处理的精细解读,10.我的"工具变量"走丢了,寻找工具变量思路手册,11.面板数据里处理多重高维固定效应的神器, 还可用工具变量处理内生性,12.豪斯曼, 拉姆齐检验,过度拟合,弱工具和过度识别,模型选择和重抽样问题,13.工具变量先锋 Sargan,供参考,14.AEA期刊的IV靠不靠谱?15.计量大焖锅: iv, clorenz, rank, scalar, bys, xtile, newey, nlcom,16.GMM是IV、2SLS、GLS、ML的统领,待我慢慢道来,17.IV和GMM相关估计步骤,内生性、异方差性等检验方法,18.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?19.内生变量的交互项如何寻工具变量, 交互项共线咋办,20.面板数据、工具变量选择和HAUSMAN检验的若干问题,21.IV和Matching老矣, “弹性联合似然法”成新趋势,22.IV回归系数比OLS大很多咋回事, 怎么办呢? ,23.不用IV, 基于异方差识别方法解决内生性, 赐一篇文献,24.找不到IV, RD和DID该怎么办? 这有一种备选方法,25.内生转换模型vs内生处理模型vs样本选择模型vs工具变量2SLS,26.内生性, 工具变量与 GMM估计, 程序code附,27.GMM和工具变量在面板数据中的运用,28.关于工具变量的材料包, 标题,模型,内生变量,工具变量,29.必须使用所有外生变量作为工具变量吗?30.工具变量精辟解释, 保证你一辈子都忘不了,31.毛咕噜论文中一些有趣的工具变量!33.前沿: 删失数据分位数工具变量(CQIV)估计, 做删失数据异质性效应分析,34.不需要找工具变量, 新方式构建工具变量, 导师再也不用担心内生性问题了!35.关于顶级外刊工具变量的使用最全策略, 不收藏反复读就不要谈IV估计!36.如何通过因果图选择合适的工具变量?一份关于IV的简短百科全书,37.前沿: nature刊掀起DAG热, 不掌握就遭淘汰无疑!因果关系研究的图形工具!38.最清晰的内生性问题详解及软件操作方案!实证研究必备工具!39.中国女学者与其日本同行在JPE上发文了!利用独特数据, 地理断点RDD和IV研究中国环境议题!40.双胞胎样本解决遗漏变量和测量误差, LIV解决选择偏差,41.内生性处理的秘密武器-工具变量估计,42.工具变量IV必读文章20篇, 因果识别就靠他了,43.看完顶级期刊文章后, 整理了内生性处理小册子,44.“内生性” 到底是什么鬼? New Yorker告诉你,45.Heckman两步法的内生性问题(IV-Heckman),46.最全估计方法,解决遗漏变量偏差,内生性,混淆变量和相关问题,47.非线性面板模型中内生性解决方案,48.内生性处理方法与进展,49.万能cmp程序, 有了他, 建议把其他程序全删掉!50.你的内生性解决方式out, ERM独领风骚,51.面板数据是怎样处理内生性的,52.计量分析中的内生性问题综述,53.一份改变实证研究的内生性处理思维导图,54.Top期刊里不同来源内生性处理方法,55.面板数据中heckman方法和程序(xtheckman),56.控制函数法CF, 处理内生性的广义方法,57.二值选择模型内生性检验方法,58.2SRI还是2SPS, 内生性问题的二阶段CF法实现,59.非线性模型及离散内生变量处理利器, 应用计量经济学中的控制函数法!60.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用,61.如何选择合适的工具变量, 基于既有文献的总结和解释!62.中介效应最新进展: 中介效应中的工具变量法使用方法及其代码!63.弱工具变量的稳健性检验, 附上code和相关说明!64.工具变量对因果效应的识别和外推, 大牛的顶级评述!65.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!66.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!67.估计工具变量回归时, 是否必须将所有外生变量用作工具变量?68.引力模型基础上的工具变量如何构建?69.必读, 宗教是如何阻碍经济发展的? 基于DID, IV和各种机制分析的AER量化史分析!70.JPE上利用地理断点RDD和IV研究中国环境议题的do文件release!71.工具变量IV估计免费课程, 文章, 数据和代码全在这里, 不学习可不要后悔!72.天下回归, 无内生性不破, 唯此神文不破, 练就内生性处理的终极大法!73.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!74.2020年博导圈流传最广的一份“几十种内生性处理方法及其要求和局限”的宝典, 并附上代表性重要文献!75.因变量和内生变量是连续,有序和无序多元变量时, 该如何做工具变量估计?76.太难了! 用天气做工具变量IV都被审稿人质疑! IV竟如此脆弱那有什么IV选取建议呢? 77.天气数据作为工具变量IV的文献清单, 分门别类地为各位整理好了!78.华人金融学术女神为运用工具变量估计方法做因果推断的学者提供了如下宝贵建议!79.你确定找到一个好的工具变量了吗? 这将是一篇最值得你看的文章!80.关于工具变量估计的论证思路,各种检验, 操作代码和实证解读, 这可能是最全面的一份兵法!81.几百年一遇的工具变量让基于OLS的截面数据回归结果发到Top了, 设计巧妙让人叹服!82.一份使用工具变量回归的AER文章清单, 思路惊奇定会让你脑洞大开!83.引力模型基础上的工具变量如何构建?84.使用千年难得的IV+DID方法将中国故事写到了Top5, 设计之巧妙构思之缜密让人叹服不已!84.最全利用工具变量控制内生性的步骤和代码—在经管研究中的应用
另外,今天逛社群看见群友分享了一篇陆铭老师推荐的DID文章,建议各位群友到社群下载看看。
社群里面的资料相当丰富,各位群友要多逛逛,这样才能在学术上才能长更多的见识。
下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。
2.5年,计量经济圈近1000篇不重类计量文章,
可直接在公众号菜单栏搜索任何计量相关问题,
Econometrics Circle
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。