从AER学习DID方法的最经典文献, 当时没有之一

稿件:econometrics666@126.com

所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

可以自行搜索一下,计量经济圈公众号搜索功能及操作流程演示

正文

关于下方文字内容,作者: 亢延锟(kangyankun@126.com)


今天给大家带来的是一篇发表在AER上的关于DID方法运用的经典文章,内容是Compulsory Licensing: Evidence from the Trading with the Enemy Act,这个论文的中心思想是研究在没有经过外国专利所有者同意情况下,一些发展中国家实施强制许可制度,即允许本国公司利用外国专利生产最终会促进还是抑制本国的发明创造。
为了检验该命题,本文借助于一战后1917年10月6日通过的敌对国家贸易法案(TWEA)这个外生的自然实验,利用美国专利与贸易办公室(USPTO)有机化学产业业中19个主行业(下含7248个子行业)1875-1939年的数据,其中336个子行业是受到了强制许可制度影响的处理组,结果显示受强制许可影响的子行业的国内技术发明得到了极大的增长,在那些至少得到一个强制专利许可的子产业在TWEA法案出台后,相比那些未强制许可行业的技术发明平均每年要多0.151个,比平均水平的0.619个技术发明要高出25%。
同时还验证了国内企业通过干中学方法,利用外国技术发明然后形成自己的生产能力的影响机制。本文思路简单明了,其最出彩的地方就是在DID之后,通过DDD、IV、falsification test等检验进行了大量稳健性分析,保证了结果的稳健性,堪称DID的范本文献。
在介绍这篇文章具体是如何使用did的时候,我想先说一点,其实有很多时候写作要比方法重要得多,同样的食材顶级厨师和一般人做出的菜当然味道不一样,论文也是如此,所以我在开始之前还是想给大家看看,顶级的作者是如何展开论述,引出问题的。下面,我把引言和背景的段落梗概列出来,看看大牛是如何一步一步开展论证的。
Paragraph1:首先陈述事实,强制许可的一些好处;其次说明有一些反对的声音。
Paragraph2:直接点出一个一直以来被忽视的问题(本文的研究)。有可能促进,有可能降低,并说明原因。
Paragraph3:为了检验上述问题,我们利用了Trading with the Enemy Act (TWEA).作为政策冲击,并检验介绍TWEA的内容。
Paragraph4:为了达成以上目的,我们是如何构建DID的。利用政策影响前后不同行业发明专利的差异,这可以使我们排出其余干扰性的因素。
Paragraph5:介绍被解释变量:虚拟变量、数量、时长
Paragraph6:介绍被解释变量和数据格式
Paragraph7:介绍本文的主要发现。
Paragraph8:我们还检验了时间趋势,因为“干中学”需要时间。况且有证据说明处理组的研发水平在TWEA之前本身就更低。
Paragraph9:我们发现强制许可的效果是有时滞的,大概在8-9年左右。
Paragraph10:提出了潜在的质疑:政策时间和给予的专利可能是随机的,但是处理组的选取可能并不随机。首先,他有可能倾向于将专利授予那些国内产品需求较大的行业,这样我们所观测到的效应可能是强制许可和需求的交互影响。其次,也有可能是政府倾向于将专利授予那些本身发展比较差的行业。
Paragraph11:除上上述问题,我们的研究还可能面临一系列因素的干扰。例如:控制组有可能收到德国竞争者突然减少的影响。对此我们利用DDD来对此做出检验。另外我们还做了反事实检验来控制其他非观测性的因素。
Paragraph12:我们利用IV来说明解决我们刚刚提到的内生性问题。选取的IV为“敌国专利的数量”,结果发现did低估了强制许可的效果。
Paragraph13:我们还做了一系列稳健性检验,包括控制了事前的时间趋势和行业层面的差异,并且只用主行业样本进行回归,我们还用了专门的一个大类(靛蓝染料行业)来进行检验。
Paragraph14:在本文的最后一个部分,我们利用了企业层面的数据分析了只有杜邦公司有的专利和其余大家共享的专利做了比较,发现两种机制都很重要,但是杜邦独享的专利对自身的研发促进作用要更强。
Paragraph15:介绍了接下来本文的安排。
下面开始计量部分:
首先,作者用几段内容说明TWEA作为外生冲击的外生性,也就是告诉我们这个自然实验的合理性。
其次,介绍了数据:
①解释变量: 剥夺了4500多个外国专利,其中727个被授予了化学行业中19个主行业,7248个次行业,其中336个是处理组。
②被解释变量:1875-1939年美国19个主行业中一共128953个专利。
③测量误差和衰减偏误(总是朝向零的估计量偏误,因而有衰减偏误的估计量的期望值小于参数的绝对值)
来源一:由于OCR软件识别国籍的时候造成误差。(手动整理了一部分与OCR做了比较)
来源二:行业的划分是不断变化的,为此我们控制了行业的固定效应。(我们假设只有处理组受到专利授予的影响,行业之间的扩散效应是我们不能忽视的,但是这个并不重要,因为这样只会造成结果的低估。)
1. OLS回归(利用下面这最普通的did的模型设定)
回归结果如下:
有一个问题,β只有在处理组和控制组其余所有不因TWEA所导致的不同都相同时,才是一致的估计。但是一个问题是处理组中因为战争导致德国竞争者的数目一度急剧下降,这有可能造成我们的估计偏误,于是作者统计了行业中的德国发明家的数量。结果发现,并没有证据表明,德国发明家的数量只在处理组或者控制组中减少,事实上在所有行业中的变化都是一致的。如下图:
2. 考虑事前趋势
众所周知,did的使用一个最重要的前提就是要满足平行趋势的假设,究竟这个平行趋势假设如何去检验,及如何具体操作的问题,这篇文章给我们做了一个很好的示范。具体的,用下面这个方程:
圈友们会问,这个β后面怎么跟了三个连乘项,具体的数据结构又是什么的呢,我们用如下的三张图来演示这个方程背后的数据结构(北京是处理组,上海是对照组):
首先β×year之后数据变成了:
其次,β×year×treat变成了:
最后,β×year×treat×pre1919(这是一个虚拟变量,1919之前为1,之后为0):
其实,所谓的事前平行趋势检验就是把上面这幅图中所有1的样本一回归,结果发现不显著,这就说明事前是平行的,如果这时候发现依然显著,这就说明你的处理组和对照组的不满足事前平行趋势假设,在政策实施开始之前就有显著不同的发展趋势。而这个回归的结果,满足要求,如下图:
3. 动态效应检验
动态效应检验其实就是把上面的事前趋势如法炮制,只不过1919年之后赋值为1就可以了。
首先是利用虚拟变量回归:
其次,解释变量不再是是不是受到法案影响,而是受到多少个专利的连续变量,这也就是所谓的连续性did。
关于这种图如何看是否显著的问题,是这样,如果上下区间(即虚线)分布在横轴上下,即不显著异于0,就是不显著,如果上下区间都在横轴上方,则显著异于0,就是显著的意思。

最后是,如果多接受一年政策的影响,行业的发明将会如何变化,课间第二和第三个检验都是在检验这个政策的边际效用,第二个是数量上的,第三个是时间上的:
4. DDD
Ddd就是三重查分的意思,顾名思义就是差中差中差,所以他肯定需要三个交互项来构造三重查分,而大家知道构造交互项的时候不能只放交互项,还要放水平项,所以方程就显得有些繁琐:
这个目的是为了解决其余非观测性因素,例如刚刚提到的德国竞争者的问题,文章中也承认其实从历史数据来看这并不重要,但是我依旧要证明给你看。因此本文引入专利发明国家这一维度,比较美国和除了德国外所有国家在TWEA发案出台前后,以及在受影响行业和不受影响行业的技术发明差异。这里DDD就是在基准DID模型基础上引入USA国别虚拟变量及其与组别虚拟变量treat和处理时间虚拟变量posttwea的交互项。结果显示那些强制许可的行业在美国比除了德国以外的国家平均每年要多生产0.087个技术发明,分年度估计结果显示主要是在1934年以后起作用,进一步支持了基本模型的估计结果。
5. 反事实检验
反事实检验就是人为的构造一个处理组,例如本文中被解释变量成了法国的发明专利,本文选取了在有机化学行业落后的法国为样本,只是将因变量换为法国有机化学相应行业在1875-1939年的专利发明数,重新进行了DID估计。由于法国没有受该法案的影响,该政策效果应该不显著,估计结果支持了该结果,因此证实了该政策确实只作用于美国企业。
结果也符合预期,确实是不显著。
6. IV
正如文中所说“实证策略最大威胁来自于美国企业的许可决定可能不是外生的,即便TWEA政策本身和美国企业的技术引进是外生的”。数据表明美国企业往往选择国内初始技术发明比较弱的行业进行许可,由于反向选择导致的内生性导致OLS结果可能低估强制许可政策的真实效果。因此本文用敌国的专利数做本国专利许可数的IV,进行了2sls估计,证实了OLS相比IV估计确实存在一定程度的下偏。
7. 控制事前时间趋势
虽然前面通过了平行趋势检验,本文仍然担心处理前处理组和参考组可能面临不同时间趋势的影响,继续在基准DID模型基础上加入各行业虚拟变量与时间趋势项的交互,处理变量仍然显著为正,进一步增强了本文的结论。需要说明的是该方法现在常用于包括did在内的面板固定效应模型估计,如果加入交互项,核心变量仍然显著,无疑结果是高度稳健的。
可以看到,比原始方程多了一个treat×t,
8. 控制主行业和时间的联合固定效应
另外一个解决平行趋势问题的方法是在基准DID模型中引入7248个子行业所属的19个主行业的虚拟变量与各年度虚拟变量交互的联合固定效应。注意这里不同于前面用的是7248个子行业,这里是用其上一层的19个主行业。因为对于本文这个7248个子行业*64年的面板数据,控制7248个子行业虚拟变量与时间趋势项只相当于引入了7248个待估系数,模型自由度完全足够。如果这里还是同样引入7248个子行业的虚拟变量和各年度虚拟变量的联合固定效应,这时候会引入7248*64个待估参数,跟样本一样大,如果还考虑其他需要估计的控制变量、子行业固定效应、时间固定效应,模型自由度为负,肯定估计不出,所以这时只有退而求其次,引入上一层主行业与时间交互,这样一来节约了自由度,同时也考虑了随时间和行业同时变化因素的作用,避免了遗漏变量可能导致的时间趋势不一致影响。这个方法在nancy qian发表在aer的一篇关于粮食援助是否会导致冲突的文章也得到了同样运用,该文把130个亚非国家划分为6个区域,控制了区域和年度的联合固定效应以避免遗漏变量的影响。
9. 排除了新创造的行业:排除了在接受其强制许可的专利时还不存在的行业
另外一个可能引起质疑的点在于,很多专利不止被发给一个行业,如何排除行业之间的交叉引用技术的影响?
于是作者只用了19个主行业的数据进行回归,从而避免上述问题。
10. 排除需求冲击:利用靛蓝染料行业
在本文的样本区间内,有可能突然因为某些事件的影响,某一行业的需求大增,市场导向使得这个行业迅速发展从而诞生了很多发明专利,作者为了排除这个因素的影响,利用二战时期由于盟军军装需求的增长,对于靛蓝染料这个行业的需求迅速增长,作者只用靛蓝燃料这个行业进行回归后发现,原结果依然十分稳健。
11. 公司级别的检验
是哪一种强制性许可促进了国内的发明?
是独享的还是大家都有的?
自己独享的机制:首先选择自己较弱的方面进行专利的引进,其次策略性的选择可以与自己的研发完美契合的专利。
其余公司有的专利:通过企业之间的技术溢出和正外部性
于是作者使用了杜邦公司的数据,由于杜邦公司是一个大公司,他牵扯到了很多行业,所以被解释变量是杜邦公司这些年中所有涉及到的行业的发明,这仍然是一个基于行业的面板数据。使用如下回归方程:
事实上看,还是独享的专利对自己的发明创造更有利。
到这里,这篇文章的大体内容也就结束了,did算是一个门槛十分低,运用起来也十分简单的政策评估方法,但是实际上这个方法虽然简单,却面临十分严苛的适用条件,目前国内的研究很多文章在关键部分的交代模棱两可,导致这一方法有滥用的趋势。话说回来,这篇文章很多检验翻来覆去的做,虽然有些繁琐,但是却让我们看到了一个标准、规范的did需要如何去证明其运用的合理性。抛开计量部分,这篇文章的行文包括开头结尾也写得十分精彩,值得大家反复阅读。

双重差分法DID

0.双重差分DID方法免费课程, 文章, 数据和代码全在这里, 优秀学人必须收藏学习!1.DID运用经典文献,强制性许可:来自对敌贸易法的证据3.截面数据DID讲述, 截面做双重差分政策评估的范式4.RDD经典文献, RDD模型有效性稳健性检验5.事件研究法用于DID的经典文献"环境规制"论文数据和程序6.广义DID方法运用得非常经典的JHE文献7.DID的经典文献"强制许可"论文数据和do程序8.传销活动对经济发展影响, AER上截面数据分析经典文9.多期DID的经典文献big bad banks数据和do文件10.因果推断IV方法经典文献,究竟是制度还是人力资本促进了经济的发展?11.AER上因果关系确立, 敏感性检验, 异质性分析和跨数据使用经典文章12.第二篇因果推断经典,工作中断对工人随后生产效率的影响?13.密度经济学:来自柏林墙的自然实验, 最佳Econometrica论文,14.AER上以DID, DDD为识别策略的劳动和健康经济学,15.一个使用截面数据的政策评估方法, 也可以发AER,16.多期DID模型的经典文献,big bad banks讲解",17.多期DID的经典文献big bad banks数据和do文件,18.非线性DID, 双重变换模型CIC, 分位数DID,19.模糊(Fuzzy)DID是什么?如何用数据实现呢?20.多期DID的big bad banks中文翻译版本及各细节讲解,21.DID中行业/区域与时间趋势的交互项, 共同趋势检验, 动态政策效应检验等,22.截面数据DID操作程序指南, 一步一步教你做,23.DID的研究动态和政策评估中应用的文献综述,25.DID双重差分方法, 一些容易出错的地方,26.连续DID, DDD和比例DID, 不可观测选择偏差,27.加权DID, IPW-DID实证程序百科全书式的宝典,28.DID和DDD, 一个简明介绍, 双重和三重差分模型,29.DID过程中总结的地图展示技巧,30.DID的平行趋势假定检验程序和coefplot的其他用法,31.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,32.实践中双重差分法DID暗含的假设,33.过去三十年, RCT, DID, RDD, LE, ML, DSGE等方法的“高光时刻”路线图,34.计量院士首次用DID方法分析, 中国封城对新冠病毒扩散的影响!,35.截面DID, 各种固定效应, 安慰剂检验, 置换检验, 其他外部冲击的处理,36.诺奖夫妇的中国学生, “DID小公主”的成名之作, 茶叶价格与中国失踪女性之谜!,37.前沿: 反向DID, 反向双重差分法DDR全解析, 辅以实证示例!38.英诺丁汉大学校长为你讲解逐年PSM匹配-DID方法的操作, 并配上自己写的一篇范文!39.逐年PSM匹配后再DID识别因果的实证范文, 这就是逐年PSM-DID的操作范式!40.用事件研究法进行因果识别如何做? 有什么好处? 与DID结合起来潜力无穷!41.Abadie半参数双重差分DID估计量, 使你的平行趋势假设更加可信!42.弹性DID, DID的终极大法, 关于DID各方法总结太赞了!43.二重差分法分析(DID)44.比DID更加灵活的DDID政策效应评估方45.DID思路和操作,一篇相关实证文献46.二重差分法深度分析(DID),三重差分兼论47.面板数据的DID估计,透彻解读48.PSM-DID, DID, RDD, Stata程序百科全书式的宝典49.关于DID的所有解读, 资料, 程序, 数据, 文献和各种变形都在这里50.分位数DID, PSMDID, 政策前协变量平衡性检验操作步骤和案例51.PSM-DID, DID实证完整程序百科全书式的宝典52.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器53.广义DID, DID最大法宝, 无所不能的政策评估工具54.渐进DID专治各种渐进性政策的良药, 可试一试疗效55.双重差分DID的种类细分, 不得不看的20篇文章56.找不到IV, RD和DID该怎么办? 这有一种备选方法57.在教育领域使用IV, RDD, DID, PSM多吗? 使用具体References58.DID和IV操纵空间大吗? 一切皆为P-hacking59.第一篇中文DID实证论文长啥样? 60.世界上第一篇DID实证论文长啥样?61.关于双重差分法DID的32篇精选Articles专辑!62.空间双重差分法(spatial DID)最新实证papers合辑!63.空间DID双重差分方法的文献, spatial DID64.多期三重差分法和双重差分法的操作指南65.多期双重差分法,政策实施时间不同的处理方法66.三重差分法运行和示例,67.如何设计双重差分法DID: 各种政策研究的最佳指南! 68.利用DID和事件研究法的Top5文章, 分析最低工资对低薪工作的影响!69.推出输出表格, 滚动回归, 事件研究, asdoc, asreg,asrol, estudy代码和解析!70.中国拖拉机vs牲畜: 事件研究法用于政策评估和因果识别, 与DID结合起来威力无穷!71.事件研究法逐步附上程序code和对应的解释, 这还不懂那就真的没办法了!72.推荐用渐进(多期)DID和事件研究法开展政策评估的论文及其实现数据和代码!

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

2.5年,计量经济圈近1000篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle

数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多、前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。
(0)

相关推荐

  • 从消费互联网到产业互联网,土巴兔如何助力家装行业迎来二次腾飞

    过去十多年,家装业先是借助消费互联网及拥抱互联网的家装平台,在引流.撮合成交.信息透明化等方面,迎来了第一波大改造,积累了相当量级的消费大数据. 如今,在产业互联网大趋势下,借助大数据.人工智能等新技 ...

  • 互助问答第500期:关于面板空间计量模型怎样使用不随时间变化的解释变量?

    关于面板空间计量模型怎样使用不随时间变化的解释变量? 各位老师:您好! 我是西北大学城市与环境学院的一名硕士生,最近在使用空间计量模型,有一个问题想请教各位老师,即:在使用面板数据进行空间计量模型回归 ...

  • 面板DID操作分析

    Stata新的didregress和xtdidregress命令符合控制未观察组和时间效应的DID和DDD模型. didreress可以与重复的横断面数据一起使用,其中我们在不同的时间点对不同的观测单 ...

  • 【香樟推文2087】进口竞争与企业创新:自中国的证据

    图片来源: https://www.163.com/dy/article/E2C4DD7O0514AE01.html 原文信息: Liu Qing et al. Import competition ...

  • 互助问答第421期:关于面板数据回归的问题

    关于面板数据回归的问题 老师,您好.我在面板数据回归过程中,碰到一个疑问: 研究关键解释变量X对被解释变量Y的影响时,如果Y本身就是随时间变化的变量,即Y先上升后下降.而研究表明X对Y的影响是非线性的 ...

  • 《新国货白皮书》报告出炉!6大趋势值得关注

    新国货品牌正在以新审美.新技术.新连接创建新品牌,它们作为全新物种,将重塑中国品牌的结构,在中国商业界掀起"重新想象"的浪潮. --吴晓波 在来势汹汹的国货浪潮中,几乎每天都有新故 ...

  • 吐奶、消化不良,宝宝胀气,手把手学习推拿方法

    腹胀.吐奶.消化不良.打嗝--宝宝胀气并不是什么大病,但却是每个宝宝都会经历的过程,因为空气会趁宝宝吃母乳或者用奶瓶吸吮时进入食道. 一些宝宝排气没有困难,但是由于年纪较小肠蠕动慢或者其他原因引起涨肚 ...

  • 一个成功的期货股票操盘手,是需要10年的学习历程的!(经典好文)

    导读: 王国维在<人间词话>中说:古今之成大事业.大学问者,必经过三种之境界:"昨夜西风凋碧树,独上高楼,望尽天涯路." 此第一境也. " 衣带渐宽终不悔,为 ...

  • 中考数学【等腰三角形】常用辅助线添加方法,附经典考题详解

    众所周知,等腰三角形.等边三角形是几何考题里最常见的考试元素之一,尤其是等腰三角形,它是初中数学里的一个重点,和等腰三角形有关的考试题型,各种变式题也特别多. 那么,如何快速解决好等腰三角形问题,做到 ...

  • 捷径探究|学习有方法,学习有捷径,学习有...

    捷径探究|学习有方法,学习有捷径,学习有秘籍! 什么是捷径?我们只按照字面意思解读解析:"捷",就是"快","迅速","战胜&qu ...

  • 历史:学会学习掌握方法培养能力(3)

    第三部分:学习升华,培养能力. 有的同学认为:我们从初中到高中,一直都在学历史,而且,初中.高中的历史课本的内容大体相似,其实,大家只看到了现象,而没有看到事情的本质.实际上,它们是点.线.面的关系. ...

  • 历史:学会学习掌握方法培养能力(2)

    第二部分:掌握方法,增强信心. 许多同学头疼历史,最主要的原因就是历史需要大量的记忆.的确如此,学好历史的基础就是记忆.人的智力系统包括观察力.想象力.思维力.记忆力等等.其中,记忆力是基础,思维力是 ...

  • 历史:学会学习掌握方法培养能力(1)

    第一部分 :学会学习 随着人类向信息社会的迈进,教育面临着重大变革,学习受到了前所未有的重视.一个全新的学习时代就要到来.美国著名未来学家阿尔文·托夫斯认为:"未来的文盲不再是不识字的人,而 ...

  • 学习针灸方法浅谈

    中医是我们中华民族的三大国粹之一,从二十世纪七十年代以来,随着国际"中医热"."针灸热"的兴起,中医正在走向世界,而针灸医学业已成为医学百花园中一朵绚丽之花.国 ...

  • 谈谈学习的方法

    系统的学习.系统学习是和碎片化学习对立的.系统的学习目的是要学习方法论,而不只是知识. 读经典.想最快的,最全面的掌握某个领域的知识.就是要读这个领域内的经典书籍.