TOP5期刊上如何检验由不可观测因素导致的估计偏误呢?

正文

以下内容由社群群友@骄傲了的天 整理。

“Using Selection on Observables to Assess the Bias from Unobservables”
尽管我们试图控制可观测的因素,如最初的繁荣和殖民统治的影响,表3中报告的估计结果仍然可能受到不可观测因素的影响,即,只要这些不可观测因素与奴隶贸易选择和随后的信任度相关(即,与解释变量和被解释变量同时相关),都会造成核心解释变量的估计偏误。因此,我们将评估不可观测因素在多大程度上会产生估计偏误。
我们使用了Altonji、Elder和Taber(2005)的策略,即用基于可观测因素的自选择评估基于不可观测因素的自选择所导致的潜在估计偏误。作者提供了一种衡量由不可观测所引起的估计偏误的强度的方法:与基于可观测因素的自选择相比,基于不可观测因素的自选择必须要强多少,才能解释掉全部的估计效应。
为了知道它是如何计算的,考虑两个回归:一个带有一组受限制的控制变量,另一个为一组完整的控制变量。

表示从第一个回归(其中R代表Restricted)和

表示从第二个回归(其中F代表Full)估计的感兴趣变量的系数。从而能够算出以下这个比例:

。这个公式背后的直觉如下。首先,考虑若分母

的比率在下降,则表明

之间的差异越小,系数估计值受基于可观测因素的自选择的影响也就越小,因此只有受基于不可观测因素的自选择更大时,我们才能有效解释整个效应。接下来,考虑在分子中

背后的直觉。

越大,估计值受基于不可观测因素的自选择的影响就越大,因此比值就越高。

我们考虑两组受限协变量:一组没有控制任何变量,另一组稀疏地控制了个体因素,只包括年龄、年龄平方和性别指标变量。我们还考虑了两组完整的协变量:来自方程(1)的基准控制集,以及在此基础上增加的族群层面的殖民控制变量,包括殖民地人口密度。给定我们的两个受限和两个非受限协变量集合,有四种受限和非受限控制变量的组合可用来计算这个比率。具体地,就看表4中每一列都有四个数字,这就是四个比率。
在表4中报告的20个比率中,没有一个小于1。比率从3.0到11.5,中位数为4.1。因此,要将整个OLS估计归因于自选择效应,基于不可观测因素的自选择至少要比基于可观测因素的自选择大三倍,平均来说,要大四倍以上。因此,在我们看来,这些结果使估计的奴隶贸易对信任的影响不太可能完全由不可观测因素所驱动。
在中文期刊中也能看到这一方法的影子,因此作为稳健性检验该方法值得借鉴和使用。
Source: 李俊青,李响.传染病经历对居民社会信任的影响研究[J].经济与管理研究,2020,41(10):42-58.
(0)

相关推荐