公司固定效应总是更优吗?
固定效应(Fixed Effects,FE)是实证会计、金融乃至经济学研究中普遍使用的控制遗漏变量的方法。由于许多研究往往以公司为研究对象(Firm-level studies),出于对公司层面遗漏变量的顾虑,“控制颗粒度更细的固定效应(如公司固定效应)优于控制颗粒度更粗的固定效应(如行业固定效应)”似乎已成为不少文献的共识。然而,公司固定效应总是更优的吗?来自美国华盛顿大学的会计学者Ed deHaan近日就OLS模型中如何使用与解读固定效应,以及公司固定效应对回归系数可能产生的偏误的议题撰写了工作论文“Using and Interpreting Fixed Effects Models”。本文将提炼该文主要观点,以飨读者。
公司固定效应模型能够有效地控制公司层面不随时间变化(Time-invariant)的遗漏变量。学者们也可以通过公司组内去均值化(Within-firm de-meaning)的方法获得等价于控制公司固定效应的处理效果。因此,学者们常常在控制公司固定效应后论述:公司固定效应将研究聚焦于公司内部的变异程度(Firm FE restrict analyses to within-firm variation)。然而,在许多研究中,核心解释变量X的变异程度往往是局部的(local),或者更多是存在于公司之间而非公司内部,若此时研究模型控制公司固定效应,则极易产生研究偏误。deHaan(2021)举例阐释了两种可能产生相关偏误的情形:
情形1:核心解释变量X的变异程度仅存在于部分观测。假设核心解释变量X为董事会规模,在标普500指数成分股的平衡面板数据中,只有100家公司的董事会规模在各年份之间发生变动,而剩余400家公司的董事会规模在各年份之间保持不变。那么,在控制公司固定效应后,不存在公司内部变异程度的400家公司观测并不直接贡献于核心变量X的系数估计。换言之,在控制公司固定效应的情形下,倘若不再加入其他控制变量,500家公司观测估计得出的核心变量X系数将等同于只用100家董事会规模发生变动的公司观测估计得出的系数。然而,学者们仍通常会默认该系数代表了全样本的平均效应;考虑到“真正”用于估计系数的观测仅占20%,做如此的结论外推显然是不合适的。
在控制公司固定效应并加入其他控制变量后,董事会规模不发生变动的400家公司观测将通过其核心变量X与控制变量之间的协方差(covariances)间接影响核心变量X的回归系数。若此协方差与100家公司的对应协方差类似,那么这400家公司观测的加入能够提升模型检验效力,降低统计检验中的第一类与第二类错误(Type I and II errors);然而,若此协方差显著区别于100家公司的对应协方差,那么这400家公司观测将在公司固定效应模型下导致核心变量X系数估计的有偏、增加第一类与第二类错误发生的可能性。
情形2:核心解释变量X的变异程度更多存在于公司之间而非公司内部。假设标普500家公司中,大部分公司的董事会规模在各年份之间都发生了变动(即不存在情形1),但核心解释变量X在全样本中的跨度是5人到20人,标准差为4人,而公司内部的跨度变化却极小,组内标准差仅0.5人。那么,在控制公司固定效应后,此情形则易产生三个研究偏误:(1)核心变量X在公司内部极小的变异程度可能是经济上无意义的,并不适合进行公司组内分析,故极易产生第二类统计错误,即错误拒绝了实质为真的备择假说;(2)倘若核心变量X中的测量误差(measurement errors)是随时间变化的(譬如数据库更新数据带来的差错),那么在公司组内分析下,极小的公司内部变异程度将让位于测量误差的时变性,导致测量误差对系数估计的影响被放大;(3)在公司组内分析下,由于大部分观测的公司内部变异程度极小,少数存在极大公司内部变异程度的观测组将成为极端观测,进而显著影响系数估计。
与此相关的是,许多研究在控制公司固定效应后,解释研究的经济意义时却往往忘记了回归系数是来源于公司组内估计。例如,延续上例,许多研究仍会用全样本的标准差(4人)乘以核心变量X的回归系数来论述研究发现的经济意义,但正确的做法应是用公司内部的标准差(0.5人)乘以回归系数来论述。
综合而言,deHaan(2021)建议,学者们在考虑控制公司效应前,应先观察到底有多少比例的公司在核心解释变量X上是完全不存在“公司内部变异程度”的,以及核心变量X在公司间的变异程度与公司内变异程度的差别。倘若有大比例公司并不存在公司内部变异程度,或者核心变量X的变异程度更多存在于公司之间而非公司内部,那么公司固定效应可能并非优选。(但此时仍须注意遗漏变量问题的解决,譬如缓解存在公司内部变异的观测与其他观测之间可能存在的系统性差异)
除了上述探讨,deHaan(2021)还讨论了固定效应与标准误、固定效应模型下的拟合优度,固定效应与前视偏差等议题。限于篇幅,本文不再赘述。deHaan(2021)的探讨虽然以公司固定效应为轴,但其思想可以拓展到其他需要更高维固定效应的研究(例如“分析师-公司”相关研究中的分析师固定效应),是具备普适性的。尽管deHaan(2021)一文在思想上并非是开天辟地式的创新(譬如不少文献已经指出公司固定效应模型在某些研究场景下的局限性(Zhou,2001JFE)),但该文深入浅出的语言使其在北美学界广为传阅;虽然尚未发表,但已经被JAE等知名期刊论文所引用。更值得一提的是,作者还开发了STATA命令“SUMHDFE”,为研究人员诊断自己的研究样本与问题是否适合控制公司固定效应提供了便捷路径。该命令可以在https://github.com/ed-dehaan/sumhdfe网站下载。
Using and Interpreting Fixed Effects Models
Ed deHaan
Working Paper (Latest version: March 2021)
[Abstract] Fixed effects are ubiquitous in financial economics studies, but many researchers have a limited understanding of how they function. This manuscript explains how fixed effects can eliminate omitted variable biases and affect standard errors, and discusses common pitfalls in using fixed effect regressions. I especially focus on how fixed effect groups (e.g., firms) that have little or no variation in X can confound coefficient estimates and interpretations, and I provide guidance on how to identify and avoid said confounds. I emphasize that FE can be a powerful tool for improving identification but can also introduce important problems of their own. Better understanding these issues will help researchers make better choices about how to design fixed effects models and carefully interpret the results thereof.
推文参考文献:
Zhou, Xianming, 2001, “Understanding the Determinants of Managerial Ownership and the Link between Ownership and Performance: Comment,” Journal of Financial Economics, Vol. 62 (December), No. 3, pp. 559-571.