Logit-Probit:非线性模型中交互项的边际效应解读

🍎 连享会主页:lianxh.cn

🎦 2021 效率分析专题
📅 2021 年 5.15-16;5.21-22
🔑 主讲:龚斌磊(浙江大学);连玉君(中山大学);张宁(山东大学)
🍓 课程主页https://gitee.com/lianxh/TE

New! lianxh 命令发布了:   GIF 动图介绍
随时搜索 Stata 推文、教程、手册、论坛,安装命令如下:
. ssc install lianxh

作者:展一帆 (复旦大学) ,周依仿(复旦大学)邮箱:simonzhanyf@163.com

Source:

  • Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-
  • Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-

目录

  • 1. 问题背景

  • 2. 四种解释方法

  • 3. 一个警示性例子

  • 4. 实操案例分析

    • 4.1 优比度量下的乘积交互效应解释方法

    • 4.2 优比度量下的边际交互效应解释方法

  • 5. 参考资料

  • 6. 相关推文


温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:

1. 问题背景

在非线性计量模型(例如 logit,probit 等),如何解释交互项的效应,很多学者在应用上仍存在混淆之处。本文通过介绍 Buis (2010 和 Dow et al. (2019) 来说明这一问题。

2. 四种解释方法

我们使用一个 logit 模型作为例子:。定义四种解释交互效应的方法如下:(1) 概率度量下的乘积交互效应(multiplicative interaction effects) 记 为给定 和 之后的估计值,则概率度量下的乘积交互效应可定义为

在 stata 中可用 marginsnlcom 命令获得:

. logit y i.x##i.z
. margins x#z, post
. nlcom (_b[1.x#1.z] / _b[1.x#0.z]) / (_b[0.x#1.z] / _b[0.x#0.z])

(2) 概率度量下的边际交互效应(marginal interaction effects) 概率度量下的边际交互效应定义则为:

stata 中可以使用如下命令获得:

. margins, dydx(z) at(x=(0 1)) contrast(atcontrast(r._at)) post

(3) 优比度量下的乘积交互效应(multiplicative interaction effects) 如果将被解释变量转化为优比(odds ratio),则乘积交互效应(multiplicative interaction effects)可定义为

这种解释方式是文献中最为常见的,在 stata 中的实现方式也非常简单,仅需增加 or 选项

. logit y i.x##i.z, or

(4) 优比度量下的边际交互效应(marginal interaction effects)

. margins x#z, expression(exp(xb())) post. lincom (_b[1.x#1.z] - _b[1.x#0.z]) - (_b[0.x#1.z] - _b[0.x#0.z])

3. 一个警示性例子

在很多文献中,对于非线性模型交互项的解释只汇报了上述解释方法中的一种。本小节中通过一个简单例子说明上文四种方法可能得到不一样的结论,需要针对研究问题谨慎选择。

这个简单例子只有四个数据点(见图 1 的面板 A)。不妨考虑这个例子的背景为一个自然实验,变量 x 代表处理前后,0 代表处理前,1 代表处理后。变量 z 标记组,z=0 为控制组,z=1 为处理组。样本在处理前并不平衡,控制组的 p 为 0.05,处理组的 p 为 0.1。

在处理前(x = 0)时,随着 z 从 0 增加到 1,被解释变量取 1 的概率 p 从 0.05 上升到 0.10。当 x = 1 时,随着 z 从 0 增加到 1,被解释变量取 1 的概率从 0.10 增加到 0.19。图 1 的面板 B 则为转换成优比后的相同的四个数据点。

图1

一方面,概率度量上的乘积交互效应为 0.95(表 1 最后一列,面板 A),因为在处理前(x=0)时,处理组(z=1)的 p 为控制组的两倍(0.1/0.05),而在处理后则仅为 1.9 倍(0.19/0.1),这意味着随着 x 增加,z 对 y 的效应在减小。相比之下,优比度量上的乘积交互效应是 1.0(表 1 的最后一列,面板 B),这意味着随着 x 的增加,z 的效应是不变的。

另一方面,概率度量上的边际交互效应为 0.04(表 1 中列,面板 A),因为在处理前(x=0)时,处理组(z=1)的 p 比控制组大 0.05(0.1-0.05),而在处理后则升至为 0.09(0.19-0.1)。这意味着随着 x 增大,z 的效应增大。优比度量上的边际交互效应为 0.06,也显示了类似的递增效应(尽管在其他例子中,它可能与概率度量上的边际交互效应有显著不同)。

由此可见,在该简单例子中,交互项的解释根据解释方法不同,即可能为正,为零也可能为负。即随着 x 增大,z 的效应可能:

  • 根据概率度量上的乘积交互效应而减小
  • 根据概率度量上的边际交互效应而增大
  • 根据优比度量上的乘积交互效应而为零
  • 根据优比度量上的边际相互效应而增大
表1

4. 实操案例分析

进一步,我们可以通过 Buis(2010)中的一个例子加深对上午的理解。比如我们要研究对于黑人和白人来说,是否拥有大学学位 collgrad 对于是否能获得高级别工作(high_occ)优比的效应差异。

4.1 优比度量下的乘积交互效应解释方法

. sysuse nlsw88 // 采用系统自带的美国妇女工资数据集

// 生成“高级别”工作变量
. generate byte high_occ = occupation < 3 if occupation < .

. generate byte black = race == 2 if race < .
. drop if race == 3

. generate byte baseline = 1

// 添加or选项,汇报odds ratio
. logit high_occ black##collgrad baseline, or noconstant nolog

结果如下:

. logit high_occ black##collgrad baseline, or noconstant nolog 

Logistic regression                             Number of obs     =      2,211                                                Wald chi2(4)      =     504.62Log likelihood = -1199.4399                     Prob > chi2       =     0.0000

------------------------------------------------------------------------------       high_occ | Odds Ratio   Std. Err.     z    P>|z|   [95% Conf. Interval]----------------+-------------------------------------------------------------        1.black |   .4194072   .0655069   -5.56   0.000   .3088072    .5696188                |       collgrad |  college grad  |   2.465411    .293568    7.58   0.000   1.952238    3.113478                | black#collgrad |1#college grad  |   1.479715   .4132536    1.40   0.161   .8559637    2.558003                |       baseline |   .3220524   .0215596  -16.93   0.000   .2824512    .3672059------------------------------------------------------------------------------

针对上表的解读,首先看基准组(没有大学学历的白人),表格中可得其优比为 0.322。由于优比的定义是 p/(1-p),所以我们可以解读为,对于每一个非高级别工作的人,样本中可以找到对应 0.322 个有高级别工作的人。

collgrad 的优比为 2.47,也即是说,拥有大学文凭的白人相对于没有大学文凭的白人,优比提升 2.47 倍(注意这里是乘法运算,即上文提到的 multiplicative effects)。所以对于有大学文凭的白人,总优比是 0.79 (0.32×2.47)。也即是说此时对于每一个非高级别工作的人,样本中可以找到对应 0.79 个有高级别工作的人。显然拥有大学文凭大幅度提升了获取高级别工作的可能性。

black的优比为 0.42,所以没有大学文凭的黑人的优比为 0.14 (0.32×0.42)。交乘项的优比为 1.48 (注意,这里对应上文中的“优比度量下的乘积交互效应”解释方法),也即黑人有大学文凭相比白人有大学文凭,对于找到高级别工作的优比的边际提升为 1.48 倍。换言之,对于有大学文凭的黑人来说,总优比是 0.49 (0.32×0.42×2.47×1.48)。

4.2 优比度量下的边际交互效应解释方法

继续该例子,但我们换做优比度量下的边际交互效应解释。用 margins 命令得到 blackcollgrad 不同组合下的优比。可以看到四种组合下的优比分别为 0.32,0.79,0.14 和 0.49(上一小节中已经通过乘法运算得到了这四个数字)。

用边际交互效应解释,则大学文凭对于白人的边际效应为 0.47 (0.79-0.32), 而对于黑人的边际效应则仅有 0.36 (0.49-0.14)。

由此可以看出, collgrad 的边际交互效应对于白人来说大于黑人,但其乘积交互效应则是黑人大于白人。产生差异的原因就在于计算乘积交互效应时,不同组的基准是不一样的,白人为 0.32,但黑人仅 0.14,所以虽然从乘积角度, collgrad 提升黑人的优比的比例更高,从 0.14 提升至 0.49,约 3.6 倍,但从边际上看优比只增加了 0.36。而白人的优比从 0.32 提升至 0.79,增加的倍数不如黑人,但边际上的增加量却达 0.47,大于黑人的 0.36。这就是两种解释方法差异的来源。

margins, over(black collgrad) expression(exp(xb())) post
*结果如下:
Predictive margins                              Number of obs     =      2,211
Model VCE    : OIM

Expression   : exp(xb())
over         : black collgrad

--------------------------------------------------------------------------------
                    |          Delta-method                                 
                    |   Margin   Std. Err.      z    P>|z|  [95% Conf. Interval]
--------------------+-----------------------------------------------------------
     black#collgrad |                                                           
0#not college grad  | .3220524   .0215596    14.94   0.000  .2797964    .3643084
    0#college grad  | .7939914    .078188    10.15   0.000  .6407457    .9472371
1#not college grad  | .1350711   .0190606     7.09   0.000   .097713    .1724292
    1#college grad  | .4927536   .1032487     4.77   0.000    .29039    .6951173
--------------------------------------------------------------------------------
. lincom 0.black#1.collgrad - 0.black#0.collgrad
( 1)  - 0bn.black#0bn.collgrad + 0bn.black#1.collgrad = 0

----------------------------------------------------------------
     |    Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
-----+----------------------------------------------------------
 (1) |  .471939    .081106   5.82   0.000   .3129742    .6309038
----------------------------------------------------------------
. lincom 1.black#1.collgrad - 1.black#0.collgrad
 ( 1)  - 1.black#0bn.collgrad + 1.black#1.collgrad = 0

-----------------------------------------------------------------
     |     Coef.   Std. Err.    z    P>|z|   [95% Conf. Interval]
-----+-----------------------------------------------------------
 (1) |  .3576825   .1049933   3.41   0.001   .1518994    .5634656
-----------------------------------------------------------------

总结一下,乘积交互效应(multiplicative interaction effects)和边际交互效应(marginal interaction effects)并不一样,回答的是不同的问题,在特定情况下可能给出完全相反的结论。故而学者在解释非线性模型的交乘项时,应当注意其中微妙的差别,谨慎的对交互项做出经济学解释。

5. 参考资料

  • Maarten L. Buis. Stata Tip 87: Interpretation of Interactions in Nonlinear Models[J]. The Stata Journal, 2010, 10(2) : 305-308. -Link-
  • Dow W H, Norton E C, Donahoe J T. Stata tip 134: Multiplicative and marginal interaction effects in nonlinear models[J]. The Stata Journal, 2019, 19(4): 1015-1020. -Link-, -PDF-

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 调节 u型 交乘 交叉
安装最新版 lianxh 命令:
ssc install lianxh, replace

(0)

相关推荐