Stata:gen命令中的group()函数的潜在风险
原文链接:https://www.lianxh.cn/news/56d6e46376d31.html
目录
1. 问题背景
我们经常使用 generate
(后文简称 gen
) 命令提供的 group()
函数对某个变量进行分组,产生分组变量 gg,继而基于 gg 变量进行后续的分组回归分析。
例如,在公司金融中,常用如下代码产生融资约束的分组指标:
*-用公司规模衡量融资约束,分成三组
. bysort code: egen av_size = mean(size)
. sort av_size
. gen gg = group(3)
. gen FC = (gg==1) //小规模公司定义为 FC 组
. replace FC=. if gg==2 //丢弃中间组
. reg y x if FC==0
. est store m_FC
. reg y x if FC==1
. est store m_NFC
. esttab m_FC m_NFC
恐怖的事情就要发生了!
后续做分组回归时,你会发现:执行相同的代码,但两次得到的结果居然不同!
原因何在??
赞 (0)