互助问答第525期:关于Logit模型问题

关于Logit模型问题

老师,您好,想请教下Logit模型。

是这样的,我的被解释变量是0-1,解释变量是上市公司的相关数据,其中也有0-1变量,采用的是2011-2019年的混合截面数据。

运行命令,logity x i.year i.industry的时候,有两个行业回归显示 8.industry1 != 0predicts failure perfectly  8.industry1dropped and 47 obs not used

我查过相关资料,这是因为在控制行业的时候,该行业中的被解释变量恒为0或者1,所以被drop掉。

我的描述性变量是17,243 ,和进行回归结果的样本数17,106不同,想问下这个时候的解决方法是什么?如果是说手动删掉这两个行业的话,在行业虚拟变量的部分需要介绍一下为什么不是证监会发布的所有行业类型吗?

出现这种情况的一个原因是行业分类太细,以至于特定行业内部的变量取值变化不够大。可以考虑整合行业,比如将被drop掉的行业与最相似的其他行业合并为一个新行业,这样就能使用全部样本了。不过因为被drop掉的观测值不多,所以是否处理应不明显影响最终结果。
(0)

相关推荐