互助问答第521期:关于聚类标准误问题
关于聚类标准误问题
老师,您好!
我正在做一个关于移民倾向的分析:
所用数据为:在一个国家于2017年的问卷调查内搜集到的截面数据。
应变量为:个人是否有移民意愿。
回归模型设置:在二元logit模型中我除了加入一系列相关自变量以外,并控制了region FE。
问卷抽样:该数据在搜集时,首先在行政区级别(农村和城市)(共79个)分层并设置小抽样单位(共150个),在每个抽样单位中随机抽选8个家庭,并在家庭中随机抽取一个人进行采访。
问题描述:遇到的问题是我想考虑在各行政区内的个人的移民意愿的回归误差方差不是独立的, 即我想使用行政区作为聚类的层级。
但是回归后发现wald test不再可用。(结果一)
我查了一下可能是因为聚类太少,于是我用小抽样单位(150个)进行了聚类,得到结果二。
同时附上只用robust se的结果。(结果三)
我的疑问主要是在是否选择聚类稳健标准误上,请问我是否应该选择文件标准误+行政区划级别的FE。 还是选择小抽样单位cluster+区域FE。
非常感谢你的帮助,谢谢你花时间看了这封邮件!!
祝好!
如主要考虑异方差的稳健性,应用robust+的方式可行,cluster也没问题;cluster为聚类标准误,可根据自身数据结构特征选择合适的分类层级进行标准误聚类设定,实际操作中robust和cluster两者均有应用。相关讨论可进一步参见https://www.zhihu.com/question/23155918。
赞 (0)