互助问答第487期:关于剔除样本的问题
关于剔除样本的问题
请问什么时候需要剔除样本呢?某指标连续2-3年缺失数值,可以直接空着,还是得删除这几年的样本呢?
你的问题没有标准答案,需要根据你具体情况来定,如果只是一两个指标,两三年的数据缺失,那可以用差值法进行填补。
相关推荐
-
各种算法对比以及各自的优缺点
详细:https://www.julyedu.com/question/big/kp_id/23/ques_id/2533 贝叶斯分类法 优点: 对小规模的数据表现良好,适合多分类任务,适合增量式训练 ...
-
闲鱼是如何实践一套完整的埋点自动化验证方案的?
此文转载自:https://blog.csdn.net/weixin_38912070/article/details/112386551#commentBox 背景 作为一款国民级二手交易App,闲 ...
-
手把手带你入门数据插补(附代码)
本文将为你介绍数据缺失时的处理办法. 1. Feature Imputation Feature Imputation是指数据中的数据缺失某些特征值的时候,用一定的方法来解决此问题的过程. 2. 缺失 ...
-
互助问答第465期:关于样本未分离的内生转换回归模型问题
关于样本未分离的内生转换回归模型问题 老师您好,请问关于样本未分离的内生转换回归模型stata如何实现呢? 已知movestay命令可以实现样本分离的. 小粉丝不胜感激! 不明白这里的样本分 ...
-
互助问答第484期:关于DID样本时间选择的问题
关于DID样本时间选择的问题 请问DID的样本时间起码要选事件发生前的多少年呢?如果是事件发生当年开始算可以吗? 一般3~5年,具体事件发生当年还是滞后的一年算,要根据具体的政策来看.
-
互助问答第539期:关于总体和分组样本显著性的问题
关于总体和分组样本显著性的问题 总体样本回归显著,然后按照地区分组后,东部城市显著西部城市不显著,这种结果要怎么解释呀?可以说明异质性嘛? 是的,这就是异质性,每个地区不一样,所以估计结果也可能 ...
-
互助问答第483期:关于控制变量选择的问题
关于控制变量选择的问题 想请教下关于控制变量选择的问题.第一个回归我加了三个控制变量,第二个根据已有的文献我又加入了人口密度.但是回归的结果显示,人口密度加进去好像没什么意义,感觉显著性好像没那么强, ...
-
互助问答第482期:关于边际效应描述的问题
关于边际效应描述的问题 老师好,我想问问关于边际效应的系数怎么描述呢? 需要具体看你的变量如何度量,你参考一下文献中类似的度量来描述.
-
互助问答第485期:关于定序变量的问题
关于定序变量的问题 请问老师定序变量当自变量可以当数值变量放到回归模型中吗,1到4的定序,比如公平1-4越大越公平,在自变量里可以直接当数值放还是必须需要让非常不公平的那个做参照组. 可以直接放,很多 ...
-
互助问答第486期:把logit的结果代入到DID问题
把logit的结果代入到DID问题 请问老师,公式6是用logistics模型来估计政策执行概率,然后把政策执行概率代入到公式7DID中,该怎么把logit的结果代入到DID中呢? logit估计后生 ...
-
互助问答第488期:关于控制变量和R方的问题
关于控制变量和R方的问题 把一个控制变量剔除之前,R方大 但解释变量不显著:去掉一个控制变量后,解释变量显著,但R方只有0.12.请问该怎么办呢? 目前对r2的关注没有以前那么看重.
-
互助问答第489期:关于DID异质性分析的问题
关于DID异质性分析的问题 我在做多期双重差分异质性分析,即政策对不同城市级别影响的差异性.看了一些文献,选用了因变量=a+b改革变量*城市级别虚拟变量+c控制变量+个体固定效应+时间固定效应+误差项 ...