互助问答第399期 变量初始值缺失的问题
变量初始值缺失的问题
变量初始值缺失应该如何补齐?
这分两种情形。如果某个变量在某一年没有值,在其他年份有值,你首先得看这个值随年份是否有规律。例如性别等不随年份发生变化的变量,可以直接根据其他年度补齐。而像企业利润之类的缺失值,填补缺失需要面临很多假设。如果不填,会面临数值缺失;而进行填补,则可能面临插值错误的危险。很难判断哪种情况好坏。就我而言,如果缺失值并未显著影响最终结果,一般不会进行填补。
赞 (0)
变量初始值缺失的问题
变量初始值缺失应该如何补齐?
这分两种情形。如果某个变量在某一年没有值,在其他年份有值,你首先得看这个值随年份是否有规律。例如性别等不随年份发生变化的变量,可以直接根据其他年度补齐。而像企业利润之类的缺失值,填补缺失需要面临很多假设。如果不填,会面临数值缺失;而进行填补,则可能面临插值错误的危险。很难判断哪种情况好坏。就我而言,如果缺失值并未显著影响最终结果,一般不会进行填补。