互助问答第401期 变量中有大量0值的问题
变量中有大量0值的问题
老师,您好!请教一下关于自变量和因变量中有大量0值,该如何处理呢。自变量是企业的R&D投入,有大量0值,和正值的投入金额占销量比例。因变量是企业的销量变化百分比,有大量0值(保持不变),负值(降低)和正值(增加)。想请教老师这种情况下该用什么模型比较合适呢?以及如果把其中一个转化为名义变量(eg 有无R&D的虚拟变量销量变动转化为增平减三值名义变量),只有自变量或者因变量有大量0值又该如何处理呢?
自变量不用处理,因变量ln(y+1),当然也可以泊松回归,但是没必要。你为什么要把被解释变量转成三值变量,这时候需要用多元选择模型,但我觉得很多复杂没有必要。
赞 (0)