当自变量为连续变量时,实证研究的开展更具弹性
当自变量为连续变量时,实证研究的开展更具弹性!众所周知,实证研究中有两个不可分离的姊妹变量:自变量和因变量。而且,这两个变量是实证研究中核心内容的代言词,全文内容都是贯穿他们始终。
今天,我们主要来聊聊这个“自变量”,当然也常常被称呼为“解释变量”,但今天不谈泛泛的“自变量”,即控制变量。一谈到实证回归分析,我们就不可避免地接触到自变量的选取,而自变量的选取往往又有多样性,主要根据它的样本分布属性来判断。
自变量,有的是虚拟变量(0-1),有的是程度性变量(如1,2,3,4……),有的是连续性变量。相对于虚拟变量和程度性变量,连续性分布属性的自变量在实证分析中更具“魅力和感染力”,它可以使我们在实际操作中得心应手,游刃有余。
当自变量为连续变量时,我们的直接操作方法是直接给它降维,一般的方法是用相对指标和绝对指标。在回归分析中,我们将直接采用这个自变量的相对指标或绝对指标,但一般情况下,我们一般只选择其中一个作为主效应分析的基础,额外的相关度量指标作为后续稳健性检验开展的主要力量来源。
实际上,连续变量给我们实证分析带来了巨大的操作空间和想象力!譬如:连续变量可以根据它的中位数或者均值来转化为虚拟变量;连续变量可以根据它的四分位数或五分位数进行设计并以此形成一个程度变量;而且,连续变量,可以转化为一个变量的相对指标或绝对指标,这也为我们的实证分析提供了空间。
在实证分析中,连续变量的操作丰富性主要体现在后续实证操作空间上,如变量替换检验、Heckman二阶段模型、倾向得分匹配法等。在变量替换方法,连续变量带来多种类型变量的转换优势是稳健性检验有效开展的最好保障。在进一步分析中,Heckman二阶段模型、倾向得分匹配法等,多需要虚拟变量,连续变量可以直接转化成功。
所以,在实证研究中,如果你的自变量为连续变量,一定要把握样本分布赋予你的开展机会。实证研究,最主要的就是稳健性和严谨性,而这个严谨性需要的就是研究结论的稳健,如果作者从多个维度来夯实结论,是一篇学术实证文章的基础,也是一篇实证文章质量提升的保障。也正因为如此重要,连续变量可以为我们的实证操作带来多种空间和机会,所以请认真对待连续变量的自变量。