选择偏误与随机分组——看完还不会做政治学实验你就打我(四)
文献来源:Angrist, Joshua D., and Jörn-Steffen Pischke. Mostly harmless econometrics: An empiricist's companion. Princeton university press, 2008. pp. 9 – 16.
作者简介: Joshua D. Angrist,麻省理工学院(MIT)经济学教授;Jörn-Steffen Pischke,伦敦政治经济学院(LSE)经济系主任、教授。
编者按:每天一杯咖啡会让你更长寿吗?经常去医院反而会害了你吗?班级规模会影响学生成绩吗?对于这类问题,普通人似乎总会从生活经验中得出相互矛盾的答案,而简单的数据分析也无法为这些争论画上句号。这是因为,几乎所有通过观察、比较得出的因果推断都可能会因为样本选择而产生的严重偏误。也正因如此,针对这些争议性问题的研究最后大都转向了以随机分组为基础的实验方法。如果说概率抽样给予了研究者以小见大的基本能力,那么随机分组就是探寻真实因果关系的终极奥义。为了帮助读者朋友进一步理解选择偏误和随机分配,本期政观特选编了一本经典教材的相关片段。
首先从一个看起来非常幼稚的问题说起。去医院能改善你的健康吗?从常识来看答案似乎是不言自明的。虽然医院确实会带来一些交叉感染的风险,但这并不能阻却正常人去医院救治的意愿。问题在于,我们的既有数据能够支撑这个结论吗?显然,同时包含“近期是否就医”和“目前身体状况”这两个变量的数据库并不罕见,美国国家健康访谈问卷就能满足要求。那么在此基础上,一种自然而天真的想法就是比较就医与不就医群体的健康情况,结果如下表所述:就医群体的健康状况要明显差于不就医群体。(1 = 极好; 5 = 极差),而统计检验也表明这一差异具有显著意义。
从表面上看,就医似乎并没有改善健康,甚至产生了完全相反的处理效应。然而不难发现,这种比较存在严重的问题。因为健康堪忧的群体本身就更可能去就医,而对于这一群体来说,不就医会让他们的健康情况更为恶化。换言之,我们选择进行比较的两部分样本之间本身就存在明显差异,这就导致了严重的样本选择偏误。
下面用一个假想的实验来说明,首先我们将分组变量记为Di,它可以取0(控制组)或1(处理组)。在此基础上,我们将结果变量记为Yi,根据分组变量的取值,Yi存在Y1i(处理后)和Y0i(未处理)两种情况。那么对于任意一个观测i来说,结果变量可以用如下公式表示:
显然,Y1i - Y0i就是我们希望得到的处理效应。然而,现实中,某一个观测要么被处理,要么没有被处理。因此,我们永远无法从单个观测中得到处理效应,我们事实上比较的是控制组和处理组的均值。问题在于,如以下公式所示,处理组和控制组的均值之差并不完全等同于处理效应。因为在分组之后、处理之前,控制组和处理组之间本身就可能存在差异,而这一差异就是选择偏误。换言之,只有当选择偏误为0时,处理组和控制组的均值之差才能无偏地反映出处理效应。在上述的医院案例中,就医群体的身体状况明显更差,那么选择偏误就呈负值。如果这一偏误足够大,那么它就可以完全掩盖正方向的处理效应。
截至目前,随机分组仍然是解决选择偏误的最佳方法。在随机分组的情况下,分组变量Di独立于结果变量Yi。那么在未经处理前,处理组和控制组的数学期望是相等的。那么在处理组接受处理后,处理组和控制组的均值之差就可以无偏地反映处理效应。
长期以来,社会科学研究大都是观察性的。因此,相比于自然科学,随机分组在社会科学中的应用并不广泛。然而,新兴的随机分组已经挑战了很多社会科学经典研究。譬如,不少人认为小班教学会提高学生成绩。然而,经典的教育研究并没有为此找到数据支撑。许多学者都尝试对观察性的数据进行事后分析,但结果往往表明班级规模和学生成绩之间的联系微乎其微。然而如果遵循上文思路不难发现,这些研究都存在严重的选择偏误:成绩糟糕的学生往往会得到特别的待遇——被分入更小规模的班级。近年来,遵循随机分组的研究成功验证了班级规模和学生成绩之间的强烈联系。
编者按:回到这期推送的开头,我们应当如何看待咖啡对健康的影响。在小编小的时候,人们对咖啡这种舶来品似乎抱有相当的警惕。将咖啡视为“心脏杀手”的论调屡见不鲜。而到如今,咖啡已经成为了年轻和体面的象征,咖啡无害论甚至咖啡有益论又开始流行起来。事实上,咖啡的消费具有明显的社会人口学特征。这会使得简单的观察和比较面临严重的样本选择偏误。如果你真的发现喝咖啡的人比较长寿,你可能要留个心眼——或许是因为那些朝不保夕的人根本买不起咖啡呢?(写到这里,小编流下了贫穷的泪水,请大家点一点广告让小编可以恰杯咖啡!)