《为什么统计数据有时会“撒谎”》阅读答案
为什么统计数据有时会“撒谎”
①收集统计数据是一项复杂而又精细的工作,每一步都有出错的可能。即使所有的细节都万无一失,最终得到的数据里也会隐藏大量的陷阱。如果盲目地对统计数据进行分析,有时会得出一些甚为荒谬的结论。
统计学家曾经调查过铀矿工人的寿命,其结果让人大跌眼镜:在铀矿工作的工人居然与普通人的寿命相当,有时甚至更长!难道统计结果表明在铀矿工作对身体无害甚至有益吗?当然不是!事实上,只有那些身强体壮的人才会去铀矿工作,他们的寿命本来就可能长一些;正是因为去了铀矿工作,才把他们的寿命拉低到了平均水平,造成了数据的虚假独立性。这种现象常常被称为健康工人效应。
有虚假的独立性数据,就有虚假的相关性数据。统计数据显示,去救火的消防员越多,火灾损失也越大。初次听到这样的结论,想必大家的反应都一样:这怎么可能呢?仔细想想你就明白了:正是因为火灾灾情越严重,损失就越大,所以才会有更多消防员去救火。这里的因果关系弄颠倒了。数据只能显示两个事情有相关性,但并不能告诉你它们内部的逻辑关系。
事实上,两个在统计数据上呈现相关性的事件,甚至有可能根本就没有因果关系。统计数据表明,冰激凌销量增加,鲨鱼食人事件也会同时增加。但这并不意味着,把冰激凌销售点全部取缔了,就能减小人被鲨鱼吃掉的概率。真实的情况是,这两个变量同时增加只不过是因为夏天到了。又如,统计数据显示,篮球队的获胜率,竟然与队员的球袜长度成正比。难道把队员的球袜都换长一些,就能增加球队实力吗?显然不是。数据背后真正的因果关系是,球队的获胜概率和队员的球袜长度同时受第三个因素——队员身高——的影响,这导致了获胜概率与球袜长度之间表现出虚假的相关性。
可见,要想从统计数据中挖掘出正确的结论,并不是一件容易的事。如果只从表面上观察数据,往往会得到一些错误的信息。正如著名作家马克·吐温所言:“世上一共有三种谎言:谎言,糟糕的谎言,还有统计数据。”
13.第②段加点词“大跌眼镜”在文中的意思是: (2分)
14.第②段以“铀矿工人与普通人的寿命相当,有时甚至更长”为例,是为了说明(3分)
A.铀矿工人寿命更长 B.健康工人效应
C.数据的虚假独立性 D.统计数据会“撒谎”
15.以下内容,适合放入文中的哪一段?(3分)
有数据表明打太极拳的人和不打太极拳的人平均寿命相当。事实上,打太极拳确实可以强身健体,延长寿命,但打太极拳的人往往体弱多病。
A.第②段 B.第③段 C.第④段 D.第⑤段
16.第③-④段中“救火的消防员越多,火灾损失越大”与“冰激凌销量增加,鲨鱼食人事件也会同时增加”两个例子及分析,能互换位置吗?请说明理由。(5分)
17.运用本文第④段中的知识,解释下列现象。(5分)
【现象一】1950年左右,大气层二氧化碳的含量变化和肥胖症人口的数量都出现了一次非常剧烈的增长。
【现象二】20世纪50年代,汽车产业形成了一定的规模,尾气排放导致大气中的二氧化碳含量陡然增加。
13.(2分)(因出乎意料而)大吃一惊
14.(3分)C
15.(3分)A
16.(5分)不能。因为在说明虚假的相关性数据时,按逻辑应先说明相关性数据中存在因果关系,而虚假体现为因果颠倒,再说明相关性数据没有因果关系(2分)。“消防员救火”的例子是说明因果颠倒,“冰激凌和鲨鱼”的例子说明没有因果关系(2分)。
17.(5分)【示例】大气层二氧化碳的含量变化和肥胖症人口的数量变化,都受第三个因素——汽车产业形成一定规模——的影响,汽车尾气排放导致大气中的二氧化碳含量增加(3分);同时,人们更多地用汽车代步,活动大大减少,自然肥胖症人口也会增加(2分)。