《魔鬼数学》

1. 学习数学的精髓时不能只抱着应付差事的心理,而应该把这些知识融入日常思维并通过各种激励手段使它们反复出现在你的脑海里。——伯特兰·罗素《数学研究》

2. 飞机弹孔的「幸存者偏差」问题,是犹太数学家亚伯拉罕·瓦尔德在哥伦比亚大学统计研究小组(SRG)工作时遇到、解决的。

3. 数学就是常识的衍生物。——克劳塞维茨

4. 世界上许多问题并不呈现线性关系,因此我们必须考虑到非线性的情况发生。「非线性思维表明,正确的前进方向取决于你当前所在的位置」——用我们更熟悉的话来说,就是「过犹不及」、「中庸」。

5. 「非线性」的一个典型例子就是「拉弗曲线」,由芝加哥大学经济学教授阿瑟·拉弗等人提出。该曲线完美地阐释了人们在高税收政策下怠工的原因。格里高利·曼昆则在前者基础上提出了更极端的可能:「拉弗曲线」甚至是随意振荡的曲线。

6. 阿基米德计算给定圆周长使用的「穷竭法」,其中蕴含着朴素的「微积分」想法,后者由牛顿进一步完善。然而其中的无限小量是违背直觉的事物,和格兰迪级数一样,数学家们最后采用了不同的处理方法,代价是牺牲了它们在算术方面的直观性。

7. 毫无疑问,「线性回归」是非常强力的数学武器,适用范围很广,然而却不总适用——因为不是所有线都是直线(尽管「局部」总是直线)。马克·吐温在他的小说《密西西比河上的生活》里专门嘲讽了滥用「线性回归」,并扣上「科学」帽子的情况。

8. 计算积分或者拟合线性回归,用计算机就能完成,但判断结果是否有意义,或者判断所采用的方法是否正确,离不开人的智慧。乔丹·艾伦伯格信奉这一点:学生在数学测验中算出水壶中有「-4」克水,如果什么都不写他会给零分,写了自己意识到错误但找不到错处则给一半分数。

9. 王烁提到当前教育是「3R」教育,其中之一是「算术(ARismetic)」,因为其结果易于评判。这对考试分数当然令人满意,但是如果仅以此作为数学学习的最终目标,却可能早就数学成绩优秀,但对数学一窍不通的学生。

10. 如果学生学习时说:「我明白这个概念,但是不会做题。」其实等同于「我没弄明白这个概念」。美国诗人威廉·卡洛斯·威廉姆斯说:「凡理皆寓于物。」

11. 数学领域规避错误的一个重要原则是:实地测试某个数学方法时,可采用不同的方式计算。如果得到不同结果,则说明我们使用的方法有问题。

12. 「大数定律」耳熟能详,其本身不会根据已发生的情况干预未发生的情况,而只是削弱已发生情况的影响力,直至其结果从比例上足够小。当然我们也不能忘记,「小样本量」可能意味着巨大的偏差,这样的偏差可能导致我们错误地估计一些情况。

13. 箴言一则:「在数字有可能是负值时,不要讨论它们的百分比。」分类数据有增有减的情况下,使用某类数据的增长额度除以增长净值计算其所占份额,显然是不正确的——用一个数除以另一个数只是单纯的计算,考虑清楚用什么除以什么才是真正的数学问题。

14. 基金公司发行公共基金时,通常会在机构内部持有,过一段时间才向公众开放——所谓的「基金孵化」。通常,公司会同时孵化多笔基金,尝试无数种投资策略与投资额度,最后将那些回报率较好的基金向公众兜售,而收益不佳的则扼杀在襁褓之中。

15. 只要尝试次数足够多,概率极小的事件总会发生,而且小概率事件并不少见。亚里士多德说:「不可能发生的事情也会发生。接受了这个观点之后,我们就有理由认为不可能发生的事情仍然有可能发生。」

16. 关于小概率事件,英国统计学家费舍尔(R.A. Fisher)则有另一个论断:「概率为『百万分之一』的事件如果发生在我们身上,我们可能会感到非常吃惊。但是,无论我们有多么吃惊,这件事都肯定会发生,而且发生的概率不会超过其应有的范围。」

17. 如果试图从小概率事件中得到可靠的参考信息,回旋余地就是应当规避的大敌。另一方面,解读即使标准的统计学检验方法得到的结果时,也应当小心谨慎。

18. 2009 年旧金山召开国际人脑成像组织大会,加州大学圣塔芭芭拉分校的神经学家克雷格·班尼特作了题为《大西洋死鲑鱼对人类神经活动的观察——论多重比较修正的重要性》的会议报告,以此讽刺许多科研人员忽视小概率事件并不少见的情况。而科技文献出版界,阴性结论大多沉默的现实加剧了结论的误读。

19. 自然数是上帝的杰作,而其余的数字则是人类创造的。——代数学家利奥波德·克罗内克

20. 乔丹·艾伦伯格说,很多孩子在两个时间点特别容易放弃数学学习,一是引入分数的时候,二是引入代数的时候。后者成为孩子们哲学观的重大转折点,它教会孩子们两件事:逆向思考问题,以及答案未必唯一。

21. 仅仅证明数据与理论相一致还不够,还要证明数据与反面理论不一致,即排除讨厌的零假设——乔丹·艾伦伯格随即举了个超能力使太阳升起的例子,很说明问题。

22. 约翰·阿布思诺特研究 1629-1710 年伦敦的人口出生记录,发现 81 年间每年都是出生的男孩多于女孩,于是提出问题:如果上帝不存在、新生儿性别随机分布(即零假设),出现这种情况的概率(即 p 值)有多少呢?由于 p 值很小,因此作为上帝存在的证据。

23. 尼古拉斯·伯努利反驳阿布思诺特,提出另一个零假设:新生儿性别随机决定,但男孩概率是 18/35,女孩的概率是 17/35,同样否认了上帝的存在,但与 81 年间的统计数据吻合。可见,零假设其实并不好提,阿布思诺特在自己的假设中夹带了私货。

24. 阿布思诺特已经具备了朴素的「显著性检验」观念,但现代统计学之父费舍尔的贡献则在于把其变成了一种形式主义的手段,借助这套系统性的方法可以客观地分析实验结果的显著性(或非显著性)。然而仅限于此,这套方法并不能向解释什么是真理或者什么不是——这是人们经常忽视的地方。

25. 乔丹·艾伦伯格不喜欢「显著性」这个术语,这个术语本应告诉人们存在某种结果,而不该对该结果的重要性、作用大小妄加评论。他觉得“值得注意的统计结果”、“可以检测到的统计结果”更好,更符合这种研究方法的初衷。

26. 从来没有人在试管中触摸或者看到过灵魂。——心理学家约翰·华生。他认为,科学家需要完成的唯一工作就是观察实验结果,而根本不需要对意识或灵魂提出各种假设。

27. 人们倾向于在不存在规律的地方总结出规律,在存在某种规律的地方又会夸大这些规律的影响力。譬如投资领域,规律真的存在吗?即使存在,真的广泛适用吗?

28. 显著性检验的逻辑基础源自亚里士多德久经考验的论证方法:「反证法」或称「归谬法」。p 值设置阈值则将该形式进一步转为「归为不可能法」——这却不合逻辑了,毕竟「可能性极小」与「不可能」(「基本」一词常被忽视)根本是两码事。p 值极小的情况应该理解为要么小概率事件发生,要么零假设错误。

29. 18 世纪的天文学家、牧师约翰·米歇尔是最早将统计学方法应用于天体研究的学者之一。他的著名研究成果包括通过金牛座一角的一个昏暗星团,证实宇宙里的恒星可能并非随机分布。这个昏暗的星团由 6 颗星组成,日本人称为「Subaru」,现在大家知道为什么汽车品牌「斯巴鲁」的标志是 6 颗星了吧?

30. 1 不是素数,而是零个素数的乘积。于是产生了疑问:为什么零个素数的乘积不是 0 呢?解释有些复杂:先求出某些素数(如 2 与 3)的乘积,然后再将该乘积依次除以所有作为乘数的素数,得到的就应该是零个素数的乘积……

31. 狄利克雷提出的一个古老定理认为,随机数的一个特点便是它们除以 3 后,余数 1 与余数 2 出现的概率相同。

32. 乔丹·艾伦伯格虚构了一本期刊《国际肠卜术杂志》(International Journal of Haruspicy),要求投稿的肠卜僧肠卜预测结果接受同行评议,通过显著性检验才能发表。

33. 由于大众传播(包括科技文献出版界)对统计学显著的偏好,导致某个科学领域对某个假设的证据形成了严重歪曲的观点(所谓的「文件柜问题」)。大家只看到了碰巧成功的那一次实验结果,却没有看到更多的实验以失败告终。

34. 科研人员将费尽心血得到的失败实验数据锁进「文件柜」,需要极强的意志力。于是诞生了一批研究者,通过修改数据(譬如「异常值」)操控 p 值。他们的做法被描述成「对数据严刑拷打,直到它们屈打成招」。

35. 于是科学家们测定期刊文章小于 0.05 的 p 值分布。《国际肠卜术杂志》的 p 值均匀分布,实事求是的杂志 p 值往 0.05 方向向下倾斜,而政治科学、经济学、心理学、社会学等多个领域,p 值分布曲线接近 0.05 时明显向上倾斜。

36. 如果修改数据仍然不能获得令人满意的 p 值,科研人员就会在讨论、结论中精心编排出各种说辞——最煽情的绝对是「在显著性边缘徘徊」……心理学家马修·汉金斯在自己的博客里收集了大量这样的说辞。

37. 费舍尔 1926 年提出:「科学事实被判定为经受住了实验的检验,必须满足一个前提条件:只要实验设计合理,每次得到的结果几乎都能表现出一定程度的显著性。」因此重复实验、阴性结果已经逐渐受到重视。但他提到的「几乎」又是什么意思呢?如果再设置一条一成不变的红线,恐怕重蹈 p 值覆辙了。

38. 如果说 p 值解决的问题是:如果零假设成立,那么观察到某种实验结果的概率是多少?那么不得不经常考虑另一个问题:如果观察到某种实验结果,那么零假设成立的概率是多少?这两个问题截然不同。重新温习一下高敏感度、高特异度检验手段对罕见疾病诊断阳性时,实际的患病概率吧!

39. 重新回到费舍尔的理论:「科研人员不会设一个固定的显著性临界值,然后年复一年,无论情况如何变化,都依据这条红线去推翻各种假设。相反,他们会在证据的启示下,结合自己的想法,认真考虑每一个具体案例。」显然,他保留了一定的贝叶斯推断精神。

40. 荒诞不经但却非常成功的理论大多有一种共性:它们有厚厚的保护层,这些保护层又与许多可观察到的结果并不矛盾,因此很难被打破。

41. 同一个观察结果可能产生多种理论,以偏概全的推断会让人们误入歧途。因此,评估检验结果时,必须重新审视最初的理论假设,是否有一些假设被遗漏了。很多问题上,定量分析存在极限,盲目相信或者随意抛弃某种观点都不是恰当的做法——此时此地,数学应该保持沉默。

42. 17 世纪数学家、哲学家布莱士·帕斯卡在其《思想录》中写到:「『上帝要么存在,要么不存在。』但是,我们到底应该相信哪种观点呢?在这个问题上,推理得不出任何答案。」换言之,数学至少难以证明上帝存在或者不存在。

43. 哈佛大学在 1794 年和 1810 年仅靠销售彩票募集资金,盖起了两栋大楼。这两栋大楼仍在使用,目前是大一新生的宿舍。

44. 乔丹·艾伦伯格始终强调的一点是:数学方法通常是人们天生就会的心算活动的形式化产物,是借助其他手段对常识的扩展。

45. 所有的彩票游戏都有一个共同点:胜算不大。但是也有例外情况,譬如 2005 年一群麻省理工学院的学生发现马萨诸塞州的 Cash WinFall 彩票存在漏洞,在特定情况下每张彩票的期望值高于售价,因此疯狂购买盈利。

46. 在乔丹·艾伦伯格看来,思考数学问题是情绪极端时最好的安抚手段。与冥想一样,数学可以让人们直接接触宇宙,将自己置身于广袤的天地间——「如果不让我钻研数学,我反倒有可能发疯。」

47. 其实早在 18 世纪初,法国政府就发行了一种彩票,由于计算失误,单张期望值大于售价。数学家、探险家查尔斯-马利·拉孔达明发现了这个秘密,于是同那帮麻省理工的学生一样,召集了一群人一起购买彩票——作家伏尔泰也是其中一员,因此挣到了足以安享余生的钱。

48. 「如果你从来没有误过飞机,那只能说明你浪费在机场的时间太多。」——1982 年诺贝尔经济学奖得主乔治·施蒂格勒

49. 施蒂格勒的理论也适用于某些政府行为:「如果我们的政府没有浪费行为,那只能说明他们在反浪费方面花了太多的时间。」

50. 丹尼尔·伯努利使用期望效用理论解决了圣彼得堡悖论;数百年后,丹尼尔·埃尔斯伯格试图使用埃尔斯伯格悖论推翻期望效用理论。后来,唐纳德·拉姆斯菲尔德引入了「已知的未知信息」(风险)、「未知的未知信息」(不确定性),前者可以定量分析,后者可能无法使用形式主义的数学方法分析。

51. 老话说得好:「如果你欠了 100 万美元,那是你自己的问题;但是,如果你欠了 50 亿美元,那就是政府的问题了。」欠款成了「系统风险」,有可能牵一发而动全身。

52. 如果两个投资方案的期望经济价值相同,那么大多数人,特别是流动资产有限的人,会倾向于选择「方差」较小的方案——「方差」表示某个决策结果的分布范围,以及出现极端结果的可能性。

53. 数学史就是一部扩张史——虽然我们不可以盲目相信任何人声称借助数学方法解释、征服、彻底了解这样或那样的事物。

54. 香农在其里程碑性的论文《通信的数学原理》里指出,信号抗噪声干扰的能力越强,传输这条信息的速度就会越慢。噪声的出现,为传输渠道在固定时间内精准传送的信息长度设置了上限,香农称之为通信渠道的信息传输能力。

55. 香农与理查德·海明(海明码蕴含着法诺平面的几何学特征)对错误校正码的研究,极大地推动了信息工程学的发展。无论有什么样的噪声,灵活机动的错误校正码都足以消除它们造成的影响。光盘编码时采用了里德所罗门码,于是光盘表面的擦痕不再有太大影响。

56. 天文学家约翰尼斯·开普敦 1611 年发表论文,认为「面心立方晶格」是最紧密的球体填充方式(形似石榴果实种子的排列形式),但并未给出证明过程。1998 年,托马斯·黑尔斯才利用计算机计算了数千种球体排列方式,证明了开普敦的猜想。

57. 然而,黑尔斯对证明高度依赖计算机深感不安。证明过程越来越复杂,而且相互依赖,即使代码可以验证,也未必表明计算机执行过程完全正确。如果这些都正确,计算机会不会无需人类介入独立完成证明过程,甚至具备思维能力?数学会不会因此消亡?面对 AI,我们总问类似问题,好在我们至今仍跑得更快。

58. 要规避博彩活动的风险,仅凭购买数十万张彩票还不够,必须再选择正确的号码——譬如利用错误校正码。

59. 经营企业同样是胜算不高的「赌博」,收益期望值很大可能小于零。但是人们没有采取更明智、理性的行动,原因之一可能是我们对企业主的尊重程度高于赌徒(我们判断一种行为是否理性时,很难不受到道德观念影响);原因之二(可能更重要)是企业经营的效用与彩票一样,不仅仅通过收益期望值来衡量。

60. 美国西北大学统计学教授、商业研究中心主任霍勒斯·西克里斯特从 1920 年开始收集企业经营的详细数据,1933 年出版专著描述了研究结论:「在竞争激烈的商业行为之中,平庸已成为常态。对数千家公司的成本(开支)与利润研究明显指向这个结论,这是追求产业(贸易)自由需要付出的代价。」

61. 生活中随时间产生起伏变化的任何东西,几乎都可能受到回归效应的影响。

62. 西克里斯特发表专著后,时任哥伦比亚大学教职的统计学家哈罗德·霍特林撰文指出:只要研究的变量同时受到稳定因素和随机性的影响,那么平庸状态的胜利就或多或少是一种必然结果——西克里斯特花费十年时间证明的东西,在他眼中一文不值。

63. 回归效应在时间轴方向是双向的,无论时间向前或向后推移,都会产生相同的影响。

64. 护理界先驱弗罗伦斯·南丁格尔发明了「玫瑰图(coxcomb graph)」,用以说明克里米亚战争中绝大多数英国士兵死于传染病,而非死于俄罗斯人之手。

65. 英国皇家天文学家埃德蒙·哈雷多才多艺,除了观察彗星外,他还替英国国王算过终生年金保险定价,观察过磁北、真北,绘制「等偏线」帮助水手计算两者差值,还驾驶着「帕拉莫尔」号几次横渡大西洋。

66. 从笛卡尔开始,数学家们就热衷于在现实世界的代数描述与几何描述之间来回切换。代数的优势是形式严谨,易于电脑处理;而借助几何学,则可以凭直觉处理眼前的难题,尤其当拥有绘图能力时,这种优势更为明显。

67. 卡尔·皮尔逊完善了高尔顿对「相关性」的定义,使用了复杂的代数公式表述。如果使用几何学语言,则相当简单:两个变量之间的相关性由这两个向量之间的夹角决定:如果是锐角,则向量间正相关,如果是钝角,则向量间负相关,如果是直角,向量不相关——当然也可以使用余弦函数来表达。

68. 相关性不具有传递性。如果相关性具有可传递性,那么医学研究便容易许多,因为几十年来医学研究者已经积累了大量的观察结果和相关数据,知道很多现象之间存在相关性。

69. 最后一点非常重要:不相关不代表没有任何关系——相关性主要探讨的是变量间的线性关系,只是有些线不是直线,有些关系不是线性关系。数学工具与所有科学工具一样,不可能适用于探究所有现象。

70. 相关性易于证实,但其是否由因果关系所致,难度极大——吸烟与肺癌间关系即是一例证据,现代统计学奠基人费舍尔在该问题上以无可辩驳的思维逻辑,坚定地站在了两者无因果关系的这一边。

71. 科学研究允许存在不确定性,但公共决策的制定者们却没有这种权力,他们必须作出最准确的预测,然后在此基础上做出决策。决策者们或许可以计算决策的结局期望值,但他们通常只有一次选择机会。假如他们一定要等到十拿九稳时才制定策略,那就跟「候机时间过长」一样,在及时决策这方面做得不够了。

72. 医学统计学家约瑟夫·柏克森也质疑吸烟与肺癌存在因果关系的观点:「癌症是生物学问题,而非统计学问题。阐述癌症问题时,统计学可以发挥非常好的辅助作用,但如果生物学家听任统计学家在生物学问题上指手画脚,必然会给科学带来灾难。」他提出的「柏克森悖论」演示了相关性由共同结果所致的一种可能。

73. 民意通常充满矛盾与不确定性,甚至大多数时候是根本不存在的东西——更准确地讲,只有在大多数人意见一致时民意才会存在(仍然必须注意细分立场)。

74. 如果在方案甲与方案乙之间做选择,第三个方案丙出现,不会影响人们对甲和乙的倾向性,数学上称为「无关选项的独立性」。然而很多时候第三个方案(尽管无关)都会对前两个方案的倾向性造成微妙的影响——法国数学家让-查尔斯·波达使用数学手段解释了该现象:「与问题有关的信息不应该排除在外!」

75. 这种现象叫做「非对称性支配效应」,是一种非理性表现——经验告诉我们,个人不可能完全理性。

76. 1924 年,斯特凡·巴拿赫与阿尔弗雷德·塔斯基发现,把一个球体分成 6 块之后,通过移动可以重新拼成与之前球体大小相同的两个球体——当然,这些碎块具有无限复杂的形状,在自然世界中无法实现。

77. 马克·吐温说:「电报、蒸汽机、留声机、电话等重要发明,往往需要成千上万人的努力,但得到荣誉的总是取得最后胜利的那个人,而其他人则被忘得一干二净。」包括数学在内的科学研究,都需要这样的「成千上万人」。

78. 乔丹·艾伦伯格在最后一部分讨论了孔多塞、希尔伯特在各自领域构建「形式主义」的尝试,并向其它领域积极推广的努力。尽管阿罗、哥德尔等人又相继粉碎了他们的理想,但他们的思想、工具未必不能成为「凸显人类才能」、「引导其应用」(孔多塞语)的手段。

79. 美国总统西奥多·罗斯福 1910 年在巴黎索邦大学作了演讲《一个共和国的公民意识》,大力赞扬「实干家」,批评「严重脱离实际」、「整天泡在图书馆里」、「对政府如何管理指手画脚」的「批评家」。他的观点是错误的,因为行为的结果充满不确定性,数学则提供了表达不确定性的公平、公正方式。

80. 乔丹·艾伦伯格在结语里语重心长地重申了几点:不确定性普遍存在;不必过于计较精确性;接受矛盾(悖论)存在;以及数学是常识的衍生物,我们一直都在使用它。

(0)

相关推荐