赌徒谬误:赌博与大数定律

先讲一个赌场捞金的故事。

很多人都听说过概率或统计中的蒙特卡罗(Monte-Carlo)方法,说白了就是利用大量数据在统计的基础上进行计算的方法。

蒙特卡罗不是人名,是法国边上一个袖珍小国摩纳哥中著名赌场的名字。自从蒙特卡罗赌场于1865年开张后,摩纳哥从一个穷乡僻壤的弹丸之地,一跃而为欧洲最富有的国度之一,至今已经150年过去,这个国家仍然是以赌场和相关的旅游业为主。

(蒙特卡罗赌场。图片来自网络)

那年代有一个名叫约瑟夫·贾格尔(Jaggers)的英国人,是约克郡一个棉花工厂的工程师,在摆弄加工棉花的机器之余,经常光顾蒙特卡罗赌场,特别感兴趣那种38个数字的轮盘游戏(图1-1-5)。

贾格尔毕竟是位优秀的机械工程师,脑袋中的弯弯绕绕比一般赌徒要多一点。他想:这轮盘机器在理想的情况下,每个数字出现的概率都是1/38。但是,机器怎么可能做到完美对称呢?任何缺陷都可以改变获奖号码的随机性,导致转盘停止的位置偏向某些数字,使这些数字更为频繁地出现。因此,赌徒应该可以利用这种偏向性来赚钱!

于是,在1873年,贾格尔下决心要改变自己的命运,他带上他所有的积蓄,前往蒙特卡罗赌场,雇用了六个助手,每个助手把守一个轮盘机器。白天,赌场开放了,助手们用贾格尔供给他们的“赌币”,让轮盘不停地哗啦哗啦转!不过,他们并不在乎输赢,他们的任务是记下所把守的轮盘机停止时的每一个数字。然后,到了晚上赌场关门后,贾格尔便在旅馆里独自分析这些数字的规律。

(图片来自网络)

六天后,五个轮盘的数据没有发现有意义的偏离,但第六个轮盘为贾格尔带来了惊喜:38个数字中有9个数出现的概率显然要比其余的频繁得多!贾格尔兴奋不已,第七天他前往赌场,认定了那台有偏向性的轮盘机,大量投注这九个频率高的数字:7,8,9,17,18,19,22,28和29。这种方法使贾格尔当天就赚了7万。

不过,贾格尔没高兴几天,事情便引起了管理人员的注意,经理们采取了各种方法来挫败贾格尔的策略,最后贾格尔无法赚更多的钱,便离开了赌场,带着已经到手的巨款,投资房地产去了。

(图片来自网络)

赌场中的确有极少数的人像贾格尔那样偶然幸运地赚了一笔,但更多的赌徒是十赌九输,一直到输光为止。

这其中的原因有两个:一方面是因为所有赌场游戏的概率设计本来就是以利于赌场为准,让赌场一方赢的概率为51%,52% ,玩家赢的概率为49%或48% ,如此设计的赌场才能包赚不赔。另一方面,利用赌徒的心态也是赌博游戏设计者们的拿手好戏。赌徒谬误便是一种常见的、不符合概率规则的赌徒错误心态,经常被赌场利用。

赌徒谬误(The Gambler's Fallacy)

赌徒谬误的来源是因为将前后互相独立的随机事件当成有关联而产生的。怎么样算是独立的随机事件呢?比如说,抛硬币一次,是一个随机事件。再抛一次,是另一个随机事件。两个事件独立的意思是说,第二次的结果并不依赖于第一次的,互相没有关联。

(图片来自网络)

假设硬币是理想对称的,将出现“正”记为1,“反”记为0,那么,每次结果为1和0的概率都是1/2。第二次“抛”和第一次“抛”互相独立,再多“抛”几次也一样,每次的“抛丢”事件互相独立,出现1和0的概率总是“1/2,1/2”,都和第一次一样。即使硬币不对称,比如两面之概率可能是“2/3,1/3”,也并不会影响每次投丢的“独立性”,每次得到正面的概率都是2/3,并不受上一次结果的影响。

道理容易懂但有时仍会糊涂。比如说,当你用“公平”硬币接连抛了5次1,到了第6次,你可能会认为这次“1”出现的概率会更小了(< 1/2),“0”出现的概率更大了(> 1/2)。也有人是逆向思维,认为既然5次都是1,也可能继续是1(也被称为热手谬误)。实际上这两种想法,都是掉进了“赌徒谬误”的泥坑。也就是说,将独立事件想成了互相关联事件。

(图片来自网络)

事实上,一般来说,硬币每次的结果,并不影响下一次正反的概率,硬币没有记忆,不会因为前面5次被抛下时都是正面在上就会加大(或减小)反面朝上的概率。也就是说,无论过去抛出的结果如何,每一次都是第一次,正反出现的几率都是1/2。

另外,还有生男生女的问题,也很容易产生谬误,比如有对父母接连生了4个女孩儿,就觉得第5个是男孩的可能性增大了。但事实上,第5个是男或女的概率仍然是50%对50%,并不因前面4个都是女儿而改变。这些都是与“赌徒谬误”类似的迷思。

还有一个笑话:某呆子上飞机时身上带了个炸弹,问其原因,答曰:飞机上有1个炸弹的几率是万分之一,同时有两人带炸弹的几率就是亿分之一,我自己带上一个(绝不爆炸!),便将飞机上有(将爆)炸弹的概率从万分之一降低到了亿分之一!想必你看到这儿,一定会抿嘴一笑。是啊,能不笑吗?此呆子将“自己带炸弹”与“别人带炸弹”的独立事件视为相关,呆子非赌徒,但这也算是一种赌徒谬误。

(图片来自网络)

当然,认为每次抛硬币是互不关联的独立事件,或每一胎生男生女是独立的,也只是我们描述某些随机事件所使用的数学模型而已,物理世界中的此类事件并不一定真正独立。比如说到生男生女的问题,也许有某种与荷尔蒙有关的原因使得前后两胎的性别有所关联,也不是没有这种可能性的。

但是,如果有关联,也要明白是如何关联的?应该使用何种模型来描述这种关联?那是另一种类型的研究课题,而赌徒谬误指的则是将基本上没有关联的随机事件,以为有关联来考虑问题而产生的谬误。

图1-5-1:赌徒谬误

赌徒有了“赌徒谬误”的心态,会输得更惨。比如说,赌场中著名的输后加倍下注系统(Martingale)便是利用赌徒谬误的例子。赌徒第一次下注1元,如输了则下注2元,再输则4元,如此类推,直到赢出为止。赌徒以为在连续输了多次之后,胜出的概率会非常大,所以愿意加倍又加倍地下注,殊不知其实概率是不变的,赌场的游戏机和通常抛丢的硬币一样,没有记忆,不会因为你输了就给你更多胜出的机会。赌徒或是因为不懂概率,或因为人性的弱点,往往自觉或不自觉地陷入赌场设置的陷阱中。

赌徒谬误不仅见于赌徒,也经常反映在一般人的思维方式中。人们在预测未来时,往往倾向于把过去的历史作为判断的依据,也就是说,根据某事件曾经发生的频率来预言事件将要发生的可能性。中国人说“风水轮流转”,这句话很多时候反映了现实,但如果将这种习惯性的思维方法随意地应用到前后互相独立的随机事件上,便成为了赌徒谬误。

(图片来自网络)

即使明白地认识到“赌徒谬误”的错误,许多人仍然会犯糊涂而陷于其中。就数学原因而言,有几个容易混淆的概念,下面我们仍然用抛硬币实验来说明。

有人说:如果连续4次都是出现正面,接下来的第5次还是正面的话,就接连5次都是正面,根据概率论,连抛5次正面的几率是1/25=1/32。所以,第5次正面的机会只有1/32,而不是1/2。

以上论证是混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,前者等于1/32,后者却是1/2。

(图片来自网络)

前者指的是:在硬币第1次抛出之前,如果预测接连抛5次的各种可能性,共有25=32种不同的排列情形,等效于从00000到11111的32个2进制数。每一种情形出现的几率均为1/32。

后者指的是:已经抛了4次均为正面,那么,4次的结果已经固定了(1111),没有再选择的机会。剩下的第5次,可能是1或0,即总结果只有两种:11111或11110,各占1/2。

误用大数定律

赌徒谬误产生的另一个原因是对“大数定律”的误解。

首先要说说大数定律是什么。如果要用一句通俗的话来概括的话,大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率。

对一枚对称硬币而言,正面的预期概率是1/2。当我们进行n次实验后,得到正面出现的次数n正,比值p正 = n正/n,叫做正面出现的频率,频率不一定等于概率(1/2),但是,当n逐渐增大时,频率将会逐渐趋近1/2。

(图片来自网络)

掷骰子的情形也类似,掷100次,数目为1的面也许出现了20次,即出现1的频率是1/5;如果掷了10000次之后,1出现了1900次,那么这时出现1的频率是1900/10000=19%。如果这个骰子是6面对称的,出现1的频率会随着投掷次数的增加而趋近于1/6,即预期的概率。也就是说,频率取决于多次实验后的结果,而概率是一个极限值,实验次数增大,频率趋近概率,这就是大数定律。

赌场赚钱的秘诀也是在于大数定律。赌博机一般被设计为“51% :49%”的预期概率,赌场赢的概率至少51%。因此,赌场永远不会和你进行“一锤子买卖”的交易,他们只需要多多地、不停地招揽顾客,然后,随着赌博机咕噜咕噜转动,硬币叮当叮当落下,赌徒们以为自己要赚大钱了,老板们却心中暗喜,静等大数定律显示威力,他们则坐收渔利。

提出并证明了大数定律最早形式的是瑞士数学家雅各布·伯努利(Jakob Bernoulli ,1654-1705),雅各布是概率论的重要奠基人。

(雅各布·伯努利。图片来自网络)

大数定律发表于他死后8年,即1713年才出版的《猜度术》中,这本巨著使概率论真正成为数学的一个分支,其中的大数定律和稍后狄莫弗(A.de Moivre)和拉普拉斯(P.S.Laplace)导出的“中心极限定理”,是概率论中极其重要的两个极限定理。

有一个所谓墨菲定律:“凡事有可能会出错,就一定会出错!”就是说,如果暂时没出错,也只是时间问题。大数定律体现了类似的意思:当试验次数足够多时,事件发生的频率终究会趋于它的概率。次数n趋于无穷,概率小的事件也会发生。换言之,一件事情,只要有发生的概率,那么随着重复次数变多,就几乎一定会发生。

(墨菲定律。图片来自网络)

上面的说法也基本上是略知大数定律的赌徒们的说法,这种说法理论上没错。错在对“多次重复”的理解。多少次试验才算“足够多”,才到达大数定律能够实用的大样本区间呢?此问题的答案:理论上是无穷大,实际中难以定论。大多数情形是:还没到“足够多”,该赌徒便已经财力耗尽、赌注输光、两手空空了!

有人喜欢买彩票,并且在每次填写彩票时,要选择以往中奖号码中出现少的数字,还振振有词地说这样做的依据是大数定律,某个数字过去出现得少,以后就会多呀,为什么呢?“要满足大数定律啊!”,可见对大数定律误解之深。

图1-5-2:雅各布·伯努利和大数定律

某些赌徒思维的误区,便是将大数定律应用于试验的小样本区间,将小样本中某事件的概率分布看成是总体分布,以为少数样本与大样本区间具有同样的期望值,把短期频率当成长期概率,或把无限的情况当成有限的情况来分析。实际上,这是在错误应用大数定律时的心理偏差,因此被心理学家卡尼曼和特维尔斯基戏称为“小数法则”。事实上,任何一段有限次的试验得到的频率对于足够多次的试验的频率几乎没有什么影响,大数定律说的是总频率趋近于概率值,如图1-5-2b所示,小样本区间试验的结果并不影响最后趋近的概率。

发现大数定律的雅各布·伯努利所属的伯努利家族,当年在欧洲赫赫有名,是世界颇负盛名的科学世家,出了好几个有名的科学家,驰骋影响学界上百年。雅各布和他的弟弟约翰·伯努利(Johann Bernoulli,1667-1748),都是那个时代著名的数学家。此外,学物理的人都知道流体力学中有一个著名的伯努利定律,说的是有关不可压缩流体沿着流线的移动行为,是由雅各布的侄子丹尼尔·伯努利(Daniel Bernoulli,1700-1782)提出的。

(伯努利家族。图片来自网络)

有意思的是,伯努利家族这几个科学家之间,相处得并不和谐。互相在科学成就上争名夺利、纠纷不断。尤为后人留下笑柄的是约翰·伯努利,他与比他大十几岁的哥哥雅各布之间进行激烈的兄弟之争。

事实上,雅各布还是约翰走进数学大门的启蒙老师,约翰进入巴塞尔大学时,雅各布已经是数学教授,但两人互相嫉妒明争暗斗。不过,无论如何,伯努利兄弟的你争我斗实际上也推动了变分法、泛函分析、概率论等数学领域的发展。之后没过几年,哥哥雅各布就去世了。

弟弟约翰却似乎过不了没有竞争对手的日子,他继而又把对雅各布的嫉妒心转移到了自己的天才儿子丹尼尔·伯努利的身上,据说他为了与儿子争夺一个奖项把丹尼尔赶出了家门,后来还窃取丹尼尔的成果据为己有。伯努利家族更多的故事不在这儿讲,只付诸一笑。

(摘自《从掷骰子到阿尔法狗:趣谈概率》)

#真相来了#

(0)

相关推荐