为什么真正聪明的人,都是概率高手?(深度好文 !)
追问“为什么”,是概率计算的“第一性原理”,一旦做到了这一点,你就是真正聪明的概率高手。
1
懂概率的3个层级
懂得概率的人,才是真正聪明的人。
因为这个世界,不管是世俗层面,还是宇宙层面,都是依照概率运行的。
至少,概率包裹着人类的无知的最外面那一层。
然而,这个世界上极少有人真的懂概率。
我把“懂概率”分为3个层级:
层级一:懂概率计算;
层级二:懂概率思考;
层级三:懂概率行动。
这三个层级未必是递进的关系。
a、你是概率计算高手,也会艰深的概率思考,但未必一定是个概率行动高手。即使天才如凯恩斯,也是历经多年磨难,才最终跻身“层级3”。
b、有些人压根儿不会基本的概率计算,也不知道什么叫概率思维,但天生就是概率行动高手。例如那些德州扑克高手,交易员鬼才等等。
这或者是因为他们小时候的生活环境是个天然的概率训练场,或者是因为大脑本身就是一个概率机器。
有多少人懂得概率计算?
大约1%吧,实话说可能更少。
懂得概率计算的人里,有多少人懂得概率思考?
再来个1%。
懂得概率思考的人里,有多少人懂得概率行动?
还是1%吧。
不过,这么一算,全世界没多少人真正懂得概率行动了,而且这样计算也违背了我上面所说的,有些人天生就会概率行动而无需会计算。
所以,修正一下,把后面的两个1%改成10%,于是可以得出,有意识的概率行动者,大约万分之一。
也就是说,在千万级人口的城市里,有几千个“概率高手”。
你可能会说,不对吧,北上广深这些千万人口城市,每个地方光是亿万富翁都不止几千个吧?
有钱人虽然多,但很多只是靠运气,属于“随机漫步的傻瓜”,而非概率高手。
2
层级一:概率计算
假如想应对这个世界上的不确定性,与随机性共舞,你必须懂得概率计算。
那么,一个普通人到底要掌握多少概率公式,才够用呢?
我的答案是:零。
没错,你一个公式都不用记,爱因斯坦说:
“科学知识不是大量莫名其妙的结论,它是每个人按照正确的思维方式自己应当并且也能够推导出的结论。学习科学的过程,就是自己得出这个结论的过程。”
概率的公式本来就很简单,假如你能够拆掉这些公式,自己从头推导,你就永远不用去记这些公式。
对于那些熟悉概率公式的人,我也建议你一起来一次“从头推导”,这样你就会发现,几乎可以解决所有的“难度达到硅谷面试题级别”的概率趣题,绝对横扫“俗人圈儿”。
如何从头推导?
我想和你分享的是“平行宇宙法”。
比方说,我们扔一个标准的六面骰子,众所周知,你得到任何一个面的可能性都是1/6。
但是很多人即使懂得这个简单的道理,也没法从感官上理解,他会想:骰子落地,只会100%是某个数字,1/6有什么意义呢?
就像我有次和一个朋友聊特斯拉电动车的自燃率,我告诉他根据行驶里程,特斯拉官方公布的自燃率比燃油车低500%。
这个朋友说:“不管你特斯拉总的自燃比例有多低,(一旦发生)对任何一个车主而言就是100%……电动车自燃也许是小概率事件,但对涉事车主来说,却是百分百的噩耗。”
这就是聪明的概率无知者。
其实特斯拉的说法也有漏洞,因为他们应该和同等车龄同等级别的车对比,才够公平,不过,这个就是更聪明的人才能提出的问题了。
回到我们的“平行宇宙法”。
一个骰子在你扔出的瞬间,现有的宇宙分裂成了6个平行宇宙,如下:
所以,尽管现实中,看起来骰子落地的时候,只会是某个确定的一面朝上,但是当你(不作弊地)随机扔出骰子的时候,骰子的未来就分裂成了6个平行宇宙,分别是骰子落地之后的6个结果:1,2,3,4,5,6。
但是,我们的现实,只能选择6个宇宙中的一个。
因为标准骰子的六个面是一样的,所以6个宇宙平分了“未来的可能性”。
所以某一面出现的可能性,也就是概率,是1/6。
那么,扔一个骰子,得到偶数的概率是多少呢?
把2、4、6三个平行宇宙的三个1/6加起来,等于1/2。
懂得概率计算的人,一定会对我如此啰嗦表示不屑,请坚持一下,再往下看。
3
平行宇宙论
“平行宇宙论”,也叫多重宇宙论,或者叫多元宇宙论,指的是一种在物理学里尚未证实的假说。
在我们的宇宙之外,很可能还存在着其他的宇宙,而这些宇宙是宇宙的可能状态的一种反应,这些宇宙可能其基本物理常数和我们所认知的宇宙相同,也可能不同。
“多重宇宙”这个名词,是由美国哲学家与心理学家威廉·詹姆士在1895年所提出的。
平行宇宙经常被用以说明,一个事件不同的过程或一个不同的决定的后续发展,是存在于不同的平行宇宙中的。(以上来自维基百科)
我个人对平行宇宙的理论不太感冒,但觉得用它来描述概率,非常直观。
而且,这能够让我们从哲学和“实在”层面,去理解概率里的“发生”和“未发生”。
例如,假如一件事情发生的概率是80%,但结果这件事情并没有发生,很多人会据此怀疑概率的意义。
借助于平行宇宙的理论,我们就能说,除了要验证80%发生概率的精确性,可以认为我们掉进了20%“不发生”的平行宇宙,这并不奇怪。
最近有位物理学家认为,我们处于上层宇宙的一个黑洞中。
这个新观点颇让人震惊,我们所知的宇宙,可能是从其他宇宙里面的“黑洞”诞生而来,大爆炸就是一个黑洞“炸出”另一个宇宙的过程。
我们对于充满不确定性的未来,对自己似乎“命中注定”的命运,对于比电影还要精彩(或是“还要悲催”)的现实,不可避免地会有一些疑惑和感慨。
4
让我们回到现实世界的概率话题。
现在我们把问题变成扔两个骰子,请问扔两个骰子,得到两个6的可能性是多大?
太简单了,1/6 X1/6=1/36,但是为什么要这么计算呢?
我知道你懂“两个独立事件A和B同时发生的概率等于A发生的概率和B发生的概率的乘积”,可我们说好了不用公式的呀。
所以,让我们继续用平行宇宙的可视化计算法,扔两个骰子,其实是它们的宇宙分裂了两次,如下图:
第一次:扔第一个骰子时,宇宙分裂成了六个(绿色);
第二次:扔第二个骰子时,每个绿色的宇宙又分别分裂成了六个(蓝色)。
于是我们得到了36个平行宇宙。
现在我们来找一下,在36个平行宇宙里,有多少个是两个骰子都处于6的状态。
答案是只有一个(在右下角),所以,得到两个6的可能性是1/36。
用“平行宇宙法”,看起来复杂,但直观,而且可感知,这正是爱因斯坦所说的:
每个人按照正确的思维方式,自己应当并且也能够推导出的结论。
更关键的是,我们可以用这种零公式的方法,来解答更难的题目。
有些读者会问我数学题,例如下面这个:
这个问题看起来简单,我猜90%的人不会做,会做的那10%,其中可能只有1%能说明白为什么这么做。
让我继续采用“平行宇宙法”清清楚楚地算一遍。
如题,因为1也可以是3,所以我们可以把问题简化,单个骰子得到3的概率是2/6=1/3,在下图中:
用红球来标记1和3,出现的概率是1/3;
用黑球来标记其他可能,出现的概率是2/3;
扔三个球,作为独立事件,相当于爆炸了三次,如下图。
分裂了三次之后,一共产生了3X3X3=27种可能。
我们来检查一下,这27个平行宇宙中,有多少个是两个红色球?
如图,从右侧回溯到左侧,每条线上的三个球,就是该平行宇宙下的三球分布。
其中,画红钩的6个符合条件,所以答案是:6/27=2/9。
我们也可以用排列组合法来做:1/3X2/3X1/3X3=6/27=2/9。
但我们说了,不用一个公式。
(开始提问者后半截的问题,摇骰子,得到三个3(1也可以是3)的概率是1/27。)
5
下面这道题,已经进入高手级别了,但是我们依然不用任何公式。
更好玩儿的是,你甚至可以用下面这道题让普通人迷惑的地方,在酒吧里和人“打赌”。(当然,不是真赌哈。)
帽子里有三张卡片,一张两面都是红色(“红-红”),一张两面都是白色(“白-白”),一张一面红色一面白色(“红-白”)。
从里面随机抓出一张卡片扔向空中,落地后红色一面朝上,问:这张卡片是“红-红”的概率是多少?
请你准备三张纸片,写成上面的样子,以便更直观地思考。
看起来很简单啊,根据已有信息,这张牌要么是(“红-红”)那一张,要么是(“红-白”),二者出现的可能性是一样的,所以是“红-红”的概率是50%,不是吗?
正确答案是:2/3。
正确的问题表征是根据卡片的面,而不是整张卡,所有结果的样本空间包括六个事件——每张卡片的每一面各为一个事件。
由于红色的一面向上,因此在“有效样本空间”中共有三个事件:红白(红面向上)、红-红(一个红面向上)、红-红(另一个红面向上)。
因此正确答案是 2/3——三个等概率事件中,其中两个是红-红。
我们的错觉在于,红-红这张牌每回只能出现一次,为什么其两面可以“拆”成两个独立事件呢?
我们用穷举法,以“概率树”的形式,也就是我们上面所说的“平行宇宙法”,加上书中的配图(如下),更容易理解:
三张牌可以分裂成(上图右侧的)6个平行宇宙,牌面是红色的有3个,这3个中,有2个是红-红牌。
你看,这道题看似非常简单,能答对的人极少,而且会有人看了答案都不服,最好的办法就是做三张牌,实际玩儿上几把,不服就来真的。
6
其实,“平行宇宙法”就是一种穷举法。
只不过我把动态过程加进去,因为有了时间、空间,以及“分裂”这个动作,我们就可以让这个计算过程可视化,可感知。
这样一来,也就更可以在“为什么”的基础上思考。
“为什么”是一个非常伟大的词汇,本系列文章的后两篇,“为什么”是主角之一。
追问“为什么”也是概率计算的“第一性原理”,一旦做到了这一点,你就是真正聪明的概率高手。
能否进行概率计算和思考,的确是评判一个人是否真聪明的硬指标。
1968年夏天,爱德华·O·索普遇见了沃伦·巴菲特共进晚餐。
索普是一位数学家,曾经在赌场攻克了21点游戏,后来又在资本市场上大展身手,是量化金融的先驱。
两个聪明人在一起自然要过招,巴菲特决定考验一下索普,题目如下。
有三个奇异骰子,每一个骰子最多有2个或3个不一样的数字。
用这些特殊的骰子来玩1个赌博游戏:
你可以选这3个中“最好”的那个,而我拿剩下的2个中“最好”的。
我们一起掷出,数字大的获胜。
即便你选择了那个你认为“更好”的骰子,我也总是能够从平均统计值上战胜你。
对绝大部分人来说,这里最不可思议的一点在于,根本不存在所谓“最好”的骰子。
坦率说,这个题目让许多人困扰,因为他们认为应该遵守数学上所谓的传递规则:若A优于B,B优于C,则A优于C。
索普答出了巴菲特的难题。
如果骰子如下:A的六面数字是(3,3,3,3,3,3),B是(6,5,2,2,2,2),C是(4,4,4,4,1,1),那么统计平均显示,A对B的胜率有2/3,B对C有5/9,C对A有2/3。
所以说,这是三个非传递骰子,不管你先选哪一个,我都能找出一个在概率上赢了你。
什么意思呢?我们继续用基于“平行宇宙法”的穷举法,来证明索普的结论。
只是我不再能画成简单的分叉图了。
以B对C为例,示意如下:
横向的红色,是B的六种可能。
纵向的蓝色,是C的六种可能。
二者对决,36个格子就是36种可能,也就是说,会有36个平行宇宙。
这当中,红胜20次(打红钩的情况下),所以B的胜率是20/36=5/9。
你看,全世界最聪明人的难题,也不用一个公式,就能够解得清清楚楚。
7
概率计算,普通人只要知道这么多,就够了吗?
几乎是,但最好再加上另外一种,就更完整了,我们先来一道传说中的谷歌面试题:
假设在一段高速公路上,30分钟之内见到汽车经过的概率是0.95,那么在10分钟内见到汽车经过的概率是多少?(假设缺省概率固定)
解题思路如下:
1、可以把30分钟的这个结果,当作是三个10分钟的叠加,就像扔三个骰子一样;
2、30分钟之内见到汽车经过的概率是0.95,可能是经过一辆车,也可能是几辆车,所以我们就倒过来想,30分钟见不到任何车的概率是0.05。
3、30分钟见不到任何车,意味着三个10分钟,连续都见不到任何车,我们假设每10分钟见不到车的概率是y。
所以,这三个10分钟同时发生见不到车的概率,就是yXyXy,原理和上面第“4”节的思路一样。
因此在10分钟内见不到任何车辆的概率,是0.05的立方根。
而在10分钟内见到一辆车的概率,则为1减去此立方根(因为“见到车”和“见不到任何车”的可能性之和为100%)。
答案是大约63%。
类似思路的“用1减”,最有名的题目就是所谓的“生日悖论”:
如果在一个房间,至少要有多少人,可以令“其中某两个人的生日是同一天”的概率大于50%?
答案是23人,这个数字远比直觉要低得多。
我很早以前喜欢拿这个错觉和人打赌,赢了好多回。
具体计算方法也不难,简述如下:
1、这个问题也要倒过来想,计算连续多个人生日都不重合的概率;
2、我们假设人们是按顺序一个个进入房间,第一个人随便占了365天的一天,概率是365/365;
3、第二个人只有占剩下364天的一天,才能不和第一个人重合,概率是364/365;
4、依次类推,第三个人只有占剩下363天的一天,才能不和前两个人重合,概率是363/365;
……
前五个人生日完全不重合的概率是:
1×364/365×363/365×362/365×361/365=97.3%。
也就是说,看起来似乎不重合的可能性很大,但是随着人数的增多,不重合的可能性加速降低。
这有点儿像另外一种形式上的“复利效应”。
当人数达到23的时候,不重合的概率已经低于50%了;
当房间里有50人时,至少有两个人生日重合的概率已经高达近97%了。
类似的算法,还可以用来在饭桌上打赌,至少有两个人是同一个星座。
请问,饭桌上有几个人的时候,你愿意和别人打这个赌?
即使我宣称了“零公式”,你能坚持看到这里,也很不容易,但绝对是值得的。
据科学家说,人类的大脑可能天生就是一个懂得贝叶斯概率算法的机器。
但只是一个隐形的机器。
事实上,人类很晚才懂得如何计算概率,所以人类大脑很难对概率计算形成直觉判断。
计算机、大数据、人工智能的加速发展,以及金融市场和全球化经济的进程,令概率成为现代人必备的“底层算法”。
好文,值得你一读再读
作者简介:老喻,出版新书《人生算法》,孤独大脑,可能是最烧脑的公众号,公众号:孤独大脑(lonelybrain)