一道数学题说明:人类有多不擅长概率思维?
文/CxEric
昨天在雪球发了一个概率题,题目如下:
假定存在某种疾病,每1000人中就有1人患上该疾病;该疾病可以被检测出来,检测准确率为99%。如果一个人已被测出是阳性。问:他真的得了该疾病的概率是多少?
题目链接:网页链接
很多朋友给出的答案是99%。
但正确答案是:约9%。
一、解题过程
这个题目有多种理解方式,我提供两种计算思路,不一定是最佳思路。
第一种,是正儿八经地画概率树。
这个图是我随手画的,非常简陋,大家凑合看就好。
如图所示,显示阳性有两种情况:
1、有病——阳性,即【真阳性】
其概率为:0.001x99%=0.099%
2、没病-阳性,即【假阳性】
其概率为:0.999X1%=0.999%
题目给定条件是【已知阳性】,求在此条件下:【真阳性】的概率。
计算过程是:
0.099%÷(0.099%+0.999%)=9.016%
第二种,是一种简便算法。
假定有1000人,其中有1生病,其余999人为健康。
因此:
测出真阳性的人:1人
测出假阳性的人:999X1%=9.99
因此,当已知阳性,求此条件下真阳性的概率是:1/(1+9.99)
如果四舍五入,将9.99视为10,就会算出1/11(约9.091%)
如果不四舍五入,就会算出来:约9.099%
上述两种算法得出的结果都是约为9%,与直觉反应出来的 99%相去甚远。
这里的关键是,能否理解这是一个条件概率,随着【已知阳性】这个条件的出现,概率分布已经出现巨大改变,不能再按照直觉而去推断。
二、这个题目的启发
我昨天发这个贴的时候,其实关注点不是在题目本身,而是想以此说明,人脑其实天生不擅长理解随机性、概率这些东西,更别提以概率的方式来处理【预测】问题。
这个题目只是一个简单的条件概率模型,其难度最多是高中数学水平,但第一次就给出正确答案的人的很少。
昨晚一个有趣的现象是:
一个数学系毕业的朋友,给出的第一个答案是:99%;
一个统计学毕业的朋友,给出的第一个答案是:99%。
——太有趣了,数学很好的人也会被坑。
另一个有趣的现象是:一旦我告诉他们答案不对,很多人第二或第三次就能给出正确答案。
这个例子充分说明了卡尼曼在《思考快与慢》里说的,人脑思考问题有两个系统:
系统1:它的运行是无意识且快速的,完全处于自主控制状态,无法关闭。
系统2:它需要将注意力转移到需要费脑力的活动上来,它的运行通常与行为、选择和专注等主观体验想关联。
人类只有遇到觉得困难的问题、系统1碰壁的时候,才会调动系统2。
所以,昨晚没有答对的朋友大部分是低估了题目的难度,试图直接用系统1来解决问题,但在碰壁后,才认真起来,启用系统2,认真计算了一次。
我完全相信,如果他们不是在手机上看题目,而是拿着纸笔坐在考场,这个题目对他们来说就是湿湿碎而已。
三、概率题目与投资
最后,问题来了。
如果面对这么简单的概率模型,人脑都容易下意识给出一个错的离谱的答案(99% VS 9%),那在现实生活中、在股票投资过程中,人脑对概率的估计,又有多少成把握呢?
我相信,投资者总是过于高估自己的预测能力,其根源是人脑无法很好地理解随机性、概率思维。
一个常见现象是,投资者容易认为:在某时某刻,某股的下跌概率只有30%,但是上涨概率有70%。——这种概率估算有什么依据吗?有什么逻辑和计算吗?没有,就是拍脑袋而已。
另一个常见现象是,投资者和财经媒体,非常热衷于统计历史上“XX事件发生后次日的大盘涨跌的数据”,以此计算出一个【概率】,用来预测第二天大盘的涨跌概率。
比如,历史上某事发生了10次,其中有7次第二天大盘是跌的,于是媒体就会宣称,由于今天发生了该事件,因此明天大盘有70%的概率是跌的。
这是我见过最扯的概率计算,连高中生都不会接受。我建议读者无视这类“概率”分析。
此外,在玩这个游戏过程中有两点启发:
1、如果你低估问题的难度,你会更依赖系统1,这增加了你掉坑的概率;
2、不要太相信自己的概率估计,不要太相信自己对未来的预测(哪怕你已经觉得自己深思熟虑)
四、题目来自塔勒布
这个题目是我昨天在看Nick Sleep 的资料时看到的,但他又是从塔勒布那看到的。
塔勒布在《随机漫步的傻瓜》中,给出了一道一模一样的题目。
“我在行为研究的文献中至少找到偏差十分严重的40个例子。以下是个很有名的测验,也是叫医学界尴尬不已的实例。接下来的问题是给医生做的,引用自本内特写得非常好的一本书,叫做《你赌对了吗?》。
检验某种疾病时有5%的概率产生误报。全部人口有1‰的概率罹患这种疾病。不管是否怀疑罹患这种疾病,随机检测一群人之后,发现有个病患的检测结果呈现阳性,那么这位病患染上这种疾病的概率有多少?”
塔勒布给出的答案如下:
“大部分医生只考虑检测的准确率为95%,而回答95%。正确的答案是病患生病且检测发现有病的条件概率,其结果接近2%。结果有不到1/5的专业人士答对。
我来简化这个答案。假设没有漏报存在。1000个受检的病患中,预料将有一位罹患这种疾病。999位健康的病患中,检测的结果将有约50位染病,因为准确率是95%。正确的答案应该是,随机选取的某人,检测呈现阳性且确实染病的概率如下:
答案为1/51。
不妨想想,这一辈子你曾有多少次被告知染上某种疾病,需要接受某种药物治疗且忍受可怕的副作用,而实际上你真的罹患那种疾病的概率只有2%!”
五、再来一个题目
这个可能有点难。
在一个电视节目上,挑战者来到最后一关,他要从三扇门里选一扇门。其中一扇门背后是奖品,一辆汽车的钥匙;其余两扇门后面是一只羊。
现在,挑战者选了其中一扇门,但还没打开。
此时,主持人从没被选中的两扇门里,打开了一道门开给挑战者看:呐,这是一只羊。
然后,主持赋予挑战者一个选择权:你要不要换一道门?
问:他该不该换?
这个题目很有名,也非常有趣,答案也是反直觉的。
我迟些会在评论里放相关的讨论文章。
希望大家玩的开心。