【学府点拨】概率——随机世界与大数据时代
概率的意义
一骰子有6个面,一掷之下,会得到偶数之概率为何?骰子看起来没有异样,就假设每个面出现的概率皆相同,即均为1/6。而偶数面有2,4,及6等3个。因此所求之概率为3/6。这就是所谓古典的概率,基本假设是“相同的可能性”。先求出观测的现象共有几种可能,再求出其中有几件是我们有兴趣的。将后者除以前者,即为所要的概率。虽说是“古典”,这种概率的意义,至今仍处处可见。採用的范围包含诸如抽籤、玩扑克牌,及玩乐透彩等。又如某项工作徵才,报名的有82人,录取5人。若没有什么特别的资讯,便只能假设每人被录取的概率皆相同,即皆为5/82。
2009年7月底8月初,世界高尔夫球王老虎伍兹(TigerWoods),参加在美国密西根州举行的别克公开赛(Buick Open)。第1轮打完,落后领先者多达8杆,排名并列95。引发他可能难逃职业生涯,首次连续2场比赛(前一场是英国公开赛(The Open Championship,在英国之外常称为BritishOpen)),提前被淘汰的话题。不过老虎毕竟不能小觑,打完前3轮后,伍兹跃居首位。
这时大家看法丕变,一致认为这座冠军盃,几乎可说是他的囊中物了。因过去的纪录显示,伍兹如能带着54洞领先进入决赛圈,战绩是35胜1败。你要不要猜后来他赢了没有?运动比赛,往往有过去资料可参考,此时相同的可能性便不宜用了。36次中成功35次,“相对频率”为35/36(约0.972)。这种以相对频率来解释概率,是常有的作法。适用能重复观测的现象。会不会有爆出冷门的时候?当然有。只是对一特定事件,用过去多次同样情况下,该事件发生的相对频率,来估计下一次事件发生的概率,乃是在没有更多资讯下,常被认为一属于客观的办法。
某君看上一女孩,惊为天人,觉得这是他今生的新娘。评估后信心满满,自认追上的机会有8成。旁人却都不看好,问他8成这一数字,是如何冒出来的?该君举证历历,一个又一个的迹象,显示那女孩对他很有好感。这个0.8的概率,就是所谓主观概率。主观概率当然也可基于过认识概率35去一些客观的事实。只是即使面对同样的资料,不同的人,可能有不同的判定,因而给出不同的主观概率(看过他其实没那么喜欢你(He’s Just Not That Into You)吗?片中那个叫Gigi的女孩,便常误解男生所透露的讯息)。有些现象就是不能重复观测。如核能电厂的意外,及彗星撞地球等。以追女孩为例,大约少有女孩,会让你做实验,反覆地追,然后数一数其中成功几次,来定下她会被你追上的概率。对这类无法重复观测的现象,在谈概率时,主观概率就常派上用场。每天早上出门,我们不是惯于抬头看天,判断一下今天下雨的概率有几成?只是往往父母认为的概率会大些,该带伞,而小孩所认为的下雨概率会小些。
虽说“主观”,但仍要合理。例如,考试有及格与不及格。若认为会及格的概率为0.9,这没问题,人总要有点自信,但若又同时担心有0.8的概率会不及格,那就不行了。各种可能性发生概率相加要为1。即使是主观,可以独排众议,仍须自圆其说。不能说,既然是主观,便可以任意自定各事件之概率。因此不论是那一种对概率的解释,都自然地,或说必须要满足一些共同的规则。这点大家应能理解。
上述三种是常见对概率的解释,大抵也就是人们评估事件发生可能性之大小的几种思维。虽是针对不同的情况,但常能交互着运用。大家都听过曾参杀人的典故吧!有个与曾子同名的人杀人,好心者告诉曾母“曾参杀人”。曾母说“吾子不杀人”,继续织布。过一会儿,又有人来说“曾参杀人”。曾母仍继续织她的布,这么好的儿子怎可能杀人?但当第三人跑来说“曾参杀人”,曾母就害怕了,丢掉织布器具翻墙而逃。所谓“其母惧,投杼踰墙而走”。这故事出自战国策秦策二。因此当拿到一铜板,可主观地认为,政府发行不该会有偏差,两面出现的概率,应皆为1/2(这也可以是基于相同可能性之想法)。若投掷10次,正面出现8次,可能觉得有些奇怪。若继续投掷,结果100次中,出现80个正面,这时相对频率的观点,很可能便将显现。类如曾母,调整看法,不再认为此铜板公正。
当然,你可以不信邪,不论投掷的结果如何,皆认为那只是短暂的情况,意志坚定地认为这是一公正的铜板。这并没有不行,就像会有母亲,即使再多的人证,只要她没亲眼看到,她就不信儿子会杀人。要知随机现象,事件只要概率为正,不论概率值多小,便皆可能发生。毕竟铜板正面出现的概率为何,只有天晓得。但引进概率与统计,乃为了协助我们做决策可以更精准。而决策可以与时推移,并非不能更改。有如气象局对颱风会带来多少雨量,须密切掌握新的动向,而随时修正。要有随机的思维,如前言中劳氏所说的,从给定的结果,验证前提。因此针对100次投掷,出现80个正面,多数人面对此结果,还是会认为0.8的正面出现概率,较0.5的概率可信。稍后我们会再来看,10次中的8次,与100次中的80次,相对频率同为0.8,但提供的资讯,是否有异?
虽然已有上述三种对概率的解释,也涵盖了不少实际生活中所遇到的情况,数学家当然不会在此止步。他们喜欢抽象化,及一般化。像解方程式,会寻求公式,以表示出某类方程式的解,而非只满足于求出一个个的特例之解。又如当完全了解实数系统后,便会以公理化的方式,定义实数系统。即给一集合,没说是数字的集合,对其中的元素定义二运算,并给出10条遵循的公理(axiom,规则)。你好奇该二运算是否一为加法,一为乘法?而怎么没有减法与除法?名可名,非常名,数学家不认为你提出的是重要的问题。但用心体会后,你终于发现原来二运算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。数学家对你的洞察力,仍不以为意,但同意你可以这样想。
什么叫以公理化的方式,来引进概率?先要有一个集合,称做样本空间,当做某一观测之所有可能结果的集合。可以真的有这一观测,或只是虚拟的。样本空间的某些子集合,是我们有兴趣的,这些就是一个个的事件。所有事件也构成一集合。最后定出一概率函数,即对每一事件,给一介于0,1间的值,为该事件之概率。样本空间、事件的集合,及概率函数,三者便构成概率空间(probability space)。这其中对样本空间没有太大要求,但不可以是空集合。而事件的集合,要满足若干条件。简单讲,就是你有兴趣的事件不能太少。譬如说,不能只对某事件A发生有兴趣,却对A不发生没兴趣。因此事件的集合要够大,至少该有的都得纳入。这有点像婚宴前拟宾客名单。可以请很少人,如只有双方家长。而一旦多列了某人,与他同样亲近的人便也要一併请。所以每多列1人,将不只是增加1人而已,而会随之增加几位。又概率函数,既然以概率之名,当然要符合过去大家对概率的认知,满足一些基本的条件。
在概率空间的架构下,不论采用何种方式解释概率的人,都可各自表述,找到他所以为的概率意义。但因抽象化后,不再局限于铜板、骰子,及扑克牌等,便能讨论较一般的问题,有够多的理论可挖掘。
与数学的其他领域相比,概率论的发展是较晚的。但公理化后,概率论便快速地有了深而远的发展,并成为数学中一重要的领域。这都要归功于二十世纪那位重要的概率学家,俄国的科莫果洛夫(Andrey Nikolaevich Kolmogorov,1903-1987),于他1933年出版,那本不到100页的小书概率论的基础(Foundationsof the Theory of Probability)中所奠定。在此书中,他说:概率论作为数学学科,可以而且应该从公理开始发展,就如同几何、代数一样(Thetheory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra)。