一点都不“模糊”的“模糊数学”
严密性与精确性是数学最显著的特征,也正因为如此,数学被誉为“科学的皇后”,成为各门科学,尤其是自然科学研究的基础工具。马克思甚至曾经说过:“一门科学只有当它达到了能够成功地运用数学时,才能真正达到了完善的地步”。
那么,是不是所有的事物都可以严密化和精确化呢?我们可以考虑以下几个问题。
- 如何判断一个人是否是“高个子”呢?
如果一个身高179cm的人站在你面前,那你来说他算不算高个子呢?对这个问题不同的人会有不同的回答。有人觉得算有人觉得不算,当然还有更多的人可能会回答:勉强算。
- 如何判断一个男生是否是“帅哥”呢?
把吴彦祖拉过来你当然会毫不犹豫地说是,把宋小宝拉过来你当然会说不是,但是从学校里随便拉一个男生出来,大家的意见可能就没法统一了。
所以我们会发现,很多问题是无法明确地用“是”和“否”来回答的。
再比如下面两个著名的问题:
- 秃子悖论
一个人长着一头乌黑茂密的长发,那如果拔掉一根,从外观上看不出有什么变化吧。再拔掉一根,也不会有什么变化。那就不妨再拔一根,反正头发很茂密嘛,再拔一根仍然还是茂密。那如果再一根一根的拔下去......总有一个时刻头发会被拔光变成秃子。那么问题就是,既然茂密的头发拔掉一根还是茂密的头发,那怎么最终还会变成秃子呢?或者更准确的问法,当我拔掉第几根的时候,头发就从茂密变为不茂密了呢?你会发现这是个非常难以回答的问题。
- 沙堆悖论
沙堆悖论与秃子悖论相似:地上有一个沙堆,我取走一粒沙子,它依然还是个沙堆,再取走一粒,它还是沙堆,那如果我一粒一粒不停地往下取,总有一天会全部取光。那么我来问你,取到第几粒的时候,它就不再是沙堆了呢?
如果说上面两个悖论还只是停留在纯粹的思维层面,那下面这个问题就事关现实生活了。
我们国家制定了《未成年人保护法》,规定了年龄未满18周岁的为未成年人。那如果有两个人犯了相同的罪,一个人的确切年龄是17周年零364天零23小时59秒,另一个人是18周年0天0小时01秒。只因为出生时间相差了两秒,而一个人需要坐牢,另一个人不需要坐牢,那这样来看是合理的吗?(虽然这种情况在现实生活中几乎不会出现,但我们不妨当成一个问题来思考)
刚才提到的这几个现象都可以称之为模糊现象,模糊在我们生活中随处可见,比如“高矮”,“胖瘦”,“美丑”,“冷热”,几乎每一个形容词都是一个模糊现象。其实,数学家们早就注意到这类问题了,只不过苦于没有办法来处理。直到1965年,美国加州大学伯克利分校教授,自动控制专家L.A.扎德(L.A. Zadeh),极具创造性地提出了一种全新的数学思想,专门来解决这一类所谓的模糊问题,由此开创了一门名为“模糊数学”的数学分支。
扎德(L.A Zadeh,1921-2017)
本文就来介绍一下模糊数学的主要思想。
1.传统数学遭遇的困难
我们在高中都学过集合这一概念,老师肯定都曾经说过,集合是整个数学大厦的基础。
集合中的元素需要满足三个性质:确定性,无重复性和无序性。所谓确定性是指,你需要非常明确的知道集合中包含哪些元素。换句话说,任给你一个元素,你能够非常明确的判断它是属于这个集合,还是不属于这个集合。比如我们用N来表示全体自然数的集合,给你一个3,我知道它肯定属于这个集合;给你一个0.5,我知道它肯定不属于这个集合。
确定性从表面上看起来似乎没有什么问题,而且它是集合之所以成为集合的重要保证:你得告诉我这个集合里包含什么东西,才相当于告诉了我这个集合是什么吧!但是,传统的集合在处理模糊现象时,却遭遇了前所未有的困难。因为我们发现,在模糊现象里,是不能用绝对的“属于”或“不属于”来界定的。
比如上文提到的例子,我让F表示中国所有高个子男人的集合,一个身高195的男人肯定属于这个集合,一个身高160的男人肯定不属于这个集合,但是对于一个身高179的人呢?大家的意见肯定就有分歧了。
再比如,中国所有帅哥组成的集合。吴彦祖肯定属于这个集合,宋小宝肯定不属于这个集合。但是你家隔壁那个大男孩,属不属于这个集合呢?估计你自己都很难说清楚。
这就是传统数学所遭遇的困难,扎德为了解决这个问题,创造性地发明了“模糊集合”这个概念。
2.模糊集合
扎德是这样考虑问题的,179cm的男人到底属不属于高个子男人这个集合呢?问题就出在,我们非得用绝对的“属于”或绝对的“不属于”来回答这个问题。我们为什么不能回答:“大概算是吧”。对于一个身高174的人,我们为什么不说:“大概不算吧”。因此,扎德就想用一个数来衡量这种大概的程度,称为这个元素对这个集合的隶属度。隶属度介于0~1之间,数值越大说明属于这个集合的程度就越大。比如,195的男人 100%的算是高个子,我们就说195男人对高个子男人这个集合的隶属度为1,179的男人隶属度则是0.95,178的男人隶属于度为0.91,以此类推,170的男人隶属度可能只有0.3,而160的男人隶属度则为0。
通过这个例子,扎德给出了模糊集合的概念:
比如上面的例子,U表示所有身高的男人组成的集合,那么μ(195的男人)=1,μ(179的男人)=0.95,μ(170的男人)=0.3,μ(160的男人)=0,等等。
可以看出来,想表示一个模糊集合非常的繁琐,通常情况下我们有三种表示方法:扎德表示法,序偶表示法和向量表示法。我们介绍一下其中最直观的序偶表示法:
比如还是刚才那个高子男人那个例子,我们就可以这样表示
再比如中国的帅哥这个模糊集合,可以写成如下这个样子:
当然,写成这个样子,我相信李易峰的女粉丝们肯定就不高兴了:俺们家峰峰明明是100%的帅哥,怎么能说只有95%呢。于是这就涉及到下一个问题,某一个元素的隶属度是如何确定的?
3.隶属度的确定
隶属度的确定通常有三种办法
- 调查统计
通俗地讲就是做问卷调查,比如我去高校中随便挑100个女同学,问她们李易峰是不是帅哥?回答中95个人说是,5个人说不是,那么李易峰对帅哥这个集合的隶属度就是0.95。
当然这样做隶属度跟你所选取的人有关,如果换另外一批100个人,可能隶属度会发生变化,或者把人数扩大到1000人,隶属度也会发生变化。
当然,你做抽查的人数越多,那么就越接近于一个固定的值。而且,概率论里面的大数定律和中心极限定理也告诉我们,抽查的人数达到无穷大时就会有一个极限值,那么这个极限值就可以看成是可信的隶属度。
- 指派函数
人类的科学和数学经历了几千年的发展,研究和完善了各种类型的函数。尤其是在统计学中我们有各种各样现成的分布函数,比如正态分布函数,二项分布函数,泊松分布函数等等。那么在面临具体问题时,科学家们就会根据以往的经验和科学研究的结果,给它指定一个现成的函数。比如科学家在研究东亚地区人们的智商时,可以指定“智力普通的人”,它的隶属函数就是,期望为105,方差为5的正态分布函数。
- 借用现有指标
我们在科学研究中会有各种各样的指标,比如化学中有ph值,地质学中有地震震级,统计学中有相关系数,经济学中有GDP等等,有的时候,这些指标本身就可以作为隶属度。
比如经济学中的恩格尔系数。是衡量一个家庭财政支出状况的指标,具体的计算方法是,先指定一段时间,用这段时间家庭用来购买食物的支出,除以家庭的总支出得到的数。恩格尔系数是衡量家庭贫困程度的一个重要指标,恩格尔系数越高,家庭越贫困;反之,恩格尔系数越低,家庭越富裕。这是因为,吃饭是人类生存的第一需求,人们只有先吃饱肚子,再去考虑其他的事情。你每个月挣的钱,第一要用来吃饭,余下的钱才会去考虑买好看的衣服,看喜欢的电影。
从计算方法可以看出恩格尔系数一定是位于0~1之间的,如果我考虑“贫困家庭”组成的集合,就不妨直接把恩格尔系数当成它的隶属度。比如恩格尔系数是0.33的家庭,那么它属于贫困家庭的隶属度就是0.33。
4.模糊数学及其发展
模糊集合的提出,彻底颠覆了人们对经典集合的认识,甚至可以模仿经典集合,定义模糊集合之间的包含关系,子集,交集,并集,特征函数等概念。
我们知道,经典数学就是建立在经典集合之上的,而模糊集合的出现,则是可以完全改变经典数学的面貌。经典数学中的一些已有理论与方法,如果套用在模糊集合上,就形成了新的理论与方法。这些理论与方法放在一起,就是所谓的模糊数学这一门学科。
模糊数学最常用的应用有,模糊聚类分析,模糊模式识别,模糊决策,模糊线性规划等等,应用非常广泛,而且还在飞速发展中。可以想见,模糊数学是比传统数学更实用的方法,因为在现实生活中,我们所接触到的大部分其实都是模糊现象。
所以说,数学界从此一分为三:研究精确与确定现象的传统数学,研究不确定现象的概率论,和研究模糊现象的模糊数学。
从上面的叙述中也可以看出,模糊数学其实一点都不模糊,它只是研究的对象是模糊现象而已,但是研究方法还是传统数学的方法。给每一个对象赋予一个确定的数字,这不仅不模糊,反而是把模糊现象精确化了。这里要多说一句,概率论也不是不确定的数学,而只是研究不确定现象的数学,它的方法也是非常确定的。
最后不得不提一下扎德老先生,是学术界德高望重的老前辈。他可谓是学界“常青树”,出生于1921年,1965年提出模糊集合理论;1978年提出“模糊逻辑”理论,1981年提出“可能性理论”;1990年提出“软计算”的概念;2002年提出“词语计算”理论;2010年提出“不确定性的一般理论”。可以算一下,这个时候老先生已经90高龄了。扎德老先生于2017年去世,他这种惊人的毅力与勤奋的精神,值得我们永远学习!