数学思想的一次飞跃——详述模糊数学
模糊数学是以前较为有争议的一个领域,因为和数学的严谨性统计规律性相悖,但是由于现实中模糊现象较多,使得它在短暂的时间内就迅速发展起来了,现在在社会众多领域都有渗透,可以称为是一次变革。所谓模糊是指处于中间过渡状态的不分明性和辩证性,区别于随机,随机是指一个事件要么发生要么不发生(取决于发生的可能性),比如硬币就只有正反两个可能,基本事件总数总是一定的,而模糊则不一样,比如形容一个人很高,那多高算高?如果他1.8我们就说他比较高,这里的比较高是一个模糊概念,很难用确定性的数学描述,类似的还有老年人与年轻人的划分、污染严重与不严重的界限等,这些都是模糊概念。
数学经过了确定性数学(即研究对象之间有必然的关系)到随机性数学(即在确定性上增加了偶然性,但结果一定是可以预知的,只是增加了发生可能性的随机)到模糊性数学(即对象的结果都不一样),总体来说是一大飞跃
模糊数学领域主要有三种用途,第一是模糊识别,即识别未知样本的所属归类,第二是模糊聚类,可以无监督地将样本动态聚成多类,第三是模糊综合决策,主要是一些方案的评价、样本的优劣评价等,下面详细解释,(有较多数学符号)
基本概念
模糊数学中的类似于定义域的概念被称为论域,假设模糊集为A,使得
X称为A的论域,
称为A的隶属函数,其函数值为隶属度,如果隶属度为0.5表明此时的x是模糊集A的过渡点,是最具模糊的点,如果
,A则就是普通集
隶属函数一般可由频数、实际业务场景、枚举实例、偏重程度等方面来确定,一般来说,隶属函数为值域在[0,1]上的分段函数
模糊集合
模糊集合的表示,个人认为最经典的就是zadeh表示法,它有很多好处(后面说),其中有限模糊集A为
这里论域
为有限集,这里的'+'号不是数学上面的加号,可以理解为并集,分数除法也不是数学上面的含义而只是一种表示方法(表示
的隶属度为
),写成这样的好其实就是相同隶属类别(分母)的值那它的隶属度等于各自隶属度(分子)相加
如果是无限模糊集(连续的),则表示为
同样的,这里的积分符号也不是数学上面的积分含义
例子
比如有四个人{
,
,
,
},身高分别为150,170,180,190,其中假设高个子的隶属函数为
则这四个人构成的模糊集为
模糊集之间的运算
常用
、
来表示模糊集之间的运算
- 对于模糊集A、B,隶属函数为
、
,且论域相同,若对任意的x有
,则称
- 模糊集的并集为C(x) =
= max{A(x), B(x)} =
,隶属度为
- 模糊集的交集为D(x) =
= min{A(x), B(x)} =
,所以隶属度为
为A的补集,隶属度为
并集就是取大,交集是取小,联想韦恩图即可
模糊关系和模糊矩阵
设论域U为
,论域V为
类似于高代里面的线性变换(从一个空间通过变换到另一个空间),而这里是论域U到论域V的模糊关系映射
模糊关系的隶属函数为
,值域为[0,1],这里的R是m*n的二维矩阵,即模糊矩阵
- 如果模糊矩阵的元素值要么为1要么为0,则成为布尔矩阵
- 如果模糊方阵(m=n)的对角线元素都为1,则成为模糊自反矩阵
- 如果模糊矩阵
,则等价于
- 如果模糊矩阵
,则等价于
- 若A的维度为ms,B的维度为sn,则类似矩阵乘法有
这里的
等于
可以看成是矩阵乘法中的乘替换成立先取两值最小后所有这样的两值中的最大
截矩阵
对于任意的
,对于模糊矩阵A有
故模糊矩阵A经过
截取后的截矩阵为布尔矩阵
模糊识别
假定论域都为U,U上所有的模糊集为F(U),U={
,
,...,
}
贴近度
言下之意就是模糊集相似程度的一种度量,记模糊集A,B之间的贴近度为N(A,B)
- 海明贴近度
用的是L1范数
有限集型
无限集型,即
- 欧几里得贴近度
用的是L2范数
即
- 黎曼贴近度
黎曼贴近度只需要确保函数黎曼可积就行,黎曼可积可以理解为在离散型的时候也可积,所以不用区分是否是有限集
以上贴近度的复杂度较大,现实中一般采用格贴近度
格贴近度
模糊集之间的内积定义为
先取对应元素中的最大再取最大值中的最小
外积定义为
先取对应元素中的最小再取最大值中的最大
固定模糊集 A ,如果模糊集 B 越靠近 A ,会使内积增大而外积 减少,所以用格贴近度来刻画两个模糊集的贴近程度,即格贴近度为
识别规则
若给定一个未知的样本,如何识别它的隶属,有两种办法
- 最大隶属原则
即
,则说明
相对隶属模糊集
比如在模糊集(年轻,中年,老年),一个人在三个模糊集的隶属度最大就表示它更应该属于那个模糊集
- 择近原则 即在所有已知模糊集中格贴近度最大的那个模糊集即是隶属,即
则说明
相对隶属模糊集
,B为待识别的一个模糊向量
所以应用这两种规则就可以判定识别出未知样本属于哪个等级或哪个分类
模糊聚类分析
聚类分析含义是对客观事物按一定的标准进行分类的数学方法,而在很多领域中有许多事物的类与类之间并无清晰的划分即其边界具有模糊性,它们之间的关系更多的是模糊关系,所以用模糊聚类分析更加符合
相关定义
- 模糊等价矩阵
若满足
,R>=I(单位矩阵),且R为对称矩阵,则称R为模糊等价矩阵
性质是对于它的截矩阵
和
,如果在
时将
,
聚成一类,则在
时一定也是一类,其中
如图所示,截矩阵后成为布尔矩阵,只需找相同行即可归为一类,可以知道当
越小,类别数越少,可以再看一下截矩阵的定义
- 模糊相似矩阵 只需要等价矩阵条件中撤去
这个条件即可
设R为模糊相似矩阵,则存在最小的正整数k使得
,其中t为任意大于等于k的正整数,并且
为模糊等价矩阵,即模糊相似矩阵的有限次幂一定收敛于对应的模糊等价矩阵,因为这里的矩阵乘法是两者元素取完最小后的最大值
- 传递闭包矩阵 自然而然,上面收敛的
称为模糊相似矩阵R的传递闭包矩阵,记作t(R),一般幂次的乘积用平方法,直到收敛,即
若有
故此时传递闭包矩阵为
,传递闭包矩阵为模糊等价矩阵
聚类步骤
- 获取原始数据A,为n个样本,m个特征
- 数据标准化处理,最好采用极差归一化方法
- 建立模糊集合,定义隶属度函数(一般采用
)
- 生成模糊相似矩阵,矩阵元素这里可选格贴近度或者上述的其他贴近度
- 聚类主过程,迭代不同置信水平
,得到动态聚类的效果(和层次聚类法较像)
- 基于误差准则进行修正
因为是由相似系数构建的模糊相似矩阵,则一定存在传递闭包,从而使用不同水平的
去截这个闭包矩阵(模糊等价矩阵)得到动态聚类效果
模糊决策分析
类比与层次分析法,具有主观性
模糊综合评价
它是从多个因素出发对被评价样本分类隶属等级综合性评价的方法,是后续模糊决策分析方法的基础
评价的是单个样本对象
步骤
- 确定单个样本因素或样本特征的论域U
- 确定评价标准论域V,比如V = {优、良、中、差}
- 建立模糊关系矩阵R,矩阵元素为因素
对评价等级
的影响隶属关系
- 确定评价样本的各个特征之间的权重向量A,这很主观,取决于现实场景
- 确定权向量A与模糊关系矩阵R的合成方法(需要利用模糊算子,一般选用
),即
而这里B的元素为
- 求出向量B后,元素值最大的就是最终评价标准
多目标模糊综合评价决策法
若是多个样本的决策,则只需对每个样本进行上述的评价过程即可,但是如何评价这些个多个样本哪个最优呢,这就是多目标模糊综合评价决策法解决的问题
步骤
- 对每个样本进行模糊综合评价,计算出最终的评价结果向量B,假设第k个样本的评价结果向量为
- 将评价标准(评价尺度)量化,得到量化集S,比如V = {优、良、中、差}的量化集可以为{0.4,0.3,0.2,0.1},这也需要人工赋值
- 计算第k个样本的总评分,即
,总评分数最大的那个就是最优的样本
多层次模糊综合评价
多层次体现在特征体系的选取上,一般来说样本如果因素众多,可以先组合一些特征进行组合特征的决策,然后再总体决策,这就是多层次模糊综合评价的思想
步骤
- 将样本的各个特征划分成多个子集
,子集元素交集为空,并集为整个特征集
- 将每一个子集
与评价标准集V结合,获得模糊关系矩阵
- 通过模糊关系矩阵
计算评价结果向量
- 根据方法确定各个子集
之间的权重A
- 将每一个
视为一个特征,此时的模糊关系矩阵为
,即评价结果向量构成的矩阵
- 根据各个子集
之间的权重计算评价结果向量,
确定权重的方法可以是频数统计法,层次分析法,熵权法等
总结
模糊数学的出现是从确定性到随机性再到模糊性的一大飞跃,更好地贴近了现实生活,因为在现实中很多东西的评判标准都是模糊的,隶属度的含义是属于每个类别的程度,就将一个不确定不预知的结果给刻画出来了,不得不说,传递闭包矩阵、截矩阵这些思想是精髓所在,真的佩服!!这也正是数学思想的奇妙!
模糊数学模型可以解决模糊识别、模糊聚类等经典场景,具有较高的准确性和简易型,虽然说模糊评价和层次分析法一样有主观赋权的存在,但是在主观性很强的研究领域不失为一个可扩展性好,效果较好,且能更好结合其他评价方法的一种手段!
参考资料
《数学建模算法与应用》 司守奎老师著