浅谈频率学派和贝叶斯学派

写在前面的话

终于可以写贝叶斯相关的文章啦,心情有点小激动,最近一段时间反复看Bishop老师编写的<<Pattern Recognition and Machine Learning>>前三章章节,发现贝叶斯思想真是太强大了,瞬间成为该书作者的忠实粉丝。在后续的文章中,笔者会尽自己最大的努力去阐述与机器学习算法所蕴含的贝叶斯思想。若有错误之处,欢迎更正指出。笔者认为互相学习、资源互享是最好最快速的学习方法。


频率学派

高中数学对概率的定义:在大量重复进行同一实验事件A发生的频率总是接近某一个常数,并在它附近进行摆动,这时将这个常数叫事件A的概率,记作P(A)。

这是古典频率学派对概率的定义,定义包含了二个要点:

(1)、事件A发生的概率是常数。

(2)、事件A发生的概率是重复多次进行同一实验得到的。

频率学派的局限性:

频率学派评估可重复实验事件发生的概率具有一定的现实意义。

但是假如评估本世纪末北极圈的冰川消失的概率,按照频率学派的思想,首先需要创造无数个平行世界,然后计算北极圈冰川消失的平行世界的频率,记该频率为冰川消失的概率。

目前,创造无数个平行世界的技术还不成熟,因此频率学派在评估不可重复实验事件发生的概率具有很大的限制性。

【贝叶斯学派】

贝叶斯学派对概率的定义:贝叶斯学派评估事件A发生的概率带有主观性,且事件A发生的概率是当前观测数据集D下的概率,即条件概率P(A|D),当观测数据集更新为D1时,则事件A发生的概率为P(A|D1),不同的数据集预测A事件发生的概率不同。贝叶斯学派评估事件A发生的概率会引用先验概率和后验概率两个概念,贝叶斯定理是搭建先验概率和后验概率的桥梁。

定义包含了三个要点:

(1)、事件A发生的概率是变化的,并非常数。

(2)、事件A发生的概率是特定数据集下的条件概率。

(3)、事件A发生的概率是后验概率,且事件A发生的先验概率已给定。

贝叶斯学派的难点在于如何设置合理反映事件A发生的先验概率,不同的先验概率得到的结果不一样。

概率论基本知识回顾


条件概率:设A,B是两个事件,且P(A)>0,称

为在事件A发生的条件下事件B发生的概率。

乘法定理:设P(A)>0,称

事件A,B同时发生的概率等于事件A发生的概率与事件A发生的条件下事件B发生的概率的乘积。

求和定理:设P(A)>0,称

为事件A发生概率的边缘化。

全概率公式:事件B发生的所有可能结果B1,B2,…,Bn,事件A发生的概率P(A),则

贝叶斯定理:

其中,P(A|B)为已知事件B下A发生的概率,称为后验概率;等式右边分子部分P(A)为事件A发生的概率,称为先验概率贝叶斯定理是先验概率和后验概率转换的桥梁。

频率学派和贝叶斯学派在评估模型参数的异同


相同点:最大似然函数在频率学派和贝叶斯学派都具有重要的作用,最大似然函数的思想是存在即合理,认为已观测数据的概率分布是最大概率,最大概率对应的模型就是我们需要找的模型。

不同点:频率学派认为模型是一成不变的,即模型参数是个常数;贝叶斯学派认为模型是一直在变的,当获取新的信息后,模型也相应的在改变,即模型参数是个变量,用概率去描述模型参数的不确定性。

【例】小明在做抛硬币试验,已观测数据集D为五次正面向上,求正面向上的概率w

频率学派解法:

硬币正面向上的概率为1,模型明显存在问题,称为过拟合

贝叶斯学派解法:

假设硬币正面向上的先验概率p(w),根据贝叶斯定理得:

由于篇幅的关系,本文只在这里描述了贝叶斯学派求解硬币正面向上概率的流程图,笔者会在后面的文章详细描述这一现象。

贝叶斯定理在先验概率和后验概率的应用举例

【例】 一个红盒子有六个橘子一个苹果,一个蓝色盒子有一个橘子三个苹果,选择红盒子的概率为0.4,选择蓝盒子的概率为0.6,随机从盒子抽取一次水果,(1)求水果为橘子的概率;(2)当抽取的水果为橘子时,求随机选择盒子为红色的概率;

解:

假设选择盒子的事件记为B,B有两种可能的结果,选择红盒子记为r,选择蓝盒子记为b;

假设抽取水果的事件记为F,F有两种可能的结果,抽取橘子记为o,抽取苹果记为a;

(1)、由全概率公式得:

因此,随机抽取水果为橘子的该为0.45。

(2)、问题转化为求解P(B=r|F=o)

由贝叶斯定理得:

由(2)可知,选择红色盒子概率为0.4,该概率为先验概率;当观测数据为橘子时,选择红色盒子的概率变成0.67,该概率为后验概率。再次证明了贝叶斯估计模型的概率是随着观测数据的变化而变化的。

总结


本文介绍了频率学派和贝叶斯学派的概率定义,频率学派认为模型是一成不变的,贝叶斯学派认为模型是随着数据的更新而不断更新,频率学派和贝叶斯学派都可以使用最大似然函数来估计模型。

(0)

相关推荐

  • 频率学派与贝叶斯学派的区别

    有人学了多年统计说不清楚频率学派与贝叶斯学派的区别,什么主观对客观啦,什么似然 函数对后验概率啦,那些都是现象,不是本质.两者本质上的区别是:频率学派把未知参 数看作普通变量,把样本看作随机变量:而贝 ...

  • 贝叶斯学派与频率学派有何不同?

    要说贝叶斯和频率学派,那简直太有意思了.为什么这么说呢?因为两个学派的理解对于我来说真的是一场持久战.我是在学习机器学习的时候接触到的这两个学派,此前并不知道,当时就被深深吸引了,于是找了各种资料学习 ...

  • 贝叶斯推断 1. 基本概率模型和贝叶斯定理

    这里简单介绍三个概念,古典概型,频率学派,贝叶斯学派. 古典概型 这个模型下,随机实验所有可能的结果是有限的,并且每个基本结果发生的概率是相同的 比如:投掷一枚均匀硬币,结果只有两种(假设硬币没有立起 ...

  • 统计学中的频率学派与贝叶斯学派

    对于技术应用人员来说,我们更看重方法的应用,但有时候对知识的背景做一些了解,我觉得还是挺有必要的,能帮助我们理解一些东西.这篇博文里,不会呈现任何计算公式,只是讨论一下贝叶斯学派与频率学派之间的问题. ...

  • 浅谈1918年布列斯特条约背后的角斗

    十月革命之后,德军继续对苏俄进攻,年轻的苏维埃处于较为混乱与薄弱状态下,节节败退.列宁引导的主和派逐渐占了上风.1918年3月3日,布列斯特和约正式签订.按照合约,苏俄割让大量领土,赔款60亿马克.自 ...

  • 从拒配"吉斯"专车浅谈55年9月授衔时张闻天的级别与待遇

    1952年4月底,新中国第一次驻外使节会议在北京召开,会议的一个主题就是确定驻外大使的级别评定.由于评级中两位将军大使不同意降低工资,说自己原来就是兵团级干部,使主持评级的外交部副部长伍修权很是为难. ...

  • 斯利通浅谈陶瓷基板的种类及应用

    目前电子陶瓷百花齐放,下文由斯利通提供一些陶瓷基板的种类,性能,以及应用. 氧化铝陶瓷 目前应用最多,其优势在于: 热学特性:耐热性和导热性强 机械特性:强度和硬度高 其它特性:电绝缘性高.耐腐蚀性强 ...

  • 统计学:你是贝叶斯主义者还是频率主义者?

    统计学:你是贝叶斯主义者还是频率主义者?

  • 俄罗斯空天军新成员“普罗米修斯” 浅谈俄军S-500反导系统

    近日,俄罗斯"消息报"报道称,国防部正在考虑为防空部队部署S-500防空系统的两种选择,一种方案是为现有部队更换S-500,另一种方案则是组建新的S-500防空导弹部队.但不管采取 ...

  • 红海军的末日余晖——浅谈苏联“乌里扬诺夫斯克”号核航空母舰

    苏联最后没有完工的航空母舰有2艘:11436"瓦良格"号常规动力航空母舰和11437"乌里扬诺夫斯克"号核动力航空母舰.其中11437"乌里扬诺夫斯克 ...

  • 艺术眼光:浅谈西方绘画大师以缪斯女神形体油画,揭示人性为何

    注本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意 ​ 聊一聊18世纪的英 ...