人工智能与贝叶斯定理
人工智能与贝叶斯定理
前言
2020年11月5日至10日,第三届中国国际进口博览会在上海举办。在本届进博会上,包括乒乓球机器人、城市智能环卫清扫车等在内的众多人工智能产品,尤为引人注目。人工智能,英文缩写为AI。人工智能诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。提起人工智能,我们有必要探究一下它背后隐藏着的一个数学公式:贝叶斯定理。
贝叶斯及贝叶斯定理
历史上有许多天才,生前籍籍无名,死后众人崇拜。18世纪英国数学家托马斯·贝叶斯也是其中一位。
贝叶斯定理源于他生前为解决一个“逆向概率”问题而写的一篇论文。在贝叶斯写文章之前,人们已经能够计算“正向概率”。举个例子:假设一个袋子里有N个红球和N个白球,伸手随机摸一个,摸出红球的概率是多大呢?显然摸出红球的概率是1/2,这就是正向概率。
那么“逆向概率”是什么呢?《公式之美》一书告诉我们:如果我们事先并不知道袋子里红球和白球的比例,而是闭着眼睛摸出一些球,然后根据手中红球和白球的比例对袋子里红球和白球的比例做出推测,这就是“逆向概率”。也就是说,当你不能准确知悉一个事物的本质时,你可以依靠经验去判断其本质属性。用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
与其他统计学方法不同,贝叶斯定理建立在主观判断的基础上,你可以先估计一个值,然后根据客观事实不断修正。这个研究看起来平淡无奇,名不见经传的贝叶斯也未引人注意。他写的论文直到他死后的第二年,才由他的一位朋友在1763年发表。
人工智能与贝叶斯定理
那么贝叶斯定理在人工智能领域又是如何体现的呢?人工智能有许多应用,它们大致可分为五类:自然语言处理、语音识别、计算机视觉、专家系统和智能机器人。自然语言处理就是让计算机代替人来翻译语言、识别语音、认识文字和进行海量文献的自动检索。但是,人类的语言可以说是信息里最复杂最动态的一部分。人们最初想到的方法是语言学方法,让计算机学习人类的语法、分析语句,等等。尤其是在乔姆斯基提出“形式语言”以后,人们更坚定了利用语法规则的办法进行文字处理的信念。但是,几十年过去了,在计算机语言处理领域,基于这个语法规则的方法几乎毫无突破。
率先成功利用数学方法解决自然语言处理问题的是贾里尼克。他认为语音识别就是根据接收到的一个信号序列推测说话人实际发出的信号序列(所说的话)和要表达的意思。这就把语音识别问题转化成为一个通信问题,而且进一步简化为用贝叶斯定理处理的数学问题。
基于贝叶斯定理,语音识别问题可以分解为:给定文字序列后出现这条语音的条件概率及出现该条文字序列的先验概率。对条件概率建模所得模型即为声学模型,对出现该条文字序列的先验概率建模所得到的模型即为语言模型。这种语音识别系统不但能够识别静态的词库,而且对词汇的动态变化具有很好的适应性,即使是新出现的词汇,只要这个词已经被大家高频使用,用于训练的数据量足够多,系统就能正确地识别。
随着大量数据输入模型的迭代,和大数据技术的发现,贝叶斯定理的威力日益凸显,它的实用价值也越发显现。
扫码关注
- 谢谢关注 -