我们学数学有什么用?这是最现实的回答!
对于我们大多数人来说,日常生活中可能不会用到太多数学知识,但这并不代表着数学就不重要。实际上,这个世界属于自然科学范畴的各种知识,它们的底层逻辑几乎都离不开数学。
在这个信息时代,数学在我们的日常生活中扮演着越来越重要的角色,而且这一角色具有不可替代性,因为数学是帮助人类认识世界、发现客观规律的一个重要工具,离开了数学,很多问题就会面临无法解决的困境。虽然数学实际应用起来可能比较复杂,但其背后所蕴含的思想却总是简单的.
我们现在每天都离不开的手机和电脑,其实本质上也就是各种计算机,要想让它们辅助我们的生活工作,就避免不了让它们处理人类的文字和语言,比如语音文字转换、语言翻译等等,那你知道计算机处理人类的文字、语言背后的原理是什么吗?其实在很早以前,人们就已经试着用数学来解决文字校验的问题了。
我们知道,犹太人信仰犹太教,犹太教的经典是《圣经》中的《旧约》,里面记载着犹太人的历史。可是,《圣经》不是由一个人写成的,它的写作过程经历了好几个世纪,所以之后的作者在补充《圣经》时,就会面临一个问题,那就是怎么在抄写的过程中不出现错误?人的马虎总是难以避免,所以这本应该是一个难题。但是聪明的犹太人发明了一种方法。他们在抄写《圣经》时,会把每一个希伯来字母对应一个数字,这样,每行或者每列文字加起来都对应一个数,这个数就是这一行或这一列的校验码。这样一来,抄完之后只要对比每行每列的校验码正不正确就行了,如果发现校验码有错,那通过行和列的校验码,也可以很快地定位到抄错的地方。这背后的原理,和我们今天的各种校验也是相同的。那人类的自然语言该怎么处理呢?在这个问题上,人们曾经走过很多弯路。其实最开始的时候,科学家们按照仿生学的思路,坚持认为,要让计算机学会处理自然语言,就必须像人一样,先让它理解自然语言,让它学会语法。但是后来人们发现,语法规则实在太多,根本没有办法穷尽。因为我们日常用的自然语言其实很复杂,不同的语境,不同的上下文,不同的语序,都会产生完全不同的语义。根据计算,就算覆盖我们平时常用语言的20%,都要写几万条语法,这个工作量就已经是天文数字了。而且写到后面,还会有自相矛盾的语法,为了区分,还要注明什么环境下用什么语法,整个过程无比繁琐。所以让计算机学习语法这一条路,在上个世纪70年代就走到了尽头。
就在人们一筹莫展的时候,数学的威力显示了出来。数学的魅力就在于让复杂的问题简单化。美国著名的计算机科学家贾里尼克领导他的实验室,借助数学中的统计学工具,把当时语言识别的成功率从70%提升到90%,同时让语言识别的规模,从几千个单词上升到几万个单词,让语言识别有了实际应用的可能。听到这儿你可能很疑惑,统计学和自然语言好像没什么关系,它怎么处理自然语言呢?其实贾里尼克的思路很简单,他认为,要判断一个句子正不正确,就要看这个句子出现的可能性的大小,这个可能性用概率来衡量。比如,我们假定第一个句子出现的概率是二分之一,第二个句子出现的概率是千分之一,那第一个句子出现的可能性就比第二个句子大得多,那么从概率的角度来说,第一个句子就更有可能是正确的。所以接下来我们需要做的事,就是判断一个句子出现的可能性有多大。这时就需要用到“马尔科夫假设”,这个假设是说,假定一个句子里每个词出现的概率,只和前一个词有关,就好比“涨停”这个词,最有可能出现在“股票”这个词之后。那么,只要给计算机量足够大的机读文本,也就是专业人士说的语料库,计算机就能算出来,在一个特定词后面出现某个词的概率。这样,只要把一句话里所有词出现的概率相乘,就是这个句子出现的概率。概率最大的句子,就是最有可能正确的句子。按照这个思路,科学家们成功地让计算机拥有了处理自然语言的能力。
你看,一个用几万条复杂语法解决不了的问题,用数学工具就轻松地解决了,而且效果还要好得多。那除了自然语言,我们今天用手机、用电脑,最常做的一个动作之一就是“搜索”。很多人喜欢点网站上的分类标签,看自己特别感兴趣的新闻。那计算机是怎么给这些新闻分类的呢?
这背后的原理也就是数学。这就是我们最开始举的那个例子:余弦定理能帮助新闻网站进行新闻分类。余弦定理大家中学都学过,你可能忘了,我来跟你复习一下啊。它是一个揭示三角形边角关系的重要数学定理,使用余弦定理,就可以仅凭三角形两个边的向量,计算出这两个边的夹角。向量就是有特定长度和方向的量,可以表示为带箭头的线段。具体该怎么做呢?一篇新闻里会有很多词,像“之乎者也的”这种虚词,对判断新闻的分类没有太大的意义。而像“股票”“利息”这种实词,是判断新闻分类的重点词。科学家精选了一个词汇表,这里面收录着64000个词,每个词都对应一个编号。他们先把大量文字数据输入计算机,算出每个词出现的次数。一般来说,出现次数越少的词越有搜索价值,比如“爱因斯坦”“数学之美”;而出现次数越多的词,越没有搜索价值,比如“一个”“这里”等等。根据这个标准,把词汇表里的64000个词都算出各自的权重,越特殊的词权重越大。然后,再往计算机里输入要分类的新闻,计算出这64000个词在这篇新闻里的分布,如果某些词没有在这篇新闻里出现,对应的值就是零,如果出现,对应的值就是这个词的权重。这样,这64000个数,就构成了一个64000维的向量,我们就用这个向量来代表这篇新闻,把它叫做这篇新闻的特征向量。不同类型的新闻,用词上有不同的特点,比如金融类新闻就经常出现“股票”“银行”这些词,所以不难判断,同类新闻的特征向量会有相似性。这样的话,只要算出不同新闻特征向量之间夹角的大小,就可以判断出它们是不是同一类新闻。这时就要用到余弦定理,来把两则新闻的特征向量之间的夹角算出来。科学家可以人工设定一个值,只要两个向量之间的夹角小于这个值,这两则新闻就可以判定成同一类新闻。你看,一个简单的数学定理,通过科学家们的巧妙应用,再次举重若轻地解决了一个难题。来给你总结一下这部分的内容。科学家们使用了统计学的方法,用概率的大小判断一个句子的正确性,从而让计算机获得了处理自然语言的能力。而在新闻分类领域里,科学家们用到了余弦定理,来判断新闻的特征向量之间的夹角,从而让计算机能够确定新闻的类别。
那咱们来回答一下这个部分的问题“数学的用处都有什么”。技术分为“道”和“术”两种,做事的原理和原则是“道”,而做事的具体方法就是“术”。我觉得数学真正的作用,就是让我们掌握“道”。因为从历史的发展来看,所有的“术”都会从独门秘籍到普及再到落伍,只有掌握了“道”的人才能永远游刃有余。