雅虎、谷歌成功背后的思考:学习的本质是降低"熵"

导语:熵是一个非常重要的概念,整个人类科技的进步就是一部与熵做对抗的历史。雅虎、谷歌之所以能成为全球顶尖的互联网公司,就是在于有效降低了熵。本文的目的是把熵讲清楚,并通过熵让你理解怎么样更有效的学习。

名字古怪性格嚣张的"熵"

熵(英文entrophy,读音"shāng"),符号S,是表示混乱程度的物理量。

围绕着熵有一个著名的热力学第二定律:系统中的熵总是不断增大的。要想降低熵就要消耗能量。

这么说可能有点抽象,形象的表述是:对于任何一件事情,如果你不再上面投入时间和精力,它一定会越来越混乱。

我们的日常生活中充满了和熵对抗的例子:比如你要是不定期整理书桌,它一定会越来越乱(混乱程度增加,即熵增加),你要想让它变整齐,就必须不断花时间整理。

再比如做笔记,你要是做很乱很随意的笔记就相对轻松一点,而要做得很整齐就要耗费更多的精力和时间,这是因为整齐的笔记熵比较低。

你可能觉得上面这个例子太显而易见了,没有任何新意。那我再举一个略显沉重的例子。

其实我们每个人从年轻到年老再到死亡也是熵增加的过程。刚出生时我们细胞里面的DNA熵最低。每次DNA随着细胞分裂复制的时候都有一定概率出错,即发生基因突变。

随着我们年龄增长,DNA复制次数越多,错误的比例会越来越大,也就是熵会越来越高。当错误多到一定程度时要么细胞分裂能力下降,表现为衰老。要么分裂会失控,表现为癌症(这就是为什么老年人容易得癌症)。最终的结果就是死亡。

而健身的人衰老的慢,是因为健身这个过程通过消耗更多能量,来减慢熵增加的速度。

看,熵就是这么一个名字古怪性格嚣张的小恶魔,把一切搞乱,你必须无休止的与它斗争,而且还打不赢。

整个人类的历史就是与熵斗争的历史,那些伟大的技术和发明都是为了降低熵。下面我们聊一聊互联网行业里两家伟大的公司雅虎和谷歌,看看它们是怎么和熵做对抗的。

雅虎:靠人肉对抗熵的互联网先驱

我们回到上世纪90年代,也就是大家刚开始上网的那几年。当时已经有一些企业建立了网站并在网上发布信息了。但这些信息是杂乱的,没有分类和组织,熵很高。

这个时候你没有地方去查到每个网站的网址,很多网站你很难访问的到。因此互联网是个很小众的东西,大部分人觉得没什么价值。

直到1994年,斯坦福大学的两个学生杨致远和大卫·费罗创立了雅虎(Yahoo),颠覆了整个互联网行业。

这两个学生在网上查资料的时候一方面觉得网上资料很丰富,但是另一方面又觉得找每个网站网址好麻烦。因此灵光乍现,觉得如果有一个网站,把所有其它网站分门别类的列出来,那上网就方便多了。

说干就干,他们很快开发出了一个简单的网页,把自己之前整理过的网址分类之后填上去,并且不断更新。早期的雅虎页面是下图这个样子:

就是这么一个简陋的页面却大受欢迎。用户量激增,雅虎顺利拿到融资,越做越大,顺利上市。

其实咱们国内早期上网的时候主页也都是像hao123、网易、新浪、搜狐等几大门户网站,雅虎可以说是这些的祖师爷了。

其实雅虎干的事情很简单,通过编辑夜以继日的整理网站,更新分类。靠人肉降低了熵。

而雅虎链接着互联网的大部分页面,是进入互联网的入口,因此雅虎提高了用户使用互联网的效率,有效的降低了互联网的熵。

此后互联网行业的迅速发展都应该感谢雅虎与熵的对抗。

谷歌:找到对抗熵的核武器

虽然雅虎是互联网对抗熵的先驱,但是现在已经变成了先烈,而从雅虎手里接棒的是谷歌。原因很简单,谷歌对抗熵的效率和效果远高于雅虎。

时间来到了上世纪90年代末期。有了雅虎这样的门户网站之后虽然上网比之前体验好了很多,但是还是有很多问题。

比如你想查一个名人的资料,你得先找到"名人"这个分类,然后按照这个名人的行业筛选,最后在茫茫多的人里面找到它。

当时已经有很多人设想通过搜索来检索信息。但是有一个核心问题没法解决,就是怎么确保搜出来的结果里有价值的页面能排在前面。毕竟如果有一万条结果,但是有价值的只有50条,还分散在这一万条里,那这也是没有意义的。

用熵的角度说,就是如何得到熵很低的搜索结果。

1998年,斯坦福的另外两个大学生拉里·佩奇和谢尔盖·布林在做博士论文时突发奇想,找到了一个简单的解决方法,即利用网页上的超链接来计算页面价值,并将价值高的页面排在前面,这样搜索结果的熵就显著下降了。

下面简单介绍一下这个算法的原理:

假设有ABCDEF六个网页,他们页面上超链接的指向如上图。D有个指向A的箭头表示D网页有一个超链接,点击可以跳到A网页。

我们要计算每个网页的价值。D网页有一个超链接能指向B网页,那说明D觉得B是有价值的,而被指向次数越多的网页越有价值。如果你觉得不好理解就想想抖音,抖音上的网红都想尽一切办法获得更多人的关注,因为越多人关注他,他的价值就越大。上图里的B被指向的最多,所以最有价值。

不仅如此,不同页面的指向价值不同,越有价值的网页指向的网页也越有价值,就好比名人说话比一般人有分量一样。因此上图里的C网页虽然只有B一个指向,但是因为B很有价值,所以C也很有价值。

这个就是互联网史上最伟大的算法PageRank的核心思想。是不是非常简单?

但是就是这么一个简单的算法使得用户用谷歌搜索时能获取到非常有价值的信息,从而造就了谷歌这个全球数一数二的互联网巨头。

谷歌比雅虎的厉害之处在于它是对整个互联网上所有的页面做了个排序,就好比把一副洗的很乱的扑克牌按照花色和大小重新排列,使得熵进一步大幅下降。而且谷歌是靠算法而不是人工来完成这一切。所消耗的能量就只有计算机的电能而已。

如果雅虎对抗熵的武器是步枪,那谷歌的PageRank无疑是核武器了。

学习的本质是和熵的对抗

其实学习的本质是建立一个结构化的知识框架来和熵对抗。以高中阶段为例,我们的学习就是两个阶段不断循环。

阶段一:输入。每天我们都要密集的上课,语文要背古文和诗词、数学物理有各种定理、化学有各种方程式。这些都是信息的输入。刚输入的信息不仅是杂乱的,而且容易跟已有的知识混淆,因此这个阶段是我们的熵会增加。

阶段二:整理。在这个阶段,我们要花很多时间把新输入的知识按照某些逻辑组织起来,构建各个学科自顶向下的知识结构。比如高中物理,我们把高中物理所有知识点分成运动系统和非运动系统,把运动系统又分成外部能能量、加速度和能量转化,然后再进一步细分,如下图:

随着不断地细分和构建,熵就下降了。

而考试其实说白了就是考我们熵下降的程度。如果我们想把题做对,就要快速检索出考点在系统中的位置,并找到与之关联的知识,然后调动这些知识来解题。熵越低、构建越完善的系统检索速度越快,能检索到的关联的知识越多越准确,自然解题能力更强。

以上,基于熵的原理,我们可以回答两个被问的最多的学习方法的问题:

1.所谓定式、套路和大招对考试到底有没有帮助?

你学习定式和套路时,相当于把知识孤立了,对每个套路都建立了一个小的子系统。由于彼此没有链接,就好像雅虎出现之前的互联网系统,熵是很高的。

所以我强烈不建议你花时间在这个上面。

2.为什么学习投入的时间和成绩不成正比?

只有当时间花在降低熵上时,才是真正有效率的学习。很多同学学习的时候喜欢啃好啃的骨头,要么是在反复巩固自己学的好的内容,要么是被动的做老师留的作业,没有针对性。

这两个行为都不太可能降低熵,因此不会带来有效的成绩提高。

总结

1. 熵表示混乱程度,会一直增加,降低熵需要消耗能量

2. 谷歌和雅虎的价值在于降低了互联网中信息的熵

3. 学习的本质是建立一套高度结构化的系统,降低熵

4.要想学习高效,唯有通过更加积极的调整,把时间用在最能降低熵的方向上

(0)

相关推荐