2021年荐书第5期---《算法之美:指导工作与生活的算法》
我在微博上对这本书的推荐如下:
推荐《算法之美》,这本书通过丰富的跨学科研究指出,计算机算法也可以用来解答人类面临的许多问题。
这本书告诉我们如何更有效地利用直觉?
什么时候应该把选择权交给命运?
无所适从的时候,应该如何作出选择?
以及如何有效地与他人保持联系?等等。
我从这本书中关于缓存的一章,学到了一个改进我所从事工作的方法:
就是对图书展示进行乾坤大挪移,缓存清理的解决策略,常常最有效的一种是最近最少使用策略。
那么图书馆的大厅展示区类似于缓存区,也可以不再展示新购入的书籍,而是展示读者们刚刚归还的书籍。
---引自微博大脑培训师
每天推荐一本书,进步一点点!
https://weibo.com/huangduhai/profile?rightmod=1&wvr=6&mod=personnumber&is_all=1
---------------------
而这期文章准备扩展一下这篇推荐,核心就是要回答上面提到的两个问题:
1,如何更有效地利用直觉?
2,什么时候应该把选择权交给命运?
1,如何更有效地利用直觉?
掌握经验启发式;
了解什么时候直觉管用什么时候不管用;
在管用的时候相信直觉,在不管用的时候反直觉。
譬如要克服自利性偏差,要警惕确认偏误,要提醒自己反过来想,总是反过来想。
以上是我没看书之前的想法。
书中第7章 过度拟合与这个问题密切相关。
我们需要相信直觉的时候,就是发生了过度拟合。
作者讲了许多有趣的实例,包括达尔文做出是否结婚的决策,富兰克林的方程式选择法以及对于生活满意度的预测等等。
作者指出,过度拟合很多时候缘于数据崇拜。
如果我们现在的丰富数据是一个完全有代表性的样本,完全没有错误,并完全代表我们正试图评估的对象的话,那么使用最复杂的模型确实是最好的方法。
但如果我们试图找到完全适合我们的模型数据时,只要有一个因素不符合以上条件,我们就不能将模型完美地拟合于数据之上,就会有过度拟合的风险。
从根本上说,过度拟合就是对数据的一种偶像崇拜,产生的原因是将重心放在我们能够测量的数据而不是真正重要的问题上。(可得性偏误)
考虑越来越多的因素和在模型分析上花费的更多努力,会导致我们进入将错误的事物最优化的误区。
让我想起了《论语》中一段对话:
季文子三思而后行。
子闻之曰:“再,斯可矣。”
---引自《论语·公冶长》
给自己更多时间去决定某件事并不一定意味着你就会做出更好的决定。
但它的确会保证你最终会考虑更多的因素、更多的假设、更多的利弊,从而对风险过度拟合。
作者对于如何尽早停止理性思考,利弊权衡,选择相信直觉?
给出了下面的答案:
取决于你能衡量的标准和真正重要的因素之间的差距!
1) 如果你了解了所有的事实,你可以直接评估什么对你来说是重要的
----不要过早的停止,思考的时间要长而努力;
模型的复杂性和付出的努力都是值得的。
2)你有很高的不确定性和有限的数据
----务必提前停止。
不确定性越大,你所能衡量的东西和真正重要的东西之间的差距就越大,你就越应该注意过度拟合的风险。
你越喜欢简单,就应该越早停下来!
想起奇葩说中薛兆丰老师的建议:
要做难的工作,要谈简单的恋爱!
当达尔文下定决心要结婚时,他又开始思考时间的问题。最后,他在纸上写道“不要在意,相信运气”。
结果,在几个月的时间里,他向艾玛.韦奇伍德求婚,这是一段美好的关系和幸福家庭生活的开始。
上图为达尔文夫妻,下图为他的后代子孙
2,什么时候应该把选择权交给命运?
左右为难的时候,就占卜算卦。
尽人事之后,就要听天命;
愿赌服输,落子无悔。
以上是没看书的个人想法。
书中与这个问题相关的章节是第9章 随机性 何时应用随机?
这一部分的内容比较艰深,像蒙特卡罗法,米勒-拉宾素数测试,多项式身份测试,布隆过滤器,爬山算法,梅特罗波利斯算法,模拟退火算法.......
尽管书中有一定的解释,但我知道我也只能理解最浅表的部分,其背后的数学含义,深远道理我知之甚浅,就不做评论了。
我说说书中的结论:
如果我们想继续寻求改进,我们可能需要暂时恶化我们的解决方案。
随机性提供了好几个策略就是这么做的:
“抖动“来增大爬山算法。如果你看起来像是被卡住了,就做一些随机的小调整,即使它们的情况更糟,然后再回到爬山算法;
“随机重复爬山法”或叫“猎枪爬山法”,当我们达到一个局部最大值时,要完全地打乱我们的解决方案,然后从这个随机的新起点重新开始。
梅特罗波利斯算法,每次你作决定时都要使用一点儿随机性,在任何一个给定的点上,都有可能接受坏的调整和好的调整。
总之,随机性对于避免局部最大值都是非常有用的,不仅仅是处理棘手优化问题的可行方法,在许多情况下,它是必不可少的。
至于应该使用多少随机性?何时使用?
这些问题的答案在模拟退火算法!
“物理系统研究的方法是把它们加热,然后再冷却,让系统自行编组。”
最后是三个建议:
1)即使你有执行坏主意的习惯,你也应该坚持执行那些好的想法。
----爬山算法
进一寸有一寸的欢喜。
日拱一卒,不求速胜,相信功不唐捐。
2)你有执行一个坏主意的可能性与该想法的糟糕程度成反比。
---梅特罗波利斯算法
一个想法太糟糕了,以致没有人会去采纳它。
而有迷惑性的谎言往往是九真一假,似是而非!
无知并不会伤害我们,傲慢才是生存的大敌,以为自己知道而实际无知才最可怕!
3) 你应该提前实现随机性,在完全随机的状态下迅速冷却,随着时间的推移,使用越来越少的随机性,当接近冰点时,持续的时间最长。
再让自己回火!
---模拟退火算法
一个盲目的变异和选择性的保留过程是所有归纳成果,所有知识的真正增加,以及所有的系统适应环境能力增长的基础。
随机性是创造力的核心。
创造性的创新行为是新思想产生的结果,是随机产生的,人类精明的头脑保留了这些思想的精华。
结晶过程
--------------------
上一周荐书的计划基本如约完成
2021年荐书第4期---《Does Santa Exist?》
02/18 星期四
埃德温.勒菲弗 《股票大作手回忆录》
02/19 星期五
理查德.道金斯 《魔鬼的牧师:关于希望,谎言,科学和爱的思考》
布莱恩.克里斯汀 《算法之美:指导工作与生活的算法》
02/20 星期六
马薇薇,黄执中等《好好说话2》
02/21 星期日
梁秋阳 《深度说服》
02/22 星期一
约翰.杜威 《确定性的寻求》
02/23 星期二
吉仁泽 《直觉:我们为什么无从推理,却能决策》
02/24 星期三
蒂姆.哈福德 《塑造世界经济的50项伟大发明》
这个计划看来执行的不错,那就继续下去。
接下来我准备在微博上推荐的书籍如下:
02/25 星期四
查尔斯.都希格 《习惯的力量:为什么我们这样生活,那样工作?》
02/26 星期五
道格拉斯.斯通 《高难度谈话:有效接收反馈的科学和艺术》
02/27 星期六
吉姆.洛尔 《精力管理》
02/28 星期日
吴晓波 《历代经济变革得失》
03/01 星期一
万维钢 《智识分子:做个复杂的现代人》
03/02 星期二
凯文.凯利 《必然》
03/03 星期三
斯蒂芬.茨威格 《人类群星闪耀时》