AlphaGo与未明言知识

一、围棋

围棋,起源于中国,中国古代称为“弈”,可以说是棋类之鼻祖,至今已有4000多年的历史。

据先秦典籍《世本》记载,“尧造围棋,丹朱善之。”

晋张华在《博物志》中继承并发展了这种说法:“尧造围棋,以教子丹朱。若白:舜以子商均愚,故作围棋以教之。”

围棋相传为帝尧所作,属琴棋书画四艺之一,于隋唐时经朝鲜传入日本,流传到欧美各国。

这是一种策略性两人棋类游戏,蕴含着中华文化的丰富内涵。

喜欢战略的人也喜欢下围棋。

孔子说过:“饱食终日,无所用心,难矣哉!不有博奕者乎?为之,犹贤乎已。”

在很多方面,围棋的地位甚至高于国际象棋——另一种很难的无运气成分的策略性博弈。

顶级的人类围棋选手如何操控如此玄妙的复杂性,然后连出妙手?

这个问题没人知道答案,就连选手们自己都说不明白。

事实证明,所有人都不能通晓自己所了解的全部知识。

二、波兰尼悖论

当我们识别一张脸或骑一辆自行车时,事后反思一下,我们也不能完全解释自己为什么能这么做。

这种隐性知识很难显性化。

20世纪英籍犹太裔大学者迈克尔·波兰尼的观察精彩地总结了这个状况:“我们所知的多于我们所能说的。”

波兰尼认为人类的知识有两种:

1、显性知识:通常被描述为知识的,即以本面文字,图表和数学公式加以表述的,

2、隐性知识:未被表述的知识,比如在做某事的行动中所拥有的知识,也称为未明言知识。

区别于能够用各种明言符号加以表述的显性知识,隐性知识是指那种我们知道但难以言传的知识。

同时,波兰尼提醒我们不要把隐性知识理解为神秘经验,隐性知识只是难以用语言来充分地表述,而不是说对这类知识绝对地不能言说。

在波兰尼看来,隐性知识本质上是一种理解力,即领会经验、重组经验的能力。

波兰尼的隐性知识是存在于个体中的、私人的、有特殊背景的知识,隐性知识以个体内在携带的“意会模型”为中心,这些意会模型是概念、形象、信仰、观点、价值体系以及帮助人们定义自己的世界的指导原则。

另一方面,隐性知识也包含一些技术因素,包括具体的技能和专门技术以及来源于实践的经验。

实际上,追溯到古希腊时代,哲学家们已经认识到这一点并做了探讨。

在柏拉图的《米诺篇》中,苏格拉底和米诺开始讨论什么是美德时,米诺提出“但是你连它是什么都不知道,又如何去寻找呢?你会把一个你不知道的东西当作探索的对象吗?换个方式来说,哪怕你马上表示反对,你又如何能够知道你找到的东西就是那个你不知道的东西呢?”

苏格拉底认为,米诺实际上是提出了关于认识活动的“两难悖论”,即:

  • 一个人既不能试着去发现他知道的东西,也不能试着去发现他不知道的东西。

  • 他不会去寻找他知道的东西,因为他既然知道,就没有必要再去探索;他也不会去寻找他不知道的东西,因为在这种情况下,他甚至不知道自己该寻找些什么。

对此,柏拉图在《米诺篇》中以苏格拉底的名义用“回忆说”来解决这一悖论。

在柏拉图看来,灵魂是不朽的,关于实在的真理一直存在于灵魂中,只不过灵魂在和人们的肉体相结合时忘掉了种种知识。

因此,在人们进行学习或是探究某个问题的解决时,看似是在试着去发现他不知道的东西,但实际上是在进行回忆。

这个解释显然已经无法让多数现代人满意,波兰尼生活的时代,在逻辑实证主义的推动下,强调认识的客观性、超然性和非个体性特征的客观主义认识理想盛极一时。

随着科学的发展,科学家和哲学家们逐渐发现了这种认识理想的理论缺陷,并在各自的理论中对客观主义认识理想进行了批判。

在这样的背景下,波兰尼提出了默会认识理论,使人们的视线开始转向存在于言传认识背后的默会认识。

默会认识理论通过对认识的默会维度的揭示,对客观主义的认识理想进行了批判,并代之以个人知识理想,开拓了认识论研究的全新视野。

三、AlphaGo

显然,“波兰尼悖论”给任何试图开发围棋电脑程序的人设置了重大障碍。

如果没人能清楚地表达战略,那么你又如何编写包含最佳对弈战略的程序呢?

退一步说,对一些定式进行编程是有可能的,但是当面对那些能够以自己说不清楚的方式超越定式的优秀选手时,这样做是无法取胜的。

程序员通常借助模拟来操控诸如围棋的所有可能下法之类的复杂环境。

他们编写程序,下一手乍看还好的棋,然后探测所有对手对这手棋的合理回应,以及对每次回应的所有合理回应,等等。

最终选中的一手棋,本质上就是有着最多后续妙手、最少后续恶手的一手棋。

然而,围棋的潜在棋局如此之多,下法如此丰富,因此即使是装满超级电脑的机库,也无法模拟哪怕其中的一小部分。

由于关键知识不可得,模拟又无效,因此一直以来围棋编程进展缓慢。

2014年5月,哲学教授艾伦·莱维诺维奇在《连线》杂志发表文章,探讨电脑围棋的现状和可能进展,结论是:“再用10年让电脑围棋胜出,这可能太过乐观。”

2015年12月,心理学教授及游戏专栏作家克里斯·查伯里斯在《华尔街日报》撰文,标题就是“为什么电脑依然无法攻克围棋”。

然而,就在2016年3月,AlphaGo的开发者打破了这些预言。

区别于原来的思路,AlphaGo并没有尝试用超级围棋战略和定式进行编程。

相反,他们创建了一个可以自我学习的系统,这个系统通过大量对弈研究棋盘下法,并从中学习。

阿尔法狗被用来识别大量数据中存在的微妙模式,并将动作(如在棋盘某个特定位置下子)与结果(如赢得围棋对弈)联系起来。

该软件可从在线棋局库中获取3 000万种棋盘下法,并且被告知“用这些数据来了解如何获胜”。

AlphaGo还与自己进行多场对弈,生成了另外3 000万种下法,然后进行分析。

系统在对弈过程中进行模拟,但只针对重点下法;它使用从研究数百万种下法中累积的学习结果,模拟它认为最有可能获胜的下法。

从哲学层面看这个问题,AlphaGo创造“不可能的奇迹”最重要的原因就是突破了原有系统的束缚,建立了新的机器逻辑系统。

更深层次的,这个机器的逻辑系统可以自我更迭,其速度会超出人类的想象。

人类认知的局限性,波兰尼悖论在机器逻辑的自我更迭中被打破。

机器逻辑的自我更迭也会解放人类,人类不再需要去指导、纠正机器的学习,而是让机器自我学习、自我更迭。

AlphaGo的成功就是机器学习的一大步,利用机器来探索世界的大门也正在慢慢打开。

心归航,再启航

愿每日微小知识激发你的深刻思考

(0)

相关推荐