AlphaGo Zero上线|阿尔法元面前,我们输了吗?
AlphaGo Zero面前,我们输了吗?
Nature于2017年10月19日新上线的重磅论文:Mastering the game of Go without human knowledge,《无需人类知识,掌握游戏规则》再一次将人工智能的话题腿上了风口浪尖。其中AlphaGo Zero闪亮登场,据说它在三天的学习之后,依靠在较之于阿尔法狗而言,数量极小的棋局参数基础上就从一个围棋小白变成为了打败阿尔法狗的新晋棋王。
阿尔法狗(AlphaGo)与阿尔法元(AlphaGo Zero)之间的区别究竟在哪里呢?作为对于人工智能的内在运行机制完全无知的哲学工作者,我只能依据各色报告所提供信息作出一个极为粗陋的划分:阿尔法狗所依赖的大数据的统计,基于整全性认知,因此它是一个一诞生就拥有了类似于上帝之视角和能力的围棋机器人;而AlphaGo Zero则是展现了一个围棋机器人的成长历程,借助于对相对小的数据样本,并依靠着不同阶段同一层次的陪练对手而逐渐“养成”的围棋达人。换言之,如果说,阿尔法狗类似于只存在于天国中围棋神灵,那么AlphaGo Zero则更趋向于是一个生活在尘世中的围棋机器“人”。前者以对经验的无限性积累与掌控而获得不败的战绩,因此,或许在它的面前,我们还可以说,我无法战胜如神一般的对手,那么在AlphaGo Zero的面前,我们却感到了真实的恐慌,因为它在三天前还大约与我们中任何一个人一样,对于围棋一无所知,而三天后,它却打败了被我们视为神一样的对手,阿尔法狗。
由AlphaGo Zero所引发的震动(甚至带有着些许恐慌)或可被概括为两点:其一,从有限知识向无限知识跨越的可能性似乎变成为现实性;其二,超强的学习能力和学习速度,是否为我们揭开了人类理解(human understanding)的黑匣子。而在这两个向度上,我们不得不承认,人类的思维及其创造能力都突然遭到了巨大的嘲弄。我们陷入了一个奇特的悖论当中,它类似于中世纪神学家所提出的有关上帝的悖论:上帝能否创造一个自己也无法举起来的石头?同理,人是否正在创造一个超越人类智慧的智能物?
人类自身是有限的,但我们却是一个能够认识到这种有限性,以追求无限性为己任的独特生物。我们构造神话与神学,发明这种与简单的维持生存毫无关系的富有“意义”的活动(围棋就算是其中之一),其所证明的或许正是,我们不是简单的服从于自然必然性的生物体,我们还有着超越必然性的能力。但其所实现的超越,总是带来一个让人哭笑的后果:即人类总是会陷入到“异化”的魔咒当中,即最终被自己创造的东西所控制。宗教是如此,我们所构筑的各色艺术与游戏,同样是如此。这其中的原因正在于我们将所有无限性的诉求放置于这些创造物之中,换言之我,我们将自身的无限性让渡给了它们。神是全知全能的,我们只能匍匐在它的脚下;艺术依赖于灵感与天才,它也并非是常人依赖于学习和知识的积累所能实现的,甚至今天诸如围棋一般的游戏,它规则以及对规则的灵活运用(近似于艺术的创造),也需要认真的学习以及无可名状的天赋的叠加才能成就名副其实的围棋大师。
人的这种异化存在样态,在某种意义上是AlphaGo Zero为我们提出的生存悖论的另一种表述方式,同时却也彰显了人之存在样态的独特性:人是无限性与有限性的共同体。灵与肉的并行不悖总是在不同时期有其不同的呈现样态。如果说在人类的原始时期,我们通过制造神话来完成这种有限性与无限性的并置,那么这一任务在中世纪则被宗教来替代,而今,AlphaGo Zero的出现,在我看来,是现代人的新宗教形态。它所带出的整个人工智能领域的讨论构筑了人类放置自身无限性的诉求的一个新场所。因此,我们可以预言,AlphaGo Zero,绝非阿尔法系列的终点,它注定是无限序列中的开端,它的延伸将是无限的。它是人类无限性一维存在的新样态。
换言之,如果我们要将人类与AlphaGo Zero做一个比较的话,我们会发现,人类是一个有限与无限并行相悖相生的二元存在物,而AlphaGo Zero则是一个“似乎”用有限战胜无限的一元存在物。
当我对AlphaGo Zero做这样一个界定的时候,我必须指出,这里的“似乎”的含义所在。显然,由AlphaGo Zero所敞开的有限性向无限性的挑战,两者仅仅是一个量上的区别,换言之,AlphaGo Zero作为一个过程性存在物,较之于阿尔法狗而言,其差异仅仅是样本数量级数的差异,而非质的差异,但同样作为过程性的存在的人类,在其学习的过程中,却永远不是一个量的积累,它在每一个阶段都包含着质的飞跃,比如语言的学习与思考能力的增长,都包含着诸多无法用量的积累来加以说明的跳跃。因此,其有限性与无限性之间的跨越就变成了一个不可理解的问题。但在AlphaGo Zero的学习过程,其有限性与无限性之间却可以比较大小的。所谓AlphaGo Zero所处理的490万棋局与阿尔法狗所处理的三千万个棋局之间的PK。从棋局数量的处理上说,即便是围棋小白AlphaGo Zero在其学习过程中的这个所谓“有限性”对于一个拥有着有限生命的人来说已经是不可企及的,因此它已经算是人的一种无限性的诉求,它与人的有限性有着质的区分。由此可见阿尔法狗向阿尔法元的过度,所实现的,严格说来,并不是一场革命,而是一次数量级的渐进,尽管这次数量级的缩减是巨大的,但却仍然不过仅仅是一个数量的变化,这类变化虽然是现实的有限的人无法企及的(正如现实的任何的一个棋手都无法达到这种训练),但却是有限的人的技术能力可以操控的,因为这种数量级的变化都还没有超越既有的技术范式,(诸如神经网络),没有范式的根本转换,谈不上真正的革命,因此AlphaGo Zero所表达出的有限性对无限的挑战,本身是有限的。
从这一意义上说,AlphaGo Zero所实现的强化学习的示范并没有解开人类理解的黑匣子,对于这个黑匣子的研究,哲学,作为人类思维的最高形态一直付出艰辛的努力,从洛克的《人类理解论》到莱布尼茨的《人类理解新论》以及休谟的《人类理解研究》,直至康德《纯粹理性批判》等等,都在努力思考一个外在,与我们完全不同的事物如何与我发生联系,被我习得,并成为我所认知抑或表象的知识究竟是如何可能的,我们因此拥有了经验论(主张经验的积累)与唯理论(主张天赋观念论)以及诸如康德的先验经验主义(主张先天范畴对于经验所给出的根据)。AlphaGo Zero所展现出的强大的学习能力虽然让人汗颜,但却不过是建基于一种经验论框架内一种讨论方式,它所遵循,从而证明的仅仅是有关人类学习能力得以可能的一个经验主义向度,更何况,由于它所实现的学习强度根本不是正常人类所能企及的,因此对于内在习得机制的分析而言,可谓毫无推动和贡献,同时对于思考正常人类的学习过程该如何展开,也毫无可资借鉴的方面。与之不同的是,常人建基于正常时间内的学习能力恰恰表现出了量化积累无法说明的跳跃性的一维,这是人特有的超越能力的表现,也是不同有关人类理解之不同思考路径的难点坐在,但现在AlphaGo Zero所实现的不过是在超越常人极限的角度下的思考,反而从根本上回避了有关人类理解的要害所在:我们自身虽然从未能够实现在三天内数一百万计的棋局处理能力,我们却可以制造出这样的一个机器去完成这一工作。从这一意义上说,AlphaGo Zero以及其后可能存在的所有人工智能序列都无法超越人。因为它们的计算能力无论如何强大不过是人类技能发展的单一维度的进展。只要其最终无法达到人的二重性共在的状态,它就无法真正构成对“人”的威胁。因此那些看到阿尔法系列的成功,而担忧人工智能之胜利的人们,无需杞人忧天了。