数学、逻辑和人工智能镜头下的进化论——自然是随机猜测者,还是数学天才?进化论背后 的终极数学哲学
如果进化是一个计算问题,自然是如何处理它?此外,它与计算的巅峰——人工智能有什么关系?根据新达尔文主义,大自然在很长一段时间里一直在盲目地选择基因突变中的变异。在这篇文章中,我试图通过人工智能和计算的视角来研究新达尔文主义关于机会和时间的概念。你会发现人工智能是如何将进化与P vs NP联系起来的,这是计算领域最重要的开放问题之一。
盲目的钟表匠
新达尔文主义说:
机会,无论多么罕见,只要有足够的时间通过诸如自然选择等验证过程加以完善,就能带来多样性、创造性和独创性。
我能够从数学和计算的角度去研究它。新达尔文主义者急于消除一个神圣创造者的必要性,他们强调利用时间和机会的随机性。时间和机会本身会创造奇迹。
有时,随机性会受到挑战,比如在钟表匠的类比中,如果你在地上发现一只手表,那么可以推断,不仅是有人把它仍在了地上,而且一定有一个钟表匠制造了它。然而,新达尔文主义者声称,尽管自然就像看似不可能的盲人钟表匠,但“自然选择”是将不可能性变成现实的非随机元素。
手表可能是一个盲人制表师的偶然产品,他既不知道手表是什么,也不打算制造手表。
随机猜测者和数学天才
下面是这样一个思维实验:
如果有足够的时间,一个精通遵循逻辑规则,但没有数学直觉的随机猜测者,能像数学天才一样解决问题吗?
如果你问新达尔文主义者,由于他们的中心信条,他们将不得不坚信,随机猜测显示了一个数学天才的创造力和独创性。然而,数学家会说,“这在数学上是不可能的。”计算机科学家也会做出类似的反应,认为这在计算上是不可行的。与盲人钟表匠不同,随机数学猜测实验可以在数学和计算机科学中找到对应的对象,因此辩论可以得到判定性的解决。
让我们从20世纪初开始,在杰出的数学家大卫·希尔伯特的领导下,数学形式主义者,使逻辑推理成为数学不可分割的一部分。这样,他们就可以把解决问题当作数学的一部分。他们认为直觉被认为是一种思想的人工制品,因此对数学的发展没有必要。因此,希尔伯特提出了希尔伯特方案,在这个方案中,数学可以从一组公理中完全展开,只使用逻辑。
知道希尔伯特的方案最终失败了,我们能得出直觉起什么作用呢?直觉首先“猜测”正确的公理,学习突出的数学事实,以及证明这些事实的必要逻辑步骤。然后用逻辑来验证这些猜测。正如我们所看到的,希尔伯特时代的数学家们淡化了猜测的艺术,认为它可以被随机猜测取代。因此,随机猜测思维实验相当于希尔伯特的方案。如果它可行,数学发展可能是盲目的,没有目的的,没有计划的,这正是新达尔文主义者描述生命进化的方式。
现在让我们来看看库尔特·哥德尔和艾伦·图灵的观点,他们证明了希尔伯特的方案在数学上是不可能的,因为自我参照必然存在悖论。根据哥德尔的说法,直觉不仅是不断完善和扩展公理的必要条件,而且根据图灵的说法,它还必须涉及到发现和证明数学事实(参见我的文章逻辑的极限与数学的困境,罗素用了362页才推导出1+1=2)。这意味着在数学的发展中需要人类的直觉,这意味着大自然可能根本不是盲目的。
数学与计算机科学
希尔伯特方案的数学谬误实际上可以用数学上的两个弱点来解释。首先,它缺乏解决问题所需时间的概念。其次,它没有配备猜测工具。矛盾的是,这种数学缺陷的发现导致了计算机和计算机科学的发明。
计算机科学根据运行程序的处理步骤来定义时间,并配备了一个工具——搜索,来处理猜测。随机和巧妙的猜测分别对应于蛮力搜索和智能搜索。正确猜测的微小概率可能与必须在一个大空间中通过蛮力搜索和长时间运行相关联。
计算机相关概念
总结:
蛮力搜索的运行时间与搜索空间大小成正比。
猜对的概率正比于1除以搜索空间的大小
现在,一个关于如何解决这个问题的数学问题可以看作是一个计算问题,数学可能性可以看作是计算可行性。在可行性方面,计算问题可以根据运行时间或搜索空间是指数增长还是多项式增长分为以下两种类型。我们可以认为第一类是不可行的,因为一个指数运行时间,或搜索空间,几乎为无限大(对人类来说)。第二种类型,称为P表示多项式时间,被认为是可行的,因为一个多项式运行时间,或搜索空间,一般可以容纳在宇宙的范围内。
P vs. NP:问一个新达尔文主义者
解决不可行的问题是无望的,而可行的问题似乎太容易而没有意义。幸运的是,还有第三种类型,称为NP(Non-deterministic polynomial -time),表示非确定性多项式时间。在这种情况下,做出正确的猜测可能很困难(指数时间),但验证猜测很容易(多项式时间)。希尔伯特方案可以被认为是一个NP问题,因为用逻辑推理来验证猜测显然是可行的,但如果用随机猜测或蛮力搜索,则是不可行的。
同样,根据新达尔文主义,盲目、无目的、计划外的进化就像用蛮力搜索来解决NP问题。自然选择作为验证机制必须采用多项式时间;否则,它将无法促进生命的进化。
正如我在逻辑大结局——直觉、复杂度和终极悖论,统治一切的程序一文中所解释的,有一类NP问题,称为NP完备问题,它被认为是所有NP问题中最难的。
如果一个NP完备问题存在多项式时间解,那么所有NP问题都可以简化为这样一个问题,并在多项式时间内求解,从而证明P = NP。确定P = NP被称为P vs NP问题。它是数学和计算,甚至是现代科学中最重要的开放问题之一。
新达尔文主义者将如何回答P = NP这个问题?如果演化可以被简化为一些NP完备问题,并被一个不理解生命的多项式时间NP完备求解器求解。因此,自然仍然是盲目的,创造性、独创性,对进化的预见仍然是一种幻觉。这正是新达尔文主义者所期望的。然而,他将被噩梦所困扰,必须解释是谁设计了这样一个多项式时间解算器。正如我们所看到的,新达尔文主义者会坚持P不等于NP。
埃米尔·波莱尔:罕见事件不会发生
埃米尔·波莱尔,1871 - 1956
回想一下,蛮力搜索相当于随机猜测。因此,指数增长的搜索空间表明了指数的运行时间和正确猜测的概率递减。为了方便起见,我们可以将搜索空间的大小表示为10^N,其中N是1之后0的个数。
因此,我们可以用N来表示搜索空间有多大,运行搜索需要多长时间,以及做出正确猜测的可能性有多大。新达尔文主义者坚持认为,无论N有多大,都有足够的时间来做出尽可能多的猜测。乔治·沃尔德(George Wald)的这句话或许最能说明这一立场:
如果时间足够长,(几乎)不可能变成了可能,可能变成了很可能,而很可能实际上变成了确定。
与新达尔文主义关于机会和时间的观点相反,法国著名数学家埃米尔·波雷尔在他的“单一机会定律”中说:
概率足够小的事件永远不会发生。
尽管它被称为“单一”定律,但它描述了两种主要情况,在第一种情况下,低概率应该被视为零。前者关注的是你如何做出日常或一生的决定,比如,你是想冒着死于车祸的危险开车去上班,还是因为天气预报不一定总是对而每天都要带伞,还是为了中彩票而赌上自己的退休金。
第二种情况与如何处理科学事实或工程决策有关。波莱尔估计有一个小于N = 50的概率(前文解释过N的含义)可能违反牛顿定律。但在设计桥梁、汽车或飞机,以及让人类登上月球时,我们会把这种可能性考虑为零。更进一步,考虑到统计力学的预测,我们不需要考虑容器中氧和氮的混合物会自发地分离成纯氮和纯氧的可能性。每个决定向右或向左移动的搜索空间的大小是N的数亿倍,在各个方面都比我们的宇宙大得多,波莱尔认为这样的搜索空间的大小是在超级宇宙的尺度上。
对于生命的进化,著名进化生物学家卡尔·萨根(Carl Sagan)估计,搜索空间为N = 20亿,即10分之1的20亿次幂的概率,以符合新达尔文主义的理论,即生命可以在任何一个给定的行星上完全偶然地进化。然而,新达尔文主义者认为他们的进化机制不是完全随机的,自然选择是非随机的因素。如前所述,如果进化被认为是一个NP问题,那么自然选择就是验证机制。使其可行或可能的唯一方法是在猜测或搜索中具有非随机性,这意味着在生成变体时存在设计或计划,这在核心教条中是被严格禁止的。
超越P vs. NP
尽管最坏情况指数时间表明P不等于NP,但启发式和近似求解器已经成功地应用于数学、芯片设计、软件检查以及与我们的日常生活有关的各种领域的关键任务决策。与此同时,我们正在见证人工智能通过模仿数学天才,在解决NP完全数学问题方面取得进展。
在生物学中,利文索尔悖论( Levinthal’s paradox)一直困扰着蛋白质结构预测(PSP),即从蛋白质的线性氨基酸序列中确定蛋白质的三维结构。这个悖论是:
尽管它有巨大的搜索空间,N大约是300,即使是一个小的蛋白质分子,它也会在毫秒甚至微秒的时间范围内自动折叠。
PSP被认为是NP完备的。DeepMind声称在使用人工智能程序AlphaFold上取得了突破,以前所未有的精确度和效率解决了PSP问题。现在的问题是:AlphaFold的成功是否证明了P = NP,如果它确实“解决了”PSP,一个已知的NP完备问题?答案是否定的,因为AlphaFold在学术上被归类为近似和启发式求解器之一。然而,与其他解决方案相比,AlphaFold和AI解决方案在以下方面表现突出:
即使在最坏的情况下,它们也不是指数运行时间
他们总是“开放”的,不断地学习和适应
如下所述,它们可以被设计成端到端的,以捕捉人类或自然的直觉
事实上,PSP之前宣称的NP完备可能是由于自然和人工问题公式之间的不匹配,导致搜索空间呈指数膨胀。相反,AlphaFold从自然界中学习,将蛋白质的氨基序列直接映射到端到端的最终三维结构上。它不是在一个超级宇宙搜索空间里跳来跳去,而是把搜索空间看作一个场景。
从这个意义上说,人工智能不仅为具有挑战性的问题提供了实用的解决方案,而且还启示我们,自然和人类可能会以类似的方式解决问题。更深层次的问题是自然如何选择那些可以折叠成三维结构的氨基酸序列。一个有趣的观察是,在进化的时间尺度上,自然用来选择蛋白质序列的“能量地貌”本质上与将这些序列折叠成功能蛋白质的“能量地貌”相同。这就引出了一种观点,即自然可能是通过在进化的地貌中导航而进化的。
来源:维基百科。箭头表示种群在适应度地貌上进化时可能遵循的各种突变路径。