空空如也的大脑 | 为什么科学家把人类当成了计算机?
1 新智元编译
来源:神经现实、dlacombejr.github.io
译者:*黄玉杰、*ki bear、闻菲、胡祥杰
今天是2016年9月14日
AI WORLD 2016世界人工智能大会倒计时 33 天
启航期5折抢票倒计时5天
【新智元导读】借鉴脑科学的研究,是否有助于发展人工智能?《今日心理学》前主编、心理学家 Robert Epstein 日前在 Aeon 刊文,指出将大脑比作计算机误导了我们对智能的认知,阻碍了脑科学发展。Epstein 认为,“大量的资金被用于脑科学研究,然而某些研究却是基于错误的观点和根本无法兑现的诺言”。
对此,佛罗里达大西洋大学计算机视觉博士生 Daniel C. LaCombe, Jr 做出了回应。LaCombe 认为,信息处理比喻是迄今我们对大脑工作原理最好的解释,Epstein 没有正确理解“计算”在人工智能中的主要作用及其与大脑的联系。
下面先是 Epstein 的文章,后面是LaCombe 的回应。我们欢迎你不仅观看,也加入讨论。
正方:你的大脑不处理信息,它不是计算机
空空如也的大脑
【译文转自微信公众号“神经现实”】
作者:Robert Epstein | 来源:Aeon
翻译:黄玉杰,ki bear | 校对:岳川
半个多世纪以来,心理学家、语言学家、神经学家以及其他人类行为领域的专家都认为,人类大脑正是像电脑一样工作。把人类智能当做“信息处理”的比喻,不管是在普通人心中还是在科学界,都占据了主导地位。几乎所有提及人类智能行为的论述,都免不了采取这种比喻。
我们为什么对这个比喻如此执着?它真的可以解释我们的思维吗?它会不会成为我们理解人类意识的误区?
不管如何努力,脑科学家和认知心理学家们永远也不会在人脑中找到贝多芬第五交响曲的乐章,文字、图片、语法规则或是其他任何类型的外界刺激。当然,大脑并不真的是空的。但那些人们通常认为存在于大脑中的许多事物,即使是最简单的东西,比如“记忆”,也并没有存在于大脑之中。
我们对大脑的愚昧认知有着深刻的历史根源,特别是受到了20世纪40年代计算机发明对人类所带来的影响。半个多世纪以来,心理学家、语言学家、神经学家以及其他人类行为领域的专家都认为,人类大脑正是像电脑一样工作。
想想婴儿的大脑,你会明白这样的想法是多么空洞。多亏了生物进化,人类的新生儿,如同其他所有哺乳动物的新生儿一样,当它们来到这个世界时已经做好了与这个世界互动的准备。婴儿的视力模糊,但它们会重点关注脸部,并且能够迅速认出自己的母亲。相比其他声音,它更喜欢人声,可以区分不同的对话。毫无疑问,我们生来就是为了建立社交关系。
一个健康的新生儿还具备了十几种反射——随时应对某些对生存极为重要的刺激。它会把头自动转向触碰它脸颊的物体,吮吸任何进入口中的东西。当它潜入水中时,会屏住呼吸。它会紧紧抓住任何被放置在手上的物体,几乎可以承受住自己的重量。或许最重要的是新生儿与生俱来的强大学习机制,尽管这个世界同它们祖先生活的时代已经大不相同,但他们能够迅速变化,从而更加有效地与之互动。
感官、反射和学习机制——这是我们与生俱来的礼物。想想还挺丰富。如果在出生时,我们缺乏了其中任何一个技能,那么很可能会难以生存。
但以下这些并非与生俱来:信息、数据、规则、软件、知识、词汇、表征、算法、程序、模型、记忆、图像、处理器、子程序、编码器、译码器、符号和缓冲器——这些使数字计算机能够表现出智能化的设计元素。这些元素我们不仅没有,而且永远也不可能进化出来。
生物体不会处理信息
我们并不“存储”单词或是指导我们运用单词的语法。我们不会创建视觉刺激下所形成的“表征”,把它们“存储”到短期缓存区后,在“传输”到长期的记忆存储器中。我们不会从寄存器中“检索”信息、图像或单词。这些都是计算机做的事,可生物体不会这样。
电脑确实是在“处理信息”——数字,字母,单词,公式,图像。这些信息首先会被编译成它能使用的格式,也就是从0和1的位(bit)到小块的字节(byte)。在我的电脑里,每个字节包括8个位,一个字节可以存储一个英文字母。比如,字母d、o和g分别对应不同的字节。把这三个字节放到一起,就形成了单词“狗”。一个单一图像——比如我的猫(Henry)在我桌上的照片——由一百万个字节(1M)的特定组合所表征出来,并且需要用一些特殊的字符来指导电脑,告诉它是生成一个图像,而不是一个单词。
电脑确实是在移动这些数据,把它们从不同的物理存储器写入到电子器件中。有时它们也会复制数据,或者用其他的方式传输数据——比如在我们修正手稿中的错误或者润色图片的时候。电脑所遵循的移动、复制和操作数据组的规则也都存储在电脑内部。这些规则统称为“程序”或者“算法”。可以帮助我们做事(比如炒股或网上约会)的一组同时运行的算法,被称为“应用”——现在许多人称之为“app”。
请原谅我啰嗦了这么一段计算机概述,我需要弄明白:计算机确实是在这个世界的符号表征上运行。它们存储和检索,处理信息。它们有着物理记忆。它们所执行的任何指令,无一例外的,都是遵循“算法”的指导。
为什么科学家把人类当成了计算机?
而人类,却从来没有,今后也永远不会这样。既然如此,为什么如此多的科学家们研究讨论我们的精神状态,就像把我们当成了计算机?
人工智能专家乔治·扎克达基斯(George Zarkadakis),在他2015年的著作《我们自己的形象》(In Our Own Image)中,描述了人类在过去2000年里使用过的用以解读人类智能的6种不同的比喻。
最早的一个,是《圣经》中所记载的故事。人类由黏土或泥巴造出,再被智慧之神赋予了精神。这个“精神”解释了我们的智能——至少从字面上说是这样。
公元前3世纪水利工程的发明,引领了人类智能液压模型的流行。这个观点认为,人体内不同液体的流动——“体液”——可以为我们的身心功能做出解释。“液压模型”这一比喻持续了1600多年,在此期间始终阻碍着医学的发展。
到了16世纪,由弹簧和齿轮驱动的自动装置被设计出来,这鼓舞了勒内·笛卡儿(René Descartes)等著名思想家。他们相信,人类是复杂的机器。到了17世纪,英国哲学家托马斯·霍布斯(Thomas Hobbes)认为,思维来自于大脑内部小型的机械运动。到了18世纪,电学和化学领域的新发现带来了人类智能的新理论——本质上主要还是一个比喻。19世纪中期,德国物理学家赫尔曼·冯·亥姆霍兹(Hermann von Helmholtz)受到通信领域研究进展的启发,把人脑比作了电报。
Henri Maillardet 发明的可绘画自动机 Draughtsman-Writer
数学家约翰·冯·诺依曼直截了当地指出人类神经系统的功能“表面看来是数字的”,他做了个比较,把那个时代计算机器的部件和人脑的部件一一对应起来。
每一个比喻都反映出各时代最先进的思想。不出所料,在计算机技术出现没几年的20世纪40年代,大脑就被说成是像电脑一样运转,大脑本身扮演了硬件的角色,而思想是它的软件。1951年,心理学家乔治·米勒(George Miller)的著作《语言和交际》(Language and Communication)出版标志着如今被广泛称为“认知科学”的诞生。米勒提出,利用信息理论、计算学和语言学可以对人类的精神世界展开细致的研究。
1958年,在数学家约翰·冯·诺依曼的短篇著作《计算机与大脑》(The Computer and the Brain)中,这一思想得到了最终体现。冯·诺依曼直截了当地指出,人类神经系统的功能“表面看来是数字的”。尽管他也承认,对于大脑在人体推理和记忆中到底扮演了何等角色,我们几乎一无所知。他做了个比较,把那个时代计算机器的部件和人脑的部件一一对应起来。
将人脑比作处理信息的机器,建立在错误的推导基础上
在计算机技术和大脑研究领域持续发展的推动下,各个不同领域的专家都在为理解人类智能做出雄心勃勃的努力。而这一切都扎根在“人类就像是电脑般的信息处理器”这种观点上。目前有成千上万的研究者,消耗了数亿资金在从事这项工作,他们写出了大量的文献,包括技术文章和主流书籍。以2013年出版的雷·库兹韦尔(Ray Kurzweil)的《如何创造思维:揭示人类思维的奥秘》(How to Create a Mind: The Secret of Human Thought Revealed)为例,他在书中推测了大脑的“算法”,大脑“处理数据”的方式,以及从表面来看大脑结构如何起到集成电路的作用。
把人类智能当做“信息处理”的比喻,不管是在普通人心中还是在科学界,都占据了主导地位。几乎所有提及人类智能行为的论述,都免不了采取这种比喻。就像如果不提及精神或者神性,在过去那些时代和文化背景下,任何形式的关于人类智能行为的观点也无法成文。在当今世界看来,IP比喻毫无疑问是正确的。
但是“信息处理”(IP)这个比喻,毕竟也只是又一个比喻——仅仅是为了搞懂我们并不明白的事物而提出来的一个解释而已。就像上文所提过的所有比喻,IP比喻也会在某一天被抛弃——或者被其他比喻所取代,或者终究被真正的知识所否定。
就在一年前,我访问了某个世界上最负盛名的研究机构。在那里提出了一个挑战,我问那儿的研究者们,能不能在解释人类智能行为时绝口不提IP比喻的观点。他们做不到。当我在随后的邮件往来中礼貌提出这一问题时,他们连着几个月依然没有给我提供任何消息。他们当然意识到了这个问题。他们也并非认为这是个微不足道的挑战。但他们就是找不出替代品。也就是说,IP比喻具有“粘性”。这些语言和思想的力量如此强大,阻碍了我们的思维,以致我们总是跳不出这个圈。
IP比喻的错误逻辑很容易理清楚。它基于一个错误的三段论——也就是两个合理的前提加一个错误的结论。合理前提#1:所有的电脑都能表现出智能行为。合理前提#2:所有的电脑都是信息处理器。错误结论:具备智能行为的所有实体都是信息处理器。
通俗点说,仅仅因为电脑是信息处理器,就认为人类一定是信息处理器,这种观点实在太傻了。今后某一天,等到IP比喻最终被抛弃,历史学家们肯定也会这么认为。就像我们现在回顾液压比喻和机械比喻,会觉得它们很傻一样。
那么既然IP比喻这么傻,为何又这么粘人呢?是什么阻止了我们甩开它,就像我们会扫除阻碍前进道路的障碍?有没有办法理解人类智能,而不用拄着这根破烂的智力拐杖?长久以来我们如此的依靠着这根破拐杖,已经付出了什么代价?IP比喻,在这几十年里在各种领域指导了大量的学者写作和思考,我们又为此付出了怎样的代价?
大脑并不是计算机
这些年来,我重复进行了很多次同样的课堂练习。首先,我会招募一个学生,让他在教室前面的黑板上画出一副详细的——“尽可能详细的”——1美元钞票图。当这个学生画完后,我会用纸把图盖上,然后从钱包里取出1美元,把它按在黑板上,让这个学生照着重新画一次。当他/她画完后,我会拿走遮挡第一幅画的纸,然后让全班同学来比较两者的区别。
你也许从来没见过这样的场景,也很难想象最后的结果,所以我让研究机构里曾经上过我课的一个实习学生Jinny Hyun,画了两幅画。以下是她来自“记忆”的作品(注意这个比喻):
这是她看到1美元钞票后照着画下的另一幅图:
Jinny看到两幅图之后,也和你们一样,倍感惊讶。但这却是个典型。可以看到,在没有美元钞票作参考照着画的情况下,凭记忆所画出来的图像简直可怕,尽管对于Jinny来说,她已经见过这张钞票成千上万次了。
那么问题在哪?我们大脑里不是有个关于1美元钞票的“表征”“存储”在“记忆寄存器”里吗?难道不能使用“检索”功能然后用它来画出这个1美元钞票?
显然不行。即使神经科学再发展一千年,也永远不会在大脑中找到一个“存储”1美元的“表征”,理由很简单,因为大脑里压根就不存在这东西。
认为记忆存储在单个神经元中这一观点实在荒谬:细胞如何存储记忆?况且又能存储在细胞何处?
丰富的大脑研究资料告诉我们,事实上即使是最普通的记忆任务,也有多个不同的或许更大面积的大脑区域牵涉其中。当人体表现出强烈的情感时,成千上万的神经元会变得更活跃。2016年多伦多大学神经心理学家布莱恩·莱文(Brian Levine)等人在对一则飞机失事幸存者的研究中发现,当幸存者们回忆空难时,“杏仁核、内侧颞叶、前后中线和视觉皮层”的神经活动有所增加。
部分科学家提出的“具体记忆以某种形式存储在单个神经元中”这一观点实在荒谬;如果真是这样,那就把记忆这个问题推到了一个更具挑战性的层面:毕竟,细胞如何存储记忆?又能把记忆存储在何处呢?
所以,当Jinny凭记忆画1美元时,发生了什么?如果Jinny以前从未见过1美元,那么她所画的第一幅图和第二幅图之间就不会有相似之处。因为曾见过1美元,这一切便发生了改变。更确切点说,她的大脑想象出了1美元的样子,也就是说,她的大脑在某种程度上重新体验了见到1美元的情景。
这两张图的区别提醒我们:对某个事物仅靠想象(即凭空忆起某物)的准确性远远不如真实见到它的存在。这也正是我们更善于识别而不是回忆的原因。当回忆某个东西(在拉丁语里,回即“重新”;忆即“留意”),我们必须尝试重温一次体验;但在识别某个东西时,我们只需要意识到自己以前曾经有过这样的感觉。(译者注:remember最初源自拉丁语rememorari。)
也许你不会相信这个结果。Jinny以前见到过1美元钞票,但她没有刻意“记下”钞票的样子。你也许会说,假如她认真记了,那么很有可能凭空画出第二幅图。但即使如此,也完全不能说明1美元钞票的图像“存储”在了Jinny的大脑中。她只是准备得更充分从而能够准确描绘出这张钞票,这就和钢琴家通过反复练习可以在弹奏时脱离原谱,熟练弹奏出乐曲是一个道理。
通过这个简单的联系,我们可以开始构建人类智能行为的非比喻性框架了,在这个框架中,大脑并不完全是空的,但至少没有“IP比喻”的位置。
构建人类智能行为的非比喻框架
人生在世,我们会被很多经验改变,其中最主要的有三种:(1)我们观察身边发生了什么(他人的行为,音乐的声响,下达的指令,页面上的单词,屏幕上的图像等);(2)我们处于弱刺激(比如警笛)和强刺激(比如警车出现)联合作用之下;(3)我们因特定的行为得到惩罚或者奖励。
如果我们根据这些经验做出改变——写一首诗或者唱一支歌;遵循收到的指令;对弱刺激和强刺激做出更类似的反应;少做无益之事多做有益之事——那么我们会变得更有效率。
尽管标题有些误导(指“空空如也的大脑”),毕竟没有人真的知道我们在学唱一首歌或者背下一首诗之后大脑发生了什么变化。但不管是歌还是诗都没有“存储”在大脑里,大脑只是按照某种有序的方式发生了变化,使得我们能够在特定的情况下唱出这首歌或者背诵这首诗。当表演的时候,歌或者诗都不是从大脑中某个地方“检索”出来的,就像我在桌上敲手指的时候,手指的运动也不是“检索”出来的。我们就是唱或者背出来——没必要“检索”。
哥伦比亚大学的神经科学家艾瑞克·坎德尔(Eric Kandel)因识别出海兔(一种海蜗牛)在习得某项行为之后神经突触内发生的某些化学变化而获诺贝尔奖。几年前,我曾经问他,我们理解人类的记忆行为还要多久?他立马回答我:一百年。我当时并未想到要问他是否觉得“IP比喻”阻碍了神经科学的发展,但很多神经科学家确实已经开始思考这个之前不可想象的事实——这个比喻并非必须。
一小部分认知科学家现在已经完全抵制“人脑就像计算机”的观点了。其中最著名的是辛辛那提大学的安东尼·卡梅伦(Anthony Chemero),《激进具现认知科学》(Radical Embodied Cognitive Science)一书的作者。主流观点认为,我们像计算机那样,通过对心理表征执行各种计算来理解这个世界,但是,卡梅伦和其他科学家描述了另外一种方式,将人类智能行为理解为生物体同外界环境的直接互动。
欧洲人类大脑计划是一个最无耻的神经科学研究走上歧途的例子
这种观点现在被某些人称之为人类机能“反表征”。为了说明这种观点同信息处理观点之间的巨大差异,这里举一个我最爱的例子。这个例子涉及到两种不同的理论,用来解释棒球运动员如何接到飞行中的球,由迈克尔·麦柯毕斯(Michael McBeath)(如今在亚利桑那州立大学)及其同事于1995年在《科学》上发表的一篇论文提出。为了拦截飞行中的球,信息处理的观点要求球员估计球在飞行中的各种初始条件:击打力度,轨道角度,诸如此类。然后建立一个内在模型分析球可能的运动轨迹,并用这个模型去不断指导并调整自己的动作。
如果我们真的像计算机那样运作,那么这是个不错的模型。但麦柯毕斯和他的同事提出了一个更简单的解释:为了接到球,球员只需要在运动过程中,保持球和本垒以及四周环境的视觉关系不变即可(用术语表示就是“线性光学轨迹”)。这听起来也许有些复杂,但它实际上非常简单,并且与计算、表征、算法完全无关。
我们永远不必担心有人在赛博空间发狂,不过我们永远也无法通过下载思维来永生。
英国利兹贝克特大学的两名心理学教授安德鲁·威尔逊(Andrew Wilson)和萨布丽娜·戈隆卡(Sabrina Golonka)决定收集一些简单、合理、并且可以跳出IP比喻框架的例子,包括上面的棒球例子。他们这些年一直经营着一个博客,主题是他们自称的“一种更有条理、更自然的研究人类行为的科学方法……与主流认知神经科学方法完全不同”,然而这远远还不成气候,主流的认知科学仍然无条件的接受IP比喻的说法,并且,某些世界最有影响力的思想家甚至根据这个比喻对人类未来做出了一些宏伟预言。
其中一个预言由未来学家库兹韦尔、物理学家史蒂芬.霍金以及神经科学家兰德尔·科纳(Randal Koene)等人提出。这个预言认为,既然人类的意识类似于电脑软件,那么在不久的将来我们可以将人类的意识上传到计算机中,通过电路我们将获得超强的智力,甚至很有可能不朽。这个概念启发了一步反乌托邦电影《超验骇客》。这部电影由约翰尼.德普主演,他在其中扮演了一个类似库兹韦尔的科学家,其意识被载入到了互联网中,结果给人类带来了毁灭性的后果。
幸运的是,IP比喻一点都不可靠,所以我们永远不必担心有人在赛博空间发狂,不过可惜的是,我们也永远无法通过下载思维来永生。这不仅是因为大脑中并没有意识软件,而且还有一个更深层次的问题,这个问题既令人鼓舞又令人沮丧,姑且让我们称之为唯一性问题吧。
由于大脑中既没有“内存条”也没有所谓刺激的“表征”,并且,我们活在这个世界上所需要的不过是由于大脑根据我们的经历作出了一系列有组织的改变,因此,没有任何理由可以认为任意两个人会有相同的经历以及相同的改变。即使我们同时参加一个音乐会,当听到贝多芬第五交响曲时,我的大脑中发生的变化与你的大脑中发生的变化也会完全不同。这些变化,无论它们是什么,都建立在现有的独特的神经结构上,而每一种结构都是由我们此生独特的经历发展而来。
这也是为何没有两个人可以完全相同地复述同一个故事的原因,并且他们的复述随着时间的推移差别会越来越大,如同弗雷德里克·巴特莱特(Frederic Bartlett)在他的书《记忆》(Remembering)中描述的那样。人们在听到故事的时候,脑海中并没有产生故事的副本,而是各自发生改变,改变大到足够在之后被问到这个故事的时候(在巴特莱特读完故事之后的几天,几月,某些情况甚至几年),他们可以重现听故事时的情景——尽管并不完美(参考上面第一张美元的图画)。
这很令人鼓舞,毕竟,这意味着我们每个人都独一无二,不仅仅是因为基因构成,而且因为我们的大脑无时无刻不在发生改变。这也令人沮丧,因为这也让神经科学家的任务更艰难了,超出想象。对于任何一个特定的经历,其产生的有序变化涉及到成千上百万个神经元甚至整个大脑,每个大脑中的变化模式也完全不同。
更糟糕的是,即使我们有能力给大脑所有的860亿个神经元拍一个快照然后在计算机中模拟这些神经元的状态,这个巨大的模式在离开产生它的大脑之后也毫无意义。这也许是IP比喻对我们考虑人类行为带来的最大的误解。考虑到计算机确实储存了数据的精确副本——那些在漫长的时间中、即使电源关掉也能够保持不变的副本,然而大脑仅仅只能够在它活着的时候维持我们的智力。并没有什么开关,要么大脑保持运转,要么我们消散。此外,如同神经生物学家史蒂芬·罗斯(Steven Rose)在《大脑的未来》(The Future of the Brain )中指出的那样:除非我们知道这个大脑拥有者的整个生命历程,甚至有可能还要知道他/她所处的社会环境,否则一个大脑当前状态的快照仍然毫无意义。
我们来分析下这个问题有多么难吧!仅仅为了搞清楚大脑维持人类智力的基本原因,我们就需要知道860亿个神经元的当前状态以及它们之间100万亿的相互连接状态,不仅仅是连接的强度,也不仅仅是每个连接点中超过1000种蛋白质的状态,还包括大脑每时每刻的活动对整个系统的影响。再加上每个大脑由于个人生活所带来的独特性,这样一想坎德尔的预言显得过于乐观了。(在纽约时报最新的一篇专栏中,神经科学家肯尼斯·米勒(Kenneth Miller)指出,仅仅为了搞清楚神经元之间的基本连接,可能就要花费数个世纪。)
同时,大量的资金被用于脑科学研究,然而某些研究却是基于错误的观点和根本无法兑现的诺言。《科学美国人》报导了一个最无耻的关于神经科学研究走上歧途的例子。2013年,欧盟启动了“人类大脑计划”,整个项目投资13亿美元,项目创始人亨利·马克拉姆(Henry Markram)魅力非凡,他信誓旦旦地表示:2023年他可以在超级计算机上模拟出整个人脑,并且这样一个模型可以给阿兹海默症以及其他一些病症的治疗带来颠覆式的变化。欧盟官员资助了他的项目,并且几乎毫无限制。结果不到两年,这个项目变成了“大脑残骸(brain wreck)”,马克拉姆也被要求辞职。
我们是有机体,而不是计算机。别纠结了,忘记它吧。让我们继续试图理解我们自身,但这一次,不要再被没必要的智力包袱阻碍。IP比喻已经盛行了半个世纪,一路上几乎毫无所获。是时候按下删除键了。
反方:人脑既是有机体,也是计算机
(文/Daniel C. LaCombe, Jr)在认知科学中,再现论(主张头脑只有通过思想才能理解客观事物的一种理论)的地位已经得到普遍接受。在这个学科背景基础之上,我读了一些关于反再现论的观点文章,比如劳伦斯·夏皮罗(Lawrence Shapiro)的“Embodied Cognition”(体验认知) 和 O'Regan 关于感觉运动的意识理论,以客观地看待我的工作。
这些作品对我的研究并没有产生重大影响,因为他们所列举的例子中,一些形式的“再现”看起来依然是必需的。我现在的日常研究聚焦于人工智能神经元网络,深度学习是每日的基础词汇。最近,我在 Aeon 上看到了一篇文章,在 Reddit 和 Facebook 上也见到了很多有关这篇文章的讨论。在文章中,备受尊重的 Robert Epstein 博士展示了自己的立场:反对用计算机来比喻人脑。
接下来的文章中,根据在认知心理学和机器学习与人工智能相关领域短期的实践经验,我将对这种观点进行回应。
《空空如也的大脑》讲了什么
在那篇文章中 Epstein 想要表达的主要观点是:使用我们最先进的技术——计算机来比喻大脑,扰乱了我们对人类大脑的理解。他在文中用的词是信息处理比喻(IP Metaphor)。Epstein 强调,人类并没有,也永远不会进化出计算机所拥有的关键组件,比如软件、模型和存储缓冲器。确实,计算机是通过移动大量成串的、以兆节编码的数据,使用算法来处理信息。这并不是人处理信息的方式,至少不是天生如此。
Epstein 发现,几乎没有人能够不借助信息处理的比喻来解释大脑运作的原理,而他认为这是一个很大的问题。Epstein 指出,这种比喻是基于我们所得出的一个错误推论,即“所有能够智能地行动的实体,都是在做信息处理”。正如此前所有关于大脑的比喻听起来都很无理一样,未来,信息处理的比喻也会被认为是很傻的。
明确术语的定义
在辩论中,对一些重要的术语进行定义十分重要,这是为了确保争议并不是基于语义发生。以下是一些 Epstein 论证中的重要术语。
算法:等待执行的操作集,独立的,分步的。
运算(operation):在数学中,指的是从0输入或多个输入到输出的计算过程。
信息处理:从计算的角度,指的是使用算法来转化数据。
信息:不确定性的减少。我们可以说,完全随机的、不确定的数据是没有信息的。如果数据中有存在某种形式的信息,它就能减少输出的不确定性。
数据:数字、字母或者符号
表征(representation):从认知学的角度来看(这 Epstein 可能更加熟悉),指的是“综合的认知符号,代表了外部的现实”;从机器学习的角度来看,指的是 “对学习数据的表示,使得在开发分类器和预测模型时,有用信息的提取更加容易”。
计算机:可以执行自动算术或逻辑运算的设备。更泛泛地说,是“执行计算的”
计算:“任何形式的运算,遵从严格定义的模型,也就是算法”
算法:等待执行的操作集,独立的,分步的。
运算(operation):在数学中,指的是从0输入或多个输入到输出的计算过程。
信息处理:从计算的角度,指的是使用算法来转化数据。
信息:不确定性的减少。我们可以说,完全随机的、不确定的数据是没有信息的。如果数据中有存在某种形式的信息,它就能减少输出的不确定性。
数据:数字、字母或者符号
表征(representation):从认知学的角度来看(这 Epstein 可能更加熟悉),指的是“综合的认知符号,代表了外部的现实”;从机器学习的角度来看,指的是 “对学习数据的表示,使得在开发分类器和预测模型时,有用信息的提取更加容易”。
计算机:可以执行自动算术或逻辑运算的设备。更泛泛地说,是“执行计算的”
计算:“任何形式的运算,遵从严格定义的模型,也就是算法”
信息处理比喻抓住了人脑以及深度神经网络本质
我认为 Epstein 质疑 IP 比喻是好事,也意识到这个比喻错误的可能性比它就是理解大脑的终极答案可能性要高,因为历史上有太多太多比喻大脑功能失败的案例了。像 Epstein 这样的人物对科学发展而言是必要的,因为我们必须质疑科学范式,反思它们是如何使我们的观察带有了偏见。但是,作为一个开发神经网络的人,面对 Epstein 和其他人提出的反证,我仍然坚信(或许是错误地)大脑的计算功能。在这里,我试图阐明 Epstein 所举的大部分例子都没有正确反映我们如何理解 IP 比喻,“我们”是指那些认真严肃看待计算在通用人工智能中的主要作用及其与大脑联系的人。
基于以上定义,信息处理就是使用算法转变数据的过程,这些算法本身也是一系列的运算。由此,Epstein 对于算法和计算与大脑功能关联的理解几乎立马就显得过时而偏颇。他坚持认为,算法就是机器代码里的一套规则,这些规则指定数据如何被缓冲器、寄存器等硬件设备存储、转变和接收。是的,这些也是算法,但却不是我们在努力与大脑建立联系时所关注的那些。Epstein 强调的这些方面只是传统计算机功能实现的具体细节,我们用传统计算机模拟神经网络,但是从来没有说过大脑里面真正有这些网络。
Epstein 对于计算的理解过于狭隘,其中有一个方面是切实、离散、方便存储的记忆库。为了说明我们没有像计算机那样的存储体,Epstein 讲述了一个实例,一位实习生被要求画出一张一美元的钞票。她必须从记忆中提取信息才能够画画,结果她无法画出太多的细节。但是,当她能够看着一美元的钞票画画时,她就可以非常详细地画出来。
“Jinny 看到两幅图之后,也和你们一样,倍感惊讶。”
其实并没有。除了结果正如预期,在无监督学习中常常能见到那样的结果,计算机会生成“模糊”(fuzzy)图像。另一方面,现在最先进的生成模型,也即对抗网络,更像是一位画家会做的——生成描述,将其与现实比较,直到两者非常相似(至少写实主义是如此)。
即使她花时间研究这些细节,“……Jinny 的大脑里也没有'存储’任何意义上的一美元图像。”
人工神经网络——或许在某种意义上生物神经网络也是如此——并没有将图像存储在网络里面;人工神经网络拥有的,是从输入数据中学习得来的抽象、身份恒定(identity-preserving)、平移不变(translation-invariant)的表征。实际上,这些表征本身就是记忆的一种形式。假设 Jinny 在研究一美元钞票的时候,大脑里正在进行的是暂时性地加强那些会生成一美元图像的网络层次。下面,我们将看到这一过程是如何在网络中分布的(distributed)——不像现代计算机,然而却在本质上拥有计算的特点。
我们使用普通(没有脉冲、向前传播)人工神经网络,作为我们从信息传播角度为大脑建模的主要例子。在它们的核心,人工神经网络是算法(也即一系列运算,比如求加权和),这在生物学上说是可以类比的(达到阈值后,突触可以产生兴奋和抑制作用),但是这样类比有很大的局限。
具体说,深度神经网络就是一系列有层次的运算,接收数据后(图像可以比作视网膜的激活)通过每一层使数据发生转变,愈发将它们投射到对于学习和决策更有价值的空间上。算法就是如此,而认为算法与我们大脑在做的事情很一样,是有道理的。
例如,一个卷积神经网络用许多滤波器对图像进行卷积处理。当然,大脑不会真的求卷积。而且,我们眼睛看见的图像能够在空间里发生位移,人又能转动脑袋和眼睛,因此视野里到处都是类似的基本特征。所以视觉中枢在早期才会平铺着类似的基本特征,并且在不同的位置都有感受野。而这也是我们在生物的大脑中所见到的。尽管过于简化无疑会造成一些在生物学上说不通的问题,但这却能够说明这些计算是抽象的元语言(比如加权和),可以在现实中实现(physically implemented)。
好,在上面画美钞的例子中,Epstein 用那一结果当论据,论证人脑中并不存在存储在记忆里的“表征”,或者更具体地说,不存在存储在神经元里的“表征”。确实,正如 Epstein 所说,现代计算神经科学里没有人会做出如此鲁莽草率的判断,这一点 Epstein 肯定也知道。在计算神经科学里有一个常用的概念,稀疏分布表征,它与并行分布处理的概念十分类似。在这一框架下,输入能够被一组为数不多的、分布式的特征(feature)表征出来。此外,记忆(也能够以刚才说过的方式被表征出来)不是离散的,而是分布的。因此,“消除”一个记忆(如果真的能够实现的话),可能会涉及移除数不清的其他记忆。
我以前曾经写过,稀疏编码方案用逻辑证明了它相比其他可能的类型(比如本地和密集代码)在功能上的优越性,因为稀疏编码方案表征性能强、存储性能高(表征性能根据平均活动率呈指数增长,短代码不占用过多内存),学习速度快(只有少数几个单元需要更新),容错性好(一个单元宕机或损坏不会导致系统完全瘫痪),并且干扰可控(多个表征能同时激活)。
由此,当我们看下面的深度神经网络,一张指明人脸或猫的图像并不意味着有一张“图像”存储在那个位置。这幅图像是通过合成一个能够最大化该单元激活的输入而生成的。但是,由于一个节点的激活会随着此前所有连接的复杂加权而变化,更准确的说法应该是,表征被分布式地存放在前面所有的连接里,而不是存储在一个位置。还需要注意一点,合成的图像是模糊的,这表明发生位移可能不会对它产生什么影响。
实际上,Epstein 自己就在文章里面写明了:
“任何经历,有序变换可能会涉及上千乃至百万个神经元,甚至整个大脑,而且每个大脑发生的模式变化都不相同。”
这正是神经网络模拟所做的事情;这一事实并不能排除计算。
能够不提“信息处理”来解释人类智能吗?
在这个例子后,Epstein 尝试“去建立一个关于人类智能行为的非比喻框架”,然而,我发现这是失败的,他只是对现有的 IP 比喻进行了重构。Epstein 指出,我们是通过观察配对(比如,相关性)事件,随后根据我们的反应,得到奖赏或者惩罚。这些概念在机器学习和人工智能领域并不陌生,事实上,几乎所有的机器学习应用都取决于基于原始相关性建立的学习模型,这是做出一个好决定的前提。
Epstein 举了一个学习新歌的例子,计算机只是“改变”而不是“存储”歌曲。现在还不清楚二者之间是不是截然不同。“改变”的是什么?怎么“改变”?在计算机里,我可能会在我的硬盘上储存这些文件。但是,我想要用一个神经网络来学这首歌,并能生成歌曲,“存储”会涉及到网络中的权重分布发生改变(正如上文所说的那样)。例如,如果此前我有很多歌曲方面的知识储备,其中的一些歌曲又有很多相同的组成部分,我就能用分布式的代码来代表这首新歌。这些组成部分会被耦合,进而创造出一个记忆(或者表示),被分布在网络中的各个地方。
最后的一个例子,Epstein 引用了被引用最多的参考例子——接飞球。他论证说:
从 IP 视角出发,要求玩家对球的飞行原始条件进行全方位评估并写成公式,比如阻力、轨道角度等等,然后创造和分析球可能飞行的路径内部模型,进而使用这一模型来持续地调整地面小车,以准确地接到球。
现在,考虑到这是一篇 1995 年发表的文章,这绝对是一个很陈旧的观点。正如一些支持用信息处理的观点来看待大脑的人一样,我绝不会说,抓飞球包含了对轨迹角度的精确计算。事实上,从周围环境的相关度来评估球,是使用增强学习的神经网络智能体可以学会的事情,前提是使用视觉输入来对其进行训练。
进一步说,它还会学习表征的各个方面(比如球本身,还有地平线),最终能精确计算出轨迹。
Epstein 和其支持者称,还不清楚这能不能通过完全不用计算机、表征和算法来完成。他称,因为大脑中即不存在“存储器”,也没有用于模拟的“表征”,并且,如果要在世界中起作用,大脑要以一种有序的方式进行改变,形成我们的经验。所以,没有理由相信,世界上有两个人的这种”改变“是相同的。这也很容易看出,由于基于现有网络上已被压缩的“模糊”回忆的分布式表示,没有经验将是相同的。所以,IP会胜出。
人脑是有机体,也是计算机
Epstein 的论证看来是基于一个对信息处理错误、过时并且僵化的理解。与他所说的不同,大脑没有完美的存储器,表征也是分布式存在(不在本地)。很多模拟神经网络都拥有这样的特征。Epstein 所做的,只是将计算机和计算混为一谈而已。说到底,人工神经网络可以通过与模拟中相同的运算在硬件里得到实现,而不用涉及任何传统计算机所做的,比如数据传输。要是 Epstein 明白了这一点,他或许会更新他的观点。
在文章最后,Epstein 留下了一句羞辱性很强的言论:
“IP比喻已经盛行了半个世纪,然而一路上并没有产生任何见解。”
这一巴掌硬生生地拍在计算神经学、神经形态计算和人工智能等学科的脸上。尤其是人工智能,它得到了很多来自脑科学的影响。忽略这些领域对认知的理解和发现是十分错误的,拒绝 IP 比喻就彻底断绝了这类对话发生的机会。
说到底,我也没有办法在不借用 IP 比喻的情况下解释大脑。但 Epstein 看来也不行。我认为 IP 比喻虽然是建立在无效的推论之上,但它仍然是迄今我们所拥有的最好的解释,由此带来了很多深刻的洞见。此外,关于 IP 理论还有十分特殊、普遍适用的一个特点,让它似乎能够在大脑中得以实现。
我们是有机体,不是计算机。
或许我们两者皆是。最低限度上讲,我们人类还是在进行一些计算的。而计算可以超越进行计算的媒介——无论是肉体还是硅。
《空空如也的大脑》转载自《上传意识?你的大脑可不是计算机》,原文发表于微信公众号“神经现实”,英文原文“The Empty Brain”(https://aeon.co/essays/your-brain-does-not-process-information-and-it-is-not-a-computer),原作者 Robert Epstein 是美国加州行为研究和技术研究所的资深研究员、《今日心理学》前主编。译文由黄玉杰、ki bear 翻译,岳川校对。
编译来源:A Response to Anti-Representationalists(http://dlacombejr.github.io/2016/09/12/a-response-to-anti-representationalists.html)
AI WORLD 抢先看
神秘中国“大狗”机器人亮相2016世界人工智能大会
看过美国波士顿动力大狗机器人意犹未尽?
其实,我国“四足仿生机器人”的研究也早在几年前开展,
神秘的国产机器人大狗将亮相北京·AI WORLD 2016大会现场
先来一睹为快
机器人大狗来自山东大学,负载能力超过80kg,运动速度达1.8m/s,由我国自主研发,技术水平国际领先。
山东大学李贻斌教授
大会还特别邀请到山东大学机器人研究中心主任李贻斌教授在AI WORLD2016-技术分论坛分享“中国大狗”的研发之路。