许成钢:为什么用大数据、人工智能去建立计划经济是行不通的
为什么用大数据、人工智能去建立计划经济是行不通的
许成钢
9月23日,在第二届野三坡中国经济论坛上,经济学家、长江商学院经济学教授许成钢对最近出现在中国的一场争论——基于大数据和人工智能(AI)是否可以重振计划经济,给出了否定回答。
许成钢称,机器只能习得可度量、可传递的数据,而对基于人类自身心里感知的原始基础要素无能为力,更无法模拟人的目标行为。
他表示,人工智能只能执行有限范围内目标清晰的任务,但国家经济制度并不属于此类。试图用大数据、人工智能建立计划经济与人工智能得以发展的基础相悖,“大数据从市场上来,你如果把市场消灭了,数据没有了。你说,我现在收集了人类历史上没见过的无数的数据,我就可以不要市场了,就可以计划了,那你搞错了,因为你把市场消灭以后,你的基础也就没有了。”许成钢说。
许成钢1991年在哈佛大学获得经济学博士学位,于2013年获得孙冶方经济科学奖。2016年,许成钢获得首届中国经济学奖(与钱颖一共享),奖励其在转轨经济中作用于政府和企业激励机制的研究所做出的贡献。
以下为许成钢演讲全文:
我今天讨论的是大数据、人工智能以及计划经济、市场经济的争论。
重要的问题就是人工智能的产生是从计划来还是从别的地方来?这是第一个问题。第二个问题就是,人工智能发展了之后会把我们带到哪儿去?人工智能会把我们带到计划经济去吗?这个就是我要今天讨论的主题。
人工智能的基础——大数据
为了讨论这个主题,我想从最基本的技术层面开始讨论,因为我需要理解人工智能是什么意思,人工智能到底能做什么不能做什么,大数据跟它是什么关系。
首先,大数据它自己其实没有那么大的重要性,它的重要性在于它是人工智能的基础。如今之所以世界上所有发达国家都高度关注人工智能的发展,原因现在已经很清楚,就是这是一次正在兴起的产业革命。
这个产业革命会引起的后果立即能看到的就是大量的无人工厂会产生、许多无人服务行业会产生、人类历史上从来没有见过的高效率会产生,会有巨大量的失业。
那么由于人工智能的技术基础是大数据,因此如今大数据变成了一个基础资源,和我们人类历史上过去经历过的原材料、能源等一样。但是这个资源不一样的地方是它不是原来就在世界上存在的,而是我们人工去收集的。
产业革命的教训
下面的问题就是当这种生产模式发生基本变化的时候,这种全新、全面的自动化,它会不会从基本的地方改变制度?我想非常简要的概要一下,我们要吸取从过去已经发生过的产业革命的教训,如果我们不吸取过去的教训,那么我们会重蹈覆辙。
过去的产业革命之所以带来教训,就是因为当这些产业革命产生的时候,人们过高的估计了产业革命可能到什么地方,在过高估计自己力量的时候人类会滥用这些新兴的科学和技术。我举两个历史上的例子,第一个是在第二次产生革命时期,靠那个技术在那个背景下产生出来的以国有制为基础的中央计划这样一类制度的设计,这是一个过高地估计了人的计划能力、人的统治能力设计出来的东西。
另外一个例子就是对环境的破坏,比如化石原料,化石原料的大规模使用就是伴随着第一次和第二次产业革命来的,造成了全球碳排放过高带来全球变暖、带来的一系列污染,人们已经意识到现在到时间扭转了。
这都是过去带来的教训,今天当大数据和人工智能结合在一起的时候,它可能的危险我们还不知道,比如带有垄断性质的大公司利用手中的数据试图来控制社会,用于大规模的战争,用于犯罪等等。
基于大数据的算法与计算能力
下面我们从最基础的地方认识一下人工智能和大数据,只有知道基础,才有可能能知道它能做什么不能做什么。
今天人工智能整个的大发展实际上是过去超过了半个世纪的发展积累出来的。首先,人工智能第一个重要的部分是算法,而这个算法是早在1950年代就开始探索的东西。关于人工智能的提法、算法和想法,甚至一些指导性的意见,是很少几个创始人在1956年的时候在一次会上把这个名字确定下来,讨论了大的方向,其中奠基人之一是经济学家西蒙教授,他是诺贝尔经济学奖获得者,同时他是卡内基梅伦大学的经济学教授、计算机教授、心理学教授,这三个专业统一在一起,才有了人工智能的想法。
人工智能的算法部分如今发展的最好的是所谓的“神经元模型”,神经元模型导致这个机器可以在人的指导下进行学习,所谓“深度学习”就是今天通常人们讲人工智能时所提到的东西。人工智能的另外一个普遍使用和可探索的方法是“统计算法”,但是无论是使用的是人工训练的办法还是统计得办法,都必须要大量的数据,这就是为什么大数据是基础。
人工智能的第二个基础是计算能力。在过去的半个世纪里,计算速度、计算能力和存储能力基本上是每两年提高一倍(摩尔定律),积累了半个世纪以后,现在超强的能力使得无论使用任何一种计算方法的人工智能,在一些领域机器超过人,而且是大大得超过人,一部分是因为算法,一部分原因是因为计算能力。当然了,所有的这些的基础是大数据。
大数据的基础:可度量数据
下面我们需要理解一下大数据本身的技术基础是怎么回事,我们才能明白人工智能可以做什么不可以做什么。首先,大数据产生的最基本的基础是传感器、移动设备,是传感器和移动设备先检测到一些具体的数据,然后通过互联网和物联网把他们传送,然后集中起来,所谓的大数据的核心就在于收集、传输、储存和处理所有这些传感器和移动设备他们可以度量的数据。这是关键所在,人工智能可以做什么不可以做什么,是由这个决定的,即是不是可以度量。
另一层面的大数据,是利用历史上积累的大量文献,其中包括各个学科积累的文献,比如说图书馆里有文字的、有图的、有音乐的、有舞蹈的记录,这些全都可以转换为大数据供机器去学习、分析。
所谓“深度学习”的人工智能(我们今天讲人工智能多半讲的是这个),它的技术基础基本是用大数据来训练机器来产生识别的能力、推理的能力、规划的能力,等等。
冷识别与热识别、硬数据与软数据
下面我们讲的是算法,因为所谓的深度学习其实是一种算法。这个东西从一开始产生就从同经济学里的决策理论是在一起的,或者换句话说可以认为它是决策理论的一个部分。算法的核心是什么东西?首先,作为人工智能的设计者,你要为你的机器人分配一个目的,就是你造的这个机器在世界上的目的是什么,它是用来干什么的?他的目的和我们经济学家讨论的是一回事——它要寻求它自己效益(利益)的最大化。
没有任何一个经济学家知道世界上每一个人真实的目的是什么,是什么东西影响你?抽象来说你的目的是为了幸福、为了愉快,但是什么东西影响了你的幸福、你的愉快,没有任何一个经济学知道,这就是为什么“市场”重要。下面的问题就是如果有了大数据,有了这么聪明的人工智能,有没有可能通过收集无数的巨大量大数据把它算出来、把它模拟出来,有没有可能?
下面我们就要把人的智能和人造的智能,分别看一下。首先,人的智能是产生于人的生理、心里的感知以及人收集的信息。1950年代,西蒙教授讨论人工智能的时候,就已经区分出来了“识别”的概念,这也是今天人工智能核心的概念。早在那个时代就已经有了所谓冷识别和热识别区别的辩论。什么是冷识别和热识别?冷识别是机器能够识别的,热识别是人带着感情的识别,人带着感情的识别机器是学不来的,这是一点。
再一点就是今天讨论人工智能也好、讨论相关的激励机制问题也好,有一个重要基本概念——硬数据和软数据,硬数据就是前面我提到过的,所有可以度量可以传递的数据;但是,永远和硬数据对应的还有一部分是软数据,软数据是没有办法用传感器或移动设备度量的,不能度量就无法传递、无法处理。所以当我们讨论人工智能是基于大数据训练出来的时候,热识别和软数据的问题从技术上决定都不包含其中,它连基础都没有上哪去学呢,这就是为什么机器不是人。
再有一点,人的智能里边有个非常重要的基本部分就是直觉。什么是直觉?直觉是基于人对于硬数据和软数据、冷识别和热识别综合在一起产生出来的人的一种高度的抽象的跳跃性的反映。这种直觉,不但它依赖的数据是不可度量、不可传递、无法机器处理的,而且产生的直觉本身也是人无法描述的,这就是为什么师傅带徒弟不一定带得出来,在教学的时候,好的教授之所以好,因为好的教授有更多的好的直觉,但是这个直觉传递不过去,你已经想出来了都传递不过去,更不要说你的学生会不会学出来,这个学生能不能产生直觉是老师没有办法,天生的。
人的智能与机器的智能的差别
我想讲的就是,人的智能和机器的智能中间有一个鸿沟,人工智能的基础是可以度量、可以描述、可以传递的数据,满足这几个条件数据在我们手里才能训练。
如果我们去看一看,什么东西是可以度量、传递,哪些东西不可以。首先,在生物科学上,有一系列基本的人的生命感知,由生物科学已经决定了这些东西是无法度量的。我这里只举几个例子,如嗅觉、味觉、性欲,这些东西是无法度量的。无法度量的东西,无论你造出来的机器计算能力有多强,算法有多么优秀,因为它没有感知,你造不出来一个机器人来代替品酒师品酒,因为生物科学告诉你这个东西是测不出来的,你也不能在网上传递嗅觉、味觉过去。
再一点,人的心理感知也是无法度量的。喜悦、厌烦、痛苦、抑郁、思念、怀旧、贪婪、野心等等,这些心理的内容是怎么演变的、为什么每个人是不一样的等等,这些东西都是机器达不到的,因为数字是没有的。
看一下现在对机器人、人工智能的社会训练是怎么做出来的。当不存在这些原始数据的时候,它实际用的是刻画某一些软数据的其他参数,比如说文字、观察某个行为的录像,然后用机器识别录出来的各种各样的行为,用这个来学习。今天我们看到机器人了不起,指的都是这个方法。但是这里面有什么问题呢?第一个问题就是片面的,第二个问题是静态的,静态的意思就是你看到的是过去,你可不知道将来怎么样。福特不做市场调查,因为当没有汽车的时候,你无法知道消费者的反应;当没有手机的时候,你也无法知道人们对手机的反应,没人知道,因为人们没有。
因此,深度学习的人工智能它最终不涉及学习人的智能的这些原始基础要素。原因就是因为它缺少大量人的基本感知,这样机器没有可能通过学习来产生和人相似的效应反射。任何一个人工智能的机器设备或者机器人,它的第一重要、最终重要的是它自己的效应反射,即它的目的是什么,它活在世上干什么,但这个东西是没有可能让它学来的,学不来的原因是缺少原始基础要素,因此只能是由设定它的人分配给它。
经济学家从来并不真知道人的真正的效应函数是什么,我们永远不知道,因此,人分配给机器的效应函数没有可能是人的普遍函数,只能是在一个狭窄范围内定义的、静态的,即可预见的。因此从广义上讲,任何的人工智能设备或者机器人的目标函数,不是也不可能代替真的人的自身目标。这个概念其实早在西蒙获得诺贝尔奖的时候就提出了,即“有限的理性”,这个概念一直影响到今天,而且是经济学发展最前沿的东西。“有限的理性”是当初讨论计划、规划的时候认识到的,我们永远受这个概念的限制。今天我们讨论机器人,你分配给机器人一个效应函数,它一定不会比你更好。
因此,结论性的意见就是你没有办法训练源于人自身的原始偏好和动物性而产生出来的目标行为。今天我们见到的可以深度学习的人工智能,实际上只限于训练模仿人在已知的环境里的行为。因为,你是靠已知的环境下收集的数据训练的。例子就包括在市场中的消费行为、在自由环境里参加讨论的那些人的社会行为,以及比如说面对一个知音者或一群知音者,音乐家的表演行为。你收集到的行为实际上是有限的,是限定在已有制度里的,你拿这个来训练你的机器人,机器人会模仿在这个状态是什么样,一旦脱离了训练的环境,没有原始动力的人工智能实际上是没有办法的。
人工智能能干什么?
到底人工智能能干什么?能干的事非常非常多。刚才我们讲的是它不能干什么,它能干的事儿就是它可以规划,也可以执行。但是它能够规划和能够执行的事的前提必须是,你的目标是清楚规定的。
因此,人工智能会有非常大的革命,它产生在所有你能想象的、能明确规定目标任务的,这些领域它就能干。比如说下棋,下棋计算过程很复杂,但目标很简单,就是赢了对方,但是人类碰到的事不是那么简单。还有开车、开飞机、开船等等,甚至根据设计制造产品,甚至成体系地设计产品,只有规定的目标就行。在全面自动化的情况下,无人的工厂内,激励机制自然也就消失了。
另一方面,当做与人有关的工作的时候,它可以是非常好的助理,它可以是非常好的助教、助理研究院员、金融分析师、医生助理、律师助理、军事参谋。为什么都是助理?因为它没有办法代替人。最近在美国做了个实验,让机器人去经济学做助教,在不见面的前提下,一个学期过去之后,学生分不出来哪个是真人哪个是机器。但是它必须是助教不能是教授,因为有大量的重要地信息这个机器它没有办法知道。
因此,在最乐观的情况下,整体来说,如果你有明确规定的狭窄的的目标来执行,机器人都会做,包括战争,这是一个严重争议的问题。在最乐观的情况下,人工智能最终可以规划和执行企业和军事任务。
在这里我就想回到咱们最大的主题上,我想强调一下:第一,经济任务和军事任务和本质任务不同,因为军事任务的目的简单——打胜仗,而经济任务的目的说不清楚了,经济任务的目的是国民福利,不是经济增长。什么叫国民福利?指全体国民的感觉合在一起,连我们人也搞不清,所以没有可能使机器做。另外一个,企业治理和国民经济本质是不同的。因为企业追求利润,而国民经济追求国民福利。
消灭市场与人工智能存在的基础相悖
到底有没有可能人工智能来了以后,计划经济就能代替市场经济呢?答案非常简单,我刚才已经把人工智能的基础说清楚了,大数据从市场上来,你如果把市场消灭了,数据没有了。你说,我现在收集了人类历史上没见过的无数的数据,我就可以不要市场了,就可以计划了,那你搞错了,因为你把市场消灭以后,你的基础也就没有了。
还有最重要的一点,当你把市场消灭后,如果你试图用人工智能、大数据去解决资源配置也一定搞错了。为什么?尤其是在跟创新相关的资源配置问题上,这些资源配置大量工作实在市场中由风险投资专家做的,因为他们掌握大量的软数据,他可以凭他们的直接进行判断。人工智能只能处理硬数据,没有直觉所以不能产生这个判断。
今天实际上人工智能的人才在哪?截至今年的第一季度,全球人工智能人才一共190万人,其中中国5万人,而这5万人里面做这行达到十年的不到40%。有85万人在美国,而美国的85万人里,有十年以上经验的占其中的71.5%。原因很简单,在市场的环境下才有这么多的创新能力的人出来,你如果把市场的环境搞掉,创新是很难发展的。
最后我总结一下,大数据、人工智能和制度之间有非常深刻的关系,制度会深刻影响大数据和人工智能的发展,原因是因为大数据的收集处理会受到制度的制约,比如说哪些是合法的、是不是得到支持、或者社会上有没有反弹,比如说掌握技术有垄断权的垄断权的大公司是否侵犯隐私权等。
另一面,人工智能发展的本身,也受到制度的制约,比如说在发达经济体里边,人工智能要发展的时候,一系列行业要被淘汰,制度本身是如何面临这个问题的。再有一点,一个社会平等或是不平等都会对人工智能发展造成巨大的影响,原因是因为人工智能的发展会造成巨大的不平等,一个更平等地社会会更有能力解决这个问题,而在一个不平等的社会则会引起非常尖锐的社会矛盾,阻碍人工智能的发展。