一门四诺奖——2020年诺奖得主罗伯特·威尔逊和他的博弈论门派 / 四六文摘

2012年诺贝尔经济学奖获得者

作者| 本特·霍斯特罗姆，罗汉堂学术委员

2016年诺贝尔经济学奖获得者

作者| 保罗·米格罗姆

2020年诺贝尔经济学奖获得者

一门四诺奖，回顾威尔逊的成就和学术传承

当人们不再意识到一位学者的工作有多么重要和影响深远，这意味着他的研究成果已经成为一种广为接受的常识，一种新的传统，这是学者生涯中更难企及的成就。

更难得的是，这位学者同时是一位伟大的老师和顾问，作为罗伯特·威尔森（鲍勃）的学生，回忆起他的成就，我们倍感欣喜。

他不仅成就了学生们的学术生涯，更教会了他们如何去教导自己的学生。一代代传承，成就了新的学术传统。本书是鲍勃学生们——这一传统的亲历者——的论文选辑，为庆祝其65岁诞辰编撰。

鲍勃的传统到底是什么？他的学术领域宽广且涉猎众多领域，超越任何简单的定义和归类。在众多博弈理论者里，他最先提出，研究信息如何分布、控制、掩盖和揭示的重要性。

他也率先意识到，要策略性地计算博弈中一方对另一方可能行动的预判。然而让他成为其时代最伟大经济学家的是其对理论研究的理解。在著作《非线性定价》中，他写道：“理论的价值取决于其解决实际问题的有效性...”他进而阐述了实际问题对其学术研究的重要作用：“...对于理论研究者，实践者遇到的问题为我们提供了丰富的选题。”

鲍勃传统下的博弈论，是一门服务于实体经济的、自信的、实践的且有用的学科。

带有鲍勃风格的研究，其灵感不仅来自于对其他学术研究的深刻理解，也源于经济生活中那些日常现象。在此精神下，鲍勃的研究不仅仅产生了突破性的，广泛应用的理论洞察，也为实际中企业战略和市场设计提供了建议和解决方案。

鲍勃威尔逊的成就

简单回顾鲍勃漫长、富有成效且笔耕不辍的学术生涯，不难发现方法与众不同、且统一在同一风格之下。

要如编年史一般讲述他的故事是困难的，因为其生涯早期的想法和题目一直在随时间发展和变化。1966年9月，他在《管理科学》杂志发表文章和自述，我们可从中洞见其研究兴趣不断进化的大致方向。鲍勃在文中表示，他的主要研究兴趣是“统计决策理论，特别是群体决策和其在金融中的应用。”

1967年，他的研究延伸至“经济中的不确定性，包括群体决策理论”；1972年，他写道：“正在进行多人决策理论的研究，包括博弈论”。

时间拨回1963年，鲍勃的博士论文开创了“二次规划子问题迭代法”去解决一般的“非线性约束凸规划”问题。著名的序列二次规划算法（Sequential Quadratic Programming，SQP）即脱胎于此，如今已经成为解决非线性约束优化问题的最佳算法。

｢非线性规划在经营管理、工程设计、科学研究、军事指挥等方面普遍地存在着最优化问题。例如：如何在现有人力、物力、财力条件下合理安排产品生产，以取得最高的利润；如何设计某种产品，在满足规格、性能要求的前提下，达到最低的成本；如何分配一个动力系统中各电站的负荷，在保证一定指标要求的前提下，使总耗费最小；如何安排库存储量，既能保证供应，又使储存费用最低；如何组织货源，既能满足顾客需要，又使资金周转最快等。｣

尽管鲍勃没有在此领域继续深入，但对算法的热情伴随了整个职业生涯。他为双边互补性问题、一般均衡问题、拍卖市场、电力市场以及求解博弈的纳什均衡都开发过算法。一旦有机会，他总是孜孜不倦地寻找解决方法，试图用算法计算。将理论与算法结合，也许是他的研究能脱颖而出的主要原因。

鲍勃在1968年的论文《联合体理论》（The Theory of the Syndicates）影响了一整代经济学、金融学和会计学的学生。论文提出的基本问题直指许多现实经济问题的核心：“在什么情况下，“一组理性人”会像”一个理性人”（形成联合体）一样进行决策？

｢此处理性人是指萨维奇理性：Savage Rational，指理性人会在一个经济机会的预期效用和其相信的风险概率之间进行权衡。由美国经济学家莱纳德·萨维奇Leonard Savage提出｣

换言之，当一群人独立地进行决策和风险分担时，在哪种情况下预期效用理论能够表示这群人的帕累托最优决策？这样的例子在现实中比比皆是，例如一家公司由一组活跃的经理人拥有和管理，那么谁应该对投资进行决策？群体的最优行动流程是什么？群体决策能否被视为由单独个体做出？如果企业可以被视为一个最大化预期效用的个体，那么企业目标函数和个体效用函数的关系是什么？

论文指出，在一般情况下，由于不同人对各种不确定状态的信念不同，群体行为难以符合预期效用理论。鲍勃发现，当引入最优的风险分配规则——每个个体根据自己的风险承受度分担相应风险，并通过补充协议（side-bets）调和风险信念的矛盾。那么群体的效用就会和个体的效用协调一致。群体也因此会对最优行动达成一致，即达成全体一致（Unanimity）。因此，这样的情形下，任何个体都可以代表群体的利益行动。一旦分配规则确定，我们就不必再对决策机制进行探讨。

这一结论引出了两支重要文献，一个是代理理论，另一个是有关企业的最优目标函数。在1967年发表的《不确定性下去中心化的激励结构》中，鲍勃贡献了首个对委托-代理模型（Principal-Agent Model)的正式分析。在联合体分析的基础上，他展示了代理人可以被信任而为委托人的利益而行动。

在和Steiner Ekern合作的论文（Ekern 和Wilson，1974）中，联合体理论的直觉被用于给出不完全市场下股东达成全体一致决策的充分条件，同时证明了这个一致决策带来的市场风险与联合体风险规避系数的相关性。

联合体理论在在1970年代的影响都可以追溯到上述的两类重要应用。不能忽视的是，当论文付梓之时，基本资产定价模型仍在发展，尚未成型。因此鲍勃对这些问题探讨的背景与今天完全不同。在这些论文中，他在哈佛商学院得到的训练显露无疑，特别是师承Howard Raiffa的经历。

很快鲍勃发现了这些理论与正在崛起的金融研究的关系，并深刻地改变了这一领域的研究方向，特别是通过他在斯坦佛大学的学生们。

随着不对称信息、逆向选择，以及不完全博弈中的共同知识假设的发展，假设个体持有不同信念渐渐不再流行。过去20年，联合体理论并未获得应有的关注。然而随着行为经济学的崛起，该论文可能会重新获得关注。

对群体行为的理解是我们理解组织和公司的基础，而信念不同就会引发对理性行为的背离更是值得注意，为何我们不能将群体视为不同思维的集合？

在同一时期，鲍勃撰写了第一篇关于拍卖的论文。他最早关于贝叶斯拍卖模型的文章成文于1967年，甚至早于海萨尼奠定贝叶斯博弈基础的著名论文（Harsanyi，1967）。

现代拍卖理论的每个领域都留下了鲍勃的印记。他开创了共同价值模型的研究。他研究了对称拍卖模型，和非对称拍卖模型——油田开采（Drainage Tract）拍卖（相邻油田的主人要比其他人了解该油田的价值），其中一方掌握的信息要远远多于其他竞拍者。油田开采模型为Hendricks和Porter重要实证工作奠定了基础，他们用数据揭示了博弈论中最出人意料的预测（Hendricks和Porter，1988）。

多数拍卖理论的研究者将注意力集中在单一拍卖品模型，或多个拍卖品在完全信息条件下的状况。鲍勃的份额拍卖理论却打破了常规，它开创了可分割物品拍卖的研究，例如国债和电网中用电量的交易。

鲍勃的研究很快指出了此类拍卖模型会显著增强竞拍者的力量，让拍卖方的利益受损。而最近电力市场的实践显现出他在此领域的远见卓识。

鲍勃早期对拍卖的研究就展现了不同信息、不同信念的重要作用。在其所有学术成果中，最重要的莫过于他和David Kreps合作的序贯均衡理论。简单搜索一下，就能发现成百上千的引用论文，还有无数的论文借鉴了它的灵感。

在序贯均衡出现之前，经济学家总是难以解释人们在纳什均衡下的某些行为。一些人提出了参与者的想法和信念可能发挥了作用，但这些讨论是非正式的，且聚焦于均衡路径上的策略。

序贯均衡彻底改变了这一状况，信念被正式纳入博弈的定义中，成为参与者的策略的一部分，无论策略是否在均衡路径上。

这一创新概念立刻在讨价还价理论，契约理论以及劳动经济学中大显身手，也带动了博弈论自身的发展。

首先将序贯理论付诸应用的还是鲍勃自己的两篇论文：《声誉和不完美信息》以及《有限重复囚徒困境下的理性合作》。这些流传广泛的论文对传统博弈论以及其在经济中的实际应用带来了重大挑战。

在应用经济学中，动态博弈的结果取决于参与者的信念，这对理解工业组织如何运作带来了巨大挑战。传统的结构——行为——绩效的公司范式认为，供给和需求结构影响参与者的行为。这需要涉及成本、规模经济、需求弹性、需求分层等因素。而鲍勃和一众博弈论学者告诉我们，这还不够。

最悲观的实践者可能会认为，如果结果对预期这么敏感，博弈论学者大可通过微调对预期的假设来得到任何想要的结果。但这些批判者却忽略了一个要点，当结果如此依赖于预期时，如现实一样，可以根据任何次要的假设得出任何不确定的对预期的假设便不再是无足轻重的了，仅仅依靠基本面的、结构性因素将无法准确预测经济结果。｢从公司管理、任务分配，到激励机制的设计，认识和管控参与者的预期都是重要影响因素。｣

序贯均衡的另一个重要应用是证明动态垄断、讨价还价理论以及预测垄断耐用品将持续降价的“科斯猜想”。科斯研究垄断者的定价策略后猜想，对于耐用品的垄断厂商而言，垄断者要和未来的“自己”竞争，很难维持较高的垄断价格。因为如果消费者预期垄断者能够维持高价，会在高价下购买，而厂商在消费者购买后，为了卖给更多消费者获利，可能会立即降价。

鲍勃、Faruk Gul和Hugo Sonnenschein（1986）用序贯均衡证明了科斯猜想，并将其延伸到讨价还价理论上。

假设在讨价还价中，我的产品生产成本是5元，我的定价是10元，如果你不愿意以10元的价格购买该产品。那么降低产品售价是对我有利的。这个效用是如此强大，如果能高频出价，生产者不可能维持任何高于5元的价格。这个结论是不合作讨价还价理论的主要发现之一。

鲍勃很多理论研究源于实际应用中。1970年，他受雇于施乐公司成为公司顾问。施乐后来进入宽带通信业务，鲍勃因此与ShmuelOren 和Stephen Smith结识，后两者整在研究网络外部性以及电信服务的战略定价。

鲍勃因此对差异化产品以及非线性定价产生了兴趣，并在1982年与Oren和Smith合著论文

后来在美国电力研究院的倡议之下，他将非线性定价延伸到电力定价领域。在鲍勃的模型帮助下，电力公司可根据容量和用电量两个维度进行定价，让公司回收满足峰值用电需求的扩容成本。

鲍勃在1993年在非线性定价领域的研究集结成书，出版了《非线性定价》，立刻成为关税设计以及其他公共服务定价的权威之作。

他对非线定价政策的研究，让他自然而然地进入到了市场设计领域。1992年，他参与到市场机制评估和设计工作中，其中包括碳排放交易市场和电力市场。与大多数理论研究者不同，他的建议并非仅仅基于自己的理论研究。他与Charlie Plot一起合作，在加州理工学院实验室对电力市场的规提案进行试验和测试。

他对电力批发市场的政策建议，深刻影响了新英格兰地区能源和相关配套服务市场的发展。此后他持续与电力研究局合作，成为多个国家和地区电力批发市场的政策顾问，其中包括波兰、日本和中国台湾地区。

鲍勃最著名的市场设计工作，也许是联邦通讯委员会的波段拍卖机制。他是拍卖主要的设计者之一，后来该机制成为波段拍卖的世界通用标准。他和保罗·米格罗姆（2020年诺奖获得者）在其中的工作让拍卖理论得到了新的发展，特别是处理复杂多物品拍卖的问题上，以及当竞拍者获得的价值体现出较强互补性时。（他和米格罗姆也因此领域的研究获得了今年的诺贝尔经济学奖）。

鲍勃·威尔逊的教导

许多个人关系能影响人的一生，或好或坏。比如父母与子女，兄弟和姊妹，配偶和搭档等等。如果足够幸运，学者可以拥有另一个非常重要的关系，那就是老师与学生。就像犹太教的经典《塔木德》所说：“选择一个老师，得到一个朋友。”

鲍勃·威尔逊传统的一个重要的组成部分是他的友谊，对学生和年轻同侪的无私相助。在鲍勃的学生Rosenthal的葬礼上，这一传统体现的淋漓尽致。所有的学生都聚集在葬礼上，分享他痛失挚友的哀思。毫无例外，每个人都提到了Rosenthal对自己的帮助和友善，他就像我们学术上的兄长。Roshethal是这一学术传统的最好体现，而这一传统在一代代传承。

我们之中有幸能拥有学生的，便能教导他们，分享友谊，我们有机会将这一传统继承下去。就像幸福家庭中成长的孩子，他们结婚生子，为人父母的机率更大。我们也有幸能成为我们学生好的导师和顾问，让智慧更好地传承下去，就像鲍勃从Raiffa那里继承的那样。

后记

本文成文于2002年，是罗伯特·威尔逊的三位学生，阿尔文·罗斯、本特·霍斯特罗姆和保罗·米格罗姆为纪念威尔逊65岁生日的纪念文集所作的序。此后，罗斯在2012年因市场设计获得诺贝尔经济学奖；霍斯特罗姆在2016年因契约理论获得诺奖；威尔逊和米格罗姆刚刚因拍卖理论和其深远影响获得诺奖。

摘编|安健、马英举

（原文见“GAME THEORY IN THE TRADITION OF BOB WILSON”，有删节。）

关注我们，每周掌握社会科学新知

一门四诺奖——2020年诺奖得主罗伯特·威尔逊和他的博弈论门派

相关推荐