跟声誉好的人合作

俗话说,“众人拾柴火焰高”,合作(cooperation)作为一种达成成功的策略在自然界和人类社会中都得到了发展,但人们对于合作的形成机制却知之甚少。2021年5月13日发表在Nature Human Behaviour上的一项研究试图将其抽象为数学的公式,以便对合作行为进行预测。四位作者Schmid, Chatterjee, Hibe和Nowak分别来自奥地利,德国和美国。

在进化博弈论领域,研究者经常研究玩家在一个简单的给予和接受利益的游戏中采取的策略。研究者发现并不是最强壮或者最自私的人才能在博弈的游戏中生存,相反,合作才是通向成功的稳定的策略。

该研究创建了一个新的数学框架,他们通过模拟玩家之间的多次互动,揭示出与潜在伙伴相处的经历和潜在伙伴的声誉如何影响玩家与其合作的意愿。

直接互惠与间接互惠

互惠性(Reciprocity)指导我们社会生活的方方面面。该研究关心的是人与人之间基于两个不同类型互惠性的互动——基于直接和间接互惠的互动。

图1  直接互惠与间接互惠

基于直接互惠(direct reciprocity)的互动意味着“你为我做什么,我就为你做什么”,这在人类和一些动物中都存在,如图1a所示。

基于间接互惠(indirect reciprocity)的互动是以个体的声誉为前提的,意味着“如果你为别人做什么,我就可以为你做什么',这种互动只在人类中得到了确凿的证明。间接互惠不需要个人之间有互动的历史,也不需要他们以后再见面。它完全基于这样一个前提——通过帮助别人,你可以提升你的公众地位。这种声誉收益在未来与他人的互动中是有价值的。实验表明,人类行为同时受到直接、间接的相互影响,如图1b所示。

然而,如果当这两种互惠性导致的结果互相矛盾时,又该解决呢?玩家是否应该与一个对他人表现良好的人合作,即使他们过去曾不公平地对待他们?研究通过揭示玩家在不同条件下所采取的策略回答了这个问题。他们发现,体现直接互惠的慷慨回报(generous tit-for-tat)与体现间接互惠的慷慨评分(generous scoring)相对应。

为了建立直接和间接的互惠模型,该研究考虑将两种可能的声誉——好的(G)或坏的(B)——中的一种分配给合作者个体。当前分配以绿色突出显示,如图2所示。

图2  直接互惠和间接互惠的模型

当前的分配用绿色突出显示。(C)与他们认为好的合作者合作,(D)不与他们认为不好的合作者合作(如图3所示)。研究者建立的直接和间接互惠的统一模型揭示了合作策略的选择和变化都取决于环境。例如,玩家之间互动的频率以及结果(选择合作还是背叛)、玩家是否知道伙伴的声誉情况(例如玩家作为观察者观察对方在游戏中的合作情况)等因素。玩家根据这些因素分别评判对方的好坏,综合这些因素的评价,得出整体的对对方的评价,并做出是否合作的决定。

个体是否认为同伴是好的取决于其策略(y, p, q, λ)。这里,y是在没有任何信息的情况下,将良好声誉分配给合作者的初始概率; p和q分别是合作玩家在直接互动中合作或背叛后分配良好声誉的概率。接受度λ是一个人考虑各自的合作者的第三方交互的概率。如果λ = 0,将得到一个直接互惠模型。如果λ = 1,将得到一个间接互惠模型。为了简单起见,图3仅描述了单向交互,事实上该研究还考虑了双向交互。当两名玩家被选择进行互动时,他们都会同时决定是合作还是不合作(即背叛)。所有其他人也都能观察到他们的选择。

图3 研究设计图

稳定的合作

图4 均衡分析揭示出何时直接或间接互惠可以维持合作

研究结果显示,在反应策略中,存在一个直接互惠的合作纳什均衡(图4a)和一个间接互惠的合作纳什均衡(图4b)。这两种策略有一个共同点,即它们总是在第一轮中合作,或者如果合作者在最后一次相关的互动中合作过(y=p=1)。他们对合作者背叛的反应不同,如公式1和2所述,他们是否考虑了间接信息。

根据游戏的参数,最多有四种情况:(i)当轮次少,感知错误多时,合作是不可行的;(ii)当有中间轮数和很少的感知错误时,合作可以通过间接而不是直接互惠来维持;(iii)当有许多回合和许多感知错误时,合作可以通过直接互惠而不是间接互惠来维持;(iv)当轮次多、失误少时,直接互惠和间接互惠都支持合作(图4c)。

当直接观测和间接观测具有相同的误差率时,不存在直接互惠能维持但间接互惠不能不能维持的合作(图4d)。

公式1

公式2
此外,该研究还表明,直接和间接互惠需要不同的环境才能出现。慷慨的回报要求玩家进行足够频繁的互动,然而,即便只是偶尔互动,慷慨性得分也足以维持玩家间的合作。然而,要想保持慷慨性得分的作用,突变率必须小于直接互惠,且外部信息需要足够可靠(如图5)。

图5  有条件合作与信息利用的协同变化

这个模型可以帮助研究人员了解合作策略如何演变和保持一定的稳定性。这些发现在一定程度上揭示了早期人类社会的合作进化如何受到其基于经验和声誉的社会规范的影响。目前的一个应用是根据买家的个人经验和卖家的声誉对网上商店的评级系统进行建模。

当人们定期互动时,他们依赖直接信息,更相信自己的经验,而不是间接的信息。相比之下,当关系是短暂的或表面的,合作只能靠公众声誉加以维持。先前的研究表明,间接互惠需要十分复杂的社会规范——当给一个人被分配一个新的声誉时,观察者还需要考虑与这个人合作的伙伴的声誉。而该研究与之前研究最大的不同是提出,为了维持合作,基于最少信息的简单概率规则就足够了。

最后,研究者希望能够结合不同的领域进行探讨,例如博弈论和进化模型。在未来的工作中,施密德希望研究在一个群体中,有多少人必须使用基于间接互惠的策略才能获得成功。有了这些,她将能够研究社会规范在社会中传播的影响。

编译 | 关岳琳
审校 | 王轶楠

参考文献

Laura Schmid, Krishnendu Chatterjee, Christian Hilbe, Martin A. Nowak. A unified framework of direct and indirect reciprocity. Nature Human Behaviour, 2021; DOI: 10.1038/s41562-021-01114-8

Institute of Science and Technology Austria. 'The emergence of cooperation.'  ScienceDaily, 13 May 2021. <www.sciencedaily.com/releases/2021/05/210513142406.htm>.

(0)

相关推荐