当前位置: 查字典论文网 >> 国内外强互惠理论研究最新进展及其评述

国内外强互惠理论研究最新进展及其评述

格式:DOC 上传日期:2023-07-01 00:03:49
国内外强互惠理论研究最新进展及其评述
时间:2023-07-01 00:03:49     小编:

摘要:作为一项跨域研究成果,强互惠理论的提出为人们解释和理解合作行为提供了一种新的视角,在短短十几年间便受到了广泛关注。目前国内外学术界关于强互惠的探讨主要集中在强互惠的界定、强互惠的成因及影响因素分析、强互惠的演化模型研究、强互惠理论的应用和发展等层面上。进一步的研究可以聚焦于以下几个问题:为强互惠理论提供更多的现实证据作为支撑、探明强互惠的激励机制以及在强互惠的理论背景下重新思考人性假设以指导管理实践。

关键词:强互惠;利他性惩罚;内在激励;“情境人”假设

1 强互惠理论的提出

2 强互惠的界定

作为政治科学、经济学、心理学、社会学、计算机科学和生物学的交叉学科,强互惠理论自产生以来就受到了广泛的关注。那么,究竟什么是强互惠呢?

在Gintis看来,“在群体中同他人合作,且不惜个人成本去惩罚破坏合作规范的人,即便在预期这些个人成本得不到补偿的时候也这样做”便可以称之为强互惠[3]。它认为人类行为可以超越“自利”动机,为公平和公正可以不惜付出个人代价,其实质是一种与他人保持合作的倾向。具有强互惠倾向的人既是有条件的利他合作者,也是一个有条件的利他惩罚者,其遵循的行事逻辑是“你对我(或他人)好,我也对你好;你对我(或他人)不好,我也对你不好,并且愿意为此付出个人成本[4]。”在一个群体中,哪怕只有一小部分强互惠倾向者,也足以保持该群体内大部分是利己的和小部分是利他的这两种策略的演化均衡稳定,实现“演化均衡稳定性”(ESS)[5]。此外它还能够有效地减少群体内的卸责、背叛和机会主义等行为,使得群体的总体福利水平提高。可见,强互惠行为具有一定的正外部性,因此学界一般也用利他惩罚(Altruistic Punishment)来指代它。现实中存在的实名举报、腾讯QQ中的举报制度以及史书等文学作品上记载的游侠的种种“路见不平、拔刀相助”等都是带有强互惠性质的行为。

为了更好的理解强互惠的概念,在这里,我们有必要将强互惠与其他用于解释人类的合作行为的理论,主要包括:弱互惠(或互惠利他)、利他主义、一报还一报等进行区分。首先是弱互惠。如果行为主体仅仅是为了获取间接或者长期利益而实施帮助别人的行为(即便要为此支付一定的短期成本),那么这种行为就可以称之为弱互惠。而利他主义指的是在一定的时空条件下以自己的适存度的牺牲来换取别人乃至群体的适存度的提升。它是无条件的,从不依赖于对方的行为。至于“一报还一报”的行动策略主要是:第一步合作,此后每一步都重复对方上一步的行动(合作或背叛)。一报还一报的基础在于重复博弈(时间问题),其核心还是互惠。相较而言,强互惠包含着双重因素,有条件合作和利他主义惩罚,即便是在一次性匿名博弈中也是成立的,这正是强互惠区别于利他主义、弱互惠、一报还一报等的本质特征。根据强互惠发挥的作用的不同,可以将其进一步区分为积极强互惠(positive strong reciprocity)和消极强互惠(negative strong reciprocity)[6]。 3 强互惠的成因及影响因素分析

人们为什么会表现出强互惠行为呢?合理地解释这个问题乃是强互惠理论的应有之义,也是其成立与否的关键之一。因此,学者们从各个学科出发,提供了各种各样的解释,归结起来主要有以下两种:

其一,内在激励说

其二,基于生存、进化等现实性因素的考量

在揭示强互惠的成因的同时,一些学者还对影响强互惠的因素展开了探讨。就目前的研究而言,强互惠可能会受到如下因素的影响:

其一,惩罚者的影响

典型的利他行为的演化模型通常都假设同质性,即:在合作情况下每个参与者获得的利益是相同的,并且每个人要为惩罚背叛者花费相同的成本。Harmen de Weerd和Rineke Verbrugge[25]抛弃了这种假设,转而引入了异质性假设,并且根据参与者惩罚能力的不同将其分类。其人口模型显示:利他行为在大规模的均匀混合的人口中难以维持,然而当人口是空间结构化的时候就不是如此了,人们的行为更加接近于社会规则演化的方式并且在一个社会网络中被维持着。正是因为异质性的存在,也就是人们惩罚背叛者所花费的成本的不同才使得利他行为更容易维持。在这种情况下,制止自利行为所需要的惩罚者的数量并不用太多,而且绝大多数情况下他们属于那类只需花费较低成本就可以进行惩罚的群体。因此,可以说,异质性有利于合作行为和专业化的产生。R. Vilela Mendes[26]也认同相似性聚类的社会网络在利他行为的出现和进化中扮演重要角色。Frank W Marlowe[27]的跨文化研究则表明在更大更复杂的社会中的人们比小规模社会中的人们从事更多的第三方惩罚,第三方惩罚是一种有效执行强互惠规范并促进合作的方式,这也就是说惩罚效果与执行主体是相关的。Alpaslan Akay[28]考察了惩罚者的信仰对强互惠行为的影响,再一次强调了有条件合作的重要性。Ferguson Eamonn和Corr Philip[29]从内部有效性的角度指出,个人的品质也是需要考虑的因素。 其二,压力的时间依赖性效应

压力对行为的影响是双向的:刚受到压力的刺激时,人们表现出的往往是反射性和习惯性的行为。一段时间以后,人们表现出的行为却是更加有远见的、有弹性的且目标导向的。基于此,Christiaan H. Vinkers[30]提出压力的时间依赖性效应应该被引入到利他性惩罚的行为讨论中来。他们通过最后通牒实验来测定这种影响:首先将健康的男性参与者分成两组:压力测试组和控制组。参与者被要求进行一项亲社会决策任务。他们的决策要么在压力过后立即做出要么在75分钟之后才做出。而泛利他主义则通过一次性的独裁者游戏测定,在这个游戏中参与者可以将不记名捐款投给慈善机构。结果发现压力对利他性惩罚行为产生了双向作用:在独裁者游戏中,有压力的一组表现得比控制组不慷慨,但是没有观察到时间依赖性效应,这表明一般奖励敏感性在压力过后的各种时间节点保持不变。而在急性应激过后,比如75分钟后,参与者的行动则更加符合自己的物质利益考虑,并且进行利他性惩罚的倾向也较低。

其三,惩罚的合法性与否

Pat Barclay[20]设计了一个公共物品博弈游戏,在这个游戏中搭便车者是存在的,其他游戏参与者有权向搭便车者征收货币惩罚。参与者认为惩罚者比不惩罚者更值得信任、更重视集体的利益且更值得尊重。在接下来的双方信任游戏中,惩罚者虽没有在一次性的公共物品中获得利益,但在重复性的情境中就不同了。此外,实验结果显示,不是针对搭便车者的惩罚并没有为惩罚者带来货币效益。这表明人们能够区分合法性惩罚和乱罚,并且只有当惩罚是合法的时候才会报之以更多的信任。

其四,惩罚的成本

4 强互惠的演化模型研究

我们知道,强互惠者在施行惩罚的时候往往要由个人付出一定代价并且不能预期在未来得到补偿。这在某种程度上是会降低其在群体中的适应性的。那么,导致自身适应性降低的利他性惩罚行为怎样才能在严酷的生存竞争中对自利行为保持相对的遗传优势,从而使自己在人群中顺利演化呢?

Gintis[3]以“公共物品博弈”为分析框架发展了一个关于强互惠的演化模型,他的模型基于这样一种信念:在相应的演化环境中,人类群体以一定正的概率面临灭绝的威胁。此时,互惠利他和间接互惠都不能维持可以帮助群体幸存所必需的合作。但是,具有一定强互惠成员的群体则可以在这种环境下幸存。强互惠者承担成本却使整个群体受益,因此,群间选择的压力更偏爱强互惠行为[33]。这种偏爱使得强互惠者与群体中其他成员的合作更容易发生,进而引发协作力量、产生合作剩余,只要合作剩余足够大,就足以弥补利他者损失的进化优势,从而保证其在人群中得以成功演化[34]。需要指出的是,当合作与惩罚完美结合时,即使在强互惠者在起始频率上接近于0的人群中(也就是几乎没有变异种的入侵),强互惠行为也能进行扩散 [35]。相比之下,当合作与惩罚二者可以发生重组(即两个特质共同进化),并且强于选择时,只有当它提供适合的利益给参与者,惩罚才有可能入侵到有背叛者的人群中。Juan Pablo Calderón和Roberto Zarama[36]的代理人进化模型进一步揭示了个别强互惠者的行为如何影响群体中的其他成员。在他们的模型中,个体产生的适应性被引进以考察个体适应性如何影响强互惠的进化。模拟结果表明,强互惠确实可以由个体选择引发。在代理人的一生中,适应性的进化路径由各种有趣的行为向容易被人们接受的行为演化。随着适应性的增加,平均供给和接受阈值也在增加。到目前他们的结果显示适应性通过增加人群中显性行为的多样性在强互惠的演化中扮演着一个有利的角色。而且,如果适应性是由基因决定的话,那么它就是进化稳定(这取决于它以何种机制传递给子孙后代)的,不会从人群中消失。易言之,适应性是可以进化的。但是,随着群体规模扩大,利他性惩罚的代价也相应提高,因此,大规模的社会的出现还有赖于制度建设以控制成本,这主要通过一个专门负责制裁的社会部门来实现[37]。

上述学者所构建的模型主要针对重复交往情景。Henrich和Boyd[38]似乎对一次交往情景中的惩罚行为的解释更为感兴趣。在他们的文化演化模型中,合作和惩罚的演化是人类在同化过程中具有采用流行行为趋势的一个副效应。人类的社会学习机制并不是简单随机地复制其他人的行为,而是复制成功者和大多数人的行为。正是这种收益偏好传播和从众传播机制使得社会可以建立合作和惩罚的规范。

模型显示,在有限次惩罚阶段,仅有一小部分的尊奉习俗者的传播就可以在演化均衡中稳定群体的合作和惩罚行为。一旦一个群体的合作稳定后,便可以通过群体选择机制使得群体受益的文化特征在一个多群体的人口中扩散。最后,一旦合作均衡变得普遍时,自然选择也会偏爱那些喜欢合作和惩罚背叛者的基因,因为这些基因降低了人们遭受惩罚的成本,从而亲社会基因可以尾随文化演化进程侵入,表现出阿利效应 。

5 强互惠理论的应用和发展

在强互惠基础理论研究的基础上,学者们逐渐将其用于解释一些经济社会现象,这表明该理论已逐步走向成熟。其当前应用领域主要包括:

其一,应用于国家治理问题的研究

在这方面的代表主要是上海市委党校的黄真。他[43]认为,强互惠行为在国家层面上也是存在的。其根源在于,国家也是具有“人”的特征的有意图行为体,由于自然进化而来的合作能力和趋社会情感的存在,因此,国家在国际关系中有实施利他惩罚的功能,进而获得预期的满足感。这给我们的反思是,国家在国际关系中应注重情理的结合,注重智商与情商的共同提升。

其三,应用于农民合作问题的研究

韦惠兰等[44]指出理论研究很少关注农民的强互惠行为对自然保护区管理产生的作用。她们认为强互惠很可能是自然资源社区共管中农民合作的重要影响因素,它有助于森林保护区内个人利益和集体利益之间实现协调;强互惠塑造的社区合作结构并非刀刃均衡,它能够抵制一定程度上的外部冲击。浦徐进等[45]的研究结果表明强互惠行为的存在确实能有效提高合作社的农产品质量。因此,他们建议:通过增强农户间的关系密切程度来重塑合作社结构;通过奖惩制度和文化营造来培育“强互惠主义者”。

其四,应用于网络工程领域的研究。Seredynski M.[46]将强互惠理论运用到移动ad-hoc网络中,再一次强调了惩罚成本的重要性。

6 几点评议和思考

总体而言,关于强互惠的研究已经取得了较大进展,虽然该理论提出至今不过十余年,但由于它自身所特有的一些理论上的优点,包括:

第一,强互惠是稳定演化的策略,具有很强的鲁棒性(Robust稳定性);

第二,强互惠可以解决一次性囚徒困境;

第三,强互惠不依赖于未来的回报,即不以互惠为基本特征;

第四,强互惠策略适用于N人博弈[5],使得它成为了“理性经济人”假设、起源相关性、重复互动作用等理论的一种重要补充,受到了经济学、生物学、心理学、人类学和政策科学等领域越来越多学者的重视,为人类认识自己、理解合作提供了一种新的视角。

但我们应该看到,作为一种新兴理论,它还有很多值得深究的问题:

第一,需要提供更多的现实证据作为支持。

虽然强互惠行为在实验室情景中被很好地观察到了,但是,为了维持合作而付出高额代价这种行为在现实环境下尚未获得证实,强互惠行为的作用也尚未得到强有力的证明,这需要现实世界的观察[47]。而且社会历史学家和经济学家的研究表明,社会两难问题更多的是人们通过协同惩罚来解决的[48]。Read Dwight[49]以分享掠杀食物为例,认为其主要是受到文化规则的制约而非强互惠模型所谓的自发合作。以上学者的质疑绝非吹毛求疵,只有呈现更多的现实中存在的强互惠现象才能体现这一理论的现世价值,而非学者们玩弄的一种概念。也只有在这个基础上,我们才可以从现实中将强互惠者萃取出来并对强互惠者本身所具有的一些的特质进行深入研究,从而更好地解释他们的这一行为。

第二,对利他性惩罚中的惩罚进行较为系统而又深入的研究。

以往的支持强互惠的研究中都提到了当有人背叛时强互惠者会不惜个人成本对其进行惩罚,但对于惩罚的机制形态、实施主体、手段等则缺乏细致的研究。笔者认为,利他性惩罚主要有三种机制形态,即:有惩罚无合作、有合作无惩罚和有合作有惩罚。有惩罚无合作指的是以不合作的方式对其进行惩罚。有合作无惩罚是指对于背叛者的行为以合理的、能够接受的解释,继续与之合作。有合作有惩罚是指当有一方背叛时便对其进行惩罚,在此基础上再与之合作。而实施处罚的主体既有可能是个人也有可能是集体。至于惩罚手段,倒不一定是指向武力,还可以是利益(在对自己的利益损坏的基础上试图使背叛者的利益也受到损失)或者情感(比如孤立背叛者)。

第三,强互惠行为的利他性如何衡量?

强互惠者是如何判断其惩罚行为是有效率的,怎样才可以说其惩罚行为对于群体中的其他人有利,判断标准是什么。况且我们清楚,创新对于原来的群体规范来说往往是一种打破,在这种情况下,强互惠者对作为创新者的背叛者的惩罚在短期内对于群体中的人虽然是有利的,但是从长远来看倒也未必。因此,利他性这个概念还有待进一步精确。

第四,从前文的分析中我们可以看出,目前学者们争议比较大的地方主要是关于强互惠的激励机制。

虽然支持内在激励的学者们已经通过运用正电子发射成像技术对强互惠行为发生时的脑神经系统进行了观察并且发现了与激励相关脑区的活跃程度远远超过平均水平,但这还是无法证明这种激活是由纯粹的内在满足引起的还是因为预测到未来可能的收益而引起的。

第五,强互惠亦或者是“情境人”?

2006年4月,英国心理学家科尔曼(Andrew Colman)发表于《自然》杂志的评论也指出,“惩罚不是免费午餐,惩罚本身是有成本的;除了需要消耗时间和精力,惩罚者还要承受被报复的风险;这样就可能产生‘二阶搭便车’行为” [50]。这也就是说,虽然具有强互惠倾向的人有较高的利他倾向,但他们也在理性地进行思考。他们或许并不追求所谓的利益最大化,但至少他们会尽量降低自己的损失。易言之,强互惠是有条件的,只有在满足了这些条件的情境中人们才会表现出强互惠行为。因此,现实中的人并不像强互惠假说所说的那么“好”,当然,也不像“理性经济人”假说描述得那么“坏”。而我们需要做的便是让“人”成为“人”,不能用自己脑袋中对于人的假设取代现实中活生生的人。因为一旦把人定义为某类人的时候,便已经在潜意识里承认了他作为这类人的一些稳定性特征,而忽视了其更多的可能性。然而,很多现实证据都已经表明,人们不仅具有自利的倾向,也有利他的倾向,他们是靠“两条腿”来走路的。并且,他们的行为不是稳定不变的,如上文所述,即便是利他性较强的带有强互惠倾向的人也会根据情景或者环境来调整自己的行为,所以,所谓的“某类人”更多的只是后来人的一种解释罢了。毋宁说,人应该是环境或者情境中的人。 综上,从考虑“人是什么样的人”向考虑“在何种情境下人们会表现出何种行为”过渡,应是明智之举。

全文阅读已结束,如果需要下载本文请点击

下载此文档

相关推荐 更多