社会偏好理论与社会合作机制研究:基于公共品博弈实验的视角
上QQ阅读APP看书,第一时间看更新

三、维系公共品自愿捐赠合作效果的机制设计

尽管个体内在的社会偏好能够导致成员之间的社会合作,但合作也可能是脆弱的,这就需要相应的机制来加以维持。现有的行为和实验经济学研究表明,奖励和惩罚机制以及声誉机制都是维系社会合作的有效办法。

(一)公共品自愿捐赠合作的脆弱性的解释

社会困境来自社会合作的脆弱性,而这一脆弱性体现在公共品博弈实验中自愿捐赠水平的降低上。理解这种脆弱性就成为走出社会困境的关键。Fischbacher等(2001)试图通过对个体社会偏好异质性的测度来寻找其中的缘由。他们利用Selten(1967)的策略性方法思想转引自Fischbacher等(2001)。按照Fischbacher等的理解,策略性方法的基本做法是让被试在面临小组其他人的各种可能的投资数额的情形下,做出相应的投资额决策。由于它可以收集到被试在不同投资数额之下的投资反应的大量数据,因此可以刻画出被试的合作偏好类型。,从实验测度方法角度解决了个体合作偏好类型的测度问题。而测度之后的实验结果发现,被试的合作偏好类型存在很大的异质性,大约有50%的被试是条件性合作者正如Chaudhuri(2011)所指出的,Kelley和Stahelski(1970)在囚徒困境博弈的研究当中最先检验了条件性合作概念。此外,Bryan和Test(1967)也对条件性合作做了初始的研究,他们把条件性合作具体表述为只有当别人也是这么做的时候决策才是有利的这一现象。但是,Bryan和Test并没有诱导出关于被试的信念的任何信息。而Sonnemans等(1999)最有可能是最先使用条件性合作术语的人。他们在扩展了Andreoni(1988)的经典的固定匹配和随机匹配的分组类型的实验研究后,不仅发现了最后一轮当中捐赠水平急剧下降的策略性行为的证据,而且发现了那些预期到其他人会做出捐赠的被试也会进行捐赠的条件性合作行为的证据。,23%的被试是搭便车者剩余比例的人无法进行分类。。此外,他们还发现,那些条件性合作者的总体自愿捐赠水平落在了45度线下面。这意味着当条件性合作者乐意捐赠自己所预期的其他人的捐赠水平时,他们并不完全与群体成员捐赠同样的水平,而是表现出微弱的自我服务(self-serving)偏向,即其投资的水平稍微低于群体当中其他人的捐赠水平。Fischbacher等(2001)采用这样的异质性合作偏好的参与者类型特点解释了公共品自愿捐赠合作行为的脆弱性特征。在他们看来,在任何给定的未分类的实验当中,参与者往往是由条件性合作者和搭便车者组成的。对群体成员的捐赠水平持乐观信念的条件性合作者会对公共品进行捐赠。但是随着时间的变化,他们开始发现群体当中的异质性类型,特别是在发现群体当中存在搭便车者之后,他们会降低他们的捐赠水平。正是这样的行动导致公共品自愿捐赠水平随着时间的变化而呈现出下降的趋势。后续的诸多研究结果表明,不管是采用策略性方法还是采用直接反应的方法(Muller et al., 2008; Güth et al., 2001; Brandts and Charness, 2011; Sonnemans et al., 1999; Keser and van Winden, 2000; Brandts and Schram, 2001),抑或是采用问卷方法或者博弈分解技术(Burlando and Guala, 2005),甚至是采用不同文化地区和城乡的被试(Kocher et al., 2008; Hermann and Thoni, 2009),都可以发现存在不同比例的参与者异质性类型和条件性合作的稳健结果。

而Fischbacher和Gächter(2010)在Fischbacher等(2001)的基础上进行的扩展研究的结果则发现,他们的信念模拟研究结果进一步地表明,即使整个群体是由条件性合作者组成的,只要每个条件性合作者都存在自我服务的偏差,就会形成公共品自愿捐赠合作行为的脆弱性特征。

公共品自愿捐赠合作水平的脆弱性意味着即使个体具有某种程度的社会偏好,在缺乏合适的机制设计的条件下其自愿捐赠合作最终还是会处于低水平的状态,甚至是趋向于瓦解的状态。那么公共品自愿捐赠合作水平能否通过相应的机制设计维持在一个较高的水平之上呢?从已有的公共品实验研究结果来看,对相关机制的实验研究主要集中于奖励和惩罚机制、声誉机制、群体类型选择机制以及其他机制的合作效果研究。

(二)奖励和惩罚机制

维系社会合作的第一种有效机制是奖励和惩罚制度。Ostrom、Walker和Gardner(1992)在一个公共池塘资源实验环境中考察了被试间交流的影响,更为重要的是,其提出了通过被试之间达成口头协议提高公共品总体供给水平的思路。后续的实验研究沿着这条思路,对惩罚机制进行了全面的讨论,例如Fehr和Gachter(2000, 2002), Decker、Stiehler和Strobel(2003), Anderson和Putterman(2006), Carpenter(2007a), Nikiforakis和Normann(2008), Egas和Riedl(2008), Casari和Luini(2009)以及Carpenter和Matthews(2009)等。此外,一些文献还对比了惩罚和奖励机制的作用(Sefton, Shupp, and Walker, 2007)。

典型的研究惩罚机制的公共品实验刻画了一个多期(被试在事前准确了解期数)两阶段博弈。第一个阶段是典型的公共品自愿供给阶段。被试在公共品和私人物品中做出投资决策(实验的参数设定大都确保个体占优策略是完全免费乘车)。第二个阶段是惩罚阶段。被试在了解其他被试的公共品投资决策的基础上,根据事前明确的惩罚机制选择对其他被试施加的惩罚,并且为此承担成本个别实验考察了不必承担成本的情况,例如Masclet等(2003)。,而被惩罚的被试的收益也会相应减少。个别实验对比研究了收益不受影响的情况,例如Masclet等(2003)以及Nikiforakis和Normann(2008)。根据新古典理论的理性人假设,在这种实验环境下个体的最优行动是显而易见的,即在第一阶段选择完全免费乘车,在第二阶段选择不施加惩罚。但是实验结果的诸多方面却与新古典理论的预测相去甚远。

针对惩罚机制的实验研究最具代表性的当属Fehr和Gachter(2000)。他们比较了在陌生人(stranger)环境和同伴(partner)环境中惩罚机制对公共品供给结果和被试个体平均收益的影响。实验结论表明,以不存在惩罚机制的公共品自愿供给环境为对照实验局,从组的层面来看,不论在陌生人环境还是同伴环境下,引入惩罚机制都会显著地提高公共品供给水平(是对照实验局中对应数字的三倍多),并且这种效果不会随着实验的重复进行而减弱(在同伴环境中甚至趋向完全合作,并且能够一直保持稳定)。另外,就个体层面而言,惩罚机制在初期会降低被试的平均收益,而最终往往会提高被试的平均收益。对此,他们给出的解释是,被试往往认为免费乘车行为违反社会准则,从而会有意愿对其施加惩罚,这就导致原本希望免费乘车的被试为避免受到惩罚而提高其个体公共品投资水平,因此从总体上显著提高公共品供给水平。但是由于施加惩罚需要付出成本,并且被惩罚的个体的收益也会相应减少,所以这种方式增加被试的平均收益的作用并不显著,即不能显著提高效率。

后续研究主要关注了三个方面。首先,大部分研究都印证了以下事实:惩罚机制的应用确实可以有效且显著地提高组内的公共品投资水平。一般而言,不存在惩罚机制的公共品实验中初期个体投资是其禀赋的40%~60%;但是,如果存在10期重复,则平均的个体投资大约是其禀赋的15%。表2—3列出了一些代表性文献的结果。

表2—3 关于惩罚机制的一些代表性实验研究的结果

注:MNTV代表Masclet等;DSS代表Decker、Stiehler和Strobel; CL代表Casari和Luini; AP代表Anderson和Putterman; C代表Carpenter; NN代表Nikiforakis和Normann; VFT代表Vyrastekova、Funaki和Takeuchi。平均比例表示不同实验局中各位被试的公共品投资占其初始禀赋的比例的平均值。

其次,后续的实验文献考察了惩罚机制的诸多方面,包括惩罚成本被试施加的惩罚点数与其负担的成本额度之间的关系一般有两种情况:一是递增关系,例如Fehr和Gachter(2000)等的研究,随着施加惩罚点数的增加,被试付出的成本是递增的;二是比例关系,例如Casiri和Luini(2009)中被试施加1点惩罚就负担1点成本。、惩罚效力被试得到的惩罚点数与其最终收益减少额度之间的关系一般有两种情况:一是按比例减少;二是按点数减少。(punishment effectiveness)、惩罚决策程序和惩罚范围(惩罚来源)等。Anderson和Putterman(2006)详细考察了被试的惩罚决策与其惩罚成本之间的关系。结果表明,惩罚力度和被惩罚对象的免费乘车程度正相关;即使控制了免费乘车程度的影响,惩罚力度还是与惩罚成本负相关;反向惩罚反向惩罚是指公共品投资水平较低的被试对公共品投资水平较高的被试或者公共品投资水平高于组内平均水平的被试施加的惩罚。(perverse punishment)大量存在;组内的公共品投资效率与其面对的平均惩罚成本负相关。这说明被试对惩罚力度的选择与其将要负担的成本之间存在重要联系。惩罚可被视为一种正常商品,被试会对其惩罚的价格(即被试需支付的成本)以及自身的收入做出相应的反应,它同样遵循需求规律(Andersion and Putterman, 2006; Carpenter, 2007a; Nikiforakis and Normann, 2008; Masclet and Villeval, 2008)。Nikiforakis和Normann(2008)对惩罚效力进行了系统性考察。实验结果表明,组内的公共品投资水平和惩罚效力正相关。Egas和Riedl(2008)同时研究了惩罚成本和惩罚效力的影响。实验结果表明,组内的公共品投资水平和惩罚效力正相关;与Nikiforakis和Normann(2008)不同,公共品投资效率和惩罚效力负相关。而这种相反的结论可能和参数选择有关。Decker、Stiehler和Strobel(2003)比较了个体惩罚规则(individual punishment rule)和集体惩罚规则(collective punishment rule)的不同效果。Casari和Luini(2009)对比了基准型(baseline)、序贯型(sequential)和一致同意型(consensual)三种不同的惩罚决策程序的效果。这些实验结果表明,不同的惩罚决策程序都能够显著提高公共品供给水平,并且都能至少维持合作水平,不过不同程序的效果存在差异。Carpenter和Matthews(2009)则把惩罚分为同组惩罚(second party punishment)和异组惩罚(third party punishment)(包含单向和双向)。实验结果表明,这些惩罚机制都能显著提高公共品供给水平,不过单向异组惩罚机制的效果相对差一些。

最后,这些实验研究试图揭示惩罚机制能够维持合作的原因。早期的解释主要是一部分个体认为免费乘车行为违反社会准则或者出于互惠目的,从而有意愿对个体施加惩罚,这就导致原本希望免费乘车的个体为避免受到惩罚而提高其公共品投资水平,因此从总体上显著提高公共品供给水平(Fehr and Gachter, 2000, 2002)。由此可见,即使承担成本也有意愿惩罚免费乘车者的被试就是解释这种现象的关键所在,而且这种现象在很多其他实验环境中也得到了证实,例如Henrich等(2006)以及Ottone、Ponzano和Zarri(2008)。惩罚也可被视为一种利他惩罚(Fehr and Gachter, 2000;Vyrastekova, Funaki, and Takeuchi, 2008),或者仅仅表达对免费乘车行为的不满(Masclet et al., 2003),或出于对某种社会因素的考虑(Carpenter, 2007a),或出于惩罚带来的主观满足(Fehr and Fischbacher, 2004;Quervain et al., 2004),或出于报复那些不公平行为的情感需要(Xiao et al., 2005; Falk et al., 2005)。而Cinyabuguma、Page和Putterman(2004)则担心被试的惩罚选择针对性不强,可能指向错误的方向。

总之,现有的实验研究表明,惩罚机制的确能够显著提升社会合作水平,并维系社会合作的长期稳定性,但不同机制的效果存在差异(Nikiforakis, 2008; Hermann et al., 2008; Gächter and Herrmann, 2011),这与决策规则的差异有关(Decker et al., 2003;宋紫峰和周业安,2009),也与惩罚力度和惩罚效力有关(Nikiforakis and Normann, 2008),甚至静态和动态情景下也存在差异(Gürerk et al., 2010)。惩罚效果还存在跨文化的区别(Hermann et al., 2008; Gächter and Herrmann, 2011)。特别是当在带惩罚的公共品博弈当中允许个体对惩罚行为进行反惩罚时,合作水平会下降(Nikiforakis, 2008)。可见,惩罚机制对社会合作的影响极其复杂。

除了研究惩罚机制外,实验经济学家还分别研究了惩罚和奖励混合机制以及外生奖惩机制的作用。首先,内生惩罚机制和奖励机制的搭配有助于提高社会合作水平。例如,Sefton、Shupp和Walker (2007)的实验结果表明,惩罚实验局以及同时包括惩罚和奖励的实验局都能够显著提高公共品供给水平并且保持稳定,而奖励实验局虽然初期能够提高公共品供给水平,但是在后期会有一个明显的下降。其次,外生惩罚和外生奖励机制也会产生不同的效果。Yamagishi (1986, 1988)的实验结果表明,由表现出较高信任水平的被试组成的组的公共品投资水平更高;由表现出较低信任水平的被试组成的组更能认识到惩罚系统的重要性,并且更愿意投资于该系统,相应地,该惩罚系统在这样的组中的作用也更为明显;由于该惩罚系统的存在,由较低信任水平的被试组成的组的效率相比基准组更高。通过投资惩罚系统解决免费乘车问题的思路在后续研究中也得到了进一步的拓展。例如,Cremer和Dijk (2009)就研究了惩罚系统。从某种意义上讲,这也是另外一种公共品。不过该实验更加关注被试是否就其选择向其他被试进行解释的区别。

(三)声誉机制

非合作博弈的一个重要思想是当参与人重复博弈时,有可能形成某种声誉机制,从而有助于提高社会合作的稳定性。行为和实验经济学家通过两条路径来讨论这种声誉效应。一是直接互惠,即前期合作的声誉可以让双方在后期受益。该声誉效应是通过固定匹配实验局当中双方稳定的合作关系实现的。二是间接互惠,即前期个体合作的声誉可以在后期使其他与其合作的个体也受益。它往往是通过互助博弈以及简化的二元公共品博弈结构(也相当于囚徒困境)实现的。不过,迄今的研究得到的结论却大体上正好相反,关于直接互惠的研究并没有发现声誉能显著促进合作,而关于间接互惠的研究则显示声誉可以是社会困境的一种有效治理机制。

具体来看,直接互惠型研究的结论非常不明确,有些研究不支持声誉效应,即固定匹配实验局的公共品自愿捐赠水平低于随机匹配实验局(Andreoni, 1988; Palfrey and Prisbey, 1996),另一些研究则刚好相反(Croson, 1996; Sonnemans et al., 1999; Keser and Winden, 2000; Fehr and Gächter, 2000; Duffy and Ochs, 2009;周业安和宋紫峰,2008),还有证据表明两种不同匹配方式的实验局的捐赠水平并不存在显著差异(Weiman, 1994; Brandts and Schram, 2001; Nikiforakis, 2008)。跨文化研究同样呈现出这三种结论(Burlando and Hey, 1997; Brandts et al., 2004)。三种可能结果的出现表明,就直接互惠而言,声誉效应是不稳健的,但社会偏好的存在是稳健的(Andreoni and Croson, 2008)。

与直接互惠型研究的结论截然相反的是,间接互惠型研究给出了声誉效应的稳健性的证据,即从间接互惠的角度看,声誉机制可以有效解决公共品自愿捐赠合作行为的脆弱性问题(Milinski et al., 2002)。而间接互惠中声誉机制之所以能够发挥作用,主要是因为,当参与者意识到其身份在未来社会情境当中会被识别出来的时候,他们会进行声誉的策略性投资(Semmann et al., 2004; Engelmann and Fischbacher, 2009)。声誉投资是一个非常有用的信号(Vugt and Hardy, 2010),因为声誉无论对目前自己所处的群体内的成员来说还是对未来自己可能碰到的其他群体的成员来说,都可以传递出自身诚实合作而非搭便车的信息(Semmann et al., 2005)。出于这样的考虑,即使是纯粹利己的自利个体在公共品情境当中也会选择合作的方式。

除了前述的基本机制外,还有其他一些机制也影响社会合作。首先,信号显示机制非常重要。信息交流可以为异质性参与者提供一个相应的信号和协调机制,使囚徒困境问题转变成一个协调博弈问题(Fehr and Schmidt, 2005)。Isaac等(1985)、Isaac和Walker(1988a, 1988b, 1991)、Ostrom等(1992)研究发现,面对面的沟通交流能有效促进合作,这实际上是一种信号发送(Roth, 1995)。后续的研究结果则表明,不管是采取面对面的交流、电话交流、视频会议(Jensen et al., 2000; Brosig et al., 2003),还是采用控制面部表情及声音等的电子文本或者纸质文本(Bochet et al., 2006;Bicchieri and Lev-On, 2007),无论这样的交流方式是在博弈进行之中还是在博弈互动过程当中(Voissem and Sistrunk, 1971; Brosig et al., 2003),也无论是否存在领导机制(Koukoumelis et al., 2012; Pogrebna et al., 2011),不同类型的交流方式均能显著提高社会合作水平,尽管各自的效果存在差异(Sally, 1995; Balliet, 2010)。其次,门槛的设置有助于合作的形成。门槛公共品是指这样的一种情形,即只有当群体成员自愿捐赠的总和超过某个预设的公共品供给门槛值时,公共品才能供给出来,群体成员才能受益。现有研究发现,不同的门槛返款规则有着显著不同的合作效应(Marks and Croson, 1998; Spencer et al., 2009; Cadsby and Maynes, 1998, 1999),合作的概率主要取决于公共品的总体群体收益与总门槛成本的比率(step return, SR),或者门槛公共品供给的价值与成本的差额,即净收益或者净回报(net reward, NR)(Cadsby and Maynes, 1999; Croson and Marks, 2000; Cadsby et al., 2008)。与此同时,门槛水平的不同变化顺序也会影响参与者自愿捐赠的意愿及其对合作可能性的预期(Asher et al., 2009)。最后,还有一些研究者关注到了非物质奖惩的重要性。关于非物质奖励和惩罚的效应的实验结果发现(Peeters and Vorsatz, 2009),非物质奖励比非物质惩罚更有效。除此之外,非物质奖励对未来的捐赠水平会产生影响。

(四)群体类型选择机制

由于个体具有社会偏好的异质性,因而根据不同类型的社会偏好对人进行分类就会影响社会合作水平。这种分类可以是外生的,即由第三方的实验人员或者电脑随机分组,也可以是内生的,即由被试自己选择相应的群体。无论采取哪种群体选择机制,都会把人划分成不同类型的群体,这种分群是否会对社会合作产生影响?直觉上说,物以类聚,人以群分,分群有助于社会合作的稳定,从而激励社会成员走出社会困境。行为和实验经济学家试图通过实验方法探讨群体类型选择机制对社会合作的影响。

早期群体类型外生选择机制往往将被试在公共品博弈当中的初期捐赠水平作为后续博弈阶段群体类型的划分标准,其背后的原理在于认为第1期的捐赠水平实质地反映出了个体纯粹的合作偏好,因此在形式上是根据捐赠水平进行分类,而实质上是通过将捐赠水平作为个体合作偏好的代理变量进行分类,如Gächter和Thoni(2005)、Gunnthorsdottir等(2007)以及Ones和Putterman(2007)。这些研究发现,按照个体公共品初期捐赠水平高低顺序分群之后,和未分群时相比,分群后不同群体的捐赠水平显著地提高了,公共品自愿合作的衰减速度则显著放慢。即使是在混合惩罚(Gächter and Thoni, 2005)条件下或者是在不同的公共品单位收益条件下(Gunnthorsdottir et al., 2007),依然存在类似的结果。

随着Fischbacher等(2001)的类型测度方法的提出,许多研究开始基于这一方法进行分群。de Oleveira等(2009)采用测度出来的条件性合作者以及搭便车者进行了后续的研究,并对群体类型信息进行了控制。实验研究结果表明,同质的条件性合作者的合作效果显著高于异质性群体和同质的搭便车群体,而随着条件性合作者的比例在群体当中的逐渐降低,其群体合作水平也明显下降,但是这样一个下降的趋势受异质性群体的比例以及群体信息条件的制约。

在Dannenberg等(2007)以及Blanco等(2011)解决了对个体不平等厌恶偏好的测度难题之后,产生了依据个体的不平等厌恶偏好程度进行群体类型划分的另外一种分类标准。Dannenberg等(2007)以及陈叶烽等(2011)在对Fehr和Schmidt(1999)的不平等厌恶理论进行检验时,依据个体的优势不平等厌恶系数把被试分为公平组、混合组和自私组,这类似于de Oleveira等(2009)的群体类型划分。而他们所得到的实验结果无法完全地验证Fehr和Schmidt(1999)的不平等厌恶理论,反而在大体上支持同种类型成员具有更高捐赠水平的结论。

从群体选择机制的实验研究成果来看,无论是群体内生机制实验还是群体外生机制实验,都根据个体的实际公共品自愿捐赠水平来划分群体类型,所不同的是,群体外生机制实验中,群体类型的划分标准是个体初期的实际捐赠水平,而群体内生机制实验中,群体类型的划分标准是个体多期的实际捐赠水平。与此同时,是否构成同一个群体是由被试自行依据其他个体实际的捐赠水平决定的,可以采用“用手投票”的方式——表示愿意与哪些个体构成一个群体(Pageet al., 2005),或者采用“用脚投票”的方式——(以一定的成本)自行退出某个群体(Ehrhart and Keser, 1999),或者同时采用“用手投票”和“用脚投票”的方式(Charness and Yang, 2008)。连洪泉等(2015)则进一步讨论了信息显示和群体内生机制的可能影响。这些研究所得到的结论大体上表明,赋予个体选择权限之后,由此构成的群体的捐赠水平会显著地提高,并且能够维系在稳定的合作水平。