
三、实验室实验研究的基本思路和特点
(一)经济学家为什么需要进行实验室实验研究?
经济学家对实验方法的忽视非常类似早期哲学家对自然科学领域运用实验方法的冷漠,如古丁(2000)所指出的,早期哲学家忽视了实验的创造性、探索性和建构性。也正是这种忽视使早期自然科学领域也对实验研究加以排斥。歧视实验方法的历史在经济学的发展过程中重现,只不过经济学家并没有深究实验在自然科学发展中的沧桑经历及其对自然科学所带来的巨大影响,或者说,即便经济学家看到了实验在推进自然科学进步的过程中所起的巨大作用,但总会自我辩护说人类社会和人的行为不具备自然界那种可实验的条件,因而拒绝实验。直到最近,仍然有不少经济学家持这种看法,比如Sims(2010)甚至很武断地说,经济学不是一门实验科学,也不可能是!但为什么不可能?他并没有给出理由。
经济学家对实验方法的排斥来自对这种方法的性质和作用的认知错误。Plott(1991)不得不通过例举法解释经济学为何可能变成一门实验科学。Roth(2002)更是把实验视为经济学工程化的关键。但从自然科学的角度看,实验的作用是非常巨大的,古丁(2000)指出,“实验的基本作用是提供如何研究世界的新信息,换言之,关于未知世界的工具知识”。这一点得到了实验经济学家的高度赞同,Falk和Heckman(2009)指出,实验室实验在发现新知识方面有独特的作用。Guala(1998, 1999, 2003, 2005a, 2005b, 2012)以及Guala和Mittone(2005)在一系列的论文中系统地讨论了实验经济学方法论问题,认为实验方法不仅对理论研究有用,能够起到作为理论和现实之间的桥梁的作用,而且即便存在外部有效性问题,仍然可以通过方法论和实验设计技术的改进来提高其有效性。也就是说,实验室实验对经济学来说非常有用。就算是不怎么认同实验方法的人,如Rubinstein(2001),也认为实验可用于检验理论。Croson和Gächter(2010)认为,实验研究具有四个作用:检验理论、提供行为模型、精炼理论以及创造新理论。Søberg(2005)则从迪昂—奎恩命题出发,指出实验其实是对相互关联的不同理论假说的检验,而不是针对某一类理论的检验,这符合科学哲学中整体论的思想。按照整体论,任何经验证据对任一单一理论都是非充分决定的,也就是说,理论总是伴随着众多的假说和背景知识,检验理论的同时也必须与这些假说和背景知识结合起来,这就使同一经验证据可能指向多个理论,而不是单一地指向某个理论。因此,按照整体论的观点,实验室实验方法就不仅仅针对行为经济学或者某些经济学的理论,它针对全部的经济学理论。从这个角度讲,实验室实验可以作为经济学研究的一种基础方法。
那么,实验室实验在经济学研究中究竟能起多大的作用?在最基本的层面上,实验室实验是作为某种经济理论的检验工具而出现的,比如早期张伯伦的实验等。Roth(2002)从市场设计的角度出发,认为实验室实验是对博弈论的非常有利的补充。受波普尔证伪主义的哲学观之影响,经济学家试图通过数据来验证其理论,计量经济学是一种常用的方法。但对于很多微观理论问题,比如偏好、市场结构等,经济学家很难采集到合适的自然数据加以检验,此时实验室实验就起到了很好的补充作用。比如,通过在实验室中要求被试进行彩票组合的选择可以测度被试的风险偏好类型和程度,通过设计某种市场机制可以考察该机制对被试的交易行为的影响。但实验室实验的内容远比理论检验更为丰富。用于检验理论的实验室实验总是受理论本身的限制,假如理论自身是错误的,那么实验室实验可能跟着犯错。理论通常是不完备的(Guala, 2005b),如Bardsley(2010)所指出的,理论的抽象可能影响实验的抽象,使实验陷入理论的困境中,并且实验室实验在检验理论与独立发现之间存在某种程度的权衡(Guala and Mittone, 2005)。实验经济学家为了避免这个问题,通常会独立于单个理论设计出实验室实验,以研究一些具有普遍意义的问题,这就意味着实验室实验除了可以检验理论外,还可以起到作为理论和现实世界之间的桥梁的作用(Guala, 1998),并且可以提供证据呈现出某种内在逻辑关系的意义(Sugden, 2005, 2006),也就是说,实验和理论是一个相互发现的过程(Samuelson, 2004)。Jones(2007, 2008)则认为,实验室实验完全可以作为独立发现理论的重要方法,并且Jones(2011)并不同意Guala(1998)的桥梁说法,而是认为实验室实验是和理论与现实并行存在的。
的确,Harrison和List(2004)、Levitt和List(2007a, 2007b)、A-l Ubaydli和List(2013)也承认,实验室实验的作用在于通过实验室抽象地再现现实世界,关键在于提供定性的证据(qualitative evidence)。即使相关的结构参数受到深深的质疑,实验室实验也能够为政策制定提供有力的依据。相比实地实验,实验室实验在提供定性数据方面更有优势。同样,我们也可以把实验室实验和理论模型进行对比。Morgan(2005)指出,实验室实验和理论模型都是对现实世界的抽象,并且都提供了可控的研究环境,只不过实验室实验是通过实验设计和物质条件来控制,而理论模型则通过假定条件来控制。理论模型是对现实世界的抽象表达,而实验室实验是在一个人为环境中再现世界的一个代表性部分,两者都是人为的。也正是这种共性使两者都可能在科学研究中获得惊喜,尤其是实验室实验。
(二)实验室实验的基本逻辑和思路
如前所述,经济学实验可以被视为一个受控条件下的数据生成过程。所谓控制,就是让其他影响行为的变量保持不变,而仅仅允许某个变量随时间变化(即处理)(Croson and Gächter, 2010)。比如经济学实验通常都会对选择集、信息条件以及货币激励结构等加以控制。实验室实验的特点在于非常简化的情景、人为的设置以及抽象的导语。比如在最后通牒博弈实验中,一组被试被分成提议者和响应者,被试的任务就是分配给定的初始禀赋。这个情景非常简单。同时整个分配按照最后通牒博弈来设计,具备博弈的基本要件,比如参与人、时间、信息、行动次序等。这些要件在导语中都会得到详细的表达。被试只需在电脑前进行匿名交易,电脑对被试进行随机匹配,这是人为设计出来的最简单的博弈环境。而实验员只需要记录被试的决策结果就可以对结果数据进行分析研究。
具体来说,实验室实验试图通过一个可控情景来研究某些逻辑关系。一个现实的社会经济系统无一例外地都可以抽象成环境、制度和行为三要素,三者之间有内在的互动关系,这就是一般均衡的思维。但主流经济学在处理这种一般均衡时,只能给定某种制度,讨论确定或者不确定的环境下个体的理性行为,无法讨论制度在其中的作用以及个体互动成为群体后所具有的社会性的意义,而这恰恰是后来的行为和实验经济学所重点讨论的。经济学家长期对实验方法的排斥和忽略可能与其面对个体的社会性时束手无策有关,传统上对个体社会性的处理要么把社会性抽象掉,形成一个纯个体的代表性当事人,要么把个体完全抽象掉,成为社会的一个部件,两者都无法讨论个体和社会之间因社会性而隐藏着的互动关系。这种互动关系在展示个体的社会性时,介于纯个体和纯社会人之间的某种状态,具体在哪个位置取决于社会性的程度。制度是个体的社会性的表达,由个体的社会性演化而来,同时又决定了个体的社会性的程度。
个体的社会性在实验室实验中可以得到有效的展示。回到最后通牒博弈,在标准的最后通牒博弈中,两个被试进行一回合的蛋糕分配,其中作为提议者的被试提出一种蛋糕分配方案,而作为响应者的被试选择接受或者拒绝。在这种情景下,按照过去的经济学的预测,响应者对于大于零的任一正数都会接受。而提议者很明显了解这一点,因此只会给响应者不为零的一个微小份额。这个看似简单的博弈满足博弈论的所有要件,并且理论预测完全符合基于理性经济人的个体主义方法论。但大量的实验给出了相反的结论,响应者通常拒绝一个过小的但正的份额,并且提议者通常分给响应者一个远大于零的正的份额。这个最后通牒博弈实验在扩大的被试群中得到了反复验证,并且退化成独裁者博弈后仍然如此。为什么被试会在实验室实验中展现出与理性经济人模型的预测相反的结果?答案很简单,就是因为基于理性经济人假设的经济学理论忽略了人的社会性,而实验室实验把这一社会性展示了出来。史密斯(1982)指出,实验室微观经济系统就是真实生动的经济系统,其基本目标就是建立一个便于管理的实验室微观经济环境,使我们能够对其施加足够的控制,并且精确地测量相关的变量。Bardsley(2005)明确指处,实验室实验是对现实社会的折中,尽管这可能影响实验室实验的代表性,但也仅此而已。
由于有特定的理论模型作为指南,实验室实验无论作为证伪的工具,还是作为进一步发现新的理论线索之途径,都严格受限于经济理论的一般性的要求。这一要求本质上是把实验室中参与实验的被试视为社会中的真实的代表性当事人,那么实验室环境本质上也就是一个浓缩的小社会。从这个意义上看,实验室实验类似于小样本研究。这种研究和通常的心理学实验有很大区别,因为心理学并不要求人是理性的,而经济学则不然,无论哪种流派,一般来说都要求当事人是理性的。也正是理性这个要件使实验室实验在设计时必须遵循两个基本要求:一是有效激励;二是真实再现社会经济生活。
1.有效激励
实验室实验的设计明显受到了信息经济学的影响。在早期的实验中,经济学家并没有关注被试的激励问题。比如张伯伦的课堂实验更多地还是通过一种轻松的小游戏来再现市场运行的情景。这和心理学的实验没有本质区别,尽管张伯伦的实验已经有了导语和说真话的要求。被试的激励是实验室实验的一个关键。被试为什么要来参加实验?被试选择参加这个实验,为什么会按照导语的要求做出真实的行为?这两个问题按照信息经济学的术语说,就是参与约束和激励兼容约束。这就要求在一个实验室实验中,被试从中所得必须满足这两个约束条件。史密斯(Smith, 1976)提出了诱导价值原理,这一原理要求针对被试的具体行为制定相应的货币报酬结构。其中有两层意思:一是通过出场费的形式来满足被试的参与约束;二是通过设计与被试的行动绩效挂钩的报酬结构以及恰当的报酬均值来满足被试的激励兼容约束。通过满足这两个约束,被试在实验室实验中就如同在一个真实的社会情境中那样行事。这两个约束被史密斯(Smith, 1982)概括为非餍足性、突显性和占优性三个充分条件。第一个条件是说被试按照经济学理论所预测的那样偏好货币激励;第二个条件是指被试的行动和绩效与货币激励挂钩;第三个条件是指被试的报酬必须高于实验中任何行为的主观成本(价值)。
2.真实再现社会经济生活
实验室实验看起来是一小群人在一个实验室环境中玩一些和经济学理论模型相关的游戏,比如博弈论、市场交易、公共决策等,但即便是这样一个小的可控环境,仍然构成一个小的真实的社会,而被试身处其中,面临着与现实社会同样的问题,做出日常生活当中也会做出的决策。要做到这一点,就需要实验室实验不仅是可控制的,而且必须是可重复的。可控制性体现了实验室实验和现实社会经济生活的区别。实验室实验要发现某些特定变量之间的关系以及特定制度的影响,就需要把其他可能的影响变量控制起来,在实验室中将其变成受控条件下的数据集。不过仅仅做到可控还不够,同样一个实验,如果更换被试、扩大被试的规模,或者提高互动的频率等,那么是否还能得到类似的结果?这就要求实验室实验必须是可重复的。这体现在两个方面。第一,如果是一次博弈,那么这样一种博弈在不同情况下再现出来时是否可以展示类似的结果?比如在不同国家和地区招募各自的被试进行最后通牒博弈实验,其结果是否类似?这涉及实验结果的稳健性。第二,假如对一次博弈进行扩展,让同样的被试进行多轮博弈,那么结果又如何?这就涉及单次博弈和重复博弈的区别,而实验室实验可以很方便地研究不同的博弈模型。通过控制和重复,实验室实验所得的结果从理论上能够有效解释一些变量的因果关系,并且这种关系在实验室之外也是成立的,这就是史密斯(Smith, 1982)提出的并行原理。该原理要求,在实验室中已经检验过的有关个体行为和制度绩效的命题,同样也适用于同等条件下的非实验环境。
可以说,诱导价值原理和并行原理确保了实验室实验能够在受控条件下再现人们的真实生活状态,使实验室实验生成的数据集能够真实反映行为人的相关信息。有了这一基本逻辑,经济学家就可以在实验室当中设计各种博弈来研究利用自然数据无法实现的目的。关于具体实验设计的详细论述和一般性的实例可参见Friedman和桑德(2011)、Davis和Holt(2013)。本书则给出了详细的公共品博弈实验的设计和实施过程。