【内容提要】:文章描述了达成集体行动基础的两条研究路径,一是关注实 验研究提供的证据及其可能的理论解释;二是考察真实世界的经验证据。关于集体行动的这两条研究路径是很活跃的研究领域,出现了很多重要的研究成果。其中一 个重要的发现是,世界上的人有许多类型,有一些人会比另一些人更愿意为了集体行动的潜在收益而发起互惠行动。因此,一个核心的问题是,潜在的合作者如何相 互发出信号,以及如何设计制度以促成而不是破坏有条件的合作。尽管还没有完全成熟的理论面世,不过,基于演化的一些理论对各种基于实验或者田野调查的研究 发现的解释力也许是最强大的,因而有可能成为这一领域的核心理论。

【关键词】:集体行动 社会规范 演化

【作者】:埃莉诺·奥斯特罗姆,2009年诺贝尔经济学奖得主,美国印第安纳大学教授;翻译:王宇锋,经济学博士,江西财经大学经济学院讲师

 

【来源】:《经济社会体制比较》(京)2012年5期第1~13页

当 共同受益(jointly benefited)的机会出现时,群体会形成并采取集体行动,这是现代民主思想体系的重要基础。在《集体行动的逻辑》一书中,曼瑟尔·奥尔森 (1965)挑战了这一基础,提出了一个颇具刺激性的论题,即自利的个体不会提供公共产品。他写道:“理性的自利个体不会为公共的或群体的利益付诸努力, 除非群体规模很小,或者通过强力以及其它特殊机制。”这一论断被称作“零贡献命题”(zero contribution thesis)。

在特定环境中,即使合作有利于实现共同的利益,理性参与人也不会选择合作,这一思想在n人囚徒困境中也同样体现了出来 (Hardin,1971;1982)。事实上,和其它一些社会悖论一样,囚徒困境被看作是对集体行动问题的标准表述(Lichbach,1996)。 “零贡献命题”为许多政策类教科书(以及当代的许多公共政策)提供了理论基础:由于个体无法解决集体行动问题,那就需要引入外部的强制性规则,以实现个体 的长远利益。

然而,这一命题和我们在日常生活中观察到的许多现象并不一致。至少,很多人会去投票、不会在纳税申报上进行欺诈以及为志 愿组织积极贡献力量。目前,广泛的田野调查已经证实,为实现贸易的收益、实现风险共担以及为保护自然资源而设立并实施相关规则,世界各地各行各业的人们会 自愿地组织起来。强有力的经验证据表明,政府实施的政策可能会阻碍而不是有助于公共物品的私人提供(Montgomery & Bean,1999)。当然,研究也证实,在为集体福利付诸努力时,搭便车倾向是一个普遍问题。在所有已知历经多代仍能维系的自组织资源治理体系中,参与 人会投入资源进行相互监督和惩罚,以降低搭便车的可能性(Ostrom,1990)。

尽管这些经验研究对零贡献理论提出了严峻的挑战,但目前还没有一种集体行动理论能够有效整合这些经验研究。基于自利个体的理论表明,协调集体行动非常困难,而实践中,这种协调尽管很难奏效,但确实广泛存在。于是,理论和实践之间产生了鸿沟。

从事理论研究和经验研究的学者们都在试图弥合上述鸿沟。近来博弈论领域(往往结合实验研究提供的证据)的一些研究给出了新的关于个体行为的微观理论,这 些理论有助于回答前述问题(McCabe,Rassenti & Smith,1996;Rabin,1993;Fehr & Schmidt,1999;Selten,1991;Bowles,1998)。从事经验研究的学者们则在找出哪些因素可以提高集体行动成功的概率方面, 做出了重要的贡献(Feeny et al.,1990;Baland & Platteau,1996)。本文将从理论研究和经验研究两个方面来拓展这一命题的研究视野。

一、集体行动中的理性选择:来自实验的证据

政治经济学家的大部分研究建立在标准的理性个体行动模型之上,我称之为理性自我中心主义。广泛的经济学实验研究表明,在竞争性市场中,理性自我中心主义 假设是恰当的(Kagel & Roth,1995)。不过,在市场实验中,实验参与人也不是第一轮就能够形成理论所预测的均衡,而是要经过五轮才能逐渐接近所预测的均衡。实验经济学的 主要成就之一就是验证了微观经济学理论对市场行为的解释力。

然而,在集体行动的情况下,结果却大相径庭。在通过实验考察个体克服集体 行动困境的意愿时,线性公共品实验是广泛应用的一种实验。在这种实验中,每个人拥有一定数量的资产,并且必须决定投资于公共产品的投入量。当一个参与人贡 献一定量的资产作为公共品(比如10单位)时,每个参与人(包括贡献者)会得到一定量的资产,比如,5单位。在这种设定中,如果所有参与人都把自己的初始 资产全部投作公共品,就会得到最大化的总产出(如果有10个成员,一个成员付出10单位则可以产生50单位的社会收益!)。然而,在单次博弈模型中,理性 自我中心者所能达成的唯一均衡是所有参与人都不进行公共品投资,因为每个人都可以获得其他人的投资收益,而不用付出任何成本①。

对理 性自我中心主义而言,只要这一公共品博弈的次数是有限的,每一轮均衡的投入都是0。因为他们会这样推理:最后一轮的均衡投入是0,那可以预期倒数第二轮的 投入也是0,如此从后往前推,结果就是任何一轮都不会进行公共品投资。当然,这些预测是建立在如下基础之上的,即:每个参与人都完全理性;参与人只关心他 们直接的金融财富收益;每个参与人对该博弈的结构完全了解并且相信其他的参与人也完全理性;没有外部的参与人可以使参与人之间的协议得到执行。

自从道威斯、麦克塔维什和夏克利(Dawes,McTavish & Shaklee,1977)首次进行公共品实验研究后,这种实验层出不穷(Davis & Holt,1993;Ledyard,1995;Offerman,1997)。到目前为止,以下七个方面的一般性发现得到了验证,并成为理论解释的核心 事实。

1)在单次博弈中,参与人会将大概40%~60%的初始禀赋作为公共品投资,在有限次重复博弈中的第一轮也是如此。

2)一轮过后,公共品的投入水平趋于下降,但远高于0。一个反复得到验证的发现是,在有限轮次的博弈中,最后一轮,有超过70%的参与人将不进行任何公共品投资。

3)相信在社会困境中其他人会进行合作的那些人自己也更加可能会进行合作。然而,在公共品博弈中,理性自我中心主义者不会受到其他人的投入水平的影响,其占优策略是不管其他人怎么做,他都完全不投入。

4)通常,进行博弈的学习会产生更多的合作行为。通过在实验中让参与人有更多的博弈时间,让他们学习什么是预测的均衡策略,可以很容易考察公共品博弈中 的学习效应。艾萨克、沃克尔和威廉姆斯(Isaac,Walker & Williams,1994)对此作了简单的实验检验,他们在实验中让参与人先后进行10轮、40轮和60轮的重复试验,参与人在实验中知道每次实验的轮 数。他们发现,衰减率和与博弈轮数成负相关关系。换言之,面临更多的博弈轮数时,参与人在其中的学习会使他们提高合作水平,而不是变得不合作。

5)和面临其它一些社会困境一样,面对面交流会使参与人在公共品博弈中的合作水平有大幅提高,这种提高发生在博弈的所有轮次,包括最后一轮 (Ostrom & Walker,1997)。沟通效应非常显著,这和目前为人们所接受的理论并不一致,因为实验中的口头协议是不可执行的。因此,沟通只是“廉价协商”,根 据现有理论的预测,这不会改变社会困境的结果。实际上,在协商过程中,参与人并不是将此机会用在如何愚弄他人以使他人合作,而是讨论最大化的联合战略,相 互承诺,并且在总公共投资水平低于之前承诺水平时进行口头谴责。有趣的是,通过计算机终端发出承诺的实验,其合作水平远低于面对面沟通的实验。

6)如果博弈的结构允许,参与人将愿意付出个人资源去惩罚那些公共品投资低于平均水平的人,在有限重复博弈中的最后一轮同样如此。理性自我中心主义者是 不会有动机去惩罚其他人的。因为这种惩罚带来的好处要和许多其他人均等地共享,无论其他人是否投入资源进行惩罚。事实上,在美国、瑞士和日本的实验都表 明,那些最初信任感很低的人会更加愿意投入到惩罚系统中,并且在有了惩罚机制后,变成高度合作者的几率更高。面对面的沟通比通过计算机终端发信息更有效, 其原因很可能在于,前者可以使用丰富的语言结构。发自内心的厌恶搭便车者的人会用语言和肢体语言表示其愤怒,而听到那种语调或者看到那种肢体语言会给搭便 车的人带来内在成本(Ostrom,1998a)。

7)公共品投资贡献率受到许多背景因素的影响,比如所设定的情境,指派参与人的规则,增加参与人之间的竞争性,允许沟通,引入惩罚机制以及不同的收益分配方案。

在标准理论看来,人们在面对同样的外在博弈形式时,会采取同样的方式进行评价决策。然而,这与上述事实并不相符②。对于这种结果,我们不能简单地归咎为 本科生的古怪③。至少,在实验中,增加报酬额同样没有改变基本的结论④。我相信,这些相当牢靠的事实将使人们不得不采纳更加折中(也更经典)的关于人类行 为的看法。

二、构建基于多类型参与人的集体行动理论

为了解释实验研究的发现,我们也许需要将一些关键假设整合在一起,以改进集体行动理论。如果我们假设在理性自我中心主义参与人之外,还存在两种参与人,即“有条件合作者”和“有惩罚意愿者”,这可能会有助于我们解释公共品实验中的那些发现。

我们把A这样的参与人称为有条件合作者:参与人A只有预期到,A以外的其他参与人只有在有足够比例的其他参与人⑤采取互惠行动时他们才会采取且持续互惠 行动,这时,A才会发起合作行动。有条件合作者会在单次的囚徒困境和公共品博弈中进行公共品投资。在重复博弈中,这类参与人的合作行为会激励一些理性自我 中心主义者也进行合作,因为这样可以在前面轮次的博弈中获得更高的回报(Kreps et al.,1982)。在序贯囚徒困境博弈中,只要回报信任的比例较高,有条件合作者会倾向于信任他人而且也值得信赖。不过,有条件合作者对搭便车的忍耐力 差别很大。有些人在看到其他人不合作时,很容易就失望了,然后就会降低其合作贡献程度。而他们降低合作贡献程度,会进一步让其他有条件的合作者感到失望。 如果没有沟通和制度性机制阻止这种急坠,最终,只有那些最坚定的有条件合作者才会即便是在最后一轮都会贡献正的合作份额。

前述发现中 的前四个发现与在多数集体行动情形下会出现有条件合作者的参与这一假说是一致的。在一次及有限次重复博弈中,有很多参与人的初次公共品投资比率达到 40%~60%。显然,有条件合作者在人群中占有相当比例。预期到其他人很可能合作将会增加这些人的合作意愿。进一步地,知道博弈要重复很多期,会使得有 条件合作者抑制他们对搭便车者的失望,以保持在后面博弈中适中的合作水平(及联合收益)。

第五个和第六个发现需要有第三类参与人,这 类参与人有意向对推定的搭便车者进行言语上的谴责,或者进行有物质成本的惩罚。有惩罚意向的参与人也可能愿意在群体内对那些合作水平高于最低合作水平的参 与人进行奖励。一些有条件合作者也可能同时是有惩罚意向的参与人。有条件合作者和有惩罚意向的参与人能可靠地促进集体行动的达成,并且可以创造使合作水平 增加的机制。当允许面对面交流时,有惩罚意向的参与人会对辜负他们信任的其他人表达蔑视和愤怒,而当大家合作水平很高时,会进行大力的鼓励。对于集体行动 的长期持续,甚至更为重要的是有人愿意付出一定成本来惩罚其他人。考虑到已有的经验证据,要质疑前述两种参与人的存在是不太容易的。现在的问题是,在一个 理性自我中心主义者的世界里,这些参与人是怎么出现并存活下来的呢?

(一)演化过程中多类型参与人的出现与存续

演化理论提供了模型化人群中不同类型参与人出现与存续的一些有用的方法。在严格的演化模型中,个体通过遗传获得策略并且终生不变。在这种方式下,带有成功 策略的个体将以更高的几率进行繁殖。多代重复后,携有更成功的策略个体将构成总群体的主体(Axelrod,1986)。该模型给了我们一个看待不同策略 的竞争与存活比例的出发点⑥。

人类的演化主要发生在距今一万年前的漫长的更新世时期,持续了约300万年。在这一时期,人类以小规模 的狩猎—采集群体的方式散居在地球各处。群体中的人们需要相互保护,分享食物,抚养幼小。他们要想存活下来,仅仅通过个体侵略性很强地寻求个体回报这种方 式是不够的,还有赖于解决每天都会出现的各种集体行动问题。那些更加有效率地解决此问题并且学会识别谁是欺诈者、谁是值得信赖的互惠者的先辈们会比做不到 这些的其他人更拥有选择性优势(Barkow,Cosmides & Tooby,1992)。

研究人脑认知结构的演化心理 学家们给出的结论是:人类并没有发展出应对各种具体问题的通用分析技能。人类并不非常擅长于解决一般逻辑问题(教授本科生概率论的专家都可以证实这一 点)。人脑似乎演化出了一种领域依赖(domain-specific)的人类推理结构(Clark & Karmiloff-Smith,1991)。比如,人类在推断道义关系,即什么是禁止的、什么是有义务的以及什么是允许的,和推断什么是真实的和什么是 虚假的时,使用的是不同的推理方式。当推断义务关系时,人类倾向于去检查违反行为或背叛者(Manktelow & Over,1991)。当推断经验关系是否真实时,则采取的是巩固确认策略(Oaksford & Chater,1994)。这种人类推理的道义效应甚至在年仅3岁的儿童中都可以得到反复的证实,而3岁儿童没有总体智识和教育水平的差异 (Cummins,1996)。

类似于语法规则的学习能力,现代人类通过遗传获得社会规范的学习能力,这一假说得到了演化理论和相关 经验研究的最新进展的强有力支持(Pinker,1994)。社会规范就是为人们所共享的关于人们有义务、允许以及禁止采取哪些行动时的认识 (Crawford & Ostrom,1995)。不过,处于不同的文化、不同的家庭以及展示出多种社会规范的各种环境之中,人们习得的规范往往很不同。由于完全是自己造成的对 社会规范(比如说实话或信守承诺)的违背带来的罪恶感,或者由于违背社会规范被人们所知晓带来的羞耻感,都会给人带来内在的成本或痛苦(Posner & Rasmussen,1999)。

(二)经验产生适应性变化:间接演化方法

关于人类行为的科学研 究,新近发展出了一种间接演化方法。它为理解偏好(包括那些与社会规范相关的偏好)的演化或适应性改进提供了一种严密的理论方法(Güth & Yaari,1992;Güth,1995)。在间接演化模型中,参与人会得到外在收益,不过,参与人有自己的内在偏好,内在偏好会对外在的物质收益进行 转换,而决策则基于这种转换的结果。那些认为互惠、公平和值得信赖本身是一种价值的参与人,将会对他们自己和其他人的行动赋予一个主观变量,以衡量是否与 其所秉持的规范一致。这一方法允许个体在初始状态上有一种行为倾向,他们不是只向前看的理性自我中心主义者,同时,由于外在收益以及对这些收益的内在偏 好,他们可以在相对较少的博弈轮数内对偏好做出适应性变化。

与信任相关的社会困境,如序贯囚徒困境博弈,特别适用于讨论间接演化方 法。在这类博弈中,如果参与人彼此信任并且合作,他们可以获得较高的收益。不过,如果一个参与人合作而另外一个不合作,不合作者获得的收益更高,而另外一 个得到最少或根本没有收益。理性自我中心主义者将会选择不信任,因为他的预期是其他参与人同样不会信任。结果是,两个参与人都只能获得比信任且合作时更低 的收益。考虑这类博弈时,有必要记得,大多数契约关系至少有这种试图确保相互信任的基本结构的一个要素。间接演化方法解释了,在标准理性选择理论所假设的 只有理性个人中心主义者的环境中,那种由附有规范者和理性个人中心主义者的混合状态是如何产生的。

从这一理论来看,即便面临同样的外 在条件,社会规范会导致不同的人采取不同的行动,这取决于他们有多么看重对社会规范的遵从(或者偏离)。理性自我中心主义者可以看作那种外部收益等同于内 在收益的人,因为他们并不看重互惠的社会规范。有条件合作者(现在只考虑一种其他类型)在模型中可以刻画为值得信赖类型,当他们用值得信赖回报其他人的信 任时,这种类型的参与人会在外部收益之外增加一个额外的参数。由于所有参与人行为和结果的交互作用,不同类型的参与人往往会得到不同的外在回报。在一个信 任博弈中,最初的参与人包括一定比例的理性自我中心主义者和有条件合作者,该博弈的分析表明,对参与人类型的信息掌握水平会影响理性自我中心主义者和有条 件合作者的随着博弈时间推移的相对比例。在关于类型的信息为完全信息时,有条件合作者采取可信赖策略时,会以更高的可能性得到更高的收益,而理性自我中心 主义者则会一直得到低收益,因为其他人不会信任他们。

在完全信息情形下,只有值得信赖类型才能够在演化过程中存活下来(Güth & Kliemt,1998:386)。新进入人群中的人,会更加可能接受在上轮博弈轮次中得到较多物质收益的那些人的偏好序(Boyd & Richerson,1985)。那些相对失败的人会学习到获得高物质回报的人的价值观⑦。当参与人的类型是公共知识,理性自我中心主义者将不能生存。不 过,关于所有参与人拥有完全且准确的信息是一个非常强的假设,大多数的真实世界都不能满足这一假设。

对一个较大群体来说,如果参与人 无法获得参与人类型,偏好将演化成只有理性自我中心主义者的状态⑧。如果参与人知道人群中值得信赖的人的比例,但是不知道具体的参与人的类型,古斯和克莱 门特(Güth & Kliemt,1998)的研究表明,当遇到值得信赖的人从而得到高回报的预期收益高于两人互不信任的收益时,第一个参与人会信任第二个参与人。另一方 面,如果有一个比随机的比率更精确一些的关于参与人的噪音信号,值得信赖的人会存续下来,构成整个人群中的一个可观的比例。这种噪音信号可能来自于能够见 到彼此、面对面的沟通以及为监测彼此行为而设计的各种机制。

(三)对间接演化博弈理论的经验检验

间接演化方法可 以用来解释,在传统博弈论预测的只有理性自我中心主义者能够盛行的环境中,那种由附有规范者和理性个人中心主义者的混合状态是如何可以产生的。前文所述的 七个核心发现中的前六个是激励人们构建间接演化理论的部分动力,第七个发现和这一理论也并没有表现出不一致。考虑到这类研究的最新发展,对这一理论的直接 检验还不够广泛。从间接演化过程的视角来看,参与人在集体行动问题中,由于他们关于互惠和信任这类社会规范有初始倾向,因而对博弈结果有不同的内在偏好。 根据已参加博弈的经验以及在其中得到的外在收益,参与人会学习他人的行为,改变自己的行为。近来的一些实验研究为与此相关的认知行为和行为变化提供了证据 ⑨。

比如,在单次的、序贯并且双盲的囚徒困境实验中,在知道对方的决策之前,实验人员要求参与人对最终产出结果的偏好做排序。在 136个被试者中,有40%认为合作结果(C,C)要好于自己不合作而对方合作(D,C)的结果,而有27%则认为这两者无差异,即便后一种情形下个体的 收益要高出许多(Ahn,Ostrom & Walker,1998)。这一发现表明,在集体行动时,并不是所有参与人都像纯粹向前看的理性自我中心主义者那样,把决策仅仅建立在个体收益基础上。有 些人所秉持的社会规范和价值观可以支持合作行为。

另一方面而言,建立在这些社会规范上的偏好会被糟糕的经历所改变。在随机配对的有限 次重复囚徒困境博弈实验中,在72个被试者进行了12轮次后,合作率很低,很多人经历了多次对手不合作的糟糕情况,而且,这时只有19%的被试者认为 (C,C)好于(D,C),17%认为无差异(Ahn et al.,1999)。这个试验表明,支持合作和互惠行为的社会规范被不良经历削弱了。

在另一个版本的囚徒困境博弈中,凯恩(Cain,1998)让参与人先参与一个“独裁博弈”,在这个博弈中,一个参与人在两人中分配一定数额量的金钱, 而且不管给多少,另一方必须接受。进行完这个博弈后,再进行囚徒困境博弈。吝啬型参与人,即在独裁博弈中给自己分配的比重不低于70%的人,倾向于在后面 的囚徒困境博弈中认为所有人都将会选择背叛。良善型参与人,即至少给出去30%的人,倾向于在后面的囚徒困境博弈中认为其他良善型参与人会选择合作,而吝 啬型参与人会选择背叛。良善型参与人在与同为良善型对手博弈时,以69%的可能性会选择合作,而当对手是吝啬型时,这一比例为39%。

最后,越来越多来自实验室(以及田野调查)的有趣的证据表明,外部强加的规则很可能会“挤出”内生的合作行为(Frey,1994)。以弗洛里希和奥本 海默(Frohlich & Oppenheimer,1996)所开展的囚徒困境博弈实验为例,该实验有两种类型的分组,一类是常规的囚徒困境博弈,其中有一些可以沟通,一些没有沟 通。另一类则引入了外部强加的同时也是激励相容的机制以强化合作的选择。和预期的一致,在第一阶段,第二类的试验中的参与人比第一类(控制组)获得更高的 金钱回报。第二阶段中,两类参与人都进行常规的囚徒困境博弈。令实验者吃惊的是,在两个阶段中,控制组所进行的常规囚徒困境博弈中,合作水平都要更高,特 别是那些有面对面交流的更是如此。由于外生的激励相容机制带来的较高合作水平是暂时的。正如作者所说,去掉这种外部机制后,“似乎会对随后的合作产生消极 影响,使得该组境况比那些参与常规……囚徒困境博弈的小组情况更糟。”

近来其他一些实验研究也证实了外部规则和监控会挤出合作行为 ⑩。这类研究的基本发现是,通过社会规范,特别是引入当事人的沟通机制的情形下,其合作水平接近或等同于强制性外部规则和监督惩罚机制。而且,社会规范似 乎有一种持续激励人们的合作欲望的效力,而强制性外部规则的效力可以迅速消失。最后,所有情形中最糟糕的是,存在外部当局施加强制性规则,却只能进行低水 平的监督和惩罚。在存在强有力的外部监督惩罚的世界中,合作的实施无需发展任何内部社会规范。在没有外部规则或监督的世界里,社会规范的演进可以支持合作 行为。然而,在折中的情形下,中等水平的外部监督会抑制社会规范的行为,对参与人来说,这时欺骗和背叛被抓住的几率较低,因而会成为有吸引力的选择。

三、外部规则和社会规范的演进:基于田野调查

目前已有大量关于集体行动问题的田野研究,基本的发现是,在不同环境下,合作水平差异很大,从极低到极高都有分布。如前所述,实验研究中的第七个核心发 现告诉我们,许多背景因素会影响到参与人的公共品投入比率。田野研究者发现了许多有助于或有害于内生集体行动的背景变量。这些变量包括:生产函数和分配函 数的类型;资源流的可预测性;产品的相对稀缺性;参与人群的规模;参与人的异质性;参与人对产品的依赖性;人们认识的一致程度;集体收益的规模;个体对集 体产品的边际贡献;搭便车的诱惑大小;当他人不合作时,合作者的损失;是否可以选择不参与;是否有领导者;过去的经验和社会资本水平;制定有约束力规则的 自主权;用来改变环境的各种不同的规则。

田野研究已经得出了一些一致性的结论。一个反复验证的发现是,相对于外部强加规则,公共池塘 资源的使用者自己组织起来构建并执行一些基本规则会使本地资源的使用更有可持续性(相关研究如 Tang,1992;Blomquist,1992;Baland & Platteau,1996;Wade,1994)。公共池塘资源是这样一种资源,它可以产生一个收入流,要排除别人使用资源的成本很高,而一个人对资源 的消费会降低其他人从该资源所获的收益,这种资源可以是自然的也可以是由人类创造的(Ostrom,Gardner & Walker,1994)。公共池塘资源的使用者面临的第一层困境是,因为每个个体都可以免费使用资源,他们总是希望由其他人而不是自己去控制对资源的使 用。第二层的困境是如何努力改变规则,因为新规则是一种公共物品。因此,与前面我们讨论的实验类似,使用者们面临一个集体行动,即,由于个体的直接的最优 反应策略会导致次优结果,如何合作以改善之。现在的关键问题是:演化理论如何帮助我们理解为什么很多群体可以克服这两种困境?进而言之,我们如何理解基本 不建立在外部第三方实施的自组织资源体系为什么往往比建立在外部实施和正式规则基础上的政府所有的资源体系来得更好?

(一)自组织集体行动的生成

根据前述演化理论,我们可以知道,会有一些个体有遵循互惠规范的初始倾向,从而,只要大家都能够采取互惠行为,他们就会愿意限制自己对公共池塘资源的使 用。如果一个小的核心群能够彼此认同互惠规范,他们就可以开始合作的过程,而不需要设立一个全能组织,让这个组织构建为最终长期维持合作所需要的各种规 则。领导者或者企业家,即能够清晰地阐述改进联合产出的各种组织方式的人,往往是很重要的初始激励(Frohlich,Oppenheimer & Young,1971;Varughese,1999)(11)。

如果使用资源的人可以决定其成员,即将那些愿意遵从关 于使用资源的一致同意规则的人囊括进来,而排除那些不同意这些规则的人,这样就意味着向更高水平的信任和互惠迈出了重要的第一步。群体边界往往由很明确的 标准所界定,比如,居住在特定社区或者加入了一个具体地方的合作社。成员身份的确定还可以通过象征性边界来确定,包括用复杂的仪式和信念来强化个人关于他 人是可信赖的信念。

(二)长期存续的自组织资源体系的设计原则

成功的自组织资源体制,在大多数社区环境下,最初 需要依靠当地演化出来的关于互惠和值得信赖的社会规范,以及当地领导者的存在。不过,要解释那些延续了许多代的资源体制如何得以长期存续并获得相对较高的 效率,更重要的是它们遵循了一些设计原则。奥斯特罗姆(Ostrom,1990)对这些设计原则进行了广泛的讨论,并且对此已经有许多经验检验(12)。 演化理论有助于解释这些设计原则是如何能够使群体长期维持并建立合作。

我们已经讨论了第一个设计原则,即存在明确的关于边界的规则。 有了这一原则,参与人就知道谁将与之发生关系,也即合作对象是哪些人。第二条设计原则是,用地方上使用着的规则来限制获取资源的数量、技术以及时间安排; 承担的投入按比例获得收益分配;精心将当地条件纳入考虑。如果一个群体想要长期获得资源,必须在获取多少、什么时候获取以及获取何种产品方面设定规则,同 时也需要考虑运作这个体系需要使用者付出多少成本。合适的规则有助于资源本身的持续性。如何将使用者的投入和他们获取的收益联系起来是构建一个公平合理的 体系的关键因素(Trawick,1999)。如果一些使用者占有了所有收益却只承担很少的成本,随着时间的推移,其他人将不会愿意遵守规则。

比如,在那些能长时期维持的灌溉系统中,需要筹集水费来维持相关活动,不同的系统在评估水费方面有一些细微的差别,不过水的分配是按照所承担的水费和其 它投入的比重来进行的(Bardhan,1999)。有时水和承担获取水的资源投入类似于股份制,有时则根据获取水的顺序,还有时根据灌溉土地的数量。在 一个地区会有许多类似但有显著差异的灌溉系统,没有一个规则集合能适用于所有这些系统的管理(Tang,1992;Lam,1998)。

第三个设计原则是,要让大部分受资源体系影响的个体都参与到规则的制定和修改中来。这一原则,可以使资源体系中的规则更加切合当地环境,也使规则的制定 让参与人感到公平。比如,池萨斯比地区的克里族人(Chisasibi Cree)在关于詹姆斯湾狩猎区的鱼类资源以及海狸资源的准入和狩猎权方面,制定了一系列复杂的规则。伯克斯(Berkes,1987:87)认为,这些 用以规范他们行为的资源管理系统和规则能够在非常长时期内延续并发扬光大,因为有效的“社会机制能保证对规则的遵从,这些规则建立在对共同体的相互认同的 基础之上。违反这些规则的人不仅会损失动物们的眷顾,还会丧失在集体中的尊严。”公平的分配规则有助于构建信任关系,因为如果人们参与规则的设计并且这种 规则体现了他们所共享的公平理念,他们就会更加愿意遵守规则(Bowles,1998)。

巴德汉(Bardhan,1999)研究了 印度的48个灌溉体系,他发现,在农民们知道规则是由地方精英所制定的那些地方,其水渠维护质量要更差。另一方面,通过对(480个)农民的调查发现,当 规则由大部分农民而不是由精英和政府所精心制定时,农民们对水资源分配规则以及对其他农民遵守规则方面,都有更为积极的态度。在那些由政府机构决定水的分 配和分布的地方,农民们违规的报告更多,并且农民对地方村庄基金的投入更少。这一研究跟瑞和威廉姆斯(Ray & Williams,1999)的研究结论是一致的,他们发现,在印度马哈拉施特拉邦,由于上游农民偷窃政府所有的灌溉中的水造成的损失接近在一个有效分配 和定价体系中的收益的四分之一。

极少数能长期维持的资源体系仅仅依赖于内生的信任和互惠。第四个设计原则是,大部分长期维持的资源体 系选择自己的监督者,这些监督者对使用者负责,或者本身就是使用者,他们不仅监测资源情况,还观察使用者的行为。进一步地,第五个设计原则指出,这些资源 体系采取的是渐进惩罚机制,惩罚根据违规行为的严重性及其发生时的情境。通过创设地方监督者的正式职位,资源体系就不需要仅仅依靠惩罚意愿者付出个体的成 本去惩罚违规者。共同体授权一个职位,在有些体系中,使用者轮流担任这个职位,这样,所有参与人都做出贡献,联合监督。有了当地监督者,有条件合作者可以 相信,有人会检查其他人是否遵从了当地的规则。这样,他们就会继续他们的合作行为,而不会一直担心其他人会占他们的便宜。

另一方面, 最初施加的惩罚往往是很轻的,相对于违规带来的可观的诱惑,惩罚对违规的预期的收益—成本之比没有影响。不过,最初违规的惩罚应该被视为传递给被抓住的人 和社区中的其他人的信息。每个人都可能会犯错,或者面临困难的局面使得他们违规。然而,如果仅仅依赖于有条件合作者而没有惩罚措施,违规者可能会导致群体 合作水平的急坠(Kikuchi et al.,1998)。不过,使用渐进惩罚的体系,那些故意或不小心违规的人会知道其他人注意到他们的违规行为,这会使人们相信,其他人如果违规,也会被抓 到。进而言之,人们从中可以了解到大体上其他人还是会彼此信任,他们只是想要有一个机制可以让人们知道是有不幸的事发生了。用玛格丽特·莱维的话来说,自 组织体系更多的依靠“准自愿”的合作,而不是纯粹自愿或者强迫合作(Levi,1988)。对自组织体系来说,重大的威胁来自于有参与人反复违规。对违规 行为施加越来越高的惩罚的机制可以警告其成员,如果他们不遵守规则,会受到越来越严重的惩罚,甚至最终被逐出社区。

让我对上述观点做 一个小结。当由资源使用者自己制定规则(设计原则3),由当地使用者或者对他们负责的人来执行(设计原则4),使用渐进惩罚机制(设计原则5),规则要界 定谁有权利从资源中退出(设计原则1),并且有效地将收益成比例地分配给成本承担者(设计原则2)时,就可以强化对集体行动和监督问题的解决 (Agrawal,1999)。

很多人会认为一系列的规则将会有助于产生更高的联合收益,监督(包括对自己的监督)会防止被他人所欺 骗。这种人愿意进行有条件的合作。使用者如果做出了暂时性的自我承诺,他们会有激励至少在一些时候去监督其他人的行为以确保他们自己以及其他人在大多数时 候都遵守规则。有条件的合作和相互监督会相互加强,特别是在那些制定了降低监督成本的体系之下。随着时间的推移,人们越来越忠诚于共享的规范,高水平的合 作得以实现,而并不需要引入严密和高成本的监督机制来保证人们遵守规则。

第六个设计原则有助于巩固上述这些原则的运作。第六个设计原 则强调,地方上需要有快捷、低成本的解决使用者之间以及使用者和官员之间的冲突的活动平台。与自然界的约束规则不同,规则需要为人们所理解,需要高效率。 对联合制定的规则的阐述,参与人总是存在不一致的情形。因此,要设置一些简单的、基于地方的机制,让冲突立即摆到台面上并加以解决,而且这些机制要让社区 成员普遍知情。这样,有损信任的冲突的数量会下降。要让个体长期遵循规则,有必要建立一些讨论并且解决什么是违规的机制,这样会有助于规则的遵守。

国家或者地方政府是否允许当地使用者拥有少量的组织权利,会影响到当地使用者是否能够构建越来越有效的治理体系。这是第七项设计原则。有一些运作相对较 长时间的资源体系中没有这种权利(Ghate,2000),这时,基本上只能完全依靠参与人对于关于改变规则的规则的完全一致的同意。否则,任何投票反对 规则改变的哪怕只是暂时不满的参与人都可以跑到外部的权威当局抗议,这时会对治理体系构成威胁。强制要求规则的改变要达到完全一致的同意,这会导致很高的 交易费用,从而妨碍群体以相对更低的成本去寻求更加合适的规则。

使用者会制定他们自己的规则,不过这并不需要建立正式的、政府的司法 权。比如,在很多沿海渔场,当地渔民制定了广泛的规则以界定谁可以使用渔场以及允许使用哪些设备 (Acheson,1988;Schlager,1994)。只要政府官员一定程度上认可这些规则的合法性,渔民们自己就可以执行好这些规则。但是,如果 外部的政府官员认为,只有他们可以指定权威规则,那当地使用者构建的自组织体系就难以维持(Johnson & Libecap,1982)。

对规模更大的公共池塘资源来说,要想建立成功的体系,需要引入第八个设计原则,即要对不同层面且嵌套在一起的组织进行治理。比如,适合一个灌溉系统中主 要分支的水分配规则,不一定适用于分布在单个水渠旁的农民进行水分配。因此,在长期维系的自我治理体系中,大组织往往由小规模的组织嵌套而成。比如,有时 一个大型的由农民治理的灌溉系统,其中包含五个层级,每个层级采取很不相同的规则集,这并非罕见的事。

(三)可持续的集体行动所面临的威胁

所有的经济组织和政治组织都可能遭受威胁,自组织的资源治理体系也不例外。外部的或者内部的因素都可能会给这类组织的长期生存能力带来挑战。我们集中关 注这样两类因素,一类是影响参与人类型分布的因素,另一类是影响参与人所秉持的信任以及互惠的社会规范的强度的因素。较大规模的迁移(迁入或迁出一个地 方)是一个总会存在的威胁,这两类迁移造成的威胁有可能会相互抵消,但也有可能不会。迁出社区可能会改变治理体系在经济上的生存能力,因为这会减少能够为 获取资源而付出的人的数量。迁入的参与人可能会不信任其他人,不能很快习得那些已经长时期存在的社会规范。由于集体行动很大程度上建立在相互信任的基础 上,那些有外来人口快速定居的地方,有些自组织的资源体系在较短的时间内就瓦解了(Baland & Platteau,1996)。

此外,由于市场变化或者土地分配政策的变化,也会带来人口的迅速改变。经验研究文献还考察了新的外生和内生的威胁 (Sengupta,1991;Bates,1987;Ostrom,1998b;Britt,2000)。这些威胁包括:1)国家最上级政府会努力在一 个区域内的所有行政单元都强加一系列同样的规则;2)技术、要素可得性以及对货币交易的依赖这三方面的快速变化;3)那些自组织治理背后的运作原则的代际 传承失败;4)过于频繁的依赖外部资源的帮助;5)不考虑本地知识与制度的国际援助;6)腐败和其他形式的机会主义行为的恶化;7)地方政权、教育及其分 支机构等会产生冲突,而资源体系中缺乏大量制度性安排为冲突提供公平且低成本的解决机制,以及缺乏在当地发生自然灾害时的保险机制。

因而,不深入理解背景性变量,我们就很难理解自组织体系必须克服的问题:集体行动最初的培育和可持续性以及长期中面临的挑战。但是,简单地说背景很重要, 在理论上,这并不能令人满意。要构建更具一般性的理论综合以阐明背景为什么重要,需要引入演化理论。特别地,我们需要理解这样两方面的内容:第一,背景是 如何影响有条件合作者和意愿惩罚者的出现与离开;第二,我们知道这些人秉持的社会规范有可能被相关人群中的其他人所接受和强化,因而我们需要理解背景是如 何影响这种接受和强化的几率。

四、结论

实验研究和田野调查都证实了人们成功地解决了相当多的集体行动问题。前曼 瑟尔·奥尔森时代的老式理念认为,群体可以找到办法使集体行动得以达成,这种理念并不完全是误导性的。事实上,近来,包括文化演化研究在内的演化理论表 明,人类建立在社会规范的发展与成长之上的合作倾向,有遗传和适应性基础。考虑到在所有现代经济体中集体行动情形的多发性和多样性,我们也许可以抱着比零 贡献假说更为乐观的态度。我们现实中所观察到的图景,并不指向纯粹的悲观主义,也不指向纯粹的乐观主义,而是需要我们进一步的研究以解释不同的背景性变量 是如何促进或者破坏合作行为的。

未来经验的和理论的工作有必要去回答,许多背景性变量是如何影响了这样一些过程:社会规范在人群中的 教育和激发;其他人的行为和对社会规范的忠诚的信息的传播;以及对使用社会规范(比如互惠、信任和公平)的那些人进行奖励。我们需要理解制度、文化和生物 物理学因素是如何影响那些进入或者退出特定类型的集体行动的人的类型,以及,那些可以获得的关于过去的行动的信息的类型。人们可以改变结构性变量,随着时 间的推移,这种改变可以提高社会规范使用者的比重以及社会规范在人们心中的强度。因而,我们还需要理解这些改变是如何发生的。

如果我 们试图提出公共政策以促进那些基于社会规范的、对社会有益的合作行为,推进上述的研究方向是非常重要的。过去,促进集体行动的政策行动主要是通过在外部改 变理性自我中心主义者的收益结构,这有可能是误导性的,并且有可能挤出了社会规范的形成,而这些社会规范本来可以促进合作行为。通过更多的授权,使得参与 人可以自己制定规则,这有可能会促进社会规范的演进,从而增加成功解决集体行动问题的可能性。

*本文“Collective Action and the Evolution of Social Norms”原载《经济展望杂志》(The Journal of Economic Perspectives),2000年第14卷第3期,第137—158页。

注释:

①在线 性公共品博弈中,个体的效用为其收益的线性函数:U[,i]=U[,i][(E-x[,i])+A·P(∑x[,i])],其中E是个体的初始资 产,x[,i]为第i个参与人的公共品投入,A表示如何将群体收益分配到个体,P是生产函数。在线性公共品博弈中,A为1/N并且有0<1 /N<P<1(不过在其他类型的集体行动中,这些函数形式各式各样)。只要P<1,对于一个完全自利的参与人,将自己的资产投到集体产品的生产永远不会是 其最大化策略。

②尽管这里的讨论仅限于集体行动与公共品博弈,事实上,许多实验都表明基于理性自我中心主义的理论在进行预测时表现糟糕。这些实验包括允许沟通的最后通牒博弈、独裁博弈、信任博弈和公共池塘资源博弈。

③此处隐含着许多实验的实验对象是本科生。——译者注

④包括最后通牒博弈在内的许多实验,其发现都有一致的含义。比如,卡梅伦(Cameron,1995)在印度尼西亚开展的最后通牒实验,其收益可以达到 3个月的工资总额。这是非常有诱惑力的实验条件,她仍然发现,提议者会将40%~50%这么高比例的收益分配给响应者。(在最后通牒博弈中,一名提议者向 另一名响应者提出一种分配资源的方案,如果响应者同意,则按照这种方案进行资源分配;如果不同意,则两人都会什么都得不到。——译者注)

⑤对前面这个“其他”参与人而言的“其他”。——译者注

⑥如需参考集体行动的严格的演化模型可参见如下文献:诺瓦克和西格蒙德(Nowak & Sigmund,1998)、瑟西和索马纳斯安(Sethi & Somanathan,1996),以及爱泼斯坦和爱克斯泰尔(Epstein & Axtell,1996)。

⑦伊谢尔、萨缪尔森和谢克德(Eshel, Samuelson & Shaked,1998)构建了一个学习模型,这个模型刻画了这样一个地方,其中有一部分人是采取提供地方公共品的策略的利他主义者,而与之互动的其他邻 居则是搭便车的自我主义者。在这个互动的环境中,马尔科夫学习过程将使得利他主义者的策略受到模仿,变成吸收状态。不过,跳出这种环形设置,利他主义和自 我主义者之间的互动,前者不一定能够得到存续。

⑧这意味着,在参与人只知道自己收益而不知道其他人的收益的博弈中,他们更可能像理性 自我中心主义者那样行为。麦克凯布和史密斯(McCabe & Smith,1999)的研究表明,在参与人只有关于自己支付的私人信息时,实验中演化的结果接近理论所预测的子博弈精炼结果;而当参与人知道其他参与人 的收益和行动时,实验结果接近合作的结果(McCabe,Rassenti & Smith,1996)。

⑨菊池、渡边和山岸(Kikuchi, Watanabe & Yamagishi,1996)进一步发现,那些表现出高信任度的人对其他人的行为的预测精确度要高于低信任度的人。

⑩博内特、弗瑞和哈克(Bohnet, Frey & Huck,1999)在序贯囚徒困境博弈实验中引入了一个管制体制,即,当出现不合作时会启动一个“诉讼程序”。卡德纳斯、史川劳和威利斯 (Cardenas, Stranlund & Willis,2000)在哥伦比亚的三个村庄进行了一个基于收割的公共池塘资源实验,他们发现,在这个实验中引入了外生但执行不完美的规则,这时的合作 水平会比面对面交流情形下的更低。

(11)在民权运动中,采取合作行为成本非常高,对民权运动的经验研究表明,组织者会想办法让潜在 参与人了解共享内部规范的重要性,并且保证其他人也会参与进来(Chong, 1991)。教会的教众和其他组织联合承诺会进行抗议以及其他形式的集体行动也是重要因素(Opp,Voss & Gem,1995)。

(12)塑造了长期维持的公共池塘资源体系的设计原则从提出以来(Ostrom, 1990),已经有相当可观的深入的经验研究。尽管在对这些原则的表述上有一些细微的差别,但据我所知,还没有经验研究对这些原则的有效性提出挑战 (Morrow & Hull, 1996; Asquith, 1999; Bardhan, 1999; Lam, 1998)。

 

发表评论

Please enter your comment!
Please enter your name here