友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
妙趣横生博弈论-第7部分
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!
达成合作的另一面就是避免背叛。通过给予参与者一个适当的奖励,将可以激励参与者选择合作而不是选择最初的优势策略“背叛”;或者,通过制造一种适当的惩罚的可能性,亦可以吓阻参与者选择背叛。
基于以下原因,奖励方法可能会有问题。奖励可以是内部的,一方对另一方的合作进行奖励。有时也可以是外部的,可以由从双方合作中获利的第三方对双方的合作进行奖励。不论哪种情形,都不能在参与者做出选择之前给予奖励;否则,参与者一定会把奖励揣入口袋,然后再选择背叛。如果奖励仅仅是一个许诺,那么这个许诺可能是不可信的:在受诺方选择了合作后,许诺方有可能会食言。
尽管困难重重,有时奖励还是可行的、有用的。发挥最大的创造性和想象力,参与者可以同时、相互许诺,然后通过把许诺的奖金存入由第三方控制的托管账户中,使这些许诺显得可信。更切实际的是,参与者可以在多个方面相互作用,一方在一个方面的合作可以换来对方在另一个方面合作的奖励。比如,在雌性黑猩猩群中,分享食物、帮忙照看幼崽,可以换来梳理毛发的帮助。有时候,博弈第三方可能有非常强烈的利益动机促成合作。例如,为了结束世界范围内的各种冲突,美国和欧盟不时地许诺向战争国提供经济援助,作为对它们和平解决争端的奖励。1978年,美国以这种方式奖励了以色列和埃及,因为它们合作签署了戴维营协议。
惩罚是解决囚徒困境的更为常用的方法。它可能即时见效。电影《洛城机密》中有这样一个场景,警官埃德·埃克斯利向他正在审讯的嫌犯之一雷若伊·方丹许诺,如果他为国家作证,就可以比其他两个嫌疑犯少判几年。但雷若伊知道,一旦他出狱,他会发现另两个人的朋友正等着报复他!
然而,在这种背景下自然而然想到的惩罚,产生于这样的事实,即大多数此类博弈都只是一段持续关系的一部分。欺骗可能使一个参与者获得短期利益,但却会损害这种持续关系,产生更长期的成本。如果该成本非常大,这就可能从一开始就起到了阻吓欺骗的作用。
由于发展了重复博弈中隐含合作的一般理论,罗伯特·奥曼(Robert Aumann)于2005年被授予诺贝尔经济学奖。一个引人注目的例子来自棒球比赛。美国联盟队的击球员被投球击中的概率是11%,而国家联盟的击球员被击中的概率是17%。据道格·德林恩(Doug Drinen)和约翰…查尔斯·布拉伯瑞(JohnCharles Bradbury)所说,这种区别的主要原因在于指定的击球手规则。在美国联盟队,投球手不击球。因此,攻击击球手的美国联盟队投球手,不必担心对手队的投球手会直接报复。虽然投球手不太可能被击中,但如果他们刚刚在上半场攻击了某个人,那么,他们被击中的机会就会增加1/4。担心遭到报复是显然的。就像王牌投球手科特·谢林(Curt Schilling)所解释的:“当你面对兰迪·约翰逊(Randy Johnson)时,你还会郑重其事地向某个人投球吗?”
解决困境的初步思想(2)
大多数人在考虑一个参与者如何惩罚对方过去的欺骗行为时,就会想到“以牙还牙”的说法。这的确是关于囚徒困境最有名的实验结果。让我们详细叙述在实验中发生了什么,以及我们能从中学到什么。
以牙还牙
20世纪80年代初,密歇根大学政治科学家罗伯特·阿克谢罗德(Robert Axelrod)邀请了世界各地的博弈论学者以电脑程序形式提交他们的囚徒困境博弈策略。这些程序两两结对,反复进行150次囚徒困境博弈。参赛者按照最后总得分排定名次。
冠军是多伦多大学的数学教授阿纳托·拉普波特(Anatol Rapoport)。他的取胜策略就是以牙还牙。阿克谢罗德对此感到很惊奇。他又举办了一次比赛,这次有更多的学者参赛。拉普波特再次提交了以牙还牙策略,并再次赢得了比赛。
以牙还牙是“以眼还眼”行为法则的一种变形:人家怎么对你,你也怎么对他。说得更准确点,这个策略在开局时选择合作,以后则模仿对手在上一期的行动。
在《旧约·出埃及记》(Exodus,21:22)中,我们看见,“人若彼此争斗,伤害有孕的妇人,甚至坠胎,随后却无别害,那伤害她的,总要按妇人的丈夫所要的,照审判官所断的,受罚。若有别害,就要以命偿命,以眼还眼,以牙还牙,以手还手,以脚还脚,以烙还烙,以伤还伤,以打还打。”《新约》则提倡更具合作精神的行为。在《新约·马太福音》(Matthew,5:38)中,我们读到,“你们听见有话说:‘以眼还眼,以牙还牙。’只是我告诉你们,不要与恶人作对。有人打你的右脸,连左脸也转过来由他打”。我们从“以其人之道,还治其人之身”转到“你们愿意人怎样待你们,你们也要怎样待人”(《新约·路加福音》,Luke,6:31)的金科玉律。假如人们当真遵守这一金科玉律,也就不会存在什么囚徒困境了。此外,只要我们看得更深远一些,不难发现,虽然合作可能在某一特定博弈中降低你的赢利,但是以后可能带来的回报却足以使一个自私的人相信,合作应该算是一个理性策略。你认为不存在以后吗?帕斯卡尔的赌博说明了,在此假设基础上行动的后果可能相当惨烈,所以这就是冒险的原因。
因为每个失败者都必须和一个胜利者组对,所以结果一定是某个参赛者的胜利的次数大于失败的次数,不然就是失败的次数大于胜利的次数。(唯一的例外就是每个单场比赛都打成平局。)阿克谢罗德认为,以牙还牙法则体现了任何一个有效策略应该符合的四个原则:清晰、善意、报复性和宽容性。再也没有什么字眼会比“以牙还牙”更加清晰、简单。这一法则不会引发欺骗,所以是善意的。它也是报复性的——也就是说,它永远不会让欺骗者逍遥法外。它还是宽容的,因为它不会长期怀恨在心,而愿意恢复合作。
以牙还牙一个非常引人注目的特征在于,它在整个比赛中取得了突出的成绩,虽然它实际上并没有(也不能)在一场正面较量中击败任何一个对手。其最好的结果是跟对手打成平手。因此,假如当初阿克谢罗德是按照“赢者通吃”的原则打分,以牙还牙的策略只可能失败或是打成平手,而不可能取得最后的胜利。
不过,阿克谢罗德并没有按照“赢者通吃”的原则给结对比赛的选手打分,只有比赛结束才算数。以牙还牙策略的一大优点在于它总是可以将比赛引向结束。以牙还牙最坏的结果是,以遭到一次背叛重击而告终,也就是说,它让对手占了一次便宜,此后双方打成平局。 。 想看书来
解决困境的初步思想(3)
以牙还牙策略之所以能赢得这次锦标赛,是因为它通常都会竭尽全力促成合作,同时避免互相背叛。其他参赛者则要么太轻信别人,一点也不会防范背叛,要么太咄咄逼人,一心要把对方踢出局。
不过,尽管如此,我们仍然认为以牙还牙策略是一个有缺陷的策略。只要存在一丁点儿出现错误或误解的可能性,以牙还牙策略的胜利就会土崩瓦解。这个缺陷在人工设计的电脑锦标赛中并不可能,因为此种情况下根本不会出现错误和误解。但是,一旦将以牙还牙策略用于解决现实世界的问题,错误和误解就难以避免,结局就可能是灾难性的。
以牙还牙策略的问题在于,任何一个错误都会犹如“回声”一般反复出现。一方对另一方的背叛行为进行惩罚,从而引发连锁反应。对手受到惩罚之后,不甘示弱,进行反击。这一反击又招致第二次惩罚。无论什么时候,这一策略都不会只接受惩罚而不做任何反击。
举个例子:假设弗勒德和德雷希尔都采取以牙还牙策略。没有人先发起背叛,一段时间内,一切都顺利进行。然后,到了第11轮,假设弗勒德错误选择了背叛,或者选择了合作但德雷希尔却误以为他选择了背叛,不论是哪种情况,德雷希尔在第12轮都会选择背叛,而弗勒德却会选择合作,因为德雷希尔在第11轮中选择了合作。到了第13轮,角色就会转换过来。这种一方合作而另一方背叛的模式会继续反复进行下去,直到又一个错误或误解的出现恢复了合作或导致双双背叛。
在西弗吉尼亚与肯塔基的交界处,哈特菲尔德家族(Hatfields)与麦科伊家族(McCoys)家族的长期争斗可谓令人难忘。而在虚构世界中,马克·吐温笔下的格兰杰福特家族与谢泼德森家族的世代仇恨,为我们提供了另外一个生动的例子,说明以牙还牙的行动是怎样导致循环报复的。当赫克·芬恩试图了解格兰杰福特家族与谢泼德森家族世仇的源头究竟是什么时,他却遇到了“鸡生蛋还是蛋生鸡”的难题:“这究竟是为了什么,巴克?——为了土地吗?”
“我估计是——我不知道。”
“那么,究竟是谁开的枪呢?是格兰杰福特家的人还是谢泼德森家的人?”
“天哪,我怎么会知道?那是多久以前的事啊。”
“有没有人知道呢?”
“噢,有的,老爸知道,我估计,还有其他一些老头子,不过现在他们也不晓得当初究竟发生了什么事。”以牙还牙策略缺少的是一个宣布“到此为止”的方法。它实在太容易被激发起来了,而且不会轻易地宽恕。确实,后来的阿克谢罗德比赛的版本考虑了错误和误解的可能性,结果表明,其他那些更宽宏大量的策略优于以牙还牙策略。
2004年,诺丁汉大学的格雷厄姆·肯德尔(Graham Kendall)为了庆祝阿克谢罗德首届比赛的20周年,举行了一次比赛。“胜出”者是来自英格兰南安普敦大学的小组。南安普敦小组总共推荐了60个参赛者,包括59只“雄蜂”、1只“蜂后”。他们所有的参赛者都以独特的模式开始,这样他们就可以辨认出彼此。接着,雄蜂们牺牲了自己,以便让蜂后得到好的结果。蜂后也拒绝了与任何对手合作,以降低对手们的得分。虽然让一群雄蜂为了你的利益而牺牲自己是增加你的赢利的一种方法,但它并没有教给我们许多关于如何进行一个囚徒困境博弈的知识。在这里,我们甚至可以从猴子那里学到一些东西。棉头狷猴被置于一个博弈中,每只猴子都有机会拉动一个杠杆,给另一只猴子喂食。但是拉动杠杆需要力气。对每只猴子而言,最理想的策略就是自己偷懒,而它的搭档拉杠杆。但是为了避免遭到报复,猴子们学会了合作。只要一个参与者不连续背叛两次以上,棉头狷猴的合作就会一直持续下去,这种策略类似于以牙还牙策略。9 。。
解决困境的初步思想(4)
较新的实验
成千上万的关于囚徒困境的实验是在课堂和实验室进行的,这些实验涉及不同参与者人数、不同重复次数以及其他方面。下面是一些重要发现。10
首先最重要的是,合作发生得相当频繁,即使每对参与者只达成一次合作。平均而言,几乎一半参与者选择了合作。确实,对此最引人注目的例证来自游戏秀网络产品“朋友还是敌人”。在这个节目秀中,两人一组,每组都被问了一些琐碎问题。答对的人赚得的钱存入“信托资金”,在105集中,资金总额为200~16 400美元不等。为了分配这笔资金,参赛者双方进行一个单次囚徒困境博弈。
每个人私下里写下“朋友”或“敌人”。当双方同时写下朋友时,他们平分这笔资金。如果一方写了敌人而另一方写了朋友,那么,写敌人的那个人将得到全部资金。但若双方都写敌人,他们都将一无所获。不论对方写什么,你写敌人得到的钱至少等于或者可能大于你写朋友所得到的钱。然而,几乎一半参赛者写下的是朋友。甚至当资金总额增大时,合作的可能性也没有改变。资金低于3 000美元时人们合作的可能性,与资金高于5 000美元时相等。以上就是从菲利克斯·奥本豪泽尔…吉(Felix OberholzerGee)教授和乔·沃德弗格(Joel Waldfogel)教授,以及马修·怀特(Matthew White)教授和约翰·李斯特(John List)教授所进行的两项研究中发现的一些结果。11
如果你还在疑惑看电视如何算得上是学术研究,可结果已有过700 000美元的资金分给了参赛者。这是史上奖金最多的囚徒困境实验。我们能从中学到许多东西。实验结果表明,女性比男性更倾向于合作,在第一季,女性和男性合作的概率分别是475%和537%。第一季的参赛者不具有可以在决策前看到其他比赛结果的优势。但到了第二季,前40集的结果已经公布了,这个模式变得显而易见。参赛者可以从其他人的经验中学到一些策略。当某一组是由两个女性组成时,合作的概率增至55%。但是当一个女性与一个男性组对时,这个女性的合作概率降到了342%。而这个男性的概率也降到了423%。总体而言,合作率降低了10个百分点。
如果一群实验对象集中起来进行几次配对,且每次的配对不同,那么,选择合作的比率一般会随时间下降。不过,它不会降至零,而是总有固定的一小部分人坚持合作。
如果同一对实验对象重复进行基本的囚徒困境博弈,他们常常逐渐达成连续的相互合作,直到其中一个参与者在临近这一连续重复博弈结束时选择了背叛。在第一次进行的困境实验中就发生了这样的事。弗勒德和德雷希尔一设计出这个博弈,就立即招呼他们的两个同事进行了100次这个囚徒困境博弈12。其中60次双方都选择了合作。较长的一次连续相互合作是从第83轮持续到第98轮,直到其中一方在第99轮偷偷背叛。
事实上,按照博弈论的严格逻辑,这种情况本来不应该发生。当这个博弈恰好重复100次时,它就是一个同时行动博弈序列,我们可以用倒后推理的逻辑来解决这样的博弈。展望一下在第100次博弈时会发生什么。因为往后不再有更多的博弈了,所以背叛不可能在以后的任何一轮遭到惩罚。根据优势策略的推理,双方都应该在最后一轮选择背叛。但是,一旦确定了双方都会在最后一轮选择背叛,第99轮实际上就成了最后一轮。尽管后面还有一轮,在第99轮的背叛也不会在第100轮遭到对方的选择性惩罚,因为对方在第100轮中的选择是预先注定的。因此,优势策略的逻辑也适用于第99轮。我们可以用这个序列逻辑一直倒后推理到第1轮。不过,在实际博弈中,不论是在实验室还是在真实世界中,参与者似乎忽略了这个逻辑,结果反而受益于相互合作。事实证明,只要其他人同样都是 “非理性”的,那么,乍看上去可能是非理性的行为,偏离参与者的优势策略却是一个正确的选择。
解决困境的初步思想(5)
针对此种现象,博弈论学者做出了一种解释。现实世界中存在一些“互惠主义者”,只要对方合作,他们也愿意合作。假设你并不是这些相对友好的人中的一员。如果你在一个有限次重复囚徒困境博弈中按照自己的风格行事,那么你会从一开始就欺骗。而这会向对方参与者暴露出你的本性。为了掩盖真相(至少掩盖一会儿),你不得不表现出友好的样子。为什么你愿意这么做呢?假设你一开始就表现得友好。那么,即使对方参与者不是一个互惠主义者,他也会认为你可能是周围少有的几个友好的人中的一员。合作一段时间将会带来一些实实在在的好处,于是对方会打算报答你的善举,以获取这些好处。这对你也有好处。当然,你正计划在临近博弈结束时偷偷欺骗,就像对方一样。但你们仍然能够在最初阶段维持一段互利互惠的合作。虽然各方都假装善良等着占对方便宜,但双方都会从这种共同欺骗中获得好处。
有些实验不是将一群实验对象两两配对,进行几个双人囚徒博弈,而是让所有人进行一个多人囚徒困境博弈。下面我们介绍一个来自课堂的例子,它非常有趣并具有启发性。得克萨斯A&M大学的雷蒙德·巴特里奥(Raymond Battalio)教授让班上27名学生进行以下博弈。13假设每一个学生都拥有一家企业,他必须决定(同时且独立地做出决定,并把决定写在一张纸条上)是生产产品1,帮助维持较低的总供给及较高的价格,还是生产产品2,在损失别人的利益的情况下获利。根据选择1的学生总数,将收入按照下面的表格分配给学生:写1的学生分配给写1的学生的钱(美元)分配给写2的学生的钱(美元)0050100405420080583012062………251001502610415427108
把这个表用下图表示出来,我们可以看得更加清楚,效果也更加明显:
这是博弈“事先设计好”的,目的是确保选择2(欺骗)的学生总是比选择1(合作)的学生多得50美分,不过,选择2 的人越多,他们的总赢利就会越少。假设全体27名学生一开始都打算选择1,这样每个人将得到108美元。现在,如果一个学生打算偷偷改变决定,选择2,那么,选择1的学生就会变成26名,每个人将得到104美元(比初步计划少了4美分),而那个背叛者将得到154美元(比初步计划多了46美分)。不管最初计划选择1而不是2的学生有多少,他们都一样。选择2是一个优势策略。每一个把选择1改成选择2的学生都使自己的赢利增加46美分,却使他的其他26个同学每人少得4美分,结果全班损失58美分。等到人人都采取自私的行动,都想使自己的赢利最大化时,他们每人得到50美分。如果他们成功地合谋起来,协同行动,不惜将个人的赢利减到最小,他们将各得108美元。如果是你,你会怎么选择?
演练这个博弈的时候,起初不允许集体讨论,后来允许一点讨论,以便达成“合谋”,结果愿意合作而选择1的学生总数从3到14不等。在最后的一次带有协议的博弈里,选择1的学生总数是4,全体学生的总赢利是1582美元,比全体学生成功合作可以得到的赢利减少了1334美元。“我这辈子再也不会相信任何人了。”领导合谋的学生这样嘟囔。那么,他自己又是怎么选择的呢?“噢,我选了2。”他答道。尤塞里安一定早就知道这一点了。
解决困境的初步思想(6)
新近的关于多人囚徒困境博弈的实验室实验,采用了一种叫做捐款博弈的形式。每个参与者得到一笔初始资金:10美元。每人可选择保留其中一部分,再把另一部分捐给共同储金。然后,实验者把累积的共同储金翻倍,在所有参与者之间平分,捐款人和非捐款人都同等对待。
假设在这个组中总共有四个参与者:A、B、C和D。不论其他人怎么做,A只要向共同储金捐献1美元,共同储金翻倍后就会增加2美元。但是,增加的2美元中,会有15美元分给B、C和D;而A只能得到50美分。因此,A提高了其捐献量,最后却亏了本;相反,他减少捐献量反而会获益。不论其他人捐多少(如果有捐款的话),这一点都是成立的。换句话说,对A来说,一分钱也不捐是优势策略。对B、C和D来说亦是如此。这个逻辑是说,人人都应当希望成为一个分享别人成就的“免费搭车者”。如果四位参与者都采取他们的优势策略,共同储金便空空如也,每个人只保有他们的初始资金10美元。当人人都想成为免费搭车者时,车就会停滞不前。如果人人把他们所有的初始资金捐给共同储金,那么,翻倍后的共同储金将是80美元,每个人将分到20美元。然而,每个人都有背叛这样协议的个人动机。这就是他们的困境。
捐款博弈不仅仅是实验室或理论上的奇事;它还发生在现实世界的社交活动中——只要群体成员自愿捐款就能共同受益,但却不能阻止没有捐款的人也能享受到这些利益。村庄对洪水的控制、自然资源的保护就属于这种情形:不可能建了堤坝后,洪水就会有选择地绕道而行,只淹没那些没有捐款帮忙建设堤坝的人的田地;拒绝以后把鱼分给那些过去消耗太多的人,也是不可行的。这就产生了多人囚徒困境:每个参与者都有偷懒或保留贡献的动机,却指望能享受别人的贡献带来的利益。如果大家都这么想,总的贡献量就会很少甚至为零,结果大家都遭受了损失。这些情形普遍存在而且如此严重,以致所有社会理论和政策都需要深入思考才能走出困境。
在该博弈中的最有趣的变体中,参与者有机会惩罚那些背叛隐含社会合作契约的人。但是,他们必须为此承担个人成本。在捐款博弈结束后,参与者被告知其他参与者的个人捐款量。然后开始第二阶段的博弈,参与者可以采取降低其他人赢利的行动,而其他人的赢利每降低1美元,他自己要付出33美分的成本。也就是说,如果A选择把B的赢利降低3美元,那么A这样做之后,他的赢利就会减少1美元。这些减少的赢利不会再分配给其他任何人;而是返还到实验者的总资金中。
实验结果表明,人们对“社会欺骗者”实施了大量的惩罚,惩罚的可能性也大大提高了博弈第一阶段的贡献量。这样的惩罚似乎是促成合作、增进群体利益的一个有效机制。但是人们实施惩罚的事实首先就是令人惊讶的。以私人代价惩罚他人的行为,本身就是对集体利益的贡献,所以它是一个劣势策略;如果它以后成功地引导欺骗者采取了更好的行为,这将对整个集体有利,而惩罚者将只得到该利益中属于他的一小部分。所以,惩罚不是自私估计的结果。情况的确如此。在关于该博弈的实验进行的同时,参与者的大脑接受了正电子放射扫描仪的扫描。14结果表明,实施惩罚的行为会刺激某个大脑区域,该区域被称为背侧纹状体,它与体验快乐或满足有关。换句话说,人们从惩戒社会欺骗者的行为中,实际上得到了心理上的受益或满足。这种本能必定有着很深的生物根源,而且可能是因为其进化优势而被选择出来的。15书包 网 。 想看书来
解决困境的初步思想(7)
如何达成合作
这些例子和实验已经说明了成功合作的几个先决条件和策略。让我们更系统地介绍这些概念,并利用它们解决更多的现实生活实例。
成功的惩罚机制必须满足几个要求。下面我们逐一列出。
觉察欺骗惩罚欺骗之前,必须觉察到欺骗。如果觉察快速而且准确,惩罚的实施就能够即时无误。这在提高欺骗成本的同时,减少了欺骗的好处,从而提高了成功合作的可能性。比如,航空公司时常监视对手的票价;如果美国航空公司打算降低其纽约至芝加哥的票价,联合航空公司可以在5分钟内就做出反应。但是在其他情况下,想降价的公司可能会跟顾客秘密交易,或者通过一笔涉及飞行时间、服务质量、安全保证等许多方面的复杂交易来掩饰其降价。极端情形下,每个公司只能观察到自己的销售和利润,它们不仅取决于其他公司的行动,还取决于一些机会元素。比如,一家公司的机票销售量还可能取决于需求的变化,而不是仅仅取决于其他公司的秘密降价。这样,觉察和惩罚不仅变得缓慢,而且也不准确,更增强了欺骗的动机。
最后,当同一个市场上有三家以上公司同时行动时,他们不仅需要找出是否存在欺骗,还要找出欺骗者是谁。否则,惩罚不但不能针对性地惩戒坏人,而且会变得迟钝无效,或许还会引发价格战,以致伤害所有人。
惩罚的性质接下来是惩罚的选择。有时候,参与者会采取惩罚他人的行动,这些行动会被欺骗行为激发起来,即使在单次互动博弈中也是如此。就像我们在《洛城机密》中的囚徒困境中指出的,如果雷若伊因为替国家作证而从轻判刑,那么,他出狱后将遭到苏格和蒂龙的朋友的报复。在得克萨斯州A&M大学的课堂实验中,如果学生们可以觉察出是谁背叛了所有人的合谋而选择了1,他们就可能对欺骗者施以社会制裁,比如排斥这个欺骗者。这样,就不会有几个学生愿意为了多得50美分而冒这个险了。
在博弈的结构里还存在其他类型的惩罚。一般而言,这种情况发生的原因在于这个博弈是重复进行的,这一轮欺骗的所得将导致后面几轮的损失。这些是否足以觉察出哪个参与者打算欺骗,取决于得失的大小以及将来相对于现在的重要性。我们很快就会继续讨论这个方面。
清晰性可接受行为的界限,以及欺骗的后果,对潜在的欺骗者而言应当是清晰的。如果这些是复杂的、含糊不清的,参与者就可能因为失误而欺骗,或者不能做出理性的计算,而是根据某种直觉行事。举个例子,假设彩虹之巅(RE)和比比里恩(BB)正重复进行定价博弈,RE决定,如果RE过去17个月内的平均折扣利润比同期产业资本的平均真实回报率低10%,它就推断BB欺骗了。BB不能直接知道这个规则;它必须通过观察RE的行动来推断RE所采用的规则。但是,这里陈述的规则太复杂了,BB根本无法弄清楚。所以,这不是一个阻吓BB欺骗的好方法。而像以牙还牙这样的策略就表达得相当清楚:如果BB欺骗,它就会看到RE在下次降低价格。
确定性参与者应该确信,背叛将受到惩罚,合作则会得到回报。在像世界贸易组织(WTO)贸易自由化这样的国际协议中,这是一个主要问题。当一个国家投诉另一个国家违背了贸易协定时,WTO就会发起一个行政诉讼程序,而一拖就是几个月,甚至好几年。案件真相几乎对判决没有任何影响,判决通常更多地取决于国际政治规定及外交政策。这种强制执行的判决程序显然不可能发挥什么作用。
解决困境的初步思想(8)
规格这样的惩罚应该有多严厉?似乎没有限制。如果惩罚严厉到足以阻吓欺骗,惩罚就无须实际执行了。因此,要阻吓欺骗,最好把惩罚设定在尽可能严厉的水平。比如,WTO可以这样规定,任何国家要是违背了其将保护性关税维持在协定低水平之内的承诺,都会遭到核武器袭击。当然,大家会被这个规定吓得退缩不前,不敢欺骗;但大家至少部分会认为某个失误也可能导致核攻击的发生。在大多数情况下,当失误可能发生时,正如实际中常会发生的那样,惩罚的规格应该保持能够成功阻吓欺骗的尽可能低的水平。在极端情况下,原谅偶然的背叛甚至可能是最优的策略,例如,一家明显为生存而竞争的公司的对手
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!