蜈蚣博弈悖论的势分析 联系客服

发布时间 : 星期六 文章蜈蚣博弈悖论的势分析更新完毕开始阅读3674973067ec102de2bd892b

蜈蚣博弈悖论的势分析

(西北农林科技大学 理学院 李红波)

摘要:逆推归纳法是博弈论求解的重要方法,但是1981 年罗森塞尔提出的蜈蚣博弈给逆推归纳法带来了严重的挑战,研究发现,在蜈蚣博弈中,人们的选择和我们通过逆推归纳法求解得到的结果不同,形成了悖论。通过对逆推归纳法的适用范围进行分析,我们发现我们在最初的理性人假设时我们忽略了人们在另一方面的理性——势理性,文章通过对势的概念、性质等进行分析研究,得到势理性的概念,并对通过势理性和有限理性的结合,解决了蜈蚣博弈悖论的问题。

关键词:蜈蚣博弈 逆推归纳法 博弈的势 势理性

一、引言:

蜈蚣博弈是指这样一个博弈(如下图):两个博弈方A、B 轮流进行策略选择,可供选择的策略有“合作”和“不合作”两种。

图一

在上图中,所有得益数组中第一个数字是博弈方A 的得益,第二个数字是博弈方B 的得益。利用逆推归纳法我们不难得到,在第一步A 将选择“不合作”,此时各自的收益为1 。

从逻辑推理来看,逆推归纳法是严密的,但结论是违反直觉的。直觉告诉我们采取“合作”策略是好的。而从逻辑的角度看,A 一开始应选择“不合作”的策略。人们在博弈中的真实行动“偏离”了运用逆推归纳法关于博弈的理论预测,造成二者间的矛盾和不一致,这就是蜈蚣博弈的悖论。

蜈蚣博弈悖论给逆推归纳法提出里严重的挑战,这令许多博弈论学者感到困惑。一些学者坚信逆推归纳法本身没有问题,是符合逻辑的,;也有一些学者则对逆推归纳法提出了质疑,否认了逆推归纳法的有效性;还有一些学者(如张峰)认为逆推归纳法悖论产生是源于逆推归纳法的适用范围问题,笔者同意最后一种观点。

文章通过对逆推归纳法的使用范围进行分析,认为逆推归纳法最大的问题就是对博弈方的理性人假设,首先,理性人的假设对博弈方的理性要求太高,这使得现实中很多人不满足逆推归纳法的假设,出现了求解错误的现象,其次,理性人假设中忽略了对理性人更深层次理性的考虑(文中成为势理性),由于理性人假设中缺少了势理性,使得逆推归纳法犯下以偏概全,只重眼前和近期利益而忽略长远利益的错误。由于理性人假设的这两点致命的弱点,严格限制了逆推归纳法的适用范围和条件。

文章通过分析认为,像蜈蚣博弈这样比较多阶段的动态博弈不适合用逆推归纳法求解,只有当博弈进行到某一阶段后,剩余的子博弈满足逆推归纳法的假设条件时,才可以用逆推归纳法对该子博弈运用你退归纳法求解。

二、 势的提出:

“势”是中国传统战略思想的核心概念之一,但对其下一个明确的定义却非常的困难。

许多古代学者喜欢用比喻来谈“势”,如:李韩非认为,“夫有才而无势,虽贤不能制不肖。故立尺材于高山之上,下临千仞之溪;材非长也,位高也。桀为天子能制天下,非贤也,势重也。尧为匹夫,不能正三家,非不肖也,位卑也。千钧得船则浮,锱铢失船则沉,非千钧轻而锱铢重也,有势之于无势也。” 其实,“势”是指一种不以人的意志为转移的必然趋势,是事物发展的客观规律,也是事物存在的一种状态。

“势”具有隐蔽性、广泛性、动态性和较强的辐射力四个属性。

(1)“势”是无形的,具有隐蔽性的特点。 (2)“势”是广泛存在的,上至国家社会,下至企业个人,都有“势”的存在。 (3)“势”是不断变化的,是动态的。随着时间的变化。

(4)以较强的辐射力实现系统功能的突现。在棋盘上,强大的厚势常令对方望而却步。在国际上,强国往往会给邻国造成巨大压力。

博弈中参与人的势:各种因素对参与人作用的合力,体现参与人对全局掌控的能力,它是由外部各因素共同作用并由参与人表现出来的一种状态。

势的作用:从整体而非局部把握事物的本质,以获得整体得益,我们可以通过对势的利用使得整体得益最大化。

三、 势对理性人的分类:

在理性人假设中,人是理性的,但这个所谓的理性中却缺乏了势的概念,忽略了理性人更深层次的理性,即势理性。

势理性是与势相依的理性,指具有整体观念和全局眼光的理性,是在适当的时候,会选择保全整体利益而放弃某以时刻的利益的理性。

下面我们以贝叶斯博弈中的一个例子来说明:

有限次囚徒困境中,假设囚徒1有两种类型:理性和非理性,这是囚徒1的私人类型。两种类型的概率分布为两人的共同知识。 P(理性)=1-p,P(非理性)=p,囚徒2是理性的,理性的囚徒可以选择任何策略,而非理性的囚徒仅选择“针锋相对”策略,即第一阶段选合作,而在t>1阶段选择与对手在t-1阶段想同的行动。支付矩阵为(设贴现因子??1)

a?1,b?0,a?b?2。支付矩阵为:

DCD?(1,1)(b,a)? ???C?(a,b)(0,0)??

现在我们对三次重复博弈进行探讨,当p(1+a)+(1-p)b>pa,1+p+(1-p)b+pa>a,1+p+(1-p)b+pa>a+b+pa时,我们会看到博弈的结果为

非理性囚徒1 理性囚徒1 囚徒2 t=1 D D D t=2 D C D t=3 D C C 在博弈的第一阶段,理性的囚徒1并没有选择他的在这阶段的更优策略C,而是选择了

D,故意犯下错误,而误导囚徒2,这样可以使自己在整个博弈的过程中的得益最多,这说明理性的囚徒1具有势理性,这使得他的整体收益得到提高。

由此可见,人们在动态博弈中可能选取一个并非次步的最佳策略而体现故意犯错的行为为未来获得更多的利益做准备,于是,势理性是有利于人们得益最大化的,所以是理性的重要的一部分,我们将势理性加入的理性人假设中去,用势理性对理性人进行分类,这可以是博弈论有更广泛的应用范围,也可以使博弈分析得到更精确的结果。

我们通过势理性把理性人分为两类:

1、 局部理性人:没有势观念或势观念较弱的人,这种人缺乏全局观念,只看重眼前利

益,看不到整体利益,就如在下棋中的不善弈者,只思谋子,而不思谋势。

2、 整体理性人:有较强的势观念,这种人在博弈中可以从整体把握局势,有时会为了

整体利益放弃当前的一些利益,就如在下棋中的善弈者,谋其势而非只谋其子,这种人可以实现自身整体利益的最大化。当然这种人也分为两类:绝对整体理性人和相对整体理性人。

五、悖论势分析:

在现实中, 人的理性必然是有限的。但理性人假设在经济学的许多领域具有成功的应用, 原因一, 在于这些领域需要的理性程度不高, 一般人都能达到;原因二, 在于这些领域问题的解具有稳定性, 在理性人假设具有微小偏差的情况下也能很好的说明问题。而逆推归纳法解娱蛤博弈恰恰不能满足上述两点。娱蛤博弈由于博弈阶段复杂, 对博弈者的理性要求高, 面对娱蛤博弈, 普通人不能达到理性人的标准。逆推归纳法得到的娱蛤博弈的子博弈完美纳什均衡具有不稳定性。

逆推归纳法忽略整体观,以偏概全,只注重眼前和近期利益,忽略长远利益等严重错误,通过给理性人与势的区分,可以让理性人实现真正的理性,弥补了这一缺陷。

由于蜈蚣博弈并不满足理性人假设,所以我们要重新思考理性人的假设,我们可以考虑参与人有势观念,我们称之为整体理性人。在蜈蚣博弈中,我们假设所有参与人具有整体理性,都是整体理性人,并且这是共同知识,但由于理性的有限(在博弈中只能向前看30步),参与人并不能看清全部198步的博弈过程,所以,参与人会将注意力放在蜈蚣博弈开始的几步和结束的几步,如图一中所示,省略号的部分经常会被“忽略”掉,参与人A在第一步选择不合作的得益是1,而如果博弈可以进行到最后的话,参与人A的得益为100或98,这均远远大于1,所以具有整体理性的参与人A没有选择不合作的动机,同样参与人B也没有选择不合作的动机,这个过程会一直持续下去,直到参与人可以看清以后所有的博弈过程。在此以后的博弈中,由于整个子博弈都可以被参与人所了解,成了完全完美信心的博弈,这时参与人从整体把握局势,为了获得更过的利益,相对整体理性人会考虑合作,但这种合作存在着风险,即为了得到更多的利益有可能损失已经得到的1个利益,所以,相对整体理性的人也会根据自己的风险偏好在适当的时候结束该博弈,这时如果加入风险的概念,参与人便近似满足了理性人的假设,这时我们就可以用逆推归纳法去求解蜈蚣博弈模型了;而绝对整体理性的人会为了追逐最终的100或101的利益而坚持与对方合作。

通过上面的分析,我们分几种情况讨论蜈蚣博弈的求解问题:

1、参与人A或B为局部理性者,则由于局部理性者只顾及眼前和近期利益,所以博弈会比较早的结束,这种情况下,参与人满足理性人假设,所以可以用逆推归纳法求解,但现实生活中,局部理性人比较少,所以这种情况在试验中很少出现。

2、参与人中无局部理性者,参与人A或B为相对整体理性者,参与人A和B为有限理性者(在博弈中只能向前看30步),这种情况下,开始时,参与人的行为受到势理性的影响会一直选择合作,而当博弈进行到168步后,由于博弈变成了完全且完美信息博弈,所以相

对整体理性者会根据自己的风险偏好加入风险损失值,然后再根据逆推归纳法解出自己的策略集合,在适当的时候结束该博弈。在现实中这种情况会出现的比较多,因为大多数人都是相对整体理性人,他们有较强的势理性,也有较强的风险观念,他们会在适当的时候结束博弈,以实现自身利益最大化。

例如:我们假设A、B的风险损失系数(即他们认为出现损失的概率)如下: A B 169步 0.42 170步 0.46 171步 0.45 172步 0.49 173步 0.49 174步 0.51 ?? 用逆推归纳法,经计算我们得知,当A或B的风险损失系数大于0.5时,博弈就会停止,从上表中我们可以看出在174步时参与人B的风险损失系数为0.51,大于0.5,所以此时他不会选择合作,他会在此时结束博弈,这时二人的得益分别为86和89。

3、参与人A和B均为绝对整体理性者:这种情况下,双方都会一直合作下去,直到博弈结束,双方拿到100,100的完美结果,但在实现中这种类型的很少,所以这种情况一般不会出现。

参考文献

张峰.逆推归纳法悖论探析[J].福建论坛.人文科学社会版.2004年第12期 张峰.博弈逻辑中理性人假设的困境与思考[J].学术论坛.2007年第9期 谢识予.经济博弈论[M].上海:复旦大学出版社.2010年2月,第三版 易宪容,赵春明.行为金融学[M].北京:社会科学文献出版社.2004年8月

Drew Fudenberg,David K.Levine.THE THEORY OF LEARNING IN GAMES[M]. The MIT Press.Combridge,Massachusetts.London,English.1995