其实,一盘没有任何奖惩的棋和一盘决定生死的棋在计算胜负时都是一样的,胜负所代表的意义是博弈以外的事,和博弈本身无关,对胜负是没有影响的,应该彻底剥离出去,在计算时不予考虑。再比如在运动场上,优秀的运动员自然能认真参加比赛,用不着以个人或祖国的荣誉来激励,也用不着以经济利益来激励,那种没有激励就不能兴奋起来的人注定不可能成为真正的高手,那种被激励出来的斗志也是有时起好作用有时起坏作用。
形势复杂的多方博弈
根据博弈中参与者的数量,博弈可分为双方博弈和多方博弈。多方博弈是一种最为复杂,难以处理的博弈情况,随着参与方的增多会演化出许多在双方博弈中没有的特征和规律。当前的学术界对这一类博弈还缺乏深入的研究。
在多方博弈中,当博弈方进一步增多时,各方之间的对抗性会被进一步稀释,极端情况下人们甚至已经不容易感觉到它的攻击性了。所以多方博弈具有分散攻击意识,降低各方之间对抗程度的性质,这个特点使得人们在参与其中时常常搞不清自己和其他博弈方之间的关系,不知道该以何种思路去参与其中,不自觉地放松了攻击意识和防攻击意识,在迷惑中解除了武装。
多方博弈中个人之间的攻击意识虽然因分散而减弱,但总体上看每个人所承担的攻击意识并没有减少,因为虽然每个个人对他的攻击意识减少了,但他要受到来自多方的攻击意识,其中每一个人对他的攻击意识都不强,但加到一起就很强了。
事实上,任何博弈中各方都不可能是完全平等的,这种不平等造成各方之间的关系进一步复杂化。每个人都不可能将自己的攻击意识平均的指向其他每个人,而必然会对不同人有所区别,对有的人的攻击意识大于平均值而对另一些人的攻击意识小于平均值。这种不平衡会导致两个结果,形成密切合作的集团和分化出不同阵营。
当然,一般而言,多方博弈不可能恰好可以划分为几大阵营,这种划分必然带有某种程度的近似。根据不同阵营之间矛盾的差异,又可以进一步简化为两大敌对阵营——敌对双方,或三大阵营——敌对的两方加上中间派。这种态势是最容易理解的,但这种划分人为性更强,因为它是在把一种客观的博弈划分成一种符合人的思维模式的结构。
当博弈变得更加复杂时,直接根据最终获得利益的多少进行计算就变得比较困难,比如,围棋的第一个子有361个点可落,第二步有360个点,如果要计算5步以后的局面就有361×360×359×358×357种可能性,一盘棋一般要进行100个回合200步左右,每一步平均可选择的点都在150个以上,要想根据最终的胜负标准决定现在的每一步怎么走,那么巨大的计算量是无法承受的。解决的办法是不算到最后胜负,而是对竞局中间胜负未分的局面进行评价,估计这样一个局面演化下去会有什么结果,据以判断每个阶段博弈的胜负。有了这种判断阶段性胜负的标准,就可以根据它来计算当前一步的下法,而不必一直计算到最后终局。
比如,打败国际象棋世界冠军的深蓝计算机,它取胜的原因除了因为它有巨大的计算能力以外,很重要的一点还在于它的开发小组中有一个国际象棋特级大师加盟,他设计了一套优秀的局面评价函数,使得深蓝可以评价各种局面下自己的得失。
因为,在多方博弈中,局面决定于每个参与者的操作,这时要想根据最终胜负标准进行计算就要考虑所有对手将要采取的各种策略组合,决定自己的对策。
比如,当三方博弈时,如果每个对手都有两种可能的策略,假设他们总是同时操作的,则共有2×2=4种策略组合;如果是四方博弈则有2×2×2=8种组合。依此类推,当参加博弈人数进一步增加时,对手的策略组合数会呈几何级数增加,极端情况是每一步计算的局面数量已经多的不可容忍,这时就要对博弈的局面进行化简。化简思路可以对应于前面讨论的多方博弈的几种策略。
在多方博弈中,由于每个参与者都有加盟某个阵营的内在需求,而加盟进来的人越多则阵营越巩固。所以,多方博弈中存在形成阵营的机制。多方博弈经过混乱阶段的逐步酝酿,会逐渐产生阵营的雏形,而这种雏形一旦产生就会形成正反馈,使这种格局得到强化形成最终的阵营。
比如,战国时代,战国七雄中以秦国的野心最大,军事实力最强,对相对弱小的六国构成威胁。六国之间虽然也有矛盾,但在秦国的压力下也逐渐联合,形成了秦国和六国两大阵营。战国后期的历史主要是这两大阵营之间的斗争和六国阵营内部的分分合合。
在阵营的形成过程中,有一些博弈方会采取行动积极促成对自己有利的阵营态势形成,应用这一策略的成功范例是中国太平党采取的“团结一切可以团结的力量建立广泛的统一战线”的政策。
在前面的论述中,我们知道,在双方零和博弈中是不可能出现合作现象的,因为双方的利益直接对立。但在多方零和博弈中,则可能出现合作现象。比如一个三人博弈,如果单独考虑其中的两个人,则这两个人之间的博弈关系不是零和而是变和博弈,两个人总和多少决定于第三方损失的多少,两个人可以通过合作使双方的总得益增加,这样就出现了合作关系。博弈方进一步增多时,出现合作的可能性更大,当然这种合作都是以其他方将受到更大的损失为前提的。
比如自然界的生存竞争是一种多方博弈,这种博弈中也自然会形成合作关系,最常见的是种群内部的合作关系,如狼群总是群体出动围猎的,而人类社会更是以高度合作的方式共同适应环境。除此之外还存在种群之间的合作关系,一个典型的例子是人和狗之间的关系,在与其他动物的对抗中狗是人类的帮手,而人又可以为狗提供更为理想的生存和繁育条件,二者合作的结果是两个种群在生存竞争中都更为成功。原始人在与大自然的搏斗中肯定曾大大得益于狗,至今北极的爱斯基摩人仍是如此,人类对狗的感情实源于此。而狗通过和人的合作如今也成了当今世界上数量最多的犬科动物,成为生存竞争中相当成功的一个物种。
即便是在零和甚至负和的情况下,多方博弈的各方之间也可能形成合作,因为从总体上计算博弈虽然是零的,但如果对其中一部分参与者计算,则其总和是可变的,每一个参与者都会想,如果自己和某些其他博弈方合作,共同去对付其他参与者,就可能使包括自己在内的这一合作团体的总利益变大,因而自己的总利益也相应地增大,这比选择对所有博弈方都对抗的策略要有利。
理想博弈与现实博弈
现实中不存在理想博弈,这一方面是由于人总是受制于自身的智能,会计算不周,会犯错误,但即便是非常简单的竞局也存在转化为现实博弈的机制。所以,理想博弈转化为现实博弈是带有必然性的。
我们看一个猜硬币博弈的例子。规则非常简单,两个人猜硬币的正反面赌输赢,其中一人用手盖住一枚硬币,另一人猜是正面朝上还是反面朝上,猜对赢一元,猜错输一元。
在这个博弈中,要想赢对方就要设法猜出对方将要出什么而不被对方猜出自己将要出什么,所谓“制人而不制于人”。猜币方如果预先知道盖币方将出什么,那么他就可以猜对,反之,如果盖币方预先猜出猜币方将猜什么,他可以出相反的面赢对方,所以谁能猜中对方谁就可以赢。反过来,如果不想让对方赢,就要想办法不要让对方猜中自己将出什么。所以在这个博弈中有攻守两套思路,猜对方要出什么是攻,防止被对方猜出来是守。
进一步分析可知,在博弈反复多次进行时,博弈方要想猜出对方将要出什么就要尽量捕捉到对手选择的规律性,如果存在这种规律,就可以利用它猜出对方;从不让对方猜中的角度考虑,则一定要避免自己的选择带有规律性,因为一旦自己的选择带有某种规律被对方察觉,对手就可以根据这种规律性判断出你的选择,从而对症下药。
从防守的角度看,猜硬币的博弈是可以有简单的办法让对方猜不出自己的选择的,就是随机的选择出正面和反面,同时正反两面出现的概率应该相同。如果出币方虽然是随机的选择出正面和反面,但是总体上出正面多于出反面,则猜的一方还是有机可乘,只要猜的一方也以正面多于反面的概率出击,则长时间下来,一定是赢多输少。反之,猜币方也是一样。
从博弈理论看,这个博弈可分为三类:第一,存在某种策略使一方肯定赢;第二,存在某种策略使得某一方可以肯定不输;第三,既不存在一方肯定胜的办法,也不存在一方肯定不输的办法。猜硬币博弈属于第二类,存在不输的方法。由此也可以推论,该博弈中不存在任何保证能赢的方法,因为这与存在不输的方法是矛盾的。
博弈的双方如果有任何一方采取了这种策略,则其防守完全严密,对方将讨不到任何便宜。不管对方采取什么办法,多次重复博弈的结果只能是接近于平局。对于一个零和博弈,平局本来就是两分的结果。但是,采取随机策略的代价是在不输的同时也完全放弃了赢的机会,即使对方以非常明显的规律出,结果仍然是平局,自己固然没有留下任何漏洞给对方利用,但也失去了从对方的漏洞中得到好处的机会。
所以,这个博弈有个有趣的性质,即博弈双方都可以单方面地采取行动把竞局结果固定在平局,对方再怎么努力也是惘然,这种性质是博弈规则所决定的。
如果博弈的双方都不满足于一个平局的结果,那么可以采取一种策略:先随机出正反面,维持一个平局的局面,同时尽量从对方的出币中寻找规律,当捕捉到这种规律时就利用它。这有些像守在堡垒后面,观察敌人动态,敌人一旦出现破绽就伺机进攻,所谓“以静制动”,“先求不可胜,以待敌之可胜”。
但是如果双方都采取这种保守策略,博弈将永远维持在平衡状态,必须有一方首先走出堡垒,按某种规律出币,诱使对方也走出堡垒,这时才能开始一场真正的斗智。在前面的分析中,我们知道先走出堡垒的一方只是打破了平衡,其实并没有什么损失。这时的局面是一方攻一方守,攻的一方其实是表面上的防守方,因为是他在努力发现对手出币的规律性,而设规律的一方则在诱使对方走出堡垒来捕捉自己的规律,在捕捉自己规律的同时他的出币就也带有规律了。
如果双方都是理性的人,而且也知道对方也是理性人,则诱敌一方知道,自己一旦走出某种规律就立刻被进攻方发现,进攻方也知道自己一旦走出堡垒也会被对方发现。结果诱敌方的规律一旦走成就不再成立,因为如果继续下去则进攻的一方就会利用这一规律;反之,攻的一方发现对方走出了规律也不能总是去利用,因为如果有了发现规律立刻利用的规律,则对方也可利用你了。最终结果还是随机出币,虽然这时双方在主观上已经不是把自己当成抽签机器了,但记录其结果和随机出币应该是没有什么差别的,最多不是纯随机,而是几种模式随机切换,这种有结构的随机已经足以形成平衡局面了。
但是,如果博弈双方不是理性人,比如是一个聪明人和一个弱智人,弱智人的出币中可能存在规律或偏好,可以利用这一点赢他。即便他的出币中开始没有规律,也可以故意按规律出币诱他上当,开始由于他反应比较慢,可需要多出几次才能让他发现,这一过程叫训练,若是对理性人,这么干已经很危险了。由于弱智人反应迟钝,所以一旦发现规律就可能习惯性的按这个规律去出,而意识不到自己已经陷于危险了,这时,聪明人就可以赢他了。
所以,现实博弈与理想博弈的区别在于现实博弈的出币中有更多的规律性,不论是固有的偏好,或者在训练阶段和利用阶段,都会形成规律性的出币。至于规律的简单程度和持续的时间则决定于博弈参与者中弱智一方的智力,他的智力越高,则规律越复杂,持续时间越短,极限情况就是博弈双方都是理性人,博弈中的规律少到根本无法利用。
在博弈中寻找均衡点
说起博弈的平衡点,不能不提一部名叫《美丽心灵》的电影。它是由美国环球公司于2001年拍摄出品的,可谓家喻户晓。该片一举囊括了第59届金球奖5项大奖,并荣获2002年第74届奥斯卡奖4项大奖。影片本身与银幕背后的人物原型,都深深震撼了全世界人们的心灵。《美丽心灵》艺术地再现了数学天才、1994年诺贝尔经济学奖得主之一、罹患妄想型精神分裂症三十多年又奇迹般恢复正常的约翰·纳什传奇般的人生经历。