友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
3C书库 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

三天读懂博弈学-第4章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



�
   。 想看书来

第2章  囚徒困境:傻作精时精亦傻,输为赢处赢还输(1)
◆预备知识
  在博弈中,你在采取行动时,一定要考虑对方会采取怎样的行动;在博弈中,假定每个人都是理性的;每个博弈参与者都会采取最优策略反应,以使自己在博弈中的预期收益最大化。(第1章)
  ◆本章重要概念
  ◎囚徒困境:在博弈论中最常被研究的,也是20世纪最有影响力的博弈实例。它由美国普林斯顿大学数学系教授阿尔伯特?塔克提出。囚徒困境通俗化的表达就是“在一场博弈中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。”
  ◎优势策略:是指在一个博弈中,不论对方采取哪个策略,我的这个策略总是显出优势。
  ◎收益矩阵:由著名经济学家托马斯?谢林教授提出,用矩阵的形式直观地表示两个参与者在博弈中的得失。收益矩阵在博弈论中至关重要,在本书的许多章节中都会涉及。
  ■囚徒困境:忠诚还是背叛?这是一个问题
  在了解“囚徒困境”之前,让我们先看一下发生在我国古代的一个小故事。
  春秋时期,贫士玉戭生与三乌从臣二人相交甚好,由于没有钱,他们就以品性互勉。玉戭生对三乌从臣说:“我们这些人应该洁身自好,以后在朝廷做官,绝不能趋炎附势而玷污了纯洁的品性。”三乌从臣说:“你说得太有道理了,巴结权贵绝不是我们这些正人君子所为。既然我们有共同的志向,何不现在立誓明志呢?”于是二人郑重地发誓:“我们二人一致决心不贪图利益,不被权贵所诱惑,不攀附奸邪的小人而改变我们的德行。如果违背誓言,就请明察秋毫的神灵来惩罚背誓者。”
  后来,他们二人一同到晋国做官。玉戭生又重申以前发过的誓言,三乌从臣说:“过去用心发过的誓言还响在耳边,怎能轻易忘呢!”当时赵盾在执掌晋国朝政,人们争相拜访赵盾,以期能得到他的推荐,从而得到国君的赏识。赵盾的府邸前车子都排出了很远。这时三乌从臣已经后悔,他很想结识赵盾,想去赵盾家又怕玉戭生知道,几经犹豫后,决定起早去拜访。为避人耳目,当鸡刚叫头遍,他就整理衣冠,匆匆忙忙去拜访赵盾了。进了赵府的门,却看见已经有个人端端正正地坐在正屋前东边的长廊里等候了,他走上前去举灯一照,原来那个人是玉戭生。
  这则颇具意味的故事出自明代学者宋濂的《宋文献公全集》。宋濂在作品中评论道:“二人贫贱时,他们的盟誓是真诚良好的,等到当了官走上仕途,便立即改变了当初的志向,为什么呢?是利害关系在心中斗争,地位权势使他们在外部感到恐惧的缘故。”或许我们要问,地位和权势是怎样使他们感到恐惧的?或许博弈论中的“囚徒困境”理论可以给出合乎情理的解答。
  1950年的一天,美国斯坦福大学客座教授、普林斯顿大学数学系主任阿尔伯特?塔克给一些心理学家做讲演,为了避免使用繁杂的数学手段而能更加形象地说明博弈的过程,他提出了囚徒困境的理论模型。
  塔克以下面这则小故事作为开始:
  鲍勃和埃尔两个窃贼在偷盗地点附近被警察抓获,分别关押。每个窃贼必须选择是否供认并指证同伙。如果二人都不供认,将被指控非法携带武器,入狱1年。如果二人都供认并指证同伙,将入狱10年。如果一人供认,一人不供认,则鉴于供认者与警方合作的表现,无罪释放,其同伙将遭到严惩,判入狱20年。

第2章  囚徒困境:傻作精时精亦傻,输为赢处赢还输(2)
我们用收益矩阵分析囚徒困境的情况(如下表):
  埃尔
  供认 不供认
  鲍伯 供认 10年,10年 0年,20年
  不供认 20年,0年 1年,1年
  收益矩阵可以这样解释:囚犯的战略是供认或不供认,每个囚犯选择其中一种战略。竖列代表埃尔的战略,横行代表鲍勃的战略。矩阵中的每组数字是两个囚犯选择不同战略得到的相应结果,逗号左边的数字为鲍勃的收益,右边数字为埃尔的收益。以第一列为例,若两囚犯都认罪,都被判入狱10年;若埃尔认罪,鲍勃不认罪,鲍勃入狱20年,埃尔获释。
  那么,到底应该如何解决这一博弈问题呢?如果二人都想入狱时间最短,什么样的战略才是理性的呢?埃尔可能作如下思考:“有两种可能性会发生:鲍勃认罪或保持沉默。假定鲍勃认罪,则我不认罪将入狱20年,认罪将入狱10年,所以该情况下最佳的选择是认罪。相反,假定鲍勃不认罪,则我不认罪将入狱1年,认罪将获得自由,认罪还是最佳选择。总之,我应该认罪。”
  ⊙托马斯?谢林的博弈收益矩阵
  托马斯?谢林教授对博弈论的重大贡献之一就是首先用矩阵形式的表格表示两个参与者的博弈所得。谢林教授曾经说过:“假如真有人问我有没有对博弈论做出一点贡献,我会回答有的。若问是什么,我会说我发明了一个矩阵反映双方得失的做法……我不认为这个发明可以申请专利,所以我免费赠送,不过除了我的学生,几乎没有人愿意利用这个便利。现在,我也供给各位免费使用我发明的矩阵。”
  上文中我们所用的用来表示囚徒困境的矩阵,就是谢林教授“免费”提供给我们的。
  同样,鲍勃也将按照相同的思维确定自己的行为选择,其结果是两人都认罪,被判入狱10年。然而,如果二人非理性行事,保持沉默,每人只会入狱1年。
  由此可见,对于鲍伯来说,无论埃尔采取什么策略,他坦白总是对自己有利的,两相比较,坦白是他的优势策略;对于埃尔同样如此。因此,在这个博弈中,坦白是双方的优势策略,那么,抵赖就是劣势策略。
  实际上,囚徒困境正是个人理性冲突与集体理性冲突的经典情形。正因为在囚徒困境中,每个人都根据自己的利益做出决策,但最后的结果却是谁也捞不到好处。这种情形在生活中也会遇到,比如排队购物时,如果大家都在排队而只有一个人挤上前去插队,他将得到好处;可是如果大家都蜂拥而上,将会出现混乱无序的局面,此时你只能跟着大家一起挤才有可能尽快买到你想要的东西,否则你将成为最后一个——也是最吃亏的一个。
  学习了囚徒困境理论,我们在回过头来看一下本文开头的小故事,相信会有豁然开朗的感觉。首先,赵盾的权势对玉戭生与三乌从臣而言是不可忽视的外在资源,赵盾是否赏识,将决定他们的仕途是否顺利。这种情形之下,巴结赵盾与不巴结赵盾的选择,就与二人的现实利益息息相关。对于二人而言,无论对方是否选择巴结,自己只有选择巴结才有可能升官。
  因此我们不能说趋炎附势是性格软弱而导致的惯性举止,实际上它是为了维护自身利益而进行的一种博弈选择。如果他们信守誓言,就肯定与升迁无缘;而背叛誓言,则有可能得到现实利益。因此,在没有良性竞争的机制下,背叛无疑是利益最大化的选择。因为如果自己坚守,而又没有一种机制能保证对方也同样坚守,那么坚守者就有可能成为被牺牲的傻瓜。学习囚徒困境的理论模型,并非鼓励人们背叛,而是让我们知道,在面临一个决策时,如果没有十全十美的办法,我们不妨权衡一下利弊,从而做到“两害相权取其轻”。

第2章  囚徒困境:傻作精时精亦傻,输为赢处赢还输(3)
⊙阿尔伯特?塔克(Albert  tucker;1905—1995)
  阿尔伯特?塔克出生于加拿大的安大略,1929年到普林斯顿大学从事研究工作,后来担任该大学数学系主任——当时普林斯顿大学的数学系是世界上最富创造力的数学系之一。
  1950年,塔克在作为斯坦福大学的客座教授给心理学家们讲理博弈论时,创造了囚徒困境。囚徒困境的例子虽然简单到用一页纸就可以写完,但却对20世纪后半叶的社会科学产生了深远的影响,塔克本人也因其在博弈论和数学优化领域的贡献而为世人敬仰。
  ■军备竞赛、价格战与学生减负
  “妈妈,我要买耐克运动鞋,脚底有透气孔的那种!”
  “多少钱?”
  “一千两百多。”
  “这么贵?赶上我半个月工资了呢!”
  “同学们都有,我也要!”
  以上是14岁的初二学生小明放学回到家里和妈妈的对话。对此,大多数朋友会指责小明不懂事、爱慕虚荣、喜欢攀比、不体念父母赚钱养家的艰辛。但这只是表面现象。目前学生穿的校服是学校统一制作的,单从衣服上看,学生无法分出三六九等,不知道谁的父母更有钱、谁在家更受宠。那么比什么?比学习好当然太“老土”,于是比鞋子、比手机、比MP4。大刘的儿子今年上高二,让大刘哭笑不得的是,儿子早上上学走的时候穿的是两只一样的鞋,晚上回到家里一只脚耐克一只脚阿迪达斯——不懂?这是时尚!你要穿个稍微次点的鞋,还没人和你换着穿呢!你说要孩子不要和人攀比?那你无疑是把孩子推到另一个体系——大多数同学之外的体系。这是家长的无奈,也是社会的无奈。
  这就是囚徒困境在现实生活中的生动写照。同学间的攀比,其结果是对大家都不好;但是别的同学都有了,你也得有,否则你就是同学中的“另类”,你就会遭多数同学的白眼。
  国家之间军备竞赛的例子与此类似,同样可以用囚徒困境来描述。展开军备竞赛的两国都可以声称有两种选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成都有损坏等)。比如冷战时期的美国与苏联。
  商业领域,囚徒困境在商业领域也不鲜见,比如价格战、广告战等。让我们看下面一例:
  2007年夏,中国食品行业普遍刮起了涨价风。6月21日,光明、蒙牛、伊利、三鹿等14家国内外乳品企业聚集南京签署“乳品企业自律南京宣言”。约定取消特价、降价销售等促销方式,这被认为是一种变相的联合涨价。7月26日,统一、康师傅、日清、今麦郎、华龙等方便面生产企业宣布集体涨价,幅度为20%至40%。对于联合涨价,厂商们给出的统一理由是:遏制低价竞争,维护行业长远发展。
  但是结果怎样呢?
  不到两个月,在超市的货架上,方便面“涨价联盟”成员之一某品牌的葱爆羊肉方便面就搞起了促销活动——买两包方便面即可获赠一副扑克牌;而有的超市中,某著名品牌方便面则是买五连包送一个酱罐;还有方便面展开了“买五送一”的活动。
  再看牛奶,“买一箱伊利纯牛奶送3袋250毫升牛奶”、“光明利乐枕原价元,现价18元”、“原价元特浓纯牛奶现仅售元”“蒙牛买一箱送一袋”……乳制品业的知名品牌无一例外,全部参加了促销活动。而且超市的促销广告牌上标明促销活动时间为7月24日至8月10日,是在乳制品业“涨价联盟”形成之后。。 最好的txt下载网

第2章  囚徒困境:傻作精时精亦傻,输为赢处赢还输(4)
为什么这些当初如此高调、如此信誓旦旦的价格联盟是这样的不堪一击?博弈论中的“囚徒困境”能给出令人信服的解释。假设乳制品市场有两个寡头同时面临着降价与不降价的选择,如果双方都不降价,则双方都保持原来的销售利润,增加的赢利为0;如果双方都降价,则各增…50个单位;如果甲厂降价而乙厂不降价,那么甲通过降价扩大了市场份额,赢利增加100个单位,而乙因为坚持不降价而失去了市场,赢利增加…100个单位;反之,如果乙降价而甲不降价,而乙赢利增加100个单位,而甲赢利增加…100个单位。那么从双方最好的结果来看,就是双方都不降价(相当于“囚徒困境”中的两个人都不招)。但如同囚徒困境一样,只有降价才是每个企业的优势策略——如果对方不降价,我最好降价(我不降价得0,降价得100);如果对方降价,我更得降价(我不降价得…100,降低得…50)。
  显然,从参与竞争各方最好的结果来看,就是都不降价。而在现实中,几乎所有的公司都不可避免地陷入了价格战的囚徒困境中。
  囚徒困境中在现实生活中的另一个例证是学生减负的问题。众所周知,目前我国的“应试教育”备受诟病,但孩子们无一例外地在接受着这种教育。为什么会出现这种情况呢?�
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!