友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

策略思维-第11章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

美元。
我们可以把这些例子归纳为一个指导同时行动的博弈的法则。
法则2：假如你有一个优势策略，请照办。
不要担心你的对手会怎么做。假如你没有一个优势策略，但你的对手有，那么就当他会采用这个优势策略，相应选择你自己最好的做法。提醒一句：我们已经确立了同时行动的博弈的优势策略的概念。若是换了相继行动的博弈，采用优势策略的时候就要格外留神。因为策略互动的本质已经改变，优势策略的概念也会完全不同。假设我们说你有一个优势策略，无论你的对手选择怎么做，你按照这个策略做都比采用其他策略更好。若是相继行动，而你的对手先行，你就应该一直选择自己的优势策略。正如我们已经说过的那样，这是你对你的对手每一个行动的最佳对策，因此也是对现在他选择的这个特定行动的最佳对策。但是，假如你先行，你就不会知道你的对手将会采取什么行动。他会观察你的选择，同时做出自己的决定，因此你有机会影响他的行动。某些情况下，若是采用优势策略以外的策略，你可能更有效地施加这种影响。我们将在第6章讨论承诺的时候全面分析这个问题。
3　．劣势策略
不是所有博弈都有优势策略，哪怕这个博弈只有一个参与者。实际上，优势与其说是一种规律，不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则，但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。
一个优势策略优于其他任何策略，同样，一个劣势策略则劣于其他任何策略。假如你有一个优势策略，你可以选择采用，并且知道你的对手若是有一个优势策略他也会照办；同样，假如你有一个劣势策略，你应该避免采用，并且知道你的对手若是有一个劣势策略他也会规避。
假如你只有两个策略可以选择，其中一个是劣势，那么另一个一定是优势策略。因此，与选择优势策略做法完全不同的规避劣势策略做法，必须建立在至少一方拥有至少三个策略的博弈的基础之上。现在就让我们看一个这种类型的简单例子。
设想一场橄榄球比赛的一次对抗。攻方一门心思竭尽全力向前推进，能跑几码算几码，而守方则全力以赴阻挡对方向前移动，寸步不让。举个例子：当比赛只剩下很少时间，攻方可能希望尽力推进，使自己更容易得到一个射门得分的机会。
假如攻方只有两个策略，即带球跑动或者传球，而守方则有三个策略——拦截带球跑动，拦截传球以及闪击四分卫（blitz　the　
quarterback）。我们可以计算出全部六种策略组合分别能使攻方向前推进多少码的距离。以守方选择闪击四分卫而攻方打算传球为例。假设四分卫被撞得倒退10码的概率是10％　
，迅速传球传出10码的概率是70％　
，而传球传出更远达到20码的概率是20％。那么，平均值就是0。1l*（10）＋0。7*10＋0。2*20　＝1＋7＋4　
10显而易见，这些数字本应该以两队拥有或者缺少的特殊技能为基础；我们只不过为了描述方便而选择了一些非常独特的技巧。①①　
在这个例子里，攻方善于传球，不善于带球跑动。因此，即便是在对方集中防御传球的时候，选择传球还是会比带球跑动更好。带球之所以比闪击四分卫更好，是因为防守后卫不在他们的位置上。
我们用图36　显示所有六种策略组合将会得出怎样的计算结果。
图36攻方期望得到的码数如图36所示，攻方竭力要得到最大数目，守方则尽量压低这个数目，因此，我们没有必要分开列表确定他们的行动。①①　
所有零和博弈都会出现这样的情况，而零和博弈是指一方所得等于另一方所失。
双方都没有一个优势策略：没有一行的数字完全高于另一行，也没有一列的数字完全低于另一列。不过，守方倒是有一个劣势策略，就是闪击四分卫。闪击四分卫的结果是无论如何都会拱手让出较大的码数，因此，这一策略对于守方而言会比它采用其他可能的策略都更糟糕。因此，守方不应该闪击四分卫，攻方也可以非常自信地认定对手不会那么做。
至此，这场推导尚未结束。闪击策略可能从守方教练的笔记本中删除了，整个比赛可以被视为双方各有两个策略。在这场经过简化的比赛中，攻方有一个优势策略，就是传球。其数字分别是9和8，都大于带球跑动策略的数字，分别是3和　
。传球之所以不是原来的比赛的优势策略，原因在于，带球跑动的结果在守方采取闪击策略的时候会有一个比较理想的结果（因为带球者可能趁守方闪击四分卫而分身无术时，顺利突人开阔地带），而现在闪击策略已经不予考虑。因此，攻方将会选择传球。反过来，守方也会想到这一点，选择自己的最佳策略，即防守传球。
这里涉及的普遍适用的概念可以归纳为一个指导相继移动的博弈的行动法则。
法则3　：剔除所有劣势策略，不予考虑，如此一步一步做下去。
假如在这么做的过程当中，在较小的博弈里出现了优势策略，应该一步一步挑选出来。假如这个过程以一个独一无二的结果告终，那就意味着你找到了参与者的行动指南以及这个博弈的结果。即便这个过程不会以一个独一无二的结果告终，它也会缩刁整个博弈的规模，降低博弈的复杂程度。
我们以一个虚构的波斯湾海军对峙局势具体描述逐步剔除劣势策略的做法。②　图37　
所示的格栅代表战斗舰艇的方位以及可能的选择。I点的一艘伊拉克舰艇准备发射一枚导弹，企图击毁A点的一艘美国舰艇。这枚导弹的路径已经由电脑程序在发射的时候确定，可以直线前进，也可以每隔20秒大幅转动一个直角。假如这枚伊拉克导弹笔直从I点飞向A点，美国导弹防御系统可以非常轻易地进行拦截。因此，伊拉克一定会尝试带点拐弯的路径。所有能从I点通向A点的路径已经由下面的格栅显示出来。每条边的长度，比如IF的长度，等于这枚导②这个故事是J。D。威廉斯（J。D。Williams）在《完全策略大师》（The　
pleat　Strategyst）一书中描绘的猫捉老鼠游戏的一个更新版本。猫可能指的就是波斯人。弹20　秒之内可以走过的距离。
那艘美国舰艇的雷达会监测到伊拉克舰艇发射的这枚导弹，因此电脑会马上发射一枚反导弹。反导弹的速度和伊拉克导弹相同，也可以做同样的90度拐弯。于是，这枚反导弹的路径也可以用同样的格栅表示，只不过这次是由A点出发。但是，为了填装足够撞毁一枚导弹的爆炸物，反导弹不得不少装燃料，装的燃料只够它飞行1分钟，因此，它只能走过三个节点（比如，从A　
到B点，B点到C点，然后再从C点到F点，这一路径我们用ABCF表示）。
图37假如在这1分钟开始之前或者结束之际，我们的反导弹将与来犯的导弹相遇，那么，反导弹就会爆炸，消除伊拉克导弹的威胁，否则伊拉克导弹就会击中我们的舰艇。问题是，应该怎样选择两枚导弹的路径？在这个博弈里，值得关注的只有第1分钟的路径。各方必须事先想好三个20秒时间段应该怎么走。将每个时间段的可能选择加起来，双方各有8条可能的路径，共有64种组合方式。我们现在就来考察全部64种组合方式，计算哪些方式下反导弹和导弹会迎头相撞，哪些方式下不会相撞。
举个例子：假设伊拉克选择IFCB，即头两个时间段直线从I点经F点到C点，然后转90度到B。对照美国的ABCF策略，可见，反导弹和导弹将在两个时间段（即40秒）之后在C点相遇，因此这一组合的结果是相撞。假如伊拉克还是采取IFCB策略，而美国却选择ABEF迎击，反导弹和导弹就不会相撞。表面上看来，上述弹道都经过B点和F点，但反导弹和导弹是在不同时间达到这些点；比如美国反导弹20秒后到达B点，而伊拉克导弹则要在60秒后到达。
图38显示了所有这样的组合。伊拉克的8个策略分别标为I1到I8，同时标出具体路径，比如I1表示IFCB。同样地，美国的策略用A1到A8表示。相撞的结果记做H，不会相撞的结果记做O。图38　
击中与错过图图38看起来好像很复杂，但只要借助消除劣势策略的法则，就能将其大大简化。美国反导弹的目标在于得到相撞的结果，因此在美国人看来，H强于O。不难看出，对于美国人，A2策略与A4策略相比处于劣势：假如你将A4行举起，盖在A2行上面，你会发现，只要是A2　
得到H的地方，A4也会得到H，而且A4还多一个H，即对应伊拉克巧策略的地方。对全部可能性进行这样的分析，可以知道A2、A3、A6和A7策略与A4和A8策略相比处于劣势，A1不及A8，　
A8又不及A4。因此，伊拉克人可以确信美国人只会采取A4或者A8策略。伊拉克人把注意力集中在这两行，一心想避免反导弹和导弹相撞，因此在他们看来，I2、I3、I4、I6、I7和I8策略与I1或者I5策略相比处于劣势。划掉劣势策略所在的行和列之后，整个博弈就简化为图310　
。*　
*简化过程详见图39。——译者注我们的两个法则不可能将图310进一步简化了，因为这里已经没有任何优势策略或者劣势策略可言。不过，我们已经做得很不错了。看一看表格里剩下的策略，我们发现，伊拉克导弹应该沿着格栅外围前进，而美国反导弹则应该小步曲折前进。这样，我们很快就能看到双方应该怎样从各自拥有的两个方案中进行抉择了。
图39，击中与错过图图310，简化的击中与错过图
4　．均衡策略
利用优势策略方法与劣势策略方法进行简化之后，整个博弈的复杂程度已经降到最低限度，不能继续简化，而我们也不得不面对循环推理的问题。你的最佳策略要以对手的最佳策略为基础，反过来从你的对手的角度分析也是一样。接下来我们将会介绍解开这个循环的技巧，最终走出这个循环。
为了说明这一点，我们首先回到《时代》与《新闻周刊》的价格战，不过这次不会假设备选价格只有2美元和3美元两种，而是一系列价格。现在，《时代》的管理层必须针对《新闻周刊》可能选择的每一个价格确定最佳对策。假设每种杂志都有一群忠实读者，也有一群可能受到价格竞争影响的流动读者。如果出于某种原因，《新闻周刊》的管理层把价格定在1美元的水平，也就是制作成本的水平，那么，《时代》的管理层一定不会跟随这个毫无盈利的价格策略，而会定出一个较高的价格，杂志仍然可以卖给忠实读者而获得一定利润。如果《新闻周刊》提价，那么《时代》也会提价，只不过幅度较小，从而为自己赢得一定的竞争优势。假定《新闻周刊》每提价1美元，《时代》的最佳对策是提价50美分，于是，我们可以用图311表示《时代》针对《新闻周刊》可能选择的每一个定价而确定的最佳对策。
我们假定两本杂志的成本一样，具有同等大小的忠实读者群以及同样的吸引流动读者群的能力。那么，《新闻周刊》针对《时代》可能选择的每一个定价而确定的最佳对策将与图311完全一致。
现在我们可以想像两种杂志的经理正各自埋头琢磨。《时代》的经理说：“如果他卖1美元，我就卖2美元。不过，他因为知道我这么想，所以不会真的卖1美元，而是执行他在我卖2美元时的最佳对策，即2。50　
美元。那样的话我就不能卖2美元，而是采用我在他卖2。50　美元时的最佳对策，卖2。75　美元。不过，他因为知道我这么想……　
”这样一层一层分析下去，究竟有完没完呢？
有的，结局是3美元。假如这位《时代》经理认为《新闻周刊》会卖3美元，那么他自己的最佳对策就是也卖3美元，反过来，从《新闻周刊》的角度分析也是一样。整个循环推理最后将聚成一点。
我们可以用图312　来显示这个结果，该图同时反映了两者的对策。可以看到，两条线在两家都卖3美元的一点相交。
图3ll图312我们已经找到了一个策略组合，其中，各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什（John　
Nash）提出的。纳什的想法成为我们指导同时行动博弈的最后一个法则的基础。这个法则如下。
法则4：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。
这一定就是夏洛克·福尔摩斯和莫里亚蒂教授曾经用来看穿对方心思的秘诀。
我们还要解释一下这个法则。为什么一个博弈的参与者非得达到这么一个结局呢？我们可以说出好几个理由。没有

返回目录上一页下一页回到顶部赞（0）踩（0）

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！