第 2 章策略型博弈

第2章策略型博弈 策略型博弈案例:艺术品拍卖的策略型占优策略解案例研究续：拍卖中的占优策略

策略型博弈 博弈的策略型由三项内容所确定： 1.博弈中局中人的名单. 2.每个局中人可使用的策略集. 3.与任何策略组合（每个局中人一个策略）相对应的盈利.

盈利是冯诺依曼-摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。盈利是冯诺依曼-摩根斯坦效用。最简单的博弈类型是两个局中人有两个策略的博弈。策略型 : 局中人2 北南局中人1 高π1 , π2π1 , π2 (高,北), (高,北) (高,南),(高,南) 低π1 , π2 π1 , π2 (高,北), (高,北) (高,南), (高,南)

当局中人多于两个，以及每个局中人有两个以上的策略时，对策略型的三个分量使用下述符号：当局中人多于两个，以及每个局中人有两个以上的策略时，对策略型的三个分量使用下述符号：局中人将标记为1，2，…，N。一个局中人代表将表示为第i个局中人。局中人i的策略通常表示为si，一个特定的策略表示si*或si#。除了局中人i以外的所有其它局中人的策略选择记为s-i。 πi将表示局中人i的盈利(或冯诺依曼-摩根斯坦效用)函数。对于策略组合，s1*，s2*，…，sN*，其中每一个局中人相应于一个策略，局中人i的盈利将表示为πi(s1*，s2*，…，sN*)。

囚徒困境（c = 认罪，nc = 拒绝认罪） 卡尔文＼克雷cnc c 0, 0 7, -2 cn -2, 7 5, 5 性别争端（F = 足球，O = 歌剧）丈夫＼妻子FO F 3, 1 0, 0 O 0, 0 1, 3

抛硬币打赌（Matching pennies）( h = 正面, t = 反面) 局中人1＼局中人2 正面反面正面1，-1 -1，1 反面-1，1 1，-1 鹰-鸽（或懦夫博弈）（t = 强硬, c = 退让）局中人1＼局中人2 tc t -1, -1 10, 0 c 0, 10 5, 5

投票对每一个投票者，在这个博弈中的策略有三个部分：在第一轮中如何投票和第二轮中如何投票，而在第二轮中的投票本身有两个分量。第一个分量是，如果议案A在第一阶段通过后在第二轮中投票人如何投票，第二分量是，如果（在第一轮中）议案B通过后，该投票人又将如何投票。特别地，每个投票人有下述8个策略可供选择*。AAN; AAB; ANB; ANN; BAN; BAB; BNB; BNN; *当然，投票人知道她在第一轮中自己是怎样投票的。原则上，她的策略也可以根据这个信息。目前我们将略去这种复杂性，因为这样的话，每一个策略中分量的个数将增加到5——替代原来的3。（为什么？）

与展开型的等价性 两种表示博弈的方式是等价的：每一个展开型博弈可以写成策略型且反之亦然。

案例：艺术品拍卖的策略型 • 艺术品拍卖：描述假如我们被带入位于纽约洛克菲勒中心的索士比派克伯尼特的大型拍卖场之一。拍卖商站在房间前面的讲台上。她的旁边有一对随从举着待拍卖物件的影像。设想待拍卖的物件是雷诺伊（Renoir, 1841—1919）的一组绘画；你很想拥有标号为“#264”的那件可爱的咖啡吧景色。你必须开始做如下的事。注册：如果你打算投标，必须在商品展销室的入口处注册。那里你将得到一块写有编号的拍卖牌。（为了注册，恐怕你需要一张信用卡。) 出价程序：一旦轮到标号#264，“你出价所必须做的就是举起你的拍卖牌并等待拍卖商理会你，你不必叫出你出价的数——通常由拍卖商以10%的增量自动确定高一些的出价。你不必坐的毕恭毕敬；抓耳挠腮不能算作为一个出价（除非你与拍卖商事先就做了安排）。如果没有人超过你的出价，就是说，没有其他的拍卖牌举起，那么拍卖商敲下小木槌以结束拍卖。”

艺术品拍卖：策略型 • 局中人：注册的那些人 • 策略：考虑局中人策略的一个简单方法是认定局中人愿意举牌的最高价。 • 结局：最后一个举牌的拍卖者赢得雷诺依作品（抓耳挠腮者不能得到）。 • 盈利：赢者将付多少钱？

占优策略解 定义.如果不管其他局中人选择什么样的策略，局中人i的策略si的盈利严格地大于他的所有其他策略的盈利，换言之， πi (si, s-i) >πi (si, s-i) 对一切si和s-i成立其中s-i是除了局中人i以外的其他局中人选择的策略向量。那么我们称策略si强优于局中人i的所有其他策略.

考虑局中人1，我们称该局中人的策略b——记作s1b——优于其他策略——s1a，意指针对局中人2的两个策略来说，s1b比s1a更好一些；于是考虑局中人1，我们称该局中人的策略b——记作s1b——优于其他策略——s1a，意指针对局中人2的两个策略来说，s1b比s1a更好一些；于是 π1(s1b , s2a) >π1(s1b, s2a) π1(s1b , s2b) >π1(s1a , s2b) 第一个不等式指出了，如果局中人2采用了他的第一个策略，那么s1b比s1a产生较高一些的盈利；第二个不等式指出了即使局中人2选择他的第二个策略，同样的事实也成立。

定义.如果局中人i的策略si，对于其他局中人的每一个策略来说，至少与他的另一个策略s#i一样地好，而对于其他局中人的某个策略来说，si严格地好于s#i，即定义.如果局中人i的策略si，对于其他局中人的每一个策略来说，至少与他的另一个策略s#i一样地好，而对于其他局中人的某个策略来说，si严格地好于s#i，即则称策略si（弱）优于策略s#i。在这种情况，我们称s#i为劣策略。如果si弱占优于其他任何一个策略si，那么si被称为弱占优策略*。 * 同样的定义应用于强优。如果公式3.1中令si =si#，称策略si强优于策略。于是策略si#称作强劣的。

占优策略解 当每一个局中人都有占优策略时，博弈就有一个占优策略解。一个策略的组合，如果每一个局中人的策略都是占优策略，那称这个策略的组合为占优策略解。例如，囚徒困境中（认罪，认罪）构成了一个占优策略解。左右顶 7, 3 5, 3 底 7, 0 3, -1

案例研究续：拍卖中的占优策略 竞拍人以她对雷诺依作品的真实估价作为她的最高叫价的策略是一个占优策略。不管其他竞拍人怎样叫价，你所能做得最好的办法是，以你认为画所值的价格作为叫价来。从不同的方式讲，如果你认为画值3000美元，你最好的办法是闭上你的眼睛，举着你的拍卖牌直到听到拍卖商宣布的叫价高于3000美元为止为什么它是个占优策略，与其他几个策略作比较。假使你决定“节省你的出价”，并且在2500美元处放下拍卖牌。有两种可能的情况。一种情况是，还有某些人最高叫价超过3000美元，其次，若最高叫价——即赢得雷诺依作品的叫价——是2700美元。现在，你感觉自己象个傻瓜！你失去了一幅估价为3000美元的画，而你用（稍高于2700美元）就可以拥有它。3000美元的最高叫价比起2500美元的叫价来决不会差些——而有时候严格地更好一些。

总结 • 策略型博弈由局中人的名单，每个局中人可使用的策略，和关于任何策略组合（一个策略对应于一个局中人）的盈利来描述。 • 每当博弈中有两个局中人，策略型可以很方便地表达为盈利矩阵。对于更多的局中人情况，符号表示式更方便一些。 • 每一个展开型博弈可以表示成策略型。每一个策略型博弈至少有一种展开型表示。 • 不管其他局中人如何做，占优策略比其他每一个策略给出较高的盈利。 • 当每一个局中人都有占优策略时，博弈存在占优策略解。 • 艺术品拍卖可以建模为策略型博弈，真实地叫价是该博弈的占优策略解。

第三章占优可解性 概念劣与非劣策略累次剔除劣策略案例研究：选举联合国秘书长更正式的定义讨论

概念1. 劣与非劣策略 定义。策略s#i 劣于另一个策略s-i，如果对于其他局中人的每一个策略，后者与s#i至少一样好，而对于其他局中人的某些策略，si严格地好于s#i，以致如果一个策略不劣于任何其他策略，则称它为非劣策略。将劣策略认为“坏”策略，而将非劣策略认为“好”策略

2. 累次剔除劣策略 局中人1 局中人2 左(L) 右(R) 上(U) 1, 1 0, 1 中(M) 0, 2 1, 0 下(D) 0, -1 0, 0 3 .更多例题

例1：伯川德（价格）竞争 假设双寡垄断市场中的两个公司都可以开出三个价格中的任一个——高，中或低。进一步假设不管哪个公司开价较低的话就可以得到整个市场。如果两个公司开价相同，他们将平分市场。这些假设——和任何的价格对——转换成两个公司的收益水平。例如，对于公司1，只有当它的价格不高于公司2的价格，才能有所收益。

假定收益由如下盈利矩阵给出 公司1＼公司2 高中低高6，6 0，10 0，8 中10，0 5，5 0，8 低8，0 8，0 4，4 剔除“高”策略后，留给我们如下盈利矩阵公司1＼公司2 中低中5，5 0，8 低8，0，4，4

例3：投票博弈 投票博弈：采用多数规则，三个投票人挑选两个议案A或B中的一个。通过了第Ⅰ轮的方案再面临与维持原状N（“都不”）进行决赛。三个投票人的真实偏爱如下：投票人1：投票人2：投票人3：

每一个策略有三个分量：策略A（后面跟）AN是指“投A的票而反对B，然后在第Ⅱ轮中投A的票（反对N），或投N的票（反对B）。”至于盈利，让我们使用约定，如果他最愿意的方案通过，则获盈利1，第二喜欢的通过，盈利为0，如果第三喜欢（即，最不喜欢）方案通过，则他的盈利为-1。每一个策略有三个分量：策略A（后面跟）AN是指“投A的票而反对B，然后在第Ⅱ轮中投A的票（反对N），或投N的票（反对B）。”至于盈利，让我们使用约定，如果他最愿意的方案通过，则获盈利1，第二喜欢的通过，盈利为0，如果第三喜欢（即，最不喜欢）方案通过，则他的盈利为-1。在第Ⅱ轮中真实地投票优于非真实性投票；于是，对投票人1来说，AAN优于ANN, ANB，和AAB。类似地，BBN优于BNN, BNB, 和BAB。由同样的逻辑推理，对于局中人2，作为第Ⅱ轮中的投票策略，AB优于NB, NN, 和AN；对局中人３，第Ⅱ轮的投票策略NN优于其他策略。可以看到如果投票人在第Ⅱ轮中真实地投票，那么在那个阶段，A击败N，而B输给N。

剔除了（第Ⅱ轮非真实的）劣策略后，策略型如下 剔除了（第Ⅱ轮非真实的）劣策略后，策略型如下投票人３采用ANN 投票人１＼投票人２ AABBAB AAN 1, 0, 0 1, 0, 0 BAN 1, 0, 0 0, -1, 1 投票人３采用BNN 投票人１＼投票人２AABBAB AAN 1, 0, 0 1, -1, 1 BAN 0, -1, 1 0, -1, 1 现在看到，对局中人１，AAN优于BAN，对局中人２AAB优于BAB，而对局中人３，BNN优于ANN。从而，我们得到了IEDS结局为：投票人１取AAN，投票人２取AAB，投票人３取BNN，A（以２票）赢得第Ⅰ轮，而在决赛中继续击败N。

案例研究：选举联合国秘书长 考虑有两个投票人的选举——假如为美国与非洲。投票人1——美国——首先投票并着手否决三个候选人A（安南），B（加利），和H（布鲁特莱特）中的一个。然后，投票人2——非洲——否决两个余下的候选人中的一位。假如美国和非洲关于三个候选人的中意顺序如下：美国：非洲：

非洲 HAA HHA HAB HHB BAA BHA BAB BHB 美国 A -1, 1 -1, 1 -1, 1 -1, 1 1, -1 1, -1 1, -1 1, -1 B 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0 1, -1 0, 0 H -1, 1 -1, 1 0, 0 0, 0 -1, 1 -1, 1 0, 0 0, 0 在一轮剔除之后，实际上的博弈成为：美国＼非洲HHA A -1, 1 B 0, 0 H -1, 1

占优可解性的更正式的定义 考虑有N个局中人的策略型博弈；局中人i的策略用si来表示；令Si表示局中人i的策略集。在第Ⅰ轮，局中人i的劣策略集表示为Di(I)，换言之， Di(I) = siSi: si是劣策略 理性的局中人不会采用劣策略。就是说，不启用Di(I)中的策略，这对i = 1, 2, …, N均成立。进入第Ⅱ轮，局中人i可以在留给自己的策略集SiDi(I)中作进一步的决定，看看它们当中是否又有哪些现在成为劣策略了。一个策略si# 现在成为劣的，是指：假定每一个其他局中人也都在第Ⅰ轮中剔除了劣策略之后，在SiDi(I)中存在另外一个，它始终至少与si#一样地好，而在某些时候严格地好于si#。

于是， 其中，S-iD-i(I)是除了局中人i以外的所有局中人的非劣策略组合的集合 [1]。记局中人i在第Ⅰ轮中或者在第Ⅱ轮中为劣的所有策略的全体为Di (Ⅱ)。一旦知道了没有一个局中人会采用属于Di (Ⅱ)中的策略，继续剔除任何这样的步骤，现在又成为劣的那些策略。通过这种做法，又建立了一个在前三轮中为劣策略的集合；称这个集合为Di (Ⅲ)。如此等等。 [1]尤其S-i– D-i(I)包含了策略向量（s1, …, si – 1, si + 1, …, sN），其中每一个策略sj都是非劣的。

假如我们最终达到这样一个状态，剩给每一个局中人的只有一个策略，即，假定经过T轮剔除之后，剩下的集合SiDi(T)，恰好包含了一个策略，并且这一事实对i = 1, 2,…, N都成立。在那种情况，这些每个人剩下的单一策略构成的向量称为累次剔除劣策略（IEDS）的结局，该博弈则称为占优可解的。假如这样的情况不发生——如果在某一轮，对某些局中人，尽管仍然留下多个策略，但是没有更多的策略可以被剔除——博弈就称为没有IEDS解。

理性的层次 没有人会采用劣策略是合理的假设。没有局中人会采用，那些一旦其他的劣策略被剔除之后成为了劣策略的策略，这件事看来也是合理的。没有一个局中人会采用只是在15轮剔除劣策略之后才转变成的劣策略，这件事似乎就不太合理。这是因为它假定，每个人都同意在连续（14次）高次数地剔除行动中所有的人都是理性的。如果其他局中人某一次理性的“失误”可能代价昂贵的话，这尤其成问题。考虑下述博弈： 1＼2 左中心右顶4，5 1，6 5，6 中间3，5 2，5 5，4 底2，5 2，0 7，0

剔除的顺序（和非唯一的结局） 当策略是劣的但不是强劣的，剔除的顺序就要紧了。考虑下面的博弈。 1＼2 左右顶0，0 0，1 底1，0 0，0

不存在性。 不是所有的博弈都是占优可解的。例如，在性别争端、扔硬币打赌和布鲁特上校中，不存在劣策略，因而，不存在IEDS结局。在以下博弈中，每一个局中人都有一个劣策略——“差”——可是在剔除那个策略后留下来的是一个只有非劣策略的2×2博弈。 1＼2 左中差顶1，-1 -1，1 0，-2 中-1，1 1，-1 0，-2 差-2，0 -2，0 -2，-2

总结 1.没有一个理性的局中人会采用劣策略，他宁愿采用一个非劣的策略。而且一个理性的局中人不认为他的对手会采用劣策略。 2.劣策略的剔除可以导致一系列连锁反应，逐步缩小一组局中人采取行动的范围。如果存在一个最终唯一预测，则称它为IEDS解。 3.当在IEDS解中包含有许多轮次的剔除时，有理由去关心其预测的合理性。

第 2 章 策略型博弈