高级微观经济学
This presentation is the property of its rightful owner.
Sponsored Links
1 / 94

高级微观经济学 PowerPoint PPT Presentation


  • 86 Views
  • Uploaded on
  • Presentation posted in: General

高级微观经济学. 东北大学工商管理学院 城市管理与区域经济研究所. 第三章 完全信息动态博弈. 主要内容: 1 、完全信息动态博弈的扩展式表述 2 、扩展式博弈中的纳什均衡 3 、逆向归纳法与子博弈完美纳什均衡 4 、重复博弈与无名氏定理 5 、应用举例. 第三章 完全信息动态博弈. 第三章 完全信息动态博弈. 1 、完全信息动态博弈的扩展式表述 房地产开发博弈: 房地产开发商 A 和 B 考虑是否要开发一栋新的写字楼,如果决定开发必须投入 1 亿资金;

Download Presentation

高级微观经济学

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


3593671

高级微观经济学

东北大学工商管理学院

城市管理与区域经济研究所


3593671

第三章 完全信息动态博弈

主要内容:

  • 1、完全信息动态博弈的扩展式表述

  • 2、扩展式博弈中的纳什均衡

  • 3、逆向归纳法与子博弈完美纳什均衡

  • 4、重复博弈与无名氏定理

  • 5、应用举例


3593671

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

房地产开发博弈:

  • 房地产开发商A和B考虑是否要开发一栋新的写字楼,如果决定开发必须投入1亿资金;

  • 假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价0.7亿;

  • 如果市场上只有一栋楼:需求大时,可卖1.8亿,需求小时,可卖1.1亿


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

行动顺序:

  • (1)A开发商首先决定开发还是不开发;

  • (2)A决策后,自然选择市场需求的大小;

  • (3)B在观测到A所选择的行动和市场需求 后,再决定开发还是不开发。


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

  • 开发商博弈的扩展式表述

  • 博弈的扩展式表述中包括:

    1 参与人集合;2 参与人的行动顺序;3 参与人的行动空间;4 参与人的信息集;5 参与人支付函数;6 自然选择的概率分布等。


3593671

参与人(A,B,N)

结,初始结

行动

结,决策结

信息集

结,终点结

支付

第三章 完全信息动态博弈

A

参与人集合

参与人行动顺序

参与人的行动空间

参与人的信息集

参与人的支付函数

外生事件的概率分布

不开发

开发

N

N

1/2

1/2

1/2

1/2

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(-3,-3)

(1,0)

(0,8)

(0,0)

(0,1)


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

  • 结:包括决策结和终点结两类;决策结是参与人行动的始点;终点结是决策人行动的终点。

    结满足传递性和非对称性

  • x之前的所有结的集合,称为x的前列集

    P(x),x之后的所有结的集合称为x的后续集T(x)。


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

  • 枝:枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择;

  • 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:

    1、每个决策结都是同一个参与人的决策结;

    2、该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。


3593671

A

不开发

开发

N

N

1/2

1/2

1/2

1/2

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(-3,-3)

(1,0)

(0,8)

(0,0)

(0,1)

第三章 完全信息动态博弈

假定:B在决策时不知道自然的选择;知道A的选择

B的信息集由4个变为2个

另外一种情况


3593671

A

不开发

开发

N

N

1/2

1/2

1/2

1/2

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(-3,-3)

(1,0)

(0,8)

(0,0)

(0,1)

第三章 完全信息动态博弈

B知道自然的选择;

但不知A的选择

或A、B同时决策


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

信息集的三个假设

  • 1、任何一个决策结不能是属于同一信息集的其他决策结的前列结或者后续结;

  • 2、同一信息集中的所有结都是同一参与人的决策结;

  • 3、同一参与人在属于同一信息集的每个决策结的行动空间应该是相同的。

博弈结构是参与人的共同知识,每个参与人都可以看到博弈树。


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

完美信息动态博弈:

Perfect information

  • 完美信息博弈意味着博弈中没有任何两个参与人同时行动,并且所有后行动者能确切地知道前行动者的选择,所有人观测到自然的选择。

  • 博弈树中,完美信息意味着没有任何两个决策结是用虚线连起来的。或者说博弈树中所有信息集都是单结的。


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

  • 自然总是假定是单结的,因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。

  • 不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。


3593671

N

N

A

B

小(1/2)

大(1/2)

A

A

不开发

开发

开发

不开发

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(0,8)

(0,0)

(-3,-3)

(1,0)

(0,1)

第三章 完全信息动态博弈


3593671

A

A

N

B

不开发

开发

N

N

1/2

1/2

1/2

1/2

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(-3,-3)

(1,0)

(0,8)

(0,0)

(0,1)

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

思考:

  • 在房地产开发博弈中,如果B知道N的选择,但不知道A的选择,而A既不知道B也不知道N的选择。如何用扩展式表述该博弈?


3593671

A

A

N

B

不开发

开发

N

N

1/2

1/2

1/2

1/2

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(-3,-3)

(1,0)

(0,8)

(0,0)

(0,1)

第三章 完全信息动态博弈


3593671

N

N

A

B

小(1/2)

大(1/2)

A

A

不开发

开发

开发

不开发

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(0,8)

(0,0)

(-3,-3)

(1,0)

(0,1)

第三章 完全信息动态博弈


3593671

N

N

B

A

小(1/2)

大(1/2)

B

B

不开发

开发

开发

不开发

A

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(4,4)

(8,0)

(0,0)

(0,8)

(0,0)

(-3,-3)

(1,0)

(0,1)

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

用扩展式表示完全信息静态博弈


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

用扩展式表示囚徒困境


3593671

第三章 完全信息动态博弈

1、完全信息动态博弈的扩展式表述

完美回忆(Perfect recall):

  • 所有参与人都知道自己以前的选择。

    1、同一行动

    2、同一信息集


3593671

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

战略概念的变化

  • 战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。

  • 在静态博弈中,战略和行动是基本相同的。

    作为一种行动规则,战略必须是完备的。


3593671

A

不开发

开发

B

B

不开发

不开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

战略的概念

A有一个信息集

  • 两个可选择的行动,

  • 战略空间为(开发,不开发)

    B有两个信息集,

  • 四个可选择的行动,

  • B有四个纯战略:


3593671

A

不开发

开发

B

B

不开发

不开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

开发策略:

  • 不论A开发不开发,我开发;

    追随策略:

  • A开发我开发,A不开发我不开发;

    对抗策略:

  • A开发我不开发,A不开发我开发;

    不开发策略

  • 不论A开发不开发我不开发,


3593671

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

简写为:

  • (开发,开发),(开发,不开发)

    (不开发,开发),(不开发,不开发)

  • 括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。


3593671

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

上述博弈的战略式表述为:


3593671

第三章 完全信息动态博弈

2、扩展式表述博弈中的纳什均衡

  • 存在三个纯战略纳什均衡:

    (不开发,﹛开发,开发﹜)

    (开发, ﹛不开发,开发﹜ )

    (开发, ﹛不开发,不开发﹜ )

  • 两个均衡结果:

    (开发,不开发) (不开发,开发)

  • 注意:均衡不同于均衡结果


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理?

  • 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于先行动者的选择,先行动者在选择时不可能不考虑自己的行动对后行动者的影响。

  • 子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。


3593671

A

不开发

开发

B

B

不开发

不开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 哪一个均衡更合理

    (不开发,﹛开发,开发﹜)

    (开发,﹛不开发,不开发﹜)

    (开发,﹛不开发,开发﹜ )

子博弈精炼纳什均衡


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 泽尔腾(Selten,1965)引入“子博弈精练纳什均衡”(sub-game perfect Nash equilibrium)的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析。

  • (1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • (2)子博弈的信息集和支付向量都直接继承自原博弈,即当x’和x’’在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。

  • 子博弈不能切割原博弈的信息集。

  • 习惯上,任何博弈的本身称为自身的一个子博弈


3593671

A

不开发

开发

B

B

B

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

找出该扩展式博弈的子博弈


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

找出该扩展式博弈的子博弈


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

练习:


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 定义:扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果:

    (1)它是原博弈的纳什均衡;

    (2)它在每一个子博弈上给出纳什均衡。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。

  • 纳什均衡只要求均衡战略在均衡路径的决策结上是最优的。

  • 而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。


3593671

A

不开发

开发

B

B

B

子博弈1

子博弈2

B

不开发

不开发

不开发

不开发

开发

开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

(不开发,﹛开发,开发﹜)

(开发,﹛不开发,不开发﹜)

(开发,﹛不开发,开发﹜ )

只满足子博弈2

只满足子博弈1

满足子博弈1、2


3593671

第二章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。

  • 因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

用逆向归纳法求解子搏弈精练纳什均衡

  • 给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡;

  • 回到倒数第二个决策结,找倒数第二个决策者的最优选择,该最优选择与在第一步找到的最优选择构成从倒数第二个决策结开始的子博弈的一个纳什均衡。

  • 如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

用逆向归纳法求解子搏弈精练纳什均衡

  • 逆向归纳法是求解有限完美信息博弈的最简便方法。因为有限完美信息博弈的每一个决策结都是一个单独的信息集,都开始一个子博弈。


3593671

A

不开发

开发

B

B

不开发

不开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

例子

在第二阶段 B最优选择是

﹛不开发,开发﹜;

在第一阶段A最优选择是

开发;

子博弈精炼纳什均衡:

(开发,﹛不开发,开发﹜ )


3593671

第三章 完全信息动态博弈

用逆向归纳法求子解搏弈精练纳什均衡

练习:


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 逆向归纳法是求解有限完美信息博弈的过程,实质上是重复剔除劣战略过程在博弈扩展式上的应用。即从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后剩下来的战略构成子博弈精炼纳什均衡。

  • 要求“所有参与人是理性的”是共同知识。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。

  • 有些非完美信息博弈也可以用逆向归纳法的逻辑求解。


3593671

第三章 完全信息动态博弈

有唯一的混合战略纳什均衡


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

承诺行动与子博弈精练纳什均衡

  • 有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变。


3593671

第二章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

承诺行动与子博弈精练纳什均衡

  • 这些改变博弈结果而采取的措施称为承诺行动(commitment)。

  • 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟)。

  • 不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能。


3593671

A

不开发

开发

B

B

不开发

不开发

开发

开发

(-3,-3)

(1,0)

(0,1)

(0, 0)

第二章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

承诺行动与子博弈精练纳什均衡

如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金4千万,这个合同就是承诺行动.

子博弈精炼纳什均衡

(不开发,﹛开发,开发﹜)

(-3,-3) (1,-4) (0,1) (0,-4)


3593671

第三章 完全信息动态博弈

要挟诉讼

C指控成本

P原告律师成本

rx 胜诉收益

d 被告辩护成本

rx < P 隐含假设

原告:先付律师费


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

逆向归纳法存在的问题

  • 逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此,在有多个参与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。


3593671

2

i

n

1

A

A

A

A

(2,…,2)

D

D

D

D

如果n很小,逆向归纳法的结果

(1,…,1)

(1/2,…,1/2)

(1/i,…,1/i)

(1/n,…,1/n)

多个参与人的情况

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡


3593671

2

i

n

1

A

A

A

A

(2,…,2)

D

D

D

D

如果n很大,逆向归纳法的结果

(1,…,1)

(1/2,…,1/2)

(1/i,…,1/i)

(1/n,…,1/n)

多个参与人的情况

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

逆向归纳法与存在问题

  • 对参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p<1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小;

  • 另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。

  • 这个链越长,共同知识的要求就越难满足。


3593671

2

2

1

2

2

1

1

1

A

A

A

A

A

A

A

A

(100,100)

D

D

D

D

D

D

D

D

(98,101)

(2,2)

(1,4)

(1,1)

(97,100)

(99,99)

(98,98)

(0,3)

逆向归纳法的结果:一开始,就结束!

另一种蜈蚣博弈

第三章 完全信息动态博弈

有两个参与人1、2,若第一轮1选择D,博弈结束,1、2都得n,若2决策结束,1得n-1,B得n+2,共99次,每个参与人有99个决策结。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

逆向归纳法存在的问题

  • 但是,当你没有预料的事情发生时,比如参与人选择了A,你该如何选择?你的选择应该依赖于应该依赖于你的参与人未来的行为。特别是,你如何修正你队参与人理性程度的评价。

  • 逆向归纳法理论没有为当某些未预料到的事情出现时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 弗德伯格等人将偏离行为解释为是由于有关“支付函数”信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。

  • 他们认为,任何一个有关博弈行为的理论应该是“完备的”,即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现时,参与人对随后的博弈行为的条件预测总是很好定义的。


3593671

第三章 完全信息动态博弈

3、逆向归纳法与子博弈完美纳什均衡

  • 弗德伯格、泽尔腾将偏离行为解释为参与人在博弈过程中犯的错误,或者说均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能,如果参与人在每个信息集上犯错误的概率是独立的(因而参与人不会犯系统性的错误),那么,不论过去的行为与逆向归纳法的预测如何不同,参与人应该继续使用逆向归纳法预测从现在开始子博弈的行为。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 一次动态博弈也称为“序贯博弈”(Sequential games)。同样结构的子博弈只出现一次。

  • 重复博弈(repeated games):指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”(stage game)。如多次囚徒困境。

  • 重复博弈可以分为:有限次重复博弈、无限次重复博弈


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

重复博弈的特征:

  • 1、阶段博弈之间没有“物质上”的联系,即前一阶段的博弈不改变后一阶段的结构 ;

  • 2、所有参与人都观测到博弈过去的历史;

  • 3、参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均均值。贴现因子:下一期的一单位支付在这一期的价值。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性。

  • 重复博弈可能带来一些“额外”的均衡结果。参与人在重复博弈中的战略空间远远大于和复杂于每一阶段的战略空间。

  • 博弈重复的次数的重要性来源于参与人在短期利益和长远利益之间的权衡。

  • 信息的完备性:当一个参与人的支付函数不为其他参与人知道时,该参与人可能有积极性建立一个“好”的声誉以换取长远利益。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

有限次重复博弈

  • 定义 对给定的阶段博弈G,令G(T)表示G重复进行T次的有限重复博弈,并且在下一次博弈开始前,所有以前博弈的进行都可被观测到。G(T)的收益为T次阶段博弈收益的简单相加。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

有限次重复博弈

两阶段重复博弈

如何用博弈扩展式表述?


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

有限次重复博弈


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

有限次重复博弈

  • 上述例子中,总是坦白是该博弈的唯一的子博弈精炼纳什均衡。

  • 定理 如果阶段博弈G,有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈精炼纳什均衡:即阶段博弈G的纳什均衡在每一阶段重复进行。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

两个纯战略纳什均衡(M,L)(U,M)

混合战略纳什均衡

(3/7U,4/7M)

(3/7L,4/7M)


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 如果上述博弈进行两次,则下列战略组合是一个子博弈精炼纳什均衡。

  • 第一阶段选择(D,R),如果第一阶段是(D,R),在第二阶段选(M,L);如果第一阶段不是(D,R),第二阶段选择混合战略

    ((3/7U,4/7M),(3/7L,4/7M))

    约束条件r>7/9


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 第二阶段的战略组合均是纳什均衡,看第一阶段情况:

  • 给定2选择R,1选择U而不选择D,则1增加1单位支付,但此举会导致第二阶段支付由4变为12/7;

  • 如果有1<(4-12/7)r,即r>7/16,则1没有积极性偏离D;

  • 同理,如果有1<(3-12/7)r,即r>7/9则2没有积极性偏离R


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

考虑如下问题

  • 该博弈中,如下战略组合是否为子博弈精炼纳什均衡

  • 第一阶段选择(D,R),如果第一阶段是(D,R),在第二阶段选(U,M);如果第一阶段不是(D,R),第二阶段选择混合战略

    ((3/7U,4/7M),(3/7L,4/7M))

    约束条件r>7/9


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 当博弈有多个纳什均衡时,参与人可以使用不同的纳什均衡战略惩罚第一阶段的不合作行为或者奖励第一阶段的合作行为,这一点在阶段博弈中只有唯一纳什均衡时是办不到的。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 囚徒困境博弈重复无穷次,结果如何?

  • 证明得出,如果参与人有足够的耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果)。

  • 触发战略(trigger strategies)

    (1)开始选择抵赖;

    (2)选择抵赖一直到有一方选择了坦白,然后永远选择坦白。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

无名氏定理


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 简单地说,无名氏定理意思是,在无限次重复博弈中,如果参与人有足够的耐心(贴现因子足够接近与1),任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼纳什均衡得到。


3593671

第三章 完全信息动态博弈

4、重复博弈与无名氏定理

  • 无限次重复博弈使其走出了囚徒困境,背后的原因是:如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,参与人有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。


3593671

第三章 完全信息动态博弈

故事

  • 一个男孩被视为傻瓜,因为每当别人拿一枚1角硬币和5分硬币让他选的时候,他总是选5分的,有一个人觉得奇怪,就问他:“为什么你不拿1角钱的?”,男孩小声回答:“假若我拿了1角钱的硬币,下次他们就不会拿钱让我选了。”


3593671

第三章 完全信息动态博弈

5、应用举例

斯坦克尔伯的寡头竞争模型

企业1

企业2

参与人: 企业1、企业2;

行动顺序:企业1先选择产量q1,企业2观测到q1,然后选

择自己的产量q2。

支付: 利润,利润是两个企业产量的函数


3593671

第三章 完全信息动态博弈

qi :第 i 个企业的产量

C:代表单位不变成本

假定逆需求函数为:

第i个企业的利润函数为:


3593671

最优化一阶条件意味着:

第三章 完全信息动态博弈

用逆向归纳法求解,首先考虑给定q1的情况下,企业2的最优选择。企业2的问题是:

因为企业1预测到企业2将根据S2(q1)来选择q2,企业1在第1阶段的问题是:


3593671

第三章 完全信息动态博弈


3593671

第三章 完全信息动态博弈

比较分析

  • Stackelberg的均衡总产量大于古诺均衡总产量,企业1的Stackelberg的均衡产量大于古诺均衡产量,企业2的Stackelberg均衡产量小于古诺均衡产量。同样,企业1在Stackelberg博弈中的利润大于在古诺博弈中的利润,企业2的利润却有所下降,这就是所谓的“先动优势”。

  • 拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值:企业1之所以获得Stackelberg利润而不是古诺利润,是因为它的产品一旦生产出来就变成了一种积淀成本,无法改变,从而使企业2不得不承认它的威胁是可置信的。


3593671

第三章 完全信息动态博弈

而假如企业1只是宣布了它将生产(1/2)(a-c),企业2是

不会相信她的威胁的。


3593671

第三章 完全信息动态博弈

5、应用举例

讨价还价模型

  • 参与人1和参与人2关于分配一美元进行谈判。他们轮流提出方案:参与人1首先提出方案,参与人2可以接受或者拒绝;如果参与人2接受,则博弈结束,按照参与人1的方案进行分配;如果参与人2拒绝则由他提出方案,参与人1可以接受或者拒绝;如此一直进行下去。

  • 如何用博弈树表示?

  • 该博弈的子博弈精炼纳什均衡?


3593671

第三章 完全信息动态博弈

5、应用举例

贴现因子:将未来的收益转化为现值

  • 贴现因子反映了货币的时间价值。在一个阶段开始时取得的一美元可以存入银行,赚取利息,比如说每期利息为r,则在下一阶段开始时的价值就成为1+r美元。同样,下一阶段开始时要得到的一美元,现在的价值只有1/(1+r)美元。


3593671

第三章 完全信息动态博弈

讨价还价模型

  • t=1,局中人1选择 --局中人1欲占有的利益份额;局中人2如接受 ,则产生分配结果 ;否则

  • t=2,局中人2选择 --局中人1分得的利益份额。如果局中人1同意,则产生分配结果 ,此处

    为局中人i的时间贴现因子。否则

  • t=3,局中人1提出 ,局中人2如同意,则分配结果为 ,否则

  • t=4,局中人2提出 ,局中人1如接受,分配结果为

    ,否则

    ……


3593671

第三章 完全信息动态博弈

讨价还价模型

  • 首先假定博弈只进行两个时期,在T=2,参与人2出价,如果提出,参与人1会接受,因为参与人1不再有出价的机会(一般地,如果参与人在接受和拒绝之间无差异时,我们假定他选择接受)。因为参与人2在T=2时得到1个单位等价于在t=1时的单位,如果参与人1在t=1时出价,参与人2会接受;因为参与人1没有必要给参与人2多于他会接受的最低份额,子博弈精炼均衡结果是参与人1得到,参与人2得到。


3593671

第三章 完全信息动态博弈

讨价还价模型

  • 现在假定T=3,在最后阶段,参与人1出价,他可以得到的最大份额是 。因为参与人1在T=3时1单位等价于t=2时的,如果参与人2在t=2出价,参与人1将会接受;因为参与人2在t=2时的单位等价于t=1时的单位,如果参与人1在t=1时出价,参与人2将会接受。因此,子博弈精炼均衡结果是。


3593671

第三章 完全信息动态博弈

讨价还价模型

  • 现在假定T=4,参与人2最后出价,他可以T=2时得到的最大份额是 。参与人1在T=1时将出价

    子博弈精炼纳什均衡结果是


3593671

第三章 完全信息动态博弈

讨价还价模型

  • 定理(Rubinstein,1982):在无限期轮流出价博弈中,唯一的子博弈精炼纳什均衡结果是:


3593671

第三章 完全信息动态博弈

5、应用举例

参考书中如下例子:

  • 2.4-2 宏观经济政策的动态一致性

  • 2.4-3 中国过去的财政包干制度

  • 2.4-3 工会与雇主之间的博弈


3593671

Thank You !


  • Login