对策论
Download
1 / 44

??? ( ? ) - PowerPoint PPT Presentation


  • 59 Views
  • Uploaded on

对策论 ( 一 ). 刘志新 2003.10.21. 主要内容. 1. 基本概念 2. 二人零和有限对策 3. 二人非零和有限对策 4. 二人零和无限对策. 基本概念. 1. 对策论 2. 局中人 : 决策的主体 3. 支付 : 局中人从对策中获得的利益 4. 行动 : 局中人在某时点上的决策变量 5. 战略 : 局中人的行动规则 6. 支付函数. 基本概念. 7. 合作对策 & 非合作对策 8. 两人对策 & 多人对策 9. 零和对策 & 常和对策 & 变和对策 10. 静态对策 & 动态对策 & 重复对策 11. 完全信息对策 & 不完全信息对策.

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '??? ( ? )' - iorwen


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
2003 10 21 1345176

对策论(一)

刘志新

2003.10.21


2003 10 21 1345176
主要内容

  • 1.基本概念

  • 2.二人零和有限对策

  • 3.二人非零和有限对策

  • 4.二人零和无限对策


2003 10 21 1345176
基本概念

  • 1.对策论

  • 2.局中人:决策的主体

  • 3.支付:局中人从对策中获得的利益

  • 4.行动:局中人在某时点上的决策变量

  • 5.战略:局中人的行动规则

  • 6.支付函数


2003 10 21 1345176
基本概念

  • 7.合作对策&非合作对策

  • 8.两人对策&多人对策

  • 9.零和对策&常和对策&变和对策

  • 10.静态对策&动态对策&重复对策

  • 11.完全信息对策&不完全信息对策


2003 10 21 1345176
一个例子

  • 囚徒困境


2003 10 21 1345176
研究对策论常用的两种模型

  • (一)展开型

  • (二)正规型



2003 10 21 1345176
展开型对策

  • 定义1:有n个局中人的对策树是指具有以下性质的三元组 ,使得:

    为树,且

    为一映射, 为局中人的集合

    为一映射


2003 10 21 1345176
展开型对策

  • 定义2:设 为对策树,称

    为由 产生的n人对策,对策 也称为展开型对策.

  • 定义3:在对策 中,设有策略组

    使对于任何的 及 均有: ,则称

    为对策 的一个平衡点.

    .


2003 10 21 1345176
展开型对策

  • 定理:设 为对策树,则 有一个平衡点


2003 10 21 1345176
正规型对策

  • 定义1:给定三元组 其中 均为集合,而 是定义在

    上的实值函数,则称 为一个对策.

  • 定义2:若有策略 ,使

    称 为甲的保守策略..


2003 10 21 1345176
正规型对策

  • 定义3:若有 满足:

    则称策略对 为对策的非合作平衡解.

  • 定义4:对于对策对 ,若不存在策略对 ,同时有 ,

    则称为对策的Pareto最优


2003 10 21 1345176
二人零和有限对策

  • 策略的表示:(矩阵)


2003 10 21 1345176
二人零和有限对策

  • 保守解策略是如下的策略 ,

  • 一般的


2003 10 21 1345176
二人零和有限对策

  • 我们希望

  • 定义:在二人零和有限对策 中,若甲的支付函数为 ,设有值 则称对策 有鞍点,公共值 称为对策的值,相应的策略对 为对策的鞍点.


2003 10 21 1345176
二人零和有限对策

  • 有些时候鞍点是不存在的.例:


2003 10 21 1345176
混合策略

  • 引入混合策略

  • 考虑期望收益


2003 10 21 1345176

  • 定义:对于 , 若有策略对 满足 ,

    其中 ,则称 为 的鞍点.


2003 10 21 1345176
混合对策的存在性定理

  • 定理:设 都是紧的,且 上连续,对于 ,有

    (方法1:用凸集分离定理

    方法2:用Kakutani不动点原理

    方法3: )


2003 10 21 1345176
优策略

  • 定义:对于值为 而支付函数为 的对策,凡使 的策略 称为甲的优策略.而使 的策略 称为乙的优策略.


2003 10 21 1345176
优策略的性质

  • 性质1:每个局中人的优策略集是一个凸集.

  • 性质2:若 是乙的优策略,并设 则对甲的任何优策略 ,必有:

    其中 表示甲取策略 ,乙取策略 时的支付.


2003 10 21 1345176
优策略的性质

  • 性质3:设 为对策值, 为甲的任何优策略,有若对某个 ,有 则对乙的任何优策略 必有

  • 性质4:设 为对策值,若对乙的任何优策略 有 则甲必有一个优策略 ,使得:


2003 10 21 1345176
优策略的性质

  • 性质5:若矩阵 可写作分块矩阵

    若 中的每一列严格超出 中列的凸组合,又设 中的每一行严格的被 中行的某个凸组合超出,则 , , 均可删去而不影响甲乙的优策略集.


2003 10 21 1345176
优策略的计算

  • 定理:设对策值为 , 支付矩阵为 的对策

    其优策略 为端点优策略的充要条件是存在 的子方阵 ,使得:

    式中 表示 的伴随矩阵.


2003 10 21 1345176
优策略的计算

  • 例:

    可取 可得:


2003 10 21 1345176
二人一般和有限对策

  • 双矩阵对策:

  • 定义:在对策 中,若有策略对 ,使得:

    则称 为 的一个非合作平衡点


2003 10 21 1345176
存在性定理

  • 定理:对每个双矩阵对策 至少存在一个非合作平衡点.

    对 作改进:


2003 10 21 1345176
判断平衡点

为平衡点


Lemke howson
平衡点的Lemke_Howson算法

  • 定理:当对策 为非退化时,对策肯定存在平衡点.

    (矩阵A非退化是指: 每个方

    子阵都是非奇异的(除去最后的零矩阵))


Lemke howson1
平衡点的Lemke_Howson算法

  • 例:

    选取


2003 10 21 1345176
谈判问题

  • 可行集

  • 谈判的基点(各自的保守收益)

  • 谈判的结果找 ,使得双方都满意即存在映射 ,使得 .


2003 10 21 1345176
Nash的谈判公理体系

  • 公理1(个体合理性):

  • 公理2(可行性):

  • 公理3(Pareto最优性)若 且

    则 .

  • 公理4(无关方案的独立性):若 ,

    且 ,则 .


2003 10 21 1345176
Nash的谈判公理体系

  • 公理5(线性变换的无关性)设T是由S经如下线性变换

    而得到的,如果 则必有

    其中 为正常数, 为常数.

  • 公理6(对称性) :若S是对称的,即若

    有 ,且若 ,则有 .


2003 10 21 1345176
谈判定理

  • 定理:对于所有的谈判问题 ,存在唯一的满足以上公理的 .


2003 10 21 1345176
恐吓”问题

  • 考虑以下的双矩阵对策:

  • 都有独立的恐吓策略,谈判的基点:


2003 10 21 1345176
二人零和无限对策

  • 问题的描述:

  • 定义:在二人零和无限对策中,若存在

    使得对所有 都成立 ,则称

    ( ) 为鞍点.

    在无限对策中,鞍点不一定存在.


2003 10 21 1345176
鞍点

  • 定义:在对策 ,点 称为

    鞍点,若下式对任意的 都成立,


2003 10 21 1345176
无限对策中的混合扩张

  • 定义: :集合X的子集的 代数

    y:集合Y的子集的 代数

    : ,y上所有的概率测度组成的集合

    称 为对策 的混合扩张,

    其中


2003 10 21 1345176
混合扩张的平衡点

  • 定义: 为二人零和无限对对策,

    为对策的混合扩张,若存在

    使得对所有的 都有:

    称 为对策的混合扩张的平衡点.


2003 10 21 1345176
具连续支付函数的对策

  • 定理:二人零和无限对策 中,X,Y为紧集,H为一连续函数,则存在混合策略对 使得

    对任意的 都成立.此时有


2003 10 21 1345176
凸策略与凹策略

  • 定义:设X,Y为紧集,并且Y为凸集,支付函数 是连续的,且对任意固定的 ,H(x,y)关于y是凸的,则对策

    称为凸对策.

  • 当X为凸集,支付函数H是连续的,且对任意固定的 ,H(x,y)关于x是凹的,则称对策为凹对策


2003 10 21 1345176
凸策略与凹策略

  • 定理:设对策 为凸对策,则对局中人来说都存在一个最优存策略,且策略的值为 .