第 11 章统计决策

第11章统计决策 • 11.1 统计决策的基本概念 • 11.2 完全不确定型决策 • 11.3 一般风险型决策 • 11.4 贝叶斯决策

学习目标 • 1. 统计决策的基本概念、基本工具和基本步骤； • 2. 完全不确定决策的基本准则及其使用场合； • 3. 风险型决策的基本准则及其应用； • 4. 贝叶斯决策的概念； • 5. 后验概率计算与后验分析； • 6. 完全信息价值与补充信息价值的概念及其应用。

11.1 统计决策的基本概念 • 一、什么是统计决策 • 二、统计决策的基本步骤 • 三、收益矩阵表

什么是统计决策 • 狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。

统计决策的基本步骤 • （一）确定决策目标 • 决策目标是在一定条件制约下，决策者希望达到的结果。反映决策目标的变量，称为目标变量。 • （二）拟定备选方案 • 备选方案是决策者可以调控的因素，备选方案中所调控的变量称为行动变量。所有备选方案的集合称为行动空间。 • （三）列出自然状态 • 自然状态是指实施行动方案时，可能面临的客观条件。所有可能出现的状态的集合称为状态空间，而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。 • （四）选择“最佳”或“满意”的方案 • （五）实施方案

表11-1 收益矩阵表 收益矩阵表

收益矩阵的元素qij反映在状态θj下，采用行动方案ai得到的收益值。这里所说的收益是广义收益指标。收益是行动方案和自然状态的函数，可用下式表示：收益矩阵的元素qij反映在状态θj下，采用行动方案ai得到的收益值。这里所说的收益是广义收益指标。收益是行动方案和自然状态的函数，可用下式表示： • qij＝ Q (ai, θj) i =1,2,…,m; j=1,2,…n

11.2 完全不确定型决策 • 一、完全不确定型决策的准则 • 二、各种准则的特点和适用场合

完全不确定型决策的准则 • （一）最大的最大收益值准则 • 在决策时，先选出各种状态下每个方案的最大收益值，然后再从中选择最大者，并以其相对应的方案作为所要选择的方案。 • （二）最大的最小收益值准则 • 在决策时，先选出各种状态下每个方案的最小收益值，然后再从中选择最大者，并以其相对应的方案作为所要选择的方案。

（三）最小的最大后悔值准则 • 后悔值是由于决策失误而造成的最大可能的收益值与实际收益值之差。方案ai在状态θj下的后悔值，可按下式计算： • rij＝ max Q (ai,θj) －qij • 式中，max Q (ai,θj)是在第j 种状态下，正确决策有可能得到的最大收益，qij是收益矩阵的元素。显而易见，rij≥0 。最小的最大后悔值准则主张：应在求出后悔矩阵的基础上，先选出各种状态下每个方案的最大后悔值，然后再从中选择最小者，并以其相对应的方案作为所要选择的方案。

（四）折衷准则 • 该准则主张根据经验和判断确定一个乐观系数α（0≤α≤1），以α和1－α分别作为最大收益值和最小收益值的权数，计算各方案的期望收益值E(Q(ai)) • E(Q(ai)) =α{ qij} +(1－α) {qij} • 并以期望收益值最大的方案作为所要选择的方案。

（五）等可能性准则 • 该准则假定各种状态可能出现的概率相同,在此基础上求各方案收益的期望值，并以期望收益值最大的方案作为所要选择的方案。

各种准则的特点和适用场合 • 最大的最大收益值准则一般只有在客观情况确实很乐观，或者即使决策失误，也完全可以承受损失的场合才采用。 • 最大的最小收益值准适用于对未来的状态非常没有把握，或者难以承受决策失误损失的场合。 • 最小的最大后悔值准则适用于不愿放过较大的获利机会，同时又对可能出现的损失有一定承受力的场合。 • 折衷准则和等可能性准则都是以各种方案的收益的期望值作为选择方案的标准。折衷准则事实上是假定未来可能发生的状态只有两种：即最理想状态和最不理想状态。前者发生的概率是α，后者发生的概率是（1－α）。当α＝1时，该准则等价于乐观准则，而当α＝0时，该准则等价于悲观准则。

11.3 一般风险型决策 • 一、然状态概率分布的估计 • 二、风险型决策的准则 • 三、利用决策树进行风险型决策

自然状态概率分布的估计 • 客观概率是一般意义上的概率，通常是由自然状态的历史资料推算或按照随机实验的结果计算出来的。 • 主观概率是决策者基于自身的学识和经验作出的对某一事件发生可能性的主观判断。

风险型决策的准则 • （一）期望值准则 • 以各方案收益的期望值的大小为依据，来选择合适的方案。 • E(Q(ai))＝ (i =1,2,---,m) • 式中，E(Q(ai))是i方案的收益的期望值，是i方案在出现j状态时的收益值；是j状态出现的概率。

（二）变异系数准则 • 在期望值达到一定数额的前提下，以变异系数较低的方案作为所要选择的方案。 • 方差Var(ai)和变异系数V的计算公式如下： • Var(ai) =E(Q(ai))＝ (i =1,2,…,m) • Vi＝ (i =1,2,…,m)

（三）最大可能准则 • 在最可能状态下，可实现最大收益值的方案为最佳方案。 • 最大可能准则是将风险条件下的决策问题，简化为确定条件下的决策问题。只有当最可能状态的发生概率明显大于其他状态时，应用该准则才能取得较好的效果。 • （四）满意准则 • 利用这一准则进行决策，首先要给出一个满意水平。然后，将各种方案在不同状态下的收益值与目标值相比较，并以收益值不低于目标值的累积概率为最大的方案作为所要选择的方案。利用该准则的决策结果，与满意水平的高低有很大关系。

利用决策树进行风险型决策 • 决策树是是一种将决策问题模型化的树形图。决策树由决策点、方案枝、机会点、概率枝和结果点组成。利用决策树对方案进行比较和选择，一般采用逆向分析法，即从树形结构的末端的条件结果开始，从后向前逐步分析。 • 决策树比较适用于求解复杂的多阶段决策问题。

图11-2 例11-9的决策树图

11.4 贝叶斯决策 • 一、什么是贝叶斯决策 • 二、贝叶斯公式与后验概率的估计 • 三、先验分析与后验分析 • 四、完全信息价值与补充信息价值 • 五、后验预分析

什么是贝叶斯决策 • 贝叶斯决策，是利用补充信息根据贝叶斯公式来估计后验概率，并在此基础上对备选方案进行评价的一种决策方法。

贝叶斯公式与后验概率的估计 • 设某种状态θj的先验概率为P(θj)，通过调查获得的补充信息为ek ,θj给定时ek的条件概率为，则在给定信息ek的条件下,θj的条件概率即后验概率可用以下公式计算

先验分析与后验分析 • 先验分析是利用先验概率进行决策，而后验分析是利用后验概率作为选择与判断合适方案的依据。一般来说，只要补充信息是准确的，则后验分析的结论更为可靠。

完全信息价值与补充信息价值 • 完全信息，是指在对某一问题进行决策时，对于所有可能出现的状态都可以提供完全确切的情报。完全信息的价值，可以由掌握完全信息前后，所采取的不同行动方案的收益值的差额来表示。用收益值差额的期望值来综合反映完全信息的价值。

其计算公式如下： • EVPI ＝ E[ Q(ai,θj)- Q(a*,θj)] • ＝ [ Q(ai,θj)- Q(a*,θj)(11.16) • 上式中，EVPI是完全信息价值的期望值，Q(ai,θj)表示各方案在状态θj下的最大收益值，Q(a*,θj)表示先验分析中的最佳方案在状态θj下的收益值。EVPI越大表明通过收集补充信息使决策效益提高的余地越大。同时，它也代表了为取得该项情报可付出的代价的上限。

补充信息ek的价值VAI的计算公式如下： • VAI（ek）= 先验EVPI- 后验EVPI（ek）(11.17) • 上式中，先验EVPI是根据状态的先验概率计算的完全信息价值的期望值，后验 EVPI(ek)是在了解补充信息ek后，利用根据该信息修正的后验概率计算的完全信息价值的期望值。

VAI(ek)的取值与ek有关。为了综合反映补充信息的价值，还需要计算补充信息价值的期望值 VAI(ek)的取值与ek有关。为了综合反映补充信息的价值，还需要计算补充信息价值的期望值 • EVAI = E[VAI(ek)] • = = E[VAI(ek)] • =

上式中，P(ek)是ek出现的概率。 • P(ek)＝； (11.19) • EVAI是判断收集补充信息是否有利的标准。在收集补充信息之前，应将EVAI与收集补充信息的费用加以比较，只有当收集补充信息的费用小于EVAI时，平均来看，收集补充信息才有利可图。

后验预分析 • 在正式进行补充信息的调查之前，需要先估算完全信息价值的期望值和补充信息价值的期望值，将其与收集补充信息所需的费用和收益相对比，就是否值得进一步收集补充信息的问题作出判断，并选择最佳的收集补充信息的方案。这一环节被称为后验预分析。

第 11 章 统计决策