1 / 6

5.1 动态规划的最优化原理及其算法 5.1.1 求解多阶段决策过程的方法 例 5.1.1 最短路问题

5.1 动态规划的最优化原理及其算法 5.1.1 求解多阶段决策过程的方法 例 5.1.1 最短路问题. 决策树法. 可以枚举出 20 条路径,其中最短的路径长度为 16. 例 5.1.1 最短路问题. 表现为明显的阶段性 一条从 A 到 B 的最短路径中的任何一段都是最短的. 因此我们可以从 B 向回搜索最短路 标记法 如何找出最短路径. 最优性原理 “最优策略的一部分也是最优的” 每步的决策只与相邻阶段状态有关,而与如何达到这一状态无关. 5.1.2 动态规划的基本概念及递推公式. 状态 ( 每阶段初始的出发点 )

rhea-howe
Download Presentation

5.1 动态规划的最优化原理及其算法 5.1.1 求解多阶段决策过程的方法 例 5.1.1 最短路问题

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 5.1动态规划的最优化原理及其算法 • 5.1.1 求解多阶段决策过程的方法 • 例5.1.1 最短路问题

  2. 决策树法 可以枚举出20条路径,其中最短的路径长度为16

  3. 例5.1.1最短路问题 • 表现为明显的阶段性 • 一条从A 到B 的最短路径中的任何一段都是最短的 • 因此我们可以从B向回搜索最短路 • 标记法 • 如何找出最短路径 最优性原理 “最优策略的一部分也是最优的” 每步的决策只与相邻阶段状态有关,而与如何达到这一状态无关

  4. 5.1.2 动态规划的基本概念及递推公式 • 状态(每阶段初始的出发点) • 最短路问题中,各个节点就是状态 • 生产库存问题中,库存量是状态 • 物资分配问题中,剩余的物资量是状态 • 控制变量(决策变量) • 最短路问题中,走哪条路 • 生产库存问题中,各阶段的产品生产量 • 物资分配问题中,分配给每个地区的物资量 • 阶段的编号与递推的方向 • 一般采用反向递推,所以阶段的编号也是逆向的 • 当然也可以正向递推

  5. 动态规划的步骤 1、确定问题的阶段和编号 2、确定状态变量 • 用 Sk表示第 k 阶段的状态变量及其值 3、确定决策变量 • 用 xk表示第 k 阶段的决策变量,并以 xk*表示该阶段的最优决策 4、状态转移方程 sk-1= g(sk, xk) 反向编号 sk+1= g(sk, xk) 正向编号 5、直接效果 • 直接一步转移的效果 dk(sk, xk) 6、总效果函数 • 指某阶段某状态下到终端状态的总效果,它是一个递推公式

  6. 动态规划的步骤 • hk是一般表达形式,求当前阶段当前状态下的阶段最优总效果 (1) 如最短路问题,是累加形式,此时有 • 终端的边际效果一般为 f0(s0, x0)=0 • (2)如串联系统可靠性问题,是连乘形式,此时有 • 终端的边际效果一般为 f0(s0,x0)=1 • 从第1阶段开始,利用边际效果和边界条件,可以递推到最后阶段

More Related