最优化与最优控制讲义 第6章 动态规划

最优化与最优控制讲义 第6章 动态规划

ID:37226995

大小:353.42 KB

页数:17页

时间:2019-05-19

最优化与最优控制讲义 第6章 动态规划_第1页
最优化与最优控制讲义 第6章 动态规划_第2页
最优化与最优控制讲义 第6章 动态规划_第3页
最优化与最优控制讲义 第6章 动态规划_第4页
最优化与最优控制讲义 第6章 动态规划_第5页
资源描述:

《最优化与最优控制讲义 第6章 动态规划》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、六.动态规划动态规划是最优化理论中的一种重要方法,由美国数学家理查德·贝尔曼(RichardBellman)于二十世纪50年代中期提出。最初动态规划是被用来解决多级决策过程最优化问题,如上一章所述,这一问题等同于离散时间系统的最优控制问题。后来这一方法被推广到连续时间系统最优控制问题,成为解最优控制问题的重要方法之一。动态规划是解最优控制问题的一种“方法”,而不是一种“算法”,因为它实际上是应用一些求解最优化问题的基本算法来求解多级决策过程优化这一复杂优化问题的策略,其核心是将一个复杂的多级决策问题转化为

2、一系列简单的单级决策问题。动态规划的理论基础是Bellman最优性原理。基于最优性原理,我们可以得到离散时间系统最优控制的一些理论结果,并建立相应的递推优化计算公式。对于连续时间系统,我们除了得到基于最优性原理的最优控制结果,还可以建立其与变分法和极大值原理之间的联系。6.1多级决策问题(1)最短(优)行车路线问题考虑如图6.1所示的道路网络,其中各段道路的里程如图中数字所示。一车从S站出发,前往F站,要求寻找一条路程最短的行车路线。x1(1)6x1(2)1x1(3)4614SF423572x2(1)x2

3、(2)x2(3)第一段第二段第三段第四段图6.1最短行车路线多段决策路网这是一个三段决策问题。在S站、x1(1)或x2(1)站、x1(2)或x2(2)站都要作二选一的决策,即在每一站可供决策至多两个。对这样一个三段决策问题,要找到最短路径决策,首先考虑采用穷举法求解。所谓穷举法,即将所有可能的行车路线全部列出,如S→x1(1)→x2(2)→x1(3)(n−1)3→F或S→x2(1)→x1(2)→x1(3)→F等。所有可能的行车路线共有2=2=8条,其中n=4表示分段总数,最后一段不需作决策。要求出8条路线

4、中的最短路线,需要计算每条路线的长度共8次,比较各条路线的长度7次。以计算机基本运算次数计,即需做加法运算8╳3=24(即76(n−1)(n−1)2×(n−1))次,比较运算7(即2−1)次。下面考虑用动态规划法此问题。以J表示行车路程(或称代价),并从最后一段开始计算J的值。从x1(3)→F,J=J[x1(3)]=4从x2(3)→F,J=J[x2(3)]=3此段虽然路径已定,也可以视为作了一选一的决策。再考察从倒数第二段(即图6.1中第三段)开始。从x1(2)→F,有两条路线:x1(2)→x1(3)→F

5、,J=J[x1(2)]=1+J[x1(3)]=1+4=5x1(2)→x2(3)→F,J=J[x1(2)]=1+J[x2(3)]=1+3=4有最小代价J*[x1(2)]=4,从x2(2)→F,也有两条路线:x2(2)→x1(3)→F,J=J[x2(2)]=2+J[x1(3)]=2+4=6x2(2)→x2(3)→F,J=J[x2(2)]=2+J[x2(3)]=2+3=5有最小代价J*[x2(2)]=5。考虑从倒数第三段(即图6.1中第二段)开始。从x1(1)→F,也只考虑两条路线:x1(1)→x1(2)→F,

6、J=J[x1(1)]=6+J*[x1(2)]=6+4=10x1(1)→x2(2)→F,J=J[x1(1)]=6+J*[x2(2)]=6+5=11有最小代价J*[x1(1)]=10,从x2(1)→F,考虑:x2(1)→x1(2)→F,J=J[x2(1)]=4+J*[x1(2)]=4+4=8x2(1)→x2(2)→F,J=J[x2(1)]=7+J*[x2(2)]=7+5=12有最小代价J*[x2(1)]=8。最后考虑从倒数第四段开始,即全程决策。从S→F,考虑:S→x1(1)→F,J=J[S]=4+J*[x1

7、(1)]=4+10=14S→x2(1)→F,J=J[S]=5+J*[x2(1)]=5+8=13有最小代价J*[S]=13。则最优决策路线为S→x2(1)→x1(2)→x2(3)→F,最小代价(最短行车路线)为J*=J*[S]=13。以上就是采用动态规划方法的求解过程。其中,作决策(比较运算)5次(2(n-2)+1=5),加法10次(4(n-2)+2=10)。从各站开始的最优路线如图6.2所示。x1(1)x1(2)x1(3)1044S130F853x2(1)x2(2)x2(3)图6.2从各站开始的最短行车路

8、线77(2)动态规划的特点I.与穷举法相比,动态规划法的计算工作量大大减少,当段数、决策数都增加时差别尤为明显;II.将一个复杂的、难以求解的多级决策问题转化为一系列简单的、易于求解的单级决策问题来处理——数学上称为“不变嵌入原理”(将一条最优行车路线问题嵌入到求一系列最优行车问题中);III.最优路线的后部子路线及其相应决策序列也是自中间站开始的最优路线和最优决策序列——即最优性原理,为动态规划的核心和理论基础;IV.动态规

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。