编辑: bingyan8 | 2019-07-14 |
2009 试题 2009/07/16
一、 (20 分)简答题 1) 什么是泛函?什么是泛函极值? 2) 线性连续系统的二次型目标泛函求极值: 请解释性能指标各部分的物理意义,并解释此 LQR 问题所表示的物理概念.
3) 请写出动态规划的 Bellman 方程,并试与下面 Q 学习算法的 Q 函数递归关系式相对比,说 明两者有什么联系? ( ) a a s Q a s r a s Q a ′ + ≡ ′ , , ? max , , ? δ γ 4) 请简述你所在小组课程 project 的主要工作内容以及你个人的完成的主要工作.
二、 (20 分) 在讨论泛函求极值问题 ( )dx x y x y x F y J x x y ∫ ′ =
1 0 , , min 时我们得到了极值存在的必要条件 Euler 方程 '
0 y y d F F dx ? = 请考虑如下问题: 1)如果函数 F 不显含 x 和y,即()Fy′ ,请证明总存在一个解是 x 的线性函数. 2)如果函数 F 不显含 x,即(),Fyy′ ,请证明 ' constant y F y F ′ ? =
三、 (15 分) 泛函求极值 ( )
1 2
3 0 min x J x x dt = + ∫ 若x(0)=0 和x(1)任意,求最优轨迹 x*(t).
四、 (15 分) 一阶离散系统
1 k k k x x u + = + ,经两步将其转移到原点(即x2=0) ,最小化如下性能指标: ( )
1 0 min
5 k k u k J x u = = + ∑ 其间状态和控制的允许取值分别为 { } { } 3,2,1,0, 1, 2,
3 , 2,1,0, 1,
2 k k x u 试用动态规划 求每个允许初态 x0 的最优控制及相应的目标值,并确定初态 x0= -2 时的最优控制序列{ } * *
0 1 , u u .
五、 (15 分) 在求解有约束情形的泛函求极值问题时,我们将其化为无约束优化问题是依据如下定理:如 下两个泛函求极值问题彼此完全等价, ( ) ( ) ( )
1 0 min , , '
0 x x y J y F x y y dx s t x y y ? = = ∫ 式中, n y R ∈ , m R ? ∈ , m n < .
1 0 min x T x y J y F x y y x x y y dx λ ? ? ? = + ? ? ∫ 式中,λ为Lagrange 乘子向量, m R λ ∈ . 试以如下泛函求极值问题为例证明这一定理:
2 2
1 2
0 1
2 2
1 2
1 2 min . .
0 1,
0 1,
2 0,
2 0 u J u dx s t x x x u x x x x = = = = = = = ∫
六、 (15 分) For the system given by the dynamics:
1 2
2 x x u x u = + = with ( )
1 u t ≤ , find the time optimal controller that drives the system to the origin
1 2
0 x x = = . In your solution, clearly state: z The switching law, z Show the switching lines, z Sketch the system response for ( ) ( )
1 2
0 0
1 x x = = . * 考察的同学
五、六题可选做一题.