fbpx
维基百科

LQG控制

LQG控制(linear–quadratic–Gaussian control)的全名是線性二次高斯控制,是控制理论中的基礎最优控制問題之一。此問題和存在加性高斯白噪声線性系統有關。此問題是要找到最佳的輸出回授律,可以讓二次費用函數的期望值最小化。其輸出量測假設受到高斯噪声的影響,其初值也是高斯隨機向量。

在「使用線性控制律」的最佳控制假設下,可以用completion-of-squares論述進行推導[1]。此控制律即為LQG控制器,就是卡尔曼滤波(線性二次狀態估測器,LQE)和LQR控制器的結合。分離原理指出狀態估測器和狀態回授可以獨立設計。LQG控制可以應用在线性时不变系统及线性時變系統,產生容易計算以及實現的線性動態回授控制器。LQG控制器本身是一個類似其受控系統的動態系統,兩者有相同的維度。

根據分離原理,在一些範圍較寬可能是非線性的控制器中,LQG控制器仍然是最佳的。也就是說「使用非線性控制架構不一定可以改善費用泛函的期望值」。這個版本的分離原理是隨機控制的分離原理(separation principle of stochastic control)提到就算過程及輸出雜訊源可能是非高斯,只要其系統動態是線性的,其最佳控制仍可以分離為最佳狀態估測器(不再是卡尔曼滤波器)及LQR控制器[2][3]。LQR控制器也有用來控制擾動的非線性系統[4]

問題和解的數學描述

連續時間

考慮連續時間的線性動態系統

 
 

其中 是系統狀態變數的向量, 是控制輸入向量, 是輸出量測值的向量,可用在回授上。系統受到加成性的高斯系統雜訊 及加成性的高斯量測雜訊 所影響。給定一系統,其目標是找到一控制輸入 ,此控制輸入在每個時間 下,和以往的量測量 有線性關係,而且此控制輸入可以讓以下的費用函數有最小值:

 
 

其中 期望值。最終時間(horizon) 可能是有限值或是無限值。若最終時間為無限,則費用函數的第一項 可以忽略,和問題無關。而為了要讓費用函數為有限值,會定義費用函數為 

求解上述LQG問題的LQG控制器可以用以下方程表示:

 
 

矩陣 稱為卡尔曼增益(Kalman gain),和第一個方程卡尔曼滤波有關。在時間 ,濾波器會根據過去量測及輸入來產生狀態 的估測值 。卡尔曼增益 是根據 、二個和白色高斯雜訊有關密度矩陣  及最後的 來計算。這五個矩陣會透過以下的矩陣Riccati微分方程來決定卡尔曼增益:

 
 

假設其解 ,則卡尔曼增益等於

 

矩陣 稱為回授增益(feedback gain)矩陣,是由  矩陣,透過以下的矩陣Riccati微分方程來決定

 
 

假設其解 ,回授增益等於

 

觀察上述二個矩陣Riccati微分方程,第一個沿時間從前往後算,而第二個是沿時間從後往前算,這稱為「對偶性」。第一個矩陣Riccati微分方程解了線性平方估測問題(LQE),第二個矩陣Riccati微分方程解了LQR控制器問題。這二個問題是對偶的,合起來就解了線性平方高斯控制問題(LQG),因此LQG問題分成了LQE問題以及LQR問題,且可以獨立求解,因此LQG問題是「可分離的」。

 和雜訊密度矩陣 ,  不隨時間變化 ,且 趨於無限大時,LQG控制器會變成非時變動態系統。此時上述二個矩陣Riccati微分方程會變成代數Riccati方程

離散時間

離散時間的LQG控制問題和連續時間下的問題相近,因此以下只關注其數學式。

離散時間的線性系統方程為

 
 

其中 是離散時間, 是離散時間高斯白雜訊過程,其共變異數矩陣為 

要最小化的二次費用函數為

 
 

離散時間的LQG控制器為

 ,
 

卡尔曼增益等於

 

其中 是由以下依時間往前進的矩陣Riccati差分方程所決定:

 

回授增益矩陣為

 

\ 其中 是由以下時間從後往前算的矩陣Riccati差分方程所決定:

 

若問題中所有的矩陣都是非時變的,且時間長度 趨近無窮大,則離散時間的LQG控制器就是非時變的。此時矩陣Riccati差分方程可以用離散時間的代數Riccati方程取代。可以決定非時變的離散線性二次估測器,以及非時變的離散LQR控制器。為了讓費用是有限值,會用 來代替 

降階LQG問題

在傳統LQG設定中,當系統維度很大時,實現LQG控制器會有困難。降階LQG問題(reduced-order LQG problem)也稱為固定階數LQG問題(fixed-order LQG problem)先設定了LQG控制的狀態數。因為分離原理已不適用,此問題會更不容易求解,而且其解也不唯一。即使如此,降階LQG問題已有不少的數值演算法[5][6][7][8]可以求解相關的最佳投影方程(optimal projection equations)[9][10],其中建構了局部最佳化的降階LQG問題的充份及必要條件[5]

LQG控制的強健性

LQG最佳化本身不確保有良好的強健性[11],需要在設計好LQG控制後,另外確認閉迴路系統的強健穩定性。為了提昇系統的強健性,可能會將一些系統參數由確定值改假設是隨機值。相關的控制問題會更加複雜,會得到一個類似的最佳控制器,只有控制器參數不同[6]

相關條目

參考資料

  1. ^ Karl Johan Astrom. Introduction to Stochastic Control Theory 58. Academic Press. 1970. ISBN 0-486-44531-3. .
  2. ^ Anders Lindquist. On Feedback Control of Linear Stochastic Systems. SIAM Journal on Control. 1973, 11: 323––343. .
  3. ^ Tryphon T. Georgiou and Anders Lindquist. The Separation Principle in Stochastic Control, Redux. IEEE Transactions on Automatic Control. 2013, 58 (10): 2481––2494. doi:10.1109/TAC.2013.2259207. .
  4. ^ Athans M. The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design. IEEE Transaction on Automatic Control. 1971, AC–16 (6): 529–552. doi:10.1109/TAC.1971.1099818. 
  5. ^ 5.0 5.1 Van Willigenburg L.G.; De Koning W.L. Numerical algorithms and issues concerning the discrete-time optimal projection equations. European Journal of Control. 2000, 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  6. ^ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters. Automatica. 1999, 35: 129–138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  7. ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem. International Journal of Control. 1996, 56 (1): 173–191. doi:10.1080/00207179208934308. 
  8. ^ Collins Jr. E.G; Haddad W.M.; Ying S. A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations. Journal of Guidance Control & Dynamics. 1996, 19 (2): 407–417. doi:10.2514/3.21633. 
  9. ^ Hyland D.C; Bernstein D.S. The optimal projection equations for fixed order dynamic compensation. IEEE Transaction on Automatic Control. 1984, AC–29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. 
  10. ^ Bernstein D.S.; Davis L.D.; Hyland D.C. The optimal projection equations for reduced-order discrete-time modeling estimation and control. Journal of Guidance Control and Dynamics. 1986, 9 (3): 288–293. doi:10.2514/3.20105. 
  11. ^ Green, Michael; Limebeer, David J. N. Linear Robust Control. Englewood Cliffs: Prentice Hall. 1995: 27. ISBN 0-13-102278-4. 

延伸閱讀

  • Stengel, Robert F. Optimal Control and Estimation. New York: Dover. 1994. ISBN 0-486-68200-5. 

lqg控制, linear, quadratic, gaussian, control, 的全名是線性二次高斯控制, 是控制理论中的基礎最优控制問題之一, 此問題和存在加性高斯白噪声的線性系統有關, 此問題是要找到最佳的輸出回授律, 可以讓二次費用函數的期望值最小化, 其輸出量測假設受到高斯噪声的影響, 其初值也是高斯隨機向量, 使用線性控制律, 的最佳控制假設下, 可以用completion, squares論述進行推導, 此控制律即為器, 就是卡尔曼滤波, 線性二次狀態估測器, 和lqr控制器的結合, 分離原理. LQG控制 linear quadratic Gaussian control 的全名是線性二次高斯控制 是控制理论中的基礎最优控制問題之一 此問題和存在加性高斯白噪声的線性系統有關 此問題是要找到最佳的輸出回授律 可以讓二次費用函數的期望值最小化 其輸出量測假設受到高斯噪声的影響 其初值也是高斯隨機向量 在 使用線性控制律 的最佳控制假設下 可以用completion of squares論述進行推導 1 此控制律即為LQG控制器 就是卡尔曼滤波 線性二次狀態估測器 LQE 和LQR控制器的結合 分離原理指出狀態估測器和狀態回授可以獨立設計 LQG控制可以應用在线性时不变系统及线性時變系統 產生容易計算以及實現的線性動態回授控制器 LQG控制器本身是一個類似其受控系統的動態系統 兩者有相同的維度 根據分離原理 在一些範圍較寬可能是非線性的控制器中 LQG控制器仍然是最佳的 也就是說 使用非線性控制架構不一定可以改善費用泛函的期望值 這個版本的分離原理是隨機控制的分離原理 separation principle of stochastic control 提到就算過程及輸出雜訊源可能是非高斯鞅 只要其系統動態是線性的 其最佳控制仍可以分離為最佳狀態估測器 不再是卡尔曼滤波器 及LQR控制器 2 3 LQR控制器也有用來控制擾動的非線性系統 4 目录 1 問題和解的數學描述 1 1 連續時間 1 2 離散時間 2 降階LQG問題 3 LQG控制的強健性 4 相關條目 5 參考資料 6 延伸閱讀問題和解的數學描述 编辑連續時間 编辑 考慮連續時間的線性動態系統 x t A t x t B t u t v t displaystyle dot mathbf x t A t mathbf x t B t mathbf u t mathbf v t y t C t x t w t displaystyle mathbf y t C t mathbf x t mathbf w t 其中x displaystyle mathbf x 是系統狀態變數的向量 u displaystyle mathbf u 是控制輸入向量 y displaystyle mathbf y 是輸出量測值的向量 可用在回授上 系統受到加成性的高斯系統雜訊v t displaystyle mathbf v t 及加成性的高斯量測雜訊w t displaystyle mathbf w t 所影響 給定一系統 其目標是找到一控制輸入u t displaystyle mathbf u t 此控制輸入在每個時間t displaystyle mathbf t 下 和以往的量測量y t 0 t lt t displaystyle mathbf y t 0 leq t lt t 有線性關係 而且此控制輸入可以讓以下的費用函數有最小值 J E x T T F x T 0 T x T t Q t x t u T t R t u t d t displaystyle J mathbb E left mathbf x mathrm T T F mathbf x T int 0 T mathbf x mathrm T t Q t mathbf x t mathbf u mathrm T t R t mathbf u t dt right F 0 Q t 0 R t gt 0 displaystyle F geq 0 quad Q t geq 0 quad R t gt 0 其中E displaystyle mathbb E 為期望值 最終時間 horizon T displaystyle mathbf T 可能是有限值或是無限值 若最終時間為無限 則費用函數的第一項x T T F x T displaystyle mathbf x mathrm T T F mathbf x T 可以忽略 和問題無關 而為了要讓費用函數為有限值 會定義費用函數為J T displaystyle mathbf J T 求解上述LQG問題的LQG控制器可以用以下方程表示 x t A t x t B t u t L t y t C t x t x 0 E x 0 displaystyle dot hat mathbf x t A t hat mathbf x t B t mathbf u t L t left mathbf y t C t hat mathbf x t right quad hat mathbf x 0 mathbb E left mathbf x 0 right u t K t x t displaystyle mathbf u t K t hat mathbf x t 矩陣L t displaystyle mathbf L t 稱為卡尔曼增益 Kalman gain 和第一個方程卡尔曼滤波有關 在時間t displaystyle mathbf t 濾波器會根據過去量測及輸入來產生狀態x t displaystyle mathbf x t 的估測值x t displaystyle hat mathbf x t 卡尔曼增益L t displaystyle mathbf L t 是根據A t C t displaystyle mathbf A t C t 二個和白色高斯雜訊有關密度矩陣v t displaystyle mathbf v t w t displaystyle mathbf w t 及最後的E x 0 x T 0 displaystyle mathbb E left mathbf x 0 mathbf x mathrm T 0 right 來計算 這五個矩陣會透過以下的矩陣Riccati微分方程來決定卡尔曼增益 P t A t P t P t A T t P t C T t W 1 t C t P t V t displaystyle dot P t A t P t P t A mathrm T t P t C mathrm T t mathbf W 1 t C t P t V t P 0 E x 0 x T 0 displaystyle P 0 mathbb E left mathbf x 0 mathbf x mathrm T 0 right 假設其解P t 0 t T displaystyle P t 0 leq t leq T 則卡尔曼增益等於 L t P t C T t W 1 t displaystyle mathbf L t P t C mathrm T t W 1 t 矩陣K t displaystyle mathbf K t 稱為回授增益 feedback gain 矩陣 是由A t B t Q t R t displaystyle mathbf A t B t Q t R t 及F displaystyle mathbf F 矩陣 透過以下的矩陣Riccati微分方程來決定 S t A T t S t S t A t S t B t R 1 t B T t S t Q t displaystyle dot S t A mathrm T t S t S t A t S t B t R 1 t B mathrm T t S t Q t S T F displaystyle mathbf S T F 假設其解S t 0 t T displaystyle mathbf S t 0 leq t leq T 回授增益等於 K t R 1 t B T t S t displaystyle mathbf K t R 1 t B mathrm T t S t 觀察上述二個矩陣Riccati微分方程 第一個沿時間從前往後算 而第二個是沿時間從後往前算 這稱為 對偶性 第一個矩陣Riccati微分方程解了線性平方估測問題 LQE 第二個矩陣Riccati微分方程解了LQR控制器問題 這二個問題是對偶的 合起來就解了線性平方高斯控制問題 LQG 因此LQG問題分成了LQE問題以及LQR問題 且可以獨立求解 因此LQG問題是 可分離的 當A t B t C t Q t R t displaystyle mathbf A t B t C t Q t R t 和雜訊密度矩陣V t displaystyle mathbf V t W t displaystyle mathbf W t 不隨時間變化t displaystyle mathbf t 且T displaystyle mathbf T 趨於無限大時 LQG控制器會變成非時變動態系統 此時上述二個矩陣Riccati微分方程會變成代數Riccati方程 離散時間 编辑 離散時間的LQG控制問題和連續時間下的問題相近 因此以下只關注其數學式 離散時間的線性系統方程為 x i 1 A i x i B i u i v i displaystyle mathbf x i 1 A i mathbf x i B i mathbf u i mathbf v i y i C i x i w i displaystyle mathbf y i C i mathbf x i mathbf w i 其中i displaystyle mathbf i 是離散時間 v i w i displaystyle mathbf v i mathbf w i 是離散時間高斯白雜訊過程 其共變異數矩陣為V i W i displaystyle mathbf V i W i 要最小化的二次費用函數為 J E x N T F x N i 0 N 1 x i T Q i x i u i T R i u i displaystyle J mathbb E left mathbf x N mathrm T F mathbf x N sum i 0 N 1 mathbf x i mathrm T Q i mathbf x i mathbf u i mathrm T R i mathbf u i right F 0 Q i 0 R i gt 0 displaystyle F geq 0 Q i geq 0 R i gt 0 離散時間的LQG控制器為 x i 1 A i x i B i u i L i 1 y i 1 C i 1 A i x i B i u i x 0 E x 0 displaystyle hat mathbf x i 1 A i hat mathbf x i B i mathbf u i L i 1 left mathbf y i 1 C i 1 left A i hat mathbf x i B i u i right right hat mathbf x 0 mathbb E mathbf x 0 u i K i x i displaystyle mathbf u i K i hat mathbf x i 卡尔曼增益等於 L i P i C i T C i P i C i T W i 1 displaystyle mathbf L i P i C i mathrm T C i P i C i mathrm T W i 1 其中P i displaystyle mathbf P i 是由以下依時間往前進的矩陣Riccati差分方程所決定 P i 1 A i P i P i C i T C i P i C i T W i 1 C i P i A i T V i P 0 E x 0 x 0 x 0 x 0 T displaystyle P i 1 A i left P i P i C i mathrm T left C i P i C i mathrm T W i right 1 C i P i right A i mathrm T V i P 0 mathbb E left mathbf x 0 hat mathbf x 0 right left mathbf x 0 hat mathbf x 0 right mathrm T 回授增益矩陣為 K i B i T S i 1 B i R i 1 B i T S i 1 A i displaystyle mathbf K i B i mathrm T S i 1 B i R i 1 B i mathrm T S i 1 A i 其中S i displaystyle mathbf S i 是由以下時間從後往前算的矩陣Riccati差分方程所決定 S i A i T S i 1 S i 1 B i B i T S i 1 B i R i 1 B i T S i 1 A i Q i S N F displaystyle S i A i mathrm T left S i 1 S i 1 B i left B i mathrm T S i 1 B i R i right 1 B i mathrm T S i 1 right A i Q i quad S N F 若問題中所有的矩陣都是非時變的 且時間長度N displaystyle mathbf N 趨近無窮大 則離散時間的LQG控制器就是非時變的 此時矩陣Riccati差分方程可以用離散時間的代數Riccati方程取代 可以決定非時變的離散線性二次估測器 以及非時變的離散LQR控制器 為了讓費用是有限值 會用J N displaystyle mathbf J N 來代替J displaystyle mathbf J 降階LQG問題 编辑在傳統LQG設定中 當系統維度很大時 實現LQG控制器會有困難 降階LQG問題 reduced order LQG problem 也稱為固定階數LQG問題 fixed order LQG problem 先設定了LQG控制的狀態數 因為分離原理已不適用 此問題會更不容易求解 而且其解也不唯一 即使如此 降階LQG問題已有不少的數值演算法 5 6 7 8 可以求解相關的最佳投影方程 optimal projection equations 9 10 其中建構了局部最佳化的降階LQG問題的充份及必要條件 5 LQG控制的強健性 编辑LQG最佳化本身不確保有良好的強健性 11 需要在設計好LQG控制後 另外確認閉迴路系統的強健穩定性 為了提昇系統的強健性 可能會將一些系統參數由確定值改假設是隨機值 相關的控制問題會更加複雜 會得到一個類似的最佳控制器 只有控制器參數不同 6 相關條目 编辑隨機控制 Witsenhausen反例參考資料 编辑 Karl Johan Astrom Introduction to Stochastic Control Theory 58 Academic Press 1970 ISBN 0 486 44531 3 Anders Lindquist On Feedback Control of Linear Stochastic Systems SIAM Journal on Control 1973 11 323 343 Tryphon T Georgiou and Anders Lindquist The Separation Principle in Stochastic Control Redux IEEE Transactions on Automatic Control 2013 58 10 2481 2494 doi 10 1109 TAC 2013 2259207 Athans M The role and use of the stochastic Linear Quadratic Gaussian problem in control system design IEEE Transaction on Automatic Control 1971 AC 16 6 529 552 doi 10 1109 TAC 1971 1099818 5 0 5 1 Van Willigenburg L G De Koning W L Numerical algorithms and issues concerning the discrete time optimal projection equations European Journal of Control 2000 6 1 93 100 doi 10 1016 s0947 3580 00 70917 4 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 6 0 6 1 Van Willigenburg L G De Koning W L Optimal reduced order compensators for time varying discrete time systems with deterministic and white parameters Automatica 1999 35 129 138 doi 10 1016 S0005 1098 98 00138 1 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 Zigic D Watson L T Collins E G Haddad W M Ying S Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem International Journal of Control 1996 56 1 173 191 doi 10 1080 00207179208934308 Collins Jr E G Haddad W M Ying S A homotopy algorithm for reduced order dynamic compensation using the Hyland Bernstein optimal projection equations Journal of Guidance Control amp Dynamics 1996 19 2 407 417 doi 10 2514 3 21633 Hyland D C Bernstein D S The optimal projection equations for fixed order dynamic compensation IEEE Transaction on Automatic Control 1984 AC 29 11 1034 1037 doi 10 1109 TAC 1984 1103418 Bernstein D S Davis L D Hyland D C The optimal projection equations for reduced order discrete time modeling estimation and control Journal of Guidance Control and Dynamics 1986 9 3 288 293 doi 10 2514 3 20105 Green Michael Limebeer David J N Linear Robust Control Englewood Cliffs Prentice Hall 1995 27 ISBN 0 13 102278 4 延伸閱讀 编辑Stengel Robert F Optimal Control and Estimation New York Dover 1994 ISBN 0 486 68200 5 取自 https zh wikipedia org w index php title LQG控制 amp oldid 73987992, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。