fbpx
维基百科

LQG控制

LQG控制(linear–quadratic–Gaussian control)的全名是線性二次高斯控制,是控制理论中的基礎最优控制問題之一。此問題和存在加性高斯白噪声線性系統有關。此問題是要找到最佳的輸出回授律,可以讓二次費用函數的期望值最小化。其輸出量測假設受到高斯噪声的影響,其初值也是高斯隨機向量。

在「使用線性控制律」的最佳控制假設下,可以用completion-of-squares論述進行推導[1]。此控制律即為LQG控制器,就是卡尔曼滤波(線性二次狀態估測器,LQE)和LQR控制器的結合。分離原理指出狀態估測器和狀態回授可以獨立設計。LQG控制可以應用在线性时不变系统及线性時變系統,產生容易計算以及實現的線性動態回授控制器。LQG控制器本身是一個類似其受控系統的動態系統,兩者有相同的維度。

根據分離原理,在一些範圍較寬可能是非線性的控制器中,LQG控制器仍然是最佳的。也就是說「使用非線性控制架構不一定可以改善費用泛函的期望值」。這個版本的分離原理是隨機控制的分離原理英语Separation principle in stochastic control(separation principle of stochastic control)提到就算過程及輸出雜訊源可能是非高斯,只要其系統動態是線性的,其最佳控制仍可以分離為最佳狀態估測器(不再是卡尔曼滤波器)及LQR控制器[2][3]。LQR控制器也有用來控制擾動的非線性系統[4]

問題和解的數學描述 编辑

連續時間 编辑

考慮連續時間的線性動態系統

 
 

其中 是系統狀態變數的向量, 是控制輸入向量, 是輸出量測值的向量,可用在回授上。系統受到加成性的高斯系統雜訊 及加成性的高斯量測雜訊 所影響。給定一系統,其目標是找到一控制輸入 ,此控制輸入在每個時間 下,和以往的量測量 有線性關係,而且此控制輸入可以讓以下的費用函數有最小值:

 
 

其中 期望值。最終時間(horizon) 可能是有限值或是無限值。若最終時間為無限,則費用函數的第一項 可以忽略,和問題無關。而為了要讓費用函數為有限值,會定義費用函數為 

求解上述LQG問題的LQG控制器可以用以下方程表示:

 
 

矩陣 稱為卡尔曼增益(Kalman gain),和第一個方程卡尔曼滤波有關。在時間 ,濾波器會根據過去量測及輸入來產生狀態 的估測值 。卡尔曼增益 是根據 、二個和白色高斯雜訊有關密度矩陣  及最後的 來計算。這五個矩陣會透過以下的矩陣Riccati微分方程來決定卡尔曼增益:

 
 

假設其解 ,則卡尔曼增益等於

 

矩陣 稱為回授增益(feedback gain)矩陣,是由  矩陣,透過以下的矩陣Riccati微分方程來決定

 
 

假設其解 ,回授增益等於

 

觀察上述二個矩陣Riccati微分方程,第一個沿時間從前往後算,而第二個是沿時間從後往前算,這稱為「對偶性」。第一個矩陣Riccati微分方程解了線性平方估測問題(LQE),第二個矩陣Riccati微分方程解了LQR控制器問題。這二個問題是對偶的,合起來就解了線性平方高斯控制問題(LQG),因此LQG問題分成了LQE問題以及LQR問題,且可以獨立求解,因此LQG問題是「可分離的」。

 和雜訊密度矩陣 ,  不隨時間變化 ,且 趨於無限大時,LQG控制器會變成非時變動態系統。此時上述二個矩陣Riccati微分方程會變成代數Riccati方程

離散時間 编辑

離散時間的LQG控制問題和連續時間下的問題相近,因此以下只關注其數學式。

離散時間的線性系統方程為

 
 

其中 是離散時間, 是離散時間高斯白雜訊過程,其共變異數矩陣為 

要最小化的二次費用函數為

 
 

離散時間的LQG控制器為

 ,
 

卡尔曼增益等於

 

其中 是由以下依時間往前進的矩陣Riccati差分方程所決定:

 

回授增益矩陣為

 

\ 其中 是由以下時間從後往前算的矩陣Riccati差分方程所決定:

 

若問題中所有的矩陣都是非時變的,且時間長度 趨近無窮大,則離散時間的LQG控制器就是非時變的。此時矩陣Riccati差分方程可以用離散時間的代數Riccati方程取代。可以決定非時變的離散線性二次估測器,以及非時變的離散LQR控制器。為了讓費用是有限值,會用 來代替 

降階LQG問題 编辑

在傳統LQG設定中,當系統維度很大時,實現LQG控制器會有困難。降階LQG問題(reduced-order LQG problem)也稱為固定階數LQG問題(fixed-order LQG problem)先設定了LQG控制的狀態數。因為分離原理已不適用,此問題會更不容易求解,而且其解也不唯一。即使如此,降階LQG問題已有不少的數值演算法[5][6][7][8]可以求解相關的最佳投影方程(optimal projection equations)[9][10],其中建構了局部最佳化的降階LQG問題的充份及必要條件[5]

LQG控制的強健性 编辑

LQG最佳化本身不確保有良好的強健性[11],需要在設計好LQG控制後,另外確認閉迴路系統的強健穩定性。為了提昇系統的強健性,可能會將一些系統參數由確定值改假設是隨機值。相關的控制問題會更加複雜,會得到一個類似的最佳控制器,只有控制器參數不同[6]

相關條目 编辑

參考資料 编辑

  1. ^ Karl Johan Astrom. Introduction to Stochastic Control Theory 58. Academic Press. 1970. ISBN 0-486-44531-3. .
  2. ^ Anders Lindquist. On Feedback Control of Linear Stochastic Systems. SIAM Journal on Control. 1973, 11: 323––343. .
  3. ^ Tryphon T. Georgiou and Anders Lindquist. The Separation Principle in Stochastic Control, Redux. IEEE Transactions on Automatic Control. 2013, 58 (10): 2481––2494. doi:10.1109/TAC.2013.2259207. .
  4. ^ Athans M. The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design. IEEE Transaction on Automatic Control. 1971, AC–16 (6): 529–552. doi:10.1109/TAC.1971.1099818. 
  5. ^ 5.0 5.1 Van Willigenburg L.G.; De Koning W.L. Numerical algorithms and issues concerning the discrete-time optimal projection equations. European Journal of Control. 2000, 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  6. ^ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters. Automatica. 1999, 35: 129–138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  7. ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem. International Journal of Control. 1996, 56 (1): 173–191. doi:10.1080/00207179208934308. 
  8. ^ Collins Jr. E.G; Haddad W.M.; Ying S. A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations. Journal of Guidance Control & Dynamics. 1996, 19 (2): 407–417. doi:10.2514/3.21633. 
  9. ^ Hyland D.C; Bernstein D.S. The optimal projection equations for fixed order dynamic compensation. IEEE Transaction on Automatic Control. 1984, AC–29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. 
  10. ^ Bernstein D.S.; Davis L.D.; Hyland D.C. The optimal projection equations for reduced-order discrete-time modeling estimation and control. Journal of Guidance Control and Dynamics. 1986, 9 (3): 288–293. doi:10.2514/3.20105. 
  11. ^ Green, Michael; Limebeer, David J. N. Linear Robust Control. Englewood Cliffs: Prentice Hall. 1995: 27. ISBN 0-13-102278-4. 

延伸閱讀 编辑

  • Stengel, Robert F. Optimal Control and Estimation. New York: Dover. 1994. ISBN 0-486-68200-5. 

lqg控制, linear, quadratic, gaussian, control, 的全名是線性二次高斯控制, 是控制理论中的基礎最优控制問題之一, 此問題和存在加性高斯白噪声的線性系統有關, 此問題是要找到最佳的輸出回授律, 可以讓二次費用函數的期望值最小化, 其輸出量測假設受到高斯噪声的影響, 其初值也是高斯隨機向量, 使用線性控制律, 的最佳控制假設下, 可以用completion, squares論述進行推導, 此控制律即為器, 就是卡尔曼滤波, 線性二次狀態估測器, 和lqr控制器的結合, 分離原理. LQG控制 linear quadratic Gaussian control 的全名是線性二次高斯控制 是控制理论中的基礎最优控制問題之一 此問題和存在加性高斯白噪声的線性系統有關 此問題是要找到最佳的輸出回授律 可以讓二次費用函數的期望值最小化 其輸出量測假設受到高斯噪声的影響 其初值也是高斯隨機向量 在 使用線性控制律 的最佳控制假設下 可以用completion of squares論述進行推導 1 此控制律即為LQG控制器 就是卡尔曼滤波 線性二次狀態估測器 LQE 和LQR控制器的結合 分離原理指出狀態估測器和狀態回授可以獨立設計 LQG控制可以應用在线性时不变系统及线性時變系統 產生容易計算以及實現的線性動態回授控制器 LQG控制器本身是一個類似其受控系統的動態系統 兩者有相同的維度 根據分離原理 在一些範圍較寬可能是非線性的控制器中 LQG控制器仍然是最佳的 也就是說 使用非線性控制架構不一定可以改善費用泛函的期望值 這個版本的分離原理是隨機控制的分離原理 英语 Separation principle in stochastic control separation principle of stochastic control 提到就算過程及輸出雜訊源可能是非高斯鞅 只要其系統動態是線性的 其最佳控制仍可以分離為最佳狀態估測器 不再是卡尔曼滤波器 及LQR控制器 2 3 LQR控制器也有用來控制擾動的非線性系統 4 目录 1 問題和解的數學描述 1 1 連續時間 1 2 離散時間 2 降階LQG問題 3 LQG控制的強健性 4 相關條目 5 參考資料 6 延伸閱讀問題和解的數學描述 编辑連續時間 编辑 考慮連續時間的線性動態系統 x t A t x t B t u t v t displaystyle dot mathbf x t A t mathbf x t B t mathbf u t mathbf v t nbsp y t C t x t w t displaystyle mathbf y t C t mathbf x t mathbf w t nbsp 其中x displaystyle mathbf x nbsp 是系統狀態變數的向量 u displaystyle mathbf u nbsp 是控制輸入向量 y displaystyle mathbf y nbsp 是輸出量測值的向量 可用在回授上 系統受到加成性的高斯系統雜訊v t displaystyle mathbf v t nbsp 及加成性的高斯量測雜訊w t displaystyle mathbf w t nbsp 所影響 給定一系統 其目標是找到一控制輸入u t displaystyle mathbf u t nbsp 此控制輸入在每個時間t displaystyle mathbf t nbsp 下 和以往的量測量y t 0 t lt t displaystyle mathbf y t 0 leq t lt t nbsp 有線性關係 而且此控制輸入可以讓以下的費用函數有最小值 J E x T T F x T 0 T x T t Q t x t u T t R t u t d t displaystyle J mathbb E left mathbf x mathrm T T F mathbf x T int 0 T mathbf x mathrm T t Q t mathbf x t mathbf u mathrm T t R t mathbf u t dt right nbsp F 0 Q t 0 R t gt 0 displaystyle F geq 0 quad Q t geq 0 quad R t gt 0 nbsp 其中E displaystyle mathbb E nbsp 為期望值 最終時間 horizon T displaystyle mathbf T nbsp 可能是有限值或是無限值 若最終時間為無限 則費用函數的第一項x T T F x T displaystyle mathbf x mathrm T T F mathbf x T nbsp 可以忽略 和問題無關 而為了要讓費用函數為有限值 會定義費用函數為J T displaystyle mathbf J T nbsp 求解上述LQG問題的LQG控制器可以用以下方程表示 x t A t x t B t u t L t y t C t x t x 0 E x 0 displaystyle dot hat mathbf x t A t hat mathbf x t B t mathbf u t L t left mathbf y t C t hat mathbf x t right quad hat mathbf x 0 mathbb E left mathbf x 0 right nbsp u t K t x t displaystyle mathbf u t K t hat mathbf x t nbsp 矩陣L t displaystyle mathbf L t nbsp 稱為卡尔曼增益 Kalman gain 和第一個方程卡尔曼滤波有關 在時間t displaystyle mathbf t nbsp 濾波器會根據過去量測及輸入來產生狀態x t displaystyle mathbf x t nbsp 的估測值x t displaystyle hat mathbf x t nbsp 卡尔曼增益L t displaystyle mathbf L t nbsp 是根據A t C t displaystyle mathbf A t C t nbsp 二個和白色高斯雜訊有關密度矩陣v t displaystyle mathbf v t nbsp w t displaystyle mathbf w t nbsp 及最後的E x 0 x T 0 displaystyle mathbb E left mathbf x 0 mathbf x mathrm T 0 right nbsp 來計算 這五個矩陣會透過以下的矩陣Riccati微分方程來決定卡尔曼增益 P t A t P t P t A T t P t C T t W 1 t C t P t V t displaystyle dot P t A t P t P t A mathrm T t P t C mathrm T t mathbf W 1 t C t P t V t nbsp P 0 E x 0 x T 0 displaystyle P 0 mathbb E left mathbf x 0 mathbf x mathrm T 0 right nbsp 假設其解P t 0 t T displaystyle P t 0 leq t leq T nbsp 則卡尔曼增益等於 L t P t C T t W 1 t displaystyle mathbf L t P t C mathrm T t W 1 t nbsp 矩陣K t displaystyle mathbf K t nbsp 稱為回授增益 feedback gain 矩陣 是由A t B t Q t R t displaystyle mathbf A t B t Q t R t nbsp 及F displaystyle mathbf F nbsp 矩陣 透過以下的矩陣Riccati微分方程來決定 S t A T t S t S t A t S t B t R 1 t B T t S t Q t displaystyle dot S t A mathrm T t S t S t A t S t B t R 1 t B mathrm T t S t Q t nbsp S T F displaystyle mathbf S T F nbsp 假設其解S t 0 t T displaystyle mathbf S t 0 leq t leq T nbsp 回授增益等於 K t R 1 t B T t S t displaystyle mathbf K t R 1 t B mathrm T t S t nbsp 觀察上述二個矩陣Riccati微分方程 第一個沿時間從前往後算 而第二個是沿時間從後往前算 這稱為 對偶性 第一個矩陣Riccati微分方程解了線性平方估測問題 LQE 第二個矩陣Riccati微分方程解了LQR控制器問題 這二個問題是對偶的 合起來就解了線性平方高斯控制問題 LQG 因此LQG問題分成了LQE問題以及LQR問題 且可以獨立求解 因此LQG問題是 可分離的 當A t B t C t Q t R t displaystyle mathbf A t B t C t Q t R t nbsp 和雜訊密度矩陣V t displaystyle mathbf V t nbsp W t displaystyle mathbf W t nbsp 不隨時間變化t displaystyle mathbf t nbsp 且T displaystyle mathbf T nbsp 趨於無限大時 LQG控制器會變成非時變動態系統 此時上述二個矩陣Riccati微分方程會變成代數Riccati方程 離散時間 编辑 離散時間的LQG控制問題和連續時間下的問題相近 因此以下只關注其數學式 離散時間的線性系統方程為 x i 1 A i x i B i u i v i displaystyle mathbf x i 1 A i mathbf x i B i mathbf u i mathbf v i nbsp y i C i x i w i displaystyle mathbf y i C i mathbf x i mathbf w i nbsp 其中i displaystyle mathbf i nbsp 是離散時間 v i w i displaystyle mathbf v i mathbf w i nbsp 是離散時間高斯白雜訊過程 其共變異數矩陣為V i W i displaystyle mathbf V i W i nbsp 要最小化的二次費用函數為 J E x N T F x N i 0 N 1 x i T Q i x i u i T R i u i displaystyle J mathbb E left mathbf x N mathrm T F mathbf x N sum i 0 N 1 mathbf x i mathrm T Q i mathbf x i mathbf u i mathrm T R i mathbf u i right nbsp F 0 Q i 0 R i gt 0 displaystyle F geq 0 Q i geq 0 R i gt 0 nbsp 離散時間的LQG控制器為 x i 1 A i x i B i u i L i 1 y i 1 C i 1 A i x i B i u i x 0 E x 0 displaystyle hat mathbf x i 1 A i hat mathbf x i B i mathbf u i L i 1 left mathbf y i 1 C i 1 left A i hat mathbf x i B i u i right right hat mathbf x 0 mathbb E mathbf x 0 nbsp u i K i x i displaystyle mathbf u i K i hat mathbf x i nbsp 卡尔曼增益等於 L i P i C i T C i P i C i T W i 1 displaystyle mathbf L i P i C i mathrm T C i P i C i mathrm T W i 1 nbsp 其中P i displaystyle mathbf P i nbsp 是由以下依時間往前進的矩陣Riccati差分方程所決定 P i 1 A i P i P i C i T C i P i C i T W i 1 C i P i A i T V i P 0 E x 0 x 0 x 0 x 0 T displaystyle P i 1 A i left P i P i C i mathrm T left C i P i C i mathrm T W i right 1 C i P i right A i mathrm T V i P 0 mathbb E left mathbf x 0 hat mathbf x 0 right left mathbf x 0 hat mathbf x 0 right mathrm T nbsp 回授增益矩陣為 K i B i T S i 1 B i R i 1 B i T S i 1 A i displaystyle mathbf K i B i mathrm T S i 1 B i R i 1 B i mathrm T S i 1 A i nbsp 其中S i displaystyle mathbf S i nbsp 是由以下時間從後往前算的矩陣Riccati差分方程所決定 S i A i T S i 1 S i 1 B i B i T S i 1 B i R i 1 B i T S i 1 A i Q i S N F displaystyle S i A i mathrm T left S i 1 S i 1 B i left B i mathrm T S i 1 B i R i right 1 B i mathrm T S i 1 right A i Q i quad S N F nbsp 若問題中所有的矩陣都是非時變的 且時間長度N displaystyle mathbf N nbsp 趨近無窮大 則離散時間的LQG控制器就是非時變的 此時矩陣Riccati差分方程可以用離散時間的代數Riccati方程取代 可以決定非時變的離散線性二次估測器 以及非時變的離散LQR控制器 為了讓費用是有限值 會用J N displaystyle mathbf J N nbsp 來代替J displaystyle mathbf J nbsp 降階LQG問題 编辑在傳統LQG設定中 當系統維度很大時 實現LQG控制器會有困難 降階LQG問題 reduced order LQG problem 也稱為固定階數LQG問題 fixed order LQG problem 先設定了LQG控制的狀態數 因為分離原理已不適用 此問題會更不容易求解 而且其解也不唯一 即使如此 降階LQG問題已有不少的數值演算法 5 6 7 8 可以求解相關的最佳投影方程 optimal projection equations 9 10 其中建構了局部最佳化的降階LQG問題的充份及必要條件 5 LQG控制的強健性 编辑LQG最佳化本身不確保有良好的強健性 11 需要在設計好LQG控制後 另外確認閉迴路系統的強健穩定性 為了提昇系統的強健性 可能會將一些系統參數由確定值改假設是隨機值 相關的控制問題會更加複雜 會得到一個類似的最佳控制器 只有控制器參數不同 6 相關條目 编辑隨機控制 Witsenhausen反例參考資料 编辑 Karl Johan Astrom Introduction to Stochastic Control Theory 58 Academic Press 1970 ISBN 0 486 44531 3 Anders Lindquist On Feedback Control of Linear Stochastic Systems SIAM Journal on Control 1973 11 323 343 Tryphon T Georgiou and Anders Lindquist The Separation Principle in Stochastic Control Redux IEEE Transactions on Automatic Control 2013 58 10 2481 2494 doi 10 1109 TAC 2013 2259207 Athans M The role and use of the stochastic Linear Quadratic Gaussian problem in control system design IEEE Transaction on Automatic Control 1971 AC 16 6 529 552 doi 10 1109 TAC 1971 1099818 5 0 5 1 Van Willigenburg L G De Koning W L Numerical algorithms and issues concerning the discrete time optimal projection equations European Journal of Control 2000 6 1 93 100 doi 10 1016 s0947 3580 00 70917 4 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 6 0 6 1 Van Willigenburg L G De Koning W L Optimal reduced order compensators for time varying discrete time systems with deterministic and white parameters Automatica 1999 35 129 138 doi 10 1016 S0005 1098 98 00138 1 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 Zigic D Watson L T Collins E G Haddad W M Ying S Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem International Journal of Control 1996 56 1 173 191 doi 10 1080 00207179208934308 Collins Jr E G Haddad W M Ying S A homotopy algorithm for reduced order dynamic compensation using the Hyland Bernstein optimal projection equations Journal of Guidance Control amp Dynamics 1996 19 2 407 417 doi 10 2514 3 21633 Hyland D C Bernstein D S The optimal projection equations for fixed order dynamic compensation IEEE Transaction on Automatic Control 1984 AC 29 11 1034 1037 doi 10 1109 TAC 1984 1103418 Bernstein D S Davis L D Hyland D C The optimal projection equations for reduced order discrete time modeling estimation and control Journal of Guidance Control and Dynamics 1986 9 3 288 293 doi 10 2514 3 20105 Green Michael Limebeer David J N Linear Robust Control Englewood Cliffs Prentice Hall 1995 27 ISBN 0 13 102278 4 延伸閱讀 编辑Stengel Robert F Optimal Control and Estimation New York Dover 1994 ISBN 0 486 68200 5 取自 https zh wikipedia org w index php title LQG控制 amp oldid 78934947, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。