fbpx
维基百科

最佳投影方程

最佳投影方程(optimal projection equations)[1][2][3]控制理论中,建構局部最佳降階LQG控制器的充分必要条件[4]

LQG控制(線性二次高斯控制)問題是最优控制領域中最基礎的問題之一,這問題包括了存在不確定性的線性系統,受到加性高斯白噪声的影響,沒有完整的狀態資訊(無法量測到所有的狀態變數,也無法透過回授得知),對應二次的成本泛函。不過存在唯一解,而且可以建構線性動態回授的控制律,易於計算以及實現。而LQG控制器也是非線性系統中最佳擾動控制的基礎[5]

LQG控制器的架構會類似要控制的系統,兩者會有相同的維度。因此若系統本身就是高維度,要實現(全階)LQG控制器會很困難。降階LQG問題(固定階LQG問題)事先固定LQG控制器的階數,因此克服了這個困難。不過在全階LQG控制器中適用的分離原理,在降階LQG問題中已無法適用,因此這方面會更困難,而且其解也不唯一。不過可以找到數值分析的演算法[4][6][7][8]來求解對應的最佳投影方程。

問題的數學表示以及其解 编辑

連續時間 编辑

降階的LQG控制問題幾乎和全階的LQG控制問題相同。令 表示降階LQG控制器的狀態,唯一的差異是LQG控制器的狀態維度 是事先定義好的值,比受控系統的狀態維度 要少。

降階LQG控制器可以表示為下式:

 
 

上述公式刻意寫的類似傳統全階LQG控制器的形式,降階的LQG控制問題也可以改寫為下式:

 
 

其中

 

降階LQG控制器的矩陣  是由所謂的最佳投影方程(optimal projection equations、OPE)來決定[3]

 維的最佳投影方陣 OPE的核心。此矩陣的秩在所有狀態下幾乎都等於 。相關投影為斜投影(oblique projection): 。最佳投影方程包括四個矩陣微分方程。前二個是LQG控制器對應的矩陣Riccati微分方程的擴展。在方程式中 表示 ,而  維的單位矩陣

 
 

若LQG的維度沒有減少,也就是 ,則 ,上述二個方程就是二個沒有耦合的矩陣Riccati微分方程,對應全階的LQG控制器。若 ,則兩個方程會有斜投影項 。這也是為何降階的LQG控制器無法分離的原因,斜投影 是由另外二個矩陣微分方程所決定,其中也和秩的條件(rank conditions)有關。這四個矩陣微分方程組成了最佳投影方程。為了要列出另外二個矩陣微分方程,先定義以下二個矩陣:

 
 
 
 

則最後二個矩陣微分方程如下:

  almost everywhere,
  almost everywhere,

其中

 

此處的 * 表示群廣義逆矩陣(group generalized inverse)或Drazin逆矩陣英语Drazin inverse,是唯一的,定義如下

 

其中 + 是摩尔-彭若斯广义逆.

矩陣 都需要是非負對稱矩陣。可以建構最佳投影方程的解,而此解可以決定降階LQG控制器矩陣  

 
 
 
 

上式中的矩陣 是符合以下性質的矩陣:

 幾乎在所有狀態下。

可以由 的投影分解中得到[4]

若降階LQG問題中的所有矩陣都是非時變的,且最終時間(horizon) 趨近無限大,則最佳降階LQG控制器和最佳投影方程也都會是非時變的[1]。此情形下,最佳投影方程左側的微分項會為零。

離散時間 编辑

離散時間的情形類似連續時間的例子,要處理的是將 階傳統離散時間全階LQG問題轉換為事先已知固定階數的 階降階LQG控制器。為了要表示離散時間的OPE,先引入以下二個矩陣:

 
 
 
 

則離散時間OPE為

 .
 .
  almost everywhere,
  almost everywhere.

斜投影(oblique projection)矩陣為

 

非負對稱矩陣 是離散時間OPE的解,也決定了降階LQG控制器的矩陣  and  

 
 
 
 

在上述的方程中,矩陣 是有以下性質的矩陣:

 幾乎在所有狀態下。

這些矩陣可以從 的投影因式分解中求得[4]

如同在連續時間中的例子一樣,若問題中所有的矩陣都是非時變,且且最終時間(horizon) 趨近無限大,降階LQG控制器就會是非時變的。因此離散時間OPE會收斂到穩態解,決定非時變的降階LOG控制器[2]

離散時間OPE也可以應用在狀態維度,輸入維度或是輸出維度可變的離散時間系統(具有時變維度的離散時間系統)[6]。若在數位控制器中的取樣是不同步的,就可能會出現這類的系統。

參考資料 编辑

  1. ^ 1.0 1.1 Hyland D.C; Bernstein D.S. The optimal projection equations for fixed order dynamic compensation. IEEE Transactions on Automatic Control. 1984, AC–29 (11): 1034–1037. doi:10.1109/TAC.1984.1103418. hdl:2027.42/57875. 
  2. ^ 2.0 2.1 Bernstein D.S.; Davis L.D.; Hyland D.C. (PDF). Journal of Guidance Control and Dynamics. 1986, 9 (3): 288–293 [2020-02-04]. Bibcode:1986JGCD....9..288B. doi:10.2514/3.20105. hdl:2027.42/57880. (原始内容 (PDF)存档于2022-01-09). 
  3. ^ 3.0 3.1 Haddad W.M.; Tadmor G. Reduced-order LQG controllers for linear time-varying plants. Systems & Control Letters. 1993, 20 (2): 87–97. doi:10.1016/0167-6911(93)90020-7. 
  4. ^ 4.0 4.1 4.2 4.3 Van Willigenburg L.G.; De Koning W.L. Numerical algorithms and issues concerning the discrete-time optimal projection equations. European Journal of Control. 2000, 6 (1): 93–100. doi:10.1016/s0947-3580(00)70917-4.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  5. ^ Athans M. The role and use of the stochastic linear-quadratic-Gaussian problem in control system design. IEEE Transactions on Automatic Control. 1971, AC–16 (6): 529–552. doi:10.1109/TAC.1971.1099818. 
  6. ^ 6.0 6.1 Van Willigenburg L.G.; De Koning W.L. Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters. Automatica. 1999, 35: 129–138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central (页面存档备份,存于互联网档案馆).
  7. ^ Zigic D.; Watson L.T.; Collins E.G.; Haddad W.M.; Ying S. Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem. International Journal of Control. 1996, 56 (1): 173–191. doi:10.1080/00207179208934308. 
  8. ^ Collins Jr. E.G; Haddad W.M.; Ying S. A homotopy algorithm for reduced-order dynamic compensation using the Hyland–Bernstein optimal projection equations. Journal of Guidance Control & Dynamics. 1996, 19 (2): 407–417. doi:10.2514/3.21633. 

最佳投影方程, optimal, projection, equations, 是控制理论中, 建構局部最佳降階lqg控制器的充分必要条件, lqg控制, 線性二次高斯控制, 問題是最优控制領域中最基礎的問題之一, 這問題包括了存在不確定性的線性系統, 受到加性高斯白噪声的影響, 沒有完整的狀態資訊, 無法量測到所有的狀態變數, 也無法透過回授得知, 對應二次的成本泛函, 不過存在唯一解, 而且可以建構線性動態回授的控制律, 易於計算以及實現, 而lqg控制器也是非線性系統中最佳擾動控制的基礎, lqg控制器的架構. 最佳投影方程 optimal projection equations 1 2 3 是控制理论中 建構局部最佳降階LQG控制器的充分必要条件 4 LQG控制 線性二次高斯控制 問題是最优控制領域中最基礎的問題之一 這問題包括了存在不確定性的線性系統 受到加性高斯白噪声的影響 沒有完整的狀態資訊 無法量測到所有的狀態變數 也無法透過回授得知 對應二次的成本泛函 不過存在唯一解 而且可以建構線性動態回授的控制律 易於計算以及實現 而LQG控制器也是非線性系統中最佳擾動控制的基礎 5 LQG控制器的架構會類似要控制的系統 兩者會有相同的維度 因此若系統本身就是高維度 要實現 全階 LQG控制器會很困難 降階LQG問題 固定階LQG問題 事先固定LQG控制器的階數 因此克服了這個困難 不過在全階LQG控制器中適用的分離原理 在降階LQG問題中已無法適用 因此這方面會更困難 而且其解也不唯一 不過可以找到數值分析的演算法 4 6 7 8 來求解對應的最佳投影方程 目录 1 問題的數學表示以及其解 1 1 連續時間 1 2 離散時間 2 參考資料問題的數學表示以及其解 编辑連續時間 编辑 降階的LQG控制問題幾乎和全階的LQG控制問題相同 令x r t displaystyle hat mathbf x r t nbsp 表示降階LQG控制器的狀態 唯一的差異是LQG控制器的狀態維度n r d i m x r t displaystyle n r dim hat mathbf x r t nbsp 是事先定義好的值 比受控系統的狀態維度n d i m x t displaystyle n dim mathbf x t nbsp 要少 降階LQG控制器可以表示為下式 x r t A r t x r t B r t u t K r t y t C r t x r t x r 0 x r 0 displaystyle dot hat mathbf x r t A r t hat mathbf x r t B r t mathbf u t K r t left mathbf y t C r t hat mathbf x r t right hat mathbf x r 0 mathbf x r 0 nbsp u t L r t x r t displaystyle mathbf u t L r t hat mathbf x r t nbsp 上述公式刻意寫的類似傳統全階LQG控制器的形式 降階的LQG控制問題也可以改寫為下式 x r t F r t x r t K r t y t x r 0 x r 0 displaystyle dot hat mathbf x r t F r t hat mathbf x r t K r t mathbf y t hat mathbf x r 0 mathbf x r 0 nbsp u t L r t x r t displaystyle mathbf u t L r t hat mathbf x r t nbsp 其中 F r t A r t B r t L r t K r t C r t displaystyle F r t A r t B r t L r t K r t C r t nbsp 降階LQG控制器的矩陣F r t K r t L r t displaystyle F r t K r t L r t nbsp 和x r 0 displaystyle mathbf x r 0 nbsp 是由所謂的最佳投影方程 optimal projection equations OPE 來決定 3 n displaystyle n nbsp 維的最佳投影方陣t t displaystyle tau t nbsp 是OPE的核心 此矩陣的秩在所有狀態下幾乎都等於n r displaystyle n r nbsp 相關投影為斜投影 oblique projection t 2 t t t displaystyle tau 2 t tau t nbsp 最佳投影方程包括四個矩陣微分方程 前二個是LQG控制器對應的矩陣Riccati微分方程的擴展 在方程式中t t displaystyle tau perp t nbsp 表示I n t t displaystyle I n tau t nbsp 而I n displaystyle I n nbsp 為n displaystyle n nbsp 維的單位矩陣 P t A t P t P t A t P t C t W 1 t C t P t V t t t P t C t W 1 t C t P t t t P 0 E x 0 x 0 S t A t S t S t A t S t B t R 1 t B t S t Q t t t S t B t R 1 t B t S t t t displaystyle begin aligned dot P t amp A t P t P t A t P t C t W 1 t C t P t V t 6pt amp tau perp t P t C t W 1 t C t P t tau perp t 6pt P 0 amp E left mathbf x 0 mathbf x 0 right 6pt amp dot S t A t S t S t A t S t B t R 1 t B t S t Q t 6pt amp tau perp t S t B t R 1 t B t S t tau perp t end aligned nbsp S T F displaystyle S T F nbsp 若LQG的維度沒有減少 也就是n n r displaystyle n n r nbsp 則t t I n t t 0 displaystyle tau t I n tau perp t 0 nbsp 上述二個方程就是二個沒有耦合的矩陣Riccati微分方程 對應全階的LQG控制器 若n r lt n displaystyle n r lt n nbsp 則兩個方程會有斜投影項t t displaystyle tau t nbsp 這也是為何降階的LQG控制器無法分離的原因 斜投影t t displaystyle tau t nbsp 是由另外二個矩陣微分方程所決定 其中也和秩的條件 rank conditions 有關 這四個矩陣微分方程組成了最佳投影方程 為了要列出另外二個矩陣微分方程 先定義以下二個矩陣 PS 1 t A t B t R 1 t B t S t P t P t A t B t R 1 t B t S t displaystyle Psi 1 t A t B t R 1 t B t S t hat P t hat P t A t B t R 1 t B t S t nbsp P t C t W 1 t C t P t displaystyle P t C t W 1 t C t P t nbsp dd dd dd PS 2 t A t P t C t W 1 t C t S t S t A t P t C t W 1 t C t displaystyle Psi 2 t A t P t C t W 1 t C t hat S t hat S t A t P t C t W 1 t C t nbsp S t B t R 1 t B t S t displaystyle S t B t R 1 t B t S t nbsp dd dd dd 則最後二個矩陣微分方程如下 P t 1 2 t t PS 1 t PS 1 t t t P 0 E x 0 E x 0 rank P t n r displaystyle dot hat P t 1 2 left tau t Psi 1 t Psi 1 t tau t right hat P 0 E mathbf x 0 E mathbf x 0 operatorname rank hat P t n r nbsp almost everywhere S t 1 2 t t PS 2 t PS 2 t t t S T 0 rank S t n r displaystyle dot hat S t 1 2 left tau t Psi 2 t Psi 2 t tau t right hat S T 0 operatorname rank hat S t n r nbsp almost everywhere 其中 t t P t S t P t S t displaystyle tau t hat P t hat S t left hat P t hat S t right nbsp 此處的 表示群廣義逆矩陣 group generalized inverse 或Drazin逆矩陣 英语 Drazin inverse 是唯一的 定義如下 A A A 3 A displaystyle A A A 3 A nbsp 其中 是摩尔 彭若斯广义逆 矩陣P t S t P t S t displaystyle P t S t hat P t hat S t nbsp 都需要是非負對稱矩陣 可以建構最佳投影方程的解 而此解可以決定降階LQG控制器矩陣F r t K r t L r t displaystyle F r t K r t L r t nbsp 和x r 0 displaystyle mathbf x r 0 nbsp F r t H t A t P t C t W 1 t C t B t R 1 t B t S t G t H t G t displaystyle F r t H t left A t P t C t W 1 t C t B t R 1 t B t S t right G t dot H t G t nbsp K r t H t P t C t W 1 t displaystyle K r t H t P t C t W 1 t nbsp L r t R 1 t B t S t G t displaystyle L r t R 1 t B t S t G t nbsp x r 0 H 0 E x 0 displaystyle mathbf x r 0 H 0 E mathbf x 0 nbsp 上式中的矩陣G t H t displaystyle G t H t nbsp 是符合以下性質的矩陣 G t H t t t G t H t I n r displaystyle G t H t tau t G t H t I n r nbsp 幾乎在所有狀態下 可以由P t S t displaystyle hat P t hat S t nbsp 的投影分解中得到 4 若降階LQG問題中的所有矩陣都是非時變的 且最終時間 horizon T displaystyle T nbsp 趨近無限大 則最佳降階LQG控制器和最佳投影方程也都會是非時變的 1 此情形下 最佳投影方程左側的微分項會為零 離散時間 编辑 離散時間的情形類似連續時間的例子 要處理的是將n displaystyle n nbsp 階傳統離散時間全階LQG問題轉換為事先已知固定階數的n r lt n displaystyle n r lt n nbsp 階降階LQG控制器 為了要表示離散時間的OPE 先引入以下二個矩陣 PS i 1 A i B i B i S i 1 B i R i 1 B i S i 1 A i P i A i B i B i S i 1 B i R i 1 B i S i 1 A i displaystyle Psi i 1 left A i B i B i S i 1 B i R i 1 B i S i 1 A i right hat P i left A i B i B i S i 1 B i R i 1 B i S i 1 A i right nbsp A i P i C i C i P i C i W i 1 C i P i A i displaystyle A i P i C i C i P i C i W i 1 C i P i A i nbsp dd dd dd PS i 1 2 A i A i P i C i C i P i C i W i 1 C i S i 1 A i A i P i C i C i P i C i W i 1 C i displaystyle Psi i 1 2 left A i A i P i C i C i P i C i W i 1 C i right hat S i 1 left A i A i P i C i C i P i C i W i 1 C i right nbsp A i S i 1 B i B i S i 1 B i R i 1 B i S i 1 A i displaystyle A i S i 1 B i B i S i 1 B i R i 1 B i S i 1 A i nbsp dd dd dd 則離散時間OPE為 P i 1 A i P i P i C i C i P i C i W i 1 C i P i A i V i t i 1 PS i 1 t i 1 P 0 E x 0 x 0 displaystyle P i 1 A i left P i P i C i left C i P i C i W i right 1 C i P i right A i V i tau perp i 1 Psi i 1 tau perp i 1 P 0 E left mathbf x 0 mathbf x 0 right nbsp S i A i S i 1 S i 1 B i B i S i 1 B i R i 1 B i S i 1 A i Q i t i PS i 1 2 t i S N F displaystyle S i A i left S i 1 S i 1 B i left B i S i 1 B i R i right 1 B i S i 1 right A i Q i tau perp i Psi i 1 2 tau perp i S N F nbsp P i 1 1 2 t i 1 PS i 1 PS i 1 t i 1 P 0 E x 0 E x 0 rank P i n r displaystyle hat P i 1 1 2 tau i 1 Psi i 1 Psi i 1 tau i 1 hat P 0 E mathbf x 0 E mathbf x 0 operatorname rank hat P i n r nbsp almost everywhere S i 1 2 t i PS i 1 2 PS i 1 2 t i S N 0 rank S i n r displaystyle hat S i 1 2 tau i Psi i 1 2 Psi i 1 2 tau i hat S N 0 operatorname rank hat S i n r nbsp almost everywhere 斜投影 oblique projection 矩陣為 t i P i S i P i S i displaystyle tau i hat P i hat S i left hat P i hat S i right nbsp 非負對稱矩陣P i S i P i S i displaystyle P i S i hat P i hat S i nbsp 是離散時間OPE的解 也決定了降階LQG控制器的矩陣F i r K i r L i r displaystyle F i r K i r L i r nbsp and x 0 r displaystyle mathbf x 0 r nbsp F i r H i 1 A i P i C i C i P i C i W i 1 C i B i B i S i 1 B i R i 1 B i S i 1 G i displaystyle F i r H i 1 left A i P i C i left C i P i C i W i right 1 C i B i left B i S i 1 B i R i right 1 B i S i 1 right G i nbsp K i r H i 1 P i C i C i P i C i W i 1 displaystyle K i r H i 1 P i C i left C i P i C i W i right 1 nbsp L i r B i S i 1 B i R i 1 B i S i 1 G i displaystyle L i r left B i S i 1 B i R i right 1 B i S i 1 G i nbsp x 0 r H 0 E x 0 displaystyle mathbf x 0 r H 0 E mathbf x 0 nbsp 在上述的方程中 矩陣G i H i displaystyle G i H i nbsp 是有以下性質的矩陣 G i H i t i G i H i I n r displaystyle G i H i tau i G i H i I n r nbsp 幾乎在所有狀態下 這些矩陣可以從P i S i displaystyle hat P i hat S i nbsp 的投影因式分解中求得 4 如同在連續時間中的例子一樣 若問題中所有的矩陣都是非時變 且且最終時間 horizon T displaystyle T nbsp 趨近無限大 降階LQG控制器就會是非時變的 因此離散時間OPE會收斂到穩態解 決定非時變的降階LOG控制器 2 離散時間OPE也可以應用在狀態維度 輸入維度或是輸出維度可變的離散時間系統 具有時變維度的離散時間系統 6 若在數位控制器中的取樣是不同步的 就可能會出現這類的系統 參考資料 编辑 1 0 1 1 Hyland D C Bernstein D S The optimal projection equations for fixed order dynamic compensation IEEE Transactions on Automatic Control 1984 AC 29 11 1034 1037 doi 10 1109 TAC 1984 1103418 hdl 2027 42 57875 2 0 2 1 Bernstein D S Davis L D Hyland D C The optimal projection equations for reduced order discrete time modeling estimation and control PDF Journal of Guidance Control and Dynamics 1986 9 3 288 293 2020 02 04 Bibcode 1986JGCD 9 288B doi 10 2514 3 20105 hdl 2027 42 57880 原始内容 PDF 存档于2022 01 09 3 0 3 1 Haddad W M Tadmor G Reduced order LQG controllers for linear time varying plants Systems amp Control Letters 1993 20 2 87 97 doi 10 1016 0167 6911 93 90020 7 4 0 4 1 4 2 4 3 Van Willigenburg L G De Koning W L Numerical algorithms and issues concerning the discrete time optimal projection equations European Journal of Control 2000 6 1 93 100 doi 10 1016 s0947 3580 00 70917 4 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 Athans M The role and use of the stochastic linear quadratic Gaussian problem in control system design IEEE Transactions on Automatic Control 1971 AC 16 6 529 552 doi 10 1109 TAC 1971 1099818 6 0 6 1 Van Willigenburg L G De Koning W L Optimal reduced order compensators for time varying discrete time systems with deterministic and white parameters Automatica 1999 35 129 138 doi 10 1016 S0005 1098 98 00138 1 Associated software download from Matlab Central 页面存档备份 存于互联网档案馆 Zigic D Watson L T Collins E G Haddad W M Ying S Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem International Journal of Control 1996 56 1 173 191 doi 10 1080 00207179208934308 Collins Jr E G Haddad W M Ying S A homotopy algorithm for reduced order dynamic compensation using the Hyland Bernstein optimal projection equations Journal of Guidance Control amp Dynamics 1996 19 2 407 417 doi 10 2514 3 21633 取自 https zh wikipedia org w index php title 最佳投影方程 amp oldid 72424410, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。