fbpx
维基百科

代數Riccati方程

代數Riccati方程(algebraic Riccati equation)是最优控制的非線性方程,和連續時間英语continuous time或是離散時間下,無限時間(infinite-horizon)的最优控制有關。

標準的代數Riccati方程如下:

連續時間代數Riccati方程(CARE):

離散時間代數Riccati方程(DARE):

P是未知數的n×n對稱矩陣,ABQR是已知係數矩陣。

一般而言此方程式有許多的解,不過若有存在穩定解的話,希望可以找到穩定解。

名稱的起源

此方程名稱中有Riccati,是因為和Riccati方程的關係。連續時間代數Riccati方程(CARE)可以由相關矩陣值的Riccati微分方程的非時變解來驗證。離散時間代數Riccati方程(DARE)可以由矩陣值的Riccati微分方程的非時變解來驗證(類似離散時間LQR下的Riccati微分方程)。

離散時間的代數Riccati方程

在無限時間的最佳控制問題中,關注的是一些變數在相當時間之後的值,因此需在現在選定控制變數的值,讓系統在之後的時間都在最佳狀態下運作。控制變數在任意時間下的最佳值可以用Riccati方程的解以及狀態變數當時的觀測值求得。若觀測變數及控制變數都不只一個,Riccati方程就會是矩阵方程。

代數Riccati方程可以決定無限時間下非時變LQR控制器的解,以及無限時間下非時變LQG控制的解。這兩個是控制理论中的基礎問題。

典型的離散時間LQR問題,是要最小化以下的函數

 

其狀態方程如下

 

其中 yn × 1 的狀態變數向量,uk × 1 的控制變數向量,An × n 的狀態遞移矩陣,Bn × k 的控制係數矩陣,Q (n × n) 是對應半正定狀態损失函数矩陣,R (k × k) 是對應正定的控制損失函數矩陣。

從最後時間往前的推導可以找到每一個時間的最佳控制解[1]

 

其中對應正定cost-to-go矩陣 P 會依下式,配合 ,以逆向時間推導

 

這個就是離散時間的代數Riccati方程。P的穩態解和和T趨近無限大時的無限時間問題有關,可以將動態方程反覆迭代直到收斂,來求得P的穩態解,之後再將動態方程中的時間標註移除,來確認穩態解是否正確。

求解

若代數Riccati方程存在穩定解,求解器一般會設法找到唯一的穩定解。穩定解的意思是指用此解控制相關的LQR系統,可以使閉迴路的系統穩定。

針對CARE,其控制律為

 

閉迴路遞移矩陣為

 

其穩定的充份必要條件是所有的特徵值都有負的實部。

針對DARE,其控制律為

 

閉迴路遞移矩陣為

 

其穩定的充份必要條件是所有的特徵值在複數平面的單位圓內。

代數Riccati方程的解可以用Riccati方程的的迭代或是矩陣因式分解求得。離散時間問題的一種迭代方式是由有限時間問題下的動態Riccati方程,每一次迭代時,矩陣中的值都是從最終時間往前一段有限時間內的最佳解,若進行無限長的迭代。就會分斂到特定矩陣,是無限時間內的最佳解。

針對大型系統,也可以用找特徵分解的方式求解。針對CARE,可以定義漢彌爾頓矩陣

 

因為 是漢彌爾頓矩陣,若在虛軸上沒有特徵值,則會有恰好一半的特徵值會有負的實部。若定義 矩陣,其纵排(column)形成對應子空間的基底,表示為區塊矩陣的形式,如下所示

 

 

是Riccati方程的解。而且 的特徵值即為 特徵值中有負實部的特徵值。

針對DARE,若 是可逆矩陣,可以定義辛矩陣

 

因為 是辛矩陣,若在單位圓圓周上沒有特徵值,則會有恰好一半的特徵值會在單位圓內。若定義 矩陣,其纵排(column)形成對應子空間的基底,表示為區塊矩陣的形式,如下所示 則

 

是Riccati方程的解。而且 的特徵值即為 特徵值中,在單位圓內的特徵值。

相關條目

參考資料

  1. ^ Chow, Gregory. Analysis and Control of Dynamic Economic Systems. New York: John Wiley & Sons. 1975. ISBN 0-471-15616-7. 
  • Peter Lancaster; Leiba Rodman, Algebraic Riccati equations, 牛津大學出版社: 504, 1995, ISBN 0-19-853795-6 
  • Alan J. Laub, A Schur method for solving algebraic RIccati equations (PDF), [2020-02-21], (原始内容 (PDF)于2016-10-24) 

外部連結

  • CARE solver help of MATLAB Control toolbox.
  • DARE solver help of MATLAB Control toolbox.
  • Python CARE and DARE solvers.(页面存档备份,存于互联网档案馆
  • Mathematica function to solve the continuous-time algebraic Riccati equation.(页面存档备份,存于互联网档案馆
  • Mathematica function to solve the discrete-time algebraic Riccati equation.(页面存档备份,存于互联网档案馆

代數riccati方程, algebraic, riccati, equation, 是最优控制的非線性方程, 和連續時間, 英语, continuous, time, 或是離散時間下, 無限時間, infinite, horizon, 的最优控制有關, 標準的如下, 連續時間, care, displaystyle, 離散時間, dare, displaystyle, p是未知數的n, n對稱矩陣, q及r是已知实係數矩陣, 一般而言此方程式有許多的解, 不過若有存在穩定解的話, 希望可以找到穩定解, 目录, 名. 代數Riccati方程 algebraic Riccati equation 是最优控制的非線性方程 和連續時間 英语 continuous time 或是離散時間下 無限時間 infinite horizon 的最优控制有關 標準的代數Riccati方程如下 連續時間代數Riccati方程 CARE A T P P A P B R 1 B T P Q 0 displaystyle A T P PA PBR 1 B T P Q 0 離散時間代數Riccati方程 DARE P A T P A A T P B R B T P B 1 B T P A Q displaystyle P A T PA A T PB R B T PB 1 B T PA Q P是未知數的n n對稱矩陣 A B Q及R是已知实係數矩陣 一般而言此方程式有許多的解 不過若有存在穩定解的話 希望可以找到穩定解 目录 1 名稱的起源 2 離散時間的代數Riccati方程 3 求解 4 相關條目 5 參考資料 6 外部連結名稱的起源 编辑此方程名稱中有Riccati 是因為和Riccati方程的關係 連續時間代數Riccati方程 CARE 可以由相關矩陣值的Riccati微分方程的非時變解來驗證 離散時間代數Riccati方程 DARE 可以由矩陣值的Riccati微分方程的非時變解來驗證 類似離散時間LQR下的Riccati微分方程 離散時間的代數Riccati方程 编辑在無限時間的最佳控制問題中 關注的是一些變數在相當時間之後的值 因此需在現在選定控制變數的值 讓系統在之後的時間都在最佳狀態下運作 控制變數在任意時間下的最佳值可以用Riccati方程的解以及狀態變數當時的觀測值求得 若觀測變數及控制變數都不只一個 Riccati方程就會是矩阵方程 代數Riccati方程可以決定無限時間下非時變LQR控制器的解 以及無限時間下非時變LQG控制的解 這兩個是控制理论中的基礎問題 典型的離散時間LQR問題 是要最小化以下的函數 t 1 T y t T Q y t u t T R u t displaystyle sum t 1 T y t T Qy t u t T Ru t 其狀態方程如下 y t A y t 1 B u t displaystyle y t Ay t 1 Bu t 其中 y 是 n 1 的狀態變數向量 u 是 k 1 的控制變數向量 A 是 n n 的狀態遞移矩陣 B 是 n k 的控制係數矩陣 Q n n 是對應半正定狀態损失函数矩陣 R k k 是對應正定的控制損失函數矩陣 從最後時間往前的推導可以找到每一個時間的最佳控制解 1 u t B T P t B R 1 B T P t A y t 1 displaystyle u t B T P t B R 1 B T P t A y t 1 其中對應正定cost to go矩陣 P 會依下式 配合P T Q displaystyle P T Q 以逆向時間推導 P t 1 Q A T P t A A T P t B B T P t B R 1 B T P t A displaystyle P t 1 Q A T P t A A T P t B B T P t B R 1 B T P t A 這個就是離散時間的代數Riccati方程 P的穩態解和和T趨近無限大時的無限時間問題有關 可以將動態方程反覆迭代直到收斂 來求得P的穩態解 之後再將動態方程中的時間標註移除 來確認穩態解是否正確 求解 编辑若代數Riccati方程存在穩定解 求解器一般會設法找到唯一的穩定解 穩定解的意思是指用此解控制相關的LQR系統 可以使閉迴路的系統穩定 針對CARE 其控制律為 K R 1 B T P displaystyle K R 1 B T P 閉迴路遞移矩陣為 A B K A B R 1 B T P displaystyle A BK A BR 1 B T P 其穩定的充份必要條件是所有的特徵值都有負的實部 針對DARE 其控制律為 K R B T P B 1 B T P A displaystyle K R B T PB 1 B T PA 閉迴路遞移矩陣為 A B K A B R B T P B 1 B T P A displaystyle A BK A B R B T PB 1 B T PA 其穩定的充份必要條件是所有的特徵值在複數平面的單位圓內 代數Riccati方程的解可以用Riccati方程的的迭代或是矩陣因式分解求得 離散時間問題的一種迭代方式是由有限時間問題下的動態Riccati方程 每一次迭代時 矩陣中的值都是從最終時間往前一段有限時間內的最佳解 若進行無限長的迭代 就會分斂到特定矩陣 是無限時間內的最佳解 針對大型系統 也可以用找特徵分解的方式求解 針對CARE 可以定義漢彌爾頓矩陣 Z A B R 1 B T Q A T displaystyle Z begin pmatrix A amp BR 1 B T Q amp A T end pmatrix 因為Z displaystyle scriptstyle Z 是漢彌爾頓矩陣 若在虛軸上沒有特徵值 則會有恰好一半的特徵值會有負的實部 若定義2 n n displaystyle scriptstyle 2n times n 矩陣 其纵排 column 形成對應子空間的基底 表示為區塊矩陣的形式 如下所示 U 1 U 2 displaystyle begin pmatrix U 1 U 2 end pmatrix 則 P U 2 U 1 1 displaystyle P U 2 U 1 1 是Riccati方程的解 而且A B R 1 B T P displaystyle scriptstyle A BR 1 B T P 的特徵值即為Z displaystyle scriptstyle Z 特徵值中有負實部的特徵值 針對DARE 若A displaystyle A 是可逆矩陣 可以定義辛矩陣 Z A B R 1 B T A 1 T Q B R 1 B T A 1 T A 1 T Q A 1 T displaystyle Z begin pmatrix A BR 1 B T A 1 T Q amp BR 1 B T A 1 T A 1 T Q amp A 1 T end pmatrix 因為Z displaystyle scriptstyle Z 是辛矩陣 若在單位圓圓周上沒有特徵值 則會有恰好一半的特徵值會在單位圓內 若定義2 n n displaystyle scriptstyle 2n times n 矩陣 其纵排 column 形成對應子空間的基底 表示為區塊矩陣的形式 如下所示 則 P U 2 U 1 1 displaystyle P U 2 U 1 1 是Riccati方程的解 而且A B R B T P B 1 B T P A displaystyle scriptstyle A B R B T PB 1 B T PA 的特徵值即為Z displaystyle scriptstyle Z 特徵值中 在單位圓內的特徵值 相關條目 编辑李亞普諾夫方程參考資料 编辑 Chow Gregory Analysis and Control of Dynamic Economic Systems New York John Wiley amp Sons 1975 ISBN 0 471 15616 7 Peter Lancaster Leiba Rodman Algebraic Riccati equations 牛津大學出版社 504 1995 ISBN 0 19 853795 6 Alan J Laub A Schur method for solving algebraic RIccati equations PDF 2020 02 21 原始内容存档 PDF 于2016 10 24 外部連結 编辑CARE solver help of MATLAB Control toolbox DARE solver help of MATLAB Control toolbox Online CARE solver for arbitrary sized matrices Python CARE and DARE solvers 页面存档备份 存于互联网档案馆 Mathematica function to solve the continuous time algebraic Riccati equation 页面存档备份 存于互联网档案馆 Mathematica function to solve the discrete time algebraic Riccati equation 页面存档备份 存于互联网档案馆 取自 https zh wikipedia org w index php title 代數Riccati方程 amp oldid 68100689, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。