fbpx
维基百科

共轭梯度法的推导

数值线性代数中,共轭梯度法是一种求解对称正定线性方程组

迭代方法。共轭梯度法可以从不同的角度推导而得,包括作为求解最优化问题的共轭方向法的特例,以及作为求解特征值问题的Arnoldi/Lanczos迭代的变种。

本条目记述这些推导方法中的重要步骤。

从共轭方向法推导 编辑

从Arnoldi/Lanczos迭代推导 编辑

共轭梯度法可以看作Arnoldi/Lanczos迭代应用于求解线性方程组时的一个变种。

一般Arnoldi方法 编辑

Arnoldi迭代从一个向量 开始,通过定义 ,其中

 

逐步建立Krylov子空间

 

的一组标准正交基 

换言之,对于  由将 相对于 进行Gram-Schmidt正交化然后归一化得到。

写成矩阵形式,迭代过程可以表示为

 

其中

 

当应用于求解线性方程组时,Arnoldi迭代对应于初始解 的残量 开始迭代,在每一步迭代之后计算 和新的近似解 .

直接Lanzcos方法 编辑

在余下的讨论中,我们假定 是对称正定矩阵。由于 的对称性, 上Hessenberg矩阵 变成对阵三对角矩阵。于是它可以被更明确地表示为

 

这使得迭代中的 有一个简短的三项递推式。Arnoldi迭代从而简化为Lanczos迭代。

由于 对称正定, 同样也对称正定。因此, 可以通过不选主元的LU分解分解为

 

其中  有简单的递推式:

 

改写 

 

其中

 

此时需要观察到

 

实际上,  同样有简短的递推式:

 

通过这个形式,我们得到 的一个简单的递推式:

 

以上的递推关系立即导出比共轭梯度法稍微更复杂的直接Lanczos方法。

从正交性和共轭性导出共轭梯度法 编辑

如果我们允许缩放 并通过常数因子补偿缩放的系数,我们可能可以得到以下形式的更简单的递推式:

 

作为简化的前提,我们现在推导 的正交性和 的共轭性,即对于 ,

 

各个残量之间满足正交性的原因是 实际上可由 乘上一个系数而得。这是因为对于  ,对于 

 

要得到 的共轭性,只需证明 是对角矩阵:

 

是对称的下三角矩阵,因而必然是对角矩阵。

现在我们可以单纯由 的正交性和 的共轭性推导相对于缩放后的 的常数因子  

由于 的正交性,必然有 。于是

 

类似地,由于 的共轭性,必然有 。于是

 

推导至此完成。

参考文献 编辑

  1. Hestenes, M. R.; Stiefel, E. (PDF). Journal of Research of the National Bureau of Standards. 1952年12月, 49 (6) [2010-06-20]. (原始内容 (PDF)存档于2010-05-05). 
  2. Saad, Y. Chapter 6: Krylov Subspace Methods, Part I. Iterative methods for sparse linear systems 2nd. SIAM. 2003. ISBN 978-0898715347. 

共轭梯度法的推导, 在数值线性代数中, 共轭梯度法是一种求解对称正定线性方程组, displaystyle, boldsymbol, boldsymbol, 的迭代方法, 共轭梯度法可以从不同的角度推导而得, 包括作为求解最优化问题的共轭方向法的特例, 以及作为求解特征值问题的arnoldi, lanczos迭代的变种, 本条目记述这些推导方法中的重要步骤, 目录, 从共轭方向法推导, 从arnoldi, lanczos迭代推导, 一般arnoldi方法, 直接lanzcos方法, 从正交性和共轭性导出共轭梯度法,. 在数值线性代数中 共轭梯度法是一种求解对称正定线性方程组 A x b displaystyle boldsymbol Ax boldsymbol b 的迭代方法 共轭梯度法可以从不同的角度推导而得 包括作为求解最优化问题的共轭方向法的特例 以及作为求解特征值问题的Arnoldi Lanczos迭代的变种 本条目记述这些推导方法中的重要步骤 目录 1 从共轭方向法推导 2 从Arnoldi Lanczos迭代推导 2 1 一般Arnoldi方法 2 2 直接Lanzcos方法 2 3 从正交性和共轭性导出共轭梯度法 3 参考文献从共轭方向法推导 编辑此章节需要扩充 2010年6月 从Arnoldi Lanczos迭代推导 编辑共轭梯度法可以看作Arnoldi Lanczos迭代应用于求解线性方程组时的一个变种 一般Arnoldi方法 编辑 Arnoldi迭代从一个向量r 0 displaystyle boldsymbol r 0 nbsp 开始 通过定义v i w i w i 2 displaystyle boldsymbol v i boldsymbol w i lVert boldsymbol w i rVert 2 nbsp 其中 w i r 0 if i 1 A v i 1 j 1 i 1 v j T A v i 1 v j if i gt 1 displaystyle boldsymbol w i begin cases boldsymbol r 0 amp text if i 1 text boldsymbol Av i 1 sum j 1 i 1 boldsymbol v j mathrm T boldsymbol Av i 1 boldsymbol v j amp text if i gt 1 text end cases nbsp 逐步建立Krylov子空间 K A r 0 r 0 A r 0 A 2 r 0 displaystyle mathcal K boldsymbol A boldsymbol r 0 boldsymbol r 0 boldsymbol Ar 0 boldsymbol A 2 boldsymbol r 0 ldots nbsp 的一组标准正交基 v 1 v 2 v 3 displaystyle boldsymbol v 1 boldsymbol v 2 boldsymbol v 3 ldots nbsp 换言之 对于i gt 1 displaystyle i gt 1 nbsp v i displaystyle boldsymbol v i nbsp 由将A v i 1 displaystyle boldsymbol Av i 1 nbsp 相对于 v 1 v 2 v i 1 displaystyle boldsymbol v 1 boldsymbol v 2 ldots boldsymbol v i 1 nbsp 进行Gram Schmidt正交化然后归一化得到 写成矩阵形式 迭代过程可以表示为 A V i V i 1 H i displaystyle boldsymbol AV i boldsymbol V i 1 boldsymbol tilde H i text nbsp 其中 V i v 1 v 2 v i H i h 11 h 12 h 13 h 1 i h 21 h 22 h 23 h 2 i h 32 h 33 h 3 i h i i 1 h i i h i 1 i H i h i 1 i e i T h j i v j T A v i if j i w i 1 2 if j i 1 0 if j gt i 1 displaystyle begin aligned boldsymbol V i amp begin bmatrix boldsymbol v 1 amp boldsymbol v 2 amp cdots amp boldsymbol v i end bmatrix text boldsymbol tilde H i amp begin bmatrix h 11 amp h 12 amp h 13 amp cdots amp h 1 i h 21 amp h 22 amp h 23 amp cdots amp h 2 i amp h 32 amp h 33 amp cdots amp h 3 i amp amp ddots amp ddots amp vdots amp amp amp h i i 1 amp h i i amp amp amp amp h i 1 i end bmatrix begin bmatrix boldsymbol H i h i 1 i boldsymbol e i mathrm T end bmatrix text h ji amp begin cases boldsymbol v j mathrm T boldsymbol Av i amp text if j leq i text lVert boldsymbol w i 1 rVert 2 amp text if j i 1 text 0 amp text if j gt i 1 text end cases end aligned nbsp 当应用于求解线性方程组时 Arnoldi迭代对应于初始解x 0 displaystyle boldsymbol x 0 nbsp 的残量r 0 b A x 0 displaystyle boldsymbol r 0 boldsymbol b boldsymbol Ax 0 nbsp 开始迭代 在每一步迭代之后计算y i H i 1 r 0 2 e 1 displaystyle boldsymbol y i boldsymbol H i 1 lVert boldsymbol r 0 rVert 2 boldsymbol e 1 nbsp 和新的近似解x i x 0 V i y i displaystyle boldsymbol x i boldsymbol x 0 boldsymbol V i boldsymbol y i nbsp 直接Lanzcos方法 编辑 在余下的讨论中 我们假定A displaystyle boldsymbol A nbsp 是对称正定矩阵 由于A displaystyle boldsymbol A nbsp 的对称性 上Hessenberg矩阵H i V i T A V i displaystyle boldsymbol H i boldsymbol V i mathrm T boldsymbol AV i nbsp 变成对阵三对角矩阵 于是它可以被更明确地表示为 H i a 1 b 2 b 2 a 2 b 3 b i 1 a i 1 b i b i a i displaystyle boldsymbol H i begin bmatrix a 1 amp b 2 b 2 amp a 2 amp b 3 amp ddots amp ddots amp ddots amp amp b i 1 amp a i 1 amp b i amp amp amp b i amp a i end bmatrix text nbsp 这使得迭代中的v i displaystyle boldsymbol v i nbsp 有一个简短的三项递推式 Arnoldi迭代从而简化为Lanczos迭代 由于A displaystyle boldsymbol A nbsp 对称正定 H i displaystyle boldsymbol H i nbsp 同样也对称正定 因此 H i displaystyle boldsymbol H i nbsp 可以通过不选主元的LU分解分解为 H i L i U i 1 c 2 1 c i 1 1 c i 1 d 1 b 2 d 2 b 3 d i 1 b i d i displaystyle boldsymbol H i boldsymbol L i boldsymbol U i begin bmatrix 1 c 2 amp 1 amp ddots amp ddots amp amp c i 1 amp 1 amp amp amp c i amp 1 end bmatrix begin bmatrix d 1 amp b 2 amp d 2 amp b 3 amp amp ddots amp ddots amp amp amp d i 1 amp b i amp amp amp amp d i end bmatrix text nbsp 其中c i displaystyle c i nbsp 和d i displaystyle d i nbsp 有简单的递推式 c i b i d i 1 d i a 1 if i 1 a i c i b i if i gt 1 displaystyle begin aligned c i amp b i d i 1 text d i amp begin cases a 1 amp text if i 1 text a i c i b i amp text if i gt 1 text end cases end aligned nbsp 改写x i x 0 V i y i displaystyle boldsymbol x i boldsymbol x 0 boldsymbol V i boldsymbol y i nbsp 为 x i x 0 V i H i 1 r 0 2 e 1 x 0 V i U i 1 L i 1 r 0 2 e 1 x 0 P i z i displaystyle begin aligned boldsymbol x i amp boldsymbol x 0 boldsymbol V i boldsymbol H i 1 lVert boldsymbol r 0 rVert 2 boldsymbol e 1 amp boldsymbol x 0 boldsymbol V i boldsymbol U i 1 boldsymbol L i 1 lVert boldsymbol r 0 rVert 2 boldsymbol e 1 amp boldsymbol x 0 boldsymbol P i boldsymbol z i text end aligned nbsp 其中 P i V i U i 1 z i L i 1 r 0 2 e 1 displaystyle begin aligned boldsymbol P i amp boldsymbol V i boldsymbol U i 1 text boldsymbol z i amp boldsymbol L i 1 lVert boldsymbol r 0 rVert 2 boldsymbol e 1 text end aligned nbsp 此时需要观察到 P i P i 1 p i z i z i 1 z i displaystyle begin aligned boldsymbol P i amp begin bmatrix boldsymbol P i 1 amp boldsymbol p i end bmatrix text boldsymbol z i amp begin bmatrix boldsymbol z i 1 zeta i end bmatrix text end aligned nbsp 实际上 p i displaystyle boldsymbol p i nbsp 和z i displaystyle zeta i nbsp 同样有简短的递推式 p i 1 d i v i b i p i 1 a i c i z i 1 displaystyle begin aligned boldsymbol p i amp frac 1 d i boldsymbol v i b i boldsymbol p i 1 text alpha i amp c i zeta i 1 text end aligned nbsp 通过这个形式 我们得到x i displaystyle boldsymbol x i nbsp 的一个简单的递推式 x i x 0 P i z i x 0 P i 1 z i 1 z i p i x i 1 z i p i displaystyle begin aligned boldsymbol x i amp boldsymbol x 0 boldsymbol P i boldsymbol z i amp boldsymbol x 0 boldsymbol P i 1 boldsymbol z i 1 zeta i boldsymbol p i amp boldsymbol x i 1 zeta i boldsymbol p i text end aligned nbsp 以上的递推关系立即导出比共轭梯度法稍微更复杂的直接Lanczos方法 从正交性和共轭性导出共轭梯度法 编辑 如果我们允许缩放p i displaystyle boldsymbol p i nbsp 并通过常数因子补偿缩放的系数 我们可能可以得到以下形式的更简单的递推式 x i x i 1 a i 1 p i 1 r i r i 1 a i 1 A p i 1 p i r i b i 1 p i 1 displaystyle begin aligned boldsymbol x i amp boldsymbol x i 1 alpha i 1 boldsymbol p i 1 text boldsymbol r i amp boldsymbol r i 1 alpha i 1 boldsymbol Ap i 1 text boldsymbol p i amp boldsymbol r i beta i 1 boldsymbol p i 1 text end aligned nbsp 作为简化的前提 我们现在推导r i displaystyle boldsymbol r i nbsp 的正交性和p i displaystyle boldsymbol p i nbsp 的共轭性 即对于i j displaystyle i neq j nbsp r i T r j 0 p i T A p j 0 displaystyle begin aligned boldsymbol r i mathrm T boldsymbol r j amp 0 text boldsymbol p i mathrm T boldsymbol Ap j amp 0 text end aligned nbsp 各个残量之间满足正交性的原因是r i displaystyle boldsymbol r i nbsp 实际上可由v i 1 displaystyle boldsymbol v i 1 nbsp 乘上一个系数而得 这是因为对于i 0 displaystyle i 0 nbsp r 0 r 0 2 v 1 displaystyle boldsymbol r 0 lVert boldsymbol r 0 rVert 2 boldsymbol v 1 nbsp 对于i gt 0 displaystyle i gt 0 nbsp r i b A x i b A x 0 V i y i r 0 A V i y i r 0 V i 1 H i y i r 0 V i H i y i h i 1 i e i T y i v i 1 r 0 2 v 1 V i r 0 2 e 1 h i 1 i e i T y i v i 1 h i 1 i e i T y i v i 1 displaystyle begin aligned boldsymbol r i amp boldsymbol b boldsymbol Ax i amp boldsymbol b boldsymbol A boldsymbol x 0 boldsymbol V i boldsymbol y i amp boldsymbol r 0 boldsymbol AV i boldsymbol y i amp boldsymbol r 0 boldsymbol V i 1 boldsymbol tilde H i boldsymbol y i amp boldsymbol r 0 boldsymbol V i boldsymbol H i boldsymbol y i h i 1 i boldsymbol e i mathrm T boldsymbol y i boldsymbol v i 1 amp lVert boldsymbol r 0 rVert 2 boldsymbol v 1 boldsymbol V i lVert boldsymbol r 0 rVert 2 boldsymbol e 1 h i 1 i boldsymbol e i mathrm T boldsymbol y i boldsymbol v i 1 amp h i 1 i boldsymbol e i mathrm T boldsymbol y i boldsymbol v i 1 text end aligned nbsp 要得到p i displaystyle boldsymbol p i nbsp 的共轭性 只需证明P i T A P i displaystyle boldsymbol P i mathrm T boldsymbol AP i nbsp 是对角矩阵 P i T A P i U i T V i T A V i U i 1 U i T H i U i 1 U i T L i U i U i 1 U i T L i displaystyle begin aligned boldsymbol P i mathrm T boldsymbol AP i amp boldsymbol U i mathrm T boldsymbol V i mathrm T boldsymbol AV i boldsymbol U i 1 amp boldsymbol U i mathrm T boldsymbol H i boldsymbol U i 1 amp boldsymbol U i mathrm T boldsymbol L i boldsymbol U i boldsymbol U i 1 amp boldsymbol U i mathrm T boldsymbol L i end aligned nbsp 是对称的下三角矩阵 因而必然是对角矩阵 现在我们可以单纯由r i displaystyle boldsymbol r i nbsp 的正交性和p i displaystyle boldsymbol p i nbsp 的共轭性推导相对于缩放后的p i displaystyle boldsymbol p i nbsp 的常数因子a i displaystyle alpha i nbsp 和b i displaystyle beta i nbsp 由于r i displaystyle boldsymbol r i nbsp 的正交性 必然有r i 1 T r i r i a i A p i T r i 0 displaystyle boldsymbol r i 1 mathrm T boldsymbol r i boldsymbol r i alpha i boldsymbol Ap i mathrm T boldsymbol r i 0 nbsp 于是 a i r i T r i r i T A p i r i T r i p i b i 1 p i 1 T A p i r i T r i p i T A p i displaystyle begin aligned alpha i amp frac boldsymbol r i mathrm T boldsymbol r i boldsymbol r i mathrm T boldsymbol Ap i amp frac boldsymbol r i mathrm T boldsymbol r i boldsymbol p i beta i 1 boldsymbol p i 1 mathrm T boldsymbol Ap i amp frac boldsymbol r i mathrm T boldsymbol r i boldsymbol p i mathrm T boldsymbol Ap i text end aligned nbsp 类似地 由于p i displaystyle boldsymbol p i nbsp 的共轭性 必然有p i 1 T A p i r i 1 b i p i T A p i 0 displaystyle boldsymbol p i 1 mathrm T boldsymbol Ap i boldsymbol r i 1 beta i boldsymbol p i mathrm T boldsymbol Ap i 0 nbsp 于是 b i r i 1 T A p i p i T A p i r i 1 T r i r i 1 a i p i T A p i r i 1 T r i 1 r i T r i displaystyle begin aligned beta i amp frac boldsymbol r i 1 mathrm T boldsymbol Ap i boldsymbol p i mathrm T boldsymbol Ap i amp frac boldsymbol r i 1 mathrm T boldsymbol r i boldsymbol r i 1 alpha i boldsymbol p i mathrm T boldsymbol Ap i amp frac boldsymbol r i 1 mathrm T boldsymbol r i 1 boldsymbol r i mathrm T boldsymbol r i text end aligned nbsp 推导至此完成 参考文献 编辑Hestenes M R Stiefel E Methods of conjugate gradients for solving linear systems PDF Journal of Research of the National Bureau of Standards 1952年12月 49 6 2010 06 20 原始内容 PDF 存档于2010 05 05 Saad Y Chapter 6 Krylov Subspace Methods Part I Iterative methods for sparse linear systems 2nd SIAM 2003 ISBN 978 0898715347 取自 https zh wikipedia org w index php title 共轭梯度法的推导 amp oldid 63331924, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。