fbpx
维基百科

莱文伯格-马夸特方法

莱文伯格-马夸特方法(英語:Levenberg–Marquardt algorithm)能提供數非線性最小化(局部最小)的數值解。此演算法能藉由執行時修改參數達到結合高斯-牛顿算法以及梯度下降法的優點,並對兩者之不足作改善(比如高斯-牛顿算法之反矩陣不存在或是初始值離局部極小值太遠)。[1]

問題描述 编辑

假設   是一個從   的非线性映射,也就是說   , 那麼:

 

而我們的目的就是希望任意給定一個   以及合理的初始值  ,我們能找到一個  ,使得   盡量小(局部極小),其中  

解法 编辑

像大多數最小化的方法一樣,這是一個迭代的方法。首先根據泰勒展开式我們能把   寫為下面的近似,這有兩個好處:第一是線性、第二是只需要一階微分。

 

其中  雅可比矩阵。對於每次的迭代我們這麼作:假設這次 iteration 的點是  ,我們要找到一個    最小。 根據投影公式我們知道當下面式子被滿足的時候能有最小誤差:

 

我們將這個公式略加修改得到:

 

就是莱文伯格-马夸特方法。如此一來   大的時候這種算法會接近最速下降法,小的時候會接近高斯-牛顿方法。為了確保每次   長度的減少,我們這麼作:先採用一個小的  ,如果   長度變大就增加  

這個演算法當以下某些條件達到時結束迭代:

  1. 如果發現   長度變化小於特定的給定值就結束。
  2. 發現   變化小於特定的給定值就結束。
  3. 到達了迭代的上限設定就結束。

參考資料 编辑

  1. ^ . www.mathworks.com. [2019-07-21]. (原始内容存档于2020-10-25). 

莱文伯格, 马夸特方法, 英語, levenberg, marquardt, algorithm, 能提供數非線性最小化, 局部最小, 的數值解, 此演算法能藉由執行時修改參數達到結合高斯, 牛顿算法以及梯度下降法的優點, 並對兩者之不足作改善, 比如高斯, 牛顿算法之反矩陣不存在或是初始值離局部極小值太遠, 問題描述, 编辑假設, displaystyle, nbsp, 是一個從, displaystyle, rightarrow, nbsp, 的非线性映射, 也就是說, displaystyle, mathbf. 莱文伯格 马夸特方法 英語 Levenberg Marquardt algorithm 能提供數非線性最小化 局部最小 的數值解 此演算法能藉由執行時修改參數達到結合高斯 牛顿算法以及梯度下降法的優點 並對兩者之不足作改善 比如高斯 牛顿算法之反矩陣不存在或是初始值離局部極小值太遠 1 問題描述 编辑假設 f displaystyle f nbsp 是一個從 ℜ m ℜ n displaystyle Re m rightarrow Re n nbsp 的非线性映射 也就是說 P ℜ m displaystyle mathbf P in Re m nbsp 且 X ℜ n displaystyle mathbf X in Re n nbsp 那麼 f P X displaystyle f mathbf P mathbf X nbsp 而我們的目的就是希望任意給定一個 x displaystyle mathbf x nbsp 以及合理的初始值 p 0 displaystyle mathbf p 0 nbsp 我們能找到一個 p displaystyle mathbf p nbsp 使得 ϵ T ϵ displaystyle mathbf epsilon T mathbf epsilon nbsp 盡量小 局部極小 其中 ϵ f p x displaystyle mathbf epsilon f mathbf p mathbf x nbsp 解法 编辑像大多數最小化的方法一樣 這是一個迭代的方法 首先根據泰勒展开式我們能把 f p d p displaystyle f mathbf p mathbf delta p nbsp 寫為下面的近似 這有兩個好處 第一是線性 第二是只需要一階微分 f p d p f p J d p displaystyle f mathbf p mathbf delta p approx f mathbf p mathbf J delta p nbsp 其中J displaystyle mathbf J nbsp 是f displaystyle f nbsp 的雅可比矩阵 對於每次的迭代我們這麼作 假設這次 iteration 的點是 p k displaystyle mathbf p k nbsp 我們要找到一個 d p k displaystyle mathbf delta mathbf p k nbsp 讓 x f p k d p k x f p k J d p k ϵ k J d p k displaystyle mathbf x f mathbf p k mathbf delta mathbf p k approx mathbf x f mathbf p k mathbf J mathbf delta mathbf p k mathbf epsilon k mathbf J mathbf delta mathbf p k nbsp 最小 根據投影公式我們知道當下面式子被滿足的時候能有最小誤差 J T J d p k J T ϵ k displaystyle mathbf J T mathbf J mathbf delta mathbf p k mathbf J T mathbf epsilon k nbsp 我們將這個公式略加修改得到 m I J T J d p k J T ϵ k displaystyle mu mathbf I mathbf J T mathbf J mathbf delta mathbf p k mathbf J T mathbf epsilon k nbsp 就是莱文伯格 马夸特方法 如此一來 m displaystyle mu nbsp 大的時候這種算法會接近最速下降法 小的時候會接近高斯 牛顿方法 為了確保每次 ϵ displaystyle mathbf epsilon nbsp 長度的減少 我們這麼作 先採用一個小的 m displaystyle mu nbsp 如果 ϵ displaystyle mathbf epsilon nbsp 長度變大就增加 m displaystyle mu nbsp 這個演算法當以下某些條件達到時結束迭代 如果發現 ϵ displaystyle mathbf epsilon nbsp 長度變化小於特定的給定值就結束 發現 d p displaystyle mathbf delta p nbsp 變化小於特定的給定值就結束 到達了迭代的上限設定就結束 參考資料 编辑 Levenberg Marquardt backpropagation MATLAB trainlm www mathworks com 2019 07 21 原始内容存档于2020 10 25 取自 https zh wikipedia org w index php title 莱文伯格 马夸特方法 amp oldid 74994195, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。