fbpx
维基百科

粒子濾波器

粒子滤波器(英語:particle filter)是一种使用蒙特卡罗方法递归滤波器,透过一组具有权重的随机样本(粒子)來表示隨機事件後驗機率,從含有雜訊或不完整的觀測序列,估計出動態系統的狀態,粒子濾波器可以運用在任何狀態空間的模型上。粒子濾波器是卡爾曼濾波器的一般化方法,卡爾曼濾波器建立在線性的狀態空間和高斯分布的雜訊上;而粒子濾波器的狀態空間模型可以是非線性,且雜訊分布可以是任何型式。

歷史 编辑

啟發式演算法 编辑

從統計和概率的角度來看,粒子濾波器屬於遗传算法分支过程的類別,並且是指平均場類型相互作用的粒子方法。 這些粒子方法的解釋取決於科學專業。 在進化計算中,平均場遺傳類型粒子方法通常用作啟發式和自然搜索算法(也稱為元啟發算法)。在計算物理學和分子化學中,它們用於解決費曼-卡茲(Feynman-Kac)路徑積分問題,或者用於計算玻爾茲曼-吉布斯(Boltzmann-Gibbs)度量,薛丁格算子的最高特徵值和基態。在生物學遺傳學中,它們還代表了某些環境中一群個體或基因的進化。

平均場類型進化計算技術的起源可以追溯到1950年和1954年,這是艾倫·圖靈在遺傳類型突變選擇學習機上的開創性工作,以及紐澤西州普林斯頓高級研究所的尼爾斯·艾爾·巴里切利(Nils Aall Barricelli)的文章。統計學中的粒子濾波器最早可追溯到1950年代中期。哈默斯利(Hammersley)等人在1954年提出的“窮人的蒙特卡洛”法暗示了當今使用的遺傳類型粒子過濾方法。 1963年,尼爾斯·艾爾·巴里切利(Nils Aall Barricelli)模擬了一種遺傳類型算法,以模仿個人玩簡單遊戲的能力。在進化計算文獻中,遺傳類型突變選擇算法通過1970年代初期約翰·霍蘭德(John Holland)的開創性工作而流行,特別是1975年出版的著作。

生物學遺傳學中,澳大利亞遺傳學家亞歷克斯·弗雷澤(Alex Fraser)在1957年還發表了一系列有關人工選擇生物的遺傳類型模擬的論文。 由生物學家進行的進化計算機模擬在1960年代初變得更加普遍,並且該方法在弗雷澤和伯內爾(Burnell)(1970)和克羅斯比(Crosby)(1973)的書中進行了描述。弗雷澤的模擬包括了現代突變選擇遺傳粒子算法的所有基本要素。

從數學觀點來看,給定一些部分和雜訊觀測結果的信號隨機狀態的條件分佈,是由信號的隨機軌跡上的費曼-卡茲(Feynman-Kac)概率描述的,該概率由一系列似然勢函數加權。量子蒙特卡洛法,更具體地說是擴散蒙特卡洛法,也可以解釋為費曼-卡茲路徑積分的平均場遺傳類型粒子近似。量子蒙特卡羅方法的起源通常歸因於恩里科·費米(Enrico Fermi)和羅伯特·里克特邁耶(Robert Richtmyer),他們於1948年開發了一種中子鏈反應的均值場粒子解釋方法,但它是第一個類似啟發式和遺傳類型的粒子算法(又名“重採樣”或“重新配置”蒙特卡洛方法) )是在1984年由Jack H. Hetherington提出的用於估計量子系統(在簡化的矩陣模型中)的基態能量的方法。還可以引用1951年出版的西奧多·愛德華·哈里斯(Theodore E. Harris)和赫爾曼·康恩(Herman Kahn)的開創性著作,該著作使用平均場,但類似於啟發式遺傳方法,用於估計粒子傳輸能量。在分子化學中,遺傳啟發式粒子方法(又名修剪和富集策略)的使用可以追溯到1955年馬歇爾(Marshall)的開創性工作。羅森布魯斯(N. Rosenbluth)和阿里安娜·W·羅森布盧斯(Arianna. W. Rosenbluth)。

遺傳粒子算法在高級信號處理貝葉斯推理中的使用是最近的。1993年1月,北川源四郎開發了“蒙特卡羅濾波器”,該文在1996年出現了輕微修改。1993年4月,戈登等人在他們的開創性著作中發表了遺傳類型算法在貝葉斯統計推斷中的應用。作者將其算法命名為“自舉濾波器”,並證明與其他濾波方法相比,其自舉算法不需要對該狀態空間或系統噪聲進行任何假設。獨立的是皮埃爾·德爾·莫拉爾(Pierre Del Moral)和希米爾孔·卡瓦略(Himilcon Carvalho),皮埃爾·德爾·莫拉爾(Pierre Del Moral),安德烈·莫寧(André Monin)和熱拉爾·薩魯特(Gérard Salut)在1990年代中期發表的有關粒子過濾器的論文。 1989-1992年初,皮埃爾·德爾·莫拉爾(P.Del Moral),J.C.諾耶(J.C. Noyer),G.Rigal和G.Salut在LAAS-CNRS中也開發了信號處理技術,並通過STCAN(服務技術)進行了一系列受限和分類研究des Constructions and Armes Navales),IT公司DIGILOG和LAAS-CNRS(系統分析和體系結構實驗室)來解決RADAR / SONAR和GPS信號處理問題。

數學基礎 编辑

從1950年到1996年,所有有關粒子過濾器,遺傳算法的出版物,包括在計算物理和分子化學中引入的修剪和重採樣蒙特卡洛方法,都提出了適用於不同情況的類似於自然和啟發式算法,而沒有任何證據證明它 們的一致性,也沒有討論估計的偏差以及基於族譜和祖先樹的算法。

這些粒子算法的數學基礎和首次嚴格的分析是由皮埃爾·德爾·莫拉爾(Pierre Del Moral)在1996年提出的。本文還包含了似然函數和未標準化的條件機率測度的粒子近似的無偏性質的證明。本文介紹的似然函數的無偏粒子估計器如今已用於貝式統計推理中。

到1990年代末,Dan Crisan,Jessica Gaines和Terry Lyons以及Dan Crisan,Pierre Del Moral和Terry Lyons也開發了具有不同種群大小的分支類型粒子方法。 P. Del Moral,A。Guionnet和L. Miclo在 2000年開發了該領域的進一步發展。第一個中心極限定理是由Pierre Del Moral和Alice Guionnet於1999年以及Pierre Del Moral和Laurent Miclo於2000年提出的。Pierre於1990年代末提出了關於粒子過濾器 時間參數的第一個統一收斂結果。 Del Moral和Alice Guionnet。 2001年,P。Del Moral和L. Miclo首次對基於族譜樹的粒子濾波器平滑器進行了嚴格的分析。

關於Feynman-Kac粒子方法論的理論和相關的粒子過濾器算法已在2000年和2004年的書中得到發展。這些抽象的概率模型封裝了遺傳類型算法,粒子和自舉濾波器,交互的卡爾曼濾波器(又稱Rao–Blackwellized 粒子濾波器),重要性採樣和重採樣樣式的粒子濾波器技術,包括基於族譜樹的方法和用於解決濾波和平滑問題的粒子後向方法。其他類別的粒子濾波方法包括基於族譜樹的模型,後向馬爾可夫粒子模型,自 適應平均場粒子模型,島型粒子模型和粒子馬爾可夫鏈蒙特卡羅方法。

滤波问题 编辑

目标 编辑

粒子滤波器的目标是通过观测值估计状态变量的后验概率。粒子滤波器是针对隐马尔可夫模型设计的,系统中既包含隐藏的变量,也包含可观测的变量[1]。可观测变量(观测过程)与隐藏变量(状态过程)通过某种已知的函数关系相关联。类似地,描述状态变量演化的动态系统也是概率学上已知的。

一个通用粒子滤波器通过观察测量过程估计隐藏状态的后验分布。考察下图所示的状态空间:

 

滤波问题是要通过给定的观测过程   在任意时刻 k 的值,序列地估计隐藏状态   的值。

所有的对   的贝叶斯估计服从后验分布 p(xk | y0,y1,…,yk) 。粒子滤波器方法使用经验测量和通用粒子算法,提供了这些条件概率的近似值。与之对比,马尔可夫链蒙特卡洛(MCMC)重要性采样方式会对整个后验概率 p(x0,x1,…,xk | y0,y1,…,yk) 进行建模。

信号-观测模型 编辑

粒子濾波器能夠從一系列含有雜訊或不完整的觀測值中,估計出動態系統的內部狀態。在動態系統的分析中,需要兩個模型,一個用來描述狀態隨時間的變化(系統模型),另一個用來描述每個狀態下觀測到的雜訊(觀測模型),將這兩個模型都用機率來表示。

在許多情況下,每得到一個新的觀測值時,都必須對系統做出一次估計,利用遞迴濾波器,能夠有效地達到這樣的目的。遞迴濾波器會對得到的資料做連續處理,而非分批處理,因此不需要將完整的資料儲存起來,也不需要在得到新的觀測值時,將現有的資料重新做處理。遞迴濾波器包含兩個步驟:

預測:利用系統模型,由前一個狀態的資訊預測下一個狀態的機率密度函數

更新:利用最新的觀測值,修改預測出的機率密度函數。

藉由貝葉斯推論(Baysian inference),我們可以描述出狀態空間的機率,並在得到新的觀測值時,對系統做出更新,因而達成上述目的。

近似貝式計算模型 编辑

在某些問題中,在信號的隨機狀態下,觀測值的條件分佈可能不具有密度,或者不可能或太複雜而無法計算。在這種狀況下,我們需要求近似值。其中一個策略是藉由馬爾可夫鏈 來取代信號   ,採用虛擬觀測的形式

 

對於具有已知機率密度函數的獨立序列中的某些序列,核心的概念是觀測此式子(公式)

 

在部分的觀測   之下,粒子濾波器是和馬爾可夫鏈   有相關的,定義為根據演化出的   ,在一些明顯的濫用性符號   下,帶有似然函數的粒子。這些機率性的技術跟近似貝式計算非常相關。在量子濾波器中,這些近似貝式量子濾波器的技術在1998年被皮埃爾·德爾·莫拉爾(P. Del Moral), 讓·雅各德(J. Jacod)和菲力普·普羅特(P. Protter)所採用。且被皮埃爾·德爾·莫拉爾, 阿諾·杜斯(A. Doucet)和 阿傑·賈斯拉(A. Jasra)更進一步發展。

非線性濾波方程 编辑

藉由貝式定理在條件機率中可以得出

 

 

粒子濾波器也是一個近似值,當有足夠的粒子時,結果會更加的準確。非線性濾波方程可以藉由遞迴得出

 

 

 

 

 

(Eq. 1)

依照慣例   在k=0時。非線性濾波方程問題的關鍵在於依序計算這些條件機率分布。

費曼-卡茲公式 编辑

固定一個時間範圍和一個序列的觀測   ,在k=0....n,我們定義:

 

在這種表示法中,對於從原點k = 0到時間k = n的 軌跡集合上的任何有界函數F,我們都可以用費曼-卡茲公式來表示

 

這些費曼-卡茲路徑積分模型出現在各種科學學科中,包括計算物理,生物學,資訊理論和計算機科學。他們的解釋取決於應用領域。舉例來說,如果我們選擇狀態空間某些子集的指標函數 ,它們代表馬爾可夫鏈在給定管中的條件分佈。我們會得到:

 

 

只要標準化常數嚴格為正。

非線性貝葉斯追蹤 编辑

在動態系統中,我們常常需要對物體做追蹤。假設有一動態系統,已知其狀態序列 定義為

 

其中 狀態轉移函數,可以是非線性的函數, 是一個獨立且相同分布(i.i.d.)的過程雜訊序列,  分別代表狀態和過程雜訊向量的維度, 為自然數的集合。追蹤的目標是要遞迴地從觀測值 估計出 ,而觀測值 定義為

 

其中 觀測函數,可以是非線性的函數, 是一個獨立且相同分布(i.i.d.)的觀測雜訊序列,  分別代表觀測值和觀測雜訊向量的維度。

從貝葉斯理論的觀點來看,追蹤問題是要根據到時間 為止的已知資訊 ,遞迴地計算出時間 的狀態 的可信度,這個可信度用機率密度函數 來表示。假設初始機率密度函數 (稱為先驗機率)為已知,則利用「預測」「更新」兩個步驟就能遞迴地計算出機率密度函數 

在此假設在時間 的機率密度函數 為已知。

預測 编辑

利用查普曼-科爾莫戈羅夫等式(Chapman–Kolmogorov equation),可以由狀態轉移函數與時間 的機率密度函數 ,計算出時間 先驗機率 

 

其中,由於狀態轉移模型被假設為一階馬可夫過程,時間 的狀態只由時間 決定,因此 。機率模型 狀態轉移函數  的統計值得到。

更新 编辑

在時間 ,我們得到觀測值 ,因此可以利用貝氏定理,由先驗機率 得到後驗機率 ,也就是考慮觀測值後得到的機率。

 

其中的歸一化常數

 

其中的似然函數 觀測函數  的統計值得到。

上述「預測」「更新」的遞迴關係,是貝葉斯最佳解的基本概念,然而公式中運用到的積分,對於一般非線性、非高斯的系統,難以得到解析解,因此需要利用蒙地卡羅方法來近似貝葉斯最佳解。

序列重要性重採樣(Sequential Importance Resampling, SIR) 编辑

序列重要性採樣(Sequential Importance Sampling, SIS) 编辑

SIR是由SIS加上重採樣(resampling)改良而來,在SIS中,我們將後驗機率  個隨機採樣的樣本(稱為粒子)與各自的權重表示為

 

其中的權重是根據重要性採樣的規則產生,且必須符合

 

SIS是將重要性採樣遞迴執行的一種方法,根據重要性採樣的理論,一個函數 的期望值可以用加權平均來近似

 

在每一次遞迴過程中,我們希望由前一次採樣的權重,計算出下一次採樣的權重。假設採樣的樣本分布可以表示為

   

其中 稱為重要性密度(importance density)。若樣本 是由重要性密度 抽取出來,則權重可表示為

 

我們將重要性密度分解為

 

再將後驗機率表示為

 

則權重的遞迴式可以表示為

 

重採樣(resampling) 编辑

SIS可能會造成退化問題(degeneracy problem),也就是在經過幾次遞迴後,很多粒子的權重都變小到可以忽略不計,只剩少數粒子的權重較大,如此會浪費大量的計算量在幾乎沒有作用的粒子上,而使估計性能下降。由於在遞迴過程中,權重的變異數只會愈來愈大,因此退化問題無法被避免。

為了評估退化問題,我們定義有效粒子數

 

在進行SIS時,若有效粒子數小於某一閾值,則對粒子做重採樣,即可減緩退化問題。重採樣的概念是去除權重過小的粒子,專注於權重較大的粒子。進行重採樣時,要由現有的粒子分布取樣,產生一組新的粒子 ,由於產生出的新樣本為獨立且相同分布(i.i.d.),因此將權重重新設定為 

參見 编辑

參考文獻 编辑

  1. M. S. Arulampalam, S. Maskell, N. Gordon and T. Clapp, "A tutorial on particle filters for online nonlinear/non-Gaussian Bayesian tracking." In IEEE Transactions on Signal Processing, vol. 50, no. 2, pp. 174-188, Feb 2002.
  2. A. Doucet, N. de Freitas, N. Gordon, "An Introduction to Sequential Monte Carlo Methods." In A. Doucet, N. de Freitas, N. Gordon (eds.) Sequential Monte Carlo Methods in Practice. Statistics for Engineering and Information Science. Springer, New York, NY, 2001
  3. A. Doucet, "On sequential Monte Carlo methods for Bayesian filtering." Dept. Eng., Univ. Cambridge, UK, Tech. Rep., 1998.
  1. ^ 可观测性. [2020-04-29]. (原始内容存档于2020-11-22). 

粒子濾波器, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目需要編修, 以確保文法, 用詞, 语气, 格式, 標點等使用恰当, 2017年6月30日, 請按照校對指引, 幫助编辑這個條目, 幫助, 討論, 此條目包含過多行話或專業術語, 可能需要簡化或提出進一步解釋, 2023年7月28日, 請在討論頁中發表對於本議題的看法, 並移除或解釋本條目中的行話, 粒子滤波器, 英語, particle, filter, 是一种使用蒙特卡罗方法的递归滤波器, 透过一组具有权重的随机样本, 粒子,. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目需要編修 以確保文法 用詞 语气 格式 標點等使用恰当 2017年6月30日 請按照校對指引 幫助编辑這個條目 幫助 討論 此條目包含過多行話或專業術語 可能需要簡化或提出進一步解釋 2023年7月28日 請在討論頁中發表對於本議題的看法 並移除或解釋本條目中的行話 粒子滤波器 英語 particle filter 是一种使用蒙特卡罗方法的递归滤波器 透过一组具有权重的随机样本 粒子 來表示隨機事件的後驗機率 從含有雜訊或不完整的觀測序列 估計出動態系統的狀態 粒子濾波器可以運用在任何狀態空間的模型上 粒子濾波器是卡爾曼濾波器的一般化方法 卡爾曼濾波器建立在線性的狀態空間和高斯分布的雜訊上 而粒子濾波器的狀態空間模型可以是非線性 且雜訊分布可以是任何型式 目录 1 歷史 1 1 啟發式演算法 1 2 數學基礎 2 滤波问题 2 1 目标 2 2 信号 观测模型 2 3 近似貝式計算模型 2 4 非線性濾波方程 2 5 費曼 卡茲公式 3 非線性貝葉斯追蹤 3 1 預測 3 2 更新 4 序列重要性重採樣 Sequential Importance Resampling SIR 4 1 序列重要性採樣 Sequential Importance Sampling SIS 4 2 重採樣 resampling 5 參見 6 參考文獻歷史 编辑啟發式演算法 编辑 從統計和概率的角度來看 粒子濾波器屬於遗传算法分支过程的類別 並且是指平均場類型相互作用的粒子方法 這些粒子方法的解釋取決於科學專業 在進化計算中 平均場遺傳類型粒子方法通常用作啟發式和自然搜索算法 也稱為元啟發算法 在計算物理學和分子化學中 它們用於解決費曼 卡茲 Feynman Kac 路徑積分問題 或者用於計算玻爾茲曼 吉布斯 Boltzmann Gibbs 度量 薛丁格算子的最高特徵值和基態 在生物學與遺傳學中 它們還代表了某些環境中一群個體或基因的進化 平均場類型進化計算技術的起源可以追溯到1950年和1954年 這是艾倫 圖靈在遺傳類型突變選擇學習機上的開創性工作 以及紐澤西州普林斯頓高級研究所的尼爾斯 艾爾 巴里切利 Nils Aall Barricelli 的文章 統計學中的粒子濾波器最早可追溯到1950年代中期 哈默斯利 Hammersley 等人在1954年提出的 窮人的蒙特卡洛 法暗示了當今使用的遺傳類型粒子過濾方法 1963年 尼爾斯 艾爾 巴里切利 Nils Aall Barricelli 模擬了一種遺傳類型算法 以模仿個人玩簡單遊戲的能力 在進化計算文獻中 遺傳類型突變選擇算法通過1970年代初期約翰 霍蘭德 John Holland 的開創性工作而流行 特別是1975年出版的著作 在生物學與遺傳學中 澳大利亞遺傳學家亞歷克斯 弗雷澤 Alex Fraser 在1957年還發表了一系列有關人工選擇生物的遺傳類型模擬的論文 由生物學家進行的進化計算機模擬在1960年代初變得更加普遍 並且該方法在弗雷澤和伯內爾 Burnell 1970 和克羅斯比 Crosby 1973 的書中進行了描述 弗雷澤的模擬包括了現代突變選擇遺傳粒子算法的所有基本要素 從數學觀點來看 給定一些部分和雜訊觀測結果的信號隨機狀態的條件分佈 是由信號的隨機軌跡上的費曼 卡茲 Feynman Kac 概率描述的 該概率由一系列似然勢函數加權 量子蒙特卡洛法 更具體地說是擴散蒙特卡洛法 也可以解釋為費曼 卡茲路徑積分的平均場遺傳類型粒子近似 量子蒙特卡羅方法的起源通常歸因於恩里科 費米 Enrico Fermi 和羅伯特 里克特邁耶 Robert Richtmyer 他們於1948年開發了一種中子鏈反應的均值場粒子解釋方法 但它是第一個類似啟發式和遺傳類型的粒子算法 又名 重採樣 或 重新配置 蒙特卡洛方法 是在1984年由Jack H Hetherington提出的用於估計量子系統 在簡化的矩陣模型中 的基態能量的方法 還可以引用1951年出版的西奧多 愛德華 哈里斯 Theodore E Harris 和赫爾曼 康恩 Herman Kahn 的開創性著作 該著作使用平均場 但類似於啟發式遺傳方法 用於估計粒子傳輸能量 在分子化學中 遺傳啟發式粒子方法 又名修剪和富集策略 的使用可以追溯到1955年馬歇爾 Marshall 的開創性工作 羅森布魯斯 N Rosenbluth 和阿里安娜 W 羅森布盧斯 Arianna W Rosenbluth 遺傳粒子算法在高級信號處理和貝葉斯推理中的使用是最近的 1993年1月 北川源四郎開發了 蒙特卡羅濾波器 該文在1996年出現了輕微修改 1993年4月 戈登等人在他們的開創性著作中發表了遺傳類型算法在貝葉斯統計推斷中的應用 作者將其算法命名為 自舉濾波器 並證明與其他濾波方法相比 其自舉算法不需要對該狀態空間或系統噪聲進行任何假設 獨立的是皮埃爾 德爾 莫拉爾 Pierre Del Moral 和希米爾孔 卡瓦略 Himilcon Carvalho 皮埃爾 德爾 莫拉爾 Pierre Del Moral 安德烈 莫寧 Andre Monin 和熱拉爾 薩魯特 Gerard Salut 在1990年代中期發表的有關粒子過濾器的論文 1989 1992年初 皮埃爾 德爾 莫拉爾 P Del Moral J C 諾耶 J C Noyer G Rigal和G Salut在LAAS CNRS中也開發了信號處理技術 並通過STCAN 服務技術 進行了一系列受限和分類研究des Constructions and Armes Navales IT公司DIGILOG和LAAS CNRS 系統分析和體系結構實驗室 來解決RADAR SONAR和GPS信號處理問題 數學基礎 编辑 從1950年到1996年 所有有關粒子過濾器 遺傳算法的出版物 包括在計算物理和分子化學中引入的修剪和重採樣蒙特卡洛方法 都提出了適用於不同情況的類似於自然和啟發式算法 而沒有任何證據證明它 們的一致性 也沒有討論估計的偏差以及基於族譜和祖先樹的算法 這些粒子算法的數學基礎和首次嚴格的分析是由皮埃爾 德爾 莫拉爾 Pierre Del Moral 在1996年提出的 本文還包含了似然函數和未標準化的條件機率測度的粒子近似的無偏性質的證明 本文介紹的似然函數的無偏粒子估計器如今已用於貝式統計推理中 到1990年代末 Dan Crisan Jessica Gaines和Terry Lyons以及Dan Crisan Pierre Del Moral和Terry Lyons也開發了具有不同種群大小的分支類型粒子方法 P Del Moral A Guionnet和L Miclo在 2000年開發了該領域的進一步發展 第一個中心極限定理是由Pierre Del Moral和Alice Guionnet於1999年以及Pierre Del Moral和Laurent Miclo於2000年提出的 Pierre於1990年代末提出了關於粒子過濾器 時間參數的第一個統一收斂結果 Del Moral和Alice Guionnet 2001年 P Del Moral和L Miclo首次對基於族譜樹的粒子濾波器平滑器進行了嚴格的分析 關於Feynman Kac粒子方法論的理論和相關的粒子過濾器算法已在2000年和2004年的書中得到發展 這些抽象的概率模型封裝了遺傳類型算法 粒子和自舉濾波器 交互的卡爾曼濾波器 又稱Rao Blackwellized 粒子濾波器 重要性採樣和重採樣樣式的粒子濾波器技術 包括基於族譜樹的方法和用於解決濾波和平滑問題的粒子後向方法 其他類別的粒子濾波方法包括基於族譜樹的模型 後向馬爾可夫粒子模型 自 適應平均場粒子模型 島型粒子模型和粒子馬爾可夫鏈蒙特卡羅方法 滤波问题 编辑目标 编辑 粒子滤波器的目标是通过观测值估计状态变量的后验概率 粒子滤波器是针对隐马尔可夫模型设计的 系统中既包含隐藏的变量 也包含可观测的变量 1 可观测变量 观测过程 与隐藏变量 状态过程 通过某种已知的函数关系相关联 类似地 描述状态变量演化的动态系统也是概率学上已知的 一个通用粒子滤波器通过观察测量过程估计隐藏状态的后验分布 考察下图所示的状态空间 X 0 X 1 X 2 X 3 signal Y 0 Y 1 Y 2 Y 3 observation displaystyle begin array cccccccccc X 0 amp to amp X 1 amp to amp X 2 amp to amp X 3 amp to amp cdots amp text signal downarrow amp amp downarrow amp amp downarrow amp amp downarrow amp amp cdots amp Y 0 amp amp Y 1 amp amp Y 2 amp amp Y 3 amp amp cdots amp text observation end array nbsp 滤波问题是要通过给定的观测过程 Y 0 Y k displaystyle Y 0 cdots Y k nbsp 在任意时刻 k 的值 序列地估计隐藏状态 X k displaystyle X k nbsp 的值 所有的对 X k displaystyle X k nbsp 的贝叶斯估计服从后验分布 p xk y0 y1 yk 粒子滤波器方法使用经验测量和通用粒子算法 提供了这些条件概率的近似值 与之对比 马尔可夫链蒙特卡洛 MCMC 或重要性采样方式会对整个后验概率 p x0 x1 xk y0 y1 yk 进行建模 信号 观测模型 编辑 粒子濾波器能夠從一系列含有雜訊或不完整的觀測值中 估計出動態系統的內部狀態 在動態系統的分析中 需要兩個模型 一個用來描述狀態隨時間的變化 系統模型 另一個用來描述每個狀態下觀測到的雜訊 觀測模型 將這兩個模型都用機率來表示 在許多情況下 每得到一個新的觀測值時 都必須對系統做出一次估計 利用遞迴濾波器 能夠有效地達到這樣的目的 遞迴濾波器會對得到的資料做連續處理 而非分批處理 因此不需要將完整的資料儲存起來 也不需要在得到新的觀測值時 將現有的資料重新做處理 遞迴濾波器包含兩個步驟 預測 利用系統模型 由前一個狀態的資訊預測下一個狀態的機率密度函數 更新 利用最新的觀測值 修改預測出的機率密度函數 藉由貝葉斯推論 Baysian inference 我們可以描述出狀態空間的機率 並在得到新的觀測值時 對系統做出更新 因而達成上述目的 近似貝式計算模型 编辑 在某些問題中 在信號的隨機狀態下 觀測值的條件分佈可能不具有密度 或者不可能或太複雜而無法計算 在這種狀況下 我們需要求近似值 其中一個策略是藉由馬爾可夫鏈X k X k Y k displaystyle mathcal X k left X k Y k right nbsp 來取代信號 X k displaystyle X k nbsp 採用虛擬觀測的形式 Y k Y k ϵ V k for some parameter ϵ 0 1 displaystyle mathcal Y k Y k epsilon mathcal V k quad mbox for some parameter quad epsilon in 0 1 nbsp 對於具有已知機率密度函數的獨立序列中的某些序列 核心的概念是觀測此式子 公式 Law X k Y 0 y 0 Y k y k ϵ 0 Law X k Y 0 y 0 Y k y k displaystyle text Law left X k mathcal Y 0 y 0 cdots mathcal Y k y k right approx epsilon downarrow 0 text Law left X k Y 0 y 0 cdots Y k y k right nbsp 在部分的觀測 Y 0 y 0 Y k y k displaystyle mathcal Y 0 y 0 cdots mathcal Y k y k nbsp 之下 粒子濾波器是和馬爾可夫鏈 X k X k Y k displaystyle mathcal X k left X k Y k right nbsp 有相關的 定義為根據演化出的 R d x d y displaystyle mathbb R d x d y nbsp 在一些明顯的濫用性符號 p Y k X k displaystyle p mathcal Y k mathcal X k nbsp 下 帶有似然函數的粒子 這些機率性的技術跟近似貝式計算非常相關 在量子濾波器中 這些近似貝式量子濾波器的技術在1998年被皮埃爾 德爾 莫拉爾 P Del Moral 讓 雅各德 J Jacod 和菲力普 普羅特 P Protter 所採用 且被皮埃爾 德爾 莫拉爾 阿諾 杜斯 A Doucet 和 阿傑 賈斯拉 A Jasra 更進一步發展 非線性濾波方程 编辑 藉由貝式定理在條件機率中可以得出 p x 0 x k y 0 y k p y 0 y k x 0 x k p x 0 x k p y 0 y k displaystyle p x 0 cdots x k y 0 cdots y k frac p y 0 cdots y k x 0 cdots x k p x 0 cdots x k p y 0 cdots y k nbsp 當 p y 0 y k p y 0 y k x 0 x k p x 0 x k d x 0 d x k p y 0 y k x 0 x k l 0 k p y l x l p x 0 x k p 0 x 0 l 1 k p x l x l 1 displaystyle begin aligned p y 0 cdots y k amp int p y 0 cdots y k x 0 cdots x k p x 0 cdots x k dx 0 cdots dx k p y 0 cdots y k x 0 cdots x k amp prod l 0 k p y l x l p x 0 cdots x k amp p 0 x 0 prod l 1 k p x l x l 1 end aligned nbsp 粒子濾波器也是一個近似值 當有足夠的粒子時 結果會更加的準確 非線性濾波方程可以藉由遞迴得出 p x k y 0 y k 1 updating p x k y 0 y k p y k x k p x k y 0 y k 1 p y k x k p x k y 0 y k 1 d x k prediction p x k 1 y 0 y k p x k 1 x k p x k y 0 y k d x k displaystyle begin aligned p x k y 0 cdots y k 1 amp stackrel text updating longrightarrow p x k y 0 cdots y k frac p y k x k p x k y 0 cdots y k 1 int p y k x k p x k y 0 cdots y k 1 dx k amp stackrel text prediction longrightarrow p x k 1 y 0 cdots y k int p x k 1 x k p x k y 0 cdots y k dx k end aligned nbsp Eq 1 依照慣例 p x 0 y 0 y k 1 p x 0 displaystyle p x 0 y 0 cdots y k 1 p x 0 nbsp 在k 0時 非線性濾波方程問題的關鍵在於依序計算這些條件機率分布 費曼 卡茲公式 编辑 固定一個時間範圍和一個序列的觀測 Y 0 y 0 Y n y n displaystyle Y 0 y 0 cdots Y n y n nbsp 在k 0 n 我們定義 G k x k p y k x k displaystyle G k x k p y k x k nbsp 在這種表示法中 對於從原點k 0到時間k n的 軌跡集合上的任何有界函數F 我們都可以用費曼 卡茲公式來表示 F x 0 x n p x 0 x n y 0 y n d x 0 d x n F x 0 x n k 0 n p y k x k p x 0 x n d x 0 d x n k 0 n p y k x k p x 0 x n d x 0 d x n E F X 0 X n k 0 n G k X k E k 0 n G k X k displaystyle begin aligned int F x 0 cdots x n p x 0 cdots x n y 0 cdots y n dx 0 cdots dx n amp frac int F x 0 cdots x n left prod limits k 0 n p y k x k right p x 0 cdots x n dx 0 cdots dx n int left prod limits k 0 n p y k x k right p x 0 cdots x n dx 0 cdots dx n amp frac E left F X 0 cdots X n prod limits k 0 n G k X k right E left prod limits k 0 n G k X k right end aligned nbsp 這些費曼 卡茲路徑積分模型出現在各種科學學科中 包括計算物理 生物學 資訊理論和計算機科學 他們的解釋取決於應用領域 舉例來說 如果我們選擇狀態空間某些子集的指標函數G n x n 1 A x n displaystyle G n x n 1 A x n nbsp 它們代表馬爾可夫鏈在給定管中的條件分佈 我們會得到 E F X 0 X n X 0 A X n A E F X 0 X n k 0 n G k X k E k 0 n G k X k displaystyle E left F X 0 cdots X n X 0 in A cdots X n in A right frac E left F X 0 cdots X n prod limits k 0 n G k X k right E left prod limits k 0 n G k X k right nbsp 和 P X 0 A X n A E k 0 n G k X k displaystyle P left X 0 in A cdots X n in A right E left prod limits k 0 n G k X k right nbsp 只要標準化常數嚴格為正 非線性貝葉斯追蹤 编辑在動態系統中 我們常常需要對物體做追蹤 假設有一動態系統 已知其狀態序列 x k k N displaystyle x k k in N nbsp 定義為x k f k x k 1 v k 1 displaystyle x k f k x k 1 v k 1 nbsp 其中f k R n x R n v R n x displaystyle f k R n x times R n v rightarrow R n x nbsp 是狀態轉移函數 可以是非線性的函數 v k 1 k N displaystyle v k 1 k in N nbsp 是一個獨立且相同分布 i i d 的過程雜訊序列 n x displaystyle n x nbsp 和n v displaystyle n v nbsp 分別代表狀態和過程雜訊向量的維度 N displaystyle N nbsp 為自然數的集合 追蹤的目標是要遞迴地從觀測值y k displaystyle y k nbsp 估計出x k displaystyle x k nbsp 而觀測值y k displaystyle y k nbsp 定義為y k h k x k n k displaystyle y k h k x k n k nbsp 其中h k R n x R n n R n y displaystyle h k R n x times R n n rightarrow R n y nbsp 是觀測函數 可以是非線性的函數 n k k N displaystyle n k k in N nbsp 是一個獨立且相同分布 i i d 的觀測雜訊序列 n y displaystyle n y nbsp 和n n displaystyle n n nbsp 分別代表觀測值和觀測雜訊向量的維度 從貝葉斯理論的觀點來看 追蹤問題是要根據到時間k displaystyle k nbsp 為止的已知資訊y 1 k displaystyle y 1 k nbsp 遞迴地計算出時間k displaystyle k nbsp 的狀態x k displaystyle x k nbsp 的可信度 這個可信度用機率密度函數p x k y 1 k displaystyle p x k mid y 1 k nbsp 來表示 假設初始機率密度函數p x 0 y 0 p x 0 displaystyle p x 0 mid y 0 equiv p x 0 nbsp 稱為先驗機率 為已知 則利用 預測 和 更新 兩個步驟就能遞迴地計算出機率密度函數p x k y 1 k displaystyle p x k mid y 1 k nbsp 在此假設在時間k 1 displaystyle k 1 nbsp 的機率密度函數p x k 1 y 1 k 1 displaystyle p x k 1 mid y 1 k 1 nbsp 為已知 預測 编辑 利用查普曼 科爾莫戈羅夫等式 Chapman Kolmogorov equation 可以由狀態轉移函數與時間k 1 displaystyle k 1 nbsp 的機率密度函數p x k 1 y 1 k 1 displaystyle p x k 1 mid y 1 k 1 nbsp 計算出時間k displaystyle k nbsp 的先驗機率p x k y 1 k 1 displaystyle p x k mid y 1 k 1 nbsp p x k y 1 k 1 p x k x k 1 y 1 k 1 d x k 1 p x k x k 1 y 1 k 1 p x k 1 y 1 k 1 d x k 1 p x k x k 1 p x k 1 y 1 k 1 d x k 1 displaystyle begin aligned p x k mid y 1 k 1 amp int p x k x k 1 mid y 1 k 1 d x k 1 amp int p x k mid x k 1 y 1 k 1 p x k 1 mid y 1 k 1 d x k 1 amp int p x k mid x k 1 p x k 1 mid y 1 k 1 d x k 1 end aligned nbsp 其中 由於狀態轉移模型被假設為一階馬可夫過程 時間k 1 displaystyle k 1 nbsp 的狀態只由時間k displaystyle k nbsp 決定 因此p x k x k 1 y 1 k 1 p x k x k 1 displaystyle p x k mid x k 1 y 1 k 1 p x k mid x k 1 nbsp 機率模型p x k x k 1 displaystyle p x k mid x k 1 nbsp 由狀態轉移函數x k f k x k 1 v k 1 displaystyle x k f k x k 1 v k 1 nbsp 和v k 1 displaystyle v k 1 nbsp 的統計值得到 更新 编辑 在時間k displaystyle k nbsp 我們得到觀測值y k displaystyle y k nbsp 因此可以利用貝氏定理 由先驗機率p x k y 1 k 1 displaystyle p x k mid y 1 k 1 nbsp 得到後驗機率p x k y 1 k displaystyle p x k mid y 1 k nbsp 也就是考慮觀測值後得到的機率 p x k y 1 k p y k x k p x k y 1 k 1 p y k y 1 k 1 displaystyle p x k mid y 1 k p y k mid x k p x k mid y 1 k 1 over p y k mid y 1 k 1 nbsp 其中的歸一化常數為p y k y 1 k 1 p y k x k p x k y 1 k 1 d x k displaystyle p y k mid y 1 k 1 int p y k mid x k p x k mid y 1 k 1 dx k nbsp 其中的似然函數p y k x k displaystyle p y k mid x k nbsp 由觀測函數y k h k x k n k displaystyle y k h k x k n k nbsp 和n k displaystyle n k nbsp 的統計值得到 上述 預測 與 更新 的遞迴關係 是貝葉斯最佳解的基本概念 然而公式中運用到的積分 對於一般非線性 非高斯的系統 難以得到解析解 因此需要利用蒙地卡羅方法來近似貝葉斯最佳解 序列重要性重採樣 Sequential Importance Resampling SIR 编辑序列重要性採樣 Sequential Importance Sampling SIS 编辑 SIR是由SIS加上重採樣 resampling 改良而來 在SIS中 我們將後驗機率p x k y 1 k displaystyle p x k mid y 1 k nbsp 用N displaystyle N nbsp 個隨機採樣的樣本 稱為粒子 與各自的權重表示為 x k i w k i i 1 N displaystyle x k i w k i i 1 N nbsp 其中的權重是根據重要性採樣的規則產生 且必須符合 i 1 N w k i 1 displaystyle sum i 1 N w k i 1 nbsp SIS是將重要性採樣遞迴執行的一種方法 根據重要性採樣的理論 一個函數f displaystyle f nbsp 的期望值可以用加權平均來近似 f x k p x k y 1 k d x k i 1 N w k i f x k i 1 displaystyle int f x k p x k mid y 1 k dx k approx sum i 1 N w k i f x k i 1 nbsp 在每一次遞迴過程中 我們希望由前一次採樣的權重 計算出下一次採樣的權重 假設採樣的樣本分布可以表示為x i q x displaystyle x i sim q x nbsp i 1 N displaystyle i 1 N nbsp 其中q x displaystyle q x nbsp 稱為重要性密度 importance density 若樣本x k i displaystyle x k i nbsp 是由重要性密度q x k y 1 k displaystyle q x k mid y 1 k nbsp 抽取出來 則權重可表示為w k i p x k i y 1 k q x k i y 1 k displaystyle w k i propto p x k i mid y 1 k over q x k i mid y 1 k nbsp 我們將重要性密度分解為q x k y 1 k q x k x k 1 y 1 k q x k 1 y 1 k 1 displaystyle q x k mid y 1 k q x k mid x k 1 y 1 k q x k 1 mid y 1 k 1 nbsp 再將後驗機率表示為p x k y 1 k p y k x k y 1 k 1 p x k y 1 k 1 p y k y 1 k 1 p y k x k y 1 k 1 p x k x k 1 y 1 k 1 p x k 1 y 1 k 1 p y k y 1 k 1 p y k x k p x k x k 1 p x k 1 y 1 k 1 p y k y 1 k 1 p y k x k p x k x k 1 p x k 1 y 1 k 1 displaystyle begin aligned p x k mid y 1 k amp p y k mid x k y 1 k 1 p x k mid y 1 k 1 over p y k mid y 1 k 1 amp p y k mid x k y 1 k 1 p x k mid x k 1 y 1 k 1 p x k 1 mid y 1 k 1 over p y k mid y 1 k 1 amp p y k mid x k p x k mid x k 1 p x k 1 mid y 1 k 1 over p y k mid y 1 k 1 amp propto p y k mid x k p x k mid x k 1 p x k 1 mid y 1 k 1 end aligned nbsp 則權重的遞迴式可以表示為w k i p y k x k i p x k i x k 1 i p x k 1 i y 1 k 1 q x k i x k 1 i y 1 k q x k 1 i y 1 k 1 w k 1 i p y k x k i p x k i x k 1 i q x k i x k 1 i y 1 k displaystyle begin aligned w k i amp propto p y k mid x k i p x k i mid x k 1 i p x k 1 i mid y 1 k 1 over q x k i mid x k 1 i y 1 k q x k 1 i mid y 1 k 1 amp w k 1 i p y k mid x k i p x k i mid x k 1 i over q x k i mid x k 1 i y 1 k end aligned nbsp 重採樣 resampling 编辑 SIS可能會造成退化問題 degeneracy problem 也就是在經過幾次遞迴後 很多粒子的權重都變小到可以忽略不計 只剩少數粒子的權重較大 如此會浪費大量的計算量在幾乎沒有作用的粒子上 而使估計性能下降 由於在遞迴過程中 權重的變異數只會愈來愈大 因此退化問題無法被避免 為了評估退化問題 我們定義有效粒子數為N e f f 1 i 1 N w k i 2 displaystyle widehat N eff 1 over sum i 1 N w k i 2 nbsp 在進行SIS時 若有效粒子數小於某一閾值 則對粒子做重採樣 即可減緩退化問題 重採樣的概念是去除權重過小的粒子 專注於權重較大的粒子 進行重採樣時 要由現有的粒子分布取樣 產生一組新的粒子 x k i i 1 N displaystyle x k i i 1 N nbsp 由於產生出的新樣本為獨立且相同分布 i i d 因此將權重重新設定為w k i 1 N displaystyle w k i 1 over N nbsp 參見 编辑图像处理 机器学习 机器人学 人工智能 同时定位与地图构建 滾動時域估計參考文獻 编辑M S Arulampalam S Maskell N Gordon and T Clapp A tutorial on particle filters for online nonlinear non Gaussian Bayesian tracking In IEEE Transactions on Signal Processing vol 50 no 2 pp 174 188 Feb 2002 A Doucet N de Freitas N Gordon An Introduction to Sequential Monte Carlo Methods In A Doucet N de Freitas N Gordon eds Sequential Monte Carlo Methods in Practice Statistics for Engineering and Information Science Springer New York NY 2001 A Doucet On sequential Monte Carlo methods for Bayesian filtering Dept Eng Univ Cambridge UK Tech Rep 1998 可观测性 2020 04 29 原始内容存档于2020 11 22 取自 https zh wikipedia org w index php title 粒子濾波器 amp oldid 78275289, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。