fbpx
维基百科

K-L变换

K-L轉換(英語:Karhunen-Loève Transform)是建立在統計特性基礎上的一種轉換,它是均方差(MSE, Mean Square Error)意義下的最佳轉換,因此在資料壓縮技術中佔有重要的地位。

K-L轉換名称来自Kari Karhunen和Michel Loève。

K-L轉換是對輸入的向量x,做一個正交變換,使得輸出的向量得以去除數據的相關性。

然而,K-L轉換雖然具有均方差(MSE)意義下的最佳轉換,但必須事先知道輸入的訊號,並且需經過一些繁雜的數學運算,例如协方差(covariance)以及特徵向量(eigenvector)的計算。因此在工程實踐上K-L轉換並沒有被廣泛的應用,不過K-L轉換是理論上最佳的方法,所以在尋找一些不是最佳、但比較好實現的一些轉換方法時,K-L轉換能夠提供這些轉換性能的評價標準。

以處理圖片為範例,在K-L轉換途中,圖片的能量會變得集中,有助於壓縮圖片,但是實際上,KL轉算為input-dependent,即需要對每張輸入圖片存下一個轉換機制,每張圖都不一樣,這在實務應用上是不實際的。

原理 编辑

KL轉換屬於正交轉換,其處輸入訊號的原理如下:

對輸入向量 做KL傳換後,輸出向量 之元素間( ,    之元素的index)的相關性為零,即: 

展開上式並做消去:

 

如果 ,因為KL轉換式線性轉換的關係, ,則可以達成以下式,所以這裡得輸入向量 之平均值 需為 ,所以KLT是專門用於隨機程序的分析:

 

其中 ,即輸出向量不同元素相關性為 

回到矩陣表示形式,令 為KL轉換矩陣,使:

 

  表示 之covariance矩陣:

 

因為  直接等於covariance矩陣:

 

其中  之covariance矩陣。

如果要使 ,則 必須為對角線矩陣,即對角線上之值皆為 ,所以 必須將傳換成對角線矩陣,即 的每一行皆為 之特徵向量。

K-L轉換的目的是將原始數據做轉換,使得轉換後資料的相關性最小。若輸入數據為一維:

 

 

其中en為輸入訊號x共變異數矩陣(covariance matrix)Cx特徵向量(eigenvector)

若輸入訊號x為二維:

 

與離散餘弦轉換的關係 [1] 编辑

二維之K-L轉換推導係自原先輸入信號之自協方矩陣

 

亦即

 

而得,此處假設輸入信號x已經先減去平均值。

而當輸入彼此具高度相關性,如影像等,則可假設其在水平與垂直方向上得以被分離,並以水平與垂直之相關係數 加以表示

假設   之水平和垂直距離分別為 

 

以一3x2之輸入   為例

此時  

而對於任意尺寸的水平或垂直方向之協方差矩陣可以表示成

 

可發現其值僅與   有關,取其閉合形式,其基底元素 

 

此處    之特徵值

 

其中  

對於不同的輸入影像,其 會有所不同,而若是令  ,則此轉換不必與輸入相關,同時繼承了K-L轉換去除相關性的優異性質。

此時  

代入上式,得 KLT|  

離散餘弦轉換較K-L轉換在實務上較為有利,因其毋須紀錄會隨輸入而改變的轉換矩陣。

KLT與PCA的區別 编辑

KLT和主成分分析(PCA, Principle component analysis) 有相似的特性,二者之間有很細微的差異,其中KLT專門處理隨機性的訊號,但PCA則沒有這個限制。對PCA而言,這裡假設輸入訊號為ㄧ向量,輸入向量 在乘上轉換矩陣 之前,會先將輸入向量扣去平均值,即:

 

PCA會根據 之covariance矩陣來選擇特徵向量做為轉換矩陣之內容:

 

其中 為對角線矩陣且對角線值為特徵值。

由上述可見PCA和KLT之差異在於有沒有減去平均值,這是由於輸入資料分布的限制造成的,當輸入向量支平均值為零時,二這者沒有差異。

應用 编辑

在影像的壓縮上,目的是要將原始的影像檔用較少的資料量來表示,由於大部分的影像並不是隨機的分布,相鄰的像素(Pixal)間存在一些相關性,如果我們能找到一種可逆轉換(reversible transformation),它可以去除數據的相關性,如此一來就能更有效地儲存資料,由於K-L轉換是一種線性轉換,並有去除資料相關性的特性,便可以將它應用在影像的壓縮上。此外,由於K-L轉換具有將訊號轉到特徵空間(eigenspace)的特性,因此也可以應用在人臉辨識上。

 参考文献 编辑

1. Ding, J. J. (2017). Advanced Digital Signal Processing [Powerpoint slides] http://djj.ee.ntu.edu.tw/ADSP8.pdf (页面存档备份,存于互联网档案馆

2. Gerbrands, J.J., On the relationships between SVD, KLT, and PCA, Pattern Recogn., 14 (1981), pp. 375-381

  1. ^ 酒井善則,吉田俊之原著,原島博監修,白執善編譯,「影像壓縮術",全華印行, 2004.

l变换, l轉換, 英語, karhunen, loève, transform, 是建立在統計特性基礎上的一種轉換, 它是均方差, mean, square, error, 意義下的最佳轉換, 因此在資料壓縮技術中佔有重要的地位, l轉換名称来自kari, karhunen和michel, loève, l轉換是對輸入的向量x, 做一個正交變換, 使得輸出的向量得以去除數據的相關性, 然而, l轉換雖然具有均方差, 意義下的最佳轉換, 但必須事先知道輸入的訊號, 並且需經過一些繁雜的數學運算, 例如协方差, co. K L轉換 英語 Karhunen Loeve Transform 是建立在統計特性基礎上的一種轉換 它是均方差 MSE Mean Square Error 意義下的最佳轉換 因此在資料壓縮技術中佔有重要的地位 K L轉換名称来自Kari Karhunen和Michel Loeve K L轉換是對輸入的向量x 做一個正交變換 使得輸出的向量得以去除數據的相關性 然而 K L轉換雖然具有均方差 MSE 意義下的最佳轉換 但必須事先知道輸入的訊號 並且需經過一些繁雜的數學運算 例如协方差 covariance 以及特徵向量 eigenvector 的計算 因此在工程實踐上K L轉換並沒有被廣泛的應用 不過K L轉換是理論上最佳的方法 所以在尋找一些不是最佳 但比較好實現的一些轉換方法時 K L轉換能夠提供這些轉換性能的評價標準 以處理圖片為範例 在K L轉換途中 圖片的能量會變得集中 有助於壓縮圖片 但是實際上 KL轉算為input dependent 即需要對每張輸入圖片存下一個轉換機制 每張圖都不一樣 這在實務應用上是不實際的 目录 1 原理 2 與離散餘弦轉換的關係 1 3 KLT與PCA的區別 4 應用 5 参考文献原理 编辑KL轉換屬於正交轉換 其處輸入訊號的原理如下 對輸入向量x displaystyle mathbf x nbsp 做KL傳換後 輸出向量X displaystyle mathbf X nbsp 之元素間 u 1 u 2 displaystyle u 1 neq u 2 nbsp u 1 displaystyle u 1 nbsp 和u 2 displaystyle u 2 nbsp 為X displaystyle mathbf X nbsp 之元素的index 的相關性為零 即 E X u 1 X u 1 X u 2 X u 2 0 displaystyle E X u 1 bar X u 1 X u 2 bar X u 2 0 nbsp 展開上式並做消去 E X u 1 X u 2 X u 1 X u 2 0 displaystyle E X u 1 X u 2 bar X u 1 bar X u 2 0 nbsp 如果x n 0 displaystyle bar x n 0 nbsp 因為KL轉換式線性轉換的關係 X n 0 displaystyle bar X n 0 nbsp 則可以達成以下式 所以這裡得輸入向量x displaystyle mathbf x nbsp 之平均值x displaystyle bar x nbsp 需為0 displaystyle 0 nbsp 所以KLT是專門用於隨機程序的分析 E X u 1 X u 2 0 displaystyle E X u 1 X u 2 0 nbsp 其中u 1 u 2 displaystyle u 1 neq u 2 nbsp 即輸出向量不同元素相關性為0 displaystyle 0 nbsp 回到矩陣表示形式 令K displaystyle mathbf K nbsp 為KL轉換矩陣 使 X K x displaystyle mathbf X mathbf Kx nbsp 以K displaystyle mathbf K nbsp 和x displaystyle mathbf x nbsp 表示X displaystyle mathbf X nbsp 之covariance矩陣 E X X T E K x x T K T K E x x T K T displaystyle E mathbf X mathbf X T E mathbf K mathbf x mathbf x T mathbf K T mathbf K E mathbf x mathbf x T mathbf K T nbsp 因為x n 0 displaystyle bar x n 0 nbsp E x x T displaystyle E mathbf x mathbf x T nbsp 直接等於covariance矩陣 E X X T K C K T displaystyle E mathbf X mathbf X T mathbf K mathbf C mathbf K T nbsp 其中C displaystyle mathbf C nbsp 為x displaystyle mathbf x nbsp 之covariance矩陣 如果要使E X u 1 X u 2 0 displaystyle E X u 1 X u 2 0 nbsp 則E X X T displaystyle E mathbf X mathbf X T nbsp 必須為對角線矩陣 即對角線上之值皆為0 displaystyle 0 nbsp 所以K displaystyle mathbf K nbsp 必須將傳換成對角線矩陣 即K displaystyle mathbf K nbsp 的每一行皆為C displaystyle mathbf C nbsp 之特徵向量 K L轉換的目的是將原始數據做轉換 使得轉換後資料的相關性最小 若輸入數據為一維 y u n 0 N 1 K u n x n displaystyle y u sum n 0 N 1 K u n x n nbsp K u n e n n displaystyle K u n e n n nbsp 其中en為輸入訊號x共變異數矩陣 covariance matrix Cx的特徵向量 eigenvector 若輸入訊號x為二維 y u v m 0 M 1 n 0 N 1 K u m K v m x m n displaystyle y u v sum m 0 M 1 sum n 0 N 1 K u m K v m x m n nbsp 與離散餘弦轉換的關係 1 编辑二維之K L轉換推導係自原先輸入信號之自協方矩陣C x i x j E x i x j displaystyle C x i x j E x i x j nbsp 亦即C x i x j E x 1 x 1 E x 1 x 2 E x 1 x 3 E x 1 x j E x 1 x N E x 2 x 1 E x 2 x 2 E x 2 x 3 E x 2 x j E x 2 x N E x i x 1 E x i x 2 E x i x 3 E x i x j a i n E x M x 1 E x M x 2 E x M x 3 E x M x j E x M x N displaystyle C x i x j begin bmatrix E x 1 x 1 amp E x 1 x 2 amp E x 1 x 3 amp dots amp E x 1 x j amp dots amp E x 1 x N E x 2 x 1 amp E x 2 x 2 amp E x 2 x 3 amp dots amp E x 2 x j amp dots amp E x 2 x N vdots amp vdots amp vdots amp ddots amp vdots amp ddots amp vdots E x i x 1 amp E x i x 2 amp E x i x 3 amp dots amp E x i x j amp dots amp a in vdots amp vdots amp vdots amp ddots amp vdots amp ddots amp vdots E x M x 1 amp E x M x 2 amp E x M x 3 amp dots amp E x M x j amp dots amp E x M x N end bmatrix nbsp 而得 此處假設輸入信號x已經先減去平均值 而當輸入彼此具高度相關性 如影像等 則可假設其在水平與垂直方向上得以被分離 並以水平與垂直之相關係數r H r V displaystyle rho H rho V nbsp 加以表示假設x i displaystyle x i nbsp 與 x j displaystyle x j nbsp 之水平和垂直距離分別為h v displaystyle h v nbsp 則 E x i x j r H h r V v displaystyle E x i x j rho H h cdot rho V v nbsp 以一3x2之輸入 X x 1 x 2 x 3 x 4 x 5 x 6 displaystyle X begin bmatrix x1 amp x2 amp x3 x4 amp x5 amp x6 end bmatrix nbsp 為例此時 C x i x j 1 r H r H 2 r V r H r V r H 2 r V r H 1 r H r H r V r V r H r V r H 2 r V r H 1 r H 2 r V r H r V r V r V r H r V r H 2 r V 1 r H r H 2 r H r V r V r H r V r H 1 r H r H 2 r V r H r V r V r H 2 r H 1 displaystyle C x i x j begin bmatrix 1 amp rho H amp rho H 2 amp rho V amp rho H rho V amp rho H 2 cdot rho V rho H amp 1 amp rho H amp rho H rho V amp rho V amp rho H rho V rho H 2 rho V amp rho H amp 1 amp rho H 2 rho V amp rho H rho V amp rho V rho V amp rho H rho V amp rho H 2 rho V amp 1 amp rho H amp rho H 2 rho H rho V amp rho V amp rho H rho V amp rho H amp 1 amp rho H rho H 2 rho V amp rho H rho V amp rho V amp rho H 2 amp rho H amp 1 end bmatrix nbsp 而對於任意尺寸的水平或垂直方向之協方差矩陣可以表示成C x x r r 2 r N 1 r 2 r r N 2 r N 1 r N 2 r displaystyle C xx begin bmatrix rho amp rho 2 amp dots amp rho N 1 rho 2 amp rho amp dots amp rho N 2 vdots amp vdots amp ddots amp vdots rho N 1 amp rho N 2 amp dots amp rho end bmatrix nbsp 可發現其值僅與 i j displaystyle i j nbsp 有關 取其閉合形式 其基底元素v i j displaystyle v ij nbsp 為v i j 2 N l j sin 2 i N 1 w 2 j p 2 displaystyle v ij sqrt frac 2 N lambda j sin frac 2i N 1 omega 2 frac j pi 2 nbsp 此處 l j displaystyle lambda j nbsp 為 C x x displaystyle C xx nbsp 之特徵值l j 1 r 2 1 2 r cos w j r 2 displaystyle lambda j frac 1 rho 2 1 2 rho cos omega j rho 2 nbsp 其中 tan N w j 1 r 2 sin w j cos w j 2 r r 2 cos w j displaystyle tan N omega j frac 1 rho 2 sin omega j cos omega j 2 rho rho 2 cos omega j nbsp 對於不同的輸入影像 其r displaystyle rho nbsp 會有所不同 而若是令 r 1 displaystyle rho rightarrow 1 nbsp 則此轉換不必與輸入相關 同時繼承了K L轉換去除相關性的優異性質 此時 l j N if j 1 0 if j 1 displaystyle lambda j left begin matrix N amp mbox if j 1 0 amp mbox if j neq 1 end matrix right nbsp 代入上式 得 KLT r 1 displaystyle rho rightarrow 1 nbsp v i j 1 N cos 2 i 1 j 1 p 2 N if j 1 2 N cos 2 i 1 j 1 p 2 N if j 1 displaystyle v ij left begin matrix sqrt frac 1 N cos frac 2i 1 j 1 pi 2N amp mbox if j 1 sqrt frac 2 N cos frac 2i 1 j 1 pi 2N amp mbox if j neq 1 end matrix right nbsp 離散餘弦轉換較K L轉換在實務上較為有利 因其毋須紀錄會隨輸入而改變的轉換矩陣 KLT與PCA的區別 编辑KLT和主成分分析 PCA Principle component analysis 有相似的特性 二者之間有很細微的差異 其中KLT專門處理隨機性的訊號 但PCA則沒有這個限制 對PCA而言 這裡假設輸入訊號為ㄧ向量 輸入向量x displaystyle mathbf x nbsp 在乘上轉換矩陣W displaystyle mathbf W nbsp 之前 會先將輸入向量扣去平均值 即 X W x x displaystyle mathbf X mathbf W mathbf x bar x nbsp PCA會根據x displaystyle mathbf x nbsp 之covariance矩陣來選擇特徵向量做為轉換矩陣之內容 E x x x x T W L W T displaystyle E mathbf x bar x mathbf x bar x T mathbf W Lambda W T nbsp 其中L displaystyle mathbf Lambda nbsp 為對角線矩陣且對角線值為特徵值 由上述可見PCA和KLT之差異在於有沒有減去平均值 這是由於輸入資料分布的限制造成的 當輸入向量支平均值為零時 二這者沒有差異 應用 编辑在影像的壓縮上 目的是要將原始的影像檔用較少的資料量來表示 由於大部分的影像並不是隨機的分布 相鄰的像素 Pixal 間存在一些相關性 如果我們能找到一種可逆轉換 reversible transformation 它可以去除數據的相關性 如此一來就能更有效地儲存資料 由於K L轉換是一種線性轉換 並有去除資料相關性的特性 便可以將它應用在影像的壓縮上 此外 由於K L轉換具有將訊號轉到特徵空間 eigenspace 的特性 因此也可以應用在人臉辨識上 参考文献 编辑1 Ding J J 2017 Advanced Digital Signal Processing Powerpoint slides http djj ee ntu edu tw ADSP8 pdf 页面存档备份 存于互联网档案馆 2 Gerbrands J J On the relationships between SVD KLT and PCA Pattern Recogn 14 1981 pp 375 381 酒井善則 吉田俊之原著 原島博監修 白執善編譯 影像壓縮術 全華印行 2004 取自 https zh wikipedia org w index php title K L变换 amp oldid 77501804, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。