fbpx
维基百科

相对熵

KL散度Kullback-Leibler divergence,簡稱KLD[1],在訊息系统中称为相对熵(relative entropy),在连续时间序列中称为随机性(randomness),在统计模型推断中称为訊息增益(information gain)。也称訊息散度(information divergence)。

KL散度是两个機率分布P和Q差别的非对称性的度量。 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数。典型情况下,P表示数据的真实分布,Q表示数据的理论分布、估计的模型分布、或P的近似分布。[1]

定義

對於离散隨機变量,其機率分布PQ的KL散度可按下式定義為

 

等价于

 

即按機率P求得的PQ對數商的平均值。KL散度僅當機率PQ各自總和均為1,且對於任何i皆滿足  時,才有定義。式中出現 的情況,其值按0處理。

對於連續隨機變量,其機率分佈PQ可按積分方式定義為 [2]

 

其中pq分別表示分佈PQ的密度。

更一般的,若PQ為集合X的機率測度,且P關於Q絕對連續,則從PQ的KL散度定義為

 

其中,假定右側的表達形式存在,則 Q關於PR–N導數

相應的,若P關於Q絕對連續,則

 

即為P關於Q的相對熵。

特性

相對熵的值為非負數:

 

吉布斯不等式可知,當且僅當  為零。

尽管从直觉上KL散度是个度量或距离函数, 但是它实际上并不是一个真正的度量或距離。因為KL散度不具有对称性:从分布PQ的距离通常并不等于从QP的距离。

 


KL散度和其它量的关系

自信息和KL散度

 


互信息和KL散度

 


信息熵和KL散度

 


条件熵和KL散度

 


交叉熵和KL散度

 

參考文獻

  1. ^ 1.0 1.1 Kullback, S.; Leibler, R. A. On Information and Sufficiency. The Annals of Mathematical Statistics. 1951-03, 22 (1) [2022-08-15]. ISSN 0003-4851. doi:10.1214/aoms/1177729694. (原始内容于2022-08-18). 
  2. ^ C. Bishop (2006). Pattern Recognition and Machine Learning. p. 55.

相对熵, 此條目需要精通或熟悉相关主题的编者参与及协助编辑, 請邀請適合的人士改善本条目, 更多的細節與詳情請參见討論頁, kl散度, kullback, leibler, divergence, 簡稱kld, 在訊息系统中称为, relative, entropy, 在连续时间序列中称为随机性, randomness, 在统计模型推断中称为訊息增益, information, gain, 也称訊息散度, information, divergence, kl散度是两个機率分布p和q差别的非对称性的度量, kl散度. 此條目需要精通或熟悉相关主题的编者参与及协助编辑 請邀請適合的人士改善本条目 更多的細節與詳情請參见討論頁 KL散度 Kullback Leibler divergence 簡稱KLD 1 在訊息系统中称为相对熵 relative entropy 在连续时间序列中称为随机性 randomness 在统计模型推断中称为訊息增益 information gain 也称訊息散度 information divergence KL散度是两个機率分布P和Q差别的非对称性的度量 KL散度是用来度量使用基于Q的分布来编码服从P的分布的样本所需的额外的平均比特数 典型情况下 P表示数据的真实分布 Q表示数据的理论分布 估计的模型分布 或P的近似分布 1 目录 1 定義 2 特性 3 KL散度和其它量的关系 4 參考文獻定義 编辑對於离散隨機变量 其機率分布P 和 Q的KL散度可按下式定義為 D K L P Q i P i ln Q i P i displaystyle D mathrm KL P Q sum i P i ln frac Q i P i 等价于 D K L P Q i P i ln P i Q i displaystyle D mathrm KL P Q sum i P i ln frac P i Q i 即按機率P求得的P和Q的對數商的平均值 KL散度僅當機率P和Q各自總和均為1 且對於任何i皆滿足Q i gt 0 displaystyle Q i gt 0 及P i gt 0 displaystyle P i gt 0 時 才有定義 式中出現0 ln 0 displaystyle 0 ln 0 的情況 其值按0處理 對於連續隨機變量 其機率分佈P和Q可按積分方式定義為 2 D K L P Q p x ln p x q x d x displaystyle D mathrm KL P Q int infty infty p x ln frac p x q x rm d x 其中p和q分別表示分佈P和Q的密度 更一般的 若P和Q為集合X的機率測度 且P關於Q絕對連續 則從P到Q的KL散度定義為 D K L P Q X ln d P d Q d P displaystyle D mathrm KL P Q int X ln frac rm d P rm d Q rm d P 其中 假定右側的表達形式存在 則d Q d P displaystyle frac rm d Q rm d P 為Q關於P的R N導數 相應的 若P關於Q絕對連續 則 D K L P Q X ln d P d Q d P X d P d Q ln d P d Q d Q displaystyle D mathrm KL P Q int X ln frac rm d P rm d Q rm d P int X frac rm d P rm d Q ln frac rm d P rm d Q rm d Q 即為P關於Q的相對熵 特性 编辑相對熵的值為非負數 D K L P Q 0 displaystyle D mathrm KL P Q geq 0 由吉布斯不等式可知 當且僅當P Q displaystyle P Q 時D K L P Q displaystyle D KL P Q 為零 尽管从直觉上KL散度是个度量或距离函数 但是它实际上并不是一个真正的度量或距離 因為KL散度不具有对称性 从分布P到Q的距离通常并不等于从Q到P的距离 D K L P Q D K L Q P displaystyle D mathrm KL P Q neq D mathrm KL Q P KL散度和其它量的关系 编辑自信息和KL散度 I m D K L d i m p i displaystyle I m D mathrm KL delta im p i 互信息和KL散度 I X Y D K L P X Y P X P Y E X D K L P Y X P Y E Y D K L P X Y P X displaystyle begin aligned I X Y amp D mathrm KL P X Y P X P Y amp mathbb E X D mathrm KL P Y X P Y amp mathbb E Y D mathrm KL P X Y P X end aligned 信息熵和KL散度 H X i E x I x i i log N D K L P X P U X displaystyle begin aligned H X amp mathrm i mathbb E x I x amp mathrm ii log N D mathrm KL P X P U X end aligned 条件熵和KL散度 H X Y log N D K L P X Y P U X P Y i log N D K L P X Y P X P Y D K L P X P U X H X I X Y i i log N E Y D K L P X Y P U X displaystyle begin aligned H X Y amp log N D mathrm KL P X Y P U X P Y amp mathrm i log N D mathrm KL P X Y P X P Y D mathrm KL P X P U X amp H X I X Y amp mathrm ii log N mathbb E Y D mathrm KL P X Y P U X end aligned 交叉熵和KL散度 H p q E p log q H p D K L p q displaystyle mathrm H p q mathrm E p log q mathrm H p D mathrm KL p q 參考文獻 编辑 1 0 1 1 Kullback S Leibler R A On Information and Sufficiency The Annals of Mathematical Statistics 1951 03 22 1 2022 08 15 ISSN 0003 4851 doi 10 1214 aoms 1177729694 原始内容存档于2022 08 18 C Bishop 2006 Pattern Recognition and Machine Learning p 55 取自 https zh wikipedia org w index php title 相对熵 amp oldid 74838497, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。