fbpx
维基百科

戴尔指数

戴尔指数(英語:Theil Index)又稱為泰爾指數[1],是一个衡量经济不平等[2]的统计量。它也曾經用來衡量其他社會不平等現象,如種族隔離[3][4][5]

戴尔指数主要是利用資訊理論中的資訊熵的概念導出的。戴尔指数等於資訊冗餘,也就是資料最大可能資訊熵減去觀測到的資訊熵,它是广义熵指数英语generalized entropy index的特例,可以被視為冗餘度、單樣性、不平等、非隨機性和可壓縮性的度量。[5]

戴尔指数最早由荷兰鹿特丹伊拉斯姆斯大學计量经济学亨利·戴尔英语Henri TheilHenri Theil)所提出。[5]

数学公式 编辑

假設一個人口為N的群體,其收入分別為xi (i = 1,...,N),則它的戴爾指數T定義為[6]

 

而戴爾指數L則定義為

 

其中 为第 个人的收入, 为平均收入, 为人口数量。加总符号中的第一项可以理解为个人在总收入中所占的比例,第二项为该个人相对于均值的收入。

如果收入分布是個離散分布函數 fk (k = 0,...,W),其中fk是收入為k的人口比例,而W = 代表總收入,可以得知   。 它的戴爾指數T定義為:

 

這裡的 一樣是收入平均

 

其中應注意到收入k是一個整數,k=1代表最小收入增量(比如新台幣1元)。

如果收入分布是個連續分布函數f(k),k取值0到無窮,其中f(kdk 是收入為kk + dk的人口數量,那戴爾指數T定義為:

 

其中平均 為:

 

一些常見連續概率分佈的戴尔指數如下表所示:

收入分布函數 PDF(x) (x ≥ 0) 戴尔指数(納特
狄拉克δ函數   0
連續型均勻分布    
指數分布      
對數常態分布    
帕累托分布        (α>1)
卡方分布       
伽瑪分布     
韋伯分布       

如果每一个人都有相同的收入,即等于均值,则指数为零。如果某个个人拥有所有的收入,则指数为 TT 除以  可以將方程歸一化到0到1的範圍,但這樣違反獨立公理英语Economic inequality metrics:  並不符合衡量不平等的標準。

信息論推導 编辑

戴尔指数导自克勞德·夏農信息熵,他的一般數學形式為:

 

其中  是從人群裡找到 的機率。 玻爾茲曼常數。在信息論中,當信息以二進制數字給出時, 並且對數基底為2。在物理學和戴爾指數的計算中,選擇自然對數作為對數基底。當 替換成人均收入 時,需要除以總收入達到歸一化 。那可以導出,觀察到的信息熵為:

 

 为戴尔指数, 夏農熵,则有

 

其中,ln(N)是理論最大熵。香濃根据事件发生概率导出的其熵测度。它可以用戴尔系数解释为自某个特定个人处随机取得一块钱的概率。并与其第一项,即总收入中个人所占份额相同。

符號 信息論 戴爾指數 TT
  字符數 人口數
  某個特定字符 某個特定人
  第i個字符 character 第i個人的收入
  總字符數 總收入
  未被使用的資訊空間 未使用潛在價格機制

可分解性 编辑

戴尔指数的一个优点是它是某个子群体中不平等的加权和[1]。例如,美国国内的不平等就是每个州的不平等的加权和,由该州收入相对于国家总收入的比值来加权。

如果人口被划分为 个子群体,  为群体  的收入比例, 为该子群体的戴尔指数,而   为子群体  的平均收入,则戴尔指数为

 

因此,我们可以说某个特定群体给总体“贡献了”一定数量的不平等。

另外一个被广泛使用的不平等度量为基尼系数,该系数对于很多人来说由于基于劳伦茨曲线而非常直观。但是它却没有戴尔指数容易分解。

參考文獻 编辑

  1. ^ 1.0 1.1 徐淑娟. 中国经济发展中的行业收入差距问题研究. 西南財經大學出版社. 2018-02-01: 33–34 [2019-01-14]. ISBN 7550428530. (原始内容于2019-06-05) (中文(中国大陆)). 
  2. ^ Introduction to the Theil index from the University of Texas (PDF). [2006-01-15]. (原始内容 (PDF)于2005-11-18). 
  3. ^ Diversity and Social Segregation. geodacenter.asu.edu. [2016-03-18]. (原始内容存档于2012-07-10). 
  4. ^ Segregation Measures. www.urban.org. Urban Institute. [5 February 2018]. (原始内容于2021-01-19) (英语). 
  5. ^ 5.0 5.1 5.2 Parker, Lauren. Racial and Ethnic Segregation: In the News and On PolicyMap. PolicyMap. 20 July 2015 [5 February 2018]. (原始内容于2019-06-08). 
  6. ^ Redundancy, Entropy and Inequality Measures. [2019-01-11]. (原始内容于2020-10-23) (英语). 

外部連結 编辑

  • 德克萨斯大学戴尔指数简介 (页面存档备份,存于互联网档案馆)(英文)
  • 試算表: Income inequality metrics#Spreadsheet computations英语Income inequality metrics#Spreadsheet computations
  • 免費在線計算器 計算基尼係數,繪製洛倫茲曲線,並為任何數據集計算許多其他濃度測量值
  • Free Calculator: Online (页面存档备份,存于互联网档案馆) and (Python and Lua) for Atkinson, Gini, and Hoover inequalities
  • Users of the R (页面存档备份,存于互联网档案馆) data analysis software can install the "ineq" package which allows for computation of a variety of inequality indices including Gini, Atkinson, Theil.
  • MATLAB 不平等包 (页面存档备份,存于互联网档案馆)。MATLAB不平等包,其中包括用於計算基尼,阿特金森,泰爾指數和標繪洛倫茨曲線的代碼

戴尔指数, 英語, theil, index, 又稱為泰爾指數, 是一个衡量经济不平等, 的统计量, 它也曾經用來衡量其他社會不平等現象, 如種族隔離, 主要是利用資訊理論中的資訊熵的概念導出的, 等於資訊冗餘, 也就是資料最大可能資訊熵減去觀測到的資訊熵, 它是广义熵指数, 英语, generalized, entropy, index, 的特例, 可以被視為冗餘度, 單樣性, 不平等, 非隨機性和可壓縮性的度量, 最早由荷兰鹿特丹伊拉斯姆斯大學的计量经济学家亨利, 戴尔, 英语, henri, theil, h. 戴尔指数 英語 Theil Index 又稱為泰爾指數 1 是一个衡量经济不平等 2 的统计量 它也曾經用來衡量其他社會不平等現象 如種族隔離 3 4 5 戴尔指数主要是利用資訊理論中的資訊熵的概念導出的 戴尔指数等於資訊冗餘 也就是資料最大可能資訊熵減去觀測到的資訊熵 它是广义熵指数 英语 generalized entropy index 的特例 可以被視為冗餘度 單樣性 不平等 非隨機性和可壓縮性的度量 5 戴尔指数最早由荷兰鹿特丹伊拉斯姆斯大學的计量经济学家亨利 戴尔 英语 Henri Theil Henri Theil 所提出 5 目录 1 数学公式 2 信息論推導 3 可分解性 4 參考文獻 5 外部連結数学公式 编辑假設一個人口為N的群體 其收入分別為xi i 1 N 則它的戴爾指數T定義為 6 TT Ta 1 1N i 1Nximln xim displaystyle T T T alpha 1 frac 1 N sum i 1 N frac x i mu ln left frac x i mu right nbsp 而戴爾指數L則定義為 TL Ta 0 1N i 1Nln mxi displaystyle T L T alpha 0 frac 1 N sum i 1 N ln left frac mu x i right nbsp 其中xi displaystyle x i nbsp 为第i displaystyle i nbsp 个人的收入 m displaystyle mu nbsp 为平均收入 N displaystyle N nbsp 为人口数量 加总符号中的第一项可以理解为个人在总收入中所占的比例 第二项为该个人相对于均值的收入 如果收入分布是個離散分布函數 fk k 0 W 其中fk是收入為k的人口比例 而W Nm 代表總收入 可以得知 k 0Wfk 1 displaystyle sum k 0 W f k 1 nbsp 它的戴爾指數T定義為 TT k 0Wfkkmln km displaystyle T T sum k 0 W f k frac k mu ln left frac k mu right nbsp 這裡的m displaystyle mu nbsp 一樣是收入平均 m k 0Wkfk displaystyle mu sum k 0 W kf k nbsp 其中應注意到收入k是一個整數 k 1代表最小收入增量 比如新台幣1元 如果收入分布是個連續分布函數f k k取值0到無窮 其中f k dk 是收入為k 到 k dk的人口數量 那戴爾指數T定義為 TT 0 f k kmln km dk displaystyle T T int 0 infty f k frac k mu ln left frac k mu right dk nbsp 其中平均m displaystyle mu nbsp 為 m 0 kf k dk displaystyle mu int 0 infty kf k dk nbsp 一些常見連續概率分佈的戴尔指數如下表所示 收入分布函數 PDF x x 0 戴尔指数 納特 狄拉克d函數 d x x0 x0 gt 0 displaystyle delta x x 0 x 0 gt 0 nbsp 0連續型均勻分布 1b aa x b0otherwise displaystyle begin cases frac 1 b a amp a leq x leq b 0 amp text otherwise end cases nbsp ln 2a a b e b2b2 a2ln b a displaystyle ln left frac 2a a b sqrt e right frac b 2 b 2 a 2 ln b a nbsp 指數分布 le xl x gt 0 displaystyle lambda e x lambda x gt 0 nbsp 1 displaystyle 1 nbsp g displaystyle gamma nbsp 對數常態分布 1s2pe ln x m 2 s2 displaystyle frac 1 sigma sqrt 2 pi e ln x mu 2 sigma 2 nbsp s22 displaystyle frac sigma 2 2 nbsp 帕累托分布 akaxa 1x k0x lt k displaystyle begin cases frac alpha k alpha x alpha 1 amp x geq k 0 amp x lt k end cases nbsp ln 1 1 a 1a 1 displaystyle ln 1 1 alpha frac 1 alpha 1 nbsp a gt 1 卡方分布 2 k 2e x 2xk 2 1G k 2 displaystyle frac 2 k 2 e x 2 x k 2 1 Gamma k 2 nbsp ln 2 k displaystyle ln 2 k nbsp ps 0 displaystyle psi 0 nbsp 1 k 2 displaystyle 1 k 2 nbsp 伽瑪分布 e x 8xk 18 kG k displaystyle frac e x theta x k 1 theta k Gamma k nbsp ps 0 displaystyle psi 0 nbsp 1 k ln k displaystyle 1 k ln k nbsp 韋伯分布 kl xl k 1e x l k displaystyle frac k lambda left frac x lambda right k 1 e x lambda k nbsp 1k displaystyle frac 1 k nbsp ps 0 displaystyle psi 0 nbsp 1 1 k ln G 1 1 k displaystyle 1 1 k ln left Gamma 1 1 k right nbsp 如果每一个人都有相同的收入 即等于均值 则指数为零 如果某个个人拥有所有的收入 则指数为ln N displaystyle ln N nbsp TT 除以ln N displaystyle ln N nbsp 可以將方程歸一化到0到1的範圍 但這樣違反獨立公理 英语 Economic inequality metrics T x x T x displaystyle T x cup x neq T x nbsp 並不符合衡量不平等的標準 信息論推導 编辑戴尔指数导自克勞德 夏農的信息熵 他的一般數學形式為 S k i 1N pilog 1pi k i 1N pilog pi displaystyle S k sum i 1 N left p i log frac 1 p i right k sum i 1 N left p i log p i right nbsp 其中 pi displaystyle p i nbsp 是從人群裡找到i displaystyle i nbsp 的機率 k displaystyle k nbsp 是玻爾茲曼常數 在信息論中 當信息以二進制數字給出時 k 1 displaystyle k 1 nbsp 並且對數基底為2 在物理學和戴爾指數的計算中 選擇自然對數作為對數基底 當pi displaystyle p i nbsp 替換成人均收入xi displaystyle x i nbsp 時 需要除以總收入達到歸一化Nx displaystyle N overline x nbsp 那可以導出 觀察到的信息熵為 STheil i 1N xiNx ln Nx xi displaystyle S text Theil sum i 1 N left frac x i N overline x ln frac N overline x x i right nbsp 设T displaystyle T nbsp 为戴尔指数 S displaystyle S nbsp 为夏農熵 则有T ln N S displaystyle T ln N S nbsp 其中 ln N 是理論最大熵 香濃根据事件发生概率导出的其熵测度 它可以用戴尔系数解释为自某个特定个人处随机取得一块钱的概率 并与其第一项 即总收入中个人所占份额相同 符號 信息論 戴爾指數 TTN displaystyle N nbsp 字符數 人口數i displaystyle i nbsp 某個特定字符 某個特定人xi displaystyle x i nbsp 第i個字符 character 第i個人的收入Nx displaystyle N overline x nbsp 總字符數 總收入TT displaystyle T T nbsp 未被使用的資訊空間 未使用潛在價格機制可分解性 编辑戴尔指数的一个优点是它是某个子群体中不平等的加权和 1 例如 美国国内的不平等就是每个州的不平等的加权和 由该州收入相对于国家总收入的比值来加权 如果人口被划分为m displaystyle m nbsp 个子群体 sk displaystyle s k nbsp 为群体k displaystyle k nbsp 的收入比例 Tk displaystyle T k nbsp 为该子群体的戴尔指数 而 x k displaystyle overline x k nbsp 为子群体 k displaystyle k nbsp 的平均收入 则戴尔指数为 T k 1mskTTk k 1mskln x kx displaystyle T sum k 1 m s k T T k sum k 1 m s k ln frac overline x k overline x nbsp 因此 我们可以说某个特定群体给总体 贡献了 一定数量的不平等 另外一个被广泛使用的不平等度量为基尼系数 该系数对于很多人来说由于基于劳伦茨曲线而非常直观 但是它却没有戴尔指数容易分解 參考文獻 编辑 1 0 1 1 徐淑娟 中国经济发展中的行业收入差距问题研究 西南財經大學出版社 2018 02 01 33 34 2019 01 14 ISBN 7550428530 原始内容存档于2019 06 05 中文 中国大陆 Introduction to the Theil index from the University of Texas PDF 2006 01 15 原始内容存档 PDF 于2005 11 18 Diversity and Social Segregation geodacenter asu edu 2016 03 18 原始内容存档于2012 07 10 Segregation Measures www urban org Urban Institute 5 February 2018 原始内容存档于2021 01 19 英语 5 0 5 1 5 2 Parker Lauren Racial and Ethnic Segregation In the News and On PolicyMap PolicyMap 20 July 2015 5 February 2018 原始内容存档于2019 06 08 Redundancy Entropy and Inequality Measures 2019 01 11 原始内容存档于2020 10 23 英语 外部連結 编辑德克萨斯大学戴尔指数简介 页面存档备份 存于互联网档案馆 英文 試算表 Income inequality metrics Spreadsheet computations 英语 Income inequality metrics Spreadsheet computations 免費在線計算器 計算基尼係數 繪製洛倫茲曲線 並為任何數據集計算許多其他濃度測量值 Free Calculator Online 页面存档备份 存于互联网档案馆 and downloadable scripts Python and Lua for Atkinson Gini and Hoover inequalities Users of the R 页面存档备份 存于互联网档案馆 data analysis software can install the ineq package which allows for computation of a variety of inequality indices including Gini Atkinson Theil MATLAB 不平等包 页面存档备份 存于互联网档案馆 MATLAB不平等包 其中包括用於計算基尼 阿特金森 泰爾指數和標繪洛倫茨曲線的代碼 取自 https zh wikipedia org w index php title 戴尔指数 amp oldid 78981607, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。