fbpx
维基百科

耿贝尔分布

概率论统计学中,耿贝尔分布Gumbel分布,也称为I 型广义极值分布)用于对各种分布的多个样本的最大值(或最小值)的分布进行建模。

Gumbel
概率密度函數
累積分布函數
记号
参数 location (real)
scale (real)
值域
概率密度函数
其中
累積分布函數
期望值
其中Euler–Mascheroni常数
中位數
眾數
方差
偏度
峰度
矩生成函数
特徵函数

如果有过去十年的水位最大值列表,则此分布可用于表示特定年份河流最高水位的分布。它有助于预测发生极端地震、洪水或其他自然灾害的可能性。 耿贝尔分布表示最大值分布的潜在适用性与极值理论有关,这表明如果基础样本数据的分布是正态或指数类型,它可能是有用的。本文使用耿贝尔分布对最大值的分布进行建模。要对最小值建模,请使用原始值的负值。

耿贝尔分布是广义极值分布(也称为 Fisher-Tippett 分布)的一个特例。它也称为对数Weibull 分布和双指数分布(该术语有时也用于指代拉普拉斯分布)。它与Gompertz分布有关:在原点附近,并限制在正半线上时,就得到了 Gompertz 函数。

在多项式logistic回归模型的潜变量公式中——在离散选择法理论中很常见——潜在变量的误差服从 Gumbel 分布。这很有用,因为两个耿贝尔分布的随机变量的差服从logistic分布。

耿贝尔分布以Emil Julius Gumbel (1891 – 1966) 的名字命名,来自描述该分布的原始论文。 [1] [2]

定义 编辑

耿贝尔分布的累积分布函数

 

标准耿贝尔分布 编辑

标准的耿贝尔分布是  时的特例,其累积分布函数为

 

概率密度函数为

 

此时,众数为 0,中位数为 ,均值为 歐拉-馬斯刻若尼常數),标准差为 

对于 n>1,累积量由下式给出

 

特性 编辑

众数为 μ,中位数为 ,平均值是

  ,

其中 歐拉-馬斯刻若尼常數

标准差   ,因此  [3]

在众数处,  的值变为  ,与 的取值无关。

相关分布 编辑

  • 如果 具有耿贝尔分布,则Y= − X的条件分布在Y为正的情况下,或等效地在X为负的情况下具有Gompertz分布。 Y的 cdf GX的 cdf F相关,公式如下 要求y > 0。因此,两者概率密度函数相关:  : Gompertz 密度与反射的 Gumbel 密度成正比,仅限于正半线。 [4]
  • 如果X是均值为 1 的指数分布变量,则− log( X ) 服从标准 Gumbel 分布。
  • 如果  是独立的,那么  (见Logistic分布)。
  • 如果 是独立的,那么  。注意  。更一般地,独立 Gumbel 随机变量的线性组合的分布可以用 GNIG 和 GIG 分布来近似。 [5]

与广义多变量对数伽马分布相关的理论提供了耿贝尔分布的多变量版本。

应用 编辑

 
具有累积耿贝尔分布置信带的十月最大单日降雨量分布拟合 。 [6]

Gumbel 表明,随着样本量的增加,将服从指数分布随机变量减去样本量[7]的自然对数,其最大值的分布(或最后一阶统计量)接近耿贝尔分布。 [8]

具体来说,如果令  的概率分布, 是其累积分布,那么对  次实现(realizations)的最大值小于 当且仅当所有 的实现都小于  。所以最大值的累积分布 满足:

 

并且,对于较大的 ,等式右边收敛到 

因此,在水文学中,耿贝尔分布用于分析日降雨量和河流流量的月度和年度最大值等变量, [3]也用于描述干旱。 [9]

Gumbel 还表明,表示事件的概率估计量r(n+1)——其中r是观察值在数据序列中的排名, n是观察的总数——是分布的众数周围的累积分布函数无偏估计量。因此,这个估计量经常被用作分位图

数论中,耿贝尔分布近似于随机整数分拆的项数[10]以及最大素数间隙和素数星座之间的最大间隙的趋势调整大小。 [11]

Gumbel 重参数化技巧 编辑

机器学习中,耿贝尔分布有时用于从分类分布中生成样本。这种技术称为“Gumbel-max技巧”,是“重参数化技巧”的一个特例。 [12]

具体而言,令 非负且不全为零,并且让 是Gumbel(0, 1)的独立样本,则

 
因此,  

等价地,给定任何  ,我们可以从它的玻尔兹曼分布中采样:

 
相关等式包括: [13]
  • 如果  , 那么 
  •  
  •   。也就是说,Gumbel 分布是一个最大稳定分布族。
  •  

随机变量生成 编辑

耿贝尔分布的分位数函数(逆累积分布函数 可由下式给出

 

其中  是参数,当随机变量 是从  上的均匀分布中抽取时,变量 具有服从耿贝尔分布。

概率纸 编辑

 
一张包含 Gumbel 分布的方格纸。

在软件时代之前,人们使用概率纸描绘耿贝尔分布(见插图)。这种纸基于累积分布函数的 的线性化:

 

在纸上,水平轴以双对数刻度构建。垂直轴是线性的。通过在纸张的水平轴上寻找 ,在垂直轴上寻找   ,耿贝尔分布由斜率为  的直线表示。当像CumFreq这样的分布拟合软件可用时,绘制分布的任务变得更加容易。

参见 编辑

  • 2型Gumbel分布
  • 极值理论
  • 广义极值分布
  • Fisher-Tippett-Gnedenko定理
  • 埃米尔·朱利叶斯·冈贝尔

参考资料 编辑

  1. ^ Gumbel, E.J., Les valeurs extrêmes des distributions statistiques (PDF), Annales de l'Institut Henri Poincaré, 1935, 5 (2): 115–158 [2023-01-21], (原始内容 (PDF)于2018-03-10) 
  2. ^ Gumbel E.J. (1941). "The return period of flood flows". The Annals of Mathematical Statistics, 12, 163–190.
  3. ^ 3.0 3.1 Oosterbaan, R.J. http://www.waterlog.info/pdf/freqtxt.pdf |chapterurl=缺少标题 (帮助) (PDF). Ritzema, H.P. (编). Drainage Principles and Applications, Publication 16. Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). 1994: 175–224. ISBN 90-70754-33-9. 
  4. ^ Willemse, W.J.; Kaas, R. (PDF). Insurance: Mathematics and Economics. 2007, 40 (3): 468 [2023-01-21]. doi:10.1016/j.insmatheco.2006.07.003. (原始内容 (PDF)存档于2017-08-09). 
  5. ^ Marques, F.; Coelho, C.; de Carvalho, M. On the distribution of linear combinations of independent Gumbel random variables (PDF). Statistics and Computing. 2015, 25: 683‒701 [2023-01-21]. doi:10.1007/s11222-014-9453-5. (原始内容 (PDF)于2022-12-20). 
  6. ^ CumFreq, software for probability distribution fitting
  7. ^ user49229, Gumbel distribution and exponential distribution. [2023-01-21]. (原始内容于2021-08-26). 
  8. ^ Gumbel, E.J. Statistical theory of extreme values and some practical applications. Applied Mathematics Series 33 1st. U.S. Department of Commerce, National Bureau of Standards. 1954 [2023-01-21]. ASIN B0007DSHG4. (原始内容于2023-01-21). 
  9. ^ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. An extreme value analysis of UK drought and projections of change in the future. Journal of Hydrology. 2010, 388 (1–2): 131–143. Bibcode:2010JHyd..388..131B. doi:10.1016/j.jhydrol.2010.04.035. 
  10. ^ Erdös, Paul; Lehner, Joseph. The distribution of the number of summands in the partitions of a positive integer. Duke Mathematical Journal. 1941, 8 (2): 335. doi:10.1215/S0012-7094-41-00826-8. 
  11. ^ Kourbatov, A. Maximal gaps between prime k-tuples: a statistical approach. Journal of Integer Sequences. 2013, 16. Bibcode:2013arXiv1301.2242K. arXiv:1301.2242 .  Article 13.5.2.
  12. ^ Jang, Eric; Gu, Shixiang; Poole, Ben. Categorical Reparametrization with Gumble-Softmax. International Conference on Learning Representations (ICLR) 2017. April 2017 [2023-01-21]. (原始内容于2023-01-21). 
  13. ^ Balog, Matej; Tripuraneni, Nilesh; Ghahramani, Zoubin; Weller, Adrian. Lost Relatives of the Gumbel Trick. International Conference on Machine Learning (PMLR). 2017-07-17: 371–379 [2023-01-21]. (原始内容于2023-01-21) (英语). 

外部链接 编辑

耿贝尔分布, 在概率论和统计学中, gumbel分布, 也称为i, 型广义极值分布, 用于对各种分布的多个样本的最大值, 或最小值, 的分布进行建模, gumbel概率密度函數累積分布函數记号gumbel, displaystyle, text, gumbel, beta, 参数μ, displaystyle, location, real, displaystyle, beta, scale, real, 值域x, displaystyle, mathbb, 概率密度函数1, displaystyle, frac. 在概率论和统计学中 耿贝尔分布 Gumbel分布 也称为I 型广义极值分布 用于对各种分布的多个样本的最大值 或最小值 的分布进行建模 Gumbel概率密度函數累積分布函數记号Gumbel m b displaystyle text Gumbel mu beta 参数m displaystyle mu location real b gt 0 displaystyle beta gt 0 scale real 值域x R displaystyle x in mathbb R 概率密度函数1 b e z e z displaystyle frac 1 beta e z e z 其中z x m b displaystyle z frac x mu beta 累積分布函數e e x m b displaystyle e e x mu beta 期望值m b g displaystyle mu beta gamma 其中g displaystyle gamma 是Euler Mascheroni常数中位數m b ln ln 2 displaystyle mu beta ln ln 2 眾數m displaystyle mu 方差p 2 6 b 2 displaystyle frac pi 2 6 beta 2 偏度12 6 z 3 p 3 1 14 displaystyle frac 12 sqrt 6 zeta 3 pi 3 approx 1 14 峰度12 5 displaystyle frac 12 5 熵ln b g 1 displaystyle ln beta gamma 1 矩生成函数G 1 b t e m t displaystyle Gamma 1 beta t e mu t 特徵函数G 1 i b t e i m t displaystyle Gamma 1 i beta t e i mu t 如果有过去十年的水位最大值列表 则此分布可用于表示特定年份河流最高水位的分布 它有助于预测发生极端地震 洪水或其他自然灾害的可能性 耿贝尔分布表示最大值分布的潜在适用性与极值理论有关 这表明如果基础样本数据的分布是正态或指数类型 它可能是有用的 本文使用耿贝尔分布对最大值的分布进行建模 要对最小值建模 请使用原始值的负值 耿贝尔分布是广义极值分布 也称为 Fisher Tippett 分布 的一个特例 它也称为对数Weibull 分布和双指数分布 该术语有时也用于指代拉普拉斯分布 它与Gompertz分布有关 在原点附近 并限制在正半线上时 就得到了 Gompertz 函数 在多项式logistic回归模型的潜变量公式中 在离散选择法理论中很常见 潜在变量的误差服从 Gumbel 分布 这很有用 因为两个耿贝尔分布的随机变量的差服从logistic分布 耿贝尔分布以Emil Julius Gumbel 1891 1966 的名字命名 来自描述该分布的原始论文 1 2 目录 1 定义 1 1 标准耿贝尔分布 2 特性 3 相关分布 4 应用 4 1 Gumbel 重参数化技巧 5 随机变量生成 5 1 概率纸 6 参见 7 参考资料 8 外部链接定义 编辑耿贝尔分布的累积分布函数为 F x m b e e x m b displaystyle F x mu beta e e x mu beta nbsp 标准耿贝尔分布 编辑 标准的耿贝尔分布是m 0 displaystyle mu 0 nbsp 和b 1 displaystyle beta 1 nbsp 时的特例 其累积分布函数为 F x e e x displaystyle F x e e x nbsp 概率密度函数为 f x e x e x displaystyle f x e x e x nbsp 此时 众数为 0 中位数为 ln ln 2 0 3665 displaystyle ln ln 2 approx 0 3665 nbsp 均值为g 0 5772 displaystyle gamma approx 0 5772 nbsp 歐拉 馬斯刻若尼常數 标准差为p 6 1 2825 displaystyle pi sqrt 6 approx 1 2825 nbsp 对于 n gt 1 累积量由下式给出 k n n 1 z n displaystyle kappa n n 1 zeta n nbsp 特性 编辑众数为 m 中位数为m b ln ln 2 displaystyle mu beta ln left ln 2 right nbsp 平均值是 E X m g b displaystyle operatorname E X mu gamma beta nbsp 其中g displaystyle gamma nbsp 是歐拉 馬斯刻若尼常數 标准差 s displaystyle sigma nbsp 是b p 6 displaystyle beta pi sqrt 6 nbsp 因此b s 6 p 0 78 s displaystyle beta sigma sqrt 6 pi approx 0 78 sigma nbsp 3 在众数处 x m displaystyle x mu nbsp F x m b displaystyle F x mu beta nbsp 的值变为e 1 0 37 displaystyle e 1 approx 0 37 nbsp 与b displaystyle beta nbsp 的取值无关 相关分布 编辑如果X displaystyle X nbsp 具有耿贝尔分布 则Y X的条件分布在Y为正的情况下 或等效地在X为负的情况下具有Gompertz分布 Y的 cdf G与X的 cdf F相关 公式如下G y P Y y P X y X 0 F 0 F y F 0 displaystyle G y P Y leq y P X geq y X leq 0 F 0 F y F 0 nbsp 要求y gt 0 因此 两者概率密度函数相关 g y f y F 0 displaystyle g y f y F 0 nbsp Gompertz 密度与反射的 Gumbel 密度成正比 仅限于正半线 4 如果X是均值为 1 的指数分布变量 则 log X 服从标准 Gumbel 分布 如果X G u m b e l a X b displaystyle X sim mathrm Gumbel alpha X beta nbsp 和Y G u m b e l a Y b displaystyle Y sim mathrm Gumbel alpha Y beta nbsp 是独立的 那么X Y L o g i s t i c a X a Y b displaystyle X Y sim mathrm Logistic alpha X alpha Y beta nbsp 见Logistic分布 如果X Y G u m b e l a b displaystyle X Y sim mathrm Gumbel alpha beta nbsp 是独立的 那么X Y L o g i s t i c 2 a b displaystyle X Y nsim mathrm Logistic 2 alpha beta nbsp 注意E X Y 2 a 2 b g 2 a E L o g i s t i c 2 a b displaystyle E X Y 2 alpha 2 beta gamma neq 2 alpha E left mathrm Logistic 2 alpha beta right nbsp 更一般地 独立 Gumbel 随机变量的线性组合的分布可以用 GNIG 和 GIG 分布来近似 5 与广义多变量对数伽马分布相关的理论提供了耿贝尔分布的多变量版本 应用 编辑 nbsp 具有累积耿贝尔分布置信带的十月最大单日降雨量分布拟合 6 Gumbel 表明 随着样本量的增加 将服从指数分布的随机变量减去样本量 7 的自然对数 其最大值的分布 或最后一阶统计量 接近耿贝尔分布 8 具体来说 如果令r x e x displaystyle rho x e x nbsp 是x displaystyle x nbsp 的概率分布 Q x 1 e x displaystyle Q x 1 e x nbsp 是其累积分布 那么对x displaystyle x nbsp 的N displaystyle N nbsp 次实现 realizations 的最大值小于X displaystyle X nbsp 当且仅当所有x displaystyle x nbsp 的实现都小于X displaystyle X nbsp 所以最大值的累积分布x displaystyle tilde x nbsp 满足 P x log N X P x X log N Q X log N N 1 e X N N displaystyle P tilde x log N leq X P tilde x leq X log N Q X log N N left 1 frac e X N right N nbsp 并且 对于较大的N displaystyle N nbsp 等式右边收敛到e e X displaystyle e e X nbsp 因此 在水文学中 耿贝尔分布用于分析日降雨量和河流流量的月度和年度最大值等变量 3 也用于描述干旱 9 Gumbel 还表明 表示事件的概率的估计量r n 1 其中r是观察值在数据序列中的排名 n是观察的总数 是分布的众数周围的累积分布函数的无偏估计量 因此 这个估计量经常被用作分位图 在数论中 耿贝尔分布近似于随机整数分拆的项数 10 以及最大素数间隙和素数星座之间的最大间隙的趋势调整大小 11 Gumbel 重参数化技巧 编辑 在机器学习中 耿贝尔分布有时用于从分类分布中生成样本 这种技术称为 Gumbel max技巧 是 重参数化技巧 的一个特例 12 具体而言 令 p 1 p n displaystyle pi 1 pi n nbsp 非负且不全为零 并且让g 1 g n displaystyle g 1 g n nbsp 是Gumbel 0 1 的独立样本 则P r j arg max i g i log p i p j i p i displaystyle Pr j arg max i g i log pi i frac pi j sum i pi i nbsp 因此 arg max i g i log p i Categorical p j i p i j displaystyle arg max i g i log pi i sim text Categorical left frac pi j sum i pi i right j nbsp 等价地 给定任何x 1 x n R displaystyle x 1 x n in mathbb R nbsp 我们可以从它的玻尔兹曼分布中采样 P r j arg max i g i x i e x j i e x i displaystyle Pr j arg max i g i x i frac e x j sum i e x i nbsp 相关等式包括 13 如果x E x p l displaystyle x sim Exp lambda nbsp 那么 ln x g Gumbel g ln l 1 displaystyle ln x gamma sim text Gumbel gamma ln lambda 1 nbsp arg max i g i log p i Categorical p j i p i j displaystyle arg max i g i log pi i sim text Categorical left frac pi j sum i pi i right j nbsp max i g i log p i Gumbel g log i p i 1 displaystyle max i g i log pi i sim text Gumbel left gamma log left sum i pi i right 1 right nbsp 也就是说 Gumbel 分布是一个最大稳定分布族 E max i g i b x i log i e b x i displaystyle mathbb E max i g i beta x i log left sum i e beta x i right nbsp 随机变量生成 编辑更多信息 非均匀随机变量生成 耿贝尔分布的分位数函数 逆累积分布函数 Q p displaystyle Q p nbsp 可由下式给出 Q p m b ln ln p displaystyle Q p mu beta ln ln p nbsp 其中m displaystyle mu nbsp 和b displaystyle beta nbsp 是参数 当随机变量U displaystyle U nbsp 是从 0 1 displaystyle 0 1 nbsp 上的均匀分布中抽取时 变量Q U displaystyle Q U nbsp 具有服从耿贝尔分布 概率纸 编辑 nbsp 一张包含 Gumbel 分布的方格纸 在软件时代之前 人们使用概率纸描绘耿贝尔分布 见插图 这种纸基于累积分布函数的F displaystyle F nbsp 的线性化 ln ln F x m b displaystyle ln ln F x mu beta nbsp 在纸上 水平轴以双对数刻度构建 垂直轴是线性的 通过在纸张的水平轴上寻找F displaystyle F nbsp 在垂直轴上寻找 x displaystyle x nbsp 耿贝尔分布由斜率为1 b displaystyle 1 beta nbsp 的直线表示 当像CumFreq这样的分布拟合软件可用时 绘制分布的任务变得更加容易 参见 编辑2型Gumbel分布 极值理论 广义极值分布 Fisher Tippett Gnedenko定理 埃米尔 朱利叶斯 冈贝尔参考资料 编辑 Gumbel E J Les valeurs extremes des distributions statistiques PDF Annales de l Institut Henri Poincare 1935 5 2 115 158 2023 01 21 原始内容存档 PDF 于2018 03 10 Gumbel E J 1941 The return period of flood flows The Annals of Mathematical Statistics 12 163 190 3 0 3 1 Oosterbaan R J http www waterlog info pdf freqtxt pdf chapterurl 缺少标题 帮助 PDF Ritzema H P 编 Drainage Principles and Applications Publication 16 Wageningen The Netherlands International Institute for Land Reclamation and Improvement ILRI 1994 175 224 ISBN 90 70754 33 9 Willemse W J Kaas R Rational reconstruction of frailty based mortality models by a generalisation of Gompertz law of mortality PDF Insurance Mathematics and Economics 2007 40 3 468 2023 01 21 doi 10 1016 j insmatheco 2006 07 003 原始内容 PDF 存档于2017 08 09 Marques F Coelho C de Carvalho M On the distribution of linear combinations of independent Gumbel random variables PDF Statistics and Computing 2015 25 683 701 2023 01 21 doi 10 1007 s11222 014 9453 5 原始内容存档 PDF 于2022 12 20 CumFreq software for probability distribution fitting user49229 Gumbel distribution and exponential distribution 2023 01 21 原始内容存档于2021 08 26 Gumbel E J Statistical theory of extreme values and some practical applications Applied Mathematics Series 33 1st U S Department of Commerce National Bureau of Standards 1954 2023 01 21 ASIN B0007DSHG4 原始内容存档于2023 01 21 Burke Eleanor J Perry Richard H J Brown Simon J An extreme value analysis of UK drought and projections of change in the future Journal of Hydrology 2010 388 1 2 131 143 Bibcode 2010JHyd 388 131B doi 10 1016 j jhydrol 2010 04 035 Erdos Paul Lehner Joseph The distribution of the number of summands in the partitions of a positive integer Duke Mathematical Journal 1941 8 2 335 doi 10 1215 S0012 7094 41 00826 8 Kourbatov A Maximal gaps between prime k tuples a statistical approach Journal of Integer Sequences 2013 16 Bibcode 2013arXiv1301 2242K arXiv 1301 2242 nbsp Article 13 5 2 Jang Eric Gu Shixiang Poole Ben Categorical Reparametrization with Gumble Softmax International Conference on Learning Representations ICLR 2017 April 2017 2023 01 21 原始内容存档于2023 01 21 Balog Matej Tripuraneni Nilesh Ghahramani Zoubin Weller Adrian Lost Relatives of the Gumbel Trick International Conference on Machine Learning PMLR 2017 07 17 371 379 2023 01 21 原始内容存档于2023 01 21 英语 外部链接 编辑维基共享资源中相關的多媒體資源 耿贝尔分布 分類 取自 https zh wikipedia org w index php title 耿贝尔分布 amp oldid 79054894, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。