fbpx
维基百科

离散程度

在统计学里,离散程度(英語:statistical dispersion,scatter,spread)或离散度,又稱统计变异性(statistical variability)[1],简称 變異變差(variation)、变率,是指一个分布随机变量的拉伸或压缩程度[2]习惯上,“离散”常用来描述数据分布[3],而“變異”(指:變異數、方差)更常用来描述随机变量的变异程度[4][需要解释]用以描述离散程度或變異的量主要有方差標準差變異系数四分位距等。

离散程度与集中趋势相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。

衡量 编辑

衡量离散程度的值,通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。

部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。也就是说,如果随机变量的单位是米或秒,则这些量的单位也是米或秒。这些量举例如下:

  • 标准差
  • 四分位距
  • 全距
  • 平均绝对偏差英语Mean_absolute_difference
  • 绝对差中位数英语Median_absolute_deviation
  • 平均差
  • 间隔关系英语Distance_correlation

此外,也有一些无量纲量

另外,还有一些带单位的量,但是他们的单位和随机变量本身的单位不同:

  • 方差
  • 离散指数英语Index_of_dispersion

可解释性 编辑

变差的可解释性,通常是对于一个随机变量而言的。当观测到随机变量的一些取值(例如训练集中的标签可视作是一个随机变量的一些观测值),需要推断随机变量服从的分布时,就会遇到这个问题。一般而言,推断有限观测值的随机变量服从的分布的过程,即是建立模型的过程。

假设有随机变量 及其服从的真实分布 。则对于该随机变量的观测值,可计算其变差(以方差表示) ;对于分布,亦可计算其变差 。则 是相对该随机变量的可解释變異(英语:explainable variation),其余的部分则是不可解释變異(英语:unexplainable variation)。为了衡量不可解释變異,可引入不可解释變異分数(英语:fraction of unexplainable variation) 。不可解释變異亦称为统计噪声

假设 是模型给出的随机变量的分布。则对于该预测分布,我们可以计算器變異(以方差表示) 。则 是该模型相对该随机变量的已解释變異(英语:explained variation),其余部分则是未解释變異(英语:unexplained variation)。同样,为了衡量未解释變異,可引入未解释變異分数(英语:fraction of unexplained variation) 

参考资料 编辑

  1. ^ 贺睿杰. 统计活动视角下的高中生统计学习研究[D]. 华东师范大学, 2020.
  2. ^ NIST/SEMATECH e-Handbook of Statistical Methods. 1.3.6.4. Location and Scale Parameters. www.itl.nist.gov. U.S. Department of Commerce. [2022-11-14]. (原始内容于2022-11-14). 
  3. ^ 米小琴. 统计计算与分析. 清华大学出版社有限公司. 2004: 68–75. ISBN 9787302064343. 
  4. ^ 安德森. 王峰 , 编. 商务与经济统计. 中信出版社. 2003: 202. ISBN 9787800738753. 

离散程度, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目需要精通或熟悉相关主题的编者参与及协助编辑, 請邀請適合的人士改善本条目, 更多的細節與詳情請參见討論頁, 此條目需要补充更多来源, 2019年12月10日, 请协助補充多方面可靠来源以改善这篇条目, 无法查证的内容可能會因為异议提出而被移除, 致使用者, 请搜索一下条目的标题, 来源搜索, 网页, 新闻, 书籍, 学术, 图像, 以检查网络上是否存在该主题的更多可靠来源, 判定指引, 在统计学里, 英語, statistical. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目需要精通或熟悉相关主题的编者参与及协助编辑 請邀請適合的人士改善本条目 更多的細節與詳情請參见討論頁 此條目需要补充更多来源 2019年12月10日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而被移除 致使用者 请搜索一下条目的标题 来源搜索 离散程度 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 在统计学里 离散程度 英語 statistical dispersion scatter spread 或离散度 又稱统计变异性 statistical variability 1 简称 變異 變差 variation 变率 是指一个分布或随机变量的拉伸或压缩程度 2 习惯上 离散 常用来描述数据分布 3 而 變異 指 變異數 方差 更常用来描述随机变量的变异程度 4 需要解释 用以描述离散程度或變異的量主要有方差 標準差 變異系数和四分位距等 离散程度与集中趋势相对 因此 离散度就是指各个变量值与集中趋势的偏离程度 衡量 编辑衡量离散程度的值 通常是非负实数 当衡量值取零时 表示分布集中在同一个值上 随着衡量值的增加 随机变量的取值越来越分散 部分描述离散程度的量是带单位的 并且 这些量的单位与随机变量本身的单位相同 也就是说 如果随机变量的单位是米或秒 则这些量的单位也是米或秒 这些量举例如下 标准差 四分位距 全距 平均绝对偏差 英语 Mean absolute difference 绝对差中位数 英语 Median absolute deviation 平均差 间隔关系 英语 Distance correlation 此外 也有一些无量纲量 變異係數 四分位離散係數 英语 Quartile coefficient of dispersion 基尼系数 熵另外 还有一些带单位的量 但是他们的单位和随机变量本身的单位不同 方差 离散指数 英语 Index of dispersion 可解释性 编辑变差的可解释性 通常是对于一个随机变量而言的 当观测到随机变量的一些取值 例如训练集中的标签可视作是一个随机变量的一些观测值 需要推断随机变量服从的分布时 就会遇到这个问题 一般而言 推断有限观测值的随机变量服从的分布的过程 即是建立模型的过程 假设有随机变量X displaystyle mathbf X nbsp 及其服从的真实分布X D displaystyle mathbf X sim D nbsp 则对于该随机变量的观测值 可计算其变差 以方差表示 SS total Var X displaystyle text SS text total text Var mathbf X nbsp 对于分布 亦可计算其变差SS distribution Var D displaystyle text SS text distribution text Var D nbsp 则SS distribution displaystyle text SS text distribution nbsp 是相对该随机变量的可解释變異 英语 explainable variation 其余的部分则是不可解释變異 英语 unexplainable variation 为了衡量不可解释變異 可引入不可解释變異分数 英语 fraction of unexplainable variation FUV 1 SS distribution SS total displaystyle text FUV 1 tfrac text SS text distribution text SS text total nbsp 不可解释變異亦称为统计噪声 假设D displaystyle D nbsp 是模型给出的随机变量的分布 则对于该预测分布 我们可以计算器變異 以方差表示 SS model Var D displaystyle text SS text model text Var D nbsp 则SS model displaystyle text SS text model nbsp 是该模型相对该随机变量的已解释變異 英语 explained variation 其余部分则是未解释變異 英语 unexplained variation 同样 为了衡量未解释變異 可引入未解释變異分数 英语 fraction of unexplained variation FUV 1 SS model SS total displaystyle text FUV 1 tfrac text SS text model text SS text total nbsp 参考资料 编辑 贺睿杰 统计活动视角下的高中生统计学习研究 D 华东师范大学 2020 NIST SEMATECH e Handbook of Statistical Methods 1 3 6 4 Location and Scale Parameters www itl nist gov U S Department of Commerce 2022 11 14 原始内容存档于2022 11 14 米小琴 统计计算与分析 清华大学出版社有限公司 2004 68 75 ISBN 9787302064343 安德森 王峰 编 商务与经济统计 中信出版社 2003 202 ISBN 9787800738753 取自 https zh wikipedia org w index php title 离散程度 amp oldid 76732698, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。