fbpx
维基百科

方差

概率论统计学中,方差(英語:variance)又称变异数变方,描述的是一个随机变量的离散程度,即一组数字与其平均值之间的距离的度量,是随机变量与其总体均值或样本均值的离差的平方的期望值。方差在统计中有非常核心的地位,其应用领域包括描述统计学推論統計學假說檢定、度量拟合优度英语goodness of fit,以及蒙特卡洛采样。由于科学分析经常涉及统计,方差也是重要的科研工具。方差是標準差的平方、分布的二阶矩,以及随机变量与其自身的协方差,其常用的符号表示有,以及[1]

「Variance」的各地常用別名
中国大陸方差
臺灣變異數
港澳方差
日本、韓國分散
越南分散(phương sai
两个来自不同总体的样本的案例,均值相同但方差不同。两者总体均值都是100,红色总体的方差为100(標準差SD=10),而蓝色总体的方差为2500(SD=50)。

方差作为离散度量的优点是,它比其他离散度量(如平均差)更易于代数运算;例如,一组不相关的随机变量和的方差等于它们方差的和。在实际应用中,方差的一个缺点是它与随机变量的单位不同,而標準差则单位相同,这就是计算完成后通常采用标准差来衡量离散程度的原因。

有两个不同的概念都被称为“方差”。一种如上所述,是理论概率分布的方差。而另一种方差是一组观测值的特征。观测值通常是从真实世界的系统中测量的。如果给出系统的所有可能的观测,则它们算出的方差称为总体方差;然而,一般情况下我们只使用总体的一个子集(样本),由此计算出的方差称为样本方差。用样本计算出的方差可认为是对整个总体的方差的估计量。

方差的正平方根称为该随机变量的標準差;方差除以期望值归一化的值叫分散指数;标准差除以平均值归一化的值叫变异系数

定义

X为服从分布F随机变量,如果E[X]是随机变量X期望值(均值μ=E[X]),则随机变量X或者分布F的方差为X离差平方的期望值:

 

这个定义涵盖了连续、离散,或两者皆非的随机变量。方差亦可視作随机变量与自身的协方差

 

方差也等价于生成X的概率分布的二阶累积量。方差的常用的表达有 ,有时作  ,也可写作符号  (读作“sigma方”)。方差的表达式可展开如下:

 

也就是说,X的方差等于X平方的均值减去X均值的平方。该等式不应该用于浮点运算,因为如果等式的两个成分大小相似,将会造成灾难性抵消

离散随机变量

如果随机变量X是具有概率质量函數的离散随机分布x1 ↦ p1, ..., xn ↦ pn,則:

 

此處 是其期望值,即:

 

X為有n個相等機率值的平均分佈:

 

n個相等機率值的方差亦可以點對點間的方變量表示為:

 

连续型随机变量

如果随机变量X是連續分布,機率密度函數f(x),相應的累积分布函数F(x),則其方差為:

 

或等價地:

 

其中  的期望值,其計算方法如下:

 

這些公式中,  的積分分別為勒貝格積分勒贝格-斯蒂尔吉斯积分英语Lebesgue–Stieltjes integration

若函數 在每個有限區間 都是黎曼可積的,則:

 

該積分為非正常黎曼积分

常见概率分布

下表列出了一些常用概率分布的方差。

概率分布类型 概率分布函数 均值 方差
二項式分布      
幾何分佈      
正态分布      
連續型均勻分布      
指数分布      
卜瓦松分布      

特性

方差不會是負的,因為平方運算結果為非負數:

 

一個常數隨機變數的方差為零。反之,若有限個數組成的資料集方差為零,則其內所有數皆相等。對於一般隨機變數,也有類似結論,即方差為零推出該變數幾乎總是取同一個值:

 

方差不變於定位參數的變動。也就是說,如果一個常數被加至一個數列中的所有變數值,此數列的方差不會改變:

 

如果所有數值被放大一個常數倍,方差會放大此常數的平方倍:

 

兩個隨機變數合的方差為:

 
 

此處Cov(X, Y)代表共變異數

對於 個隨機變數 的總和:

 

在样本空间Ω上存在有限期望和方差的随机变量构成一个希尔伯特空间L2 (Ω, dP),不过这裡的内积和长度跟协方差,标准差还是不大一样。所以,我们得把这个空间“除”常变量构成的子空间,也就是说把相差一个常数的所有原来那个空间的随机变量做成一个等价类。这还是一个新的无穷维线性空间,并且有一个从旧空间内积诱导出来的新内积,而这个内积就是协方差。

总体方差和样本方差

总体方差

一般而言,一个有限的容量为N、元素的值为xi总体总体方差为:

 

其中总体均值为:

 

总体方差也可用下式计算:

 

该式成立,是因为:

 

总体方差与生成该总体的概率分布的方差相匹配。因此,“总体”的概念可推广到具有无限总体的连续随机变量。

样本方差

有偏样本方差

在许多实际情况下,总体的真实方差无法事先知道,必须以某种方式计算出来。在面对非常大的总体时,不可能计算总体中的每一个元素,因此必须从总体中抽取样本进行计算。[2]样本方差还可以应用于用连续分布的样本来估计该分布的方差。

下面我们从总体中有放回抽取n个数值Y1, ..., Yn,其中n < N,并用该样本来估计总体的方差。[3]直接使用样本数据的方差,得到的是离差平方英语squared deviations的均值:

 

此处, 表示样本均值

 

由于Yi是随机选取的,  都是随机变量。它们的期望值可以用从总体中抽取的所有可能的容量为n{Yi}的样本集合来估计。对于 即为:

 

因此, 给出的是总体方差的有偏估计量,偏差为 。因此, 称为有偏样本方差

无偏样本方差

将偏差纠正后,可得到无偏样本方差,记为 

 

当语境明确时,两个估计量都可以简称为“样本方差”。同样的证明也适用于取自连续概率分布的样本。

其中,对n − 1的使用称为贝塞尔校正英语Bessel's correction,它也用于样本协方差英语sample covariance样本标准差(方差的平方根)。平方根是一个凹函数,因此会引入负偏差(根据簡森不等式),具体取决于分布,因此校正的样本标准差(使用贝塞尔校正)是有偏的。标准差的无偏估计英语unbiased estimation of standard deviation是一个技术上复杂的问题,不过对于正态分布,使用n - 1.5能得到几乎无偏的估计值。

无偏样本方差是函数ƒ(y1y2) = (y1 − y2)2/2U-统计量

一般化

如果X是一个向量其取值范围在實數空间Rn,并且其每个元素都是一个一维随机变量,我们就把X称为随机向量。随机向量的方差是一维随机变量方差的自然推广,其定义为E[(Xμ)(Xμ)T],其中μ = E(X)XTX的转置。这个方差是一个非负定方阵,通常称为协方差矩阵

如果X是一个複數随机变量的向量(向量中每個元素均為複數的隨機變數),那么其方差定义则为E[(X − μ)(X − μ)*],其中X*X共轭转置向量或稱為埃尔米特向量。根据这个定义,變異數为实数。

历史

方差」(variance)这个名词率先由羅納德·費雪(英語:Ronald Fisher)在论文《The Correlation between Relatives on the Supposition of Mendelian Inheritance[4]中提出。

后来方差逐渐衍生出了「半方差」(semivariance)、「亚方差」(hypo variance)、「超方差」(super variance)、「圆方差英语circular variance」(circular variance)与「倒方差」(inverse variance)等概念。

半方差

半方差的計算方式與方差類似,但是只包括了低於均值的觀測值:

 

半方差在不同应用领域也被用作特殊的量度。对于偏态分布,半方差能提供方差所不能提供的额外信息。[5]

参见

方差类型

参考文献

  1. ^ Wasserman, Larry. All of Statistics: a concise course in statistical inference. Springer texts in statistics. 2005: 51. ISBN 9781441923226. 
  2. ^ Navidi, William (2006) Statistics for Engineers and Scientists, McGraw-Hill, pg 14.
  3. ^ Montgomery, D. C. and Runger, G. C. (1994) Applied statistics and probability for engineers, page 201. John Wiley & Sons New York
  4. ^ Ronald Fisher(1918)The correlation between relatives on the supposition of Mendelian Inheritance (页面存档备份,存于互联网档案馆
  5. ^ Fama, Eugene F.; French, Kenneth R. . Fama/French Forum. 2010-04-21 [2022-06-10]. (原始内容存档于2021-07-25). 

方差, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目需要擴充, 2015年12月9日, 请協助改善这篇條目, 更進一步的信息可能會在討論頁或扩充请求中找到, 请在擴充條目後將此模板移除, 此條目需要补充更多来源, 2015年12月9日, 请协助補充多方面可靠来源以改善这篇条目, 无法查证的内容可能會因為异议提出而移除, 致使用者, 请搜索一下条目的标题, 来源搜索, 网页, 新闻, 书籍, 学术, 图像, 以检查网络上是否存在该主题的更多可靠来源, 判定指引, 此条目的主題是變異數, . 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目需要擴充 2015年12月9日 请協助改善这篇條目 更進一步的信息可能會在討論頁或扩充请求中找到 请在擴充條目後將此模板移除 此條目需要补充更多来源 2015年12月9日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而移除 致使用者 请搜索一下条目的标题 来源搜索 方差 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 此条目的主題是變異數 又稱变异数 變方 关于變異係數 coefficient of variation 請見 变异系数 在概率论和统计学中 方差 英語 variance 又称变异数 变方 描述的是一个随机变量的离散程度 即一组数字与其平均值之间的距离的度量 是随机变量与其总体均值或样本均值的离差的平方的期望值 方差在统计中有非常核心的地位 其应用领域包括描述统计学 推論統計學 假說檢定 度量拟合优度 英语 goodness of fit 以及蒙特卡洛采样 由于科学分析经常涉及统计 方差也是重要的科研工具 方差是標準差的平方 分布的二阶矩 以及随机变量与其自身的协方差 其常用的符号表示有s 2 displaystyle sigma 2 s 2 displaystyle s 2 Var X displaystyle operatorname Var X V X displaystyle V X 以及V X displaystyle mathbb V X 1 Variance 的各地常用別名中国大陸方差臺灣變異數港澳方差日本 韓國分散越南分散 phương sai 两个来自不同总体的样本的案例 均值相同但方差不同 两者总体均值都是100 红色总体的方差为100 標準差SD 10 而蓝色总体的方差为2500 SD 50 方差作为离散度量的优点是 它比其他离散度量 如平均差 更易于代数运算 例如 一组不相关的随机变量和的方差等于它们方差的和 在实际应用中 方差的一个缺点是它与随机变量的单位不同 而標準差则单位相同 这就是计算完成后通常采用标准差来衡量离散程度的原因 有两个不同的概念都被称为 方差 一种如上所述 是理论概率分布的方差 而另一种方差是一组观测值的特征 观测值通常是从真实世界的系统中测量的 如果给出系统的所有可能的观测 则它们算出的方差称为总体方差 然而 一般情况下我们只使用总体的一个子集 样本 由此计算出的方差称为样本方差 用样本计算出的方差可认为是对整个总体的方差的估计量 方差的正平方根称为该随机变量的標準差 方差除以期望值归一化的值叫分散指数 标准差除以平均值归一化的值叫变异系数 目录 1 定义 1 1 离散随机变量 1 2 连续型随机变量 1 3 常见概率分布 2 特性 3 总体方差和样本方差 3 1 总体方差 3 2 样本方差 3 2 1 有偏样本方差 3 2 2 无偏样本方差 4 一般化 5 历史 6 半方差 7 参见 7 1 方差类型 8 参考文献定义 编辑设X 为服从分布F 的随机变量 如果E X 是随机变量X 的期望值 均值m E X 则随机变量X 或者分布F 的方差为X 的离差平方的期望值 Var X E X m 2 displaystyle operatorname Var X operatorname E left X mu 2 right 这个定义涵盖了连续 离散 或两者皆非的随机变量 方差亦可視作随机变量与自身的协方差 Var X Cov X X displaystyle operatorname Var X operatorname Cov X X 方差也等价于生成X 的概率分布的二阶累积量 方差的常用的表达有Var X displaystyle operatorname Var X 有时作V X displaystyle V X 或V X displaystyle mathbb V X 也可写作符号s X 2 displaystyle sigma X 2 或s 2 displaystyle sigma 2 读作 sigma方 方差的表达式可展开如下 Var X E X E X 2 E X 2 2 X E X E X 2 E X 2 2 E X E X E X 2 E X 2 E X 2 displaystyle begin aligned operatorname Var X amp operatorname E left X operatorname E X 2 right 4pt amp operatorname E left X 2 2X operatorname E X operatorname E X 2 right 4pt amp operatorname E left X 2 right 2 operatorname E X operatorname E X operatorname E X 2 4pt amp operatorname E left X 2 right operatorname E X 2 end aligned 也就是说 X 的方差等于X 平方的均值减去X 均值的平方 该等式不应该用于浮点运算 因为如果等式的两个成分大小相似 将会造成灾难性抵消 离散随机变量 编辑 如果随机变量X 是具有概率质量函數的离散随机分布x1 p1 xn pn 則 Var X i 1 n p i x i m 2 i 1 n p i x i 2 m 2 displaystyle operatorname Var X sum i 1 n p i cdot x i mu 2 sum i 1 n p i cdot x i 2 mu 2 此處m displaystyle mu 是其期望值 即 m i 1 n p i x i displaystyle mu sum i 1 n p i cdot x i 當X 為有n 個相等機率值的平均分佈 Var X s 2 1 n i 1 n x i m 2 1 n i 1 n x i 2 n m 2 i 1 n x i 2 n m 2 displaystyle operatorname Var X sigma 2 frac 1 n sum i 1 n x i mu 2 frac 1 n left sum i 1 n x i 2 n mu 2 right frac sum i 1 n x i 2 n mu 2 n 個相等機率值的方差亦可以點對點間的方變量表示為 Var X 1 n 2 i 1 n j 1 n 1 2 x i x j 2 displaystyle operatorname Var X frac 1 n 2 sum i 1 n sum j 1 n frac 1 2 x i x j 2 连续型随机变量 编辑 如果随机变量X 是連續分布 機率密度函數為f x 相應的累积分布函数為F x 則其方差為 Var X s 2 R x m 2 f x d x R x 2 f x d x 2 m R x f x d x m 2 R f x d x R x 2 d F x 2 m R x d F x m 2 R d F x R x 2 d F x 2 m m m 2 1 R x 2 d F x m 2 displaystyle begin aligned operatorname Var X sigma 2 amp int mathbb R x mu 2 f x dx 4pt amp int mathbb R x 2 f x dx 2 mu int mathbb R xf x dx mu 2 int mathbb R f x dx 4pt amp int mathbb R x 2 dF x 2 mu int mathbb R x dF x mu 2 int mathbb R dF x 4pt amp int mathbb R x 2 dF x 2 mu cdot mu mu 2 cdot 1 4pt amp int mathbb R x 2 dF x mu 2 end aligned 或等價地 Var X R x 2 f x d x m 2 displaystyle operatorname Var X int mathbb R x 2 f x dx mu 2 其中m displaystyle mu 為X displaystyle X 的期望值 其計算方法如下 m R x f x d x R x d F x displaystyle mu int mathbb R xf x dx int mathbb R x dF x 這些公式中 d x displaystyle dx 和d F x displaystyle dF x 的積分分別為勒貝格積分和勒贝格 斯蒂尔吉斯积分 英语 Lebesgue Stieltjes integration 若函數x 2 f x displaystyle x 2 f x 在每個有限區間 a b R displaystyle a b subset mathbb R 都是黎曼可積的 則 Var X x 2 f x d x m 2 displaystyle operatorname Var X int infty infty x 2 f x dx mu 2 該積分為非正常黎曼积分 常见概率分布 编辑 下表列出了一些常用概率分布的方差 概率分布类型 概率分布函数 均值 方差二項式分布 Pr X k n k p k 1 p n k displaystyle Pr X k binom n k p k 1 p n k n p displaystyle np n p 1 p displaystyle np 1 p 幾何分佈 Pr X k 1 p k 1 p displaystyle Pr X k 1 p k 1 p 1 p displaystyle frac 1 p 1 p p 2 displaystyle frac 1 p p 2 正态分布 f x m s 2 1 2 p s 2 e x m 2 2 s 2 displaystyle f left x mid mu sigma 2 right frac 1 sqrt 2 pi sigma 2 e frac x mu 2 2 sigma 2 m displaystyle mu s 2 displaystyle sigma 2 連續型均勻分布 f x a b 1 b a for a x b 0 for x lt a or x gt b displaystyle f x mid a b begin cases frac 1 b a amp text for a leq x leq b 3pt 0 amp text for x lt a text or x gt b end cases a b 2 displaystyle frac a b 2 b a 2 12 displaystyle frac b a 2 12 指数分布 f x l l e l x displaystyle f x mid lambda lambda e lambda x 1 l displaystyle frac 1 lambda 1 l 2 displaystyle frac 1 lambda 2 卜瓦松分布 f k l e l l k k displaystyle f k mid lambda frac e lambda lambda k k l displaystyle lambda l displaystyle lambda 特性 编辑方差不會是負的 因為平方運算結果為非負數 Var X 0 displaystyle operatorname Var X geq 0 一個常數隨機變數的方差為零 反之 若有限個數組成的資料集方差為零 則其內所有數皆相等 對於一般隨機變數 也有類似結論 即方差為零推出該變數幾乎總是取同一個值 P X a 1 Var X 0 displaystyle P X a 1 Leftrightarrow operatorname Var X 0 方差不變於定位參數的變動 也就是說 如果一個常數被加至一個數列中的所有變數值 此數列的方差不會改變 Var X a Var X displaystyle operatorname Var X a operatorname Var X 如果所有數值被放大一個常數倍 方差會放大此常數的平方倍 Var a X a 2 Var X displaystyle operatorname Var aX a 2 operatorname Var X 兩個隨機變數合的方差為 Var a X b Y a 2 Var X b 2 Var Y 2 a b Cov X Y displaystyle operatorname Var aX bY a 2 operatorname Var X b 2 operatorname Var Y 2ab operatorname Cov X Y Var X Y Var X Var Y 2 Cov X Y displaystyle operatorname Var X Y operatorname Var X operatorname Var Y 2 operatorname Cov X Y 此處Cov X Y 代表共變異數 對於N displaystyle N 個隨機變數 X 1 X N displaystyle X 1 dots X N 的總和 Var i 1 N X i i j 1 N Cov X i X j i 1 N Var X i i j Cov X i X j displaystyle operatorname Var left sum i 1 N X i right sum i j 1 N operatorname Cov X i X j sum i 1 N operatorname Var X i sum i neq j operatorname Cov X i X j 在样本空间W上存在有限期望和方差的随机变量构成一个希尔伯特空间 L2 W dP 不过这裡的内积和长度跟协方差 标准差还是不大一样 所以 我们得把这个空间 除 常变量构成的子空间 也就是说把相差一个常数的所有原来那个空间的随机变量做成一个等价类 这还是一个新的无穷维线性空间 并且有一个从旧空间内积诱导出来的新内积 而这个内积就是协方差 总体方差和样本方差 编辑总体方差 编辑 一般而言 一个有限的容量为N 元素的值为xi 的总体的总体方差为 s 2 1 N i 1 N x i m 2 1 N i 1 N x i 2 2 m x i m 2 1 N i 1 N x i 2 2 m 1 N i 1 N x i m 2 1 N i 1 N x i 2 m 2 displaystyle begin aligned sigma 2 amp frac 1 N sum i 1 N left x i mu right 2 frac 1 N sum i 1 N left x i 2 2 mu x i mu 2 right 5pt amp left frac 1 N sum i 1 N x i 2 right 2 mu left frac 1 N sum i 1 N x i right mu 2 5pt amp left frac 1 N sum i 1 N x i 2 right mu 2 end aligned 其中总体均值为 m 1 N i 1 N x i displaystyle mu frac 1 N sum i 1 N x i 总体方差也可用下式计算 s 2 1 N 2 i lt j x i x j 2 1 2 N 2 i j 1 N x i x j 2 displaystyle sigma 2 frac 1 N 2 sum i lt j left x i x j right 2 frac 1 2N 2 sum i j 1 N left x i x j right 2 该式成立 是因为 1 2 N 2 i j 1 N x i x j 2 1 2 N 2 i j 1 N x i 2 2 x i x j x j 2 1 2 N j 1 N 1 N i 1 N x i 2 1 N i 1 N x i 1 N j 1 N x j 1 2 N i 1 N 1 N j 1 N x j 2 1 2 s 2 m 2 m 2 1 2 s 2 m 2 s 2 displaystyle begin aligned amp frac 1 2N 2 sum i j 1 N left x i x j right 2 5pt amp frac 1 2N 2 sum i j 1 N left x i 2 2x i x j x j 2 right 5pt amp frac 1 2N sum j 1 N left frac 1 N sum i 1 N x i 2 right left frac 1 N sum i 1 N x i right left frac 1 N sum j 1 N x j right frac 1 2N sum i 1 N left frac 1 N sum j 1 N x j 2 right 5pt amp frac 1 2 left sigma 2 mu 2 right mu 2 frac 1 2 left sigma 2 mu 2 right 5pt amp sigma 2 end aligned 总体方差与生成该总体的概率分布的方差相匹配 因此 总体 的概念可推广到具有无限总体的连续随机变量 样本方差 编辑 有偏样本方差 编辑 在许多实际情况下 总体的真实方差无法事先知道 必须以某种方式计算出来 在面对非常大的总体时 不可能计算总体中的每一个元素 因此必须从总体中抽取样本进行计算 2 样本方差还可以应用于用连续分布的样本来估计该分布的方差 下面我们从总体中有放回抽取n 个数值Y1 Yn 其中n lt N 并用该样本来估计总体的方差 3 直接使用样本数据的方差 得到的是离差平方 英语 squared deviations 的均值 s Y 2 1 n i 1 n Y i Y 2 1 n i 1 n Y i 2 Y 2 1 n 2 i j i lt j Y i Y j 2 displaystyle sigma Y 2 frac 1 n sum i 1 n left Y i overline Y right 2 left frac 1 n sum i 1 n Y i 2 right overline Y 2 frac 1 n 2 sum i j i lt j left Y i Y j right 2 此处 Y displaystyle overline Y 表示样本均值 Y 1 n i 1 n Y i displaystyle overline Y frac 1 n sum i 1 n Y i 由于Yi 是随机选取的 Y displaystyle overline Y 和s Y 2 displaystyle sigma Y 2 都是随机变量 它们的期望值可以用从总体中抽取的所有可能的容量为n 的 Yi 的样本集合来估计 对于s Y 2 displaystyle sigma Y 2 即为 E s Y 2 E 1 n i 1 n Y i 1 n j 1 n Y j 2 1 n i 1 n E Y i 2 2 n Y i j 1 n Y j 1 n 2 j 1 n Y j k 1 n Y k 1 n i 1 n n 2 n E Y i 2 2 n j i E Y i Y j 1 n 2 j 1 n k j n E Y j Y k 1 n 2 j 1 n E Y j 2 1 n i 1 n n 2 n s 2 m 2 2 n n 1 m 2 1 n 2 n n 1 m 2 1 n s 2 m 2 n 1 n s 2 displaystyle begin aligned operatorname E sigma Y 2 amp operatorname E left frac 1 n sum i 1 n left Y i frac 1 n sum j 1 n Y j right 2 right 5pt amp frac 1 n sum i 1 n operatorname E left Y i 2 frac 2 n Y i sum j 1 n Y j frac 1 n 2 sum j 1 n Y j sum k 1 n Y k right 5pt amp frac 1 n sum i 1 n left frac n 2 n operatorname E left Y i 2 right frac 2 n sum j neq i operatorname E left Y i Y j right frac 1 n 2 sum j 1 n sum k neq j n operatorname E left Y j Y k right frac 1 n 2 sum j 1 n operatorname E left Y j 2 right right 5pt amp frac 1 n sum i 1 n left frac n 2 n left sigma 2 mu 2 right frac 2 n n 1 mu 2 frac 1 n 2 n n 1 mu 2 frac 1 n left sigma 2 mu 2 right right 5pt amp frac n 1 n sigma 2 end aligned 因此 s Y 2 displaystyle sigma Y 2 给出的是总体方差的有偏估计量 偏差为n 1 n displaystyle frac n 1 n 因此 s Y 2 displaystyle sigma Y 2 称为有偏样本方差 无偏样本方差 编辑 将偏差纠正后 可得到无偏样本方差 记为s 2 displaystyle s 2 s 2 n n 1 s Y 2 n n 1 1 n i 1 n Y i Y 2 1 n 1 i 1 n Y i Y 2 displaystyle s 2 frac n n 1 sigma Y 2 frac n n 1 left frac 1 n sum i 1 n left Y i overline Y right 2 right frac 1 n 1 sum i 1 n left Y i overline Y right 2 当语境明确时 两个估计量都可以简称为 样本方差 同样的证明也适用于取自连续概率分布的样本 其中 对n 1 的使用称为贝塞尔校正 英语 Bessel s correction 它也用于样本协方差 英语 sample covariance 和样本标准差 方差的平方根 平方根是一个凹函数 因此会引入负偏差 根据簡森不等式 具体取决于分布 因此校正的样本标准差 使用贝塞尔校正 是有偏的 标准差的无偏估计 英语 unbiased estimation of standard deviation 是一个技术上复杂的问题 不过对于正态分布 使用n 1 5 能得到几乎无偏的估计值 无偏样本方差是函数ƒ y1 y2 y1 y2 2 2 的U 统计量 一般化 编辑如果X 是一个向量其取值范围在實數空间Rn 并且其每个元素都是一个一维随机变量 我们就把X 称为随机向量 随机向量的方差是一维随机变量方差的自然推广 其定义为E X m X m T 其中m E X XT 是X 的转置 这个方差是一个非负定的方阵 通常称为协方差矩阵 如果X 是一个複數随机变量的向量 向量中每個元素均為複數的隨機變數 那么其方差定义则为E X m X m 其中X 是X 的共轭转置向量或稱為埃尔米特向量 根据这个定义 變異數为实数 历史 编辑 方差 variance 这个名词率先由羅納德 費雪 英語 Ronald Fisher 在论文 The Correlation between Relatives on the Supposition of Mendelian Inheritance 4 中提出 后来方差逐渐衍生出了 半方差 semivariance 亚方差 hypo variance 超方差 super variance 圆方差 英语 circular variance circular variance 与 倒方差 inverse variance 等概念 半方差 编辑半方差的計算方式與方差類似 但是只包括了低於均值的觀測值 Semivariance 1 n i x i lt m x i m 2 displaystyle text Semivariance 1 over n sum i x i lt mu x i mu 2 半方差在不同应用领域也被用作特殊的量度 对于偏态分布 半方差能提供方差所不能提供的额外信息 5 参见 编辑方差分析 标准差 标准离差率 变异系数 异方差 最小平方頻譜分析法 离散程度 方差稳定化变换 英语 Variance stabilizing transformation 方差类型 编辑 相关 概率论 可解释变异 合并方差 伪方差 英语 Pseudo variance 参考文献 编辑 Wasserman Larry All of Statistics a concise course in statistical inference Springer texts in statistics 2005 51 ISBN 9781441923226 Navidi William 2006 Statistics for Engineers and Scientists McGraw Hill pg 14 Montgomery D C and Runger G C 1994 Applied statistics and probability for engineers page 201 John Wiley amp Sons New York Ronald Fisher 1918 The correlation between relatives on the supposition of Mendelian Inheritance 页面存档备份 存于互联网档案馆 Fama Eugene F French Kenneth R Q amp A Semi Variance A Better Risk Measure Fama French Forum 2010 04 21 2022 06 10 原始内容存档于2021 07 25 取自 https zh wikipedia org w index php title 方差 amp oldid 74605778, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。