fbpx
维基百科

样本均值

样本均值是由一個或多個隨機變數中得到的统计量,样本均值是一個向量,其中的每個元素都是針對隨機變數取様後得到的算术平均数。若只考慮一個随机变量,則样本均值為一個純量,是隨機變數觀測值的算术平均。

定義

 為第j個隨機變數(j=1,...,K)在第i次觀測(i=1,...,N)到的值,所有觀測值可以重組為N個K ×1的向量,其中第i次觀測的所有數據用 表示(i=1,...,N)。

算术平均向量 的第j個元素 是第j個隨機變數在N次觀測值的平均值:

 

因此算术平均向量包括所有隨機變數的平均值,可以用以下方式表示:

 

样本均值是隨機向量英语Multivariate random variable 期望(若存在)的無偏估計英语Bias of an estimator,隨機向量是一個列向量,其中第j個元素(j = 1, ..., K)為第j個隨機變數[1]

样本均值因為是用所有的觀測值計算而得,稍微和每次的觀測值有關。若母体平均 已知,其無偏估計值

 

用到母体平均,其分母為 

样本均值的方差

本节中总假定出现的均值和方差都是存在的。對於每個隨機變數,样本均值是母体平均的良好估计函数,其中的良好是指有效及無偏差。當然样本均值不會是統計母體真實均值的正確值,因為從同一個分佈中不同的取様會產生不同的样本均值,也就對真實均值有不同的估计。因此样本均值也是隨機變數,不是常數,因此也會有其分佈隨機變數。針對第j個隨機變數N次觀測的隨機取様,其样本均值分佈的均值會等於母體均值 ,而其變異數會等於 ,其中 是隨機變數Xj的變異數。

評論

样本均值廣為使用在統計學及相關應用中,不過也有其缺點。样本均值不是稳健统计英语robust statistics,容易受異常點英语outliers影響。在真實世界的應用中,一般會期望數據有稳健的性質,有其他方式可以計算類似样本均值的統計量,但又比样本均值要稳健,可以得到一些常見的量化統計量,例如様本眾數位置參數英语Location parameter有關[2]。其他的替代品包括Winsorising英语Winsorising修整估计量英语Trimmed estimator,例如Winsorized平均英语Winsorized mean修整平均英语trimmed mean

參考資料

  1. ^ Richard Arnold Johnson; Dean W. Wichern. Applied Multivariate Statistical Analysis. Pearson Prentice Hall. 2007 [10 August 2012]. ISBN 978-0-13-187715-3. (原始内容于2020-10-30). 
  2. ^ The World Question Center 2006: The Sample Mean (页面存档备份,存于互联网档案馆), Bart Kosko

样本均值, 是由一個或多個隨機變數中得到的统计量, 是一個向量, 其中的每個元素都是針對隨機變數取様後得到的算术平均数, 若只考慮一個随机变量, 則為一個純量, 是隨機變數觀測值的算术平均, 目录, 定義, 的方差, 評論, 參考資料定義, 编辑令x, displaystyle, 為第j個隨機變數, 在第i次觀測, 到的值, 所有觀測值可以重組為n個k, 1的向量, 其中第i次觀測的所有數據用x, displaystyle, mathbf, 表示, 算术平均向量x, displaystyle, mathbf, 的第. 样本均值是由一個或多個隨機變數中得到的统计量 样本均值是一個向量 其中的每個元素都是針對隨機變數取様後得到的算术平均数 若只考慮一個随机变量 則样本均值為一個純量 是隨機變數觀測值的算术平均 目录 1 定義 2 样本均值的方差 3 評論 4 參考資料定義 编辑令x i j displaystyle x ij 為第j個隨機變數 j 1 K 在第i次觀測 i 1 N 到的值 所有觀測值可以重組為N個K 1的向量 其中第i次觀測的所有數據用x i displaystyle mathbf x i 表示 i 1 N 算术平均向量x displaystyle mathbf bar x 的第j個元素x j displaystyle bar x j 是第j個隨機變數在N次觀測值的平均值 x j 1 N i 1 N x i j j 1 K displaystyle bar x j frac 1 N sum i 1 N x ij quad j 1 ldots K 因此算术平均向量包括所有隨機變數的平均值 可以用以下方式表示 x 1 N i 1 N x i displaystyle mathbf bar x frac 1 N sum i 1 N mathbf x i 样本均值是隨機向量 英语 Multivariate random variable X displaystyle textstyle mathbf X 期望 若存在 的無偏估計 英语 Bias of an estimator 隨機向量是一個列向量 其中第j個元素 j 1 K 為第j個隨機變數 1 样本均值因為是用所有的觀測值計算而得 稍微和每次的觀測值有關 若母体平均E X displaystyle operatorname E mathbf X 已知 其無偏估計值 q j k 1 N i 1 N x i j E X j x i k E X k displaystyle q jk frac 1 N sum i 1 N left x ij operatorname E X j right left x ik operatorname E X k right 用到母体平均 其分母為N displaystyle textstyle N 样本均值的方差 编辑本节中总假定出现的均值和方差都是存在的 對於每個隨機變數 样本均值是母体平均的良好估计函数 其中的良好是指有效及無偏差 當然样本均值不會是統計母體真實均值的正確值 因為從同一個分佈中不同的取様會產生不同的样本均值 也就對真實均值有不同的估计 因此样本均值也是隨機變數 不是常數 因此也會有其分佈隨機變數 針對第j個隨機變數N次觀測的隨機取様 其样本均值分佈的均值會等於母體均值E X j displaystyle E X j 而其變異數會等於s j 2 N displaystyle frac sigma j 2 N 其中s j 2 displaystyle sigma j 2 是隨機變數Xj的變異數 評論 编辑样本均值廣為使用在統計學及相關應用中 不過也有其缺點 样本均值不是稳健统计 英语 robust statistics 容易受異常點 英语 outliers 影響 在真實世界的應用中 一般會期望數據有稳健的性質 有其他方式可以計算類似样本均值的統計量 但又比样本均值要稳健 可以得到一些常見的量化統計量 例如様本眾數和位置參數 英语 Location parameter 有關 2 其他的替代品包括Winsorising 英语 Winsorising 及修整估计量 英语 Trimmed estimator 例如Winsorized平均 英语 Winsorized mean 及修整平均 英语 trimmed mean 參考資料 编辑 Richard Arnold Johnson Dean W Wichern Applied Multivariate Statistical Analysis Pearson Prentice Hall 2007 10 August 2012 ISBN 978 0 13 187715 3 原始内容存档于2020 10 30 The World Question Center 2006 The Sample Mean 页面存档备份 存于互联网档案馆 Bart Kosko 取自 https zh wikipedia org w index php title 样本均值 amp oldid 74496201, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。