fbpx
维基百科

高斯-马尔可夫定理

高斯-馬可夫定理(英語:Gauss-Markov Theorem),在統計學中陳述的是在线性回归模型中,如果线性模型满足高斯马尔可夫假定,则回归系数的最佳线性无偏估计BLUE, Best Linear unbiased estimator)就是普通最小二乘法估计

  • 这里最佳的意思是指相较于其他估计量有更小方差估计量,同时把对估计量的寻找限制在所有可能的线性无偏估计量中。
  • 值得注意的是这里不需要假定误差满足同分布或正态分布
  • 线性模型指对于参数是线性的,因此线性模型并非看起来那么有约束性,通过适当的对y与x做变换(如logy与x),可以得到y与x的非线性关系,但并未跳出线性模型的范畴。

表述

简单(一元)线性回归模型

对于简单(一元)线性回归模型,

 

其中  非随机但不能观测到的参数, 非随机且可观测到的一般变量, 不可观测的随机变量,或称为随机误差或噪音, 可观测的随机变量。

高斯-马尔可夫定理的假设条件是:

  • 在总体模型中,各变量关系为 (线性于参数)
  • 我们具有服从于上述模型的随机样本,样本容量为n(随机抽样),
  • x的样本结果为非完全相同的数值(解释变量的样本有波动),
  • 对于给定的解释变量,误差的期望为零,换言之  (零条件均值),
  • 对于给定的解释变量,误差具有相同的方差,换言之  (同方差性)。

则对  的最佳线性无偏估计为,

 

多元线性回归模型

对于多元线性回归模型,

 ,  

使用矩阵形式,线性回归模型可简化记为 ,其中采用了以下记号:

  (观测值向量,Vector of Responses),

  (设计矩阵,Design Matrix),

  (参数向量,Vector of Parameters),

  (随机误差向量,Vectors of Error)。

高斯-马尔可夫定理的假设条件是:

  •   (零均值),
  •  ,(同方差且不相关),其中 为n阶单位矩阵(Identity Matrix)。

则对 的最佳线性无偏估计为

 

证明

首先,注意的是这里数据是 而非 ,我们希望找到 对于 的线性估计量,记作

 

其中    分别是    矩阵。

根据零均值假设所得,

 

其次,我们同时限制寻找的估计量为无偏的估计量,即要求 ,因此有

 零矩阵), 

参见

外部連結

  • (brief history and explanation of its name)
  • Proof of the Gauss Markov theorem for multiple linear regression (页面存档备份,存于互联网档案馆) (makes use of matrix algebra)

高斯, 马尔可夫定理, 此條目需要擴充, 2009年7月26日, 请協助改善这篇條目, 更進一步的信息可能會在討論頁或扩充请求中找到, 请在擴充條目後將此模板移除, 高斯, 馬可夫定理, 英語, gauss, markov, theorem, 在統計學中陳述的是在线性回归模型中, 如果线性模型满足高斯马尔可夫假定, 则回归系数的最佳线性无偏估计, blue, best, linear, unbiased, estimator, 就是普通最小二乘法估计, 这里最佳的意思是指相较于其他估计量有更小方差的估计量, 同时把. 此條目需要擴充 2009年7月26日 请協助改善这篇條目 更進一步的信息可能會在討論頁或扩充请求中找到 请在擴充條目後將此模板移除 高斯 馬可夫定理 英語 Gauss Markov Theorem 在統計學中陳述的是在线性回归模型中 如果线性模型满足高斯马尔可夫假定 则回归系数的最佳线性无偏估计 BLUE Best Linear unbiased estimator 就是普通最小二乘法估计 这里最佳的意思是指相较于其他估计量有更小方差的估计量 同时把对估计量的寻找限制在所有可能的线性无偏估计量中 值得注意的是这里不需要假定误差满足同分布或正态分布 线性模型指对于参数是线性的 因此线性模型并非看起来那么有约束性 通过适当的对y与x做变换 如logy与x 可以得到y与x的非线性关系 但并未跳出线性模型的范畴 目录 1 表述 1 1 简单 一元 线性回归模型 1 2 多元线性回归模型 2 证明 3 参见 4 外部連結表述 编辑简单 一元 线性回归模型 编辑 对于简单 一元 线性回归模型 y b 0 b 1 x e displaystyle y beta 0 beta 1 x varepsilon 其中b 0 displaystyle beta 0 和b 1 displaystyle beta 1 是非随机但不能观测到的参数 x i displaystyle x i 是非随机且可观测到的一般变量 e i displaystyle varepsilon i 是不可观测的随机变量 或称为随机误差或噪音 y i displaystyle y i 是可观测的随机变量 高斯 马尔可夫定理的假设条件是 在总体模型中 各变量关系为y b 0 b 1 x e displaystyle y beta 0 beta 1 x varepsilon 线性于参数 我们具有服从于上述模型的随机样本 样本容量为n 随机抽样 x的样本结果为非完全相同的数值 解释变量的样本有波动 对于给定的解释变量 误差的期望为零 换言之E e x 0 displaystyle rm E left varepsilon x right 0 零条件均值 对于给定的解释变量 误差具有相同的方差 换言之 V a r e x s 2 displaystyle rm Var left varepsilon x right sigma 2 同方差性 则对b 0 displaystyle beta 0 和b 1 displaystyle beta 1 的最佳线性无偏估计为 b 1 x i y i 1 n x i y i x i 2 1 n x i 2 Cov x y s x 2 r x y s x s y b 0 y b 1 x displaystyle hat beta 1 frac sum x i y i frac 1 n sum x i sum y i sum x i 2 frac 1 n sum x i 2 frac widehat text Cov left x y right hat sigma x 2 hat rho xy frac hat sigma x hat sigma y quad hat beta 0 overline y hat beta 1 overline x 多元线性回归模型 编辑 对于多元线性回归模型 y i j 0 p b j x i j e i displaystyle y i sum j 0 p beta j x ij varepsilon i x i 0 1 i 1 n displaystyle x i0 1 quad i 1 dots n 使用矩阵形式 线性回归模型可简化记为Y X b e displaystyle mathbf Y mathbf X boldsymbol beta boldsymbol varepsilon 其中采用了以下记号 Y y 1 y 2 y n T displaystyle mathbf Y y 1 y 2 dots y n T 观测值向量 Vector of Responses X x i j 1 x 11 x 12 x 1 p 1 x 21 x 22 x 2 p 1 x n 1 x n 2 x n p displaystyle mathbf X x ij begin bmatrix 1 amp x 11 amp x 12 amp cdots amp x 1p 1 amp x 21 amp x 22 amp cdots amp x 2p vdots amp vdots amp vdots amp ddots amp vdots 1 amp x n1 amp x n2 amp cdots amp x np end bmatrix 设计矩阵 Design Matrix b b 0 b 1 b p T displaystyle boldsymbol beta beta 0 beta 1 dots beta p T 参数向量 Vector of Parameters e e 1 e 2 e n T displaystyle boldsymbol varepsilon varepsilon 1 varepsilon 2 dots varepsilon n T 随机误差向量 Vectors of Error 高斯 马尔可夫定理的假设条件是 E e X 0 displaystyle rm E left boldsymbol varepsilon mid mathbf X right 0 X displaystyle forall mathbf X 零均值 V a r e X E e e T X s e 2 I n displaystyle rm Var left boldsymbol varepsilon mid mathbf X right rm E left boldsymbol varepsilon boldsymbol varepsilon T mid mathbf X right sigma varepsilon 2 mathbf I n 同方差且不相关 其中I n displaystyle mathbf I n 为n阶单位矩阵 Identity Matrix 则对b displaystyle boldsymbol beta 的最佳线性无偏估计为 b X T X 1 X T Y displaystyle hat boldsymbol beta mathbf X T mathbf X 1 mathbf X T mathbf Y 证明 编辑首先 注意的是这里数据是Y displaystyle mathbf Y 而非X displaystyle mathbf X 我们希望找到b displaystyle boldsymbol beta 对于Y displaystyle mathbf Y 的线性估计量 记作 b M N Y displaystyle hat boldsymbol beta mathbf M mathbf N mathbf Y 其中b displaystyle hat boldsymbol beta M displaystyle mathbf M N displaystyle mathbf N 和Y displaystyle mathbf Y 分别是 p 1 1 displaystyle p 1 times 1 p 1 1 displaystyle p 1 times 1 p 1 n displaystyle p 1 times n 和n 1 displaystyle n times 1 矩阵 根据零均值假设所得 E b X M N E Y X M N X b displaystyle rm E left hat boldsymbol beta mid mathbf X right mathbf M mathbf N rm E left mathbf Y mid mathbf X right mathbf M mathbf N mathbf X boldsymbol beta 其次 我们同时限制寻找的估计量为无偏的估计量 即要求E b b displaystyle rm E left hat boldsymbol beta right boldsymbol beta 因此有 M 0 displaystyle mathbf M mathbf 0 零矩阵 N X I p 1 displaystyle mathbf N mathbf X mathbf I p 1 参见 编辑方差分析 安斯库姆四重奏 横截面回归 曲线拟合 经验贝叶斯方法 邏輯迴歸 M估计 非线性回归 非参数回归 多元自适应回归样条 Lack of fit sum of squares 截断回归模型 删失回归模型 简单线性回归 分段线性回归外部連結 编辑Earliest Known Uses of Some of the Words of Mathematics G brief history and explanation of its name Proof of the Gauss Markov theorem for multiple linear regression 页面存档备份 存于互联网档案馆 makes use of matrix algebra A Proof of the Gauss Markov theorem using geometry 取自 https zh wikipedia org w index php title 高斯 马尔可夫定理 amp oldid 72994326, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。