fbpx
维基百科

線性回歸

统计学中,线性回归(英語:linear regression)是利用称为线性回归方程的最小平方函數对一个或多个自变量因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归multivariable linear regression)。[1]

在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。[2]最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况,线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。像所有形式的回归分析一样,线性回归也把焦点放在给定X值的y的条件概率分布,而不是X和y的联合概率分布(多元分析领域)。

线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。[3]这是因为线性依赖于其未知参数的模型比非线性依赖于其未知参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。

线性回归有很多实际用途。分为以下两大类:

  1. 如果目标是预测或者映射,线性回归可以用来对观测数据集的和X的值拟合出一个预测模型。当完成这样一个模型以后,对于一个新增的X值,在没有给定与它相配对的y的情况下,可以用这个拟合过的模型预测出一个y值。
  2. 给定一个变量y和一些变量,...,,这些变量有可能与y相关,线性回归分析可以用来量化y与Xj之间相关性的强度,评估出与y不相关的,并识别出哪些的子集包含了关于y的冗余信息。

线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在桥回归中最小化最小二乘损失函数的惩罚。相反,最小二乘逼近可以用来拟合那些非线性的模型。因此,尽管“最小二乘法”和“线性模型”是紧密相连的,但他们是不能划等号的。


簡介

 
帶有一個自變量的線性回歸

理論模型

給一個随機樣本 ,一個線性回歸模型假設回歸子 和回歸量 之間的關係是除了X的影響以外,還有其他的變數存在。我們加入一個誤差項 (也是一個随機變量)來捕獲除了 之外任何對 的影響。所以一個多變量線性回歸模型表示為以下的形式:

 

其他的模型可能被認定成非線性模型。一個線性回歸模型不需要是自變量的線性函數。線性在這裡表示 的條件均值在參數 裡是線性的。例如:模型   裡是線性的,但在 裡是非線性的,它是 的非線性函數。

數據和估計

區分随機變量和這些變量的觀測值是很重要的。通常來說,觀測值或數據(以小寫字母表記)包括了n個值  .

我們有 個參數 需要決定,為了估計這些參數,使用矩陣表記是很有用的。

 

其中Y是一個包括了觀測值 的列向量, 包括了未觀測的随機成份 以及回歸量的觀測值矩陣 

 

X通常包括一個常數項。

如果X列之間存在線性相關,那麽參數向量 就不能以最小二乘法估計除非 被限制,比如要求它的一些元素之和為0。

古典假設

  • 樣本是在母體之中随機抽取出來的。
  • 應變量Y在實直線上是連續的
  • 殘差項是獨立相同分佈的(iid),也就是說,殘差是独立随机的,且服從高斯分佈

這些假設意味著殘差項不依賴自變量的值,所以 和自變量X(预測變量)之間是相互獨立的。

在這些假設下,建立一個顯式線性回歸作為條件预期模型的簡單線性回歸,可以表示為:

 

最小二乘法分析

最小二乘法估計

回歸分析的最初目的是估計模型的參數以便達到對數據的最佳拟合。在決定一個最佳拟合的不同標準之中,最小二乘法是非常優越的。這種估計可以表示為:

 

迴歸推論

對於每一個 ,我們用 代表誤差項 的方差。一個無偏誤的估計是:

 

其中 是誤差平方和(殘差平方和)。估計值和實際值之間的關係是:

 

其中 服從卡方分佈,自由度是 

對普通方程的解可以冩為:

 

這表示估計項是因變量的線性組合。進一步地說,如果所觀察的誤差服從正態分佈。參數的估計值將服從聯合正態分佈。在當前的假設之下,估計的參數向量是精確分佈的。

 

其中 表示多變量正態分佈

參數估計值的標準差是:

 

參數  置信區間可以用以下式子來計算:

 

誤差項可以表示為:

 

單變量線性回歸

單變量線性回歸,又稱簡單線性回歸(simple linear regression, SLR),是最簡單但用途很廣的回歸模型。其回歸式為:

 

為了從一組樣本 (其中 )之中估計最合適(誤差最小)的  ,通常採用最小二乘法,其計算目標為最小化殘差平方和:

 

使用微分法求極值:將上式分别對  做一階偏微分,並令其等於0:

 

此二元一次線性方程組可用克萊姆法則求解,得解 

 
 
 
 

協方差矩陣是:

 

平均響應置信區間為:

 

預報響應置信區間為:

 

方差分析

方差分析(ANOVA)中,總平方和分解為兩個或更多部分。

總平方和SST (sum of squares for total) 是:

  ,其中:  

同等地:

 

回歸平方和SSReg (sum of squares for regression。也可寫做模型平方和,SSM,sum of squares for model) 是:

 

殘差平方和SSE (sum of squares for error) 是:

 

總平方和SST又可寫做SSReg和SSE的和:

 

回歸係數R2是:

 

其他方法

廣義最小二乘法

廣義最小二乘法可以用在當觀測誤差具有異方差或者自相關的情況下。

總體最小二乘法

總體最小二乘法用於當自變量有誤時。

廣義線性模式

廣義線性模式應用在當誤差分佈函數不是正態分佈時。比如指數分佈伽瑪分佈逆高斯分佈泊松分佈二項式分佈等。

穩健回歸

將平均絕對誤差最小化,不同於在線性回歸中是將均方誤差最小化。

線性回歸的應用

趨勢線

一條趨勢線代表著時間序列數據的長期走勢。它告訴我們一組特定數據(如GDP、石油價格和股票價格)是否在一段時期内增長或下降。雖然我們可以用肉眼觀察數據點在坐標系的位置大體畫出趨勢線,更恰當的方法是利用線性回歸計算出趨勢線的位置和斜率。

流行病学

有关吸烟死亡率发病率影响的早期证据来自采用了回归分析的观察性研究。为了在分析观测数据时减少伪相关,除最感兴趣的变量之外,通常研究人员还会在他们的回归模型里包括一些额外变量。例如,假设有一个回归模型,在这个回归模型中吸烟行为是我们最感兴趣的独立变量,其相关变量是经数年观察得到的吸烟者寿命。研究人员可能将社会经济地位当成一个额外的独立变量,已确保任何经观察所得的吸烟对寿命的影响不是由于教育或收入差异引起的。然而,我们不可能把所有可能混淆结果的变量都加入到实证分析中。例如,某种不存在的基因可能会增加人死亡的几率,还会让人的吸烟量增加。因此,比起采用观察数据的回归分析得出的结论,随机对照试验常能产生更令人信服的因果关系证据。当可控实验不可行时,回归分析的衍生,如工具变量回归,可尝试用来估计观测数据的因果关系。

金融

資本資產定價模型利用線性回歸以及Beta係數的概念分析和計算投資的系統風險。這是從聯繫投資回報和所有風險性資產回報的模型Beta係數直接得出的。

经济学

线性回归是经济学的主要实证工具。例如,它是用来预测消费支出,[4]固定投资支出,存货投资,一国出口产品的购买,[5]进口支出,[5]要求持有流动性资产,[6]劳动力需求、[7]劳动力供给。[7]

参考文献

引用

  1. ^ Rencher, Alvin C.; Christensen, William F., Chapter 10, Multivariate regression – Section 10.1, Introduction, Methods of Multivariate Analysis, Wiley Series in Probability and Statistics 709 3rd, John Wiley & Sons: 19, 2012 [2019-05-14], ISBN 9781118391679, (原始内容于2019-06-15) .
  2. ^ Hilary L. Seal. The historical development of the Gauss linear model. Biometrika. 1967, 54 (1/2): 1–24. JSTOR 2333849. doi:10.1093/biomet/54.1-2.1. 
  3. ^ Yan, Xin, Linear Regression Analysis: Theory and Computing, World Scientific: 1–2, 2009 [2019-05-14], ISBN 9789812834119, (原始内容于2019-06-08), Regression analysis ... is probably one of the oldest topics in mathematical statistics dating back to about two hundred years ago. The earliest form of the linear regression was the least squares method, which was published by Legendre in 1805, and by Gauss in 1809 ... Legendre and Gauss both applied the method to the problem of determining, from astronomical observations, the orbits of bodies about the sun. 
  4. ^ Deaton, Angus. Understanding Consumption. Oxford University Press. 1992. ISBN 978-0-19-828824-4. 
  5. ^ 5.0 5.1 Krugman, Paul R.; Obstfeld, M.; Melitz, Marc J. International Economics: Theory and Policy 9th global. Harlow: Pearson. 2012. ISBN 9780273754091. 
  6. ^ Laidler, David E. W. The Demand for Money: Theories, Evidence, and Problems 4th. New York: Harper Collins. 1993. ISBN 978-0065010985. 
  7. ^ 7.0 7.1 Ehrenberg; Smith. Modern Labor Economics 10th international. London: Addison-Wesley. 2008. ISBN 9780321538963. 

来源

书籍
  • Cohen, J., Cohen P., West, S.G., & Aiken, L.S. Applied multiple regression/correlation analysis for the behavioral sciences. Hillsdale, NJ: Lawrence Erlbaum Associates. 2003. 
  • Draper, N.R. and Smith, H. Applied Regression Analysis. Wiley Series in Probability and Statistics. 1998. 
  • Robert S. Pindyck and Daniel L. Rubinfeld. Chapter One. Econometric Models and Economic Forecasts. 1998. 
  • Charles Darwin. The Variation of Animals and Plants under Domestication. (1868) (Chapter XIII describes what was known about reversion in Galton's time. Darwin uses the term "reversion".)
刊物文章
  • Galton, Francis. Regression Towards Mediocrity in Hereditary Stature (PDF). Journal of the Anthropological Institute. 1886, 15: 246–263 [2008-12-30]. 

延伸阅读

  • Pedhazur, Elazar J. Multiple regression in behavioral research: Explanation and prediction 2nd. New York: Holt, Rinehart and Winston. 1982. ISBN 0-03-041760-0. 
  • Barlow, Jesse L. Chapter 9: Numerical aspects of Solving Linear Least Squares Problems. Rao, C.R. (编). Computational Statistics. Handbook of Statistics 9. North-Holland. 1993. ISBN 0-444-88096-8. 
  • Björck, Åke. Numerical methods for least squares problems. Philadelphia: SIAM. 1996. ISBN 0-89871-360-9. 
  • Goodall, Colin R. Chapter 13: Computation using the QR decomposition. Rao, C.R. (编). Computational Statistics. Handbook of Statistics 9. North-Holland. 1993. ISBN 0-444-88096-8. 
  • National Physical Laboratory. Chapter 1: Linear Equations and Matrices: Direct Methods. Modern Computing Methods. Notes on Applied Science 16 2nd. Her Majesty's Stationery Office. 1961. 

参见

外部連結

  • Least-Squares Regression (页面存档备份,存于互联网档案馆), PhET Interactive simulations, University of Colorado at Boulder

線性回歸, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目包含過多行話或專業術語, 可能需要簡化或提出進一步解釋, 2013年10月5日, 請在討論頁中發表對於本議題的看法, 並移除或解釋本條目中的行話, 此條目翻譯品質不佳, 2013年10月5日, 翻譯者可能不熟悉中文或原文語言, 也可能使用了機器翻譯, 請協助翻譯本條目或重新編寫, 并注意避免翻译腔的问题, 明顯拙劣的翻譯請改掛, href, template, html, class, redirect, title, templ. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目包含過多行話或專業術語 可能需要簡化或提出進一步解釋 2013年10月5日 請在討論頁中發表對於本議題的看法 並移除或解釋本條目中的行話 此條目翻譯品質不佳 2013年10月5日 翻譯者可能不熟悉中文或原文語言 也可能使用了機器翻譯 請協助翻譯本條目或重新編寫 并注意避免翻译腔的问题 明顯拙劣的翻譯請改掛 a href Template D html class mw redirect title Template D d a a href Wikipedia CSD html G13 class mw redirect title Wikipedia CSD G13 a 提交刪除 在统计学中 线性回归 英語 linear regression 是利用称为线性回归方程的最小平方函數对一个或多个自变量和因变量之间关系进行建模的一种回归分析 这种函数是一个或多个称为回归系数的模型参数的线性组合 只有一个自变量的情况称为简单回归 大于一个自变量情况的叫做多元回归 multivariable linear regression 1 在线性回归中 数据使用线性预测函数来建模 并且未知的模型参数也是通过数据来估计 这些模型被叫做线性模型 2 最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数 不太一般的情况 线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示 像所有形式的回归分析一样 线性回归也把焦点放在给定X值的y的条件概率分布 而不是X和y的联合概率分布 多元分析领域 线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型 3 这是因为线性依赖于其未知参数的模型比非线性依赖于其未知参数的模型更容易拟合 而且产生的估计的统计特性也更容易确定 线性回归有很多实际用途 分为以下两大类 如果目标是预测或者映射 线性回归可以用来对观测数据集的和X的值拟合出一个预测模型 当完成这样一个模型以后 对于一个新增的X值 在没有给定与它相配对的y的情况下 可以用这个拟合过的模型预测出一个y值 给定一个变量y和一些变量X 1 displaystyle X 1 X p displaystyle X p 这些变量有可能与y相关 线性回归分析可以用来量化y与Xj之间相关性的强度 评估出与y不相关的X j displaystyle X j 并识别出哪些X j displaystyle X j 的子集包含了关于y的冗余信息 线性回归模型经常用最小二乘逼近来拟合 但他们也可能用别的方法来拟合 比如用最小化 拟合缺陷 在一些其他规范里 比如最小绝对误差回归 或者在桥回归中最小化最小二乘损失函数的惩罚 相反 最小二乘逼近可以用来拟合那些非线性的模型 因此 尽管 最小二乘法 和 线性模型 是紧密相连的 但他们是不能划等号的 目录 1 簡介 1 1 理論模型 1 2 數據和估計 1 3 古典假設 2 最小二乘法分析 2 1 最小二乘法估計 2 2 迴歸推論 2 2 1 單變量線性回歸 2 3 方差分析 3 其他方法 3 1 廣義最小二乘法 3 2 總體最小二乘法 3 3 廣義線性模式 3 4 穩健回歸 4 線性回歸的應用 4 1 趨勢線 4 2 流行病学 4 3 金融 4 4 经济学 5 参考文献 5 1 引用 5 2 来源 6 延伸阅读 7 参见 8 外部連結簡介 编辑 帶有一個自變量的線性回歸 理論模型 编辑 給一個随機樣本 Y i X i 1 X i p i 1 n displaystyle Y i X i1 ldots X ip i 1 ldots n 一個線性回歸模型假設回歸子Y i displaystyle Y i 和回歸量X i 1 X i p displaystyle X i1 ldots X ip 之間的關係是除了X的影響以外 還有其他的變數存在 我們加入一個誤差項e i displaystyle varepsilon i 也是一個随機變量 來捕獲除了X i 1 X i p displaystyle X i1 ldots X ip 之外任何對Y i displaystyle Y i 的影響 所以一個多變量線性回歸模型表示為以下的形式 Y i b 0 b 1 X i 1 b 2 X i 2 b p X i p e i i 1 n displaystyle Y i beta 0 beta 1 X i1 beta 2 X i2 ldots beta p X ip varepsilon i qquad i 1 ldots n 其他的模型可能被認定成非線性模型 一個線性回歸模型不需要是自變量的線性函數 線性在這裡表示Y i displaystyle Y i 的條件均值在參數b displaystyle beta 裡是線性的 例如 模型Y i b 1 X i b 2 X i 2 e i displaystyle Y i beta 1 X i beta 2 X i 2 varepsilon i 在b 1 displaystyle beta 1 和b 2 displaystyle beta 2 裡是線性的 但在X i 2 displaystyle X i 2 裡是非線性的 它是X i displaystyle X i 的非線性函數 數據和估計 编辑 區分随機變量和這些變量的觀測值是很重要的 通常來說 觀測值或數據 以小寫字母表記 包括了n個值 y i x i 1 x i p i 1 n displaystyle y i x i1 ldots x ip i 1 ldots n 我們有p 1 displaystyle p 1 個參數b 0 b p displaystyle beta 0 ldots beta p 需要決定 為了估計這些參數 使用矩陣表記是很有用的 Y X b e displaystyle Y X beta varepsilon 其中Y是一個包括了觀測值Y 1 Y n displaystyle Y 1 ldots Y n 的列向量 e displaystyle varepsilon 包括了未觀測的随機成份e 1 e n displaystyle varepsilon 1 ldots varepsilon n 以及回歸量的觀測值矩陣X displaystyle X X 1 x 11 x 1 p 1 x 21 x 2 p 1 x n 1 x n p displaystyle X begin pmatrix 1 amp x 11 amp cdots amp x 1p 1 amp x 21 amp cdots amp x 2p vdots amp vdots amp ddots amp vdots 1 amp x n1 amp cdots amp x np end pmatrix X通常包括一個常數項 如果X列之間存在線性相關 那麽參數向量b displaystyle beta 就不能以最小二乘法估計除非b displaystyle beta 被限制 比如要求它的一些元素之和為0 古典假設 编辑 樣本是在母體之中随機抽取出來的 應變量Y在實直線上是連續的 殘差項是獨立且相同分佈的 iid 也就是說 殘差是独立随机的 且服從高斯分佈 這些假設意味著殘差項不依賴自變量的值 所以e i displaystyle varepsilon i 和自變量X 预測變量 之間是相互獨立的 在這些假設下 建立一個顯式線性回歸作為條件预期模型的簡單線性回歸 可以表示為 E Y i X i x i a b x i displaystyle mbox E Y i mid X i x i alpha beta x i 最小二乘法分析 编辑主条目 最小二乘法 最小二乘法估計 编辑 回歸分析的最初目的是估計模型的參數以便達到對數據的最佳拟合 在決定一個最佳拟合的不同標準之中 最小二乘法是非常優越的 這種估計可以表示為 b X T X 1 X T y displaystyle hat beta X T X 1 X T y 迴歸推論 编辑 對於每一個i 1 n displaystyle i 1 ldots n 我們用s 2 displaystyle sigma 2 代表誤差項e displaystyle varepsilon 的方差 一個無偏誤的估計是 s 2 S n p displaystyle hat sigma 2 frac S n p 其中S i 1 n e i 2 displaystyle S sum i 1 n hat varepsilon i 2 是誤差平方和 殘差平方和 估計值和實際值之間的關係是 s 2 n p s 2 x n p 2 displaystyle hat sigma 2 cdot frac n p sigma 2 sim chi n p 2 其中x n p 2 displaystyle chi n p 2 服從卡方分佈 自由度是n p displaystyle n p 對普通方程的解可以冩為 b X T X 1 X T y displaystyle hat boldsymbol beta mathbf X T X 1 X T y 這表示估計項是因變量的線性組合 進一步地說 如果所觀察的誤差服從正態分佈 參數的估計值將服從聯合正態分佈 在當前的假設之下 估計的參數向量是精確分佈的 b N b s 2 X T X 1 displaystyle hat beta sim N beta sigma 2 X T X 1 其中N displaystyle N cdot 表示多變量正態分佈 參數估計值的標準差是 s j S n p X T X 1 j j displaystyle hat sigma j sqrt frac S n p left mathbf X T X 1 right jj 參數b j displaystyle beta j 的100 1 a displaystyle 100 1 alpha 置信區間可以用以下式子來計算 b j t a 2 n p s j displaystyle hat beta j pm t frac alpha 2 n p hat sigma j 誤差項可以表示為 r y X b y X X T X 1 X T y displaystyle mathbf hat r y X hat boldsymbol beta y X X T X 1 X T y 單變量線性回歸 编辑 單變量線性回歸 又稱簡單線性回歸 simple linear regression SLR 是最簡單但用途很廣的回歸模型 其回歸式為 Y a b X e displaystyle Y alpha beta X varepsilon 為了從一組樣本 y i x i displaystyle y i x i 其中i 1 2 n displaystyle i 1 2 ldots n 之中估計最合適 誤差最小 的a displaystyle alpha 和b displaystyle beta 通常採用最小二乘法 其計算目標為最小化殘差平方和 i 1 n e i 2 i 1 n y i a b x i 2 displaystyle sum i 1 n varepsilon i 2 sum i 1 n y i alpha beta x i 2 使用微分法求極值 將上式分别對a displaystyle alpha 和b displaystyle beta 做一階偏微分 並令其等於0 n a i 1 n x i b i 1 n y i i 1 n x i a i 1 n x i 2 b i 1 n x i y i displaystyle left begin array lcl n alpha sum limits i 1 n x i beta sum limits i 1 n y i sum limits i 1 n x i alpha sum limits i 1 n x i 2 beta sum limits i 1 n x i y i end array right 此二元一次線性方程組可用克萊姆法則求解 得解a b displaystyle hat alpha hat beta b n i 1 n x i y i i 1 n x i i 1 n y i n i 1 n x i 2 i 1 n x i 2 i 1 n x i x y i y i 1 n x i x 2 displaystyle hat beta frac n sum limits i 1 n x i y i sum limits i 1 n x i sum limits i 1 n y i n sum limits i 1 n x i 2 left sum limits i 1 n x i right 2 frac sum limits i 1 n x i bar x y i bar y sum limits i 1 n x i bar x 2 a i 1 n x i 2 i 1 n y i i 1 n x i i 1 n x i y i n i 1 n x i 2 i 1 n x i 2 y x b displaystyle hat alpha frac sum limits i 1 n x i 2 sum limits i 1 n y i sum limits i 1 n x i sum limits i 1 n x i y i n sum limits i 1 n x i 2 left sum limits i 1 n x i right 2 bar y bar x hat beta S i 1 n y i y i 2 i 1 n y i 2 n i 1 n x i y i 2 i 1 n y i 2 i 1 n x i 2 2 i 1 n x i i 1 n y i i 1 n x i y i n i 1 n x i 2 i 1 n x i 2 displaystyle S sum limits i 1 n y i hat y i 2 sum limits i 1 n y i 2 frac n sum limits i 1 n x i y i 2 sum limits i 1 n y i 2 sum limits i 1 n x i 2 2 sum limits i 1 n x i sum limits i 1 n y i sum limits i 1 n x i y i n sum limits i 1 n x i 2 left sum limits i 1 n x i right 2 s 2 S n 2 displaystyle hat sigma 2 frac S n 2 協方差矩陣是 1 n i 1 n x i 2 i 1 n x i 2 x i 2 x i x i n displaystyle frac 1 n sum i 1 n x i 2 left sum i 1 n x i right 2 begin pmatrix sum x i 2 amp sum x i sum x i amp n end pmatrix 平均響應置信區間為 y d a b x d t a 2 n 2 s 1 n x d x 2 x i x 2 displaystyle y d alpha hat beta x d pm t frac alpha 2 n 2 hat sigma sqrt frac 1 n frac x d bar x 2 sum x i bar x 2 預報響應置信區間為 y d a b x d t a 2 n 2 s 1 1 n x d x 2 x i x 2 displaystyle y d alpha hat beta x d pm t frac alpha 2 n 2 hat sigma sqrt 1 frac 1 n frac x d bar x 2 sum x i bar x 2 方差分析 编辑 在方差分析 ANOVA 中 總平方和分解為兩個或更多部分 總平方和SST sum of squares for total 是 SST i 1 n y i y 2 displaystyle text SST sum i 1 n y i bar y 2 其中 y 1 n i y i displaystyle bar y frac 1 n sum i y i 同等地 SST i 1 n y i 2 1 n i y i 2 displaystyle text SST sum i 1 n y i 2 frac 1 n left sum i y i right 2 回歸平方和SSReg sum of squares for regression 也可寫做模型平方和 SSM sum of squares for model 是 SSReg y i y 2 b T X T y 1 n y T u u T y displaystyle text SSReg sum left hat y i bar y right 2 hat boldsymbol beta T mathbf X T mathbf y frac 1 n left mathbf y T uu T y right 殘差平方和SSE sum of squares for error 是 SSE i y i y i 2 y T y b T X T y displaystyle text SSE sum i left y i hat y i right 2 mathbf y T y hat boldsymbol beta T X T y 總平方和SST又可寫做SSReg和SSE的和 SST i y i y 2 y T y 1 n y T u u T y SSReg SSE displaystyle text SST sum i left y i bar y right 2 mathbf y T y frac 1 n left mathbf y T uu T y right text SSReg text SSE 回歸係數R2是 R 2 SSReg SST 1 SSE SST displaystyle R 2 frac text SSReg text SST 1 frac text SSE text SST 其他方法 编辑廣義最小二乘法 编辑 廣義最小二乘法可以用在當觀測誤差具有異方差或者自相關的情況下 總體最小二乘法 编辑 總體最小二乘法用於當自變量有誤時 廣義線性模式 编辑 廣義線性模式應用在當誤差分佈函數不是正態分佈時 比如指數分佈 伽瑪分佈 逆高斯分佈 泊松分佈 二項式分佈等 穩健回歸 编辑 將平均絕對誤差最小化 不同於在線性回歸中是將均方誤差最小化 線性回歸的應用 编辑趨勢線 编辑 一條趨勢線代表著時間序列數據的長期走勢 它告訴我們一組特定數據 如GDP 石油價格和股票價格 是否在一段時期内增長或下降 雖然我們可以用肉眼觀察數據點在坐標系的位置大體畫出趨勢線 更恰當的方法是利用線性回歸計算出趨勢線的位置和斜率 流行病学 编辑 有关吸烟对死亡率和发病率影响的早期证据来自采用了回归分析的观察性研究 为了在分析观测数据时减少伪相关 除最感兴趣的变量之外 通常研究人员还会在他们的回归模型里包括一些额外变量 例如 假设有一个回归模型 在这个回归模型中吸烟行为是我们最感兴趣的独立变量 其相关变量是经数年观察得到的吸烟者寿命 研究人员可能将社会经济地位当成一个额外的独立变量 已确保任何经观察所得的吸烟对寿命的影响不是由于教育或收入差异引起的 然而 我们不可能把所有可能混淆结果的变量都加入到实证分析中 例如 某种不存在的基因可能会增加人死亡的几率 还会让人的吸烟量增加 因此 比起采用观察数据的回归分析得出的结论 随机对照试验常能产生更令人信服的因果关系证据 当可控实验不可行时 回归分析的衍生 如工具变量回归 可尝试用来估计观测数据的因果关系 金融 编辑 資本資產定價模型利用線性回歸以及Beta係數的概念分析和計算投資的系統風險 這是從聯繫投資回報和所有風險性資產回報的模型Beta係數直接得出的 经济学 编辑 线性回归是经济学的主要实证工具 例如 它是用来预测消费支出 4 固定投资支出 存货投资 一国出口产品的购买 5 进口支出 5 要求持有流动性资产 6 劳动力需求 7 劳动力供给 7 参考文献 编辑引用 编辑 Rencher Alvin C Christensen William F Chapter 10 Multivariate regression Section 10 1 Introduction Methods of Multivariate Analysis Wiley Series in Probability and Statistics 709 3rd John Wiley amp Sons 19 2012 2019 05 14 ISBN 9781118391679 原始内容存档于2019 06 15 Hilary L Seal The historical development of the Gauss linear model Biometrika 1967 54 1 2 1 24 JSTOR 2333849 doi 10 1093 biomet 54 1 2 1 Yan Xin Linear Regression Analysis Theory and Computing World Scientific 1 2 2009 2019 05 14 ISBN 9789812834119 原始内容存档于2019 06 08 Regression analysis is probably one of the oldest topics in mathematical statistics dating back to about two hundred years ago The earliest form of the linear regression was the least squares method which was published by Legendre in 1805 and by Gauss in 1809 Legendre and Gauss both applied the method to the problem of determining from astronomical observations the orbits of bodies about the sun Deaton Angus Understanding Consumption Oxford University Press 1992 ISBN 978 0 19 828824 4 5 0 5 1 Krugman Paul R Obstfeld M Melitz Marc J International Economics Theory and Policy 9th global Harlow Pearson 2012 ISBN 9780273754091 Laidler David E W The Demand for Money Theories Evidence and Problems 4th New York Harper Collins 1993 ISBN 978 0065010985 7 0 7 1 Ehrenberg Smith Modern Labor Economics 10th international London Addison Wesley 2008 ISBN 9780321538963 来源 编辑 书籍Cohen J Cohen P West S G amp Aiken L S Applied multiple regression correlation analysis for the behavioral sciences Hillsdale NJ Lawrence Erlbaum Associates 2003 Draper N R and Smith H Applied Regression Analysis Wiley Series in Probability and Statistics 1998 Robert S Pindyck and Daniel L Rubinfeld Chapter One Econometric Models and Economic Forecasts 1998 Charles Darwin The Variation of Animals and Plants under Domestication 1868 Chapter XIII describes what was known about reversion in Galton s time Darwin uses the term reversion 刊物文章Galton Francis Regression Towards Mediocrity in Hereditary Stature PDF Journal of the Anthropological Institute 1886 15 246 263 2008 12 30 延伸阅读 编辑Pedhazur Elazar J Multiple regression in behavioral research Explanation and prediction 2nd New York Holt Rinehart and Winston 1982 ISBN 0 03 041760 0 Barlow Jesse L Chapter 9 Numerical aspects of Solving Linear Least Squares Problems Rao C R 编 Computational Statistics Handbook of Statistics 9 North Holland 1993 ISBN 0 444 88096 8 Bjorck Ake Numerical methods for least squares problems Philadelphia SIAM 1996 ISBN 0 89871 360 9 Goodall Colin R Chapter 13 Computation using the QR decomposition Rao C R 编 Computational Statistics Handbook of Statistics 9 North Holland 1993 ISBN 0 444 88096 8 National Physical Laboratory Chapter 1 Linear Equations and Matrices Direct Methods Modern Computing Methods Notes on Applied Science 16 2nd Her Majesty s Stationery Office 1961 参见 编辑方差分析 安斯库姆四重奏 横截面回归 曲线拟合 经验贝叶斯方法 逻辑斯蒂回归 M估计 非线性回归 非参数回归 多元自适应回归样条 Lack of fit sum of squares 截断回归模型 删失回归模型 简单线性回归 分段线性回归外部連結 编辑维基共享资源中相关的多媒体资源 線性回歸Least Squares Regression 页面存档备份 存于互联网档案馆 PhET Interactive simulations University of Colorado at Boulder 取自 https zh wikipedia org w index php title 線性回歸 amp oldid 73273507, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。