fbpx
维基百科

迴歸分析

迴歸分析(英語:Regression Analysis)是一種統計學上分析數據的方法,目的在於了解兩個或多個變數間是否相關、相關方向與強度,並建立數學模型以便觀察特定變數來預測研究者感興趣的變數。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望。

簡單線性迴歸分析的例子

迴歸分析是建立被解釋變數(或稱應變數、依變數、反應變數)與解釋變數(或稱自變數、獨立變數)之間關係的模型。簡單線性回歸使用一個自變量複迴歸使用超過一個自變量()。

起源

回归的最早形式是最小二乘法,由1805年的勒让德(Legendre)[1],和1809年的高斯(Gauss)出版[2]。勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展[3],包括高斯-马尔可夫定理的一个版本。

「迴歸」一詞最早由法蘭西斯·高爾頓(Francis Galton)所使用[4][5]。他曾對親子間的身高做研究,發現父母的身高雖然會遺傳給子女,但子女的身高卻有逐漸「迴歸到中等(即人的平均值)」的現象。不過當時的迴歸和現在的迴歸在意義上已不盡相同。

在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,这种计算方法有时需要长达24小时才能得出结果[6]

迴歸分析原理

  • 目的在於找出一條最能夠代表所有觀測資料的函數曲线(迴歸估計式)。
  • 用此函數代表因變數和自變數之間的關係。

母數估計

回归模型

回归模型主要包括以下变量:

  • 未知参数,记为 ,可以代表一个标量或一个向量
  • 自变量 
  • 因变量 

回归模型将 和一个关于  的函数关联起来。

在不同的应用领域有各自不同的术语代替这里的“自变量”和“因变量”。

 

这个估计值通常写作: 

在进行回归分析时,函数 的形式必须预先指定。有时函数 的形式是在对  关系的已有知识上建立的,而不是在数据的基础之上。如果没有这种已有知识,那么就要选择一个灵活和便于回归的 的形式。

假设现在未知向量 的维数为k。为了进行回归分析,必须要先有关于 的信息:

  • 如果以 的形式给出了 个数据点,当 时,大多数传统的回归分析方法都不能进行,因为数据量不够导致回归模型的系统方程不能完全确定 
  • 如果恰好有 个数据点,并且函数 的形式是线性的,那么方程 能精确求解。这相当于解一个有 个未知量和 个方程的方程组。在 线性无关的情况下,这个方程组有唯一解。但如果 是非线性形式的,解可能有多个或不存在。
  • 实际中 的情况占大多数。这种情况下,有足够的信息用于估计一个与数据最接近的 值,这时当回归分析应用于这些数据时,可以看作是解一个关于 的超定方程。

在最后一种情况下,回归分析提供了一种完成以下任务的工具: ⒈找出一个未知量 的解使因变量 的预测值和实际值差别最小(又称最小二乘法)。

⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量 和未知量 之间的关系。

迴歸分析的種類

簡單線性回歸

簡單線性迴歸英语Simple linear regression(英語:simple linear regression

  • 應用時機
  1. 以單一變數預測
  2. 判斷兩變數之間相關的方向和程度

複迴歸(或多變量迴歸)

複回歸分析(英語:multiple regression analysis)是簡單線性迴歸的一種延伸應用,用以瞭解一個依變項與兩組以上自變項的函數關係。

對數線性迴歸

對數線性迴歸英语Log-linear model(英語:Log-linear model),是將解釋變項(實驗設計中的自變項)和反應變項(實驗設計中的依變項)都取對數值之後再進行線性迴歸,所以依據解釋變項的數量,可能是對數簡單線性迴歸,也可能是對數複迴歸。

非線性迴歸

对数几率回归

对数几率回归(英語:Logistic Regression

偏迴歸

偏迴歸英语Partial Regression(英語:Partial Regression

自迴歸

自迴歸滑動平均模型

差分自迴歸滑動平均模型

向量自迴歸模型

參閱

参考资料

  1. ^ A.M. Legendre. Nouvelles méthodes pour la détermination des orbites des comètes (页面存档备份,存于互联网档案馆), Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.
  2. ^ C.F. Gauss. Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum. (1809)
  3. ^ C.F. Gauss. Theoria combinationis observationum erroribus minimis obnoxiae (页面存档备份,存于互联网档案馆). (1821/1823)
  4. ^ Mogull, Robert G. Second-Semester Applied Statistics. Kendall/Hunt Publishing Company. 2004: 59. ISBN 0-7575-1181-3. 
  5. ^ Galton, Francis. Kinship and Correlation (reprinted 1989). Statistical Science (Institute of Mathematical Statistics). 1989, 4 (2): 80–86. JSTOR 2245330. doi:10.1214/ss/1177012581. 
  6. ^ Rodney Ramcharan. Regressions: Why Are Economists Obessessed with Them? (页面存档备份,存于互联网档案馆) March 2006. Accessed 2011-12-03.

外部連結

  1. 解讀迴歸分析的原理及結構

迴歸分析, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目需要擴充, 2018年11月8日, 请協助改善这篇條目, 更進一步的信息可能會在討論頁或扩充请求中找到, 请在擴充條目後將此模板移除, 此條目需要精通或熟悉相关主题的编者参与及协助编辑, 2018年11月8日, 請邀請適合的人士改善本条目, 更多的細節與詳情請參见討論頁, 此條目需要补充更多来源, 2018年11月8日, 请协助補充多方面可靠来源以改善这篇条目, 无法查证的内容可能會因為异议提出而移除, 致使用者, 请搜索一下条目. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目需要擴充 2018年11月8日 请協助改善这篇條目 更進一步的信息可能會在討論頁或扩充请求中找到 请在擴充條目後將此模板移除 此條目需要精通或熟悉相关主题的编者参与及协助编辑 2018年11月8日 請邀請適合的人士改善本条目 更多的細節與詳情請參见討論頁 此條目需要补充更多来源 2018年11月8日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而移除 致使用者 请搜索一下条目的标题 来源搜索 迴歸分析 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 迴歸分析 英語 Regression Analysis 是一種統計學上分析數據的方法 目的在於了解兩個或多個變數間是否相關 相關方向與強度 並建立數學模型以便觀察特定變數來預測研究者感興趣的變數 更具体的来说 回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量 一般来说 通过回归分析我们可以由给出的自变量估计因变量的条件期望 簡單線性迴歸分析的例子 迴歸分析是建立被解釋變數Y displaystyle Y 或稱應變數 依變數 反應變數 與解釋變數X displaystyle X 或稱自變數 獨立變數 之間關係的模型 簡單線性回歸使用一個自變量X displaystyle X 複迴歸使用超過一個自變量 X 1 X 2 X i displaystyle X 1 X 2 X i 目录 1 起源 2 迴歸分析原理 2 1 母數估計 3 回归模型 4 迴歸分析的種類 4 1 簡單線性回歸 4 2 複迴歸 或多變量迴歸 4 3 對數線性迴歸 4 4 非線性迴歸 4 5 对数几率回归 4 6 偏迴歸 4 7 自迴歸 4 7 1 自迴歸滑動平均模型 4 7 2 差分自迴歸滑動平均模型 4 7 3 向量自迴歸模型 5 參閱 6 参考资料 7 外部連結起源 编辑回归的最早形式是最小二乘法 由1805年的勒让德 Legendre 1 和1809年的高斯 Gauss 出版 2 勒让德和高斯都将该方法应用于从天文观测中确定关于太阳的物体的轨道 主要是彗星 但后来是新发现的小行星 的问题 高斯在1821年发表了最小二乘理论的进一步发展 3 包括高斯 马尔可夫定理的一个版本 迴歸 一詞最早由法蘭西斯 高爾頓 Francis Galton 所使用 4 5 他曾對親子間的身高做研究 發現父母的身高雖然會遺傳給子女 但子女的身高卻有逐漸 迴歸到中等 即人的平均值 的現象 不過當時的迴歸和現在的迴歸在意義上已不盡相同 在1950年代和60年代 经济学家使用机械电子桌面计算器来计算回归 在1970年之前 这种计算方法有时需要长达24小时才能得出结果 6 迴歸分析原理 编辑目的在於找出一條最能夠代表所有觀測資料的函數曲线 迴歸估計式 用此函數代表因變數和自變數之間的關係 母數估計 编辑 動差估計 Method of Moment MOM 最小二乘法 Ordinary Least Square Estimation OLSE 最大似然估计 Maximum Likelihood Estimation MLE 回归模型 编辑回归模型主要包括以下变量 未知参数 记为b displaystyle beta 可以代表一个标量或一个向量 自变量 X displaystyle mathbf X 因变量 Y displaystyle Y 回归模型将Y displaystyle Y 和一个关于X displaystyle mathbf X 和b displaystyle beta 的函数关联起来 在不同的应用领域有各自不同的术语代替这里的 自变量 和 因变量 Y f X b displaystyle Y approx f mathbf X boldsymbol beta 这个估计值通常写作 E X Y f X b displaystyle E X Y f mathbf X boldsymbol beta 在进行回归分析时 函数f displaystyle f 的形式必须预先指定 有时函数f displaystyle f 的形式是在对Y displaystyle Y 和X displaystyle mathbf X 关系的已有知识上建立的 而不是在数据的基础之上 如果没有这种已有知识 那么就要选择一个灵活和便于回归的f displaystyle f 的形式 假设现在未知向量b displaystyle beta 的维数为k 为了进行回归分析 必须要先有关于Y displaystyle Y 的信息 如果以 Y X displaystyle Y mathbf X 的形式给出了N displaystyle N 个数据点 当N lt k displaystyle N lt k 时 大多数传统的回归分析方法都不能进行 因为数据量不够导致回归模型的系统方程不能完全确定b displaystyle beta 如果恰好有N k displaystyle N k 个数据点 并且函数f displaystyle f 的形式是线性的 那么方程Y f X b displaystyle Y f mathbf X boldsymbol beta 能精确求解 这相当于解一个有N displaystyle N 个未知量和N displaystyle N 个方程的方程组 在X displaystyle mathbf X 线性无关的情况下 这个方程组有唯一解 但如果f displaystyle f 是非线性形式的 解可能有多个或不存在 实际中N gt k displaystyle N gt k 的情况占大多数 这种情况下 有足够的信息用于估计一个与数据最接近的b displaystyle beta 值 这时当回归分析应用于这些数据时 可以看作是解一个关于b displaystyle beta 的超定方程 在最后一种情况下 回归分析提供了一种完成以下任务的工具 找出一个未知量b displaystyle beta 的解使因变量Y displaystyle Y 的预测值和实际值差别最小 又称最小二乘法 在特定统计假设下 回归分析使用数据中的多余信息给出关于因变量Y displaystyle Y 和未知量b displaystyle beta 之间的关系 迴歸分析的種類 编辑簡單線性回歸 编辑 簡單線性迴歸 英语 Simple linear regression 英語 simple linear regression 應用時機以單一變數預測 判斷兩變數之間相關的方向和程度複迴歸 或多變量迴歸 编辑 複回歸分析 英語 multiple regression analysis 是簡單線性迴歸的一種延伸應用 用以瞭解一個依變項與兩組以上自變項的函數關係 對數線性迴歸 编辑 對數線性迴歸 英语 Log linear model 英語 Log linear model 是將解釋變項 實驗設計中的自變項 和反應變項 實驗設計中的依變項 都取對數值之後再進行線性迴歸 所以依據解釋變項的數量 可能是對數簡單線性迴歸 也可能是對數複迴歸 非線性迴歸 编辑 对数几率回归 编辑 主条目 对数几率回归 对数几率回归 英語 Logistic Regression 偏迴歸 编辑 偏迴歸 英语 Partial Regression 英語 Partial Regression 自迴歸 编辑 主条目 自迴歸模型 自迴歸滑動平均模型 编辑 主条目 ARMA模型 差分自迴歸滑動平均模型 编辑 主条目 ARIMA模型 向量自迴歸模型 编辑 主条目 向量自迴歸模型參閱 编辑 概率与统计主题 曲線擬合 估计理论 廣義線性模型 多元正态分布 皮尔逊积矩相关系数 信号处理 相關分析 多變量統計参考资料 编辑 A M Legendre Nouvelles methodes pour la determination des orbites des cometes 页面存档备份 存于互联网档案馆 Firmin Didot Paris 1805 Sur la Methode des moindres quarres appears as an appendix C F Gauss Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum 1809 C F Gauss Theoria combinationis observationum erroribus minimis obnoxiae 页面存档备份 存于互联网档案馆 1821 1823 Mogull Robert G Second Semester Applied Statistics Kendall Hunt Publishing Company 2004 59 ISBN 0 7575 1181 3 Galton Francis Kinship and Correlation reprinted 1989 Statistical Science Institute of Mathematical Statistics 1989 4 2 80 86 JSTOR 2245330 doi 10 1214 ss 1177012581 Rodney Ramcharan Regressions Why Are Economists Obessessed with Them 页面存档备份 存于互联网档案馆 March 2006 Accessed 2011 12 03 外部連結 编辑解讀迴歸分析的原理及結構 取自 https zh wikipedia org w index php title 迴歸分析 amp oldid 74497552, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。