fbpx
维基百科

司徒頓t檢定

司徒頓t 檢定(英語:Student's t-test)是指虛無假說成立時的任一檢定統計有司徒頓t分布統計假說檢定,屬於參數統計。學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本期望值是否為某一實數,或是二(两)群來自常態分配母體的獨立樣本期望值的差是否為某一實數。舉個簡單的例子,在某個學校中我們可以從某個年級中隨機抽樣一群男生,以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值。

由來

司徒頓t檢定是威廉·戈塞為了觀測釀酒品質於1908年所提出的,「司徒頓 (student)」則是他的筆名[1][2][3][4] 基於克勞德·健力士(Claude Guinness)聘用從牛津大學劍橋大學出來的最好的畢業生,[2]以將生物化學及統計學應用到健力士工業流程的創新政策,戈塞受雇於都柏林的健力士釀酒廠擔任統計學家。戈塞提出了t检验以降低啤酒重量监控的成本。戈塞於1908年在《Biometrika英语Biometrika》期刊上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名,統計學論文內容也跟釀酒無關。實際上,其他统计学家是知道戈塞真實身份的。

應用

常見的應用有:

  • 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線。
  • 獨立樣本t檢定(双样本):其零假设为两个正态分布的总体的均值之差為某實數,例如檢定二群人之平均身高是否相等。若两母體的變異數是相等的情况下(同質變異數),自由度為兩樣本數相加再減二;若為異質變異數(母體變異數不相等),自由度則為Welch自由度,此情況下有时被称为Welch检验。
  • 配对樣本t檢定(成對樣本t檢定):檢定自同一母體抽出的成對樣本間差异是否为零。例如,檢测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸將縮小。
  • 检验一迴歸模型的偏迴歸係數是否显著不为零,即檢定解釋變數X是否存在對被解釋變數Y的解釋能力,其檢定統計量稱之為t-比例(t-ratio)。

前提假設

大多數的t檢定之統計量具有t = Z/s的形式,其中Zs是已知資料的函數。Z通常被設計成對於對立假說有關的形式,而s是一個比例母數使t服從於t分佈。以單樣本t檢驗為例, ,其中 為樣本平均數, 為樣本數, 為总体標準差。至於s在單樣本t檢驗中為 ,其中 為樣本的標準差。在符合零假說的條件下,t檢定有以下前提:

  • Z 服從標準常態分佈
  • (n - 1)s2 服從自由度(n - 1)的卡方分佈
  • Zs互相獨立

計算

單樣本t檢驗

檢驗虛無假說為一群來自常態分配獨立樣本xi之母體期望值μμ0可利用以下統計量

 

其中  為樣本平均數, 為樣本標準差n為樣本數。該統計量t在虛無假說:μ = μ0為真的條件下服從自由度為n − 1的t分佈

配對樣本t檢驗

配對樣本t檢驗可視為單樣本t檢驗的擴展,不過檢驗的對象由一群來自常態分配獨立樣本更改為兩配對樣本之觀測值之差。

若兩配對樣本x1ix2i之差為di = x1ix2i獨立且來自常態分配,則di之母體期望值μ是否為μ0可利用以下統計量

 

其中  為配對樣本差值之平均數, 為配對樣本差值之標準差n為配對樣本數。該統計量t在虛無假說:μ = μ0為真的條件下服從自由度為n − 1的t分布

獨立雙樣本t檢驗

同質變異數假設 (Homoscedasticity)、樣本數相等

若兩獨立樣本x1ix2i具有相同之樣本數n,且來自兩個母體變異數相同(同質變異數假設)的常態分配,則兩母體之期望值差μ1 - μ2是否為μ0可利用以下統計量

 

其中   為兩樣本各自的平均數, 為樣本之共同方差。該統計量t在虛無假說:μ1 - μ2 = μ0為真的條件下服從自由度為2n − 2的t分佈

同質變異數假設 (Homoscedasticity)、樣本數不相等

若兩獨立樣本x1ix2j具有不相同之樣本數n1n2,且來自兩個母體變異數相同(同質變異數假設)的常態分配,則兩母體之期望值之差μ1 - μ2是否為μ0可利用以下統計量

 

其中 ,其中   為兩樣本各自的平均數, 為兩樣本共同之方差。該統計量t在虛無假說:μ1 - μ2 = μ0為真的條件下服從自由度為n1 + n2 − 2的t分佈

異質變異數假設 (Heteroscedasticity)

若兩獨立樣本x1ix2j具有相同或不相同之樣本數n1n2,且兩者母體變異數不相等(異質變異數假設)的常態分配,則兩母體之期望值之差μ1 - μ2是否為μ0可利用以下統計量

 

其中 ,其中   為兩樣本各自的平均數,  分別為兩樣本之方差。該統計量t在虛無假說:μ1 - μ2 = μ0為真的條件下服從自由度為

 

t分布。這種方法又常稱為Welch檢驗。

其它相關檢驗

偏迴歸係數是否為零之檢定

以簡單線性迴歸為例

模型假設:

 

其中xii = 1, ..., n為已知,αβ為未知係數,εi殘差獨立且服從期望值0且方差σ2未知的常態分佈,yii = 1, ..., n為觀測值。我們可以檢驗迴歸係數β是否相等於特定的β0,通常使β0 = 0以檢定xiyi是否存在解釋能力,在此例(簡單線性迴歸模型)即為檢定迴歸式之斜率是否為零。

  最小平方法之估計值,  為最小平方法估計值之標準誤差,則

 

在虛無假說為β = β0的情況下服從自由度為n − 2之t分布,此檢定統計量被稱作「t比率 (t-ratio)」,其中

 

由於  為殘差(即估計誤差),而   為殘差之離均平方和,我們可改寫t

 

另请参阅:F检验

電腦軟體

大多數的試算表軟體及統計軟體,諸如QtiPlotOpenOffice.org CalcLibreOffice CalcMicrosoft ExcelSASSPSSStata、DAP、gretlRPython ([1](页面存档备份,存于互联网档案馆))、PSPPMinitab等,都可以進行t檢驗運算。

编程语言/软件程序 函数 注释
Microsoft Excel 2010 之前的版本 TTEST(array1, array2, tails, type) 参见
Microsoft Excel 2010 及更高版本 T.TEST(array1, array2, tails, type) 参见 [3](页面存档备份,存于互联网档案馆
LibreOffice TTEST(Data1; Data2; Mode; Type) 参见 [4](页面存档备份,存于互联网档案馆
Google Sheets TTEST(range1, range2, tails, type) 参见 [5](页面存档备份,存于互联网档案馆
Python scipy.stats.ttest_ind(a, b, axis=0, equal_var=True) 参见 [6](页面存档备份,存于互联网档案馆
Matlab ttest(data1, data2) 参见 [7](页面存档备份,存于互联网档案馆
Mathematica TTest[{data1,data2}] 参见 [8](页面存档备份,存于互联网档案馆
R t.test(data1, data2)
SAS PROC TTEST 参见
Java tTest(sample1, sample2) 参见 [10](页面存档备份,存于互联网档案馆
Julia EqualVarianceTTest(sample1, sample2) 参见
Stata ttest data1 == data2 See [12](页面存档备份,存于互联网档案馆

參見

參考文獻

  1. ^ Richard Mankiewicz, The Story of Mathematics (Princeton University Press), p.158.
  2. ^ 2.0 2.1 約翰·J·奧康納; 埃德蒙·F·羅伯遜英语Edmund F. Robertson, Gosset, MacTutor数学史档案 (英语) 
  3. ^ Fisher Box, Joan. Guinness, Gosset, Fisher, and Small Samples. Statistical Science. 1987, 2 (1): 45–52. JSTOR 2245613. doi:10.1214/ss/1177013437. 
  4. ^ (PDF). [2013-08-10]. (原始内容 (PDF)存档于2017-05-16). 

司徒頓t檢定, 司徒頓t, 檢定, 英語, student, test, 是指虛無假說成立時的任一檢定統計有司徒頓t分布的統計假說檢定, 屬於參數統計, 學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本之期望值是否為某一實數, 或是二, 群來自常態分配母體的獨立樣本之期望值的差是否為某一實數, 舉個簡單的例子, 在某個學校中我們可以從某個年級中隨機抽樣一群男生, 以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值, 目录, 由來, 應用, 前提假設, 計算, 單樣本t檢驗, 配對樣本t檢驗, 獨立雙. 司徒頓t 檢定 英語 Student s t test 是指虛無假說成立時的任一檢定統計有司徒頓t分布的統計假說檢定 屬於參數統計 學生t檢驗常作為檢驗一群來自常態分配母體的獨立樣本之期望值是否為某一實數 或是二 两 群來自常態分配母體的獨立樣本之期望值的差是否為某一實數 舉個簡單的例子 在某個學校中我們可以從某個年級中隨機抽樣一群男生 以檢驗該年級男生與全校男生之身高差異程度是否如我們所假設的某個值 目录 1 由來 2 應用 3 前提假設 4 計算 4 1 單樣本t檢驗 4 2 配對樣本t檢驗 4 3 獨立雙樣本t檢驗 4 3 1 同質變異數假設 Homoscedasticity 樣本數相等 4 3 2 同質變異數假設 Homoscedasticity 樣本數不相等 4 3 3 異質變異數假設 Heteroscedasticity 4 4 其它相關檢驗 4 4 1 偏迴歸係數是否為零之檢定 4 4 1 1 以簡單線性迴歸為例 5 電腦軟體 6 參見 7 參考文獻由來 编辑司徒頓t檢定是威廉 戈塞為了觀測釀酒品質於1908年所提出的 司徒頓 student 則是他的筆名 1 2 3 4 基於克勞德 健力士 Claude Guinness 聘用從牛津大學和劍橋大學出來的最好的畢業生 2 以將生物化學及統計學應用到健力士工業流程的創新政策 戈塞受雇於都柏林的健力士釀酒廠擔任統計學家 戈塞提出了t检验以降低啤酒重量监控的成本 戈塞於1908年在 Biometrika 英语 Biometrika 期刊上公布t檢驗 但因其老闆認為其為商業機密而被迫使用筆名 統計學論文內容也跟釀酒無關 實際上 其他统计学家是知道戈塞真實身份的 應用 编辑常見的應用有 单样本检验 检验一个正态分布的总体的均值是否在满足零假设的值之内 例如檢驗一群軍校男生的身高的平均是否符合全國標準的170公分界線 獨立樣本t檢定 双样本 其零假设为两个正态分布的总体的均值之差為某實數 例如檢定二群人之平均身高是否相等 若两母體的變異數是相等的情况下 同質變異數 自由度為兩樣本數相加再減二 若為異質變異數 母體變異數不相等 自由度則為Welch自由度 此情況下有时被称为Welch检验 配对樣本t檢定 成對樣本t檢定 檢定自同一母體抽出的成對樣本間差异是否为零 例如 檢测一位病人接受治疗前和治疗后的肿瘤尺寸大小 若治疗是有效的 我们可以推定多数病人接受治疗后 肿瘤尺寸將縮小 检验一迴歸模型的偏迴歸係數是否显著不为零 即檢定解釋變數X是否存在對被解釋變數Y的解釋能力 其檢定統計量稱之為t 比例 t ratio 前提假設 编辑大多數的t檢定之統計量具有t Z s的形式 其中Z與s是已知資料的函數 Z通常被設計成對於對立假說有關的形式 而s是一個比例母數使t服從於t分佈 以單樣本t檢驗為例 Z X s n displaystyle Z bar X sigma sqrt n 其中X displaystyle bar X 為樣本平均數 n displaystyle n 為樣本數 s displaystyle sigma 為总体標準差 至於s在單樣本t檢驗中為s s displaystyle hat sigma sigma 其中s displaystyle hat sigma 為樣本的標準差 在符合零假說的條件下 t檢定有以下前提 Z 服從標準常態分佈 n 1 s2 服從自由度 n 1 的卡方分佈 Z與s互相獨立計算 编辑單樣本t檢驗 编辑 檢驗虛無假說為一群來自常態分配獨立樣本xi之母體期望值m為m0可利用以下統計量 t x m 0 s n displaystyle t frac overline x mu 0 s sqrt n 其中i 1 n displaystyle i 1 ldots n x i 1 n x i n displaystyle overline x frac sum i 1 n x i n 為樣本平均數 s i 1 n x i x 2 n 1 displaystyle s sqrt frac sum i 1 n x i overline x 2 n 1 為樣本標準差 n為樣本數 該統計量t在虛無假說 m m0為真的條件下服從自由度為n 1的t分佈 配對樣本t檢驗 编辑 配對樣本t檢驗可視為單樣本t檢驗的擴展 不過檢驗的對象由一群來自常態分配獨立樣本更改為兩配對樣本之觀測值之差 若兩配對樣本x1i與x2i之差為di x1i x2i獨立且來自常態分配 則di之母體期望值m是否為m0可利用以下統計量 t d m 0 s d n displaystyle t frac overline d mu 0 s d sqrt n 其中i 1 n displaystyle i 1 ldots n d i 1 n d i n displaystyle overline d frac sum i 1 n d i n 為配對樣本差值之平均數 s d i 1 n d i d 2 n 1 displaystyle s d sqrt frac sum i 1 n d i overline d 2 n 1 為配對樣本差值之標準差 n為配對樣本數 該統計量t在虛無假說 m m0為真的條件下服從自由度為n 1的t分布 獨立雙樣本t檢驗 编辑 同質變異數假設 Homoscedasticity 樣本數相等 编辑 若兩獨立樣本x1i與x2i具有相同之樣本數n 且來自兩個母體變異數相同 同質變異數假設 的常態分配 則兩母體之期望值差m1 m2是否為m0可利用以下統計量 t x 1 x 2 m 0 2 s p 2 n displaystyle t frac overline x 1 overline x 2 mu 0 sqrt 2s p 2 n 其中i 1 n displaystyle i 1 ldots n x 1 i 1 n x 1 i n displaystyle overline x 1 sum i 1 n x 1i n 及x 2 i 1 n x 2 i n displaystyle overline x 2 sum i 1 n x 2i n 為兩樣本各自的平均數 s p 2 i 1 n x 1 i x 1 2 i 1 n x 2 i x 2 2 2 n 2 displaystyle s p 2 sum i 1 n x 1i overline x 1 2 sum i 1 n x 2i overline x 2 2 2n 2 為樣本之共同方差 該統計量t在虛無假說 m1 m2 m0為真的條件下服從自由度為2n 2的t分佈 同質變異數假設 Homoscedasticity 樣本數不相等 编辑 若兩獨立樣本x1i與x2j具有不相同之樣本數n1與n2 且來自兩個母體變異數相同 同質變異數假設 的常態分配 則兩母體之期望值之差m1 m2是否為m0可利用以下統計量 t x 1 x 2 m 0 s p 2 n 1 s p 2 n 2 displaystyle t frac overline x 1 overline x 2 mu 0 sqrt s p 2 n 1 s p 2 n 2 其中i 1 n 1 displaystyle i 1 ldots n 1 其中j 1 n 2 displaystyle j 1 ldots n 2 x 1 i 1 n x 1 i n displaystyle overline x 1 sum i 1 n x 1i n 及x 2 i 1 n x 2 i n displaystyle overline x 2 sum i 1 n x 2i n 為兩樣本各自的平均數 s p 2 i 1 n x 1 i x 1 2 j 1 n x 2 j x 2 2 n 1 n 2 2 displaystyle s p 2 sum i 1 n x 1i overline x 1 2 sum j 1 n x 2j overline x 2 2 n 1 n 2 2 為兩樣本共同之方差 該統計量t在虛無假說 m1 m2 m0為真的條件下服從自由度為n1 n2 2的t分佈 異質變異數假設 Heteroscedasticity 编辑 若兩獨立樣本x1i與x2j具有相同或不相同之樣本數n1與n2 且兩者母體變異數不相等 異質變異數假設 的常態分配 則兩母體之期望值之差m1 m2是否為m0可利用以下統計量 t x 1 x 2 m 0 s 1 2 n 1 s 2 2 n 2 displaystyle t frac overline x 1 overline x 2 mu 0 sqrt s 1 2 n 1 s 2 2 n 2 其中i 1 n 1 displaystyle i 1 ldots n 1 其中j 1 n 2 displaystyle j 1 ldots n 2 x 1 i 1 n 1 x 1 i n 1 displaystyle overline x 1 sum i 1 n 1 x 1i n 1 及x 2 j 1 n 2 x 2 j n displaystyle overline x 2 sum j 1 n 2 x 2j n 為兩樣本各自的平均數 s 1 2 i 1 n x 1 i x 1 2 n 1 1 displaystyle s 1 2 sum i 1 n x 1i overline x 1 2 n 1 1 及s 2 2 j 1 n x 2 j x 2 2 n 2 1 displaystyle s 2 2 sum j 1 n x 2j overline x 2 2 n 2 1 分別為兩樣本之方差 該統計量t在虛無假說 m1 m2 m0為真的條件下服從自由度為 d f s 1 2 n 1 s 2 2 n 2 2 s 1 2 n 1 2 n 1 1 s 2 2 n 2 2 n 2 1 displaystyle df frac s 1 2 n 1 s 2 2 n 2 2 s 1 2 n 1 2 n 1 1 s 2 2 n 2 2 n 2 1 之t分布 這種方法又常稱為Welch檢驗 其它相關檢驗 编辑 偏迴歸係數是否為零之檢定 编辑 以簡單線性迴歸為例 编辑 主条目 線性回歸 單變數線性迴歸 模型假設 y i a b x i e i displaystyle y i alpha beta x i varepsilon i 其中xi i 1 n為已知 a與b為未知係數 ei為殘差獨立且服從期望值0且方差s2未知的常態分佈 yi i 1 n為觀測值 我們可以檢驗迴歸係數b是否相等於特定的b0 通常使b0 0以檢定xi對yi是否存在解釋能力 在此例 簡單線性迴歸模型 即為檢定迴歸式之斜率是否為零 令a displaystyle widehat alpha 與b displaystyle widehat beta 為最小平方法之估計值 S E a displaystyle SE widehat alpha 與S E b displaystyle SE widehat beta 為最小平方法估計值之標準誤差 則 t b b 0 S E b T n 2 displaystyle t frac widehat beta beta 0 SE widehat beta sim mathcal T n 2 在虛無假說為b b0的情況下服從自由度為n 2之t分布 此檢定統計量被稱作 t比率 t ratio 其中 S E b 1 n 2 i 1 n y i y i 2 i 1 n x i x 2 displaystyle SE widehat beta frac sqrt frac 1 n 2 sum i 1 n y i widehat y i 2 sqrt sum i 1 n x i overline x 2 由於 e i y i y i y i a b x i displaystyle widehat varepsilon i y i widehat y i y i widehat alpha widehat beta x i 為殘差 即估計誤差 而 SSR i 1 n e i 2 displaystyle text SSR sum i 1 n widehat varepsilon i 2 為殘差之離均平方和 我們可改寫t為 t b b 0 n 2 SSR i 1 n x i x 2 displaystyle t frac widehat beta beta 0 sqrt n 2 sqrt text SSR sum i 1 n left x i overline x right 2 另请参阅 F检验電腦軟體 编辑大多數的試算表軟體及統計軟體 諸如QtiPlot OpenOffice org Calc LibreOffice Calc Microsoft Excel SAS SPSS Stata DAP gretl R Python 1 页面存档备份 存于互联网档案馆 PSPP Minitab等 都可以進行t檢驗運算 编程语言 软件程序 函数 注释Microsoft Excel 2010 之前的版本 TTEST i array1 i i array2 i i tails i i type i 参见 2 Microsoft Excel 2010 及更高版本 T TEST i array1 i i array2 i i tails i i type i 参见 3 页面存档备份 存于互联网档案馆 LibreOffice TTEST i Data1 Data2 Mode Type i 参见 4 页面存档备份 存于互联网档案馆 Google Sheets TTEST range1 range2 tails type 参见 5 页面存档备份 存于互联网档案馆 Python scipy stats ttest ind i a i i b i i axis 0 i i equal var True i 参见 6 页面存档备份 存于互联网档案馆 Matlab ttest data1 data2 参见 7 页面存档备份 存于互联网档案馆 Mathematica TTest data1 data2 参见 8 页面存档备份 存于互联网档案馆 R t test data1 data2 SAS PROC TTEST 参见 9 Java tTest sample1 sample2 参见 10 页面存档备份 存于互联网档案馆 Julia EqualVarianceTTest sample1 sample2 参见 11 Stata ttest data1 data2 See 12 页面存档备份 存于互联网档案馆 參見 编辑司徒頓t分布 F檢定 機率分布參考文獻 编辑 Richard Mankiewicz The Story of Mathematics Princeton University Press p 158 2 0 2 1 約翰 J 奧康納 埃德蒙 F 羅伯遜 英语 Edmund F Robertson Gosset MacTutor数学史档案 英语 Fisher Box Joan Guinness Gosset Fisher and Small Samples Statistical Science 1987 2 1 45 52 JSTOR 2245613 doi 10 1214 ss 1177013437 存档副本 PDF 2013 08 10 原始内容 PDF 存档于2017 05 16 取自 https zh wikipedia org w index php title 司徒頓t檢定 amp oldid 75232546, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。