皮爾森卡方檢定

皮爾森卡方檢定（英語：Pearson's chi-squared test）是最有名卡方檢定之一（其他常用的卡方檢定還有葉氏連續校正（英语：Yates's correction for continuity）、似然比檢定（英语：Likelihood-ratio test）、一元混成检验（英语：Portmanteau test）等等－－它們的統計值之機率分配都近似於卡方分配，故稱卡方檢定）。「皮爾森卡方檢定」最早由卡爾·皮爾森在1900年發表，^[1] 用於類別變數的檢定。科學文獻中，當提及卡方檢定而沒有特別指明類型時，通常即指皮爾森卡方檢定。

原假設

「皮爾森卡方檢定」的虛無假設（H₀）是：一個樣本中已發生事件的次數分配會遵守某個特定的理論分配。

在虛無假設的句子中，「事件」必須互斥，並且所有事件總機率等於1。或者說，每個事件是類別變數（英語：categorical variable）的一種類別或級別（英語：level）。

簡單的例子：常見的六面骰子，事件＝丟骰子的結果（可能是1~6任一個）屬於類別變數，每一面都是此變數的一種（一個級別）結果，每種結果互斥（1不是2, 3, 4, 5, 6; 2不是1, 3, 4 ...），六面的機率總和等於1。

用途和步驟

「皮爾森卡方檢定」可用於兩種情境的變項比較：適配度檢定（英语：Goodness of Fit test）和獨立性檢定。

「適配度檢定」驗證一組觀察值的次數分配是否異於理論上的分配。
「獨立性檢定」驗證從兩個變數抽出的配對觀察值組是否互相獨立（例如：每次都從A國和B國各抽一個人，看他們的反應是否與國籍無關）。

不管哪個檢定都包含三個步驟：

計算卡方檢定的統計值「 $\chi ^{2}$ 」：把每一個觀察值和理論值的差做平方後、除以理論值、再加總。
計算 $\chi ^{2}$ 統計值的自由度「 $df$ 」。
依據研究者設定的置信水平（顯著性水平、P值或對應Alpah值），查出自由度為 $df$ 的卡方分配臨界值，比較它與第1步驟得出的 $\chi ^{2}$ 統計值，推論能否拒絕虛無假說。

適合度檢定

適配度檢定（英語：Goodness of Fit test）：測試樣本的機率分配與母體有多相似。

母體假設為離散型均勻分配

當理論上的母體分配為每個類別機率一致時，即應適用離散型均勻分配的計算方法。 $N$ 個觀察值於理論上應均勻分配在所有的 $m$ 個欄位（類別）中，因此每個欄位（類別）的「理論次數」（或期望次數）為：

E_{i}={\frac {N}{m}}

，其中

i=1,2,...,m

自由度 $df=m-1$ 。「 $m$ 」是總共要計算離差平方的個數（每個類別計算一次觀察值與理論值的差，再平方）。「 $-1$ 」是因為對於計算 $\chi ^{2}$ 而言只有一個限制條件：觀察值的個數總和為 $N$ 。

母體假設為其他種分配

貝氏算法

例子

獨立性檢定

在同一個個體（例如：同一個人）身上有兩個二元變數（X, Y），例如 X（男／女）和 Y（右撇子／左撇子），觀察兩個變數的相關性。虛無假設是：兩個變數呈統計獨立性。在本例中：性別與慣用手是獨立事件。

首先，每個觀察值（每個抽出的人）會被重新編排到一個叫做「列聯表」（英語：contingency table，又稱：條件次數表）的二維表格裡。本例的列聯表是2×2的構造（不算入Total欄位）：

	男	女	總計
右	43	44	87
左	9	4	13
總計	52	48	100

如果列聯表共有 r 行 c 列，那麽在獨立事件的假設下，每個欄位的「理論次數」（或期望次數）為：

E_{i,j}={\frac {\left(\sum _{n_{c}=1}^{c}O_{i,n_{c}}\right)\cdot \left(\sum _{n_{r}=1}^{r}O_{n_{r},j}\right)}{N}}

，

其中 N 是樣本大小（觀察值的個數，亦即2×2列聯表所有欄位的總和，本例：N = 100）。本例的各欄位期望值如下（括號裡的數字）：

	男	女	總計
右	43 (45.24)	44 (41.76)	87
左	9 (6.76)	4 (6.24)	13
總計	52	48	100

$\chi ^{2}$ 統計值的公式是：

\chi ^{2}=\sum _{i=1}^{r}\sum _{j=1}^{c}{(O_{i,j}-E_{i,j})^{2} \over E_{i,j}}.

本例的

\chi ^{2}

統計值是：

\chi ^{2}=(43-45.24)^{2}/45.24+(44-41.76)^{2}/41.76+(9-6.76)^{2}/6.76+(4-6.24)^{2}/6.24=1.777

自由度 $df=(r-1)(c-1)$ 是這樣得出：雖然總共要計算 $rc$ 個離差平方（每個欄位計算一次觀察值與理論值的差，再平方），但 X 變數有1個限制條件（樣本抽出後，男性的人數即固定），Y 變數也有1個限制條件（樣本抽出後，右撇子的人數即固定），所以可自由變動的欄位數只有 $(r-1)(c-1)$ 。

在本例中

df=(2-1)\times (2-1)=1

。

在 $\chi ^{2}=1.777,df=1$ 的條件下，得出卡方分配右尾機率 $p=0.1825$ ，無法拒絕虛無假設，亦即：無法拒絕性別變數與慣用手變數互相獨立的假設。

限制

如果個別欄位的期望次數太低，會使機率分配無法近似於卡方分配。一般要求：自由度 $df>1$ 時，期望次數小於5的欄位不多於總欄位的20%。
若自由度 $df=1$ ，且若期望次數 $<10$ ，則近似於卡方分配的假設不可信。此時可以將每個觀察值的離差減去 $0.5$ 之後再做平方，這便是葉慈連續校正（英语：Yates's correction for continuity）。

参考文献

引用

^ Karl Pearson. X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science: 157–175. doi:10.1080/14786440009463897.

卡方分配與卡方檢定（页面存档备份，存于互联网档案馆）

期刊文章

Herman Chernoff, E. L. Lehmann. The Use of Maximum Likelihood Estimates in $\chi^2$ Tests for Goodness of Fit. The Annals of Mathematical Statistics. 1954-09, 25 (3): 579–586 [2018-04-02]. ISSN 0003-4851. doi:10.1214/aoms/1177728726. （原始内容于2021-02-26）（英语）.
R. L. Plackett. Karl Pearson and the Chi-Squared Test. International Statistical Review / Revue Internationale de Statistique. 1983, 51 (1): 59–72 [2018-04-02]. doi:10.2307/1402731. （原始内容于2021-04-16）.

书籍

Nikulin, Priscilla E. Greenwood ; Mikhail S. A guide to chi-squared testing. New York, NY [u.a.]: Wiley. 1996. ISBN 047155779X.

[1] Karl Pearson. X. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science: 157–175. doi:10.1080/14786440009463897.

[1]

www.wiki2.zh-cn.nina.az

皮爾森卡方檢定

目录

原假設

用途和步驟

適合度檢定

母體假設為離散型均勻分配

母體假設為其他種分配

貝氏算法

例子

獨立性檢定

限制

参考文献

引用

期刊文章

书籍

養樂多

餐桌礼仪

餓狼傳說角色列表

餓死

餓鬼：毛時代大饑荒揭秘

餘生

餘祭

餘姚市

餘弦

餘桃

街道家具

街頭強迫推銷

街頭魔法王之魔王之王

衙儀縣

衙前圍道

文章