類別資料分析— McNemar 檢定

Print Friendly

類別資料分析— McNemar 檢定 (Analysis on Categorical Data — McNemar’s Test)
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

當遇到成對資料時,在連續型資料中有成對樣本 t 檢定可供使用。在類別型資料中,也有檢定可處理成對資料,該檢定就稱為 McNemar 檢定,本篇將作詳細的介紹。

二、McNemar 檢定

當我們今天感興趣的是試驗前與試驗後受試者的反應,由於受試者本身的體質差異很大,可能會使結果的判斷不正確。因此我們會將同一受試者先量測其試驗前的反應,再量測其試驗後的反應,這種來自相同實驗單位(受試者)的資料型態就稱為配對資料。當資料為配對資料時,列聯表的寫法與採用的統計方法也大不相同。例如今天我們想要調查畢業前與畢業後男生有無女朋友的狀況是否有改變,對 \(50\) 個男生進行調查後,寫成 \(2\times 2\) 列聯表如下(表一):

表一、50 位男生畢業前後有無女朋友的人數。(本文作者賴薇云製)

有女朋友 沒女朋友
畢業前 23 27
畢業後 10 40

\(H_0\):畢業前後有無女朋友的比例相同

\(H_a\):畢業前後有無女朋友的比例不同

然後我們可能會想利用卡方同質性檢定來檢定畢業前後與有無女朋友的比例是否相同。但其實這種列聯表的寫法和分析方式用在配對資料是錯誤的!我們只調查了 \(50\) 位男同學,但在表一的列聯表卻呈現 \(100\) 位男同學的調查結果(畢業前 \(50\) 位、畢業後 \(50\) 位),錯誤的原因是遺漏了同一位學生畢業前後的配對資訊。在配對資料中,我們應該把列聯表寫成以下的形式(表二):

表二、50 位男生畢業前後有無女朋友的個數。(配對資料的列聯表型式)(本文作者賴薇云製)

畢業後
有女朋友 沒女朋友
畢業前 有女朋友 5 (A) 18 (B)
沒女朋友 5 (C)

22 (D)

以上列聯表的結果可分為兩種配對,前後一致的配對 A、D 與前後不一致的配對 B、C。當 \(H_0\) 成立(畢業前後有無女朋友的比例相同)時,A + B = A + C or B + D = C + D,也就是 B = C。因此,當 \(H_0\) 成立時,可預期 B + C = 23 的人數應均勻分配給 B、C 兩欄,各為 11.5 人,依據《計數型資料分析-卡方適合度檢定》一文的敘述,可以卡方適合度檢定探討 B、C 兩欄的人數是否符合預期的各為 11.5 人。上述統計法稱為 McNemar 檢定,其經連續性校正後的檢定統計量可寫為:

\(\begin{array}{ll}\chi^2_0&=\displaystyle\frac{(|B-(B+C)/2|-0.5)^2}{(B+C)/2}+\frac{(|C-(B+C)/2|-0.5)^2}{(B+C)/2}\\&=\displaystyle\frac{(|2B-(B+C)|-1)^2}{2(B+C)}+\frac{(|2C-(B+C)|-1)^2}{2(B+C)}\\&=\displaystyle\frac{(|B-C|-1)^2}{2(B+C)}+\frac{(|B-C|-1)^2}{2(B+C)}\\&=\displaystyle\frac{(|B-C|-1)^2}{(B+C)}\end{array}\)

當 \(H_0\) 成立時,B = C,檢定統計量會很小,且 \(H_0\) 成立之下,該檢定統計量會服從一自由度為 \(1\) 的卡方分布,在 \(\alpha=0.05\) 下,若檢定統計量值大於自由度為 \(1\) 的卡方分布的 \(95\%\) 百分位數時,應拒絕虛無假說(圖一藍色區域)。

73479_p1

圖一、檢定統計量棄卻區示意圖。(本文作者賴薇云繪)

以男生畢業前後有無女朋友的人數資料為例,

\(\displaystyle \chi^2_0=\sum^c_{j=1}\sum^r_{i=1}\frac{(|B-C|-1)^2}{B+C}=\frac{(|18-5|-1)^2}{18+5}=6.26\)

在 \(\alpha = 0.05\) 下,自由度為 \(1\) 之卡方分布的 \(95\%\) 百分位數可查表或由 Excel 函式求得(讀者可參考《卡方分布在Excel的應用 (上) (下)》兩篇文章)為 \(3.84\)。因為檢定統計量 \(= 6.26 > 3.84\),故在 \(\alpha = 0.05\) 下,畢業前後有無女朋友的比例不同。


參考文獻

  1. 沈明來 (2014)。生物統計學入門。九州。
  2. 郭寶錚、陳玉敏 (2011)。生物統計學。五南。
  3. Hogg, R. V., Tanis, E., & Zimmerman, D. (2015). Probability and statistical inference (9th edition). Pearson Higher Ed.

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


+ 3 = 6