卡方分布在Excel的應用(下)
卡方分布在Excel的應用(下) (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系 湯育全
例題三、卡方同質性檢定(引用自沈 [民 96 ] 之例題)
設今有甲、乙、丙三種治療香港腳藥膏,其治療效果如表一。我們想要測驗三種藥膏對治療香港腳的效果是否相同。
表二、甲乙丙藥膏治療香港腳結果表。(單位:人數)(表格來源:沈 [民 96 ])
甲 | 乙 | 丙 | 合計 | |
治癒 | 24 | 30 | 21 | 75 |
沒改善 | 12 | 18 | 10 | 40 |
合計 | 36 | 48 | 31 | 115 |
定義假說如下:
\(H_0\):三種藥膏對治療香港腳的效果相同
\(H_1\):三種藥膏對治療香港腳的效果不相同
首先,在 Excel 工作表中鍵入不同藥膏的治癒與無改善的人數(圖一 B 欄至 E 欄第 3 至 5 列),再利用 Excel 公式計算期望人數(圖一 B 欄至 E 欄第 9 至 11 列)。舉例來說,儲存格 B9 的計算 = E3 * B5 / E5,其他格依此類推。接著利用 CHITEST 函式計算獨立性檢定之 p 值;本例使用的 Excel 函式語法為 = CHITEST(B3:D4, B9:D10),獲得結果 p 值 = 0.870803。由於 p 值大於設定的顯著水準 0.05,無法拒絕虛無假設,因此我們沒有足夠的證據證明三種藥膏對治療香港腳的效果不相同。
例題四、McNemar 檢定(引用自 Rosner (2010) 之例題)
McNemar 針對成對的試驗單位進行檢定。假設我們要對乳癌兩種不同的化療方案進行比較,找了 621 對(共 1242 人)年齡和臨床條件相近的的乳癌病人,兩人分別給予 A 和 B 兩種化療處理,再觀察這些病人五年後的存活情形,結果如表二。本筆資料每對都有兩位乳癌病人,因此五年後有 510 對病人兩人都存活,90 對病人兩人都死亡,5 對病人只有接受 B 化療的病人存活,16 對病人只有接受 A 化療的病人存活。
表三、621 對配對後病人經化療五年後的存活情形(表格來源:Rosner (2010))
接受B化療 | ||||
五年後存活 | 五年後死亡 | 合計 | ||
接受A化療 | 五年後存活 | 510 | 16 | 526 |
五年內死亡 | 5 | 90 | 95 | |
合計 | 515 | 106 | 621 |
根據題意定義假說如下:
\(H_0\):A 和 B 化療對治療乳癌的效果相同
\(H_1\):A 和 B 化療對治療乳癌的效果不相同
首先,在 Excel 工作表中鍵入不同組合的人數(圖二 C 欄至 E 欄第 3 至 5 列),再利用 Excel 公式計算卡方統計量值,語法為 = ((C4-D3)^2)/(C4+D3)
獲得卡方統計量值結果為 5.7619(圖二 B8 儲存格)。接著利用 CHIDIST 函式計算獨立性檢定之 p 值,其語法為:
CHIDIST (卡方值,自由度)
例如本例卡方統計量值之 p 值 = CHIDIST (B8,1) = 0.01638。
或者也可以使用 CHIINV 函式求得卡方分布的臨界值,若卡方統計量值大於卡方分布的臨界值,則拒絕虛無假設。
卡方分布的臨界值函式語法為:
CHIINV (顯著水準,自由度 = 1)
本例為 CHIINV (0.05,1) = 3.8415。
由於 p 值 (0.01638) 小於設定的顯著水準 0.05,且卡方統計量值 (5.7619) 大於卡方分布的臨界值 (3.8415),因此拒絕虛無假設,推斷 A 和 B 化療對治療乳癌的效果不相同。
參考文獻
- 沈明來(民 96)。生物檢定統計法(第二版)。臺北市。九州。
- Bernard R. (2010), Fundamentals of Biostatistics (7th Edition), Boston, MA: Cengage Learning.