卡方分布在Excel的應用(上)
卡方分布在Excel的應用(上) (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系 湯育全
關於卡方分布的檢定可參考「類別資料分析」系列下的《列聯表與獨立性檢定》、《同質性檢定》、《McNemar test》與《費雪精確性檢定》等文章,本篇主要的目的是示範 Excel 進行卡方分布相關檢定時的操作方式,提供讀者在實務上進行資料分析時作為參考。
例題一、卡方適合度檢定(引用自沈 [民 96 ] 之例題)
設有某農藥商宣稱其新出品的殺蟲劑之殺蟲效率為 \(80\%\),今實際試驗 \(500\) 隻某昆蟲,結果有 \(375\) 隻死亡,我們欲測驗實際的試驗結果是否與藥商所宣稱的效果相符合。
\(H_0\):某農藥之殺蟲效率符合 \(p = 0.8\)
\(H_1\):某農藥之殺蟲效率不符合 \(p = 0.8\)
首先,在 Excel 工作表中鍵入實測的死蟲數、活蟲數與合計蟲數(圖一 B 欄第 2 至 4 列),再利用 Excel 公式(如圖一 D 欄第 2 至 4 列)計算期望蟲數結果如圖一 C 欄第 2 至 4 列。接著利用 CHITEST(圖二)的函式計算適合度檢定之 \(p\) 值 (\(p\) 值定義請參閱另一篇文章《型I錯誤、型II錯誤與P值》)。
卡方分析的函式語法為:
CHITEST (輸入實測值範圍, 輸入期望值範圍)
本例所得 \(p\) 值小於設定的顯著水準 \(0.05\),故拒絕虛無假設,推斷某農藥之殺蟲效率不符合 \(80\%\)。
使用 p-value 進行決策之外,也可以計算卡方統計量值(如圖三 E 欄第 2 至 4 列),配合使用 CHIINV 函式求得卡方分布的臨界值,若卡方統計量值大於卡方分布的臨界值,則拒絕虛無假設。
卡方分布的臨界值函式語法為:
CHIINV (顯著水準,自由度)
本例為 CHIINV (0.05,1) = 3.8415
由於本例卡方統計量值為 \(7.8125\),大於臨界值 \(3.8415\),因此拒絕虛無假設,推斷某農藥之殺蟲效率不符合 \(80\%\)
例題二、卡方獨立性檢定(引用自沈 [民 96 ] 之例題)
設今有三種乳牛,每組餵食不同飼料,並在飼養期間對所有乳牛進行健康檢查,若生病時則登記各乳牛治療次數,結果如下表:
表一、飼料種類與乳牛疾病治療次數資料表。(表格來源:沈 [民 96 ])
飼料種類 | ||||
治療次數 | A | B | C | 合計 |
0 | 20 | 18 | 26 | 64 |
1-3 | 7 | 9 | 12 | 28 |
4-8 | 7 | 5 | 4 | 16 |
合計 | 34 | 32 | 42 | 108 |
欲檢定餵食不同飼料是否影響乳牛的健康,因此定義假說如下:
\(H_0\):飼料種類與治療次數無關
\(H_1\):飼料種類與治療次數有關
首先,在 Excel 工作表中鍵入不同飼料中各個治療次數分組的乳牛隻數(圖四 B 欄至 E 欄第 3 至 6 列),再利用 Excel 公式計算期望隻數(圖四 B 欄至 E 欄第 10 至 13 列)。舉例來說,儲存格 B10 的計算 = E3 * B6 / E6,其他格依此類推。接著利用 CHITEST 函式計算獨立性檢定之 p 值;本例使用的 Excel 函式語法為 = CHITEST(B3:D5, B10:D12),獲得結果 p 值 = 0.695533。由於 p 值大於設定的顯著水準 0.05,無法拒絕虛無假設,因此我們沒有足夠的證據證明飼料種類和乳牛的健康有關。
參考文獻
- 沈明來(民 96)。生物檢定統計法(第二版)。臺北市。九州。
- Bernard R. (2010), Fundamentals of Biostatistics (7th Edition), Boston, MA: Cengage Learning.