卡方分布在Excel的應用(上)

Print Friendly

卡方分布在Excel的應用(上) (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系 湯育全

關於卡方分布的檢定可參考「類別資料分析」系列下的《列聯表與獨立性檢定》、《同質性檢定》、《McNemar test》與《費雪精確性檢定等文章,本篇主要的目的是示範 Excel 進行卡方分布相關檢定時的操作方式,提供讀者在實務上進行資料分析時作為參考。

例題一、卡方適合度檢定(引用自沈 [ 96 ] 之例題)

設有某農藥商宣稱其新出品的殺蟲劑之殺蟲效率為 \(80\%\),今實際試驗 \(500\) 隻某昆蟲,結果有 \(375\) 隻死亡,我們欲測驗實際的試驗結果是否與藥商所宣稱的效果相符合。

\(H_0\):某農藥之殺蟲效率符合 \(p = 0.8\)

\(H_1\):某農藥之殺蟲效率不符合 \(p = 0.8\)

首先,在 Excel 工作表中鍵入實測的死蟲數、活蟲數與合計蟲數(圖一 B 欄第 2 至 4 列),再利用 Excel 公式(如圖一 D 欄第 2 至 4 列)計算期望蟲數結果如圖一 C 欄第 2 至 4 列。接著利用 CHITEST(圖二)的函式計算適合度檢定之 \(p\) 值 (\(p\) 值定義請參閱另一篇文章《型I錯誤、型II錯誤與P值》)。

73327_p1

圖一、計算期望值。(本文作者製)

73327_p2

圖二、可直接計算卡方檢定的 p 值。(本文作者製)

卡方分析的函式語法為:

CHITEST (輸入實測值範圍, 輸入期望值範圍)

本例所得 \(p\) 值小於設定的顯著水準 \(0.05\),故拒絕虛無假設,推斷某農藥之殺蟲效率不符合 \(80\%\)。

使用 p-value 進行決策之外,也可以計算卡方統計量值(如圖三 E 欄第 2 至 4 列),配合使用 CHIINV 函式求得卡方分布的臨界值,若卡方統計量值大於卡方分布的臨界值,則拒絕虛無假設。

卡方分布的臨界值函式語法為

CHIINV (顯著水準,自由度)

本例為 CHIINV (0.05,1) = 3.8415

73327_p3

圖三、計算卡方值。(本文作者製)

由於本例卡方統計量值為 \(7.8125\),大於臨界值 \(3.8415\),因此拒絕虛無假設,推斷某農藥之殺蟲效率不符合 \(80\%\)

例題二、卡方獨立性檢定(引用自沈 [ 96 ] 之例題)

設今有三種乳牛,每組餵食不同飼料,並在飼養期間對所有乳牛進行健康檢查,若生病時則登記各乳牛治療次數,結果如下表:

表一、飼料種類與乳牛疾病治療次數資料表。(表格來源:沈 [民 96 ])

飼料種類
治療次數 A 合計
0 20 18 26 64
1-3 7 9 12 28
4-8 7 5 4 16
合計 34 32 42 108

欲檢定餵食不同飼料是否影響乳牛的健康,因此定義假說如下:

\(H_0\):飼料種類與治療次數無關

\(H_1\):飼料種類與治療次數有關

73327_p4

圖四、卡方獨立性檢定。(本文作者製)

首先,在 Excel 工作表中鍵入不同飼料中各個治療次數分組的乳牛隻數(圖四 B 欄至 E 欄第 3 至 6 列),再利用 Excel 公式計算期望隻數(圖四 B 欄至 E 欄第 10 至 13 列)。舉例來說,儲存格 B10 的計算 = E3 * B6 / E6,其他格依此類推。接著利用 CHITEST 函式計算獨立性檢定之 p 值;本例使用的 Excel 函式語法為 = CHITEST(B3:D5, B10:D12),獲得結果 p 值 = 0.695533。由於 p 值大於設定的顯著水準 0.05,無法拒絕虛無假設,因此我們沒有足夠的證據證明飼料種類和乳牛的健康有關。

連結:卡方分布在Excel的應用(下)


參考文獻

  1. 沈明來(民 96)。生物檢定統計法(第二版)。臺北市。九州。
  2. Bernard R. (2010), Fundamentals of Biostatistics (7th Edition), Boston, MA: Cengage Learning.

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


8 − = 3