兩樣本均值顯著性檢定(下)

Print Friendly

兩樣本均值顯著性檢定(下)(T Test for Two Sample Means (II))
國立臺灣大學農藝學系 黃纕淇

連結:兩樣本均值顯著性檢定(上)

2.兩母群體為常態分布且母體變異數未知

\(\text{(II)}\) 假設兩母群體變異數不相等時 \((\sigma^2_1\ne\sigma^2_2)\)

假若我們獲得兩筆不同隨機獨立樣本資料,此兩筆獨立樣本抽樣自兩母群體,且兩母群體都為常態分布且變異數未知但不相同時,可採用 Welch’s t 檢定法。

Welch’s t 檢定的統計量為:\(\displaystyle t’=\frac{|\overline{x}_1-\overline{x}_2|}{\sqrt{\frac{S^2_1}{n_1}+\frac{S^2_2}{n_2}}}~~~~~~~~~(3)\)

\((3)\) 式中的 \(\overline{x}_1\)、\(\overline{x}_2\) 為此兩筆樣本之平均值,兩個樣本變異數為 \(S^2_1\) 與 \(S^2_2\),\(n_1\)、\(n_2\) 則是兩組樣本抽樣的樣本數。但由於兩母群體變異數不相同,所以無法直接套用 t 分布,因此需要對 t 分布的自由度做加權後才可以檢定,加權過後的自由度為:

\(\displaystyle df’=\frac{\displaystyle\left(\frac{S^2_1}{n_1}+\frac{S^2_2}{n_2}\right)^2}{\displaystyle\frac{S^2_1/n_1}{n_1-1}+\frac{S^2_2/n_2}{n_2-1}}\)

舉例來說,想要了解痛風病患與正常成人血中尿酸量均值是否相同,且兩母群體變異數未知但不相同,隨機抽取 10 位痛風病患以及 8 位正常成人並記錄其血中尿酸量,隨後各別計算痛風病患血中尿酸量平均值及變異數分別為 9.17 \((\overline{x}_1)\)、10.6001 \((S^2_1)\),而正常成人則為 5.795 \((\overline{x}_2)\)、1.145 \((S^2_2)\),則計算出來的 t 值為:

\(\displaystyle t’=\frac{|9.17-5.795|}{\sqrt{\frac{10.6001}{10}+\frac{1.145}{8}}}=3.076\)

加權過後的自由度為:

\(\displaystyle df’=\frac{\displaystyle\left(\frac{10.6001}{10}+\frac{1.145}{8}\right)^2}{\displaystyle\frac{10.6001/10}{10-1}+\frac{1.145/8}{8-1}}\)

計算出來的 \(t’\) 值可以與臨界值 \(t_{0.025,df’}\) 比較,若 \(t’\) 小於這個臨界值,我們就認為兩樣本之均值相同。在此範例中,由於 \(t’=3.076>t_{0.025,df’=2.19}\),顯示痛風病患與正常成人血中尿酸量均值具有顯著差異。

四、成對樣本下兩母群體平均值的假設檢定

當我們得到一組由 n 個配對所構成的 n 個 \(d_i\) 隨機樣本,此配對樣本的差值來自一個常態母群體時,其平均值 \(u_D\),變異數則為 \(\sigma^2_D\),但由於 \(\sigma^2_D\) 未知,因此可以利用 \(S^2_D\) 來估計,而 \(u_D\) 則為點估計 \(\overline{D}\) 來估計,\(\overline{D}\) 及 \(S^2_D\) 計算公式如下:

\(\displaystyle \overline{D}=\frac{\sum^n_{i=1}d_i}{n},~~~S^2_D=\frac{\sum^n_{i=1}(d_i-\overline{D})^2}{n-1}~~~~~~~~~(4)\)

\(d_i\) 為同一試驗單位於不同環境下所獲得觀測值之差值,獲得 \(\overline{D}\) 及 \(S^2_D\) 就可以檢定 \(u_D\) 是否為 0,其採用的檢定統計量為:

\(\displaystyle t=\frac{\overline{D}}{\sqrt{\frac{S^2_D}{n}}}\)

例如:研究者想要了解,肥胖國中男性運動半年後,其體重運動前後差值之均值是否有差異,因此從參加此計畫的肥胖國中男性隨機抽取 9 位,分別測量其運動前後體重,結果如表一:

\(\displaystyle \overline{D}=\frac{\sum^n_{i=1}d_i}{n}=(11+7+…+9)/9=8.67\)

\(\displaystyle S^2_D=\frac{\sum^n_{i=1}(d_i-\overline{D})^2}{n-1}=[(11-8.67)^2+…+(9-8.67)^2]/8=5.75\)

表一、國中男性運動半年後體重差值統計表。(本文作者黃纕淇製作)

編號 運動前 運動後 差值
1 72 61 11
2 70 63 7
3 84 72 12
4 81 70 11
5 75 70 5
6 72 63 9
7 90 84 6
8 68 60 8
9 87 78 9

得到 \(\overline{D}\) 及 \(S^2_D\) 就可以計算 t 值,其為:

\(\displaystyle t=\frac{8.67-0}{\sqrt{\frac{5.75}{9}}}=10.85\)

想要知道在此條件下,8.67 小時的差異夠不夠顯著?可以使用一個合理的臨界值,如果此配對樣本差值小於這個臨界值,我們就認定配對樣本差值之均值相同。此臨界值通常選定為 \(t_{0.025,n-1}\)。在肥胖國中男性運動前後體重差值之均值例子中,由於 \(t = 10.85 >t_{0.025,8}= 2.306\),顯示運動對於減重是有效的,因為運動前後體重差值之均值具有顯著的差異。

73780_p1

圖一、成對樣本下兩母群體平均值的假設檢定。(本文作者黃纕淇製作)


參考文獻

  1. 沈明來 (2014)。生物統計學入門。九州。
  2. 郭寶錚、陳玉敏 (2011)。生物統計學。五南。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


4 + 5 =