兩樣本均值顯著性檢定(上)

Print Friendly

兩樣本均值顯著性檢定(上)(T Test for Two Sample Means (I))
國立臺灣大學農藝學系 黃纕淇

一、前言

本篇將介紹兩樣本於不同情況時的平均值顯著性檢定,例如我們想要了解每個人左右手的平均血壓是否不同,或者兩種不同嬰兒奶粉配方對於嬰兒平均體重增加是否會有影響時,應該選用的統計檢定法。

二、獨立樣本與成對樣本差異

說明兩樣本均值顯著性檢定之前,先來介紹樣本的兩種不同型態—「獨立樣本」與「成對樣本」,不同樣本型態選擇不同兩樣本均值顯著性檢定。獨立樣本為不同試驗單位所得到之觀測值,例如兩種不同配方嬰兒奶粉對於嬰兒體重增加之影響,吃 A 配方嬰兒奶粉的嬰兒與吃 B 配方嬰兒奶粉的嬰兒是不同的,換句話說,吃 A 配方嬰兒奶粉的嬰兒體重增加之觀測值與吃 B 配方嬰兒奶粉的嬰兒體重增加之觀測值是無關且互不相影響,其稱做獨立樣本;成對樣本為同一試驗單位於不同環境所得到之觀測值,舉例來說,10 名洗腎病患透析前後體重之變化,同一位病患透析前後之體重均測量自同一人,表示 10 名洗腎病患透析前之體重與透析後之體重是相關且配對的觀測值,其謂之為成對樣本。

三、兩母群體平均值差的假設檢定

1.母群體為常態分布且變異數已知

當我們取得兩筆不同隨機獨立樣本資料,此兩筆獨立樣本自兩母群體抽樣獲得,且兩母群體都為常態分布且變異數已知為 \(\sigma^2_1\) 與 \(\sigma^2_2\) 時,可以使用統計量:

\(\displaystyle Z=\frac{|\overline{x}_1-\overline{x}_2|}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2}}}~~~~~~~~~(1)\)

檢定兩樣本的均值是否相同,而 \((1)\) 式中的 \(\overline{x}_1\)、\(\overline{x}_2\) 為此兩筆樣本之平均值,\(n_1\)、\(n_2\) 則是兩組樣本抽樣的樣本數。例如:欲檢定某一公司男職員與女職員工作時數是否相同,因此由公司職員名單隨機抽取 50 名男職員和 100 名女職員,分別記錄每名職員工作時數,並計算兩筆隨機樣本平均值分別男職員平均上班時數 5.5 小時 \((\overline{x}_1)\) 與女職員平均上班時數 5.3 小時 \((\overline{x}_2)\),而研究者在事前已知兩母體變異數分別 \(\sigma^2_1\) 為 \(0.4^2\)、\(\sigma^2_2\) 為 \(0.3^2\),則計算出來的:

\(\displaystyle Z=\frac{|5.5-5.3|}{\sqrt{\frac{0.4^2}{50}+\frac{0.3^2}{100}}}=3.123\)

為了了解在此樣本條件下 0.2 小時的差異是否夠顯著,我們將透過判定計算出的 Z 值大小來決定。首先限定一個合理的臨界 Z 值,如果兩樣本差異小於這個臨界值,我們就認定兩樣本之均值相同。此臨界值我們通常設定為 \(Z_{0.025}=1.96\),這個數字是標準常態分布的 97.5% 百分位數。在男職員與女職員工作時數的範例中,由於 Z > 1.96,顯示男職員與女職員工作時數均值具有顯著差異。

2.兩母群體為常態分布且母體變異數未知

\((\text{I})\) 假設兩母群體變異數未知但相等時 \((\sigma^2_1=\sigma^2_2=\sigma^2)\)

當我們取得兩筆不同隨機獨立樣本資料,此兩筆獨立樣本自兩母群體抽樣獲得,且兩母群體都為常態分布且變異數未知但相同時,可運用的統計量為:

\(\displaystyle t=\frac{|\overline{x}_1-\overline{x}_2|}{\sqrt{\frac{S^2_p}{n_1}+\frac{S^2_p}{n_2}}}=\frac{|\overline{x}_1-\overline{x}_2|}{\sqrt{S^2_p\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}},~~~S^2_p=\frac{(n_1-1)S^2_1+(n_2-1)S^2_2}{n_1+n_2-2}~~~~~~(2)\)

\((2)\) 式藉由合併兩個樣本變異數 \(S^2_1\) 與  \(S^2_2\) 來估計共同變異數 \(\sigma^2\),以 \(S^2_p\) 表示之,\(n_1\)、\(n_2\) 則是兩組樣本抽樣的樣本數。舉例來說,欲比較兩所大學學生的身高均值是否相同,今由 A 大學抽出 16 位學生,測量平均身高為 172 公分 \((\overline{x}_1)\),標準差為 8.45 公分 \((S^2_1)\);B 大學也抽出 16 位學生,平均身高為 168 公分 \((\overline{x}_2)\),標準差為 7.8 公分 \((S^2_2)\)。假若 A、B 兩大學學生身高之母群體分布為常態分布,而且變異數相同。由於兩母群體變異數相同,因此需要先計算樣本共同變異數 \(S^2_p\):

\(\displaystyle S^2_p=\frac{(16-1)8.45^2+(16-1)7.8^2}{16+16-2}=66.12\)

得到 \(S^2_p\) 後,則計算出來的:

\(\displaystyle t=\frac{|172-168|}{\sqrt{66.12(\frac{1}{16}+\frac{1}{16})}}=1.39\)

想要知道在此條件下,4 公分的差異夠不夠顯著?可以將統計量 \(t\) 與 \(t_{0.025,n_1+n_2-2}=\) 自由度為 \(n_1+n_2-2\) 的 t 分布的 97.5% 百分位數比較,該數值可以利用 Excel 的 T.INV 函式取得。於此身高例子中,由於 \(t < t_{0.025,30}=2.04\),表示兩大學學生之身高無顯著差異。

73779_p1

圖一、兩母群體平均值差的假設檢定(假設兩母群體變異數未知但相等)。(本文作者黃纕淇繪製)

連結:兩樣本均值顯著性檢定(下)


參考文獻

  1. 沈明來 (2014)。生物統計學入門。九州。
  2. 郭寶錚、陳玉敏 (2011)。生物統計學。五南。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


7 − = 5