無母數統計—符號檢定

Print Friendly

無母數統計—符號檢定(Non-parameter Statistics: Sign Test)
國立臺灣大學園藝暨景觀學系 李韶凱

一、前言

由過去的經驗,針對平均值的比較,可在抽樣收集數據之後,假設其服從常態分佈,計算樣本的平均值 (mean) 以及標準差 (standard error),再以常態的檢定方法進行檢驗(參考《兩樣本均值顯著性檢定(上)(下)》兩篇文章)。然而,如果想檢測的資料無法直接假設其服從特定分布,例如圖一的甲基化微陣列分析結果,應採用無母數 (nonparametric) 統計法進行檢定。本文將介紹無母數統計法中的符號檢定 (sign test) 方法,檢測單一中位數或成對群體的分佈是否相同。

73977_p1

圖一、甲基化微陣列分析結果。(本文作者李韶凱繪製,資料來源:參考文獻 3)

二、符號檢定 Sign test

符號檢定的特色是選用中位數 (median) 取代樣本均值 (mean) 為整體代表,可降低離群值 (outliers) 對整個抽樣分佈造成的影響,是相對於均值較穩健 (robust) 的統計量。以下舉一個單一樣本中位數的檢測例子。

某餐廳推出新套餐,想調查顧客對該商品的接受度,依喜好程度由低到高共 1 ~ 10 分(1 分表示極度不喜歡,10 分表示極度喜歡),調查 26 位顧客得到結果如下:

\(3~~~6~~~4~~~9~~~1~~~10~~~5~~~2~~~7~~~5~~~2~~~1~~~9\)

\(8~~~3~~~9~~~10~~~1~~~1~~~6~~~9~~~1~~~2~~~7~~~2~~~8\)

我們可用符號檢定分析顧客對新套餐是否有特別的喜好程度,若樣本中位數接近 5.5,表示顧客對新套餐無特別偏好。我們將樣本 26 個觀測值分別取「+」、「-」號代表與大於 5.5 與小於 5.5 的情況(表一),若觀測值等於中位數時,則剔除該筆資料,同時減少一筆樣本數。假定 D 代表「+」的個數,我們可以假設 D 服從二項分佈,且當顧客對新套餐無特別偏好,大於 5.5(符號為「+」)的機率約為 \(p = 0.5\)。

73977_c1

表一、顧客對新套餐的喜好程度評分。(本文作者李韶凱製作)

由二項分布期望值以及變異數的定義(參考《伯努力試驗與二項分布》一文):

\(E(D)=n\times 0.5=\frac{n}{2}\)

\(Var(D)=n\times 0.5\times 0.5=\frac{n}{4}\)

假設 \(\alpha=0.05\) 的雙尾檢定,虛無假設及對立假設分別為下:

\( H_o:\text{中位數}=5.5\)      \( H_a:\text{中位數}\ne5.5\)

根據中央極限定理,檢定統計量計算方式如下:

\(\displaystyle Z=\frac{|D-E(D)|}{\sqrt{Var(D)}}=\frac{|D-\frac{n}{2}|}{\sqrt{\frac{n}{4}}}\sim N(0,1)\)

由收集的數據可得:

\(D=12,E(D)=13,Var(D)=\frac{13}{2},Z=0.39\)

查 Z 表得 \(\alpha = 0.05\) 的 Z 值為 1.96 大於 0.39,因此無法拒絕 \(H_0\),表示此抽樣資料可能表示顧客對新套餐的喜惡程度相同,或是無意見。

符號檢定同時也可用於配對樣本的檢定。以檢定某品牌兩款手機於各據點的銷售情況,欲檢驗是否 A 款式較 B 款式受消費者喜愛為例:

73977_c2

表二、兩款手機的銷售情況。(本文作者李韶凱製作)

假設 \(\alpha=0.05\) 的「單尾」檢定,虛無假設及對立假設分別為下:

\(H_0:M_A=M_B\)   \(H_a:M_A>M_B\)

其中 \(M_A\) 與 \(M_B\) 分別為 A 款式與 B 款式手機銷售量的中位數。由於此樣本數較小(n < 20),上述檢定統計量需額外進行連續性校正,亦即分子需減 \(\frac{1}{2}\):

 \(\displaystyle Z =\frac{|D-E(D)|-\frac{1}{2}}{\sqrt{Var(D)}}=\frac{|D-\frac{n}{2}|-\frac{1}{2}}{\sqrt{\frac{n}{4}}}\sim N(0,1)\)

\(D=9, E(D)=6, Var(D)=3, Z=1.44\)

查 Z 表得 \(\alpha = 0.05\) 的 Z 值為 1.65 大於 1.44,因此無法拒絕 \(H_0\),表示此抽樣資料可能表示消費者對兩款的喜惡程度相同,或是無特別偏好。


參考文獻

  1. 陳順宇、鄭碧娥 (2004)。統計學。第十六章—無母數方法。華泰文化
  2. 唐麗英 (2015)。統計學(二):第十四章 無母數統計檢定—國立交通大學開放式課程。http://ocw.nctu.edu.tw/course/stat032/14.4.pdf
  3. Warden, C. (2014). COHCAP Analysis of CpG Island Methylation for Illumina 450k Methylation Arrays. Bioinformatics Core, City of Hope Medical Center.

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


8 + 8 =