數學

無母數統計—符號檢定

無母數統計—符號檢定(Non-parameter Statistics: Sign Test)
國立臺灣大學園藝暨景觀學系 李韶凱

一、前言

由過去的經驗,針對平均值的比較,可在抽樣收集數據之後,假設其服從常態分佈,計算樣本的平均值 (mean) 以及標準差 (standard error),再以常態的檢定方法進行檢驗(參考《兩樣本均值顯著性檢定(上)(下)》兩篇文章)。然而,如果想檢測的資料無法直接假設其服從特定分布,例如圖一的甲基化微陣列分析結果,應採用無母數 (nonparametric) 統計法進行檢定。本文將介紹無母數統計法中的符號檢定 (sign test) 方法,檢測單一中位數或成對群體的分佈是否相同。

比例檢定

比例檢定(Test of Proportions)
國立臺灣大學農藝學系 吳博雅

一、前言

常常市面上一些電子產品宣稱其不良率低於一個目標值(例如:5%),或是一個好的棒球打擊者其打擊率高達七成以上,或是要判定新藥的使用可以使疾病的死亡率降低至九成以下等相關問題,其實都屬於單組樣本比例檢定的問題。若是要探討舊藥與新藥對疾病治癒率的差異性,或是探討兩射箭選手命中紅心射擊率的差異性等相關問題,屬於兩組樣本比例檢定的問題。比例檢定是針對取樣自二項分布的樣本,假設於大樣本情況下,依據中央極限定理,樣本比例會近似於常態分布,並且分成「單一組樣本比例檢定」與「兩組樣本比例檢定」這兩部分做更進一步的介紹。

非成對 t 檢定於 Excel 上的操作

非成對 t 檢定於 Excel 上的操作 (Operation of Unpaired t Test on Excel)
國立臺灣大學農藝學系 杜鎮宇

一、前言

非成對的 t 檢定其操作方法與成對 t 檢定的操作方法類似,同樣使用 Excel 資料分析工具箱進行分析。若樣本是非成對資料的話,我們還需要另外考慮此兩樣本的變方是否相同。兩樣本變方相同(接近)的 t 檢定稱為獨立樣本 t 檢定 (independent t-test),我們會將兩樣本合併求共同樣本變方 (pooled variance) ,請參考《兩樣本均值顯著性檢定(上) 》一文;兩樣本變方不同時則應採用 Welch’s t 檢定 (Welch’s t-test),請參考《兩樣本均值顯著性檢定(下)》一文。

成對 t 檢定於 Excel 上的操作

成對 t 檢定於 Excel 上的操作(Operation of Paired t Test on Excel)
國立臺灣大學農藝學系 杜鎮宇

一、前言

統計的計算是繁瑣的,其中具有許多的公式運算,光是將樣本資料一個個代入做運算就會花費許多的時間,況且在複雜的運算過程下,手動運算的錯誤率也會明顯提高,為了省下時間及人力成本,我們需要一些電腦程式來替我們進行這些運算。而本篇所要介紹的就是如何使用 Excel 來進行成對的 t 檢定 (paired t-test)。

兩樣本均值顯著性檢定(下)

兩樣本均值顯著性檢定(下)(T Test for Two Sample Means (II))
國立臺灣大學農藝學系 黃纕淇

連結:兩樣本均值顯著性檢定(上)

2.兩母群體為常態分布且母體變異數未知

\(\text{(II)}\) 假設兩母群體變異數不相等時 \((\sigma^2_1\ne\sigma^2_2)\)

假若我們獲得兩筆不同隨機獨立樣本資料,此兩筆獨立樣本抽樣自兩母群體,且兩母群體都為常態分布且變異數未知但不相同時,可採用 Welch’s t 檢定法。

兩樣本均值顯著性檢定(上)

兩樣本均值顯著性檢定(上)(T Test for Two Sample Means (I))
國立臺灣大學農藝學系 黃纕淇

一、前言

本篇將介紹兩樣本於不同情況時的平均值顯著性檢定,例如我們想要了解每個人左右手的平均血壓是否不同,或者兩種不同嬰兒奶粉配方對於嬰兒平均體重增加是否會有影響時,應該選用的統計檢定法。

離群值的檢測

離群值的檢測(Detection of Outliers)
國立臺灣大學農藝所生物統計組碩士班 陳丘原

一、前言

一般我們在收集資料的過程中,可能會因為測量方法的變異、人為的疏失或是實驗誤差,導致我們所收集到的資料中會有極度異於其它資料的值產生,我們稱之為離群值 (outlier);由於離群值的存在,可能會導致我們所分析的結果產生難以解釋的情況,因此適時的找出這些離群值,再與專業領域的人討論造成這些離群值的原因,能有助於統計分析的解釋。

建構信賴區間時樣本數大小的決定

建構信賴區間時樣本數大小的決定(How to Determine Sample Size through the Establishment of Confidence Interval)
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

在進行試驗之前,有一個令人頭痛的問題:我要用多少樣本才夠?從《型I錯誤、型II錯誤與P值一文中,我們知道唯有提高樣本數才可以同時降低型 I 錯誤與型 II 錯誤發生的機率,也從《點估計及區間估計》一文中知道當提高樣本數時,信賴區間的寬度會變短,這一切似乎都說明樣本數越大越好。但是在提高樣本數的同時,需要耗費更多的人力與資源,因此決定適當的樣本數可以在最低成本耗費下控制型 I 錯誤與型 II 錯誤發生的機率在可接受的範圍內。樣本數的決定可以由兩個地方著手,一是信賴區間的估計、二是假設檢定,本篇將介紹如何決定建構信賴區間所需的樣本數大小。

點估計及區間估計

點估計及區間估計 (Point Estimation and Interval Estimation)
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

統計學可分為主要的兩個分支,敘述統計及推論統計。在我們對感興趣的母群體進行抽樣後,所得到的樣本資料凌亂不堪,無法提供任何訊息。此時,我們可以將原始資料整理成圖表或敘述統計量(平均值、變異數等),讓我們對資料的輪廓有一定的基本認識,例如資料分布的中心點、變異性、對稱性及偏歪性等,這就是敘述統計學。推論統計學則是由樣本資料的特徵,反推母群體的特徵。推論統計學又可分為估計和檢定,其中,我們從母群體抽出樣本後,計算樣本統計量來推論母體參數的過程就稱為估計。估計又可細分為點估計及區間估計,將於本篇進行介紹。

地位量數(下)—中位數、眾數

地位量數(下)—中位數、眾數 (Measures of Location (II): Median, Mode)
國立成功大學統計系 藍翊文

連結:地位量數(上)—平均數

本篇接續介紹中位數及眾數兩種地位量數。中位數與眾數均不受太大或太小的觀測值(又稱極端值)影響,因此又稱為穩健 (robust) 地位量數。

1. 中位數 (median): 將資料由小排到大,找出位於中間項的數值(當樣本數個數為奇數)或中間兩項之平均值(樣本數個數為偶數), 舉例來說,有 \(n\) 筆資料由小排到大,排名第 \(k\) 的資料記為 \(x_{(k)}\),可得 \(x_{(1)}\le x_{(2)}\le … \le x_{(n)}\),則中位數為:

Pages