數學 | 科學Online

離群值的檢測 2016/08/24
離群值的檢測(Detection of Outliers)
國立臺灣大學農藝所生物統計組碩士班陳丘原

一、前言

一般我們在收集資料的過程中，可能會因為測量方法的變異、人為的疏失或是實驗誤差，導致我們所收集到的資料中會有極度異於其它資料的值產生，我們稱之為離群值 (outlier)；由於離群值的存在，可能會導致我們所分析的結果產生難以解釋的情況，因此適時的找出這些離群值，再與專業領域的人討論造成這些離群值的原因，能有助於統計分析的解釋。 Continue reading →
建構信賴區間時樣本數大小的決定 2016/08/24
建構信賴區間時樣本數大小的決定(How to Determine Sample Size through the Establishment of Confidence Interval)
國立臺灣大學農藝所生物統計組碩士班賴薇云

一、前言

在進行試驗之前，有一個令人頭痛的問題：我要用多少樣本才夠？從《型I錯誤、型II錯誤與P值》一文中，我們知道唯有提高樣本數才可以同時降低型 I 錯誤與型 II 錯誤發生的機率，也從《點估計及區間估計》一文中知道當提高樣本數時，信賴區間的寬度會變短，這一切似乎都說明樣本數越大越好。但是在提高樣本數的同時，需要耗費更多的人力與資源，因此決定適當的樣本數可以在最低成本耗費下控制型 I 錯誤與型 II 錯誤發生的機率在可接受的範圍內。樣本數的決定可以由兩個地方著手，一是信賴區間的估計、二是假設檢定，本篇將介紹如何決定建構信賴區間所需的樣本數大小。 Continue reading →
點估計及區間估計 2016/08/23
點估計及區間估計 (Point Estimation and Interval Estimation)
國立臺灣大學農藝所生物統計組碩士班賴薇云

一、前言

統計學可分為主要的兩個分支，敘述統計及推論統計。在我們對感興趣的母群體進行抽樣後，所得到的樣本資料凌亂不堪，無法提供任何訊息。此時，我們可以將原始資料整理成圖表或敘述統計量（平均值、變異數等），讓我們對資料的輪廓有一定的基本認識，例如資料分布的中心點、變異性、對稱性及偏歪性等，這就是敘述統計學。推論統計學則是由樣本資料的特徵，反推母群體的特徵。推論統計學又可分為估計和檢定，其中，我們從母群體抽出樣本後，計算樣本統計量來推論母體參數的過程就稱為估計。估計又可細分為點估計及區間估計，將於本篇進行介紹。 Continue reading →
地位量數（下）—中位數、眾數 2016/08/18
地位量數（下）—中位數、眾數 (Measures of Location (II)： Median, Mode)
國立成功大學統計系藍翊文

連結：地位量數（上）—平均數

本篇接續介紹中位數及眾數兩種地位量數。中位數與眾數均不受太大或太小的觀測值（又稱極端值）影響，因此又稱為穩健 (robust) 地位量數。

1. 中位數 (median)：將資料由小排到大，找出位於中間項的數值（當樣本數個數為奇數）或中間兩項之平均值（樣本數個數為偶數），舉例來說，有 \(n\) 筆資料由小排到大，排名第 \(k\) 的資料記為 \(x_{(k)}\)，可得 \(x_{(1)}\le x_{(2)}\le … \le x_{(n)}\)，則中位數為： Continue reading →
地位量數（上）—平均數 2016/08/18
地位量數（上）—平均數 (Measures of Location (I): Mean)
國立成功大學統計系藍翊文

地位量數，又稱為集中量數，屬於摘要統計值的一種，主要目的是用單一數字描述資料的中心位置，但是針對不同的資料類型，選擇具有代表性之中心位置的方法不同，最常見的地位量數有平均數、中位數及眾數三類，本篇針對平均數進行介紹。 Continue reading →
類別資料分析— McNemar 檢定 2016/08/13
類別資料分析— McNemar 檢定 (Analysis on Categorical Data — McNemar’s Test)
國立臺灣大學農藝所生物統計組碩士班賴薇云

一、前言

當遇到成對資料時，在連續型資料中有成對樣本 t 檢定可供使用。在類別型資料中，也有檢定可處理成對資料，該檢定就稱為 McNemar 檢定，本篇將作詳細的介紹。 Continue reading →
類別資料分析—費雪精確性檢定 2016/08/12
類別資料分析—費雪精確性檢定 (Analysis on Categorical Data — Fisher’s Exact Test)
國立臺灣大學農藝所生物統計組碩士班賴薇云

一、費雪精確性檢定

在卡方檢定中，通常我們都會希望細格的期望次數不能小於 \(5\)，否則在 \(H_0\)下的檢定統計量，其近似卡方分布的效果不佳。若是以上情況發生，通常我們會透過將欄或列合併的方式，或是採用費雪精確性檢定 (Fisher’s exact test)。該檢定應用於 \(2\times 2\) 列聯表（列聯表的定義詳見《類別資料分析-列聯表與獨立性檢定》一文所述），且觀測總數 \(n\) 很小時（通常為小於 \(20\)），例如調查兩種陷阱捕獲兩種不同野兔的數量如下（表一）： Continue reading →
卡方分布在Excel的應用(下) 2016/08/06
卡方分布在Excel的應用（下） (Applications of Chi-squared Test in Excel)
國立臺灣大學農藝學系湯育全

連結：卡方分布在Excel的應用(上)

例題三、卡方同質性檢定（引用自沈 [民 96 ] 之例題）

設今有甲、乙、丙三種治療香港腳藥膏，其治療效果如表一。我們想要測驗三種藥膏對治療香港腳的效果是否相同。

表二、甲乙丙藥膏治療香港腳結果表。（單位：人數）（表格來源：沈 [民 96 ]）

甲乙丙合計

治癒 24 30 21 75

沒改善 12 18 10 40

合計 36 48 31 115

Continue reading →

	甲	乙	丙	合計
治癒	24	30	21	75
沒改善	12	18	10	40
合計	36	48	31	115