math1
  • 離群值的檢測 2016/08/24

    離群值的檢測(Detection of Outliers)
    國立臺灣大學農藝所生物統計組碩士班 陳丘原

    一、前言

    一般我們在收集資料的過程中,可能會因為測量方法的變異、人為的疏失或是實驗誤差,導致我們所收集到的資料中會有極度異於其它資料的值產生,我們稱之為離群值 (outlier);由於離群值的存在,可能會導致我們所分析的結果產生難以解釋的情況,因此適時的找出這些離群值,再與專業領域的人討論造成這些離群值的原因,能有助於統計分析的解釋。 Continue reading →

  • 建構信賴區間時樣本數大小的決定 2016/08/24

    建構信賴區間時樣本數大小的決定(How to Determine Sample Size through the Establishment of Confidence Interval)
    國立臺灣大學農藝所生物統計組碩士班 賴薇云

    一、前言

    在進行試驗之前,有一個令人頭痛的問題:我要用多少樣本才夠?從《型I錯誤、型II錯誤與P值一文中,我們知道唯有提高樣本數才可以同時降低型 I 錯誤與型 II 錯誤發生的機率,也從《點估計及區間估計》一文中知道當提高樣本數時,信賴區間的寬度會變短,這一切似乎都說明樣本數越大越好。但是在提高樣本數的同時,需要耗費更多的人力與資源,因此決定適當的樣本數可以在最低成本耗費下控制型 I 錯誤與型 II 錯誤發生的機率在可接受的範圍內。樣本數的決定可以由兩個地方著手,一是信賴區間的估計、二是假設檢定,本篇將介紹如何決定建構信賴區間所需的樣本數大小。 Continue reading →

  • 點估計及區間估計 2016/08/23

    點估計及區間估計 (Point Estimation and Interval Estimation)
    國立臺灣大學農藝所生物統計組碩士班 賴薇云

    一、前言

    統計學可分為主要的兩個分支,敘述統計及推論統計。在我們對感興趣的母群體進行抽樣後,所得到的樣本資料凌亂不堪,無法提供任何訊息。此時,我們可以將原始資料整理成圖表或敘述統計量(平均值、變異數等),讓我們對資料的輪廓有一定的基本認識,例如資料分布的中心點、變異性、對稱性及偏歪性等,這就是敘述統計學。推論統計學則是由樣本資料的特徵,反推母群體的特徵。推論統計學又可分為估計和檢定,其中,我們從母群體抽出樣本後,計算樣本統計量來推論母體參數的過程就稱為估計。估計又可細分為點估計及區間估計,將於本篇進行介紹。 Continue reading →

  • 地位量數(下)—中位數、眾數 2016/08/18

    地位量數(下)—中位數、眾數 (Measures of Location (II): Median, Mode)
    國立成功大學統計系 藍翊文

    連結:地位量數(上)—平均數

    本篇接續介紹中位數及眾數兩種地位量數。中位數與眾數均不受太大或太小的觀測值(又稱極端值)影響,因此又稱為穩健 (robust) 地位量數。

    1. 中位數 (median): 將資料由小排到大,找出位於中間項的數值(當樣本數個數為奇數)或中間兩項之平均值(樣本數個數為偶數), 舉例來說,有 \(n\) 筆資料由小排到大,排名第 \(k\) 的資料記為 \(x_{(k)}\),可得 \(x_{(1)}\le x_{(2)}\le … \le x_{(n)}\),則中位數為: Continue reading →

  • 地位量數(上)—平均數 2016/08/18

    地位量數(上)—平均數 (Measures of Location (I): Mean)
    國立成功大學統計系 藍翊文

    地位量數,又稱為集中量數,屬於摘要統計值的一種,主要目的是用單一數字描述資料的中心位置,但是針對不同的資料類型,選擇具有代表性之中心位置的方法不同,最常見的地位量數有平均數、中位數及眾數三類,本篇針對平均數進行介紹。 Continue reading →

  • 類別資料分析— McNemar 檢定 2016/08/13

    類別資料分析— McNemar 檢定 (Analysis on Categorical Data — McNemar’s Test)
    國立臺灣大學農藝所生物統計組碩士班 賴薇云

    一、前言

    當遇到成對資料時,在連續型資料中有成對樣本 t 檢定可供使用。在類別型資料中,也有檢定可處理成對資料,該檢定就稱為 McNemar 檢定,本篇將作詳細的介紹。 Continue reading →

  • 類別資料分析—費雪精確性檢定 2016/08/12

    類別資料分析—費雪精確性檢定 (Analysis on Categorical Data — Fisher’s Exact Test)
    國立臺灣大學農藝所生物統計組碩士班 賴薇云

    一、費雪精確性檢定

    在卡方檢定中,通常我們都會希望細格的期望次數不能小於 \(5\),否則在 \(H_0\) 下的檢定統計量,其近似卡方分布的效果不佳。若是以上情況發生,通常我們會透過將欄或列合併的方式,或是採用費雪精確性檢定 (Fisher’s exact test)。該檢定應用於 \(2\times 2\) 列聯表(列聯表的定義詳見《類別資料分析-列聯表與獨立性檢定》一文所述),且觀測總數 \(n\) 很小時(通常為小於 \(20\)),例如調查兩種陷阱捕獲兩種不同野兔的數量如下(表一): Continue reading →

  • 卡方分布在Excel的應用(下) 2016/08/06

    卡方分布在Excel的應用(下) (Applications of Chi-squared Test in Excel)
    國立臺灣大學農藝學系 湯育全

    連結:卡方分布在Excel的應用(上)

    例題三、卡方同質性檢定(引用自沈 [ 96 ] 之例題)

    設今有甲、乙、丙三種治療香港腳藥膏,其治療效果如表一。我們想要測驗三種藥膏對治療香港腳的效果是否相同。

    表二、甲乙丙藥膏治療香港腳結果表。(單位:人數)(表格來源:沈 [民 96 ])

    合計
    治癒 24 30 21 75
    沒改善 12 18 10 40
    合計 36 48 31 115

    Continue reading →