數學 | 科學Online

型 I 錯誤、型 II 錯誤與 p 值

2016/07/17

型 I 錯誤、型 II 錯誤與 p 值(Type I Error, Type II Error, and p-value)
國立臺灣大學農藝所生物統計組碩士班陳丘原

假設檢定是先對母體參數提出假設，然後利用樣本的資訊，再決定是否接受或否決該假設；而在進行假說檢定的決策時，可能會犯兩種錯誤（表一）：

一、型 I 錯誤 (Type I Error)：

若 \(\mathrm{H_0}\)（虛無假說）為真，但結論卻否決 \(\mathrm{H_0}\)，則犯了第一型錯誤，而稱犯第一型錯誤的機率為第一型錯誤率 (Type I Error Rate)，其發生的機率以 \(\alpha\) 表示，或稱顯著水準 (significant level)。

二、型 II 錯誤 (Type II Error)：

若 \(\mathrm{H_1}\)（對立假說）為真，但結論卻接受 \(\mathrm{H_0}\)，則犯了第二型錯誤，而稱犯第二型錯誤的機率為第二型錯誤率 (Type II Error Rate)，其發生的機率以 \(\beta\) 表示。另外，統計上常稱 \(1-\beta\) 為檢定力 (Power)（圖一）。

繼續閱讀→

計數型資料分析—卡方適合度檢定

2016/07/04

沒有迴響

計數型資料分析—卡方適合度檢定 (Categorical Data Analysis — Chi-Square Test of Goodness of Fit)
國立臺灣大學農藝所生物統計組碩士生賴薇云

一、前言

一般經由試驗所獲得的資料型態可分為數種，其中較常見的為連續型資料及計數型資料。連續型資料代表資料的量是可被測量的，數值也不受整數的限制。像是病患的身高、土壤中的重金屬含量……等，均可用連續型資料來呈現。

計數型資料則多以次數的多寡來呈現，例如在淹水處理下，所觀測到的種子發芽次數。連續型資料分析的方包括 T-test、回歸分析等。而卡方檢定則是處理計數型資料的統計方法中較為常見的，常見的檢定依據不同的用途分為 4 種，包括適合度檢定 (test of goodness of fit)、獨立性檢定 (test of independent)、同質性檢定 (test of homogeneity)、McNemar 檢定 (McNemar’s test) 等，本篇主要介紹卡方適合度檢定，其餘檢定將在其他章節介紹。

繼續閱讀→

次數分配與其圖表

2016/06/21

沒有迴響

次數分配與其圖表 (Frequency Distribution and Its Tables and Figures)
國立臺灣大學農藝學系劉素萍

前言

當你收到你的考試成績時，除了知道自己的成績（例如 \(85\) 分）之外，你一定也會對其他同學的成績感到興趣。這時，你可能會想了解，有多少同學跟你一樣得到 \(85\) 分？有多少同學的成績高於 \(85\) 分？又有多少同學的成績是低於 \(85\) 分？如果根據原始的數據來看，你可能無法快速清楚地看出這些訊息。但是，如果我們將全班分數依據大小以及發生的次數 (frequency) 來加以排列，就能夠快速有效率地獲得這些資訊。這種將分數依發生的次數來呈現的表達方式稱為「次數分配」。

繼續閱讀→

資料散佈圖與相關係數

2016/06/15

有 2 則迴響

資料散佈圖與相關係數 (Scatter Diagram and Correlation Coefficient)
國立臺灣大學農藝所生物統計組碩士班顏芷筠

一、前言

許多人會將因果性與相關性混淆，因果有必然性，如果說 A 和 B 有因果性，則當 A 發生時，B 一定會發生，但如果說 A 和 B 有相關性，我們只能說當 A 發生時，B 有較高的發生機會，它們的發生率有著相同的趨勢，如酒測酒精濃度高與交通事故相關性高，人們因酒駕造成交通事故發生的機會較高，但卻不能說二者是因果，畢竟交通事故的原因還可能包括其他如道路狀況、駕駛員技術等。

繼續閱讀→

單變數線性迴歸模式

2016/06/03

沒有迴響

單變數線性迴歸模式 (Simple Linear Regression Model)
國立臺灣大學農藝所生物統計組碩士班顏芷筠

一、前言

簡單迴歸分析 (simple regression analysis) 是建構一適當的數學方程式來表示兩個變數（分別稱為自變數與應變數）之間的關係，此數學方程式即稱為迴歸方程式。其中自變數與應變數或稱為其他別名（表一）。

若應變數和自變數之間有線性的函數關係存在，則此迴歸模式為單變數線性模式 (simple linear regression)；若應變數和自變數之間存在有非線性的函數關係，則為單變數非線性迴歸 (simple nonlinear regression)。

繼續閱讀→

卡方分布以及單一族群變方相等性檢定

2016/05/24

沒有迴響

卡方分布以及單一族群變方相等性檢定 (Chi-square Distribution and Test of Equal Variance on Single Population)
國立臺灣大學農藝所生物統計組碩士班賴薇云

一、前言

統計學家 Karl Pearson 在 1990 年提出了卡方分布，基於卡方分布的重要統計方法主要用於計數型資料的分析，例如卡方適合度檢定、同質性檢定、McNemar 檢定等等。今天要探討的族群變異數檢定也同樣是以卡方分布為基礎，但該檢定的前提假設是母體為服從常態分布的連續型資料。

繼續閱讀→

Z-檢定、t-檢定

2016/05/11

沒有迴響

Z-檢定、t-檢定 (Z-test,Student’s t-test)
國立臺灣大學農藝學系黃纕淇

一、前言

假設今天我們獲得一筆隨機樣本資料，且此樣本取自於未知來源的族群，該如何判斷此樣本是否來自於某一特定的族群？我們通常會用平均值和變異數來表示某一族群的特性，而本篇主要介紹樣本資料是否來自於某一特定平均值族群的檢定，在此會介紹當族群標準差 \(\sigma\) 已知的\(Z\)-檢定及當族群標準差 \(\sigma\) 未知的\(t\)-檢定。

繼續閱讀→

假設檢定

2016/04/29

沒有迴響

假設檢定(Test of Hypothesis)
國立臺灣大學農藝學系副教授劉力瑜

某公司想了解在雞飼料中加入魚骨粉後，雞每月平均產蛋量是否高於原本餵食一般飼料的每月平均產蛋量 \(20\) 個，因此，以加入魚骨粉的飼料餵食 \(100\) 隻雞一段時間後，發現把魚骨粉加入飼料中餵食後，每隻雞每月平均產蛋量為 \(23\) 個。單純從數據來看，\(23 > 20\)，代表加入魚骨粉可提昇雞蛋產量嗎？其實不一定。

繼續閱讀→

F分布

2016/04/08

沒有迴響

F分布 (F-distribution)
國立臺灣大學農藝所生物統計組碩士班顏芷筠

前言

變異數同質性 (homogeneity of variance) 是許多假說檢定法需要遵守的前提假設。舉例來說，為了檢定不同品牌的燈泡的使用壽命是否有顯著的差異，我們從賣場購滿 A、B、C 三種品牌的燈泡各五顆，並實際將所有燈泡點亮、記錄燈泡壽命小時數。這個試驗有三組獨立的樣本、樣本大小各為 \(5\)，分別取自 A、B、C 三種品牌的三個母體。我們希望可以從檢定過程中，了解三個品牌燈泡壽命小時數的母體平均數之間是否有顯著差異，常用的方法為變方分析，可是此方法有前提假設如下列三項：

繼續閱讀→

母體變異數v.s.樣本變異數

2016/03/11

有 3 則迴響

母體變異數(\(\sigma^2\))v.s.樣本變異數(\(s^2\))
國立臺灣大學農藝學系吳博雅

一、前言

每當收集完一筆資料後，可能會非常零亂、複雜，很難看出該筆資料的特性，那我們又如何整理這些資料呢？常常會畫圖表示資料的分布情形，也會計算其平均數 (mean)、中位數 (median)、眾數 (mode)…等來看該筆資料的中心位置，同時，還會計算全距 (range)、變異數 (variance)…等，來看該筆資料的分散程度，如此一來，資料收集者可以簡單敘述該資料的特性，讓有興趣者可以快速了解，取得所需的資訊，而這類的數據分析可統稱為敘述統計學 (Descriptive Statistics)。

繼續閱讀→