數學

型 I 錯誤、型 II 錯誤與 p 值

型 I 錯誤、型 II 錯誤與 p 值(Type I Error, Type II Error, and p-value)
國立臺灣大學農藝所生物統計組碩士班 陳丘原

假設檢定是先對母體參數提出假設,然後利用樣本的資訊,再決定是否接受或否決該假設;而在進行假說檢定的決策時,可能會犯兩種錯誤(表一):

一、型 I 錯誤 (Type I Error):

若 \(\mathrm{H_0}\)(虛無假說)為真,但結論卻否決 \(\mathrm{H_0}\),則犯了第一型錯誤,而稱犯第一型錯誤的機率為第一型錯誤率 (Type I Error Rate),其發生的機率以 \(\alpha\) 表示,或稱顯著水準 (significant level)。

二、型 II 錯誤 (Type II Error):

若 \(\mathrm{H_1}\)(對立假說)為真,但結論卻接受 \(\mathrm{H_0}\),則犯了第二型錯誤,而稱犯第二型錯誤的機率為第二型錯誤率 (Type II Error Rate),其發生的機率以 \(\beta\) 表示。另外,統計上常稱 \(1-\beta\) 為檢定力 (Power)(圖一)。

計數型資料分析—卡方適合度檢定

計數型資料分析—卡方適合度檢定 (Categorical Data Analysis — Chi-Square Test of Goodness of Fit)
國立臺灣大學農藝所生物統計組碩士生 賴薇云

一、前言

一般經由試驗所獲得的資料型態可分為數種,其中較常見的為連續型資料及計數型資料。連續型資料代表資料的量是可被測量的,數值也不受整數的限制。像是病患的身高、土壤中的重金屬含量……等,均可用連續型資料來呈現。

計數型資料則多以次數的多寡來呈現,例如在淹水處理下,所觀測到的種子發芽次數。連續型資料分析的方包括 T-test、回歸分析等。而卡方檢定則是處理計數型資料的統計方法中較為常見的,常見的檢定依據不同的用途分為 4 種,包括適合度檢定 (test of goodness of fit)、獨立性檢定 (test of independent)、同質性檢定 (test of homogeneity)、McNemar 檢定 (McNemar’s test) 等,本篇主要介紹卡方適合度檢定,其餘檢定將在其他章節介紹。

次數分配與其圖表

次數分配與其圖表 (Frequency Distribution and Its Tables and Figures)
國立臺灣大學農藝學系 劉素萍

前言

當你收到你的考試成績時,除了知道自己的成績(例如  \(85\) 分)之外,你一定也會對其他同學的成績感到興趣。這時,你可能會想了解,有多少同學跟你一樣得到 \(85\) 分?有多少同學的成績高於 \(85\) 分?又有多少同學的成績是低於 \(85\) 分?如果根據原始的數據來看,你可能無法快速清楚地看出這些訊息。但是,如果我們將全班分數依據大小以及發生的次數 (frequency) 來加以排列,就能夠快速有效率地獲得這些資訊。這種將分數依發生的次數來呈現的表達方式稱為「次數分配」。

資料散佈圖與相關係數

資料散佈圖與相關係數 (Scatter Diagram and Correlation Coefficient)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠

一、前言

許多人會將因果性與相關性混淆,因果有必然性,如果說 A 和 B 有因果性,則當 A 發生時,B 一定會發生,但如果說 A 和 B 有相關性,我們只能說當 A 發生時,B 有較高的發生機會,它們的發生率有著相同的趨勢,如酒測酒精濃度高與交通事故相關性高,人們因酒駕造成交通事故發生的機會較高,但卻不能說二者是因果,畢竟交通事故的原因還可能包括其他如道路狀況、駕駛員技術等。

單變數線性迴歸模式

單變數線性迴歸模式 (Simple Linear Regression Model)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠

一、前言

簡單迴歸分析 (simple regression analysis) 是建構一適當的數學方程式來表示兩個變數(分別稱為自變數與應變數)之間的關係,此數學方程式即稱為迴歸方程式。其中自變數與應變數或稱為其他別名(表一)。

若應變數和自變數之間有線性的函數關係存在,則此迴歸模式為單變數線性模式 (simple linear regression);若應變數和自變數之間存在有非線性的函數關係,則為單變數非線性迴歸 (simple nonlinear regression)。

卡方分布以及單一族群變方相等性檢定

卡方分布以及單一族群變方相等性檢定 (Chi-square Distribution and Test of Equal Variance on Single Population)
國立臺灣大學農藝所生物統計組碩士班 賴薇云

一、前言

統計學家 Karl Pearson 在 1990 年提出了卡方分布,基於卡方分布的重要統計方法主要用於計數型資料的分析,例如卡方適合度檢定、同質性檢定、McNemar 檢定等等。今天要探討的族群變異數檢定也同樣是以卡方分布為基礎,但該檢定的前提假設是母體為服從常態分布的連續型資料。

Z-檢定、t-檢定

Z-檢定、t-檢定 (Z-test,Student’s t-test)
國立臺灣大學農藝學系 黃纕淇

一、前言

假設今天我們獲得一筆隨機樣本資料,且此樣本取自於未知來源的族群,該如何判斷此樣本是否來自於某一特定的族群?我們通常會用平均值和變異數來表示某一族群的特性,而本篇主要介紹樣本資料是否來自於某一特定平均值族群的檢定,在此會介紹當族群標準差 \(\sigma\) 已知的\(Z\)-檢定及當族群標準差 \(\sigma\) 未知的\(t\)-檢定。

假設檢定

假設檢定(Test of Hypothesis)
國立臺灣大學農藝學系副教授 劉力瑜

某公司想了解在雞飼料中加入魚骨粉後,雞每月平均產蛋量是否高於原本餵食一般飼料的每月平均產蛋量 \(20\) 個,因此,以加入魚骨粉的飼料餵食 \(100\) 隻雞一段時間後,發現把魚骨粉加入飼料中餵食後,每隻雞每月平均產蛋量為 \(23\) 個。單純從數據來看,\(23 > 20\),代表加入魚骨粉可提昇雞蛋產量嗎?其實不一定。

F分布

F分布 (F-distribution)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠

  • 前言

變異數同質性 (homogeneity of variance) 是許多假說檢定法需要遵守的前提假設。舉例來說,為了檢定不同品牌的燈泡的使用壽命是否有顯著的差異,我們從賣場購滿 A、B、C 三種品牌的燈泡各五顆,並實際將所有燈泡點亮、記錄燈泡壽命小時數。這個試驗有三組獨立的樣本、樣本大小各為 \(5\),分別取自 A、B、C 三種品牌的三個母體。我們希望可以從檢定過程中,了解三個品牌燈泡壽命小時數的母體平均數之間是否有顯著差異,常用的方法為變方分析,可是此方法有前提假設如下列三項:

母體變異數v.s.樣本變異數

母體變異數(\(\sigma^2\))v.s.樣本變異數(\(s^2\))
國立臺灣大學農藝學系 吳博雅

一、前言

每當收集完一筆資料後,可能會非常零亂、複雜,很難看出該筆資料的特性,那我們又如何整理這些資料呢?常常會畫圖表示資料的分布情形,也會計算其平均數 (mean)、中位數 (median)、眾數 (mode)…等來看該筆資料的中心位置,同時,還會計算全距 (range)、變異數 (variance)…等,來看該筆資料的分散程度,如此一來,資料收集者可以簡單敘述該資料的特性,讓有興趣者可以快速了解,取得所需的資訊,而這類的數據分析可統稱為敘述統計學 (Descriptive Statistics)。

Pages