變異數

F分布

F分布 (F-distribution)
國立臺灣大學農藝所生物統計組碩士班 顏芷筠

  • 前言

變異數同質性 (homogeneity of variance) 是許多假說檢定法需要遵守的前提假設。舉例來說,為了檢定不同品牌的燈泡的使用壽命是否有顯著的差異,我們從賣場購滿 A、B、C 三種品牌的燈泡各五顆,並實際將所有燈泡點亮、記錄燈泡壽命小時數。這個試驗有三組獨立的樣本、樣本大小各為 \(5\),分別取自 A、B、C 三種品牌的三個母體。我們希望可以從檢定過程中,了解三個品牌燈泡壽命小時數的母體平均數之間是否有顯著差異,常用的方法為變方分析,可是此方法有前提假設如下列三項:

初等的機率論(8)隨機變數及其種種性質(Random Variables and Its properties)

初等的機率論(8)隨機變數及其種種性質
(Elementary Probability Theory-8. Random Variables and Its properties)

國立臺灣大學數學系蔡聰明副教授/國立臺灣大學數學系蔡聰明副教授責任編輯

連結:初等的機率論(7)獨立事件的概念

摘要:本文分別介紹「離散型」與「連續型」機率分佈(probability distribution)中幾個重要的分佈:「二項分佈(binomial distribution)」、「Poisson分佈」、「常態分佈(normal distribution)」,進而導出其期望值與變異數。並將「Markov不等式」與「Chebyshev不等式」以機率的語言重述之。

一個隨機實驗做下來,就有初等機率空間 $$(\Omega,\mathfrak{A},P)$$,這是精煉隨機實驗所得到的原始機率資料。然而,我們有興趣觀測的往往是某個變量 $$X$$,定義在 $$\Omega$$ 上的一個實值函數 $$X:\Omega\rightarrow\mathbb{R}$$。這就是隨機變數的概念,在統計學上又叫做統計變量。$$X$$ 將 $$(\Omega,\mathfrak{A},P)$$ 上的機率資料,重新改訂成方便於使用的資訊。例如丟兩個骰子,我們要觀測「點數和」是多少。在每一賭局中,賭徒要觀察輸贏額。

初等的機率論(4)機率論的甕模型(Urn Model for Probability Theory)

初等的機率論(4)機率論的甕模型
(Elementary Probability Theory-4. Urn Model for Probability Theory)
國立臺灣大學數學系蔡聰明副教授/國立臺灣大學數學系蔡聰明副教授責任編輯

連結:初等的機率論(3)兩個重要的不等式

摘要:本文從「機率論是虛,記述統計是實」的論點出發,以實例引導我們從「記述統計」進入「機率論」的世界。

現在我們先把主題點出來:機率論和記述統計,幾乎完全一樣!只是一虛一實而已。機率論是虛,記述統計是實。

為了說明這一點,我們就想像這種情形:我把去年學生的成績做了完整的記錄,將每一位學生都想像為一個球 $$\omega_k$$,並且寫上該生的分數 $$x_k$$,全部裝到一個甕(urn)$$\Omega$$ 之中,於是有 $$\Omega=\{\omega_1,\omega_2,\dots,\omega_N\}$$,這叫做樣本空間(sample space)。

初等的機率論(3)兩個重要的不等式(Two Important Inequalities)

初等的機率論(3)兩個重要的不等式
(Elementary Probability Theory-3. Two Important Inequalities)

國立臺灣大學數學系蔡聰明副教授/
國立臺灣大學數學系蔡聰明副教授責任編輯

連結:初等的機率論(2)代表值與參差度

摘要:本篇介紹「機率論」裡兩個重要的不等式:「Markov不等式」與「Chebyshev不等式」,讓我們更深入理解如何由「平均」與「標準差」知道資料分佈的狀態。

利用上述記述統計的簡單例子,我們馬上可以導出機率論裡兩個非常重要的不等式:Markov 不等式與 Chebyshev 不等式。它們是推導出(弱)大數法則之根據。

初等的機率論(2)代表值與參差度(Various Means and Dispersion)

初等的機率論(2)代表值與參差度
(Elementary Probability Theory-2. Various Means and Dispersion)
國立臺灣大學數學系蔡聰明副教授/國立臺灣大學數學系蔡聰明副教授責任編輯

連結:初等的機率論(1)母群體與統計變量

摘要:延續上篇的討論,本篇針對「記述統計學」面臨的兩個基本問題,介紹了代表整體數據的「算術平均(arithmetic mean)」、以及衡量代表值好壞的「變異數(variance)」或「標準差(standard deviation)」。

記述統計學最初的問題,可以很具體地來說明。如果校長問我:「他們這次期中考的成績怎麼樣?」,我該怎麼報告?給他整堆數據 $$\{x_1,x_2,\dots,x_N\}$$ 是無用的。

對於學生的家長我要答以他子女的成績就好了。對於校長,個別學生的成績他沒興趣聽,他要知道的是全班的概況,例如最重要卻也是最起碼的兩件事: