淺談分配:甚麼是「機率分配」?

Print Friendly

淺談分配:甚麼是「機率分配」? (Distribution: “What is Probability Distribution” ?)
國立成功大學統計系/東吳大學財務工程與精算數學系專任統計助教 杜柏毅

簡單而言,機率分配 (probability distribution) 是一個「衡量特定事件發生機率」的函數。在真正開始談論機率分配之前,我們必須先對機率函數 (probability function) 有所了解:

假設有一隨實驗 (random experiment),其可能結果之樣本空間為 \(S\)。樣本空間中元素之集合稱為事件 (event),記為 \(C_i\),將樣本空間中所有事件之集合定義為 \(B\)。則機率函數 (probability function) 為 \(B\) 中事件發生的機率。

我們可以把隨機實驗理解為一個工廠,工廠中所有不同的產品即是樣本空間 \(S\)。將不同的產品包裝在一起成為組合商品則是事件 \(C_i\),而所有的組合商品的集合就可以被定義為 \(B\)。機率函數就是 \(B\) 裡面,不同的產品被銷售出去的機率。

舉一個跟機率分配相關的例子:

丟擲一顆公正骰子並觀察其結果,其可能的結果有 \(1,~2,~3,~4,~5,~6\)。由於是公正骰子,我們可知每個結果的發生的可能性均為 \(\frac{1}{6}\)。

以機率函數的定義為基礎,例子中的隨機實驗為「丟擲一顆公正骰子並觀察其結果」,樣本空間 \(S\) 為 \(\{1,~2,~3,~4,~5,~6\}\)。假設有一事件 \(C_1\) 為「丟擲骰子得到的結果為 \(1\)」,則我們用機率函數衡量 \(C_1\) 發生的機率,可得一介於 \(0\) 到 \(1\) 之間的實數  \(\frac{1}{6}\)。

其中,描述所有樣本空間中的樣本點 (sample point) 或是特定種類之事件所發生之機率的函數即稱為機率分配

73316_p1

圖一、丟擲一次公正骰子的機率分配圖。(本文作者杜柏毅繪)

如果將分配中,各個樣本點對於其發生的機率作圖,則可得知分配的形狀,圖一即為丟擲一次公正骰子之結果的機率分配圖,這個分配則是我們之後會提到的一致分配 (uniform distribution) 的離散型,在後面的內容將以長條圖表達離散型分配圖;至於我們常聽說的常態分配,其在圖形上則是「鐘型」的表現,故又被稱為「鐘型分配」。

73316_p2

圖二、丟擲一次公正骰子其結果為1 之機率。(本文作者杜柏毅繪)

藉由圖形,我們可知道事件發生的機率就是機率圖形中曲線下的面積,圖二即為丟擲一次公正骰子,其結果為 \(1\) 之機率在分配圖上的表現;基於三大機率公設,我們也可知道曲線下的面積總和會等於 \(1\),且曲線不會經過第三、第四象限(即事件機率不小於 \(0\))。

在生活中我們也能找到很多隨機試驗,其結果無法用離散的實數來表達。例如某店家開始營業後,等待第一個客人上門發生所需的時間。由於時間是連續的,要將等待的時間轉換為實數表達就無法用離散的實數表達,反之則是用實數區間(\(0\) 到無窮大)來表達(一開門就有客人,開到天荒地老都沒有客人)。此即為連續型的機率分配。

連續型的機率分配能用一條或多條函數來表達。若我們將函數描繪在二維平面上,即為連續型機率分配圖,其函數曲線與 X 軸所夾的面積皆代表該結果發生的機率(圖三)。特別需要注意的是,對連續型的機率分配而言,單點的機率是沒有意義的;相對的,對於連續型機率分配,我們只能針對其結果的某區間討論其發生的機率。

73316_p3

圖三、開店後等待第一個客人上門的機率分配圖。(本文作者杜柏毅繪)

以等待的一個客人上門為例,要計算在「開店後 2 小時 0 分 0 秒時,第一個客人上門」的機率是無意義的(圖三,\(x = 2\) 曲線下面積為 \(0\);可以理解為,要客人剛好在那個時間出現是不可能的)。然而,雖然無法找出單一時間點發生的機率,我們還是可以針對一定的時間區間做討論,例如「在開店後2小時至4小時間,第一個客人上門」的機率即是能夠透過運算而得知的(圖三,曲線下 \(x\) 由 \(2\) 至 \(4\) 的面積大小)。


參考文獻

  1. Hogg, R. V., & Craig, A. T. (1970). introduction to mathematical statistics. 7th Ed. p.11
  2. Hogg, R. V., Tanis, E., & Zimmerman, D. (2014). Probability and statistical inference. 9th Ed. p.49

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


− 9 = 0