初等的機率論(1)母群體與統計變量(Population and Statistical variable)

Print Friendly

初等的機率論(1)母群體與統計變量
(Elementary Probability Theory-1. Population and Statistical variable)
國立臺灣大學數學系蔡聰明副教授/國立臺灣大學數學系蔡聰明副教授責任編輯

摘要:這一系列「初等的機率論」文章共有十篇,本文是第一篇,先從「記述統計學(Descriptive Statistics)」的角度出發,介紹母群體與統計變量的關係。

世界上到處都可以見到隨機現象(random phenomena),所謂隨機現象是指事先說不準會發生什麼結果(outcome)的現象。機率論(Probability theory)就是要定量地來研究隨機現象的一門數學。機率論最早發源於賭局(game of chance),賭徒想要知道輸贏的機率,以及有無必勝法。

機率論的另一個發源地是記述統計學(Descriptive Statistics, 又譯成敘述統計學)。了解記述統計學的概念,對於機率論的學習,大有助益,因為前者是具體的,易懂的,後者是抽象的,虛玄的。由具體走到抽象是一條不錯的道路。

最終,機率論又成為推理統計學的理論基礎。在隨機的說不準中,我們還是要以機率的語言,透過機率法則,定量地來述說我們感興趣的事件之機率。

因此,我們就先從記述統計學談起。

假設我擔任一班微積分課,共有 $$144$$ 位學生,用集合 $$\Omega$$ 表示全班同學:

$$\Omega = \{\omega_1,\omega_2,…,\omega_N\}$$,$$N=144$$

其中 $$\omega_{k}$$ 可以想成第 $$k$$ 號同學。集合 $$\Omega$$ 就是我們要做“統計” 研究的全體對象,稱為母群體(population),千萬不要翻譯成「人口」。

現在考慮某次考試的成績,我們用 $$X$$ 代表成績:

$$X:\Omega\rightarrow \mathbb{R}$$

例如 $$X(\omega_{k})=90$$ 就表示學生 $$\omega_{k}$$ 的成績為 $$90$$ 分。一般而言,我們令

$$X(\omega_1)=x_1,~X(\omega_2)=x_2,\cdots,~X(\omega_N)=x_N$$

所以就有一堆數據:$$\{x_1,x_2,\dots,x_N\}$$,此地 $$N=144$$。我們用 $$X$$ 來代表成績這個「統計變量」。所以,事實上,$$X$$ 是一個映射:$$\omega_{1}\rightarrow x_{1}, \omega_{2}\rightarrow x_{2},\dots , \omega_{N}\rightarrow x_{N}$$;而 $$\{x_1,x_2,\dots,x_N\}$$ 是 $$X$$ 的取值,表示所有的統計數據(statistical data)。

【例1】目前台灣社會的貧富差距越來越大,如果我們想要了解台北市民的收入情形,那麼台北市民就是母群體 $$\Omega$$,統計變量就是收入函數 $$X:\Omega\rightarrow\mathbb{R}$$,例如張三 $$\omega\in\Omega$$ 的收入為 $$5$$ 萬,則 $$X(\omega)=5$$ 萬。

通常因為集合 $$\Omega$$ 的元素太多,要做全數觀測的普查工作太花錢又困難,所以統計學就隨機從 $$\Omega$$ 中抽出一組樣本,例如 $$1000$$ 人,得到收入的數據,用來做「以偏概全」的統計研究,要說明研究結論的好壞就要用到機率論。

【例2】$$311$$ 日本發生大地震,引發海嘯,導致核電廠的災難。接著就引起日本社會開始討論是否要廢核。如果要用統計來研究,日本公民就是母群體 $$\Omega$$,統計變量就是 $$X:\Omega\rightarrow\{$$ 廢核,不廢核,其它 $$\}$$。這也難以普查,只能用抽樣調查或公民投票。只有像某班的考試成績這類問題,$$\Omega$$ 的元素不多,可以全數觀測,然後作成統計圖表,觀看圖表就知道全班概況。

連結:初等的機率論(2)代表值與參差度

參考書目:

  1. William Feller: An Introduction to Probability Theory and its Applications. Vol.1 John-Wiley & Sons, INC. Third Edition, 1967.
  2. Sheldon M. Ross: A First Course in Probability. 8th Edition, Prentice Hall, 2009.
    (這兩本是公認的機率論入門絕佳的書。第一本是經典;第二本是比較晚近寫成的書,經常被拿來當作大學部「初等機率論」這門課的教科書。)
  3. Kai Lai Chung: Elementary Probability Theory. Springer, 2004.
  4. Hugh Gordon: Discrete Probability. Springer, 1997.
  5. Eugene Lukacs: Probability and Mathematical Statistics. Academic Press, 1972.
  6. David Stirzaker: Elementary Probability. Cambridge University Press, 1994.
  7. Jim Pitman: Probability. Springer-Verlag, 1993.
  8. Janos Galambos: Introductory Probability Theory. Marcel Dekker, INC. 1984.

註:通常要講述機率論必須用到「測度積分論」的數學工具,或至少要用到微積分。因此要為一般讀者介紹機率論的讀物誠屬不容易。上述八本書盡量壓低要用到的數學工具,大部分只需排列與組合,只有少部份要用到一點兒微積分。

從科學方法論的觀點來看,機率論與統計學是一體的兩面,機率論是「演繹法」,統計學是「歸納法」。因此,本文的主題雖然是機率論,但是也順便介紹一點點統計學的概念。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


8 − = 6