次數分配與其圖表

Print Friendly

次數分配與其圖表 (Frequency Distribution and Its Tables and Figures)
國立臺灣大學農藝學系 劉素萍

前言

當你收到你的考試成績時,除了知道自己的成績(例如  \(85\) 分)之外,你一定也會對其他同學的成績感到興趣。這時,你可能會想了解,有多少同學跟你一樣得到 \(85\) 分?有多少同學的成績高於 \(85\) 分?又有多少同學的成績是低於 \(85\) 分?如果根據原始的數據來看,你可能無法快速清楚地看出這些訊息。但是,如果我們將全班分數依據大小以及發生的次數 (frequency) 來加以排列,就能夠快速有效率地獲得這些資訊。這種將分數依發生的次數來呈現的表達方式稱為「次數分配」。

未分組的次數分配表

首先,讓我們來了解未分組的次數分配表如何使用。如果我們將原始的分數(如表一)依未分組「次數分配」的方式加以整理(分數依大小以及發生的次數排列),這些分數資料就會變得較有意義(如表二)。我們很容易看出有 \(2\) 個人的分數是 \(85\) 分。而且,透過適當的累加次數,可以看出有 \(9\) 個人的分數高於 \(85\) 分,而有 \(19\) 個人的分數低於 \(85\) 分。除此之外,以「次數分配」的方式來呈現資料,可以讓我們易於觀察分數分布的範圍。從考試的成績來看,最高分是 \(100\) 分,最低分是 \(55\) 分,全班成績分布於 \(55\) 分到 \(100\) 分之間。

72882_c1

表一、考試成績 \((N = 30)\)。
(表格來源:本文作者劉素萍製)

72882_c2

表二、以未分組的次數分配來呈現考試成績 \((N = 30)\)。
(表格來源:本文作者劉素萍製)

分組的次數分配表

當有一份數字資料其分布的範圍很廣,例如全班同學的考試成績。若我們將每一個分數都列出來,就會產生很多次數 (frequency) 為 ” \(0\) ” 的情況(如表二),這樣我們很難看出成績分布的集中趨勢。因此,在這種情況下,我們常常會將分數依一定的間距歸類為幾個組別,並且以「分組的次數分配」來呈現(如表三)。在「分組的次數分配表」中,各分組的間距稱為「組距」 (class interval)。組距大小的選擇,是將資料分組時必須考量的重點。因為原始資料分組整併之後,必定會有一些訊息遺失。若是組距太大,就會遺失較多的訊息,降低資訊的精確度。組距太小,則會產生次數為 ” \(0\) ” 的情況。因此選擇一個適當的組距,才能獲得較好的分組結果。

72882_c3

表三、以分組的次數分配來呈現考試成績 \((N = 30)\)。
(表格來源:本文作者劉素萍製)

建立分組的次數分配表有下列幾個步驟,我們以考試成績的例子來說明:

  1. 計算原始分數的全距。(最高分 – 最低分 \(= 100-51=49\))
  2. 決定組距。(全距/組數 \(=49\div 5\approx 10\))
  3. 列出每組的上下限,第一組必須包含最小值。 \((51\sim60,~61\sim70,~71\sim80,~81\sim90,~91\sim100)\)

累計每組的次數,完成分組的次數分配表。(如表三)

相對次數 (relative frequency)、累計次數 (cumulative frequency) 與累計百分比 (cumulative percentage)

除了使用「次數分配」的表達方式外,我們也常常使用「相對次數」、「累計次數」以及「累計百分比」來呈現分組的資料(如表四)。「相對次數」是指各組發生的次數佔所有次數的比例;「累計次數」是指落在每組真實上限之下所有次數的和;「累計百分比」則是指落在每組真實上限之下所有次數的百分比和。

72882_c4

表四、以相對次數、累積次數與累積百分比來呈現考試成績 \((N=30)\)。
(表格來源:本文作者劉素萍製)

繪製次數分配的統計圖

類別變數或次序變數的統計資料一般可用「長條圖」 (Bar plot) 來呈現(圖一)。長條圖中各個長條互相不能重疊或相連,圖中的每一長條分別代表一種分類的資料(如血型 A 型、B 型、O 型、AB 型),高度則是代表分類資料的次數。

72882_p1

圖一、各血型人數統計的長條圖。
(本文作者劉素萍繪)

等距變數或是比率變數的統計資料,則應使用「直方圖」 (Histogram) 來呈現(圖二)。直方圖是依次數分配表中的組距,將各組依序繪製於橫軸上,因此每一長條彼此相連沒有間距,而各長條的高度則是代表各組的次數。習慣上會在橫軸上標示出各組的組中點。

72882_p2

圖二、考試成績分配的直方圖。
(本文作者劉素萍繪)

「多邊圖」 (Polygon) 也可用來呈現等距變數或是比率變數的統計資料(圖三)。多邊圖是以點來標示各組次數,再以直線將各點連接起來形成一個多邊形。研究者想比較多個分配的圖形時,可使用多邊圖。

72882_p3

圖三、考試成績分配的多邊圖。
(本文作者劉素萍繪)


參考文獻

  1. 沈明來 (2014)。生物統計學入門(第六版)。九州出版社。
  2. Ott, L. (1993). An introduction to statistical methods and data analysis (4th ed.). Belmont, Calif.: Duxbury Press.
  3. Pagano, R. R. (2010). Understanding statistics in the behavioral sciences (9th ed.). Belmont, CA: Wadsworth/Cengage Learning.

 

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


− 9 = 0