抽樣調查(3)以偏概全(Survey sampling-3.Take a part for the whole)

Print Friendly

抽樣調查(3)以偏概全(Survey sampling-3.Take a part for the whole)
國立高雄大學應用數學系黃文璋教授
責任編輯

連結:抽樣調查(2)隨機現象

如前所述,取樣的目的,是為了收集資訊,以做為決策之依據。除非是專制的帝王,或剛愎自用者,否則一般人是不排斥取樣以獲得可供參考的資訊。廣義來說,人們經常在做取樣的工作。有些人偏愛枕邊細語、親信或大老的話,認為那是最該採納的意見。

各級民意代表、人民團體的理監事、學生自治會的幹部等,這類通常是經由普選產生的“代議士”,各自代表某些特定團體表示意見。這當然是枕邊人、親信及大老等型式人物的轉換,是民主社會裡廣被接受的一種制度。

代議士的意見,有時與大眾的意見會有落差。問這是一群特殊的人,並非對每件事物的看法,均與普遍大眾的看法相契合。因此有時要跳過他們,直接訴諸民意。但如第1節所述,很多時候普查並不容易做,只能從母體中取一些樣本做為代表。報上的讀者投書版,電視台及廣播電台的扣應(call in)節目,都是獲取樣本的管道。當然你也立刻看得出來,這種樣本有時是有偏差的,無法過份依賴。

某機構負責考題的研發,找學生測試,以了解某屆考生的能力究竟如何。為了簡便,先依學生程度,大致將全國學校分絞,然後每級學校各挑一所(或若干所)測試。這樣取得的樣本,是否真能做為全國學生能力分佈的依據呢?稍想一下,你大約會說不盡然,因這種分級可能有些粗糙,而且同一所學校,學生程度差異有時也蠻大的。

抽樣調查的精神,簡單講就是以偏概全,以小樣本來了解母體。即從抽取的樣本,對母體做推論(inference)。買水果時,嚐一粒葡萄,便據此判斷整批葡萄的風味。碰到某一高中的幾位學生,由他們的行為,便推斷該校校風大概如何。生活上,我們可說常在做這類以偏概全的事。有時準確,有時誤判。一般而言,除非母體內的元素變異不大,否則取樣要有代表性,且樣本數要夠多,否則樣本與母體的差異可能很大,所做的推論,也就會令人存疑。以偏概全,有如以管窺豹,可能只見“一斑”,也有可能見到的是“一般”。 即“管”也可有如顯微鏡,將全豹看得很清楚。

藉助機率理論,統計學家已發展出不少常用的抽樣方法。事先若有充分的準備,如收集到正確的底冊,良好的問卷設計,精準的抽樣計畫,都有於提高抽樣調查結果之可靠性。只是有時限於時間,及成本的考量,不得不有一些權宜的作法。如何取樣,使所獲結果更具參考價值,乃抽樣調查中一重要的課題。

樣本與母體有時差異不大,有時則會有很大的差異。我們看底下幾個例子。

例1. 被估計一袋中紅球所佔的比例。假設袋中的球,其形狀與重量皆相同。先將袋中的球攪和均勻,然後“隨機”取 $${n}$$ 個球,每次取出後不放回。只要 $${n}$$ 夠大,樣本與母體的差異便可能不太大。設此 $${n}$$ 球中,紅球有 $${a}$$ 個,則 $$\frac{a}{n}$$ 便是全袋中紅球所佔的比例之一很好的估計量(estimator)。

上例中我們提到“隨機”取 $${n}$$ 個球,事實上“隨機取樣”有一些不同意義。直觀而言,隨機取 $${n}$$ 個球,每次取出後不放回,其中的隨機有“均勻”的想法。即樣本(所取出的球)中紅球所佔比例,與母體(全袋中的球)中紅球所佔比例應接近。這種利用“均勻”的概念,以小看大,應用廣泛。

例2. 有時你會看到某種動物只剩多少頭的報導,這是如何算出的?經由“計數法”,也就是捕捉若干頭,做記號後放走,經過一 時間,看再捉到的該種動物中,有幾頭有做記號,並求出比例。依此比例可求出該種動物現存幾頭之估計值。

例如,自某魚池中抓取 $$100$$ 條魚,做記號後放回。數日後又抓了 $$80$$ 條魚,並發現其中有 $$2$$ 條有記號。設魚池中有 $$N$$ 條魚,由式

$${\displaystyle\frac{2}{80} = \frac{100}{n}}$$ ,

解出 $${N}$$ 為 $$4,000$$。即估計魚池中有 $$4,000$$ 條魚。

與例1比較,本例中的估計法有時可能會有不小誤差,問為魚的出現,並無法像球一樣,較易維持均勻性。譬如說曾被捕捉過的魚,可能變得更機靈(或問被捕捉受傷而行動遲緩),因此不太容易(或更容易)再度被捕捉。而且有些魚可能較常出現,有些魚性愛隱藏。此時,這種估計法,使可能造成很大的誤差。甚至若兩次捕捉隔的時間過久,池中魚的數目變化可能也會很大。

例3. 要量測燈泡壽命,取幾個來測試。若燈泡的品質差異不大,則這種由樣本來推估母體,誤差不會過大。但若燈泡的品質差異很大,則如何抽取樣本,便不可輕為之。

調查若與人有關,那將更不容易做。人會改變想法,不見得會與調查者合作,而且不同群體的人,想法差異更是很大。我們來看底下一實例。

2002年11月,英國廣播公司(BBC),對英國境內的 $$100$$ 萬聽眾與觀眾調查,票選出第二次世界大戰期間,領導英國贏得對德國納粹戰爭的首相邱吉爾,為最偉大的英國人,他總共獲得 $$44.7$$ 萬票。隔年8月,又對全球調查。結果邱吉爾的得票為 $$16\%$$,被原本在國內票選中,排名第六的牛頓擠下第一的寶座,成為第二名。

統計結果全球各地的BBC聽眾,出現著的區域性差異。賽普勒斯、愛沙尼亞、荷蘭與印度的BBC聽眾多半將票給牛頓。阿根廷和南非的觀眾則選黛安娜王妃。法國、義大利與前南斯拉夫偏愛莎士比亞。達爾文的得票多半來自德國聽眾。前披頭四合唱團歌手藍儂的票,則主要來自巴西。

由上百萬的聽眾與觀眾來票選,規模可說相當大。兩次票選,第一次排第六的,第二次可排第一;第一次得票 $$44.7\%$$,第二次則僅得 $$16\%$$。各地區的投票行為差異很大,造成針對英國與針對全球聽眾來票選,結果大不相同。對人的調查,可說是最不容易的。有時隨著情況的改變,或某些重大事件的發生,也會影響一些人的想法。問此兩次調查結果有很大差異,其實並不足為奇。 

連結:抽樣調查(4)抽樣誤差

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


+ 9 = 10