抽樣調查（3）以偏概全（Survey sampling-3.Take a part for the whole）

Posted on 2010/10/15 in 數學, 機率統計 with 沒有迴響 4,152 views

抽樣調查（3）以偏概全（Survey sampling-3.Take a part for the whole）
國立高雄大學應用數學系黃文璋教授責任編輯

如前所述，取樣的目的，是為了收集資訊，以做為決策之依據。除非是專制的帝王，或剛愎自用者，否則一般人是不排斥取樣以獲得可供參考的資訊。廣義來說，人們經常在做取樣的工作。有些人偏愛枕邊細語、親信或大老的話，認為那是最該採納的意見。

各級民意代表、人民團體的理監事、學生自治會的幹部等，這類通常是經由普選產生的“代議士”，各自代表某些特定團體表示意見。這當然是枕邊人、親信及大老等型式人物的轉換，是民主社會裡廣被接受的一種制度。

代議士的意見，有時與大眾的意見會有落差。問這是一群特殊的人，並非對每件事物的看法，均與普遍大眾的看法相契合。因此有時要跳過他們，直接訴諸民意。但如第1節所述，很多時候普查並不容易做，只能從母體中取一些樣本做為代表。報上的讀者投書版，電視台及廣播電台的扣應(call in)節目，都是獲取樣本的管道。當然你也立刻看得出來，這種樣本有時是有偏差的，無法過份依賴。

某機構負責考題的研發，找學生測試，以了解某屆考生的能力究竟如何。為了簡便，先依學生程度，大致將全國學校分絞，然後每級學校各挑一所(或若干所)測試。這樣取得的樣本，是否真能做為全國學生能力分佈的依據呢?稍想一下，你大約會說不盡然，因這種分級可能有些粗糙，而且同一所學校，學生程度差異有時也蠻大的。

抽樣調查的精神，簡單講就是以偏概全，以小樣本來了解母體。即從抽取的樣本，對母體做推論(inference)。買水果時，嚐一粒葡萄，便據此判斷整批葡萄的風味。碰到某一高中的幾位學生，由他們的行為，便推斷該校校風大概如何。生活上，我們可說常在做這類以偏概全的事。有時準確，有時誤判。一般而言，除非母體內的元素變異不大，否則取樣要有代表性，且樣本數要夠多，否則樣本與母體的差異可能很大，所做的推論，也就會令人存疑。以偏概全，有如以管窺豹，可能只見“一斑”，也有可能見到的是“一般”。即“管”也可有如顯微鏡，將全豹看得很清楚。

藉助機率理論,統計學家已發展出不少常用的抽樣方法。事先若有充分的準備，如收集到正確的底冊，良好的問卷設計，精準的抽樣計畫，都有於提高抽樣調查結果之可靠性。只是有時限於時間，及成本的考量，不得不有一些權宜的作法。如何取樣，使所獲結果更具參考價值，乃抽樣調查中一重要的課題。

樣本與母體有時差異不大,有時則會有很大的差異。我們看底下幾個例子。

例1. 被估計一袋中紅球所佔的比例。假設袋中的球，其形狀與重量皆相同。先將袋中的球攪和均勻，然後“隨機”取 $${n}$$ 個球，每次取出後不放回。只要 $${n}$$ 夠大，樣本與母體的差異便可能不太大。設此 $${n}$$ 球中，紅球有 $${a}$$ 個，則 $$\frac{a}{n}$$ 便是全袋中紅球所佔的比例之一很好的估計量(estimator)。

上例中我們提到“隨機”取 $${n}$$ 個球，事實上“隨機取樣”有一些不同意義。直觀而言，隨機取 $${n}$$ 個球，每次取出後不放回，其中的隨機有“均勻”的想法。即樣本(所取出的球)中紅球所佔比例，與母體(全袋中的球)中紅球所佔比例應接近。這種利用“均勻”的概念，以小看大，應用廣泛。

例2. 有時你會看到某種動物只剩多少頭的報導，這是如何算出的？經由“計數法”，也就是捕捉若干頭，做記號後放走，經過一時間，看再捉到的該種動物中，有幾頭有做記號，並求出比例。依此比例可求出該種動物現存幾頭之估計值。

例如，自某魚池中抓取 $$100$$ 條魚，做記號後放回。數日後又抓了 $$80$$ 條魚，並發現其中有 $$2$$ 條有記號。設魚池中有 $$N$$ 條魚，由式

$${\displaystyle\frac{2}{80} = \frac{100}{n}}$$ ，

解出 $${N}$$ 為 $$4,000$$。即估計魚池中有 $$4,000$$ 條魚。

與例1比較，本例中的估計法有時可能會有不小誤差，問為魚的出現，並無法像球一樣，較易維持均勻性。譬如說曾被捕捉過的魚，可能變得更機靈(或問被捕捉受傷而行動遲緩)，因此不太容易(或更容易)再度被捕捉。而且有些魚可能較常出現，有些魚性愛隱藏。此時，這種估計法，使可能造成很大的誤差。甚至若兩次捕捉隔的時間過久，池中魚的數目變化可能也會很大。

例3. 要量測燈泡壽命，取幾個來測試。若燈泡的品質差異不大，則這種由樣本來推估母體，誤差不會過大。但若燈泡的品質差異很大，則如何抽取樣本，便不可輕為之。

調查若與人有關，那將更不容易做。人會改變想法，不見得會與調查者合作，而且不同群體的人，想法差異更是很大。我們來看底下一實例。

2002年11月，英國廣播公司(BBC)，對英國境內的 $$100$$ 萬聽眾與觀眾調查，票選出第二次世界大戰期間，領導英國贏得對德國納粹戰爭的首相邱吉爾，為最偉大的英國人，他總共獲得 $$44.7$$ 萬票。隔年8月，又對全球調查。結果邱吉爾的得票為 $$16\%$$，被原本在國內票選中，排名第六的牛頓擠下第一的寶座，成為第二名。

統計結果全球各地的BBC聽眾，出現著的區域性差異。賽普勒斯、愛沙尼亞、荷蘭與印度的BBC聽眾多半將票給牛頓。阿根廷和南非的觀眾則選黛安娜王妃。法國、義大利與前南斯拉夫偏愛莎士比亞。達爾文的得票多半來自德國聽眾。前披頭四合唱團歌手藍儂的票，則主要來自巴西。

由上百萬的聽眾與觀眾來票選，規模可說相當大。兩次票選，第一次排第六的，第二次可排第一；第一次得票 $$44.7\%$$，第二次則僅得 $$16\%$$。各地區的投票行為差異很大，造成針對英國與針對全球聽眾來票選，結果大不相同。對人的調查，可說是最不容易的。有時隨著情況的改變，或某些重大事件的發生，也會影響一些人的想法。問此兩次調查結果有很大差異，其實並不足為奇。

連結：抽樣調查（4）抽樣誤差

Tags: 抽樣調查, 樣本, 母（群）體, 計數法, 隨機

發表迴響 Cancel comment reply