抽樣調查(7)調查誤差(Survey sampling-7.Survey errors)

Print Friendly

抽樣調查(7)調查誤差(Survey sampling-7.Survey errors)
國立高雄大學應用數學系黃文璋副教授責任編輯

電訪、面訪及問卷,都是常用的調查方式。由於樣本通常不等於母體,因此會產生所謂抽樣誤差。抽樣誤差可經由精緻的抽樣調查設計而成小。在抽樣調查過程中,尚有一些其他型式的誤差會產生,稱之為非抽樣誤差。這種誤差產生之主因為不回答、不準確的回答,或選擇偏差。

上一回我們已指出不回答的偏差,有時會對調查結果造成很大的影響。回答者的意見,有時不見得能代表那些不回答者。例如,對於考試作弊是否該退學的調查,回收的問卷,有可能以不贊成者居多。因一般人對此問題並非那麼關切,回收的問卷中,可能較多曾因考試作弊被處罰者。

又如,曾有一調查指出,美國高中的生物教師中,有30%相信聖經創世紀的記載,調查者因此大作文章。事實上,他們共發出約20,000份問卷,而回收率僅為1%。而一般而言,相信聖經者,可能較願意回答此份問卷。這種現象很多。如前所述,打電話進扣應節目、主動投書報紙者,不見得能代表大多數人的想法。

再看底下一則報導:

羨慕飛行員的高薪待遇嗎?根攘交通部統計,70%以上的飛行員,認為作息不正常的工作型態,影響家庭生活及社交關係,當中有近90%的飛行員,認為工作會影響個人情睹,值得相關單位重視。

交通部統計處針對國籍航空公司一千八百多名正副駕駛員,進行飛航制度意見調查。回收有效樣本659人, 38.5%飛航國際航線的駕駛員認為,公司安排飛行時間“嚴重影響”家庭生活及社交關係,“有點影響”有45.5%。國內線駕駛員認為嚴重影響家庭生活,及社交關係的比例較低,只有11%。而53.7%認為有點影響。
(92年8月25日中國時報A9版,記者陳如嬌)

如果只看報導的第一段,會看到70%, 90%等很高的比例。只是第二段說明回收的問卷只有三成多,未回收的問卷中,很可能有較高比例是對現況還算滿意者。而回收的問卷中,又分別只有38.5%(國際航線)及11%(國內航線)的駕駛員,認為公司安排的飛行時間,“嚴重影響”家庭生活。因飛行員的工作時間本來就與一般上班族不悶,故選“有點影響”的比例,可以預期不會低。果真如此,國際航線及國內航線,分別有45.5%及53.7%。這些人對工作時間不滿意的感受未必那麼強烈,只是陳述事實,將圈選兩選項的百分比相加,而大做文章,並不見得恰當。

不準確的回答,有時是因答卷者存心不講實話。對於較敏感的問題,如是否曾作弊?是否曾逃稅?是很難期望受訪者願意誠實回答。此情況可藉由隨機回答的技巧(randomized response technique)來解決。

這種技巧就是調查機構先設計二問題,一個是所設問的敏感性的問題,一個是不相干的問題。經由一隨機的實驗,如丟一銅板、丟一骰子、抽一張樸克牌,或自袋中取一球,以決定受訪者回答那一問題。但訪問員並不知道受訪者回答那一問題。
例如,問題一為敏感問題:你是否曾考試作弊過?問題二為:你是否在四月份出生?投擲一公正銅板,若出現正面則回答問題一,否則回答問題二。雖無法由得到的“是”或“否”的答案,獲知究竟是回答第一題獲第二題,但可由回答“是”之比率,來估計曾作弊過之比率。
設p為受訪者曾作弊過之機率,此機率是我們所想估計的。而假設受訪者在四月份出生之機率為1/12。1/12。令$$\lambda$$表任一受訪者回答“是”之機率, $${H}^{c}$$表銅板正面出現之事件, 表反面出現之事件, Y表回答“是”之事件。則

$$\lambda = P(Y) = P(Y|H)P(H)+P(Y|{H}^{c})P({H}^{c})$$

即得 $$p = {2}\lambda – 1/12$$。由受訪者回答”是”之比率$$\hat{\lambda}$$來估計$$\lambda$$, 則可以$$2\hat{\lambda} – 1/12$$來估計$${p}$$。假設實際調查時,得到$$\hat{\lambda} = 0.44$$,則$${p}$$之估計值為0.88 – 1/12。

不準確的回答,有時可能是由於問題沒有定義清楚而產生。例如,關於失業率之調查,可能要先定義清楚何謂失業率?退休人員、學生暑假沒找到打工機會、因照顧小孩而辭去工作的婦女,這些算不算失業?另外, 有些民意調查是在事件發生後立即進行,雖是新聞正熱時,但受訪者有時尚未能形成自己的看法,易受媒體報導的影響;有時則可能對該事件還不太清楚來龍去聽。因此這樣調查所獲得之結論,往往不太能正確反映真實民意。

上一回我們介紹了抽樣過程產生的選擇偏差。此外訪員須確實訪問選出來的樣本,而不可為了方便,隨意替換樣本。例如,該訪問某家庭,因無人在家,遂自做主張訪問有人在的鄰居。如此樣本中,可能會包含過多孩子較多的家庭。因這種家庭較可能有人在家。當訪問的成功與否,是依賴家庭小孩數,其結果很可能使有偏差。

不回答的偏差,可經由再訪(callback)計畫而降低。如果是郵寄問卷的方式,可對未回覆者,再寄一定次數的問卷。如果是電訪或面訪,可在同一週中不同天的不同時段再試。有時附上適當的禮物(或報酬),也可降低不回答率。

相關文章:

1.抽樣調查(1)前言(Survey sampling-1.Introduction)

2.抽樣調查(2)隨機現象(Survey sampling-2.Random phenomenon)

3.抽樣調查(3)以偏概全(Survey sampling-3.Take a part for the whole)

4.抽樣調查(4)抽樣誤差(Survey sampling-4.Sampling biases)

5.抽樣調查(5)如何抽樣(Survey sampling-5.How to take a sample)

6.抽樣調查(6)美國選舉實例探討(Survey sampling-6.A Case study of US Presidential election)

7.抽樣調查(7)調查誤差(Survey sampling-7.Survey errors)

8.抽樣調查(8)問卷設計(Survey sampling-8.Questionnaire design)

9.抽樣調查(9)結語(Survey sampling-9.Conclusions)

 

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


9 + 4 =