大數法則(3)巨數法則(Law of truly large numbers)

Print Friendly

大數法則(3)巨數法則(Law of large numbers-3. Law of truly large numbers)
國立高雄大學應用數學系黃文璋教授/國立高雄大學應用數學系黃文璋教授責任編輯

連結:大數法則(2)極限的定義

摘要:本文舉例說明何謂「巨數法則(law of truly large numbers)」,並強調其與「大數則」之不同。

巨數法則,雖然英文名為 law of truly large numbers,但其實與 law of large numbers 並不太相干。在一般正規的機率論書籍中,不會提到此法則。它主要是出現在通俗性的文章中,有時也被稱為 law of large numbers。我們實在不願稱它為『真大數法則』,只好含混地稱它為巨數法則。在 Diaconis and Mosteller (1989) 一文中,對此法則給出如下定義:

With a large enough sample, any outrageous thing is likely to happen.
(當樣本數夠大,任何聳人聽聞的事,都可能發生)。

數學家 Littlewood(1953) 認為一件事發生的機率若為百萬分之一,便可稱之為令人驚奇(surprising)。若採用此定義,各種令人驚奇的事,可說在世界各地,經常在發生。

譬如說 \(49\) 取 \(6\) 的樂透彩,一張彩券會中頭獎的機率很小,僅 \(\frac{1}{13,983,816}\)。對一特定的人,要中頭獎當然很難,因他不太會買很多很多張。但『有人』中頭獎,就是一常會發生的事件。又如一家庭中有 \(4\) 人生日相同,這當然不容易。若忽略閏年,假設一年有 \(365\) 天,則任 \(4\) 人生日為 \(365\) 天中某一特定的日子之機率為 \((\frac{1}{365})^4\)。因此 \(4\) 人生日相同的機率為 \(\frac{1}{365}^3=\frac{1}{48,627,125}\) 實在很小。但世界人口已超過 \(69.27\) 億(至2011年6月),若有某一家庭中有 \(4\) 人生日相同(注意:這又比限制是父母及 \(2\) 小孩生日相同更容易發生多了),並不該太令人驚訝。

雖與大數法則不同,但由於都涉及大樣本,有些人遂將二者混在一起。如 Shermer (2004,科學人雜誌2004年9月號『奇蹟? 機率?』一文為其中文翻譯(姚若潔譯))一文提到:

A principle of probability called the Law of Large Numbers shows that an event with a low probability of occurrence in a small numb er of trials has a high probability of occurrence in a large numb er of trials. Events with million-to-one odd shapp en 295 times a day in America.
發生機率百萬分之一的奇怪事件,在美國每天可發生 \(295\) 次。這是基於美國有 \(2.95\) 億(\(295\) 百萬)的人。又順便一提,根據美國人口普查局(U.S.Census Bureau) 網頁,至2011年6月,美國人口超過 \(3.11\) 億。

薛莫(Michael Shermer)為 Scientific American 的專欄作家。上述他那篇文章雖然有趣,但對機率的描述,卻不夠精確,恐易引起誤會。

首先,他所引用的不是大數法則,而是巨數法則。其次,他說『在數量樣本很少時,機率很小的事件,在數量樣本較大時,其發生的機率會變高』(英文原意如此,這是科學人的中譯)。這樣講是不對的。應該是說『發生機率很小的事件,若試驗數(或說樣本數)較少時,會有這種事件發生的機率不高;若試驗數(或說樣本數)較大時,會有這種事件發生的機率會變高』。至於單一事件發生的機率,不會隨試驗數之多寡而改變。另外,最後一句話改為『在一個人身上每天發生機率為百萬分之一的怪事件,在美國平均一天可發生 \(295\) 次』比較恰當。

一事件發生的機率 \(p\) 雖然很小,重複觀測 \(n\) 次,假設各事件相互獨立,則 \(n\) 次皆未發生之機率 \((1-p)^n\),隨著 \(n\) 之增大,此機率愈來愈接近 \(0\)。而至少發生一次之機率 \(1-(1-p)^n\) 則逐漸接近 \(1\)。

這也可以解釋,只要觀測數夠多,一聳人聽聞的事件,其發生就不該令人驚訝。更何況世上千奇百怪的事,實在不少。要發生某一令人匪夷所思的事,就更容易了。譬如說,美國有一研究機構,養了一批猴子,每隻發一台打字機。他們每日就是在那裏亂敲,終於有一天,發現某隻猴子敲出一串從華盛頓開始的美國歷任總統的名字。雖然上了頭版新聞,只是機率學家並不會感到驚訝。

讀者可能也會明白了,何以通俗性的文章中,會稱此為 law of truly large numbers 。由於閱讀對象為較一般的民眾,當看到一件很不尋常的事,以『真是夠大的觀測數』來解釋,可能會較易使人覺得原來如此。巨數法則可用來解釋何以生活上處處有巧合(coincidence) 。關於巧合事件之無所不在,可參考黃文璋(2003)第四章『純屬巧合』一文。幾年前曾引起一陣風坡的聖經密碼(The Bible Code)事件,也可以用巨數法則來解釋。可參考Shermer(2003,科學人2003年7月號『聖經裡真的有密碼?』為其中文翻譯(姚若潔譯))一文。

巨數法則雖不難理解,但仍常有人無法正確使用。在『看守台灣季刊』第四卷第二期(2002年夏季號)的『編後語』中有底下一段文字:

就在完成本期彙編時,網路上看到一則新聞(7/9),英國有一對白人夫婦接受人工授精時,結果孕婦生出一對黑人雙胞胎,成為英國首見人工授精搞烏龍案例。為避免出錯,人工授精的過程人分嚴格,每個步驟都會重複檢查,理論上可能會出錯的機率只有百萬分之一。這次不僅出錯,甚至是黑白搞烏龍!這樣的機率可能更低。如此低的機率,怎麼可能發生?
按台北市銀行的公告,樂透彩頭獎的簽中機率大約是 \(525\) 萬分之一。這個簽中的機率更低,低於人工授精出錯機率的五分之一。然而,總會有人簽中!
按台電公告的核電反應爐每年發生重大災變的機率是十萬分之一。這個機率是人工授精的出錯機率的 \(10\),更是簽中頭獎的 \(50\) 多倍。怎麼可能保證不會發生?

該如何解釋呢?首先,發生機率再小的事件,只要機率為正,便都可能發生,並無法保證不會發生。但如前所述,每天有各種事物在進行,發生一件令人覺得離譜、怪誕不經的事,可以說是必然。

對於北銀 \(42\) 取 \(6\) 的樂透彩,一週開獎兩期,每期簽注人數多達幾百萬甚至有幾千萬,有人簽中頭獎,自然不稀奇。那天若有人第二次中頭獎,也不用太驚訝。至於台電公告的核電反應爐,每年發生重大災變的機率是十萬分之一,注意是『每年』。又假設此機率是針對『\(1\) 座』核電反應爐,而台灣目前只有 \(3\) 座核電廠。不提每年 \(3\) 座與一年開獎 \(104\) 期,且每期有幾百萬人簽注之比,而只提 \(525\) 萬(實際是 \(5,245,786\))與 \(10\) 萬之比,真是明察秋毫而不見輿薪。

沒人可保證核電反應爐不會發生災變,雖我們並不清楚十萬分之一的機率是如何求出,及此機率值是否正確。但如果接受台電的數據,則因核電反應爐也有其使用年限,因此在未來十年,雖會繼續產生不少樂透彩頭獎得主,以及發生各種烏龍事件,但台灣 \(3\) 座核電反應爐,在十年內會至少有 \(1\) 座發生災變的機率,仍是不太高。

連結:大數法則(4)弱大數法則


參考文獻:

  1. 黃文璋(1999),數學欣賞。華泰文化事業股份有限公司,台北。
  2. 黃文璋(2003),隨機思考論。華泰文化事業股份有限公司,台北。
  3. 黃文璋(2010),機率論,第二版。華泰文化事業股份有限公司,台北。
  4. Chung K. L. (2001). A Course in Probability Theory, 3rd ed, Academic Press, New York
  5. Diaconis, P. and Mosteller, F. (1989). Method for studying coincidences. Journal of the AmericanStatistical Association, 84, 853-861
  6. Littlewood J.E.(1953). A Mathematican’s Misscellany. Methuen, London.
  7. Renyi, A.(1970). Foundations of Probability . Holden-Day, Inc., San Francisco.
  8. Shermer, M.(2003). Co dified claptrap. Scientific American , June ,288(6), 35.
  9. Shermer, M.(2004). Miracle on probability street. Scientific American , August, 291(2), 32.

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


1 + 9 =