貝氏定理──量化思考的利器

本文的閱讀等級:初級

芝加哥大學商學院教授賽勒 (Richard Thaler) 專事「行為金融學」(behavioral finance) 的研究,過去幾年來他都會對上課的學生提出以下問題:

史蒂芬,30歲,美國人。史蒂芬的一位鄰居這樣描述他:「史蒂芬害羞且內向,總是願意提供幫忙,但對一般大眾或社會議題沒有什麼參與興趣。他的性格柔弱順從,他渴求秩序並講究細節。」請問史蒂芬目前最可能的職業是售貨員或圖書館員?

繼續閱讀下去前,請讀者也提供自己的答案與判斷的依據。

 
毫無疑問,很多人心裡想著:史蒂芬是圖書館員。這不是十分明顯嗎?圖書館員不是都內斂害羞,而售貨員也不是都外向積極嗎?

堅持史蒂芬的職業是圖書館員表示我們是以定性方式思考而非以定量方式思考。

美國有超過一千五百萬名售貨員,但僅有十八萬名圖書館員。如果不考慮史蒂芬的鄰居對他的描述,史蒂芬是售貨員的機率 (概率) 比他是圖書館員的機率高 83 倍!

確實,我們手邊沒有美國勞工統計局的資料,所以無法準確地估計機率比。沒關係,那就從我們生活的經驗來推論,想想看周遭的人正從事何種工作,我們仍確信史蒂芬是圖書館員嗎?按鄰人所述,史蒂芬似乎不適合從事售貨員工作,但那又怎麼樣呢?不適合並不等同不可能。

 
為什麼一個人的主觀意見就能凌駕統計立論呢?最主要的原因是我們缺乏精確的量化思考。

機率學 (而非線性代數) 是影響我們日常生活各個層面最重要的一門數學知識,而機率學裡的貝氏定理 (Bayes’ theorem) 其應用範圍尤其廣闊。貝氏定理是量化思考的一項利器,它告訴我們如何利用新證據修改已經存在的看法。

 
下面我們就使用貝氏定理來分析前述問題。先引入符號:設 S 表示「史蒂芬是售貨員」此事件,L 表示「史蒂芬是圖書館員」此事件,X 表示新證據,亦即鄰人對史蒂芬的種種描述。

先驗機率 (或稱事前機率) 是指不考慮任何 X 證據下得到的機率,史蒂芬是售貨員的先驗機率以 P(S) 表示,他是圖書館員的先驗機率以 P(L) 表示,兩先驗機率比估計為 P(S)/P(L) = 83/1

條件機率 P(X\vert S),也稱為可能性 (或稱似然),是指若史蒂芬是售貨員,他具有 X 條件的機率,而 P(X\vert L) 是指圖書館員具有 X 條件的機率。我們認為圖書館員常是內斂害羞,估計可能性是 P(X\vert L) = 0.8,但售貨員也不全都是外向積極,保守估計售貨員是內斂害羞的可能性是 P(X\vert S) = 0.1

條件機率 P(S\vert X),也稱做後驗機率 (或稱事後機率),是指考慮證據 X 後,史蒂芬是售貨員的機率,而 P(L\vert X) 則表示他是圖書館員的後驗機率。

當心,原本的問題是要考量鄰人的描述,即證據 X,從而推論史蒂芬為售貨員 S 或圖書館員 L 的後驗機率而非可能性。

貝氏定理告訴我們如何由先驗機率和可能性計算後驗機率,如下:

\displaystyle  P(S\vert X) = \frac{P(X\vert S)P(S)}{P(X)}

\displaystyle  P(L\vert X) = \frac{P(X\vert L)P(L)}{P(X)}

P(X)X 證據發生的機率,這個值並不影響我們的判斷,因為重點是要比較兩個後驗機率的大小。將上面二式相除,可得

\displaystyle  \frac{P(S\vert X)}{P(L\vert X)}= \frac{P(X\vert S)}{P(X\vert L)}\frac{P(S)}{P(L)}=\frac{0.1}{0.8}\cdot\frac{83}{1}=10.4

參考了鄰人提供的資訊後,史蒂芬是售貨員的機率比他是圖書館員的機率大 10 倍。

縱使考慮了鄰人對史蒂芬的描述,先驗機率因素還是遠大於可能性因素,因此兩者的淨效果──後驗機率──仍無法扭轉先驗機率佔上風的事實。不幸的是,多數人習慣僅根據可能性來推論,所以他們會得到錯誤的結論。(只有當先驗機率相等時,後驗機率才與可能性有相同的比值。)

 
2002年諾貝爾經濟學獎得主卡內曼 (Daniel Kahneman) 稱此現象為忽略基本率 (base rate),也就是不理會先驗機率。「樂透」是一個典型的例子,如果我告訴大家這是我圈選的六個幸運號碼 (1,2,3,4,5,6),各位恐怕會搖搖頭說道:「你別呆了,不可能開出這種號碼組合!」

不可能是嗎?很抱歉,要我不把實情說出來還真的很難。從 49 個號碼中開出我所圈選的這六個連續號碼的機率和上一期大樂透開出的六個看似隨機的號碼 (13,20,21,24,42,49) 的機率是相同的,當然也和任何一種六個號碼組合的機率相同。

雖然如此,每次聽說身邊的親友在集資購買彩券時,我從來不曾勸阻。畢竟,我們的政府將「樂透」取名為「公益彩券」,不是嗎?

This entry was posted in 無關線代 and tagged , , . Bookmark the permalink.

2 則回應給 貝氏定理──量化思考的利器

  1. pentiumevo 說:

    老師可以考慮出機率光碟,哈哈

  2. 大俠 說:

    不太可能耶, 除非線代光碟先要大賣, 可是…

    這機率不高.

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

你正使用 WordPress.com 帳號留言。 登出 / 變更 )

Twitter picture

你正使用 Twitter 帳號留言。 登出 / 變更 )

Facebook照片

你正使用 Facebook 帳號留言。 登出 / 變更 )

Google+ photo

你正使用 Google+ 帳號留言。 登出 / 變更 )

連結到 %s