其實我覺得中文書名有些誤導,精準預測四個大字會讓人以為這一是本教你如何預測的書。這樣講也沒錯,這本書確實是可以應用在預測上,但更準確的說我認為他是在告訴讀者預測的本質。原文書名其實是:The Sigal and Noise: Why So Many Prediction Fail- but Some Don't。照字面上翻的意思是:訊號和雜訊:為什麼許多預測失敗了但有的卻成功了。不過照著翻好像賣相會比較差(笑)。不過我覺得書名的問題不大,我很推薦這本書,非常值得一讀。
作者本身就是個預測鬼才,玩過德州撲克,也做過棒球預測系統。比較有名的是在自己創的「五三八」網站上預測總統大選,重點是他是預測每個洲的結果。在2008年中了49洲,而2012年更是50洲全數命中。照理說它應該是對預測本身非常有心得也很有信心才是,但在書中他會告訴你完全不是這麼回事
我會說這本書是在講預測的本質是因為他細細的分析得非常多領域的預測。從棒球賽、撲克、西洋棋、氣象、地震到金融風暴和政治選情,可說是包羅萬象。作者非常仔細得探討了各種分析所遭遇挑戰,為什麼有些時後預測可以成功,有些時候卻會一敗塗地。其實這本書所講的道理是有點硬的,不過作者寫得相當有可讀性,不會讓讀者望之卻步。
整本書將近有600多頁,內容可說是非常充實。要在短短一篇心得文中講述明白是不可能的。但就我來說這本書教會了我許多過去不曾仔細思考的重要觀念。預測簡單來說有幾個步驟,首先是資料的收集,再來是模型的建立,最後就是運用前述兩者跑出的結果。看起來很簡單,其實步布都有玄機。
比方說光是資料的取得就會有許多問題,書裡提到一個重要的觀念便是資訊有分訊號跟雜訊。許多失敗的預測就是因為誤把雜訊以為是訊號而做出錯誤的預測,書中提到一個專有名詞叫做「過度配適」,就是誤把雜訊當訊號以為預測出了趨勢。此外資訊的質也是一大學問,比方說書中曾提到光是小數點取到第二位跟第三位,跑出來的氣象預測結果就會完全不同。再比方說地震預測中,許多的地底壓力數據是根本無法取得的,這也是為什麼第地震的預測會如此困難。
再來預測模型的建立也是一大學問,在書中其實氣象已經算是預測科學中成功的範例。或許大家會覺的氣象明明就常失準,但其實長期來說已經有相當大的進步,至少我們對颱風的登陸點已經可以縮小到相當的範圍,而這樣就已經可以對於防災起到極大的作用。氣象本身的模型其實算是相對好建立的,許多的現象背後的科學基礎都以經了解得很完整。然而其他的預測就沒有那麼好運了,像是股市的預測,在模型建立上需要考慮的的問題就相當多,模型的函數非常複雜。也因此股市有許多預測失敗的慘案。
最後是結果,書中有提到其實預測就是一個機率,照理說預測應該是要向選舉那樣附上誤差範圍的。有些事情不是不會發生,只是機率相對低罷了。簡單的來說,任何過於自信的預測有相當的可能性會出錯。但是在結果中表現出不確定性似乎有失專業,這也是許多失敗的預測不願意把實際的誤差顯現出來的原因,卻也因此造成預測與結果相差甚遠。
書中不斷強調預測的不確定性,說明其問題。然而作者並不是在告訴大家不去做預測,事實上在大數據時代我們擁有比過去更多的資源來做預測。在資訊大爆炸的時帶,不去利用就顯得愚蠢了。只是在預測的同時我們也必須知道其風險,並且要能依據現實情況不斷的調整模型,畢竟不可能一次就到位。預測失敗並不可恥,可恥的是不願正視現實去做出改變。作者也提到只要是根據機率做出了選擇,就算結果不好,仍然是好的預測。
總結來說這本書非常得紮實,在看得過程中不時都會有許多的啟發,是近期工具類書籍中相當優質的讀物,推薦給大家。
留言列表