Friday, December 16, 2011

盤子越大,吃得越多?


當同一組數據產生完全相反的結論時……  



美國猶他大學最近發表了一項研究結果:在餐廳用餐時的食量會受到叉子大小的影響。我還沒有仔細閱讀這項研究,但它讓我想起一件事:只要稍微改變一下定義,人們就可以從同一組數據中得出完全相反的結論。

如果這些相互矛盾的結果是人為因素導致,或只是零星的事件,那也就算了,但我們要討論的現象並非如此。當我們在面對相關程度很低的數據時,通常可以 透過巧妙改變類組的定義,來得出假的趨勢和關聯性。最近有一些關於暴力犯罪的研究,就是利用這樣的方法來得出研究人員所希望見到的某些犯罪類型變化。接下 來我要用一個更簡單的例子,來告訴大家這其中的玄機。

前面關於叉子的研究只是一個引子,現在讓我們來看看細微的定義改變如何造成結論的不同。假設有10位客人在自助餐廳用餐,而我們想知道盤子大小對客 人食量的影響。其中三位客人使用小盤子(直徑小於20公分),他們分別吃了90110100公克的食物,平均起來每人食用100公克。另外有四位客人 使用中盤子(直徑介於20~28公分),這些客人分別吃了1807015040公克的食物,平均為每人110公克。

最後的三位客人使用大盤子(大於28公分),每人吃了130110120公克的食物,平均每人120公克。

看到趨勢了嗎?當盤子由小到中到大時,平均食量從100公克增加到110120公克。很不錯的結果吧!

但是請等一下!如果我們稍微把中盤子的定義改成介於22~26公分(小盤子和大盤子的定義也隨著變動),結果會不會改變呢?特別是當這樣的定義改變 會讓兩位客人所屬的組別改變時,結果會變得如何?在重新定義後,吃了180公克食物的客人(他的盤子直徑是21公分)現在被歸類為小盤子組,吃了40公克 食物的客人(他的盤子直徑是27公分)則被歸到了大盤子組。

讓我們再來算一下新的結果。四位(之前只有三位)客人使用小盤子,分別食用了90110100180公克,平均每人120公克。兩位(之前是 四位)客人使用中盤子,分別食用了70150公克,平均每人110公克。四位(之前是兩位)客人使用大盤子,分別食用了40130110120公 克,平均每人100公克。 看到趨勢了嗎?當盤子由小到中到大時,平均食量從120公克減少到110100公克。很不錯的結果!

更值得注意的是,樣本數很少並不是個問題。大樣本數甚至會讓這其中的操弄變得更容易,因為組別的定義改變也將會更簡單。有人想要算算看太陽黑子強度或超級盃的比賽結果嗎?

撰文保羅斯(John Allen Paulos
翻譯/謝伯讓

【欲閱讀更豐富內容,請參閱科學人2011年第11812月號】