作者:湯姆.尼克斯(Tom
Nichols)
本書書封由臉譜出版提供
確認偏誤:因為你「早知道」
「確認偏誤」是最為常見,也最討人厭的一種障礙物,動不動就會妨礙具建設性的對談順利進行,而且苦主還不限於專家與素人之間的對談。所謂的確認偏誤,指的是人有一種傾向是會去留意跟我們成見相符的資訊,接納能強化我們固有看法的事實,然後忽視對我們想法構成威脅的資訊。這是每個人都會做的事情,而且我可以跟你打賭,只要你曾經跟任何人為了任何事情起過任何一點爭執,那你一定都曾經用確認偏誤讓對方氣噗噗,包括你,也包括我。
比方說,如果我們認為左撇子代表一個人很邪惡(畢竟英文裡代表邪惡與猙獰的單字之一sinister,其拉丁語的本意就是「左手邊」),那麼每個左撇子的殺人犯就都是你有先見之明的證據。我們會覺得報紙一翻開,全部都是這樣的新聞,畢竟凡有這樣的報導出現,我們絕對不會任其放水流,甚至於我們會刻意去注意每天的媒體中有沒有左撇子犯案。不論再多的右撇子被加入死刑名單,我們對左撇子的成見都不會有所更改。對我們來說,左撇子殺人都是常態,右撇子殺人都是例外。同樣地,若我們親耳聽到過波士頓的駕駛很沒禮貌,那麼未來某日二訪波士頓的時候,我們就會想起那些曾經用喇叭聲嚇過我們或開車切過我們西瓜的粗魯運將。我們會像膝反射似地忽視或遺忘那些讓路給我們或揮手謝過我們的好駕駛。(事實上這點是有紀錄可查的:二○一四年,道路救援業者AutoVantage
將休士頓評為駕駛習慣好壞的倒數第一名,反觀波士頓在全美可是第五好。)
在一九八八年《雨人》(Rain
Man)一片中,患有自閉症的主角雷就是個或許極端了一點,但卻可以完美說明確認偏誤的例子。話說天賦異稟的雷有著一顆像是電腦般的心靈,他可以有如高階處理器一般在短時間內完成複雜的計算,並且像硬碟般儲存大量彼此無關的資料。但身為自閉症的個體,雷無法將這許多資料理出一個頭緒,他分辨不出輕重緩急。所以說每當雷的腦袋記住了一樣事情,這件事情就會變成全世界最重要的東西。
由此當雷跟他的手足兄弟因故得從俄亥俄州飛去加州時,雷便慌張了起來。美國每一家航空業者都曾經在某個點上發生過嚴重的空難,而雷牢記住了每一次空難的日期與死難人數。雷滿腦子都是那些駭人但仍算是例外的空難資料,於是他什麼飛機都不肯上。氣急敗壞的弟弟問雷能信得過哪一家航空公司,結果雷不急不徐地說出了澳洲國航的名字。「澳洲航空,」雷說,「從來沒有墜過機。」當然,澳航不會飛美國的國內線,於是雷跟弟弟只好走陸路,也就是冒險開車穿越遼闊的美國大陸原野,那說真的比坐飛機更危險不知多少倍。但因為雷的「硬碟」裡查無撞車的資料,所以他便欣然接受了長途開車的提議。
我們每個人的心中,都有一個雷。我們會專注在那些讓我們的恐懼或希望得到強化的資料之上。我們會記住那些讓我們印象深刻的悲喜,至於不夠戲劇化的事情則會被我們拋諸腦後。而當在跟人爭吵的時候,或是去徵求專家意見的時候,我們也會明知自己不理性,但卻又常放不下那些記憶中的成見。
在某個程度上,這不是個智商問題,而是個關乎教育的問題。數字、風險與機率本來就會讓一般人一個頭兩個大,而專家與素人間的對話會那麼令人氣餒,最大的問題就出在數學家約翰.艾倫.保羅斯(John
Allen Paulos)口中的這種「數盲」(innumeracy)。對於對坐飛機很危險深信不疑的人來說,每天二十四小時全球無以計數的平安降落,都永遠無法蓋過僅僅一次空難新聞帶來的恐懼。「把宇宙無敵大的分母跟小到幾乎看不到的『之一』放在他們面前,」保羅斯在二○○一年寫道,「數盲者會跳躍式地使出大絕招說:『你怎麼知道我不會是那個之一? 你怎麼知道我不會是那個萬一?』然後好像解開了謎團似地點著頭,一副好像他們看出了什麼你看不出的東西似的。」【註1】
說到用「萬一」來造句或爭辯事情,老往壞處想的人類可說很有創意。時間拉回一九七○年代,我回希臘鄉下去看家族的一個叔叔。這位叔叔是個強悍的運動型硬漢,但他怕坐飛機怕得要死,而不搭飛機,他就沒辦法去倫敦治療重病。為了說服他,我父親搬出了宿命論。我爸說生死有命,而他的大限應該還沒有到。但就跟其他怕飛到無可救藥的朋友一樣,我叔叔也不是吃素的,他搬出了很受「怕飛社團」歡迎的一個理由:「也許,但你怎麼知道機師的大限沒到?」
天底下找不到百分百理性的人,而我們大部分人都害怕把命運交到別人手裡。我叔叔的書讀得不多,他生在希臘鄉下,而且幾乎是人瑞了,而我則受過高等教育,活在二十一世紀,同時對統計學跟歷史也有一定的造詣。但即便是我,也好幾回在飛回普羅維登斯(Providence)【註2】時遇到過在夜裡飛機進場時顛簸不已,當下被安全帶綁在座位上的我也談不上多麼冷靜。此時為了降低自己的緊張,我會去想全世界有多少飛機都在同時進場,我倒楣「中獎」的機率低到如何難以想像。但這麼想的效果也通常是低到不能再低:這時候不論有多少班次的飛機從溫哥華平安飛抵約翰尼斯堡,感覺也跟我毫無關係,我能做的只是緊抓著座椅,感覺著飛機的機腹從羅德島的民宅屋頂劃過去。
一九八○年代初期, 也就是愛滋病疫情的開端, 已故的科幻小說作家麥可. 克萊頓(Michael
Crichton)醫師曾用過一個例子來說明人有多容易相信倒楣的會是自己。愛滋病在當時還是一個謎,而克萊頓醫生有個女性友人為了求取安心,打了通電話給他。但沒想到電話講到最後,這位女士反而更不開心,而惹她生氣的是克萊頓醫師對邏輯信念之堅定:我試著向她解釋風險的概念。主要是最近我發現太多人不了解自己所面對的風險。
我看很多人家裡擺著槍、開車不繫安全帶、吃飯都不怕自己會血管阻塞,抽菸也抽得舒爽自在,然後這些人說自己擔心愛滋病,實在是沒什麼說服力,甚至我覺得這些人不知道是哪根筋不對勁。
「艾倫,妳擔心死於車禍嗎?」
「不會耶,我沒這麼想過。」
「妳擔心出門被人砍嗎?」
「還好耶。」
「既然妳不擔心被車撞、不擔心被殺,那愛滋病妳真的沒什麼好害怕的。」
「多謝,」艾倫嘴上說,但聲音聽來不怎麼開心。但她還是擠出了一句:「我打給你打對了,麥可,你的話讓我放心多了。」【註3】
這話十年之後,愛滋病是怎麼回事比較為人所知了,歇斯底里的人也少了,但新的風險如伊波拉病毒、SARS等流行病又引發了全新的不理性。而且緊張兮兮的那一大群,又全都是那些開車打手機還酒駕的的美國天兵。
還有一點值得注意,那就是這種偏誤幾乎都是單行道。我們只會堅信自己是地獄倒楣鬼,不會幻想自己是萬中無一的幸運兒。買了威力彩,我們會照例做幾秒中獎的白日夢,然後就把彩券放進口袋裡,開始算起何時領薪。沒有人會彩券買完就直奔保時捷經銷商或豪宅房仲。
能把我們制住的,只有不理性的恐懼,至於不理性的樂觀則對我們無甚影響力。這是因為確認偏誤對於人類,可說是一種求生的機制。小幸運來來去去如過眼雲煙,但人死了可就不能復生。不論有多少人搭飛機出遊一路順風,也不管有多少人平安無事地一夜風流,你的大腦都不關心:因為那些人是那些人,你是你。他們的命是他們的,你的命是你的。你的心智在有限或錯誤的資訊引導下,只能盡責地努力降低你死翹翹的風險,即便那風險只是一點點點點⋯⋯。與確認偏誤唱反調的同時,我們是想要去校正人心的一個基本功能—這功能算不上「漏洞」(bug),但它確實是人心的一個特徵。
不論今天引發它的是會危及性命的風險,還是一些令人為難的日常之事,確認偏誤的存在都是因為人活著不能不倚靠我們「早知道」的東西。我們不能每遇到一個問題就把大腦的思緒像黑板上的粉筆字一樣擦掉。記憶不是這麼搞的,要是每天起床後的每件事情都得從小學一年級重新學起,這日子怎麼過得下去。
科學家與學者天天在與確認偏誤角力,對做研究的人而言,確認偏誤是一種職業傷害。學者也是人,他們也得假設一堆事情來設計實驗或解開謎團,而既然有假設,就代表學者已經帶了一些「行李」到研究計畫中。有些事情他們必須猜,有些東西他們得憑直覺,就跟我們一般人一樣,畢竟如果每個新研究都得從「今天之前沒有人知道任何事情,也沒有發生過任何事情」的基礎上做起,也太辛苦了吧。【註4】如何做到「行而後知」或「以行求知」,是任何研究計畫在設計時的共同難題:畢竟我們一定是已經知道了研究的對象存在,否則我們怎麼會知道自己在找什麼?【註5】
在學術訓練或生涯之初,學者們即會認識到這種兩難,而且他們挑戰這種兩難並沒有十足的勝算。確認偏誤一出,再老練的專家都有可能被誤導而判斷錯誤。就以看病為例,醫生有時候會特別「鍾愛」某一類診斷。這類醫生會懷疑病人已經有某些症狀,然後看診時就會專門去找相關的證據,至於其他傷病的特徵,則會在過程中遭到他們的忽視,如美劇《怪醫豪斯》(Dr.
House)的某一集裡,豪斯醫生就跟他帶的實習醫生說:「這絕對不是狼瘡。」而導演埋這樣的伏筆,自然是要讓豪斯這位目空一切的怪醫吃鱉一次。果然豪斯在這一集裡得反躬自省,才能發現這個病人好死不死,還真的得的就是狼瘡。雖然每個研究者都聽過一句話叫做「陰性的結果也是一種結果」,但自己一開始的假設被否定,任誰都不會感覺開心。
就因為如此,二○一四年的一項研究出了大包。該項研究的主題是公眾對同性婚姻所抱持的態度,結果進行該研究的一名研究生宣稱他發現了統計上無懈可擊的證據證明反同婚者在與同性戀者交談之後,其改變想法的機率便會提高。這名研究生的發現獲得了哥倫比亞大學一名資深師資成員的背書,事實上那名教授還簽名成為了該項研究的共同作者。這項研究成果若是為真,那可真的是一項偉大的發現,因為這等於是證明了理性的個體可以被說服放棄恐同。
這個研究結果看似美好,但有一個小問題是雄心萬丈的年輕研究生竄改了資料。他在報告中用做原始資料來進行分析的對話,根本是子虛烏有,從頭到尾沒有發生過。當與研究無關的第三者檢視過報告,提出了質疑之後,哥倫比亞大學的那名教授撤下了論文,原本要在普林斯頓大學展開教職生涯、眼看著前程似錦的年輕學者,則轉瞬間成了待業的陽春博士生。
師長與審稿者理應對學生的研究過程有所掌握,何以他們會沒能在第一時間發現造假呢?其實答案很簡單,就是確認偏誤搞的鬼。根據記者瑪麗亞.康尼可娃(Maria
Konnikova)後來在《紐約客》上刊出的報導,該名博士生的指導老師坦承他情感上想要相信學生拿出的東西。事實上他與其他學者都衷心希望這項研究的成果為真,所以他們質疑其研究方法的力道就弱了。「簡單講,確認偏誤讓這研究孱弱的根基躲過了糾察的眼睛,畢竟確認偏誤在社會議題上尤其有『發揮』的餘地。」康尼可娃在整起烏龍的回顧中如此寫道。【註6】但到了最後,也是「這項研究所引發的熱情,導致了假資料一事紙包不住火」,主要是有不少學者想要進行後續的延伸研究,結果才在深究原始研究的細節時發現了其夢幻的結論,原來真的只是「幻夢一場」。
這就是為什麼科學家會盡可能反覆進行同一項實驗來確認無誤,並且將結果送交其他人來進行所謂的「同儕審查」(peer
review)。這個同儕審查的過程在正常情況下,會由當事人專家的同僚來擔任用心良善但標準嚴格的找碴專家。這通常會在一個雙盲的條件下進行,意思是研究的作者跟進行裁判的同僚,雙方都不會知道對方的身分,其目的在於避免私人感情或機構效應影響到審查的公正性。
同儕審查是一個極具價值的過程。再怎麼坦蕩蕩與高度自律的學者或研究人員,都需要與研究成敗比較沒有利害關係的人帶著他們去與現實對質,這會是一種必要的建言(本書的提案也經過同儕審查:這並不代表審閱的學者同意書中的所有觀點,但他們會按照請求去評估書中的論述,並相應提出各種反對與改善的意見)。能擔任這種吹哨者的,通常是資深的專家,主要是找出證據來質疑、挑戰,甚至推翻假說的能力,並非一蹴可及。學者與研究者得長年投入心力,才能讓這種能力成為他們核心的技藝。
這類同儕審查與修改,素人是完全無感的,理由是這些過程都發生在成品推出到市場中之前。一般人會意識到這些過程的存在,只有在事情出了包的時候,而審查過程一旦出包,那通常都是「特大包」。原本應該要讓專家得以為品質背書的偉大事業,會轉瞬變質為造假、私相授受、尋仇、照顧自己人,乃至於其他不堪聞問的人類劣行。以上述的同婚研究為例,系統最終還是揭穿了其詐騙的本質,所以監督機制的效果還是在的,只不過時間上沒來得及阻止論文出版。
但出了學術圈,爭議之事就沒有這種外部的審查機制了。所謂的事實就像只是招之即來,揮之即去,只圖當下方便的塑膠袋,由此確認偏誤會讓想要以理服人的論辯變得寸步難行,因為確認偏誤會衍生出「無法證其為偽」的主張與理論—也就是無法推翻的主觀看法。確認偏誤的本質就是排斥或無視所有與自己意見相左的證據,由此我的證據是證據,你的證據頂多是個案,甚至是誤會。遇到這種兵,秀才自然有理說不清,兵對自己的意見有絕對的自信。
這裡有另外一個問題是,多數素人都沒有學過,或學過而忘記了「科學方法」的基本概念。科學方法的基本就是一套步驟,這套步驟會帶著人從一個大方向的問題出發,然後形成假說,開始測試,最後進行分析。不少人一天到晚掛在嘴上的「證據」二字,其實都沒有嚴謹到可以擔綱證據一職。一般人在對話中所提到的「證據」,其實只是「我覺得對的事情或東西」,至於真正意義的證據,應該要是「由公認原則測試過,真實性得到確認的事情」。
聽到我這麼說,素人們可以能會抗議說這都是學者在用術語嚇唬人。他們會說自己只是尋常百姓,誰用得到那麼許多學者等級的素養與自律? 我們有常識不就夠了嗎?人活著要不要那麼累啊?
多數人在多數狀況下,確實用不上各種學術圈的機制。在日常生活中,常識確實是我們的好朋友,也確實比學術界刻意複雜的「官方說法」來得實用。像是車輛在豪雨中要達到何種速度,輪胎的抓地力才會減退到開始打滑,我們真的不需要套數學公式把答案算出來,我們只要按照常識去定期換輪胎,然後下雨天要開慢一點就好。
只不過遇到有複雜點的問題要解決之時,常識就可能不敷使用了。因果關係、證據性質、統計頻率,都不是靠常識可以越級打怪成功的東西。許多研究課題在棘手之餘,都經常在背後存有一個反直覺的答案,而既然反直覺,當然也會與常識格格不入(畢竟我們的祖先就是看了一眼天上,就覺得太陽繞著地球轉,這就是常識的結論)。常識這種很直觀、很單純的工具,有時候會扯我們後腿,讓我們被大錯小錯牽著鼻子走,而這也就是何以即便是雞毛蒜皮的事情,比方說迷信與民間智慧,專家與素人都可以各說各話、雞同鴨講。
【註1】John
Allen Paulos, Innumeracy: Mathematical Illiteracy and Its Consequences (New
York: Hill and Wang, 2001),
9.
【註2】羅德島州的首府。
【註3】Michael
Crichton, “Panic in the Sheets,” Playboy, December 1991; archived at
MichaelCrichton.com.
【註4】統計學裡有一個完整的主題叫做「貝氏分析」(Bayesian
analysis),其對應的就是本書在此提出的問題,其中貝氏指的是十八世紀的英國數學家湯瑪斯.貝葉斯(Thomas
Bayes)。
【註5】社會學者對於這個問題的認知,絲毫不遜於其他領域的專家。見Charles
O. Jones, “Doing before Knowing: Concept Development in Political Research,”
American Journal of Political Science 18(1),
February 1974.
【註6】Maria
Konnikova, “How a Gay-Marriage Study Went Wrong,” New Yorker online, May 22,
2015.
本文由臉譜出版授權刊登
沒有留言:
張貼留言