Note:

因為blogger會有很多廣告留言,所以我有設留言管制。大家留言留一次就好,只要不是廣告,我都會定期去後檯把留言給撿回來。

造成麻煩還請大家多多見諒。

2014年6月10日 星期二

Simpler than conspiracy (2) --- It's because stats is counterintuitive


讓我們再回到打籃球的故事。

現在我們已經知道在NBA投三分球的得分期望值遠高過兩分球,身為一個即將到任的球隊教練,你當然會把這個資訊牢牢地記在腦中。

結果當你走到球隊練球的球館一看,發現球隊GM給你的一組先發陣容,是由Shaquille O'Neal、Tim Duncan、Blake Griffin、DeAndre Jordan和Rajon Rondo所組成,你會選擇以增加三分球出手次數當作你替球隊增加競爭力的進攻策略嗎?

(替沒看NBA的朋友解說一下:這五位明星球員生涯的三分球命中率都低於30%,最屌的是DeAndre Jordan,他生涯還沒投進過三分球)

有腦子的人,顯然都不會,是吧?

但讓我們假設一下,假設你剛好就是個過往沒看NBA的教練,所以完全不知道這五個人是誰,又很不幸的沒遇上像格主我這麼好心的人,來向你解釋這五個人生涯在三分線外的出手成績有多驚人。你有的就只是一組支持三分球出手得分期望值比兩分球高的數據,這時候會發生什麼事呢?

有一種劇情是,你很可能前半個球季都會堅持你「三分球出手得分期望值比兩分球高」的策略,即使命中率和戰績都慘不忍睹,依舊認為會regress to the mean。這不就是統計數據告訴我們的嗎?

等到你真的發現你這隊真的就沒辦法丟三分球的時候,你可能會氣得把手上支持「三分球出手得分期望值比兩分球高」的數據給撕爛,大罵這一切都是統計學家的陰謀。心理學的研究告訴我們,統計學對於人類的腦子來講,是相當counterintuitive的東西,所以當你的自身經驗與統計數據不符的時候,會選擇相信自身經驗,而不是相信統計數據並嘗試尋找統計上的解釋(例如小樣本極可能取到極端值),也是很正常的事情。

這樣的劇情,其實也常常出現在醫療界。

以前一篇文章提到的多發性硬化症(MS)為例,MS到現在都還是一個無法被治癒的疾病,加上其影響的是中樞神經系統,產生的症狀不但相當嚴重,也會大幅影響病人的生活品質,所以MS療法的開發,一直都是新藥研發界中相當火紅的一個領域。也因為缺乏療法,因此我們對於治療MS的藥,也只能先求有,再求好。

其中一個普遍用來治療MS的藥物- interferon-β,就是這樣的產物。

這個用來減少MS進入relapsing stage次數的第一線用藥,效果還算可以接受,但卻有著讓施打者相當不舒服的副作用,且在極少數的例子當中,會造成肝臟功能的損傷(liver damage)。

更重要的是,根據統計,大約只有70%的人,是所謂的interferon-β responders,也就是說,在早期的MS病人當中,有30%的病人,是無法靠著施打interferon-β來減少relapse次數的。但這30%的病人,並不會對interferon-β所帶來的副作用免疫。

現在,讓我們把自己擺在像FDA這種regulatory agency的位置。

對於一個沒有辦法治癒、很難控制,且市面上缺乏其他能夠有效減輕患者痛苦的藥物的疾病,現在有了個對70%病人有一定程度效果的新藥,其效果雖不讓人滿意,但已經能大幅提升患者的生活品質,在這樣的狀況下,你能不讓這個藥物通過審核上市嗎?

可是對於接受interferon-β治療的病患來說,每個人都是以自己為出發點的一個個體。這時候就不是70%遠大於30%的問題,而是我是不是屬於那30%的問題。更進一步的說好了,就算今天有一個藥物的responsiveness是99%,也不代表我就不會是那個不會對藥物有response的1%。

這些不幸的少數,在接受治療的時候,將會受到不舒服的副作用,卻無法享受藥物帶來的好處。如果更衰一點,是屬於會有類似肝臟受損這樣嚴重副作用,卻一樣對interferon-β沒有response的病人,會覺得這個療法根本是狗屁不通、藥廠陰謀,也是可以讓人理解的。這個,就是從個人觀點出發,和把自己放到統計脈絡下去思考的不同。


同理可證,當你聽到親戚告訴你,他曾經在服用過某個藥物之後,產生強烈的副作用,因此覺得某種藥物很不安全,或著有朋友在生病之後吃了某些藥物,卻沒有好轉,因而告訴你這個藥根本無效,甚至更誇張,當聽到新聞媒體在報導某某人得到癌症之後沒接受治療,跑去環遊世界,沒想到環個一圈回來,癌細胞居然就都消失了,因此告訴你化療其實不比環遊世界好的時候,永遠要記得,這類由主觀經驗當作基柱的anecdotes,其實都是沒有太多意義的。

藥物研發這邊的做法,是儘量由多一點的樣本數去做符合科學方法與統計推論的研究論述,做出來都還會有所偏差,只有單一或少數幾個故事當作推論依據的論述,其可信度大概就和某院長說警察只有對太陽花學運的學生拍肩差不多吧。

喔,對了,這裡還有一個可以和上篇文章做呼應的地方。

看到這裡,也許有些讀者會有疑問:「難道我們不能預先知道是哪30%的病人,不會對interferon-β有response嗎?」如果能夠預先知道,我們不就可以避免這些病人承受沒有意義的副作用?

這絕對是個好問題,也是現代醫學研究非常注重的一個新領域。對於醫藥新知稍有關注的朋友,應該都聽過個人化醫療吧(personalised medicine or individual medicine)?

所謂的個人化醫療,在處理的就是這部分的問題。很可惜的,以前由於科技不夠發達,研究的成果也累積得不夠多,導致我們直到現在才能往這個目標真正邁出步伐。現在在實驗室裡,我們不但可以開始預測哪些病人會對某種藥有response,哪些不會,甚至還可以預測某些病人是否會在服用特定藥物之後產生嚴重的副作用,或著我們可以在你一得到疾病的時候,就預測你的疾病會不會往更嚴重的方向發展(prognosis),因而制定恰當的醫療策略。這些研究成果都在快速的累積當中,在可以預見的將來,也會開始進入臨床測試期。

所以以前我們並非不做,只是我們沒辦法做,或著不知道怎麼做。也就是說,這又是一個"because we didn't konw"的典型例子。


Simpler than conspiracy (1) --- It's because we didn't know


Simpler than conspiracy (3) --- It's because QOL does matter

沒有留言: