Note:

因為blogger會有很多廣告留言,所以我有設留言管制。大家留言留一次就好,只要不是廣告,我都會定期去後檯把留言給撿回來。

造成麻煩還請大家多多見諒。

2013年8月21日 星期三

樣本夠大不夠大?

最近因為農委會說要測試狂犬病病毒(rabies virus)對狗的傳染力強不強,因此要用米格魯(beagle)做動物實驗,在網路上引起軒然大波,各種良莠不齊的正反意見蜂擁而至。其中,有一派反對的說法,指稱農委會只用14隻米格魯,樣本數太少,恐怕證明不了什麼事情。

這一類說法的精髓,可由臺大葉立森教授以下的說法做個總結:

"葉力森說,就算這14隻狗不會感染,也不代表病毒不會感染狗,因為實驗的數量不夠大;若要真的做實驗證明,至少需要上百隻的狗"(中央社,新聞常常會被砍掉,以下截圖為證)




葉力森教授的說法,整體來說方向是對的,但實際上的統計內涵卻是相當不精確的,這篇文章將針對這部分做一點處理。

在報導裡,葉教授提到了實驗數量不夠大的問題。這個問題,用比較統計的名詞來說,就是樣本數(sample size)不夠。

樣本數不夠會帶來什麼問題呢?

第一個問題,是你取到的樣本可能不夠俱有代表性(representativeness)。舉例來說,假設今天你從下面A和B兩個各有10個數字的母體(population)隨機抽個一個數字當作樣本(sample)來作比較:




由A和B的數據中,你可以很輕易地判斷A所含有的樣本的平均值(average/mean)應該會遠低於B。但如果今天你只取樣(smapling)了兩個樣本,在A母體中取到10和7,而在B中也取到10和7,那在不知道母體的情況下,你就會做出A和B的平均沒有差異這樣的結論。

是以,當你的樣本數太小,你取來做significant test的樣本,很可能並不會反應出整個母體的情況,也就是你的data representativeness會不夠,像是瞎子摸象那樣。

接著,我們把這個超簡化的例子稍稍擴大。

假設我們現在有兩個呈常態分佈(normally distributed)的母體。

常態分佈的圖形長這樣(wiki):




X軸的μ是平均,σ指得則是標準差(standard deviation)。這裡我們先不要太在意標準差的定義,只要記得他是data在分佈上是向平均集中靠攏,還是比較不集中的一個變異度(variability)指標。Y軸在wiki這裡是用百分比來表示,或著你也可以用「數量」去理解,越高,就代表累積的數量越多。

以一個常態分佈的母體來說,越靠近平均的data數量會越多,反之,越遠離平均的data在數目上就會越少。所以你可以看到,在離平均一個標準差(μ±σ)的距離內,就包含了超過68%的樣本數。

現在,讓我們回到前面說的兩個常態分佈母體那個例子。假設這兩個母體長這樣:




由圖中你可以看到這兩個母體重複的部分很少,就只有紅色箭頭指的那一塊而已。

但是,如果你在取樣時只取非常少的樣本數,且不幸的,這些樣本剛好都來自紅色的那一塊,那你就很可能會做出這兩個族群很可能是同一個族群的錯誤判斷。

但是當你取的樣本數越來越多,你的圖形就越會還原成母體的樣子。當你從兩個母體取來的樣本數趨向於無限大時,你用取樣樣本做出來的圖,就會非常非常像母體本來的樣子,這時候,你就可以窺得全豹,知道原來左邊和右邊這兩個呈現常態分佈的母體原來差得這麼多。

同理,當你取的兩組樣本其實是來自於同一個母體,但你取的樣本數很少,且剛好來自常態分佈的左右兩端時(例如來自下圖紅箭頭部分),你很可能就會誤判說你取得的兩組樣本是來自不同的母體。




上面這個圖,也可以部分說明我們在做臨床測試時,為什麼取樣偏差(sampling bias),會導致significant test做出來不具代表性的原因。當你的取樣有偏差時,你看到的顯著差異,很可能是來自於你樣本本身的內在差異(intrinsic difference),而不是來自你給的treatment造成的差異。而當樣本數過小時,這樣瞎子摸象,你摸耳朵我摸鼻子的狀況,就很容易發生。




對這部分有了基本概念之後,接下來,讓我們進一步思考下一個問題:【既然足夠的樣本數這麼重要,那麼我們要怎麼知道多大的樣本數是足夠的呢?】

在資源不受限的理想世界中,當然我們會說樣本數越接近母體數,或著越接近無限大越好。可是這在現實世界中往往是不可能達成的,一般來說,即使是phase III的臨床測試,能夠有幾千人參加,就已經很不得了了。而我們在實驗室做研究,也不可能為了拿一個數據,就做到幾百萬隻老鼠。

因此,統計學家們就發明了一個辦法,讓我們可以用統計理論和數學模型去計算到底多大的樣本數,可以讓我們在做significant test時,給我們一個較為可信的答案(reliable answer)。

而在我們能知道怎樣的樣本數可以給比較可信的答案前,我們還得先定義「可信度」(reliability),這樣我們才會有一個共同的比較基準去做判斷。

在這裡,統計學家定義了一個叫做power(中文不知道)的名詞,用來檢驗可信度。Power的精確定義會用到很多統計的詞和理論,這裡為了讓大家不被這些專有名詞搞昏頭,下面我舉一個例子來說明power的意義。

假設今天有A和B兩個母體,我們分別對兩個母體做取樣,得到M和N兩組data sets,取樣出來的數據平均之後分別得到X和Y兩個數值。X和Y是來自兩個不同的母體,且他們兩個數值間,是真的存在著顯著差異的(genuine difference do exist)。然後我們用significant test去測試X和Y這兩個平均值,發現這個significant test有80%的機率可以顯示X和Y是來自不同母體,也就是X和Y間有統計上的顯著差異(statistical significance),這時候我們就說在這個情況下,這個significant test的power是80%。

一般來說,會影響power高低(或說影響我們得到顯著差異結果的機率)的因子包含以下幾個:

1) 樣本數大小,樣本數越大,得到顯著差異的機會就越高,

2) X和Y之間差異的大小,差異越大,得到顯著差異的機會就越高,

3) M和N本身各自含有的樣本變異度(也就是前面提過的variability)有多高。變異度越高,得到顯著差異的機會就越低。

如果我們把power想成會被這三個因子影響的函數,譬如說,把它想像成是一個類似Power=aX+bY+cZ的關係式,X、Y、Z分別代表上面1)、2)、3)寫的那三個因子,那你應該可以推論出,如果我們固定其中任意三個條件,就可以得到第四個條件的數值。

同樣的道理,如果今天我們知道我們的樣本數大小、知道X和Y的差異,知道M和N各自的變異度,那麼我們就可以計算出power。

講了那麼多關於power的意義,但前面我說了,我們通常想要知道的問題是:「樣本數要多大,我們的significant test才會給出一個可信的結果」,所以,我們真正關心的,並不是power,而是在給定一個power的機率下,我們要多少樣本數,才能得到這個power。

這其實也不難,我們只要把上面那個類似函數的比喻換個角度想就可以了。

假設今天我們要用一個significant test去測試X和Y,然後我們想要達到90%的power,在知道其他兩個條件的情況下,我們就可以算出來要達到這個90% power,需要的樣本數有多大(也就是在給定條件下,如果顯著差異真的存在,用這個significant test做100,有90次顯著差異會被抓出來)下面順便附上我最佩服的統計學家給的說法讓大家參考:

"Informally, we can interpret the phrase “90% power” to mean that, in the long run, if we calculate sample sizes using these methods, and our assumptions are correct, about 90% of the trials we run will give a statistically significant result.
--- Dr. Les Huson, Imperial College London. 



問題來了。

讓我們思考一下下面這個狀況:

現在,我想要做一個研究,在這個研究裡,我想用significant test K去比較兩個取樣組別A和B得到的平均值X和Y,他們之間的差值是否達到統計上的顯著差異。

我希望能夠達到80%的power,也就是如果X和Y間的差值真的有達到顯著差異,我用K test做100次,有80次可以正確的把這個顯著差異給抓出來。

現在我定好我要達到的power了,接下來,我只要知道X和Y差多少,以及A和B的變異度,我就可以輕易的算出我取樣時要取多少樣本數,才會達到80%的power。

可是我都還沒開始取樣,沒有做實驗,我怎麼會知道X和Y差異,以及A和B兩組data sets的變異度呢?如果我一開始就知道這些事情,那我幹麼還做實驗呢?

很難懂嗎?讓我們把它放到現實情況下去想一想。

譬如我們現在要測試狂犬病病毒對狗的致病力,用米格魯作實驗,一組用來打病毒,一組不打當control。現在我想算這個實驗要達成90% power需要多少隻米格魯,而我要算出這個,就得知道打不打病毒的這兩組差異會是多少,然後這兩組中這每隻米格魯對病毒的反應會差多少。

可是這不就是我做實驗知道的事情嗎?如果我有辦法事就先知道這些資訊,那我幹麼還做實驗?

這就是power有趣的地方。你用來計算樣本數要多大才會讓結果有足夠信賴度的方法,需要兩個你不先做實驗沒辦法知道的條件。

所以,通常我們只能用猜的,我們對可能的差異大小和變異度做一些初步的假設(preliminary assumptions),然後算出在這樣的假設下,要多少樣本,才可以達到我們想要得到的power。這些假設如果是對的,那我們的power就會如同預期。因此,你的假設怎麼做,做得離實際情況接不接近,就很重要。

另外,我們使用來計算樣本數,把power和樣本數間關係建立起來的數學模型(mathematical model),也需要一些假設,這些假設也有可能不是正確的。是以,在臨床測試上,我們常常會說,關於樣本數大小的計算,其實比較接近一種藝術,而不是一種科學(more of an art than a science)。

那我們在臨床測驗上要怎麼處理這個很可能是用錯誤假設算出來的錯誤樣本數大小呢?我們把握的原則是,能夠在做得到的情況下讓樣本數越大,我們能用significant test抓出真正存在的顯著差異的機會就越高,所以能讓越多人參加臨床測試越好。這也是近年phase III臨床測試的規模越來越大的其中一個關鍵因素。

接下來,在回去檢視葉教授那句話之前,還有一件事情我要補充一下。很多人都把樣本數不夠大這件事情看得非常嚴重(一般來說我們會把power設在80%-90%之間,所謂的夠大,就是你的樣本數可以達到這個程度的power),但實際上,即使是在人類的臨床測試中,樣本數的大小都不必真正達到統計上的意義(does not have to be statistically justified),這並不是一個「法律上必須達成」的條件(not a legal requirement)。雖然像ICH之類的機構會建議你在能夠辦到的情況下盡量達到,但在現實中往往會有很多情況讓你無法真正達成這個數量,而在這種情況下死守一個很可能因為假設不精準導致計算結果也不精確的樣本數,顯然不是一個非常聰明的辦法。還有另外一點是,power和樣本數的關係通常會呈現像是下圖這樣的狀況(X軸是樣本數大小,Y軸是power):




也就是說,樣本數大到一個程度之後,再往上增加,power的變化就很小了(我們稱之為達到plateau)。所以,樣本數大到一個程度之後,再去追求更大的樣本數,並不是一個太划算的事情,也因此,即使是在資源相對不受限,增加樣本數的困難度也不高的情況下,我們對於樣本數的要求,通常也是希望增加到進入plateau之後就可以停了的程度。




對這些事情都有一些基本的瞭解之後,我們就可以回頭檢視葉教授的論點:「就算這14隻狗不會感染,也不代表病毒不會感染狗,因為實驗的數量不夠大;若要真的做實驗證明,至少需要上百隻的狗

為什麼我會說葉教授的論點是「方向對但是統計概念上不精確呢?」

首先,在大方向上,我想葉教授希望表達的是樣本數不夠,很可能即使真的有顯著差異存在,我們用的significant test也抓不出來。譬如power只有20%,那就用significant test做100次,就會有80次抓不出來。所以即使我們用significant test做出來的結果是「無顯著差異」,很可能其實只是因為power太低,significant test沒有抓出來而已。

但是如果我們仔細一點去想,就算我們的樣本數夠大,真的就能夠「證明」什麼嗎?

如果大家能夠理解我上面對power的解釋,那各位應該會知道,power是一個機率的概念。即使你的power達到99.99999%好了,你的significant test都還是有可能剛好在這一次的數據分析中沒有把顯著差異抓出來。何況我們通常用的power都是在80%-90%之間(這類似我們在做significant test時把p < 0.05當成有顯著差異一樣,都只是個約定成俗的習慣),以90% power來說好了,就算顯著差異真的存在,這個significant test你做100次,還是會有10次他沒辦法把顯著差異抓出來。所以,依照統計上的概念,不管你怎麼做,其實都無法真的「證明」什麼。

此外,我對於葉教授能夠判斷出14隻數量不夠,上百支數量才夠的說法,也不是很能瞭解。首先,他沒有提供足夠的background告訴我們他這邊說的power取得是多少(這有點吹毛求疵,一般來說沒講我們就當80%),再者,他對於這個樣本數的判斷,很可能是來自於過往其他研究的經驗。但各位有興趣可以去NCBI查查期刊,用這樣的數量去做研究的paper還不在少數。一來是我前面說的,達成統計上有意義的樣本數大小,有時候會有執行上的困難,另一方面,我們也別忘記,達成一定程度的power所需要的樣本數大小,和你使用的數學模型,以及其組間差異大小、組內變異度大小都有關係。如果今天我們做的假設是組內變異極小,組間差異極大,我們就可以用比較少的樣本數得到相對來說較高的power。

此外,樣本數大小,也會和你的實驗設計和擁有的資訊有關,這部分比較複雜,這裡就不加贅述。我想強調的是,就統計上來說,在這麼缺乏資訊的情況下,對樣本數做出「夠或不夠」的判斷,其實是一件太過武斷的事情,而且因為樣本數不夠,就說這個研究是沒意義的,也不是一個精確的說法。我們常常說,小樣本的數據,一定要explain with caution(小心解讀之類的,中文翻譯我抓不太到精髓),但並不會就讓這個研究完全沒有意義或參考價值。

最後,我想強調一下,我知道很多人看到統計和數學就頭痛,所以這篇文章我希望是用盡量避免放太多統計名詞,以及盡量避免用數學去推導的方式來說明,且為了說明上的方便,我簡化了很多東西,也用了很多比喻。有人說,真理會消失在比喻之中,就某方面而言我是認同的,比喻用得多了,有些地方就容易不精確。是以,我希望各位在看這篇文章時,能以瞭解大概念的方式去理解他。至於對細部的統計論述有興趣的朋友,我想去圖書館借本統計學的書來讀讀,在建立正確概念上,會有更大的幫助。

2013年8月12日 星期一

The story rosiglitazone story--- what can we learn from this controversial drug?

本來想要透過rosiglitazone的故事講一些觀念,不過寫一寫發現變得有點硬。

是說當初在開這個bioscience相關單元的時候,有想說這個部分的東西要盡量以大學念過普生的人可以理解的程度為主,但後來發現我其實不太會判斷哪些東西是念完普生會懂的,哪些又不是,所以就改成參考wiki,想說wiki寫的內容,應該算是沒有超過大部份人能理解的範圍。這也是我不太cite reference,都改以直接附上wiki links的原因。


但身為一個專業的rule breaker,即使自己訂下的規則也無法好好遵守,往往寫一寫就變得有點複雜XD


如果對一堆jargon感到頭大,其實也沒關係,直接從*後面那段讀好了,應該還是可以了解我想表達的東西。*前面的部分,則是一些background,如果願意花點心思理解,對糖尿病相關的藥物應該會有多一些認識,也是不錯的事情。






一般而言,用來治療type II diabetes mellitus (TIIDM) 的口服藥物可以分成三大類。

第一類是insulin secretagogues,也就是所謂的sulphonylurea receptor agonists,藉由activate β cells上的sulphonylurea receptors來達成刺激 β cells分泌更多insulin的目的。

第二大類的藥物則是α-glucosidase inhibitors,這類的藥物主要是藉由減緩小腸細胞吸收carbohydrates的速度來達成控制TIIDM的目的。小腸細胞吸收不了carbohydrates,血液中glucose的濃度自然就不會增高太多。

至於最後一類,則是所謂的insulin sensitisers,他們主要是藉由各種方式來增加cells對insulin的敏感度,並藉此控制hyperglycaemia (chronic hyperglycaemia被認為和很多TIIDM造成的complications有關,包含cardiovascular events)。在thiazolidinedione這個family的藥物出現之前,唯一可以藉由這個mechanism來控制TIIDM的口服藥是以metformin為主的biguanides類藥物,不過這類藥物的主要的功能是在它能夠降低liver的gluconeogenesis (減少liver生成的glucose),增加細胞對insulin的sensitivity只是其中一個附加功能。

由於TIIDM主要的特色就是insulin resistance,也就是細胞對insulin的sensitivity下降導致血糖一直居高不下,自然而然的,科學家們也就一直很想利用增加細胞對insulin的sensitivity來治療TIIDM。而thiazolidinedione family中的第一個藥物-troglitazone,就是在這個構想之下被發展出來的。Troglitazone是peroxisome proliferator-activated receptor-γ (PPAR-γ) 的agonist,可以activate PPAR-γ的downstream pathways。PPAR-γ被activated之後,其downstream的insulin-sensitive genes也會跟著被activated,因此會增加細胞對insulin的sensitivity。

打個比方來說,假設今天有個飲水機,你按一下按鈕啓動機器裡面的力矩打開閘門,會倒出5 ml的水。但現在這個按鈕有些卡住了,你用同樣的力道按無法完全按下去,閘門不會全開,所以這台機器變成只會倒出3 ml的水來。但你還是想喝5 ml的水,卻又不想更用力的按按鈕,於是工程師就把飲水機控制出水的力矩加長,變成你出同樣的力氣,在按鈕一樣沒有辦法完全按下去的情況下,就又可以把閘門給完全打開。PPAR-γ agonist在這裡做的事情就像是那個加長力矩的工程師,你的細胞一樣是對insulin insensitive的,但受到一樣強度的insulin刺激之後,產生的反應卻加大了,這樣就可以彌補insulin resistnece帶來的問題。

由於這類PPAR-γ agonists獨特的mechanism of action (MOA),thiazolidinedione類的藥物一被開發出來,就被視為是blockbuster,所以很受pharmaceutical industry, diabetes associations和regulators的重視。

很可惜的,troglitazone後來因為被發現俱有hepatotoxicity,所以被迫下市。想當然耳,各大藥廠對於填補troglitazone離開市場後留下來的空缺自是感到躍躍欲試。其中,由GSK所研發的另一個PPAR-γ agonist rosiglitazone,自pre-clinical時期,就一直是倍受矚目的明日之星。

而rosiglitazone在上市之後到因為被發現會增加cardiovascular events而被EMA勒令下市,並被FDA highly restrict its application之前,也不負眾望地帶給GSK以數以billion USD計的sales,因此稱它是blockbuster,絕對名符其實。

可是rosiglitazone的研發過程,也是在所有TIIDM的藥物中,最受爭議的一個。他的問題從ghostwriter、隱藏SAE、執行clinical trial時的misconduct到trials本身的設計不良等等,包羅萬象,你能想得到的大概都有。

看到這裡,各位讀者大概會開始覺得這又是一個邪惡藥廠只為賺錢的黑心故事。

就某個程度上而言,rosiglitazone的研發者確實有些地方沒有做好,regulaotrs在把關上面也出現了一些問題。


但另一方面,rosiglitazone研發的故事也再一次讓我們看到了新藥研發的困難重重與不確定性。下面就讓我們把misconduct的部分先拋開,簡單的看看rosiglitazone在研發的過程中,到底發生了什麼狀況,regulators和researchers又遇到了什麼樣的困難,導致這個會造成devastating side effects的藥物被帶到市場上。







要瞭解rosiglitazone的問題,我們得先從TIIDM為什麼是個可怕的疾病這點開始講起。

TIIDM本身其實並不是一個什麼可怕的疾病。他的可怕的原因,在於他造成的complications。舉例來說,TIIDM造成的circulatory disorder會使得病患下肢截肢的機會升高到20倍左右、會提高renal failure和眼睛失明 (diabetic retinopathy) 的機會,同時也有報導指出TIIDM的患者可能比較容易得到Alzheimer's disease。不過最嚴重的,還是TIIDM會造成患者發生cardiovascular events的機率大幅增加,而這也是TIIDM減低患者平均壽命的主要原因。


所謂的cardiovascular events,其實就是一般俗稱的心血管疾病,而這又可以分成兩大類。


第一類我們稱之為microvascular events,簡單來說就是一些比較小的血管出問題造成的毛病。像是前面提到的diabetic retinopathy,就算是microvascular events的一種(mechanisms懶得解釋了,總之一般認為這和sorbitol累積造成的osmotic pressure改變有關)。這部分雖然也很devastating,但是並非是造成病人死亡的主因。


第二類則是macrovascular events。這部分就是我們比較直觀會想到的心血管疾病,像是stroke, coronary artery disease和myocardial ischemia/infarction (MI) 等等。這些complications的致死率就很高,所以也是我們在治療TIIDM時最想要降低的部分。


換句話說,我們研發治療TIIDM的藥物,有很大一部分是希望能夠透過解決hyperglycaemia或insuline resistance等問題,藉以達成降低病人產生macrovascular complications的機率。


現在,讓我們來想想一個有趣的問題。假設今天你在研發一個新的TIIDM藥物,發現它可以解決hyperglycaemia的問題,但是卻有著讓病人增加產生macrovascular events風險的side effect,你覺得這個藥應該得到regulatory agency的approval嗎?

很明顯的不應該對吧?


因為你最終想要達到的目的,是【透過解決hyperglycaemia來達到減低病人產生macrovascular events的機率】。


但這個藥物雖然解決了hyperglycaemia,卻因為種種原因反而增加了病人得到macrovascular events的機率,或者使得病人得到macrovascular events的機率沒有明顯降低,這就等於你的最終目的沒有達成。因此,這樣的藥物也就不應該上市。


所以,在研發治療TIIDM的藥物時,很重要的一件事情就是要瞭解該藥會不會造成cardiovascular events,特別是macrovascular events。


可是這些cardiovascular events要發生,往往都要十幾甚至二十年的時間。而這世界上大概沒有一個藥廠有辦法承擔去做一個十年甚至二十年的phase II或Phase III clinical trial來檢驗新藥與cardiovascular events的關係。


那我們要怎麼辦呢?


聰明的科學家們,想出了一個好辦法:【利用biomarker】。


所謂的biomarker,最common的definition是:


"A characteristic that is objectively measured and evaluated as an indicator of normal biologic processes, pathogenic processes or pharmacological responses to a therapeutic intervention"  


   -- Principle of Translational Science in Medicine, Cambridge University Press (個人認為講translational med最強大的書之一)


舉例來說,像我們測量血液中的triglyceride,並不是因為對triglyceride的blood concentration本身有興趣,而是因為研究指出high triglyceride concentration in the blood和atherosclerosis高度相關 (*請查照文末附注說明),因此我們測量triglyceride這個"characteristic",用以當作是病人得到atherosclerosis機率的indicator。

在上面那個例子裡,atherosclerosis是我們想要測量的"true clinical endpoint",而血液中的triglyceride level就是biomarker。


把這個概念套回cardiovascular events上頭,這時候cardiovascular events,像是stroke和MI,就是我們的true clinical endpoints。這些true clinical endpoints因為測量不易,所以我們就研究來找一個像是blood triglyceride level這樣的characteristic當作是biomarker。


在TIIDM當中,一般比較被接受的biomarker是glycosylated haemoglobin A1c (HbA1c) 和fasting glucose level。


這兩個東西都滿直觀的,我大概解釋一下。


Fasting glucose level簡單說就是你餓肚子時血液中血糖的濃度。如果你記得前面提到,TIIDM的其中一個特色是chronic hyperglycaemia,也就是血糖偏高,那你應該不難理解我們可以用血糖的改變來當作治療糖尿病藥物有沒有效的一個biomarker。


HbA1c,他其實就是一種haemoglobin,只是經過glycosylation修飾而已。有趣的是這個glycosylation是一個enzyme-independent的過程,也因此這個反應可以很直觀的用酸鹼濃度概念去思考。打個比方,這是個A-+H+⟷AH的反應,在這裡A-的數量你把它當成無限大,這時候AH的數量基本上就和H+成正比。用這樣簡化的概念去理解,把A-當成haemoglobin,H+當成被加上去的carbohydrates,AH則想成是HbA1c,就不難理解HbA1c可以被當成biomarker的理由:「他在血液中的濃度,和血糖成正比」。因此,HbA1c其實也就是另一種監測血糖的方法。


這兩個well-established biomarkers其實都是在監測hyperglycaemia,不過因為hyperglycaemia不但是TIIDM的一個重要特色,也被認為和很多TIIDM引發的complications高度相關,因此在clinical trial中以測量這兩個biomarkers來檢驗藥物的efficacy,可以說是研發TIIDM藥物的SOP。


所以在這裡整個邏輯就變成【hyperglycaemia引發complications,所以利用biomarkers監測藥物降低hyperglycaemia的程度,就可以代表藥物降低complications發生機率的程度。


接著我們回過頭去看cardiovascular events的監測。前面說了,像是MI和stroke這類的macrovascular events,可能需要監測十年才會發生,根本沒有藥廠可以做得起這種研究。但如果用上面那個邏輯,我們就可以靠著監測HbA1c等biomarkers,用比較短的時間就預知TIIDM病人以後發生cardiovascular events的機會是否降低,就好像我們用監測blood triglyceride level來預測病人得到atherosclerosis的機會一樣。


關於fasting glucose level和HbA1c可以監測hyperglycaemia這點,應該比較沒有疑問。但解決hyperglycaemia,就真的就等於能降低cardiovascular complications發生的機率嗎?


以前我們認為是的。但現在愈來愈多證據顯示似乎不是這樣 (又一個兜兜轉轉求進步的例子)。


經過多年的研究,現在科學家們慢慢發現fasting glucose level和HbA1c的levels,似乎和microvascular events比較相關,但和更嚴重的macrovascular events關聯性就很低 (i.e. they are valid biomarkers for microvascular events, but not for macrovascular events)。


而在另外一方面,我們又缺乏其他可以監測macrovascular events的biomarkers。


把這兩個事實加在一起,TIIDM新藥研發的漏洞就出來了:一方面,即使我們看到了研發中的新藥可以降低fasting glucose level和HbA1c level,這也不代表他們能夠降低macrovascular events發生的機率,也因此不見得能夠增加病人存活的年限。另一方面,我們又缺乏直接監測新藥是否會增加macrovascular events發生機率的biomarkers。


這就是發生在rosiglitazone上的狀況。


在研發rosiglitazone的時候,科學家們對於fasting glucose level和HbA1c的侷限還不夠清楚,因此就很自然的用這兩個biomakers當做藥物efficacy的indicators。同時,因為沒辦法用biomarker間接監測rosiglitazone對人類心血管系統造成的影響 (特別是macrovascular events),我們只能由animal tests的data中去推測rosiglitazone對macrovascular events造成的影響。


當然我們都知道animal tests的data要直接轉換到人身上是有困難的,所以即使rosiglitazone在動物身上有造成macrovascular events發生機率上升的data,也不一定代表它在人類身上就會造成macrovascular events發生的機率增加。但一般來說,regulators在這種時候都會傾向趨於保守的判斷,也就是他們會比較傾向不讓這種藥上市,或著讓這種藥「有條件」的上市。而會做出怎麼樣的判斷,就得看regulators根據該藥物的risk/benefit profile做判斷,看看該藥是否被認為overall來說對於某個族群的病人而言,benefit會大過risk。


rosiglitazone的例子裡,由於它是一個走全新MOA (mechanism of action) 的藥,而且看起來efficacy相當好,所以最終在animal studies recommend not approving the drug for long-term human use的情況下,還是讓它有條件的上市了,而條件就是GSK必須進行長時間大型的post-marketing trial,看看rosiglitazone會不會在人身上造成macrovascular events發生機率的增加。



後來post-marketing trial的結果是對rosiglitazone比較不利的,這也造成了他在歐盟被拿掉,在美國則被"highly restrict"的結果。當然,這中間還有一些有爭議的部分,不過就如前面說的,那不在這篇文章討論的範圍內,所以這邊就略過不談了。

由這個故事,我們可以得到幾個結論。

第一,由於科學是累積的,而且是兜兜轉轉在進步的,所以以前認為valid的biomarker,很可能其實並不是好的indicator。但要加速臨床研究的速度,biomarker又不可或缺,所以我們還是得用它。這也就是為什麼這幾年translational medicine這麼流行的原因,基本上這個subject,就是一個圍繞著biomarker在發展的subject,所以如果你學的translational med沒有太強調clinical trial design和biomarker development,那基本上就不算真正的translational medicine studies。後面這部分扯得比較遠了,以後我們有機會再談。

第二,我們在做臨床測驗時,基本上對於沒有biomarker的chronic toxicity或side effects (例如rosiglitazone這個例子裡的macrovascular events),是沒什麼轍的。在考量overall的risk和benefit之後,regulators還是可能會讓這個藥上市,然後再用long-term post-marketing surveillance去做監測,決定這個藥能不能留在市場上。

這聽起來不是一個對病人最安全的做法,但是卻是實際上在trade-off之後唯一可行的辦法。Regulators當然可以要求藥廠要進行長達十年的clinical trail,不然就不讓藥上市,但這只會造成無法負擔十年clincial trial經費的藥廠選擇放棄研發這類藥物,不然就是必須讓藥廠把費用加諸到新藥上,由消費者負擔。所以在trade-off之後,regulators能做的也就是在現有的資料下做最佳判斷,看要不要讓藥物「有條件的上市」。

第三,基本上第二點的狀況,可以套用到所有chronic toxicity的監測上。這也包含了很多食品。由於我們不可能對每個東西做長達二、三十年的監測,然後再決定要不要讓這東西能夠在市場上流通,以及要在什麼劑量內在市場上流通,所以通常在沒有證據顯示其有毒的情況下,大部份的食品都是會繼續在市面上販售的(想像一下在沒有證據顯示果凍會致癌的情況下先禁止果凍20年,以收集各種chronic toxicity data是一件多麼ridiculous的事情)。

而這三點,就是這篇文章最主要想傳達的概念。我們的科學並不完美,regulatory agency也不完美。但我們可以找出一個在目前環境下feasible的最佳方案。我們的regualtory agency會犯錯,科學家會做出錯誤判斷,但他們會努力修正,科學會持續進展。這也就是為什麼clinical trial即使有這麼多侷限,我們仍然相信clinical trial是檢驗藥物效果與side effects的最佳辦法。

因此,當你看到regulatory agency或著藥物研發人員犯錯的時候,其實並不一定是又一個「該死的貪婪藥廠不顧大眾死活只想賺錢」的故事,而很可能是現行的方法真的有所侷限。

當然,藥廠會有misconduct,這是不可否認且絕對應該要譴責的事情。像rosiglitazone的故事,就包含了許多俱有爭議的部分。但即使拿掉這些有爭議的部分,rosiglitazone對於regulators來說,依舊會是個tricky case。不過大體而言,目前市面上的藥物,還是在相對來說能盡量讓證據多說話的體制下拿到licence的,只要是按照indication服用,相對來說benefit應該還是會大過risk的。

更重要的是,在這些年來一些藥廠misconduct的狀況發生之後,世界各國的regulatory agencies都在推動data transparency法案,所以現在大多數的藥物,都可以很容易在網路上看到original data和summarised reports,要多獲得一些資訊不是難事。所以與其整天糊思亂想認為整個西方醫療都是由黑心藥廠的邪惡賺錢陰謀構築起來的體系,不如多花點心思上網查查自己吃的藥有著怎樣的efficacy和side effect profiles,我想會更實際一些。


*補上三點醫師朋友的補充:

幾點補充:

1.容易造成atherosclerosis的脂肪應該是 (low and very low density) cholesterol 而非TG 雖然TIIDM病人TG升高的比例比一般族群是還常見沒錯

2.HbA1c的好處是它顯示的是長期的血糖控制狀態 而不像傳統空腹血糖會受carbohydrate load及與檢測間的時間距有很大的變異


3.糖尿病病慢性腎病的病人 會有藥量需做調整以及禁忌症的問題 (insulin就需要調量以免常常低血糖 而Metformin根本就禁用 會有代謝性酸中毒的問題 所以當Repaglinide(商品名為NovoNorm)出來時 常常變成糖尿病腎病病人控制血糖的愛用藥

關於第一點,雖然triglyceride是very low density lipoprotein (VLDL)的主要成分,但血液中triglyceride的濃度和atherosclerosis的關聯性尚不明確,LDL:HDL ratio應該是比較valid的indicator/biomarker,是以文章中以triglyceride代替VLDL,說high triglyceride concentration in the blood與atherosclerosis高度相關,是不精確的說法,特別在此補充說明。

2013年8月1日 星期四

有人說狂犬病毒並不可怕,這是真的嗎?


*在網友們的建議與協助下,將這篇文章大部份英文的部分翻譯為中文,並增加兩張圖,希望能進一步幫助大家理解狂犬病病毒 :)

A brief introduction to rabies virus

是說最近狂犬病的資訊在台灣滿天飛,麻煩的是這些資訊常常是夾在不同的概念框架裡面被送出來的,所以有時候很難找到正確的角度去切入。而找不到正確的角度去切入,就很容易誤解資訊。我這邊幫忙提供一點從幾個不同角度切入去看狂犬病的背景知識,看看能不能幫忙釐清一些概念。

第一個角度,狂犬病是一種由狂犬病病毒引發的疾病,所以我們可以從病毒這個大的概念去思考。

病毒是一種很特別的感染性物質(infectious agent),它並不具有像是維持恆定和新陳代謝等"生命應有的特徵",但它卻可以在特殊的情況底下自我複製(生命最重要的特徵之一),因此,關於病毒是不是生命這件事,一直都有爭議,這也是為什麼我在上面的文章中是用感染性的 "agent"來描述它。

前面提到病毒可以在特殊情況下自我複製,這個特殊情況,就是它必須寄生在宿主細胞(host cell)之中。這是因為病毒雖然俱有由去氧核糖核酸(DNA)或核糖核酸(RNA)構成的遺傳物質,卻不具備足夠的其他設備,因此它無法自己進行複製。但一旦病毒進入宿主細胞之中,它就可以利用宿主細胞充足的設備來完成複製。打個比方,你可以想像病毒是個機器人,這個機器人的機器腦有著如何設計並製造自己複製品的藍圖,卻沒有任何工具和材料可以完成它腦袋裡的作品。但只要讓這個機器人進入擁有充足工具和材料的工廠,它就可以以極高的效率作出一堆自己的複製品。

有了這個概念,應該就不難明白對病毒而言,進入「工廠」,是複製自己的起點。用病毒學的概念去講,就是病毒必須能夠感染(infect)它的宿主細胞,而感染的重點,就是它必須進入宿主之中(internalisation)。

有趣的是,每個病毒都只能進入某些特殊的宿主細胞。用剛剛那個比喻,就是每個機器人只擁有一把特殊的鑰匙,因此只能進入一個或少數幾個工廠。舉例來說,像人類免疫不全病毒(HIV)就只能感染某些免疫細胞,而流感病毒只能感染上皮細胞。

對這部分有概念之後,我們就可以很輕易的問出第一個問題:"狂犬病病毒的宿主細胞是誰?"

簡單來說,狂犬病病毒的宿主細胞是神經細胞(又稱神經元,neuron),這是非常確定的部分。不管是運動神經元(motor neuron)、感覺神經元(sensory neuron)或著中間神經元(interneuron),都可以是狂犬病病毒的宿主細胞。另外有一些學者認為肌肉細胞也可以是狂犬病病毒的宿主,不過這部分的證據還不夠多,所以這裡就不多做討論。

既然狂犬病病毒的宿主是神經細胞,那他要能夠複製,就必須要能夠接觸到神經細胞才行。而這也就解釋了狂犬病病毒最常見的傳染方式成因:"被帶有狂犬病病毒且能傳染狂犬病病毒給你的動物咬傷"。

要瞭解這個部分,首先你得對我們肌肉和神經的構造有一些瞭解。簡單來說,我們的神經系統控制著我們的肌肉收縮,而肌肉收縮則讓你能夠做出各種動作。因此,你腦子想著要對某強拆民宅的縣長比中指,你的中指就會聽話的舉起來。

而這樣一個簡單的動作,牽涉到一個很有趣的迴路:首先,你的中樞神經系統(central nervous system,CNS,就是大腦和脊髓)得向你的肌肉下命令,而把這個命令傳達到肌肉的任務,是由運動神經元來進行。

那你怎麼知道你的中指真的比起來了,而且比好久好酸了呢?這時候你就需要感覺神經元把訊息傳回到中樞神經系統讓你的大腦明白。至於中間神經元則是任何連接其他兩個神經細胞的神經細胞,它可以連接兩個中間神經元,也可以連接一個運動神經元和一個感覺神經元。

在繼續下去之前,這邊要岔開提一下,和中樞神經系統相對的是周邊神經系統(peripheral nervous system,PNS),這兩個是解剖學上的概念,所有在中樞神經系統外頭的部分都屬於周邊神經系統。

此外,這邊還要提的是一個神經細胞基本上可以分成三部分,一個是帶有細胞核的細胞本體,另一個是接收訊息的樹突,第三個部分則是傳遞訊息出去的軸突。這部分直接看圖應該會比較清楚,下圖是引用並修改wiki的,圖中長長上面有黃色東東的那根就是軸突,左邊紫色包著綠色圈圈那裡是細胞本體,紫色外圍突出去的那些東西則是樹突:



好了,現在讓我們回到被咬傷的情節。現在你被這隻動物咬傷了,這隻動物口水裡的狂犬病病毒跟著他的牙齒插進了你的肌肉。而和你的肌肉靠很近的,是一堆神經(nerve)。所謂的神經,其實就是一大串綁在一起的軸突。而軸突又是屬於神經細胞的一部分,是狂犬病病毒可以感染的宿主,因此狂犬病病毒就可以開開心心的拿著它的鑰匙進入這間工廠了。順帶一提,前面提到有些學者認為狂犬病病毒的宿主細胞也包括肌肉細胞,而在這一派的理論中,狂犬病病毒是先藉由沾著動物口水的牙齒進入肌肉細胞中,然後再傳染給神經細胞。

一般來說,狂犬病病毒先進去的這個軸突會是屬於運動神經元的。在前面那個wiki的圖裡,你可以看到那根很長的軸突在最右端有些開叉,這部分是運動神經元和肌肉交接的地方,稱為軸突末端(axonal terminal)。軸突末端不會真的和肌肉碰在一起,但會和肌肉細胞共同形成一個叫做神經肌肉交接處(neuromuscular junction)的構造。這裡也是狂犬病病毒一開始進到軸突裡面的地方。下圖一樣是修改並引用自wiki:


好玩的地方是,雖然狂犬病病毒是從軸突末端進入神經細胞的,但整條軸突上都不具備可以讓狂犬病病毒複製的材料和機械,這些東西放在遙遠的細胞本體那裡。或許你可以把這間叫做運動神經元的工廠想成有一個長長的走廊,入口在走廊的盡頭。機器人進去以後,必須走過空無一物的長走廊,才能到達那個放著材料和機械,名叫細胞本體的工作間。正常來講,這間工廠都是把製作好的成品從細胞本體往門口送,但現在機器人則是反過來走,從門口往細胞本體去,這樣的走法我們稱之為逆行(retrograde)。

跑到細胞本體之後,擁有充足機器和材料的狂犬病病毒這時候就可以開始很開心的複製、組裝、跑到細胞之外,之後再去感染其他神經細胞。而藉由這個逆向輸送的過程,狂犬病病毒也可以順利的從一開始的宿主細胞裡面跑到平常被保護得很好,藉由細胞外路徑通常很難進入的中樞神經系統(通常先到脊髓,然後到腦)。

到了中樞神經系統之後的狂犬病病毒就開心了,到處都是他的宿主細胞,到處都可以感染。不過你就不開心了,通常到了這個時候,就只能期待18年後又是一條好漢。

然後這些病毒又會從中樞神經系統再感染出去,遍佈你的神經系統,並往神經系統末端,和其他系統交接的方向移動,跑到像是唾腺(Salivary glands)這種神經密佈的地方。唾腺就狂犬病病毒而言是所謂的主要離體出口(major exit portal),白話講就是讓病毒從一個宿主(host,不是宿主細胞,這裡指的是個體)傳染到另外一個個體的地方。

神奇的是,跑到中樞神經系統的狂犬病病毒除了會造成像是狂犬病腦脊髓炎 (rabies encephalomyelitis)這類致命的發炎反應之外,在動物中,也會影響很多受感染動物的行為,使他們的變得更具侵略性和攻擊性。有攻擊性的結果常常就是用咬的攻擊其他動物,使得狂犬病病毒得以繼續散佈。

講了這麼多,主要是要告訴你兩件事:

第一,狂犬病病毒主要傳染途徑的起點是咬傷傷口殘留口水中的病毒和神經細胞接觸。其他路徑並不是不存在,理論上只要是你可以想像得到,能夠讓狂犬病病毒接觸到你的神經細胞的方式都可能會讓你被感染。但是這些機率都太低,有些案例甚至根本只有在實驗室發生,所以咬傷是你最需要關注的。

第二,這就是為什麼一般防治狂犬病的宣導會告訴你要在被咬之後趕快用水大量清洗傷口,然後再去打疫苗。清洗傷口可以洗掉殘留的唾液,讓狂犬病病毒不容易接觸並進入你的神經細胞,打疫苗則可以極為有效的防止你發病,不發病,你就可以直接繼續當好漢,不用等十八年了。

值得注意的是,一般認為狂犬病病毒在人類身上之所以要很長一段時間才會發病,是因為在進入你的神經細胞之前它可能會在咬傷傷口附近進入所謂的休眠狀態(dormant state),或著也有人認為它會在你的骨骼肌細胞裡用很慢很慢的速度複製。但是一旦狂犬病病毒進入神經系統,它的複製和散佈速度就非常非常快,而且因為是從細胞內走,你的血腦屏障(blood-brain barrier,BBB)根本擋不了它,所以臉書上流傳說什麼狂犬病病毒要從血液過血腦屏障然後進中樞神經系統很難的說法是不對的。

接著我們來談談第二個切入角度:狂犬病病毒跨種傳染的特性。

狂犬病是一種可在不同物種間流傳的傳染病(zoonotic disease)。Zoonosis這個字的意思是這個病可以跨種傳染,例如從狗身上傳染給人這樣。而有所謂的跨種傳染,就會有宿主專一性(host specificity)和宿主譜系(host spectrum)的問題。簡單的說,一個病毒能夠跨的物種越多,宿主譜系就越廣,宿主專一性也就越低。

而既然都說狂犬病病毒可以跨種傳染了,加上大家應該都有印象最近新聞一直有在講說好多不同的動物都會被狂犬病病毒感染,那他的宿主譜系當然不會窄,宿主專一性當然不會高。

而因為其跨種傳染的特性,有很多關於狂犬病病毒的論述,必須放在這個架構下去看,才會有辦法理解。

首先,我們來談談保毒動物(講真的我沒聽過這個翻譯,總之英文是叫viral reservoir)。所謂的保毒動物,指得是會被感染,病毒也能在其體內繁殖,但是不會有症狀或著症狀輕微,或著不會因為被感染就快速死亡的宿主。因為這種宿主可以和病毒長期和平共存,因此他們的體內也就成為了儲存病毒的地方,變成病毒來源的保存庫。

接下來,讓我們假設今天有一隻保毒動物A,他咬了一隻不同種動物B。這隻不同種動物B可以把A傳給他的病毒再傳給另外一隻不管同不同種的動物C,這時候這隻B就稱為是病媒動物(vector)。請注意病媒動物和保毒動物並不是互相排斥的概念,照定義一個動物當然可以既是保毒動物(可以和病毒長期和平共存),也是病媒動物(可以傳給別的宿主)。

那麼跨種傳染是不是一定要經由病媒動物來達成呢?

答案是否定的。以流感病毒為例,它主要是藉由飛沫傳染,如果豬把口水噴到空氣中被人吸入,而人也感染了,那這個流感也算一種跨種傳染疾病。

最後我們來講講終端宿主(dead-end host)。一樣用上面那個A咬B的狀況來說,但在這個例子裡,B被傳染之後無法再傳給其他宿主,這時候B就是終端宿主。終端這個翻譯有點誤導的意味在裡頭,我個人是認為把它想成「死巷」會比較精確一點,因為很多需要跨種傳染才能繁衍的寄生生物,一旦進入終端宿主中,就會被卡住,出不來了,因此也就無法走完他的生命週期(life cycle),是以才會被叫做"dead end"。

雖然這些定義在實際應用上會有一些爭議,但大致來說,只要你照著這些定義把這種跨物種傳染的概念放進去,再去看那些描述鼬獾和錢鼠是什麼宿主的新聞報導,我相信會清楚很多,也會比較有能力判斷哪些報導是錯的。

第三個切入點,我們來簡單的看看狂犬病病毒本身的特色。

狂犬病病毒是一種負股(negative strain)RNA病毒。

負股?這是什麼意思?

一般動物細胞要表現一個蛋白質(譬如抗體),需要把這個蛋白質的訊息從基因體(genome)裡拿出來。除了少數的RNA病毒,所有的基因體都是由DNA上的四個鹼基(ATGC)寫成的"密碼"構成。要把這個訊息拿出來,需要經過把DNA轉錄成信使RNA(mRNA),以及把mRNA轉譯成蛋白質這兩個過程。mRNA的序列叫作訊息股(sense strand)或正股(positive strand),而可以和它配對的序列就是訊息反義股(anti-sense strand)或負股。舉例:

-AUGCAUGC- mRNA, 正股

-UACGUACG- 負股

而狂犬病病毒帶有的基因體就是這種單股的負股RNA。負股麻煩的地方在於,它無法直接轉譯出蛋白質(只有mRNA才有辦法做蛋白質),所以它必須先用自己基因體的負股RNA序列把和其互補的mRNA做出來,接著才有辦法做出蛋白質,也才有辦法製造出新的病毒顆粒。而要做出RNA,需要用到一個叫做聚合酶(polymerase)的酵素。

問題來了。

在動物細胞中,轉錄會用到以DNA為模板轉錄RNA的聚合酶(DNA-dependent RNA polymerase,用DNA把mRNA做出來),細胞分裂前複製基因體時則會用到另一種以DNA為模板合成互補DNA的聚合酶(DNA-dependent DNA polymerase,用DNA把DNA複製出來),可是狂犬病病毒現在要做的事情是用RNA把RNA做出來,需要用到一個以RNA為模板合成互補RNA的聚合酶(RNA-dependent RNA polymerase)。

但這個東西宿主沒有啊!

沒有,那就只好自己帶囉。所以狂犬病病毒自己帶有一個可以用RNA當模板合成互補RNA的RNA聚合酶。

可是這個聚合酶不太可靠,複製序列時常常會複製錯,這是造成RNA病毒突變率比較高的其中一個原因,其他原因還包括RNA的結構本身就很不穩定等等。


而基因體複製的可靠度低,加上構成基因體的物質本身不穩定,就可能會造成做出來的蛋白質序列發生改變,進而影響蛋白質結構。這就是流感病毒每年都會有一點不一樣,需要做新疫苗的原因*


但RNA序列改變不代表氨基酸序列改變(舉例:CUC和CUU這兩種密碼子做出來都是白胺酸,所以第三個位置C變U不會造成氨基酸序列改變),且RNA基因體複製容易錯也不代表錯誤會被留下來。譬如編碼著前面提過的RNA聚合酶的基因,可能只要一點點結構上的改變就會失去功效,因此這個狂犬病病毒就沒辦法把自己的負股RNA基因體變成mRNA,當然也就做不出蛋白質。這樣一來,這個狂犬病病毒就無法進行複製,會被淘汰,自然這個突變也就不會被留下來。

在基因體的整個序列中,每個片段承受突變的能力可能會有所不同,某些很重要的基因,可能根本沒辦法承受多少程度的突變,因此,一個基因體裡會有一些片段能接受變異產生的程度比較低(more conserved),有些能接受變異產生的程度比較高(less conserved),甚至連在同一個基因當中,都會有不同的小片段對變異承受力不一樣的狀況存在。

講這一段這麼無聊的東西主要的目的是要處理新聞上定序比較病毒來源的問題。

首先,因為RNA本身不穩定,基本上你不太容易取得非常完整的RNA片段來做定序,而且用定序比較病毒來源時,也不太可能會去對整個基因體做定序來自找麻煩。一般來說,大家在做定序時,都是選其中一個片段來比較(例如某個基因)。前面說過每個基因受到的演化壓力不同,所以承受變異程度的能力也不同,因此不同基因的鑑別力強弱也不一樣,有的只要把門檻值設在80%就可以鑑別得出來,有的可能要90%。當然,這也和你用的演化計算方法有關。

所以當你看到新聞說台灣某某病毒的相似度和中國高達80%這類的報導時,其實他們並沒有提供什麼太有用的訊息。一來你不知道他用的方法,二來你不知道他是選哪個片段或哪個基因來比較、門檻值又設在哪裡,同時現在有的樣本這麼少,也不知道RNA的品質如何,訊息的充足程度根本不夠讓你做出精確的判斷。

此外,一開始這個研究是想要看我們現在發現的狂犬病病毒是從哪個國家來的。這樣的做法隱含的假設是【台灣舊有的狂犬病病毒已經絕跡,現在重新出現的狂犬病病毒,必定是來自其他國家】。

簡化的講,要檢驗這個假說,最好的辦法就是拿現在手上有的序列去比對來自多個地理來源的狂犬病病毒序列,看看和誰最像。

結果我們卻看到一堆人只看到什麼我們的病毒和中國相似度有88%,就說這是來自中國,然後還進一步推論說12%的差距很大,所以病毒一定已經來臺很久。

這樣的推論根本莫名其妙。

只比單一來源,沒有可比較的對照參考值,也不知道分析方法,最好你有辦法判斷這是高還低。你有沒有想過搞不好這個病毒根本是來自其他地方?或許這個病毒根本是上星期從加拿大來的,和加拿大的狂犬病病毒相似度高達93%,結果你只比了中國的狂犬病病毒株,然後就說是從中國來的,而且因為相似度只有88%,所以應該來了5年,不覺得很好笑嗎?

大家在看數據的時候,沒有能力檢視他方法的有效性沒關係,但至少要知道看到的資訊能不能夠回答你的問題。像這種比較,至少要有多個參考值,才知道自己在比什麼、,差距大不大。閱讀資訊時多想一下,不確定就多上網查,不要一味的接收,讓自己被資訊誤導。

第四個切入點,我們從狂犬病到底有多恐怖這點來思考。

這個點其實很難切入,因為可以比較的基準點很多。對人類而言,以發病之後的死亡率來論,狂犬病當然很可怕。但以傳播的難易度來說,他卻遠遠比不上流感。

另外有些人說狂犬病殺的人其實不多,所以沒什麼好怕的。這又是另一個沒有比較基準的說法,沒有比較基準點,你要怎麼知道怎樣叫多,怎樣又叫不多呢(舉例,100和1比很多,但和10000比就不多了)?

另外,即使你有數據,也有比較基準,也還是可能會遇到問題。在這裡我引用WHO的資料來說明這件事情。

在這份報告中提到:

"More than 55,000 people die of rabies every year mostly in Asia and Africa"

所以你大概知道每年會有五萬五千人死於狂犬病,且多數發生在亞非。

但在同一份報告裡,WHO也提到:

"Rabies is a neglected disease of poor and vulnerable populations whose deaths are rarely reported"

所以你知道這個數字有被低估,是以每年實際死於狂犬病的數字應該高於55,000人。

但你知道這個這個低估有多嚴重嗎?

根據這篇Nature的報導:

"However, a recent study in Tanzania indicated that the number of deaths caused by rabies may be up to 100 times higher than officially reported, and it has been suggested that only 3% of human cases of rabies virus are recorded by central health authorities. As 40% of those infected are children, the years of life lost by this infection makes rabies the seventh most important global infectious disease"

在Tanzania這個地方,你看到的數字可能是高達100倍的低估,粗糙的把這個估計倍率套到WHO的數據上,照著乘下去的話,狂犬病每年幹掉的人比HIV還多(根據WHO的報告,HIV 30年殺死了兩千五百萬人,平均一年八十三萬多)。

但另一方面來講,你只知道在Tanzania,官方數據可能有高達100倍的低估,卻無法推估全球的平均值,這會讓比較變得困難,更難以套用到臺灣。另外,狂犬病發生在小孩身上的比例相當高,這也暗示了同一國家內不同族群死於狂犬病的風險可能不同。對容易被感染的族群來說,很可能狂犬病是很會殺人的病。也就是說,你根本很難從這些死亡數字中真正看出狂犬病到底有多嚴重。

尤有甚者,上面都是針對人的角度在看。但別忘了狂犬病不止是個會出現在人身上的疾病,也會感染很多動物。人還是終端宿主,只要考慮自己會不會被感染然後死掉的問題就好,但狂犬病病毒在其他動物之間還有快速散播的問題,這本身對於會發病的野生動物就是一場浩劫,且如果造成野生動物大量死亡,進而造成生態問題,也很可能會影響到亦屬於生態系一份子的人類。

所以你要去宣導狂犬病很嚴重,或著不嚴重,其實都可以有你的道理,不過在立論的時候,還是要多用大腦,少靠情緒,多收集資料比對,少被動接收恐慌。

然後記得緊緊的踩住底線:擔心就多去瞭解資訊,害怕就用力監督政府防疫,不懂就多方比較資料,被咬就洗傷口看醫生,聽專業意見,看有沒有需要做暴露後預防(post-exposure prophylaxis,PEP)措施。我想用這樣的態度去面對,也就不會瞎恐慌了。






* 網友黑都醜熱心指正:造成每年需要重新設計製造新流感病毒疫苗的因素還有流感病毒因為帶有多個RNA strands,當病毒顆粒在合成時,有時候會把不同的RNA strands包進來,造成表面抗原的改變,特此補充說明。順便介紹一下,這種改變形式有一個專有名詞叫做antigenic shift,他會直接產生新抗原,所以產生的變異度會比我文章中說的,由於RNA突變速率較高造成的氨基酸改變更大(這個叫做antigenic drift)。

P.S. 1. 其實我覺得狂犬病病毒最好玩的是它和免疫系統的互動、它怎麼逃過免疫系統的攻擊,還有它的致病機轉。不過這些太複雜了,解釋起來超累,有興趣自己去找資料來看吧。

P.S. 2. 最後補充一下一個跟大多數人沒什麼關係,但很有趣的報導:很多人認為RNA病毒快速的突變速度是他能夠突破物種屏障(species barrier)的關鍵,不過最近有研究指出其實RNA 病毒的突變速度雖快,但並沒有快到能夠打破物種屏障,所以跨種傳遞的關鍵還是在於宿主本身的相似程度上。