癌症生物標記的空中樓閣

Print Friendly

癌症生物標記的空中樓閣
知識通訊評論第102期

生物標記來預測癌症,讓人摸不清頭緒

想由血液樣本早期偵測出癌症的想法,在實際臨床實驗上卻困難重重,經過實驗方法的分歧,統計意義的解讀以及商業市場的紛爭,現在生物標記這個方向的發展不但受挫,甚至懷疑是否有生物標記。

今年三月初,網路上出現兩篇長達十九頁的研究,內容讓關心癌症發展的人心灰意冷。這兩篇研究在探討在血液中出現的生物分子(一般稱作生物標記),是否能夠用來儘早偵測出卵巢癌,這種癌症通常被發現之時,卵巢早就毀了,並且癌細胞已經侵襲到身體其他部位。

美國國家癌症研究中心 (NCI) 的早期偵測研究網路 (EDRN) 負責統籌的研究小組,蒐羅了35種在先前的研究中,看起來頗有搞頭的蛋白質生物標記,一共分成5組進行實驗。他們進行嚴謹的測試,過濾了超過一千名婦女的血液樣本,試圖找出是否有任何生物標記,比起已經使用幾乎達30年,但是有其缺點的生物標記 CA-125 ,更能夠讓婦女發現早期的卵巢癌。結果令人失望, CA-125 依然是「一堆爛蘋果裡比較不爛的」,新的生物標記候選者表現全都不如預期。

另一項由美國耶魯大學癌症生物學家摩爾 (Gil Mor) 進行的研究,結果也好不到哪裡去。摩爾用的六種蛋白質進行檢測,結果在一年內被診斷罹患卵巢癌的婦女中,只找出了其中34%;相較之下, CA-125 卻能偵測到其中63%的婦女。而且這項研究還有爭議,它所依據的其中一篇主要研究論文,被其他科學家批評,疑似使用統計運算不當,在後續研究證明確有其事之前,過度樂觀地判定這項檢驗法有助於婦女。

然而從耶魯大學取得使用這項檢測法執照的「實驗室公司」 (LabCorp) ,卻在2008年以「確保卵巢」 (OvaSure) 之名,將這項檢測服務售予病患,長達4個月之久;直到美國食品暨藥物管制局 (FDA) 介入,該公司才讓這項服務下市。

許多癌症生物標記都是像這樣,咻地一聲跑出來,然後根本沒辦法有臨床應用。至於那些臨床上有在使用的,包括專門針對攝護腺癌的抗原 (PSA) ,偵測乳癌的乳房X光片,以及前面提到的 CA-125,不但無法偵測到所有種類的癌症,有時候還會「偵測」到實際上並不存在的癌細胞。

基因體學、蛋白質體學等類科技,也曾試著要找出比起針對單一種類癌症的檢體,更為具有全面性的聯合生物標記,但從來沒有成功過。利用這些科技的研究者,發表了數以千計的相關論文,聲稱可以及早偵測到早期癌症,導引病患療程,並且監控其復發狀況,但實際上只有一小部分的檢測法有在臨床上使用,而且沒一樣可以做到早期偵測,這是臨床上最大的挑戰。 NCI 的生物統計學家麥克珊 (Lisa McShane) 認為,這幾十年來的生物標記研究做得糟透了,光是單一標記都搞不定了,現在還想嘗試多重標記,結果就是各種我們做實驗的壞習性反撲回來。

電子顯微鏡下之癌細胞

EDRN 這項目前為止,規模最大、最有系統進行驗證的生物標記研究,就將這些「壞習性」攤在陽光下。幾個月前,美國杜克大學才剛做出一項立場明確的決定,暫停在臨床試驗中,使用一種以基因體學為基礎,設計用來導引乳癌病患化療方向的生物標記組。有些科學家對杜克大學研究小組的資料分析提出質疑,在發現領導研究工作的遺傳學家波提 (Anil Potti) 履歷不實之後,臨床試驗就宣告暫停。

美國國家研究院轄下的醫學研究院 (IOM) ,2010年9月組成一個委員會,探討這些依據「什麼什麼學」的科技,所發展出來的試驗法,為何在臨床上總是行不通。美國密西根大學乳癌研究員海伊斯 (Dan Hayes) ,在去年年底委員會第一次會議中,就這麼問道:「到底是這些玩意就是行不通呢,還是因為我們用來測試的科學有問題?」

要回答這個問題,現在還言之過早。這個研究領域不但很年輕,而且面臨許多挑戰。許多癌症生物學家有感於他們的研究工作,可能會得到臨床應用的機會,紛紛投入這個研究領域,但他們有時欠缺相關的專長或資源。加拿大多倫多大學臨床生化學家迪亞曼迪斯 (Eleftherios Diamandis) 表示,許多菜鳥入了行,根本不知道問題比表面上要來得複雜。

EDRN的這份研究報告很清楚地指出,雖然大多數專家都認為,臨床診斷前採集試驗樣本,以供偵測早期癌症所用的生物標記,應該要予以驗證,但事實上很少有人這麼做,而且沒有卵巢癌的生物標記通過了驗證。麥克珊在同一場會議中表示,相關科技的光環,以及大量「什麼什麼學」的資料,有時似乎讓研究者忘卻了基礎科學原理。摩爾也認為該領域面臨許多問題,讓生物標記能夠通過謹慎規劃的設計與驗證,是他嘗試要做的工作。

美國北卡羅萊納州癌症流行病學家藍索荷夫 (David Ransohoff) 表示,當初這個領域說得天花亂墜的,但是經過十幾年的重點經營之後,卻拿不出什麼成果,現在該是大家冷靜一下,看看哪裡出問題的時候了。

有所作為

摩爾

摩爾一開始是在以色列希伯來大學接受臨床醫師的訓練,但是他在腫瘤科最後幾年的住院醫師生涯,發生了一件事,讓他不得不轉換跑道。有個罹患卵巢癌的年輕女子前來求診,這種病每年會害死大約14萬名婦女。腫瘤科的治療團隊移除掉她的卵巢,讓她做了好幾輪化療;病況看似有好轉,但是一年半後她又回診,全身長滿腫瘤,很快就去世了。摩爾說,這個女生才29歲,年輕貌美,還是個醫科生,但他始終不明白她到底怎麼了。化療對她一點幫助也沒有。

摩爾決定離開醫界,轉往研究工作。他覺得醫學沒辦法救這個女孩,但研究成果有朝一日或許可以。他在以色列魏茲曼科學研究院,獲得研究卵巢癌的博士學位,然後1997年到耶魯大學服務。他著手進行一個叫做「發現療法」的計畫,其目標是加速臨床可用的癌症研究。研究小組開始收集許多血液與組織樣本,其中有些是來自耶魯大學的臨床診所,家族病史中有人罹患卵巢癌的高風險群。

摩爾說當初大家都很興奮,覺得很快就能找到專門針對癌症的蛋白質。

2003年,當時在耶魯的一位遺傳學家渥德 (David Ward) ,詢問摩爾是否可以用他手上的樣本,尋找早期卵巢癌的生物標記。渥德是一家名叫「分子舞台」公司的創辦人之一,這間公司發展出一套「高產能」的技法,利用一列列的抗體,可以量化血液中的多重蛋白質。摩爾先前從未涉及生物標記研究,但是對於這項科技在臨床上的潛力很感興趣,所以就簽約合作。

渥德瀏覽了與卵巢癌生長跟惡性腫瘤有關的蛋白質研究文獻,找出了169種候選者。渥德的公司運用其蛋白質量化技法,將摩爾的組織血液樣本分成兩大類:一類是來自耶魯的高風險群診所,新近診斷出有卵巢癌的婦女,另一類則是來醫院進行一般婦科檢查的人。再加上額外的癌症病患樣本後,他們挑出四種蛋白質來進行試驗。

渥德

摩爾研發出一種算法,根據這四種蛋白質的濃度,可自動檢測出是否罹患癌症。研究小組用這套算法,對另一組新的血液樣本進行試驗,得到驚人的結果:試驗的敏感度(可正確偵測罹患卵巢癌的比率)與特異度(不會將健康的人誤診為罹患卵巢癌的比率),都達到百分之九十五。對同樣一批樣本, CA-125 的特異度雖然也達95%,但敏感度卻只有70~80%之間。研究結果於2005年5月,發表於《美國國家科學院學報》,渥德掛名為作者之一。

在論文發表之前,渥德協助耶魯大學合作研究辦公室,為這套檢驗法準備申請專利。當時有很多公司表達要為這套檢驗法取得授權的意願,最後由「實驗室公司」與另一家「毫孔公司」 (Millipore) 取得執照。(不過摩爾說,他跟其他共同發明者由此獲得的權利費「並不多」)

這套檢驗法的結果卓著,也引起了 EDRN 研究員注意。在那個時候,大多數用來偵測卵巢癌的生物標記,只能夠辨別出經診斷罹患癌症的病人,但實際上卻希望能夠在癌症剛剛萌發,症狀浮現之前,就要能夠偵測得到。這個領域真正需要的,是可以在看似健康的婦女血液樣本裡,找出那些日後會被診斷出罹患卵巢癌的婦女的生物標記。然而要取得經年累月,不斷追蹤的大量婦女血液樣本,實在是難上加難。

測出問題

假檢測之名,行收集資料之實

EDRN 還是在 NCI 贊助進行的癌症篩檢試驗裡,找到了他們需要的樣本。這項「攝護腺癌、肺癌、大腸癌與卵巢癌 (PLCO) 篩檢試驗,在1992年到2001年間,有規律地收集了155,000人的血液樣本,並進行癌症篩檢。到了2006年6月,有118名婦女罹患卵巢癌或相關癌症,因此EDRN 的研究員現在可以利用這些資料,評估出最具潛力,能夠及早偵測出癌症的生物標記。擔任 EDRN 協調員,任職於弗雷德哈欽森癌症研究中心 (FHCRC) 的生物統計學家范恩 (Ziding Feng) ,前往拜訪摩爾,討論是否能將他的4種蛋白質檢驗法納入研究當中。

「現在該是大家冷靜一下,看看哪裡出問題的時候了。」

范恩

摩爾當時已經開始著手修改檢驗法。他手上有更多病人樣本,因此想要加入更多生物標記,好讓檢驗法能夠更敏銳地偵測癌症。摩爾讓范恩看他是怎麼分析他手頭上最近的資料,但是范恩覺得有點頭痛,摩爾就讓他自己來。摩爾說他統計並非他的研究領域,他平常並不做統計數據。他們就把六種蛋白質的檢測組,加進 EDRN 的驗證研究裡。

范恩跟另一位 FHCRC 的統計學家隆頓 (Gary Longton) ,研發出他們自己的檢測算法,發現摩爾的檢測法,敏感度達95%,特異度更高達99%。但是他們另外計算了摩爾檢測法的正預測值 (PPV) ,這是檢測出罹患疾病,事實上也確實如此的病人比例。正預測值愈高,代表愈少人會被誤診,這對於篩檢健康的人們極為重要。范恩跟隆頓算出的正預測值,只有6.5%,低到沒辦法拿來做篩檢;但是摩爾另外估算的正預測值,卻高達99.3%。兩個數值差距太大,起因在於他們計算數據,加以乘數的方式不同:范恩與摩爾的算法遵循傳統,用的是停經婦女的患病率,摩爾卻僅取研究母群的患病率,兩者分別是0.04%與46%,相差甚遠。

麥克珊

摩爾說他之所以只取樣自研究母體,是因為這項檢測是用於高危險群,要把檢測拿去臨床用的話,就要根據研究母體來計算。他並指出其他研究也是這樣計算正預測值的。但是麥克珊跟其他的統計學家一樣,無法認同摩爾的邏輯,認為這是一種普遍的錯誤,她見得多了,但這還是錯得離譜。即使是因為家族病史或是腫瘤抑制基因突變,而每年接受篩檢的高危險群婦女,患病率也只有0.5%左右,遠低於摩爾研究母體的46%。這場關於正確使用統計數據的論戰,把癌症生物標記研究領域搞得七葷八素的。麥克珊說,這種情況就是不是統計學家的人,覺得統計學家太死板,對於無甚緊要的事情斤斤計較。

摩爾準備要發表最新研究成果了。范恩跟隆頓讀了證明過程,發現正預測值還是99.3%,便要求摩爾改成他們算出來的6.5%,順便訂正幾處表格上打錯的數據。范恩說摩爾當時有同意,所以他們就放他一馬,但結果是摩爾會錯了意,以為范恩同意採用高的正預測值,每個人都認同最終手稿。

論文在2008年2月發表於《臨床癌症研究》。范恩看到那個正預測值,整張臉都綠了。他馬上打電話給摩爾,告訴他早就說過那些數據是錯的。范恩也接洽《臨床癌症研究》,期刊編輯要求摩爾傳一份修正稿,改掉正預測值跟其他打錯的數據。摩爾後來在附註裡補上了那個低的正預測值,另外還寫了一段修正聲明。

幾個星期後,范恩收到同事的電子郵件,告訴他一則討厭的消息:「實驗室公司」準備公開提供這項檢測服務,而且「可望在年底前實施」。范恩很震驚,他認為生物標記在供臨床使用前,應該要進一步接受驗證才對。2008年3月,范恩跟摩爾在華盛頓特區的一場會議中碰面,范恩當面跟摩爾說,不能這樣搞。「你得要等到 PLCO 驗證過了才行。你在做的是早期發現檢測,倘若驗證結果並不支持你先前所聲稱的結果,那你就犯了一個很明顯的錯。」摩爾說他不記得有這一段了,不過他說范恩的角色是來分析資料,可不是來對公司決策品頭論足的。

如今摩爾的說法是,如果讓他再準備發表這篇論文一次,他會把高低兩個正預測值都列進去。「實驗室公司」決定在檢測法通過更多驗證之前,就為婦女提供相關服務,他也開始懷疑這種做法是否正確。他說他認為臨床使用這種檢測法,也不失為一種進一步驗證的方法,因為要對大量病人進行試驗,耗費極大,因此非常困難;唯一能夠進行研究的方式,就是讓「實驗室公司」推廣提供檢測服務,弄來夠多的病人。摩爾指出像乳房X光片等許多檢測法,都是一邊提供給病人做輔助診斷之用,一邊收集研究資料;不過這是否是恰當的時機,摩爾自己也不知道。

劇烈反彈

金絲雀基金會

2008年6月,「實驗室公司」提供「確保卵巢」檢測服務,索價兩百二十到兩百四十美元之間。媒體報導說,這項檢測服務將提供給卵巢癌高危險群婦女,並引述摩爾的話:「我很高興有這項檢測,能幫助醫師在最早期的階段,偵測並治療卵巢癌。」病人之間口耳相傳,興奮不已,但很快就有叫大家小心謹慎的故事出現。有個曾經罹患卵巢癌的患者,第一天就衝去做檢測,結果顯示全無癌症跡象;一個星期後去做掃瞄,卻發現癌症復發,整個人都崩潰了。

在「實驗室公司」宣布後一週,美國婦癌學會發表一份聲明,表示「還需要做進一步研究,以驗證這項檢測的效力」。發表於《臨床癌症研究》的那篇論文,也在贊助早期癌症偵測研究工作的非營利組織「金絲雀基金會」科學家之間傳閱,他們發現還有其他問題值得擔心。基金會成員之一,在 FHCRC 擔任婦癌研究計畫主的娥班 (Nicole Urban) ,就發現檢測所用的一種蛋白質,其濃度對於壓力反應非常敏感,而那是每個有卵巢癌症狀,因此走進診所的婦女,非常可能會有的情緒;對此加以控制處理後,這種蛋白質就跟惡性腫瘤完全無關,所以一點用也沒有。

其他人則指出,論文所提到的高敏感度與高特異度,並沒有任何圖表和數據加以顯示;他們對於這項檢測聲稱「及早發現,及早治療,成功率高」的論調,也頗有微詞。同樣是金絲雀基金會成員,在 FHCRC 研究早期卵巢癌生物標記的麥金塔 (Martin McIntosh) 表示,研究裡有很多不確定性跟偏差,但是卻隱惡揚善,對注意事項隻字未提。金絲雀基金會的成員去函《臨床癌症研究》,陳述他們的意見。范恩也同意共同執筆第二封去函來批評論文,即使他自己還是那篇論文的共同作者。

這場紛爭鬧到了 FDA ,他們在2008年8月7日,去函「實驗室公司」,表示該檢驗「未經適當臨床驗證,可能對於公眾健康有害」。 FDA 在2008年9月29日,去函第二封信,聲明「實驗室公司」並沒有為這項檢測,從 FDA 取得必需的上市許可。「實驗室公司」在10月20日回覆 FDA ,反駁 FDA 的聲明,但同意讓「確保卵巢」服務下市。四天後服務下市,正好就在《臨床癌症研究》發表金絲雀基金會與范恩撰寫的兩封批判信,連同第三封來自疾病管制預防中心 (CDC) 的信函的隔一天。「毫孔公司」則繼續販售這種生物標記,但僅供研究所用,而不提供給病人。

摩爾對這三封信大感吃驚,他撰文回應,駁斥了其中某些批評,並表示任何跟檢測商業化有關的事情,都請去找「實驗室公司」討論。該公司的投資關係副總裁安德森 (Stephen Anderson) 表示,「確保卵巢」並不是拿來偵測癌症復發的,但有些病人卻這樣幹。他並且表示,該公司仍然認為「確保卵巢」檢測法與其他診斷技法結合之下,可為偵測卵巢癌提供寶貴的服務,相關檢驗仍在研發當中。該公司不會再進一步表示意見。

疑慮與教訓

麥金塔

從那之後,摩爾就致力於驗證他的檢測法。他跟渥德完成了一項研究,這次樣本數大得多,還包含了許多診斷出罹患最早期卵巢癌的婦女,結果依然是相當漂亮地,將病患從健康控制組中辨別出來。摩爾說他搞不懂 PLCO 的試驗結果,他希望進一步的分析,有助於解釋為何他的生物標記過不了關。他依然對其檢測法信心滿滿,認為這對高危險群很管用,而且每隔兩三個月定期檢測,也有助於監控復發情況。但是整件事情讓他不太想繼續鑽研生物標記了,他現在轉而研究癌症幹細胞去了。

其他人的說法有是相同,這套檢測法在 PLCO 試驗結果裡表現很差,讓人懷疑它甚至在高危險群裡都是否管用。麥金塔說這應該當作一種警鐘,整個研究領域都必須要面對。這當然也包括他自己在內,即使他服務的 FHCRC 所能找到最有前途的生物標記,都沒能改良 CA-125 的效力,實在是令人大失所望。

在2012年發表研究成果的 IOM 委員會,在吸取此次失敗的教訓,以及參考少數幾個成功的案例後,也許能找出一條前行之路。目前最迫切的需要,就是要用適當的樣本,在檢驗法供臨床使用之前,讓研究者得以驗證其生物標記。范恩說 EDRN 已經從尚未顯現症狀,以及罹癌各種階段的病患身上,收集了高品質的組織樣本,研究者可以申請進行生物標記驗證。

在這種檢測法變成家常便飯之前,誰都沒辦法排除這套搞法就是行不通的可能性。麥金塔說,人們談論早期偵測生物標記,好像這就是事實,我們只要把它們找出來便是;但實際上這種東西是否真的存在,都還是個必須要加以驗證的假設。

發表迴響

你的電子郵件位址並不會被公開。 必要欄位標記為 *


4 + 6 =