meta-分析的緣起
meta-分析,簡單來說,,就是將來自于已經(jīng)發(fā)表的臨床試驗數(shù)據(jù),通過一定的規(guī)范化處理后,,合并到一起,,然后看看這合并后的結(jié)果,與原來的單個研究有什么不同或者相同之處,。
既然可以做臨床試驗,,為什么還需要meta-分析?作為從循證醫(yī)學(xué)進(jìn)入中國之初就開始進(jìn)行meta-分析研究的醫(yī)生和科學(xué)家,,我們認(rèn)為以下幾個理由是主要的:
●大多數(shù)臨床試驗的樣本量不夠大,。樣本量小了,其對假說的驗證能力就低了,,但是大樣本臨床試驗成本很高,。把來自于很多個研究者的臨床試驗通過meta-分析合并在一起,可以在不增加成本的情況,,很快地增加樣本量,,從而減少達(dá)到有效樣本量所需結(jié)論的成本。
●即使近年來單個試驗樣本量越來越大,,但是越大樣本的大型研究,,其受到研究者和資助者主客觀因素的影響也很多,設(shè)計可能未必很合理,,得到的結(jié)論往往是良莠不齊,。嚴(yán)格遵循國際標(biāo)準(zhǔn)的meta-分析,會全面地梳理這些因素,,從而為一些爭論不休的問題理清思路,,這一意義上,meta-分析具有某種臨床試驗裁判官的位置,。
●既然很多臨床試驗研究的對象具有某種相似性,為什么不把這些看起來相似的試驗的數(shù)據(jù)合并在一起呢,?
對于上世紀(jì)后半葉的臨床研究者來說,,這些理由是強(qiáng)有力的。因此,meta-分析發(fā)展并大大興旺起來,。meta-分析興起之初,,對于若干重要臨床爭論的解決提供了很好的路徑,成為劃時代的臨床科學(xué)研究工具,。
meta-分析在方法學(xué)上的先天不足
但是,,meta-分析是具有先天缺陷的。這就是所謂的“異質(zhì)性”(heterogeneity),。那么,,什么是異質(zhì)性呢?這個詞對于統(tǒng)計專業(yè)之外的讀者有點拗口,,不過把它的反義詞拿出來,,就有助于理解了,那就是“一致性”(homogeneity),,可以直觀地理解為臨床試驗之間所具有的相似性,。客觀現(xiàn)實是:即使臨床試驗是針對同一類疾病,、同種治療手段而開展的,,由于人和人之間具有的差異性,由于試驗設(shè)計以及試驗環(huán)境的差異性,,我們不可能找到絕對相同的兩個研究,。但研究間可以存在大小不等的相似性。當(dāng)在不同時間,、地點或由不同研究者所進(jìn)行的試驗具有相當(dāng)?shù)南嗨菩詴r,,合并它們就是合理的。為達(dá)此目的,,就必須確定一種分類界限:即從大量研究中找出一些具相似研究,,并確認(rèn)它們本質(zhì)上的相似性,將它們和別的,、本質(zhì)上完全不同(差異過大)的研究區(qū)分開來,。異質(zhì)性指的就是這種存在于研究之間的、根本上的差異性,。本質(zhì)上不同的研究不應(yīng)當(dāng)合并,,不解決異質(zhì)性問題而進(jìn)行的任何meta-分析,是不科學(xué)的,。
經(jīng)典異質(zhì)性檢驗:理論與統(tǒng)計學(xué)上的缺陷
meta-分析的先驅(qū)者們深知異質(zhì)性問題的關(guān)鍵性,,從很早的時候起,他們就努力尋找測度異質(zhì)性的方法,。最終發(fā)展定量化評估方法,,此即目前流行的以Q和I?為代表的所謂“異質(zhì)性檢驗”。然而,我們剛剛發(fā)表的一個研究從數(shù)學(xué)上證明:這些經(jīng)典的,,已經(jīng)襲用十余年的“異質(zhì)性檢驗”方法學(xué)是有缺陷的,。換句話說,過去十幾年來的循證醫(yī)學(xué),,其貌似強(qiáng)大的地基,,實是建立于沙灘之上的。
meta-分析的不可靠性:數(shù)學(xué)證明
科克倫教授(Cochran)及其同事們在創(chuàng)立meta-分析時就發(fā)現(xiàn),,不同的臨床試驗在數(shù)據(jù)采集,、樣本的具體情況方面所具有的差異屬性實在是太多了,要證明能夠?qū)碜圆煌芯康臄?shù)據(jù)合并在一起分析在數(shù)學(xué)上是可接受的(legitimate),,并不是那么容易,。定義異質(zhì)性并加以定量評價,一直是循證醫(yī)學(xué)發(fā)展過程中在其方法學(xué)領(lǐng)域最為重要的問題之一,。
Q統(tǒng)計量是用來評價meta-分析研究間的差異總和的一種統(tǒng)計量,。Q值越大,說明所納入的研究之間存在越大的異質(zhì)性,;反之,,Q值越小,則說明所納入的研究之間的差異性越小,。但Q的計算方法中隱含了對研究數(shù)目的依賴,。當(dāng)納入研究的數(shù)量逐漸增大時,Q值將發(fā)生“過度膨脹”,,從而造成假陽性檢驗結(jié)果(即不論研究是否真的來自于相似的抽樣總體,,只要研究數(shù)增加,Q值都會將最終結(jié)果判定為“來自于不同總體”),。為解決Q對研究數(shù)量不當(dāng)依賴問題,,英國循證醫(yī)學(xué)專家希金斯(Higgins J)提出通過Q的計算公式中減去樣本數(shù)的修正思路,他們將這一修正方法稱之為“I?檢驗”,,并認(rèn)為I?因而比Q更為合理,。希金斯將這一方法寫成研究論文,發(fā)表于2003年的《不列顛醫(yī)學(xué)雜志》(British Medical Journal,,BMJ),。此后,I?迅速被業(yè)界接受為異質(zhì)性度量的標(biāo)準(zhǔn),,被寫入了包括Cochrane系統(tǒng)評價手冊在內(nèi)的幾乎所有循證醫(yī)學(xué)教科書,,是如今幾乎每一篇meta-分析都會用到的方法。
但是,,由四川省人民醫(yī)院聯(lián)合國內(nèi)多家知名研究單位的多學(xué)科專家共同完成的這項研究,,從數(shù)學(xué)上證明了上述經(jīng)典方法是不可靠的,。我們通過數(shù)值仿真證明:當(dāng)樣本數(shù)逐漸增大的時候,,I?值將隨著之而增加,,其上升趨勢單調(diào)不降(見下圖)。這意味著只要研究樣本量足夠大,,哪怕是根本不可能存在異質(zhì)性的,、來自同一總體的抽樣,仍然會被I2檢驗判定為存在有異質(zhì)性,。這一研究也證明Q同樣依賴于樣本量的大小,。
(I?值隨樣本量增加而線性增加)
異質(zhì)性檢驗本質(zhì)上是為保障meta-分析的可靠性,使其能夠?qū)碜远鄠€臨床試驗的數(shù)據(jù)進(jìn)行合并,,擴(kuò)大樣本量從而實現(xiàn)檢驗假設(shè)所必須的效應(yīng)量,。然而,我們證明,,隨著研究數(shù)量的增加,,合并了臨床試驗并使得樣本量增加的meta-分析,其異質(zhì)性檢驗的結(jié)果完全不可靠,。具有諷刺意味的是,,現(xiàn)代臨床試驗在面對各種矛盾和似是而非的結(jié)論的時候往往乞靈于“更大樣本的試驗”。這兩方面不可調(diào)和的矛盾說明了meta-分析在邏輯上不能自洽,,方法學(xué)基礎(chǔ)存在重大缺陷,。
反思建立在meta-分析基礎(chǔ)之上的循證醫(yī)學(xué)
循證醫(yī)學(xué)的創(chuàng)始人之一薩基特教授(David Sacket)在其名著《循證醫(yī)學(xué)的教學(xué)與實踐》(Evidence-based Medicine:How to Practice and Teach EBM)中曾經(jīng)指出,慎重,、準(zhǔn)確和明智地應(yīng)用當(dāng)前所能獲得的最好的研究依據(jù),,同時結(jié)合醫(yī)生的個人專業(yè)技能和多年臨床經(jīng)驗,考慮病人的價值和愿望,,將三者完美地結(jié)合制定出病人的治療措施方可稱為循證醫(yī)學(xué),。然而,在循證醫(yī)學(xué)向的發(fā)展進(jìn)程中,,由于制定證據(jù)分級體系時,,過分強(qiáng)調(diào)meta-分析和大樣本RCT的作用,使得在實踐中,,臨床研究者和廣大的醫(yī)務(wù)人員逐漸把最佳證據(jù)理解為:大樣本RCT以及基于這類研究的meta分析,。隨著時間的推移,越來越多的RCT和meta-分析已經(jīng)顯示出各種自相矛盾性,,使得臨床醫(yī)師無所適從,。
如今我們已經(jīng)認(rèn)識到,任何RCT都將面對如下的,、無法回避的挑戰(zhàn):對最終考察目標(biāo)的可造成實質(zhì)性影響的因素遠(yuǎn)遠(yuǎn)多于人們最初的預(yù)想,。隨機(jī)化試圖控制的是存在于患者個體間的差異,。本質(zhì)上,個體差異反映的是從基因組到宏觀表型的差異,。隨著對基因組認(rèn)識的深化,,我們認(rèn)識到,影響特定臨床表型(如血壓,、血糖水平,、腫瘤類型)的基因數(shù)量十分眾多。例如,,與創(chuàng)傷后創(chuàng)面愈合功能密切相關(guān)的基因就有651個,。這還僅僅是從基因組的角度來考慮。進(jìn)一步考慮在轉(zhuǎn)錄,、表達(dá)水平的影響因素,,那么可影響臨床結(jié)局的分子因素將以數(shù)量級增加。
假設(shè)這些影響因素在人群中的分布都是隨機(jī)的,,即正態(tài)分布,,存在于個體間的、數(shù)以萬千計的影響因素在數(shù)學(xué)上其實已經(jīng)構(gòu)成了有著數(shù)以萬記維度的超高維空間?,F(xiàn)實中的RCT,,能納入成千個樣本的,已經(jīng)是相當(dāng)難得的大型研究了,。面對上述本質(zhì)上分布于超高維空間中的個體差異,,即使有數(shù)以千計的研究對象,也幾乎完全不可能是做到真正隨機(jī),。此種情形下,,對一個RCT中發(fā)現(xiàn)的存在于組間的臨床結(jié)局的“顯著性”差異,其真實原因有很大可能是由完全不可控的偏倚所造成的,。
所以,,應(yīng)該認(rèn)識到,RCT這一誕生于半個世紀(jì)之前的研究范式,,其方法學(xué)基礎(chǔ)是虛幻的:隨機(jī)化可平衡個體變異,,能夠保證的僅僅是每個參加實驗的對象均有“同等機(jī)會”被分配到試驗組和對照組當(dāng)中,但不能保證每個影響實驗結(jié)局的因素都有“均等機(jī)會”被分配到兩組當(dāng)中,。
引入新方法,,建立新一代循證醫(yī)學(xué)的研究范式
歸根結(jié)底,RCT,、隊列研究以及病例-對照研究,,其哲學(xué)本體其實并沒有太大差別:此即觀察和收集數(shù)據(jù)。神秘化,、毫無節(jié)制地崇拜大樣本,、前瞻性臨床試驗以及基于這些試驗的meta-分析,,實在是一種迷信。面對復(fù)雜的疾病生物現(xiàn)象,,應(yīng)該承認(rèn):第一代循證醫(yī)學(xué)及其背后的,、基于18-19世紀(jì)古典統(tǒng)計學(xué)思想的研究范式,到了應(yīng)該被揚(yáng)棄的時候,。
實事求是的觀點應(yīng)該是:臨床數(shù)據(jù),,不論是來前瞻性試驗的,還是來自于臨床日常工作中的,,在經(jīng)過適當(dāng)?shù)慕y(tǒng)一化和清理之后,是具有同等應(yīng)用地位的,。理想的新一代循證醫(yī)學(xué)方法,,應(yīng)當(dāng)建立在廣泛性的原始數(shù)據(jù)開源基礎(chǔ)上。
我們也深知,,大范圍的數(shù)據(jù)開源,,還需等待一個較長的過程。在逐步轉(zhuǎn)變的過程中,,對于經(jīng)過研究者整理的數(shù)據(jù),,依然有很大的進(jìn)行“二次研究”的需求和必要性。在這過渡時期,,各學(xué)科應(yīng)該加強(qiáng)對數(shù)據(jù)報告規(guī)范性的要求,,引入并開發(fā)一些適合于這些數(shù)據(jù)的模型。我們最近進(jìn)行的一項對危重病患者最佳能量攝入?yún)^(qū)間的研究中,,就已經(jīng)發(fā)現(xiàn),,與經(jīng)典的、基于“專家經(jīng)驗”的meta-分析比較,,基于無偏倚聚類的機(jī)器學(xué)習(xí)是更為合理的對研究間相似性和異質(zhì)性進(jìn)行判斷的方法,。新一代醫(yī)學(xué)統(tǒng)計思路,應(yīng)該基于謹(jǐn)慎細(xì)致的評估數(shù)據(jù)類型,,選擇最適合于數(shù)據(jù)的模型,。此即:“數(shù)據(jù)驅(qū)動,模型適應(yīng)之”,,而非“模型驅(qū)動,,數(shù)據(jù)適應(yīng)之”。
針對有關(guān)統(tǒng)計學(xué)數(shù)據(jù)報告的規(guī)范性和研究重現(xiàn)性問題,,我國知名統(tǒng)計學(xué)家謝益輝教授發(fā)布了基于R語言的一個工具包(package),。并倡導(dǎo)利用該工具包來撰寫動態(tài)的統(tǒng)計報告。這一研究范式,,可以很好的增加研究結(jié)果的可信性,,從而避免些統(tǒng)計方法的使用錯誤,,有利于后來的研究者對已發(fā)表研究的數(shù)據(jù)進(jìn)行深入利用和挖掘。
因之,,必須將臨床數(shù)據(jù)與基礎(chǔ)研究的數(shù)據(jù)相互結(jié)合,,使機(jī)制性解釋和臨床宏觀表型之間形成結(jié)合,使臨床研究擺脫久已受人詬病的“黑箱模式”:其起點,,是細(xì)致的描述從分子機(jī)制到臨床過程的各種尺度上的復(fù)雜性,。不再寄希望于僅僅使用“病死率”、“并發(fā)癥率”,、“住院時間”,、“靈敏度”、“特異度”等很少一些指標(biāo)來衡量臨床干預(yù)或診斷措施的成敗,。一旦機(jī)理性和機(jī)制性過程能夠與臨床表型相結(jié)合,,我們就能發(fā)展出真正精準(zhǔn)、個體化的臨床評估體系,。
需要強(qiáng)調(diào)指出,,循證醫(yī)學(xué)先驅(qū)們所開創(chuàng)的臨床研究哲學(xué):以證據(jù)為基礎(chǔ),結(jié)合患者需求以及考慮衛(wèi)生經(jīng)濟(jì)的可持續(xù)發(fā)展,,依然是強(qiáng)有力的,。新一代的醫(yī)生和科學(xué)家,應(yīng)當(dāng)勇敢的接過前輩遞給我們的接力棒,,直面挑戰(zhàn),,努力學(xué)習(xí),毫不猶豫地跨過學(xué)科之間的界限與鴻溝,,發(fā)展出全新一代的循證醫(yī)學(xué)研究范式,。我們深信,臨床醫(yī)學(xué)徹底的革命,,或?qū)⒁晕覀冸y以預(yù)計的速度到來,。解決世界性醫(yī)療資源緊缺難題的鑰匙,也正蘊(yùn)含于其中,。
(本文作者江華,、楊浩、彭謹(jǐn),,單位均為四川省人民醫(yī)院,。另北京協(xié)和醫(yī)院陳偉,四川省人民醫(yī)院Charles Damien Lu對本文亦有貢獻(xiàn),。)