過(guò)去二十年以來(lái),統治整個(gè)臨床研究領(lǐng)域的方法學(xué)范式是循證醫學(xué),對于臨床醫生而言,循證醫學(xué)代表著(zhù)三樣東西:大樣本前瞻性臨床試驗,尤其是大樣本隨機對照試驗(RCT);Meta-分析;循證指南。循證指南基于RCT和Meta-分析,尤其是后者,在權威的循證醫學(xué)國際組織Cochrane協(xié)作網(wǎng)的定義中,是所謂的“最高級別”的臨床證據,被認為是制定指南以及指導臨床醫生進(jìn)行診療決策最重要的科學(xué)依據。
Meta-分析的緣起
Meta-分析,簡(jiǎn)單來(lái)說(shuō),就是將來(lái)自于已經(jīng)發(fā)表的臨床試驗數據,通過(guò)一定的規范化處理后,合并到一起,然后看看這合并后的結果,與原來(lái)的單個(gè)研究有什么不同或者相同之處。
既然可以做臨床試驗,為什么還需要Meta-分析?作為從循證醫學(xué)進(jìn)入中國之初就開(kāi)始進(jìn)行Meta-分析研究的醫生和科學(xué)家,我們認為以下幾個(gè)理由是主要的:
●大多數臨床試驗的樣本量不夠大。樣本量小了,其對假說(shuō)的驗證能力就低了,但是大樣本臨床試驗成本很高。把來(lái)自于很多個(gè)研究者的臨床試驗通過(guò)Meta-分析合并在一起,可以在不增加成本的情況,很快地增加樣本量,從而減少達到有效樣本量所需結論的成本。
●即使近年來(lái)單個(gè)試驗樣本量越來(lái)越大,但是越大樣本的大型研究,其受到研究者和資助者主客觀(guān)因素的影響也很多,設計可能未必很合理,得到的結論往往是良莠不齊。嚴格遵循國際標準的Meta-分析,會(huì )全面地梳理這些因素,從而為一些爭論不休的問(wèn)題理清思路,這一意義上,Meta-分析具有某種臨床試驗裁判官的位置。
●既然很多臨床試驗研究的對象具有某種相似性,為什么不把這些看起來(lái)相似的試驗的數據合并在一起呢?
對于上世紀后半葉的臨床研究者來(lái)說(shuō),這些理由是強有力的。因此,Meta-分析發(fā)展并大大興旺起來(lái)。Meta-分析興起之初,對于若干重要臨床爭論的解決提供了很好的路徑,成為劃時(shí)代的臨床科學(xué)研究工具。
Meta-分析在方法學(xué)上的先天不足
但是,Meta-分析是具有先天缺陷的。這就是所謂的“異質(zhì)性”(heterogeneity)。那么,什么是異質(zhì)性呢?這個(gè)詞對于統計專(zhuān)業(yè)之外的讀者有點(diǎn)拗口,不過(guò)把它的反義詞拿出來(lái),就有助于理解了,那就是“一致性”(homogeneity),可以直觀(guān)地理解為臨床試驗之間所具有的相似性。客觀(guān)現實(shí)是:即使臨床試驗是針對同一類(lèi)疾病、同種治療手段而開(kāi)展的,由于人和人之間具有的差異性,由于試驗設計以及試驗環(huán)境的差異性,我們不可能找到絕對相同的兩個(gè)研究。但研究間可以存在大小不等的相似性。當在不同時(shí)間、地點(diǎn)或由不同研究者所進(jìn)行的試驗具有相當的相似性時(shí),合并它們就是合理的。為達此目的,就必須確定一種分類(lèi)界限:即從大量研究中找出一些具相似研究,并確認它們本質(zhì)上的相似性,將它們和別的、本質(zhì)上完全不同(差異過(guò)大)的研究區分開(kāi)來(lái)。異質(zhì)性指的就是這種存在于研究之間的、根本上的差異性。本質(zhì)上不同的研究不應當合并,不解決異質(zhì)性問(wèn)題而進(jìn)行的任何Meta-分析,是不科學(xué)的。
經(jīng)典異質(zhì)性檢驗:理論與統計學(xué)上的缺陷
Meta-分析的先驅者們深知異質(zhì)性問(wèn)題的關(guān)鍵性,從很早的時(shí)候起,他們就努力尋找測度異質(zhì)性的方法。最終發(fā)展定量化評估方法,此即目前流行的以Q和I?為代表的所謂“異質(zhì)性檢驗”.然而,我們剛剛發(fā)表的一個(gè)研究從數學(xué)上證明:這些經(jīng)典的,已經(jīng)襲用十余年的“異質(zhì)性檢驗”方法學(xué)是有缺陷的。換句話(huà)說(shuō),過(guò)去十幾年來(lái)的循證醫學(xué),其貌似強大的地基,實(shí)是建立于沙灘之上的。
Meta-分析的不可靠性:數學(xué)證明
科克倫教授(Cochran)及其同事們在創(chuàng )立Meta-分析時(shí)就發(fā)現,不同的臨床試驗在數據采集、樣本的具體情況方面所具有的差異屬性實(shí)在是太多了,要證明能夠將來(lái)自不同研究的數據合并在一起分析在數學(xué)上是可接受的(legitimate),并不是那么容易。定義異質(zhì)性并加以定量評價(jià),一直是循證醫學(xué)發(fā)展過(guò)程中在其方法學(xué)領(lǐng)域最為重要的問(wèn)題之一。
Q統計量是用來(lái)評價(jià)Meta-分析研究間的差異總和的一種統計量。Q值越大,說(shuō)明所納入的研究之間存在越大的異質(zhì)性;反之,Q值越小,則說(shuō)明所納入的研究之間的差異性越小。但Q的計算方法中隱含了對研究數目的依賴(lài)。當納入研究的數量逐漸增大時(shí),Q值將發(fā)生“過(guò)度膨脹”,從而造成假陽(yáng)性檢驗結果(即不論研究是否真的來(lái)自于相似的抽樣總體,只要研究數增加,Q值都會(huì )將最終結果判定為“來(lái)自于不同總體”)。為解決Q對研究數量不當依賴(lài)問(wèn)題,英國循證醫學(xué)專(zhuān)家希金斯(Higgins J)提出通過(guò)Q的計算公式中減去樣本數的修正思路,他們將這一修正方法稱(chēng)之為“I?檢驗”,并認為I?因而比Q更為合理。希金斯將這一方法寫(xiě)成研究論文,發(fā)表于2003年的《不列顛醫學(xué)雜志》(British Medical Journal,BMJ)。此后,I?迅速被業(yè)界接受為異質(zhì)性度量的標準,被寫(xiě)入了包括Cochrane系統評價(jià)手冊在內的幾乎所有循證醫學(xué)教科書(shū),是如今幾乎每一篇Meta-分析都會(huì )用到的方法。
但是,由四川省人民醫院聯(lián)合國內多家知名研究單位的多學(xué)科專(zhuān)家共同完成的這項研究,從數學(xué)上證明了上述經(jīng)典方法是不可靠的。我們通過(guò)數值**證明:當樣本數逐漸增大的時(shí)候,I?值將隨著(zhù)之而增加,其上升趨勢單調不降(見(jiàn)下圖)。這意味著(zhù)只要研究樣本量足夠大,哪怕是根本不可能存在異質(zhì)性的、來(lái)自同一總體的抽樣,仍然會(huì )被I2檢驗判定為存在有異質(zhì)性。這一研究也證明Q同樣依賴(lài)于樣本量的大小。
(I?值隨樣本量增加而線(xiàn)性增加)
異質(zhì)性檢驗本質(zhì)上是為保障Meta-分析的可靠性,使其能夠將來(lái)自多個(gè)臨床試驗的數據進(jìn)行合并,擴大樣本量從而實(shí)現檢驗假設所必須的效應量。然而,我們證明,隨著(zhù)研究數量的增加,合并了臨床試驗并使得樣本量增加的Meta-分析,其異質(zhì)性檢驗的結果完全不可靠。具有諷刺意味的是,現代臨床試驗在面對各種矛盾和似是而非的結論的時(shí)候往往乞靈于“更大樣本的試驗”.這兩方面不可調和的矛盾說(shuō)明了Meta-分析在邏輯上不能自洽,方法學(xué)基礎存在重大缺陷。
反思建立在Meta-分析基礎之上的循證醫學(xué)
循證醫學(xué)的創(chuàng )始人之一薩基特教授(David Sacket)在其名著(zhù)《循證醫學(xué)的教學(xué)與實(shí)踐》(Evidence-Based Medicine:How to Practice and Teach EBM)中曾經(jīng)指出,慎重、準確和明智地應用當前所能獲得的最好的研究依據,同時(shí)結合醫生的個(gè)人專(zhuān)業(yè)技能和多年臨床經(jīng)驗,考慮病人的價(jià)值和愿望,將三者完美地結合制定出病人的治療措施方可稱(chēng)為循證醫學(xué)。然而,在循證醫學(xué)向的發(fā)展進(jìn)程中,由于制定證據分級體系時(shí),過(guò)分強調Meta-分析和大樣本RCT的作用,使得在實(shí)踐中,臨床研究者和廣大的醫務(wù)人員逐漸把最佳證據理解為:大樣本RCT以及基于這類(lèi)研究的Meta分析。隨著(zhù)時(shí)間的推移,越來(lái)越多的RCT和Meta-分析已經(jīng)顯示出各種自相矛盾性,使得臨床醫師無(wú)所適從。
如今我們已經(jīng)認識到,任何RCT都將面對如下的、無(wú)法回避的挑戰:對最終考察目標的可造成實(shí)質(zhì)性影響的因素遠遠多于人們最初的預想。隨機化試圖控制的是存在于患者個(gè)體間的差異。本質(zhì)上,個(gè)體差異反應的是從基因組到宏觀(guān)表型的差異。隨著(zhù)對基因組認識的深化,我們認識到,影響特定臨床表型(如血壓、血糖水平、腫瘤類(lèi)型)的基因數量十分眾多。例如,與創(chuàng )傷后創(chuàng )面愈合功能密切相關(guān)的基因就有651個(gè)。這還僅僅是從基因組的角度來(lái)考慮。進(jìn)一步考慮在轉錄、表達水平的影響因素,那么可影響臨床結局的分子因素將以數量級增加。
假設這些影響因素在人群中的分布都是隨機的,即正態(tài)分布,存在于個(gè)體間的、數以萬(wàn)千計的影響因素在數學(xué)上其實(shí)已經(jīng)構成了有著(zhù)數以萬(wàn)記維度的超高維空間。現實(shí)中的RCT,能納入成千個(gè)樣本的,已經(jīng)是相當難得的大型研究了。面對上述本質(zhì)上分布于超高維空間中的個(gè)體差異,即使有數以千計的研究對象,也幾乎完全不可能是做到真正隨機。此種情形下,對一個(gè)RCT中發(fā)現的存在于組間的臨床結局的“顯著(zhù)性”差異,其真實(shí)原因有很大可能是由完全不可控的偏倚所造成的。
所以,應該認識到,RCT這一誕生于半個(gè)世紀之前的**,其方法學(xué)基礎是虛幻的:隨機化可平衡個(gè)體變異,能夠保證的僅僅是每個(gè)參加實(shí)驗的對象均有“同等機會(huì )”被分配到試驗組和對照組當中,但不能保證每個(gè)影響實(shí)驗結局的因素都有“均等機會(huì )”被分配到兩組當中。
引入新方法,建立新一代循證醫學(xué)的**
歸根結底,RCT、隊列研究以及病例-對照研究,其哲學(xué)本體其實(shí)并沒(méi)有太大差別:此即觀(guān)察和收集數據。神秘化、毫無(wú)節制地崇拜大樣本、前瞻性臨床試驗以及基于這些試驗的Meta-分析,實(shí)在是一種迷信。面對復雜的疾病生物現象,應該承認:第一代循證醫學(xué)及其背后的、基于18-19世紀古典統計學(xué)思想的**,到了應該被揚棄的時(shí)候。
實(shí)事求是的觀(guān)點(diǎn)應該是:臨床數據,不論是來(lái)前瞻性試驗的,還是來(lái)自于臨床日常工作中的,在經(jīng)過(guò)適當的統一化和清理之后,是具有同等應用地位的。理想的新一代循證醫學(xué)方法,應當建立在廣泛性的原始數據開(kāi)源基礎上。
我們也深知,大范圍的數據開(kāi)源,還需等待一個(gè)較長(cháng)的過(guò)程。在逐步轉變的過(guò)程中,對于經(jīng)過(guò)研究者整理的數據,依然有很大的進(jìn)行“二次研究”的需求和必要性。在這過(guò)渡時(shí)期,各學(xué)科應該加強對數據報告規范性的要求,引入并開(kāi)發(fā)一些適合于這些數據的模型。我們最近進(jìn)行的一項對危重病患者最佳能量攝入區間的研究中,就已經(jīng)發(fā)現,與經(jīng)典的、基于“專(zhuān)家經(jīng)驗”的Meta-分析比較,基于無(wú)偏倚聚類(lèi)的機器學(xué)習是更為合理的對研究間相似性和異質(zhì)性進(jìn)行判斷的方法。新一代醫學(xué)統計思路,應該基于謹慎細致的評估數據類(lèi)型,選擇最適合于數據的模型。此即:“數據驅動(dòng),模型適應之”,而非“模型驅動(dòng),數據適應之”.
針對有關(guān)統計學(xué)數據報告的規范性和研究重現性問(wèn)題,我國知名統計學(xué)家謝益輝教授發(fā)布了基于R語(yǔ)言的一個(gè)工具包(package)。并倡導利用該工具包來(lái)撰寫(xiě)動(dòng)態(tài)的統計報告。這一**,可以很好的增加研究結果的可信性,從而避免些統計方法的使用錯誤,有利于后來(lái)的研究者對已發(fā)表研究的數據進(jìn)行深入利用和挖掘。
因之,必須將臨床數據與基礎研究的數據相互結合,使機制性解釋和臨床宏觀(guān)表型之間形成結合,使臨床研究擺脫久已受人詬病的“黑箱模式”:其起點(diǎn),是細致的描述從分子機制到臨床過(guò)程的各種尺度上的復雜性。不再寄希望于僅僅使用“病死率”、“并發(fā)癥率”、“住院時(shí)間”、“靈敏度”、“特異度”等很少一些指標來(lái)衡量臨床干預或診斷措施的成敗。一旦機理性和機制性過(guò)程能夠與臨床表型相結合,我們就能發(fā)展出真正精準、個(gè)體化的臨床評估體系。
需要強調指出,循證醫學(xué)先驅們所開(kāi)創(chuàng )的臨床研究哲學(xué):以證據為基礎,結合患者需求以及考慮衛生巾濟的可持續發(fā)展,依然是強有力的。新一代的醫生和科學(xué)家,應當勇敢的接過(guò)前輩遞給我們的接力棒,直面挑戰,努力學(xué)習,毫不猶豫地跨過(guò)學(xué)科之間的界限與鴻溝,發(fā)展出全新一代的循證醫學(xué)**。我們深信,臨床醫學(xué)徹底的***,或將以我們難以預計的速度到來(lái)。解決世界性醫療資源緊缺難題的鑰匙,也正蘊含于其中。
(本文作者江華、楊浩、彭謹,單位均為四川省人民醫院。另北京協(xié)和醫院陳偉,四川省人民醫院Charles Damien Lu對本文亦有貢獻。)
最新!醫生的平均年薪由改革前2011年的5.65萬(wàn)增加到2023年的19....[詳細]
連續工作滿(mǎn)15年或累計工作滿(mǎn)25年且仍在崗的鄉鎮衛生院專(zhuān)業(yè)技術(shù)人員,在滿(mǎn)足...[詳細]
意見(jiàn)反饋 關(guān)于我們 隱私保護 版權聲明 友情鏈接 聯(lián)系我們
Copyright 2002-2025 Iiyi.Com All Rights Reserved