從科學研究的歷史來看,,形成一門學科并非一件容易的事,。但在人類基因組計劃實施的短短幾年間,以××組學(-omics)構(gòu)成的學科如雨后春筍般,,迅速地在生命科學界蔓延,。最早出現(xiàn)的是與DNA相關的“基因組學”(genomics),隨后又產(chǎn)生了許多與各種生物大分子或小分子相關的“組學”,,如蛋白質(zhì)組學(proteomics),、轉(zhuǎn)錄組學(transcriptomics),、代謝組學(metabolomics)等。復合名詞則更是不可勝數(shù),,以基因組學為例,,在文獻中就可以看到結(jié)構(gòu)基因組學、功能基因組學,、癌癥基因組學,、藥物基因組學、毒理基因組學,、環(huán)境基因組學和營養(yǎng)基因組學等,。這些術語的出現(xiàn),從積極的方面來看,,表現(xiàn)了生命科學的活力和迅速發(fā)展的勢頭,。從消極的方面來看,則暗示了一種浮躁和輕率,。本文試圖對后基因組時代出現(xiàn)的這諸多的“組學”進行一番梳理,,并對這些新興學科進行反思和討論。
工程型與概念型大科學
人類基因組計劃常被人們譽為生命科學的“登月計劃”,。這一比喻應該說是很恰當?shù)?,不僅說明這兩者都是大科學,有大量人力物力的投入,,而且表明兩者都擁有一個清晰,、具體的目的。對于前者而言,,是測出人類基因組所含的32億個堿基對,;對于后者來說,則是讓人類跨越38.4萬千米的空間距離,,登上月球,。換句話說,這兩個計劃都屬于科學工程,。凡是工程都具有這樣一個特點:目的明確,,可進行評估和度量。比如要建造一幢樓房或架設一座橋梁,,顯然我們是有著明確的目的,,而且可以對工程的實施進度和完成情況進行具體的和定量的評判。盡管“登月計劃”和人類基因組測序工作要遠比蓋房子復雜和困難,,但本質(zhì)上都符合工程的范疇,。根據(jù)這一標準,筆者把生命科學領域中研究目的可以被明確界定和度量的大科學,,如測定物種基因組全序列的基因組學,,稱為“工程型大科學”,。
生命科學領域中還存在另外一類大科學,例如“相互作用組學”(interactomics),、藥物基因組學,、環(huán)境基因組學等。它們與工程型大科學有著很大的區(qū)別,,因為其研究目的不是明確可辨的,,通常也難以對其進行具體的評估。這類大科學通常圍繞著某種概念來進行研究,,例如相互作用組學是以“相互作用”這一概念為主導,,環(huán)境基因組學則以“環(huán)境”這一概念為核心。但是,,在“相互作用”和“環(huán)境”指導下的研究內(nèi)容是模糊的,研究邊界也是變化的,。此外,,這類大科學不同于工程型大科學的另一特點是,研究永無止境,,沒有結(jié)束的客觀依據(jù)或判定標準,。人類基因組序列一旦測完,就可宣稱人類基因組計劃結(jié)束,。但是根據(jù)什么來判斷酵母相互作用組的研究工作完成與否呢,?筆者把這類沒有明確目的和判定尺度的大科學研究稱為“概念型大科學”。
當然,,對這兩種類型的大科學的區(qū)別有時是很微妙的,。美國國立癌癥研究所在1997年發(fā)起了一個“癌基因組解剖學計劃”(Cancer Genome Anatomy Project,CGAP),,其目的是要收集和分析與癌癥有關的遺傳和基因組數(shù)據(jù),。這個計劃內(nèi)的兩個子計劃——哺乳動物基因收集(Mammalian Gene Collection)和癌細胞染色體畸變計劃(Cancer Chromosome Aberration Project),則分別屬于工程型和概念型大科學,。因為前者有可以判據(jù)的目標——收集所有人和小鼠的基因表達產(chǎn)物(全長cDNA),,后者卻無法判定其目標的實現(xiàn)——收集所有癌細胞的染色體畸變類型。從這個意義上說,,代謝組學或蛋白質(zhì)組學都更接近概念型大科學,,因為沒有標尺測量它們的完成情況?!?/p>
兩 難 的 抉 擇
迄今為止,,在生物學的大科學研究領域,基因組學最為成功,,從低等微生物到高等動植物中的許多物種的基因組都已被破譯,?;蚪M學的成功理所當然,因為它是典型的工程型大科學,。此外,,基因組學成功的另外一個原因是對技術的強烈依賴性。只要技術可行,,目的就能達到,。在1980年代初提出測定人類基因組的想法時,許多科學家都認為這是一個不可能實現(xiàn)的計劃,,因為當時的測序能力極低,,一年不過數(shù)萬個堿基。隨著DNA自動測序技術的出現(xiàn)和發(fā)展,,測序能力迅速提高,,在1998年已達到年測序能力9000萬堿基,2003年估計會達到每年5億堿基,。這種對技術的依賴也正是工程型大科學的一個主要特征,。所以,如果要準備開展一個大科學項目,,那么應該著眼于那些研究目的明確,、技術方法可行的工程型大科學項目。
但是,,生命科學領域的工程型大科學也有其先天不足,。首先,這類大科學不是針對具體的生物學問題來進行的,,也不能回答或解決具體的生物學問題,。其研究的最終結(jié)果只是為生物學問題的研究準備一個數(shù)據(jù)庫,提供一種進行大規(guī)模,、高通量研究的基礎,。例如芽殖酵母(S. cerevisiae)基因組全序列的測定,一方面給出了所有基因的信息,,另一方面讓基因芯片分析,、蛋白質(zhì)相互作用組研究成為可能。如果這些數(shù)據(jù)沒有被用于進一步的功能性研究,,其價值將會大打折扣,。
科學研究的標準之一是可重復性,不同的實驗室得到同樣的結(jié)果才是真實可信的,。但是,,在工程型大科學中,這一標準就難以貫徹了。很少有人愿意把一個已經(jīng)測完的基因組,,再投入大量的人力和物力去重測一遍,。雖然人們會制定一套標準來防止錯誤,如美國國立衛(wèi)生研究院和能源部設立了測序合格的三個標準,,但顯然還會有不少錯誤的信息存在于數(shù)據(jù)庫中,。不久前,美國人類基因組計劃的專家分析了國際人類基因組計劃(HGP)公布的人類基因組序列,,以及美國塞萊拉(Celera)公司采用鳥槍法測定的人類基因組序列,,認為塞萊拉公司并沒有做什么事,只是把公共數(shù)據(jù)庫里的數(shù)據(jù)重新拼裝而已,。塞萊拉公司的專家則否認這一指控,。這一案例表明,即使對同一個基因組分別測序,,兩個數(shù)據(jù)庫的差異也是不容易說清楚的,。蛋白質(zhì)組數(shù)據(jù)的問題更為嚴重,因為實驗條件的微小差別,,都可以導致不同的蛋白質(zhì)表達譜,。國際蛋白質(zhì)組織在2002年4月,專門成立了旨在建立統(tǒng)一標準的蛋白質(zhì)組學標準計劃(Proteomics Standards Initiative),。工程型大科學的這種不可重復性對研究者和科研管理者都是一個挑戰(zhàn):怎樣評判這類生物學大工程的質(zhì)量?
回過頭來看生命科學領域的概念型大科學,,它們顯然有著誘人的另外一面:這類研究的內(nèi)容或目的通常是與生物學現(xiàn)象或問題緊密相關的,。例如,癌細胞染色體畸變計劃的實施,,有助于了解癌變機理和對腫瘤的診斷,。此外,這類大科學與常規(guī)實驗室研究有著緊密的聯(lián)系,,各種小型實驗室的研究力量都能夠加入到這種類型的研究工作中,。而工程型大科學常常局限于一些大型的研究實體,如在美國,,公共的測序工作主要是由三個測序中心承擔,。目前,概念型大科學種類和項目要遠遠多于工程型大科學,,原因在于公眾和政府更愿意把錢投到有實際意義的研究中,,科學家更容易參與到與生物學問題和現(xiàn)象相關的研究中。
對于概念型大科學而言,,研究的核心理念必然涉及到概念和假設,。如果起始的概念和假設是正確的,那么研究工作就是有意義的。反之,,研究工作的價值就很成問題,。而工程型大科學就不存在這種潛在的危險。美國國立衛(wèi)生研究院在2002年10月宣布,,啟動一項被稱為“單型作圖”(Haplotype Map)的計劃,,在3年時間內(nèi)投入1億美金,構(gòu)建人類基因組的單型圖譜,。“單型”(haplotype)是一個從基因組研究中形成的新概念:基因組的DNA序列并不是隨機的排列在一起,,而是由被稱為“單型”的基本結(jié)構(gòu)單元所組成。啟動“單型作圖”計劃的假設是,,“單型”在不同人種是不一樣的,,而且單型與疾病有著密切的關系。但是,,有許多科學家反對這一計劃,,認為這個概念和假設都尚未被證實,很有可能不是這么回事,。由此可見,,從事概念型大科學的風險要遠大于工程型大科學。
借用一下數(shù)學術語,,工程型大科學是收斂的,,有一個終點;而概念型大科學是發(fā)散的,,難以界定其最終的研究目的,,因此概念型大科學要取得工程型大科學那樣的成功常常是很困難的。美國在1970年代初曾掀起過一場攻克癌癥的戰(zhàn)爭,。當時是由總統(tǒng)掛帥,,國會立法,實施“國家癌癥計劃”,。然而,,30多年過去了,盡管投入了遠遠超過人類基因組計劃的人力和物力,,卻沒有取得人們所預期的成果,,因為癌癥的復雜性遠遠超過了人們在計劃啟動時對癌癥的理解。今天,,在后基因組時代出現(xiàn)的這些形形色色的概念型大科學,,究竟有多少成果可以收獲還是很難估計的?!?/p>
從上述討論中可以看到,,生命科學領域中的這兩類大科學有某種互補性,,工程型大科學的短處正好是概念性大科學的長處,反之亦然,。古人曾說過,,魚與熊掌不可兼而得之。對于這兩類大科學來說,,是否也是只能選取其中之一種,,還是有某種方式可以同時兼顧?以筆者看來,,系統(tǒng)生物學是一種能夠把這兩類不同的大科學進行整合的途徑,。工程型大科學實際上就是所謂“發(fā)現(xiàn)的科學”,以構(gòu)造數(shù)據(jù)庫為主要任務,;概念型大科學本質(zhì)上屬于“假設驅(qū)動的科學”,,以研究生物學問題為主線。而系統(tǒng)生物學的特點,,正是整合“發(fā)現(xiàn)的科學”和“假設驅(qū)動的科學”,。(http://blog.bioon.com)