系統(tǒng)生物學(xué)面面觀
吳家睿
系統(tǒng)理論和系統(tǒng)思想對于我國知識分子并不陌生,。1980年代在我國學(xué)術(shù)界曾經(jīng)流行過“三論”——系統(tǒng)論,、信息論和控制論,,其中的“系統(tǒng)論”是指奧地利科學(xué)家貝塔朗菲(L. Bertalanffy)在1970年代創(chuàng)立的“一般系統(tǒng)論”(general system theory),。盡管貝塔朗菲是以生物學(xué)家的身份去思考、研究并提出系統(tǒng)論的,,但他的系統(tǒng)論并不僅僅適用于生命科學(xué),,而且適用于物理學(xué)、心理學(xué),、經(jīng)濟(jì)學(xué)和社會科學(xué)等各門學(xué)科,。如果說過去所談?wù)摰氖侵冈谡軐W(xué)層面上的、普適性強(qiáng)的一般系統(tǒng)論,,那么本文所要介紹的系統(tǒng)生物學(xué)(systems biology),則是生命科學(xué)研究領(lǐng)域的一門新興學(xué)科,。
作為人類基因組計劃的發(fā)起人之一,,美國科學(xué)家萊諾伊·胡德(Leroy Hood)也是系統(tǒng)生物學(xué)的創(chuàng)始人之一。在胡德看來,,系統(tǒng)生物學(xué)和人類基因組計劃有著密切的關(guān)系,。正是在基因組學(xué)、蛋白質(zhì)組學(xué)等新型大科學(xué)發(fā)展的基礎(chǔ)上,,孕育了系統(tǒng)生物學(xué),。反之,系統(tǒng)生物學(xué)的誕生進(jìn)一步提升了后基因組時代的生命科學(xué)研究能力,。正如胡德所說,,“系統(tǒng)生物學(xué)將是21世紀(jì)醫(yī)學(xué)和生物學(xué)的核心驅(qū)動力”[1]?;谶@一信念,,胡德在1999年年底辭去了美國西雅圖市華盛頓大學(xué)的教職,與另外兩名志同道合的科學(xué)家一起創(chuàng)立了世界上第一個系統(tǒng)生物學(xué)研究所(Institute for Systems Biology),。隨后,,系統(tǒng)生物學(xué)便逐漸得到了生物學(xué)家的認(rèn)同,也喚起了一大批生物學(xué)研究領(lǐng)域以外的專家的關(guān)注,。2002年3月,,美國《科學(xué)》周刊登載了系統(tǒng)生物學(xué)專集。該專集導(dǎo)論中的第一句話這樣寫道:“如果對當(dāng)前流行的,、時髦的關(guān)鍵詞進(jìn)行一番分析,,那么人們會發(fā)現(xiàn),,‘系統(tǒng)’高居在排行榜上。”
什么是系統(tǒng)生物學(xué),?根據(jù)胡德的定義,,系統(tǒng)生物學(xué)是研究一個生物系統(tǒng)中所有組成成分(基因、mRNA,、蛋白質(zhì)等)的構(gòu)成,,以及在特定條件下這些組分間的相互關(guān)系的學(xué)科[1]。也就是說,,系統(tǒng)生物學(xué)不同于以往的實驗生物學(xué)——僅關(guān)心個別的基因和蛋白質(zhì),,它要研究所有的基因、所有的蛋白質(zhì),、組分間的所有相互關(guān)系,。顯然,系統(tǒng)生物學(xué)是以整體性研究為特征的一種大科學(xué),。
系統(tǒng)生物學(xué)的基本工作流程有這樣四個階段,。首先是對選定的某一生物系統(tǒng)的所有組分進(jìn)行了解和確定,描繪出該系統(tǒng)的結(jié)構(gòu),,包括基因相互作用網(wǎng)絡(luò)和代謝途徑,,以及細(xì)胞內(nèi)和細(xì)胞間的作用機(jī)理,以此構(gòu)造出一個初步的系統(tǒng)模型,。第二步是系統(tǒng)地改變被研究對象的內(nèi)部組成成分(如基因突變)或外部生長條件,,然后觀測在這些情況下系統(tǒng)組分或結(jié)構(gòu)所發(fā)生的相應(yīng)變化,包括基因表達(dá),、蛋白質(zhì)表達(dá)和相互作用,、代謝途徑等的變化,并把得到的有關(guān)信息進(jìn)行整合,。第三步是把通過實驗得到的數(shù)據(jù)與根據(jù)模型預(yù)測的情況進(jìn)行比較,,并對初始模型進(jìn)行修訂。第四階段是根據(jù)修正后的模型的預(yù)測或假設(shè),,設(shè)定和實施新的改變系統(tǒng)狀態(tài)的實驗,,重復(fù)第二步和第三步,不斷地通過實驗數(shù)據(jù)對模型進(jìn)行修訂和精練,。系統(tǒng)生物學(xué)的目標(biāo)就是要得到一個理想的模型,,使其理論預(yù)測能夠反映出生物系統(tǒng)的真實性。
系統(tǒng)生物學(xué)的靈魂——整合
作為后基因組時代的新秀,,系統(tǒng)生物學(xué)與基因組學(xué),、蛋白質(zhì)組學(xué)等各種“組學(xué)”的不同之處在于,它是一種整合型大科學(xué)。首先,,它要把系統(tǒng)內(nèi)不同性質(zhì)的構(gòu)成要素(基因,、mRNA、蛋白質(zhì),、生物小分子等)整合在一起進(jìn)行研究,。系統(tǒng)生物學(xué)研究所的第一篇研究論文,就是整合酵母的基因組分析和蛋白質(zhì)組分析,,研究酵母的代謝網(wǎng)絡(luò)[2],。由于不同生物分子的研究難度不一樣,技術(shù)發(fā)展程度不一樣,,目前對它們的研究水平有較大的差距,。例如,基因組和基因表達(dá)方面的研究已經(jīng)比較完善,,而蛋白質(zhì)研究就較為困難,,至于涉及生物小分子的代謝組分的研究就更不成熟。因此,,要真正實現(xiàn)這種整合還有很長的路要走,。
對于多細(xì)胞生物而言,系統(tǒng)生物學(xué)要實現(xiàn)從基因到細(xì)胞,、到組織,、到個體的各個層次的整合?!犊茖W(xué)》周刊系統(tǒng)生物學(xué)專集中一篇題為“心臟的模型化——從基因到細(xì)胞、到整個器官”的論文,,很好地體現(xiàn)了這種整合性[3],。我們知道,系統(tǒng)科學(xué)的核心思想是:“整體大于部分之和”,;系統(tǒng)特性是不同組成部分,、不同層次間相互作用而“涌現(xiàn)”的新性質(zhì);對組成部分或低層次的分析并不能真正地預(yù)測高層次的行為,。如何通過研究和整合去發(fā)現(xiàn)和理解涌現(xiàn)的系統(tǒng)性質(zhì),,是系統(tǒng)生物學(xué)面臨的一個帶根本性的挑戰(zhàn)。
系統(tǒng)生物學(xué)整合性的第三層含義是指研究思路和方法的整合,。經(jīng)典的分子生物學(xué)研究是一種垂直型的研究,,即采用多種手段研究個別的基因和蛋白質(zhì)。首先是在DNA水平上尋找特定的基因,,然后通過基因突變,、基因剔除等手段研究基因的功能;在基因研究的基礎(chǔ)上,,研究蛋白質(zhì)的空間結(jié)構(gòu),,蛋白質(zhì)的修飾以及蛋白質(zhì)間的相互作用等等,。基因組學(xué),、蛋白質(zhì)組學(xué)和其他各種“組學(xué)”則是水平型研究,,即以單一的手段同時研究成千上萬個基因或蛋白質(zhì)。而系統(tǒng)生物學(xué)的特點,,則是要把水平型研究和垂直型研究整合起來,,成為一種“三維”的研究。此外,,系統(tǒng)生物學(xué)還是典型的多學(xué)科交叉研究,,它需要生命科學(xué)、信息科學(xué),、數(shù)學(xué),、計算機(jī)科學(xué)等各種學(xué)科的共同參與。
系統(tǒng)生物學(xué)的整合性可以體現(xiàn)在兩種不同的策略上,。第一種就是胡德和系統(tǒng)生物學(xué)研究所采用的方式,,選定一個較為簡單的系統(tǒng),如單細(xì)胞生物酵母,,然后分析盡可能多的構(gòu)成成分——基因組,、轉(zhuǎn)錄組、蛋白質(zhì)組,、相互作用組,,以揭示整個系統(tǒng)的行為。另外一種策略是吉爾曼(A. G. Gilman)領(lǐng)導(dǎo)的“信號轉(zhuǎn)導(dǎo)聯(lián)軍”采用的,,以一個較為復(fù)雜的系統(tǒng)(G蛋白介導(dǎo)的和與其相關(guān)的細(xì)胞信號轉(zhuǎn)導(dǎo)系統(tǒng))為研究對象,,采用盡可能多的研究手段去進(jìn)行分析(詳細(xì)介紹見本刊2002年第2期第36頁)。
系統(tǒng)生物學(xué)的基礎(chǔ)——信息
在前分子生物學(xué)時代,,生物學(xué)家把生命視為具有特殊“活力”的有機(jī)體,,遵循著無機(jī)界不存在的法則進(jìn)行生命活動。在分子生物學(xué)時代,,研究者們把生命視為一架精密的機(jī)器,,由基因和蛋白質(zhì)根據(jù)物理、化學(xué)的規(guī)律來運(yùn)轉(zhuǎn),。在后基因組時代,,像胡德這種類型的科學(xué)家,把生命視為信息的載體,,一切特性都可以從信息的流動中得到實現(xiàn),。
胡德提出,應(yīng)該把生物學(xué)視為一門信息科學(xué)[1]。這個觀點包含有三層意思,。首先,,生物學(xué)研究的核心——基因組,是數(shù)字化的(digital),。生物學(xué)與所有其他學(xué)科,,如物理學(xué)、化學(xué),、地理學(xué),,是完全不一樣的科學(xué),因為生物學(xué)以外的學(xué)科都只能通過類比的方式(analog)進(jìn)行分析,。既然生物學(xué)研究的核心是數(shù)字化的,,因此生物學(xué)可以被完全破譯。從理論上說,,我們對生物學(xué)的把握應(yīng)該超過其他任何一門學(xué)科,。其次,生命的數(shù)字化核心表現(xiàn)為兩大類型的信息,,第一類信息是指編碼蛋白質(zhì)的基因,,第二類信息是指控制基因行為的調(diào)控網(wǎng)絡(luò)。顯然,,由一段DNA序列組成的基因是數(shù)字化的,。值得強(qiáng)調(diào)的是,基因調(diào)控網(wǎng)絡(luò)的信息從本質(zhì)上說也是數(shù)字化的,,因為控制基因表達(dá)的轉(zhuǎn)錄因子結(jié)合位點也是核苷酸序列,。生物學(xué)是信息科學(xué)的第三層意思是,生物信息是有等級次序的,,而且沿著不同的層次流動,。一般說來,生物信息以這樣的方向進(jìn)行流動:DNA→mRNA→蛋白質(zhì)→蛋白質(zhì)相互作用網(wǎng)絡(luò)→細(xì)胞→器官→個體→群體,。這里要注意的是,每個層次信息都對理解生命系統(tǒng)的運(yùn)行提供有用的視角,。因此,,系統(tǒng)生物學(xué)的重要任務(wù)就是要盡可能地獲得每個層次的信息并將它們進(jìn)行整合[1]。
根據(jù)系統(tǒng)論的觀點,,構(gòu)成系統(tǒng)的關(guān)鍵不是其組成的物質(zhì),,而是組成部分的相互作用或部分之間的關(guān)系。這些相互作用或者關(guān)系,,從本質(zhì)上說就是信息,。換一個角度來說,生命是遠(yuǎn)離平衡態(tài)的開放系統(tǒng),為了維持其有序性,,生命系統(tǒng)必須不斷地與外部環(huán)境交換能量,,以抵消其熵增過程。奧地利物理學(xué)家薛定諤早在1940年代發(fā)表的著作《生命是什么,?》中就已指出,,生命以“負(fù)熵流”為食,而“負(fù)熵”其實就是信息的另一種表示方法,。因此,,我們可以這樣說,生命系統(tǒng)是一個信息流的過程,,系統(tǒng)生物學(xué)就是要研究并揭示這種信息的運(yùn)行規(guī)律,。
系統(tǒng)生物學(xué)的鑰匙——干涉
系統(tǒng)生物學(xué)一方面要了解生物系統(tǒng)的結(jié)構(gòu)組成,另一方面是要揭示系統(tǒng)的行為方式,。相比之下,,后一個任務(wù)更為重要。也就是說,,系統(tǒng)生物學(xué)研究的并非一種靜態(tài)的結(jié)構(gòu),,而是要在人為控制的狀態(tài)下,揭示出特定的生命系統(tǒng)在不同的條件下和不同的時間里具有什么樣的動力學(xué)特征,。
凡是實驗科學(xué)都有這樣一種特征:人為地設(shè)定某種或某些條件去作用于被實驗的對象,,從而達(dá)到實驗的目的。這種對實驗對象的人為影響就是干涉(perturbation),。傳統(tǒng)生物學(xué)采用非干涉方法如形態(tài)觀察或分類研究生物體,。20世紀(jì)形成的分子生物學(xué)等實驗生物學(xué)的特點就是,科學(xué)家可以在實驗室內(nèi)利用各種手段干涉生物學(xué)材料,,如通過誘導(dǎo)基因突變或修飾蛋白質(zhì),,由此研究其性質(zhì)和功能。系統(tǒng)生物學(xué)同樣也是一門實驗性科學(xué),,也離不開干涉這一重要的工具,。
系統(tǒng)生物學(xué)中的干涉有這樣一些特點。首先,,這些干涉應(yīng)該是有系統(tǒng)性的,。例如人為誘導(dǎo)基因突變,過去大多是隨機(jī)的,;而在進(jìn)行系統(tǒng)生物學(xué)研究時,,應(yīng)該采用的是定向的突變技術(shù)。上面所提到的對酵母的系統(tǒng)生物學(xué)研究,,胡德等人就是把已知的參與果糖代謝的9個基因逐一進(jìn)行突變,,研究在每一個基因突變下的系統(tǒng)變化[2],。果蠅從受精開始到形成成熟個體一共有66個典型的發(fā)育階段,不久前科學(xué)家利用基因芯片技術(shù),,對每一個發(fā)育階段的基因表達(dá)譜進(jìn)行了系統(tǒng)的研究[4],。這也是一類系統(tǒng)性的干涉方式。其次,,系統(tǒng)生物學(xué)需要高通量的干涉能力,,如高通量的遺傳變異。現(xiàn)有技術(shù)已經(jīng)能做到在短時間內(nèi),,把酵母的全部6000多個基因逐一進(jìn)行突變,。對于較為復(fù)雜的多細(xì)胞生物,可以通過RNA干涉新技術(shù)來實現(xiàn)大規(guī)模的基因定向突變,。隨著研究技術(shù)的發(fā)展,,一定還會有許多新的干涉技術(shù)應(yīng)用于系統(tǒng)生物學(xué)。
需要提請人們注意的是,,以測定基因組全序列或全部蛋白質(zhì)組成的基因組研究或蛋白質(zhì)組研究等“規(guī)模型大科學(xué)”,,并不屬于經(jīng)典的實驗科學(xué)。這類工作中并不需要干涉,,其目標(biāo)只是把系統(tǒng)的全部元素測定清楚,,以便得到一個含有所有信息的數(shù)據(jù)庫。胡德把這種類型的研究稱為“發(fā)現(xiàn)的科學(xué)”(discovery science),,而把上述依賴于干涉的實驗科學(xué)稱為“假設(shè)驅(qū)動的科學(xué)”(hypothesis-driven science),,因為選擇干涉就是在做出假設(shè)。系統(tǒng)生物學(xué)不同于一般的實驗生物學(xué)就在于,,它既需要“發(fā)現(xiàn)的科學(xué)”,,也需要“假設(shè)驅(qū)動的科學(xué)”。首先要選擇一種條件(干涉),,然后利用“發(fā)現(xiàn)的科學(xué)”的方法,,對系統(tǒng)在該條件下的所有元素進(jìn)行測定和分析;在此基礎(chǔ)上做出新的假設(shè),,然后再利用“發(fā)現(xiàn)的科學(xué)”研究手段進(jìn)行新研究,。這兩種不同研究策略和方法的互動和整合,是系統(tǒng)生物學(xué)成功的保證,。
筆者還要再強(qiáng)調(diào)一點,,在注重這兩類研究手段的同時,不應(yīng)該忽略系統(tǒng)生物學(xué)的另一個特點——對理論的依賴和建立模型的需求,。在本文一開始介紹系統(tǒng)生物學(xué)的概況時,特別指出過,,系統(tǒng)生物學(xué)的理想就是要得到一個盡可能接近真正生物系統(tǒng)的理論模型,;建模過程貫穿在系統(tǒng)生物學(xué)研究的每一個階段,。離開了數(shù)學(xué)和計算機(jī)科學(xué),就不會有系統(tǒng)生物學(xué),。也許正是基于這一考慮,,科學(xué)家把系統(tǒng)生物學(xué)分為“濕”的實驗部分(實驗室內(nèi)的研究)和“干”的實驗部分(計算機(jī)模擬和理論分析)[5]。“濕”,、“干”實驗的完美整合才是真正的系統(tǒng)生物學(xué),。
從某種意義上說,系統(tǒng)生物學(xué)在中國有很好的基礎(chǔ),。我們的傳統(tǒng)醫(yī)學(xué)就是把人體視為一個系統(tǒng),,通過測定和改變系統(tǒng)的輸入和輸出來調(diào)節(jié)系統(tǒng)的狀態(tài)。傳統(tǒng)科學(xué)的缺點在于,,它只能進(jìn)行“黑箱操作”,,不能解釋系統(tǒng)的內(nèi)部組成成分和動力學(xué)過程。而系統(tǒng)生物學(xué)則把生物系統(tǒng)化為“白箱”,,不僅要了解系統(tǒng)的結(jié)構(gòu)和功能,,而且還要揭示出系統(tǒng)內(nèi)部各組成成分的相互作用和運(yùn)行規(guī)律。
[1] Hood L. J Proteome Res, 2002 (published on web)
[2] Ideker T, et al. Science, 2002, 292:929
[3] Noble D. Science, 2002, 295:1678
[4] Arbeitman M N. Science, 2002, 297:2270
[5] Kitano H. Science, 2002, 295:1662