宋雅·普若哈斯卡是德國萊比錫大學(xué)的一名生物信息學(xué)家,。她每天的大部分時間都花在了收集,、整理和分析有關(guān)基因的信息上,。她的工作一刻也離不開基因,,因此,,她戲稱自己被基因“綁架”了。2008年夏天,,普若哈斯卡決定要嘗試度過一個每天不用再將“基因”時刻掛在嘴邊的暑期,。但是,令普若哈斯卡失望的是,,這樣的嘗試根本無法實現(xiàn),,因為關(guān)于DNA的新一輪大規(guī)模研究引發(fā)了她和她的同事對基因本來性質(zhì)的重新思考。
DNA雙螺旋結(jié)構(gòu)
百歲壽辰鬧危機(jī)
研究人員不再將典型的基因視為對單個蛋白進(jìn)行編碼的DNA片段,。因為,,對于基因的傳統(tǒng)規(guī)則來說,存在著太多的例外,。研究人員發(fā)現(xiàn),,事實上,一些不同的蛋白質(zhì)也許是由單一的DNA片段產(chǎn)生的,。DNA所產(chǎn)生的絕大多數(shù)分子甚至也許都不是蛋白質(zhì),而是另一種稱為RNA的化學(xué)物質(zhì),。人們熟知的DNA雙螺旋結(jié)構(gòu)不再為遺傳所獨享,。吸附在DNA上的其他分子能在具有相同基因的兩種有機(jī)物間產(chǎn)生顯著的差異,而且這些分子也能和DNA一起被繼承,。
換句話說,,基因出現(xiàn)了身份危機(jī)。
這場危機(jī)發(fā)生在基因一詞誕生100周年的前夕,?;蛞辉~是由1909年丹麥遺傳學(xué)家威爾海姆·約翰森命名的,用來描述父母給下一代傳遞了什么才使得它們發(fā)展出相同的性狀,。像他那個時代的其他生物學(xué)家一樣,,約翰森并不了解這個無形的因子是什么東西。
在接下來的60年里,,科學(xué)家們將基因這個詞從抽象的概念變?yōu)榱司唧w的現(xiàn)實,。他們對面包霉菌和細(xì)菌,以及果蠅和玉米展開了實驗研究,。他們發(fā)現(xiàn)了如何通過修飾細(xì)胞內(nèi)的分子來改變花,、眼睛及其他性狀。他們還指出了DNA是一對相互纏繞的鏈。到上世紀(jì)60年代,,他們已經(jīng)對基因作出了令人信服的定義,。
他們認(rèn)為,基因是一個含有制造蛋白質(zhì)分子指令的特定DNA片段,。為了從基因制造蛋白質(zhì),,細(xì)胞不得不讀取它,并建立一個單鏈副本———RNA外轉(zhuǎn)錄,。接著,,這個RNA就會被一簇用于建立蛋白質(zhì)模板的核糖體分子抓住。
基因也是遺傳的基本單位,。每次細(xì)胞分裂時,,它都會復(fù)制其基因,然后父母將這些基因中的一些傳遞給他們的后代,。如果你從母親那里繼承了一頭紅發(fā),,或是罹患乳腺癌的潛因,那么你就有可能繼承了一個有助于形成這些性狀的基因,。
基因的這種定義一直運行得相當(dāng)好,。1968年,分子生物學(xué)家岡瑟·斯坦特宣稱,,下一代科學(xué)家的工作將是必須找出其中的細(xì)節(jié),。
越來越多的怪異基因
斯坦特和他同時代的科學(xué)家都非常清楚地知道,這其中的某些細(xì)節(jié)是非常重要的,。他們知道,,在蛋白質(zhì)固定到其附近的DNA位時,基因可被關(guān)閉或開啟,。他們還了解到,,一些編碼RNA分子的基因從來不會變成蛋白質(zhì)。相反,,他們有其他的任務(wù),,如幫助建立核糖體內(nèi)的蛋白質(zhì)。
但是,,這些例外似乎顯得并不重要,,還不足以引起科學(xué)家對基因的定義提出疑問。耶魯大學(xué)的生物信息學(xué)家馬克·格斯坦說:“生物學(xué)的工作方式迥異于數(shù)學(xué),。如果你在數(shù)學(xué)找到一個反例,,你就必須回過頭去重新思考定義。生物學(xué)并不如此,,當(dāng)出現(xiàn)一,、兩個反例時,,人們更愿意對其進(jìn)行處理。”
20世紀(jì)80年代和90年代,,科學(xué)家們發(fā)現(xiàn)了越來越多的反例,,當(dāng)一個細(xì)胞產(chǎn)生一個RNA轉(zhuǎn)錄時,它會把巨大的DNA塊切斷,,只留存一些小殘余,。(細(xì)胞復(fù)制的DNA部分稱為外顯子,被拋在一邊的部分稱為內(nèi)含子,。)大量非編碼的DNA片段存在于這些蛋白質(zhì)編碼區(qū)域,。人類基因組中的2.1萬個蛋白質(zhì)編碼基因只占了整個基因組的1.2%%。
2000年,,一個國際科學(xué)家小組完成了首個基因組———人體細(xì)胞中的所有遺傳物質(zhì)的草圖,。他們確定了許多蛋白質(zhì)編碼基因的位置,但是人類基因組中98.8%%的其他基因仍有待探索,。
從那時起,,科學(xué)家們開始在基因組的叢林中不斷跋涉,一點一點地描繪著基因組的精妙細(xì)節(jié),。其中最大的一個項目就是“DNA元件的百科全書”,,簡稱為Encode。數(shù)以百計的科學(xué)家開始協(xié)同作戰(zhàn),,以確定人類基因組中每一個DNA片段的功能,。去年夏天,他們發(fā)表了1%%基因組的成果———大約300萬個DNA“字符”,。遺傳代碼是以字符形式表示的,,就像電影標(biāo)題“Gattaca”(千鈞一發(fā))中的每一個字母都代表著一種稱為堿基的分子:G(鳥嘌呤),A(腺嘌呤),,T(胸腺嘧啶),C(胞嘧啶),。Encode小組預(yù)計到明年就可以得出其他99%%基因組的初步結(jié)果,。
Encode的研究結(jié)果顯示,至少從傳統(tǒng)的基因定義標(biāo)準(zhǔn)看,,基因組中充斥著各種怪異的基因,。例如,一個單個的所謂基因可以產(chǎn)生一個以上的蛋白質(zhì),。在一個稱為選擇性剪接的過程中,,一個細(xì)胞可以選擇不同的外顯子組合制作出不同的副本。大約在30年前,,科學(xué)家就首次發(fā)現(xiàn)了選擇性剪接的例子,,但他們無法確定這種情況到底有多普遍?,F(xiàn)在一些研究表明,幾乎所有的基因都被剪接,。Encode小組估計,,蛋白質(zhì)編碼區(qū)域平均能產(chǎn)生5.7個不同的副本。不同種類的細(xì)胞似乎能從同一基因產(chǎn)生不同的副本,。
更為怪異的是,,細(xì)胞常常將外顯子“扔進(jìn)”來自其他基因的副本中。這些外顯子可能來自“遙遠(yuǎn)的地方”,,甚至來自不同的染色體,。