生物學(xué)家們?cè)诤荛L(zhǎng)一段時(shí)間里都認(rèn)為,既然幾乎所有具體的生理機(jī)能都要由蛋白質(zhì)來完成,,那么不編碼蛋白質(zhì)的DNA應(yīng)該是沒有用的,可以稱為“垃圾DNA”。
到今年,DNA雙螺旋結(jié)構(gòu)向人類展現(xiàn)其本來面目已有52年了,。似乎人類已經(jīng)繪出包括自身在內(nèi)的許多物種的基因組圖譜。但最新一期《科學(xué)世界》雜志卻撰文指出,平日充斥于學(xué)術(shù)論文和新聞媒體的“基因”只是生命之書中一些極小的段落,。基因組絕大部分區(qū)域仍然潛藏在暗影中,,長(zhǎng)久以來被人們當(dāng)成“垃圾”而忽視,,只在近年來才露出幾縷光芒,顯示這個(gè)巨大的“垃圾場(chǎng)”可能蘊(yùn)藏著與其體積相稱的寶藏,。
以垃圾的名義
人類基因組草圖繪制完成后,,23對(duì)染色體、30億個(gè)堿基對(duì)這樣的常識(shí)也開始為非專業(yè)人士所熟知,,人類對(duì)自身遺傳圖譜的認(rèn)識(shí)得到了很大的補(bǔ)充與修正,。大概在2000年時(shí),科學(xué)家還估計(jì)人類基因組中約有10萬個(gè)基因,但不出5年這一數(shù)字已跌到2萬個(gè)至4萬個(gè),,目前一種比較通行的說法是約2.5萬個(gè),。這些基因所包含的DNA序列,大概只有人類基因組序列總長(zhǎng)的2%左右,。也就是說,,人類生命藍(lán)圖中約有98%的信息似乎不屬于什么基因,是無用的垃圾,。然而,什么是基因垃圾呢,?
地球上絕大多數(shù)生命以DNA為遺傳物質(zhì),另有一些病毒使用RNA,,沒有別的方案——為什么是這樣,,科學(xué)家并不知道。他們急于尋找外星生命,,哪怕只是細(xì)菌也好,,一個(gè)重要原因就是想看看地球生命使用DNA是偶然還是必然。DNA由4種堿基也就是4種“字母”組成,,分別稱為A,、T、C,、G,。在RNA中,字母T被換成了U,。整個(gè)DNA雙螺旋就像一條極長(zhǎng)的,、扭曲的梯子,梯子的兩邊各是一條由許多字母逐個(gè)連接而成的帶子,,每個(gè)字母與對(duì)面帶子上相應(yīng)位置的字母結(jié)合在一起成為一個(gè)梯級(jí),,稱為“堿基對(duì)”。其中,只能A,、T相互結(jié)合以及C,、G相互結(jié)合,所以知道了DNA雙鏈中一條的堿基順序,,另一條也就確定了,,這兩條鏈?zhǔn)腔パa(bǔ)的。
生物的遺傳信息,,就是DNA鏈上這些字母的排列方式,。將藍(lán)圖轉(zhuǎn)化為實(shí)際產(chǎn)品的過程,就是一段DNA根據(jù)其堿基序列合成出對(duì)應(yīng)的RNA序列(轉(zhuǎn)錄),,然后RNA序列信息指導(dǎo)氨基酸拼合形成蛋白質(zhì)(翻譯)的過程,。生物體的生理機(jī)能,,基本上都由蛋白質(zhì)來完成,比如在血液中運(yùn)送氧氣,、進(jìn)行新陳代謝等等,。可以說,,DNA發(fā)出命令,、RNA揮動(dòng)鞭子,而蛋白質(zhì)則是賣苦力的牛馬,。從DNA到RNA再到蛋白質(zhì)的這個(gè)過程,,就是生物學(xué)的“中心法則”。
能夠最終形成蛋白質(zhì)或者說“編碼某種蛋白質(zhì)”的這樣一段DNA,,就是我們傳統(tǒng)意義上所說的“基因”,。在人和其他生物體內(nèi),這樣的基因都只占整個(gè)基因組的很小一部分,,它們就像寶石一樣零星地落在黑沉沉的荒野中,。各基因之間是大片大片不能制造蛋白質(zhì)的DNA序列,即“非編碼序列”,。生物學(xué)家們?cè)诤荛L(zhǎng)一段時(shí)間里都認(rèn)為,,既然幾乎所有具體的生理機(jī)能都要由蛋白質(zhì)來完成,那么不編碼蛋白質(zhì)的DNA應(yīng)該是沒有用的,,可以稱為“垃圾DNA”,。
基因的墓場(chǎng)
一集50分鐘的電視劇被拆成好幾節(jié)來播放,中途插入的廣告總共算起來有半小時(shí)以上,,是否已經(jīng)讓你忍無可忍,?那么,假如給2分鐘的正經(jīng)節(jié)目配上98分鐘的廣告,,你會(huì)有什么感覺,?是的,太過分了,!生命為何要如此浪費(fèi),?除了性細(xì)胞,人體每個(gè)細(xì)胞里都有一整套DNA,,每套DNA只有約2%的內(nèi)容有用,。在其他哺乳動(dòng)物體內(nèi),比例也大抵如此,。有些物種的基因組更加“精練”、垃圾更少,,比如雞的基因組大小只有人類的1/3,、河豚則為人類的1/10,但它們的基因數(shù)量卻與人類差不多。也有的更夸張,,如洋蔥的基因組有人類基因組的12倍那么大,、阿米巴變形蟲的基因組更是比人的基因組大200多倍。
人們對(duì)垃圾DNA的來源提出了多種解釋,,比如有一部分垃圾來自病毒,。逆轉(zhuǎn)錄病毒是一類以RNA為遺傳物質(zhì)的病毒,其中我們最熟悉的是艾滋病病毒,。它們侵襲宿主細(xì)胞時(shí),,會(huì)把自身的RNA轉(zhuǎn)換成DNA插入基因組中,并跳來跳去大量復(fù)制,。從DNA到RNA的過程叫轉(zhuǎn)錄,,反過來就叫逆轉(zhuǎn)錄,這也是這類病毒的名稱由來,。逆轉(zhuǎn)錄病毒有的會(huì)致病,、引起艾滋病或癌癥等,也有的沒有什么影響,。在進(jìn)化歷程中,,有許多逆轉(zhuǎn)錄病毒DNA留在了人類基因組里而成為垃圾。
還有一些垃圾DNA可能是死亡基因的遺骸,,被稱為“假基因”,。科學(xué)家認(rèn)為,,它們?cè)臼蔷幋a蛋白質(zhì)的真基因,,由于發(fā)生變異而失去功能被棄之不用。它們的序列與真基因非常相似,,但有著細(xì)微差別,,正是這些差別使假基因不能編碼蛋白質(zhì)。去掉假基因不會(huì)影響有機(jī)體的功能,偶爾某個(gè)假基因發(fā)生變化,、死而復(fù)生倒可能造成麻煩,。由于假基因的存在不增加或減少生物的生存優(yōu)勢(shì),所以進(jìn)化過程很難把它們從基因組里清除出去,,就好像把東西扔到了垃圾桶里卻沒有人把垃圾桶拿出去清倒,,結(jié)果在屋子里越積越多一樣。假基因在生物基因組中大量存在,,人體內(nèi)就有約2萬個(gè),,幾乎與真基因的數(shù)量相當(dāng)。
有證據(jù)顯示,,至少一部分垃圾DNA很像真正的垃圾,,因?yàn)閯?dòng)物失去它們之后依然生活得很好,。2004年10月,一組美國(guó)科學(xué)家在《自然》雜志上發(fā)表報(bào)告說,,他們刪除了小鼠基因組中超過100萬個(gè)堿基對(duì)的非編碼DNA(約占鼠基因組的1%),,但并沒有對(duì)這些小鼠的發(fā)育、壽命和繁殖造成可察覺的影響,。在100多項(xiàng)評(píng)估基因活性的組織測(cè)試中,,只有兩項(xiàng)發(fā)現(xiàn)了差異。他們還培育出失去300萬個(gè)堿基對(duì)的非編碼DNA小鼠,,也沒有發(fā)現(xiàn)明顯異常,。
“基因”定義要重寫
然而,這并不是全部。在過去幾年中,,分子生物學(xué)家們已經(jīng)越來越感覺到,,“垃圾DNA”的命名過于草率了,連“基因”的定義也需要重寫,。編碼蛋白質(zhì)并不是DNA的全部意義,,那些非編碼區(qū)域也許有一部分像上面的試驗(yàn)所顯示的那樣沒有明顯功能,但更多的部分我們還不了解,,不能先入為主地將它們?nèi)舆M(jìn)垃圾堆,。實(shí)際上,那一大堆“垃圾”里已經(jīng)長(zhǎng)出了一些讓科學(xué)家眼花繚亂的東西,,而這還只是冰山之一角,。
比如,理論上完全無用的假基因并不是那么“假”,,2003年,一個(gè)日本研究小組發(fā)現(xiàn)了第一個(gè)有功能的假基因,。科學(xué)家培育出一種轉(zhuǎn)基因小鼠,,它們帶有一個(gè)名叫“性別致死”的基因,。這個(gè)名字可怕的外來基因在大多數(shù)小鼠身上并沒有造成什么負(fù)面影響,惟獨(dú)在某一個(gè)品系中名副其實(shí),,所有的小鼠在幼年時(shí)就死了,。研究顯示,在這個(gè)品系的小鼠中,,外來基因偶然地插入了一個(gè)叫makorin1—p1的假基因中間,,把它破壞掉了。這個(gè)假基因是makorin1基因的變異版本,,比“正本”要短很多,,不編碼蛋白質(zhì),按傳統(tǒng)理論應(yīng)該沒有用處,。然而事實(shí)是,,當(dāng)它損壞后,,對(duì)應(yīng)的真基因也不工作了。
那么,,至少這個(gè)例子說明,不編碼蛋白質(zhì)的基因也對(duì)生存至關(guān)重要,,沒有什么假不假的,,只是工作方式與傳統(tǒng)基因不同。但最新研究顯示,,一些RNA可以與其他的RNA,、DNA、蛋白質(zhì)甚至小分子化學(xué)物質(zhì)發(fā)生作用,,直接影響生理機(jī)能——也就是說,,不是作為揮動(dòng)鞭子的角色,,而是直接去當(dāng)苦力,。垃圾DNA中某些不編碼蛋白質(zhì)的片斷,例如上述試驗(yàn)里的假基因,,可能通過轉(zhuǎn)錄成RNA來發(fā)揮作用,。這些片斷不是傳統(tǒng)意義上的基因,可稱為“RNA基因”,,它們往往非常短小,、難于識(shí)別,但又非常重要,。它們調(diào)控其他基因的表達(dá),,使這些基因開啟、關(guān)閉,、更活躍或更不活躍,。
垃圾DNA不是真正垃圾
還有一些非編碼DNA,即使我們完全不了解它的功用,,也可以斷定它們并不是垃圾,,必定有著重要功能,“高度保留共同序列”就屬于這一種,。2004年,一組美國(guó)科學(xué)家在《科學(xué)》雜志上發(fā)表報(bào)告說,,他們對(duì)比研究了人、大鼠,、小鼠,、雞、狗,、魚等多個(gè)物種的基因組,,發(fā)現(xiàn)其中存在一些極其相似乃至完全相同的DNA序列,。這些序列位于非編碼區(qū)域中,共有480個(gè),,在人,、大鼠和小鼠身上完全相同,與狗,、雞,、魚對(duì)應(yīng)序列的相似度也遠(yuǎn)遠(yuǎn)超過各物種基因組的平均相似度。不過,,在海鞘和果蠅體內(nèi)卻找不到這些序列,。人們并不知道這些高度保留序列有什么作用,它們?cè)谌撕褪笊砩系陌姹就耆嗤馕吨撕褪蟮淖嫦确旨抑蟮?500萬年間,,這些序列沒有發(fā)生任何改變,,這是極其不可思議的。
為了防止偶然因素,,研究者檢查的序列長(zhǎng)度都超過了200個(gè)堿基對(duì),。從統(tǒng)計(jì)學(xué)上來說,這么長(zhǎng)的序列因?yàn)楠?dú)立的偶然變異而重復(fù)出現(xiàn)3次基本上是不可能的,。有480個(gè)這樣的序列重復(fù)出現(xiàn)3次,,就更不可能了。有不少人根本就懷疑這個(gè)試驗(yàn)出了問題,,認(rèn)為人類的DNA污染了鼠的DNA樣本,。此外,這些序列在人與魚身上的版本差異很小,,即在人和魚祖先分家后的4億年里改變甚微,。這表明它們的穩(wěn)定性對(duì)脊椎動(dòng)物至關(guān)重要,微小的差異都可能造成致命后果,。
科學(xué)家猜測(cè),,有些高度保留序列可能影響著重要基因的活動(dòng),還有一些則控制著胚胎發(fā)育,。這些序列彼此差異很大,,從中看不出與其功能有關(guān)的線索??茖W(xué)家正考慮培養(yǎng)出缺少某一高度保留序列的轉(zhuǎn)基因小鼠,,觀察其生長(zhǎng)發(fā)育有何異樣,由此判斷該序列的作用,。這一發(fā)現(xiàn)再次證明,,不編碼蛋白質(zhì)、在傳統(tǒng)上被認(rèn)為是垃圾的DNA,絕對(duì)不是真正的垃圾,。
人們?cè)?jīng)猜想,,越復(fù)雜的生物基因數(shù)量越多,但事實(shí)已經(jīng)推翻了這種觀點(diǎn),。如前所述,,人類基因數(shù)量與雞和河豚的基因數(shù)量相近,,而水稻的基因差不多要比人多一倍,阿米巴和洋蔥則證明了基因組的總體大小與生物復(fù)雜性也全無關(guān)系,。到底是什么決定了物種之間的根本差異?看來必須把傳統(tǒng)的基因與新近被證明是寶藏的“垃圾”結(jié)合起來考慮,。
天文學(xué)家一度認(rèn)為,那些在電磁波譜的各頻段閃耀光芒的星星和塵埃就是這宇宙里的一切,。然而,越來越多的證據(jù)使他們認(rèn)識(shí)到,,宇宙中還有人類所看不見的暗物質(zhì)和暗能量,而且事實(shí)上它們占去了宇宙質(zhì)量的絕大部分,,我們所熟悉的物質(zhì)只有百分之幾,。宇宙的終極命運(yùn)——是永遠(yuǎn)膨脹還是坍縮成為一個(gè)奇點(diǎn)?它更多地取決于這些暗影中的神秘質(zhì)量,。對(duì)暗物質(zhì)和暗能量的研究是近年來宇宙學(xué)的重大進(jìn)展,,也是一項(xiàng)重大挑戰(zhàn),因?yàn)榭茖W(xué)家至今也沒能對(duì)它們的本質(zhì)給出合理解釋,。垃圾DNA可以說是基因組的暗面,,它將改變生物學(xué)的面貌,就像暗物質(zhì)和暗能量改變宇宙學(xué)的面貌那樣,。