生物學家們在很長一段時間里都認為,,既然幾乎所有具體的生理機能都要由蛋白質(zhì)來完成,,那么不編碼蛋白質(zhì)的DNA應該是沒有用的,,可以稱為“垃圾DNA”。
到今年,,DNA雙螺旋結構向人類展現(xiàn)其本來面目已有52年了,。似乎人類已經(jīng)繪出包括自身在內(nèi)的許多物種的基因組圖譜。但最新一期《科學世界》雜志卻撰文指出,平日充斥于學術論文和新聞媒體的“基因”只是生命之書中一些極小的段落,?;蚪M絕大部分區(qū)域仍然潛藏在暗影中,長久以來被人們當成“垃圾”而忽視,,只在近年來才露出幾縷光芒,,顯示這個巨大的“垃圾場”可能蘊藏著與其體積相稱的寶藏。
以垃圾的名義
人類基因組草圖繪制完成后,,23對染色體,、30億個堿基對這樣的常識也開始為非專業(yè)人士所熟知,人類對自身遺傳圖譜的認識得到了很大的補充與修正,。大概在2000年時,,科學家還估計人類基因組中約有10萬個基因,但不出5年這一數(shù)字已跌到2萬個至4萬個,,目前一種比較通行的說法是約2.5萬個,。這些基因所包含的DNA序列,大概只有人類基因組序列總長的2%左右,。也就是說,,人類生命藍圖中約有98%的信息似乎不屬于什么基因,是無用的垃圾,。然而,什么是基因垃圾呢,?
地球上絕大多數(shù)生命以DNA為遺傳物質(zhì),另有一些病毒使用RNA,,沒有別的方案——為什么是這樣,,科學家并不知道。他們急于尋找外星生命,,哪怕只是細菌也好,,一個重要原因就是想看看地球生命使用DNA是偶然還是必然。DNA由4種堿基也就是4種“字母”組成,,分別稱為A,、T、C,、G,。在RNA中,字母T被換成了U。整個DNA雙螺旋就像一條極長的,、扭曲的梯子,,梯子的兩邊各是一條由許多字母逐個連接而成的帶子,每個字母與對面帶子上相應位置的字母結合在一起成為一個梯級,,稱為“堿基對”,。其中,只能A、T相互結合以及C,、G相互結合,,所以知道了DNA雙鏈中一條的堿基順序,另一條也就確定了,,這兩條鏈是互補的,。
生物的遺傳信息,就是DNA鏈上這些字母的排列方式,。將藍圖轉(zhuǎn)化為實際產(chǎn)品的過程,,就是一段DNA根據(jù)其堿基序列合成出對應的RNA序列(轉(zhuǎn)錄),然后RNA序列信息指導氨基酸拼合形成蛋白質(zhì)(翻譯)的過程,。生物體的生理機能,,基本上都由蛋白質(zhì)來完成,比如在血液中運送氧氣,、進行新陳代謝等等,。可以說,,DNA發(fā)出命令,、RNA揮動鞭子,而蛋白質(zhì)則是賣苦力的牛馬,。從DNA到RNA再到蛋白質(zhì)的這個過程,,就是生物學的“中心法則”,。
能夠最終形成蛋白質(zhì)或者說“編碼某種蛋白質(zhì)”的這樣一段DNA,,就是我們傳統(tǒng)意義上所說的“基因”。在人和其他生物體內(nèi),,這樣的基因都只占整個基因組的很小一部分,,它們就像寶石一樣零星地落在黑沉沉的荒野中。各基因之間是大片大片不能制造蛋白質(zhì)的DNA序列,,即“非編碼序列”,。生物學家們在很長一段時間里都認為,既然幾乎所有具體的生理機能都要由蛋白質(zhì)來完成,,那么不編碼蛋白質(zhì)的DNA應該是沒有用的,,可以稱為“垃圾DNA”。
基因的墓場
一集50分鐘的電視劇被拆成好幾節(jié)來播放,中途插入的廣告總共算起來有半小時以上,,是否已經(jīng)讓你忍無可忍,?那么,假如給2分鐘的正經(jīng)節(jié)目配上98分鐘的廣告,,你會有什么感覺,?是的,太過分了,!生命為何要如此浪費,?除了性細胞,人體每個細胞里都有一整套DNA,,每套DNA只有約2%的內(nèi)容有用,。在其他哺乳動物體內(nèi),比例也大抵如此,。有些物種的基因組更加“精練”,、垃圾更少,比如雞的基因組大小只有人類的1/3,、河豚則為人類的1/10,,但它們的基因數(shù)量卻與人類差不多。也有的更夸張,,如洋蔥的基因組有人類基因組的12倍那么大,、阿米巴變形蟲的基因組更是比人的基因組大200多倍。
人們對垃圾DNA的來源提出了多種解釋,,比如有一部分垃圾來自病毒,。逆轉(zhuǎn)錄病毒是一類以RNA為遺傳物質(zhì)的病毒,其中我們最熟悉的是艾滋病病毒,。它們侵襲宿主細胞時,,會把自身的RNA轉(zhuǎn)換成DNA插入基因組中,并跳來跳去大量復制,。從DNA到RNA的過程叫轉(zhuǎn)錄,,反過來就叫逆轉(zhuǎn)錄,這也是這類病毒的名稱由來,。逆轉(zhuǎn)錄病毒有的會致病,、引起艾滋病或癌癥等,也有的沒有什么影響,。在進化歷程中,,有許多逆轉(zhuǎn)錄病毒DNA留在了人類基因組里而成為垃圾。
還有一些垃圾DNA可能是死亡基因的遺骸,,被稱為“假基因”,??茖W家認為,它們原本是編碼蛋白質(zhì)的真基因,,由于發(fā)生變異而失去功能被棄之不用,。它們的序列與真基因非常相似,但有著細微差別,,正是這些差別使假基因不能編碼蛋白質(zhì),。去掉假基因不會影響有機體的功能,偶爾某個假基因發(fā)生變化、死而復生倒可能造成麻煩,。由于假基因的存在不增加或減少生物的生存優(yōu)勢,,所以進化過程很難把它們從基因組里清除出去,就好像把東西扔到了垃圾桶里卻沒有人把垃圾桶拿出去清倒,,結果在屋子里越積越多一樣,。假基因在生物基因組中大量存在,人體內(nèi)就有約2萬個,,幾乎與真基因的數(shù)量相當,。
有證據(jù)顯示,至少一部分垃圾DNA很像真正的垃圾,,因為動物失去它們之后依然生活得很好,。2004年10月,一組美國科學家在《自然》雜志上發(fā)表報告說,,他們刪除了小鼠基因組中超過100萬個堿基對的非編碼DNA(約占鼠基因組的1%),,但并沒有對這些小鼠的發(fā)育、壽命和繁殖造成可察覺的影響,。在100多項評估基因活性的組織測試中,,只有兩項發(fā)現(xiàn)了差異。他們還培育出失去300萬個堿基對的非編碼DNA小鼠,,也沒有發(fā)現(xiàn)明顯異常,。
“基因”定義要重寫
然而,這并不是全部。在過去幾年中,,分子生物學家們已經(jīng)越來越感覺到,,“垃圾DNA”的命名過于草率了,連“基因”的定義也需要重寫,。編碼蛋白質(zhì)并不是DNA的全部意義,,那些非編碼區(qū)域也許有一部分像上面的試驗所顯示的那樣沒有明顯功能,,但更多的部分我們還不了解,,不能先入為主地將它們?nèi)舆M垃圾堆。實際上,,那一大堆“垃圾”里已經(jīng)長出了一些讓科學家眼花繚亂的東西,,而這還只是冰山之一角,。
比如,理論上完全無用的假基因并不是那么“假”,,2003年,一個日本研究小組發(fā)現(xiàn)了第一個有功能的假基因,。科學家培育出一種轉(zhuǎn)基因小鼠,,它們帶有一個名叫“性別致死”的基因,。這個名字可怕的外來基因在大多數(shù)小鼠身上并沒有造成什么負面影響,惟獨在某一個品系中名副其實,,所有的小鼠在幼年時就死了,。研究顯示,在這個品系的小鼠中,,外來基因偶然地插入了一個叫makorin1—p1的假基因中間,,把它破壞掉了。這個假基因是makorin1基因的變異版本,,比“正本”要短很多,,不編碼蛋白質(zhì),按傳統(tǒng)理論應該沒有用處,。然而事實是,,當它損壞后,對應的真基因也不工作了,。
那么,,至少這個例子說明,不編碼蛋白質(zhì)的基因也對生存至關重要,,沒有什么假不假的,,只是工作方式與傳統(tǒng)基因不同。但最新研究顯示,,一些RNA可以與其他的RNA,、DNA、蛋白質(zhì)甚至小分子化學物質(zhì)發(fā)生作用,,直接影響生理機能——也就是說,,不是作為揮動鞭子的角色,而是直接去當苦力,。垃圾DNA中某些不編碼蛋白質(zhì)的片斷,,例如上述試驗里的假基因,可能通過轉(zhuǎn)錄成RNA來發(fā)揮作用,。這些片斷不是傳統(tǒng)意義上的基因,,可稱為“RNA基因”,它們往往非常短小,、難于識別,,但又非常重要,。它們調(diào)控其他基因的表達,使這些基因開啟,、關閉,、更活躍或更不活躍。
垃圾DNA不是真正垃圾
還有一些非編碼DNA,,即使我們完全不了解它的功用,,也可以斷定它們并不是垃圾,必定有著重要功能,,“高度保留共同序列”就屬于這一種,。2004年,一組美國科學家在《科學》雜志上發(fā)表報告說,他們對比研究了人,、大鼠,、小鼠、雞,、狗,、魚等多個物種的基因組,發(fā)現(xiàn)其中存在一些極其相似乃至完全相同的DNA序列,。這些序列位于非編碼區(qū)域中,,共有480個,在人,、大鼠和小鼠身上完全相同,,與狗、雞,、魚對應序列的相似度也遠遠超過各物種基因組的平均相似度,。不過,在海鞘和果蠅體內(nèi)卻找不到這些序列,。人們并不知道這些高度保留序列有什么作用,它們在人和鼠身上的版本完全相同,,意味著人和鼠的祖先分家之后的7500萬年間,這些序列沒有發(fā)生任何改變,,這是極其不可思議的,。
為了防止偶然因素,研究者檢查的序列長度都超過了200個堿基對,。從統(tǒng)計學上來說,,這么長的序列因為獨立的偶然變異而重復出現(xiàn)3次基本上是不可能的。有480個這樣的序列重復出現(xiàn)3次,,就更不可能了,。有不少人根本就懷疑這個試驗出了問題,認為人類的DNA污染了鼠的DNA樣本,。此外,,這些序列在人與魚身上的版本差異很小,,即在人和魚祖先分家后的4億年里改變甚微,。這表明它們的穩(wěn)定性對脊椎動物至關重要,,微小的差異都可能造成致命后果。
科學家猜測,,有些高度保留序列可能影響著重要基因的活動,,還有一些則控制著胚胎發(fā)育。這些序列彼此差異很大,,從中看不出與其功能有關的線索,。科學家正考慮培養(yǎng)出缺少某一高度保留序列的轉(zhuǎn)基因小鼠,,觀察其生長發(fā)育有何異樣,,由此判斷該序列的作用。這一發(fā)現(xiàn)再次證明,,不編碼蛋白質(zhì),、在傳統(tǒng)上被認為是垃圾的DNA,絕對不是真正的垃圾,。
人們曾經(jīng)猜想,,越復雜的生物基因數(shù)量越多,但事實已經(jīng)推翻了這種觀點,。如前所述,,人類基因數(shù)量與雞和河豚的基因數(shù)量相近,而水稻的基因差不多要比人多一倍,阿米巴和洋蔥則證明了基因組的總體大小與生物復雜性也全無關系,。到底是什么決定了物種之間的根本差異,?看來必須把傳統(tǒng)的基因與新近被證明是寶藏的“垃圾”結合起來考慮。
天文學家一度認為,,那些在電磁波譜的各頻段閃耀光芒的星星和塵埃就是這宇宙里的一切,。然而,越來越多的證據(jù)使他們認識到,宇宙中還有人類所看不見的暗物質(zhì)和暗能量,,而且事實上它們占去了宇宙質(zhì)量的絕大部分,,我們所熟悉的物質(zhì)只有百分之幾。宇宙的終極命運——是永遠膨脹還是坍縮成為一個奇點,?它更多地取決于這些暗影中的神秘質(zhì)量,。對暗物質(zhì)和暗能量的研究是近年來宇宙學的重大進展,也是一項重大挑戰(zhàn),,因為科學家至今也沒能對它們的本質(zhì)給出合理解釋,。垃圾DNA可以說是基因組的暗面,它將改變生物學的面貌,,就像暗物質(zhì)和暗能量改變宇宙學的面貌那樣,。