從人類基因組的30億個堿基對中尋找進化出人類的基因并不是一件容易的事?,F(xiàn)在,一組研究人員尋找到了由非編碼DNA產(chǎn)生的3個基因,,也許正是它們幫助人類進化成了獨特的種群,。
人類和黑猩猩在遺傳學(xué)上非常相似,但是我們不難分辨兩者之間的許多不同,。據(jù)《基因組研究》雜志網(wǎng)絡(luò)版披露,,科學(xué)家最近獲得一項至關(guān)重要的基因發(fā)現(xiàn),這些基因和從其它靈長類動物中分支后的人類密切相關(guān),,這為理解是什么使我們成為了獨一無二的人類提供了新的可能,。
分子進化領(lǐng)域的普遍看法是,新基因只能從先前已有的基因通過復(fù)制或重組演變而來,。絕大多數(shù)基因都源遠流長,、歷史悠久,可以上溯到人類祖先還生活在樹上的時期,,甚至可以追溯到許久以前的微生物,。從微生物的幾千個基因增加到人類的幾萬個基因,主要是通過基因組復(fù)制和基因復(fù)制事件實現(xiàn)的,,復(fù)制創(chuàng)造出另外一組基因,,然后自由發(fā)展出新序列和新功能。
大多數(shù)復(fù)制發(fā)生在人類誕生之前,,只有少數(shù)發(fā)生在人類世系中,。從一個曾經(jīng)并不活躍的基因產(chǎn)生一個功能性蛋白編碼基因被認為是極度不可能之事。然而,,最新研究表明,,這一現(xiàn)象事實上真的存在,。
研究人員發(fā)現(xiàn),在果蠅,、酵母和靈長類動物身上,,存在著由非編碼DNA產(chǎn)生的基因,但直到目前為止,,還沒有發(fā)現(xiàn)過人類獨有的此類基因,。此項發(fā)現(xiàn)提出了一個令人著迷的問題——即這些基因是如何造就我們和其它靈長類動物之間的差異的。
在此項研究中,,愛爾蘭都柏林圣三一學(xué)院基因研究所的戴維·瑙勒斯及奧亦菲·麥克里賽特承擔(dān)了在人類基因組中找到黑猩猩基因組中所沒有的蛋白編碼基因的艱巨任務(wù),。他們通過嚴格的篩查和系統(tǒng)排除一些錯誤結(jié)果,最終其候選基因名單上只剩下了3個基因,。不過,,他們面臨的挑戰(zhàn)則是需要證明人類DNA中的這些基因是真正具有活性的。
研究人員從其他研究中收集到了這3個基因可積極轉(zhuǎn)錄和轉(zhuǎn)譯成蛋白質(zhì)的證據(jù),,但同時他們也需證明相應(yīng)的DNA序列在其它的靈長類動物身上并不活躍,。他們發(fā)現(xiàn),某些猿和猴種群中的DNA序列包含有可能會使蛋白編碼基因失效的差異,,這表明這些基因在古老的靈長類動物身上是失活的,。
研究人員還注意到,由于采取了嚴格的過濾設(shè)置,,只有大約20%的人類基因適合于進行分析,。因此,他們估計在人類進化過程中由非編碼DNA產(chǎn)生的人類特定基因大約有18個,。與基因總數(shù)2.4萬相比,,這個數(shù)目幾乎微不足道,但卻是至關(guān)重要的,。
人類新蛋白編碼基因的發(fā)現(xiàn)是一項重大發(fā)現(xiàn),,但又提出了一個更加重大的問題:由這些基因編碼的蛋白是干什么用的?它們不同于其他任何人類基因,,可能會帶來深刻的影響,。雖然這些基因的特點和功能目前尚不明了,但研究人員大膽地推測,,正是這些人類特有基因造就了人類特有的性狀,。(生物谷Bioon.com)
生物谷推薦原始出處:
Genome Research September 2, 2009, doi: 10.1101/gr.095026.109
Recent de novo origin of human protein-coding genes
David G. Knowles and Aoife McLysaght,1
Smurfit Institute of Genetics, University of Dublin, Trinity College, Dublin, Ireland
The origin of new genes is extremely important to evolutionary innovation. Most new genes arise from existing genes through duplication or recombination. The origin of new genes from noncoding DNA is extremely rare, and very few eukaryotic examples are known. We present evidence for the de novo origin of at least three human protein-coding genes since the divergence with chimp. Each of these genes has no protein-coding homologs in any other genome, but is supported by evidence from expression and, importantly, proteomics data. The absence of these genes in chimp and macaque cannot be explained by sequencing gaps or annotation error. High-quality sequence data indicate that these loci are noncoding DNA in other primates. Furthermore, chimp, gorilla, gibbon, and macaque share the same disabling sequence difference, supporting the inference that the ancestral sequence was noncoding over the alternative possibility of parallel gene inactivation in multiple primate lineages. The genes are not well characterized, but interestingly, one of them was first identified as an up-regulated gene in chronic lymphocytic leukemia. This is the first evidence for entirely novel human-specific protein-coding genes originating from ancestrally noncoding sequences. We estimate that 0.075% of human genes may have originated through this mechanism leading to a total expectation of 18 such cases in a genome of 24,000 protein-coding genes.