從人類基因組的30億個(gè)堿基對(duì)中尋找進(jìn)化出人類的基因并不是一件容易的事。現(xiàn)在,,一組研究人員尋找到了由非編碼DNA產(chǎn)生的3個(gè)基因,,也許正是它們幫助人類進(jìn)化成了獨(dú)特的種群,。
人類和黑猩猩在遺傳學(xué)上非常相似,,但是我們不難分辨兩者之間的許多不同。據(jù)《基因組研究》雜志網(wǎng)絡(luò)版披露,科學(xué)家最近獲得一項(xiàng)至關(guān)重要的基因發(fā)現(xiàn),,這些基因和從其它靈長類動(dòng)物中分支后的人類密切相關(guān),,這為理解是什么使我們成為了獨(dú)一無二的人類提供了新的可能。
分子進(jìn)化領(lǐng)域的普遍看法是,,新基因只能從先前已有的基因通過復(fù)制或重組演變而來,。絕大多數(shù)基因都源遠(yuǎn)流長、歷史悠久,,可以上溯到人類祖先還生活在樹上的時(shí)期,,甚至可以追溯到許久以前的微生物。從微生物的幾千個(gè)基因增加到人類的幾萬個(gè)基因,,主要是通過基因組復(fù)制和基因復(fù)制事件實(shí)現(xiàn)的,,復(fù)制創(chuàng)造出另外一組基因,然后自由發(fā)展出新序列和新功能,。
大多數(shù)復(fù)制發(fā)生在人類誕生之前,,只有少數(shù)發(fā)生在人類世系中。從一個(gè)曾經(jīng)并不活躍的基因產(chǎn)生一個(gè)功能性蛋白編碼基因被認(rèn)為是極度不可能之事,。然而,,最新研究表明,這一現(xiàn)象事實(shí)上真的存在,。
研究人員發(fā)現(xiàn),,在果蠅、酵母和靈長類動(dòng)物身上,,存在著由非編碼DNA產(chǎn)生的基因,,但直到目前為止,還沒有發(fā)現(xiàn)過人類獨(dú)有的此類基因,。此項(xiàng)發(fā)現(xiàn)提出了一個(gè)令人著迷的問題——即這些基因是如何造就我們和其它靈長類動(dòng)物之間的差異的,。
在此項(xiàng)研究中,愛爾蘭都柏林圣三一學(xué)院基因研究所的戴維·瑙勒斯及奧亦菲·麥克里賽特承擔(dān)了在人類基因組中找到黑猩猩基因組中所沒有的蛋白編碼基因的艱巨任務(wù),。他們通過嚴(yán)格的篩查和系統(tǒng)排除一些錯(cuò)誤結(jié)果,,最終其候選基因名單上只剩下了3個(gè)基因。不過,,他們面臨的挑戰(zhàn)則是需要證明人類DNA中的這些基因是真正具有活性的,。
研究人員從其他研究中收集到了這3個(gè)基因可積極轉(zhuǎn)錄和轉(zhuǎn)譯成蛋白質(zhì)的證據(jù),但同時(shí)他們也需證明相應(yīng)的DNA序列在其它的靈長類動(dòng)物身上并不活躍,。他們發(fā)現(xiàn),,某些猿和猴種群中的DNA序列包含有可能會(huì)使蛋白編碼基因失效的差異,這表明這些基因在古老的靈長類動(dòng)物身上是失活的,。
研究人員還注意到,,由于采取了嚴(yán)格的過濾設(shè)置,,只有大約20%的人類基因適合于進(jìn)行分析。因此,,他們估計(jì)在人類進(jìn)化過程中由非編碼DNA產(chǎn)生的人類特定基因大約有18個(gè),。與基因總數(shù)2.4萬相比,這個(gè)數(shù)目幾乎微不足道,,但卻是至關(guān)重要的,。
人類新蛋白編碼基因的發(fā)現(xiàn)是一項(xiàng)重大發(fā)現(xiàn),但又提出了一個(gè)更加重大的問題:由這些基因編碼的蛋白是干什么用的,?它們不同于其他任何人類基因,,可能會(huì)帶來深刻的影響。雖然這些基因的特點(diǎn)和功能目前尚不明了,,但研究人員大膽地推測,,正是這些人類特有基因造就了人類特有的性狀。(生物谷Bioon.com)
生物谷推薦原始出處:
Genome Research September 2, 2009, doi: 10.1101/gr.095026.109
Recent de novo origin of human protein-coding genes
David G. Knowles and Aoife McLysaght,1
Smurfit Institute of Genetics, University of Dublin, Trinity College, Dublin, Ireland
The origin of new genes is extremely important to evolutionary innovation. Most new genes arise from existing genes through duplication or recombination. The origin of new genes from noncoding DNA is extremely rare, and very few eukaryotic examples are known. We present evidence for the de novo origin of at least three human protein-coding genes since the divergence with chimp. Each of these genes has no protein-coding homologs in any other genome, but is supported by evidence from expression and, importantly, proteomics data. The absence of these genes in chimp and macaque cannot be explained by sequencing gaps or annotation error. High-quality sequence data indicate that these loci are noncoding DNA in other primates. Furthermore, chimp, gorilla, gibbon, and macaque share the same disabling sequence difference, supporting the inference that the ancestral sequence was noncoding over the alternative possibility of parallel gene inactivation in multiple primate lineages. The genes are not well characterized, but interestingly, one of them was first identified as an up-regulated gene in chronic lymphocytic leukemia. This is the first evidence for entirely novel human-specific protein-coding genes originating from ancestrally noncoding sequences. We estimate that 0.075% of human genes may have originated through this mechanism leading to a total expectation of 18 such cases in a genome of 24,000 protein-coding genes.