是先有雞還是先有雞蛋?這個問題相當惱人,恐怕很難說清楚。現(xiàn)在,研究人員回答了與這個問題一樣惱人的問題:人類基因組中的成千上萬的長重復(fù)DNA片段中,,那個是第一個產(chǎn)生的?那些被復(fù)制了,?
這個答案發(fā)表在10月7日的《自然·遺傳學》雜志上,。該研究給出了人類基因組中DNA重復(fù)片段復(fù)制的第一個進化證據(jù),這種復(fù)制部分歸因于疾病和近期的遺傳變異,。
這項研究工作標志著人類向著更好地了解“什么樣的基因組變化造就現(xiàn)代人類”,、“什么時候這些復(fù)制片斷出現(xiàn)以及這樣的代價”前進了重要一步,。
進行這項研究的研究組由來自美國華盛頓大學醫(yī)學院的生物學家Evan Eicher和加州大學圣地亞哥分校的計算機專家Pavel Pevzner所領(lǐng)導(dǎo)。
這項新研究首次使我們對人類基因組中一些重要的復(fù)制區(qū)域的進化起源有了個整體的了解,。研究人員“追捕”到了超過三分之二的這些長DNA復(fù)制片段的祖先起源,。在《自然·遺傳學》上發(fā)表的這片文章主要公布了兩大發(fā)現(xiàn)。
首先,,研究人員暗示出,,人類基因組的特定區(qū)域在我們近期的基因組歷史的不同時間立發(fā)生了復(fù)制活性的提升。這與大多數(shù)的基因組復(fù)制模型形成鮮明對比,。
第二,,研究人員證實了在一根相對較小的重復(fù)亞單元周圍的新的復(fù)制構(gòu)建中心的一部份與較短的DNA片段一起形成部分復(fù)制片段。這些核心是人類基因/轉(zhuǎn)錄革新的焦點,。
他們發(fā)現(xiàn),,人類基因組中不是所有的重復(fù)片段的重要性并不均等。一些核心復(fù)制子似乎與人類基因組中的近期的遺傳變異有關(guān),。研究人員給出了14個這樣的復(fù)制子,。
重復(fù)序列的分類:
真核生物細胞基因組中重復(fù)出現(xiàn)的核苷酸序列。大體可分成3大類,。高度重復(fù)序列:一個基因組中有幾百甚至幾百萬份拷貝的高度重復(fù)序列中,,既有重復(fù)幾百萬份的基因,如rRNA基因和某些tRNA基因,,更多的則是很短的非編碼序列的重復(fù),,它又稱為衛(wèi)星DNA,,散在分布于整個基因組,,它的重復(fù)序列單位長度一般小于10bp,重復(fù)次數(shù)在人群中是高度變異的,,成串成簇排列,。這類序列是不能轉(zhuǎn)錄的,一般多數(shù)分布在染色體的著絲粒區(qū)域和端粒區(qū)域,。由于高度重復(fù)序列在個體間呈高度變異性,,因而表現(xiàn)出人類基因組的遺傳多態(tài)性。
中度重復(fù)序列,,一般指10份到幾百份拷貝的DNA序列,,通常是非編碼序列。它包括一些蛋白質(zhì)基因和RNA基因,,如免疫球蛋白基因以及rRNA基因和tRNA基因,。中度重復(fù)序列可分為兩種類型:一種是短分散重復(fù)序列,長度300~500bp,,例如Alu家族長達300bp,,在一個基因組中重復(fù)30~50萬次,,其作用可能與轉(zhuǎn)錄調(diào)節(jié)、DNA復(fù)制啟動和hnRNA的加工有關(guān),;另一種是長分散重復(fù)序列,,長度5.0~7.0kb,例如 Kpn I家族,,長度6.5kb,,拷貝數(shù)3000~4800個,散在分布于人體基因組,,其功能不詳,。單一序列:在整個基因組中只出現(xiàn)一次或少數(shù)幾次的序列,在小鼠中約占基因組的70%,。如珠蛋白基因,、卵清蛋白基因、絲心蛋白基因等,。實驗證明,,所有真核生物染色體可能均含重復(fù)序列而原核生物一般只含單一序列。高度和中度重復(fù)序列的含量隨真核生物物種的不同而變化,。
原始出處:
Nature Genetics
Published online: 7 October 2007 | doi:10.1038/ng.2007.9
Ancestral reconstruction of segmental duplications reveals punctuated cores of human genome evolution
Zhaoshi Jiang1, Haixu Tang2, Mario Ventura3, Maria Francesca Cardone3, Tomas Marques-Bonet1, Xinwei She1, Pavel A Pevzner4 & Evan E Eichler1
Human segmental duplications are hotspots for nonallelic homologous recombination leading to genomic disorders, copy-number polymorphisms and gene and transcript innovations. The complex structure and history of these regions have precluded a global evolutionary analysis. Combining a modified A-Bruijn graph algorithm with comparative genome sequence data, we identify the origin of 4,692 ancestral duplication loci and use these to cluster 437 complex duplication blocks into 24 distinct groups. The sequence-divergence data between ancestral-derivative pairs and a comparison with the chimpanzee and macaque genome support a 'punctuated' model of evolution. Our analysis reveals that human segmental duplications are frequently organized around 'core' duplicons, which are enriched for transcripts and, in some cases, encode primate-specific genes undergoing positive selection. We hypothesize that the rapid expansion and fixation of some intrachromosomal segmental duplications during great-ape evolution has been due to the selective advantage conferred by these genes and transcripts embedded within these core duplications.