是先有雞還是先有雞蛋,?這個(gè)問題相當(dāng)惱人,,恐怕很難說清楚。現(xiàn)在,,研究人員回答了與這個(gè)問題一樣惱人的問題:人類基因組中的成千上萬的長(zhǎng)重復(fù)DNA片段中,,那個(gè)是第一個(gè)產(chǎn)生的?那些被復(fù)制了,?
這個(gè)答案發(fā)表在10月7日的《自然·遺傳學(xué)》雜志上,。該研究給出了人類基因組中DNA重復(fù)片段復(fù)制的第一個(gè)進(jìn)化證據(jù),這種復(fù)制部分歸因于疾病和近期的遺傳變異,。
這項(xiàng)研究工作標(biāo)志著人類向著更好地了解“什么樣的基因組變化造就現(xiàn)代人類”,、“什么時(shí)候這些復(fù)制片斷出現(xiàn)以及這樣的代價(jià)”前進(jìn)了重要一步。
進(jìn)行這項(xiàng)研究的研究組由來自美國(guó)華盛頓大學(xué)醫(yī)學(xué)院的生物學(xué)家Evan Eicher和加州大學(xué)圣地亞哥分校的計(jì)算機(jī)專家Pavel Pevzner所領(lǐng)導(dǎo),。
這項(xiàng)新研究首次使我們對(duì)人類基因組中一些重要的復(fù)制區(qū)域的進(jìn)化起源有了個(gè)整體的了解,。研究人員“追捕”到了超過三分之二的這些長(zhǎng)DNA復(fù)制片段的祖先起源。在《自然·遺傳學(xué)》上發(fā)表的這片文章主要公布了兩大發(fā)現(xiàn),。
首先,,研究人員暗示出,人類基因組的特定區(qū)域在我們近期的基因組歷史的不同時(shí)間立發(fā)生了復(fù)制活性的提升,。這與大多數(shù)的基因組復(fù)制模型形成鮮明對(duì)比。
第二,,研究人員證實(shí)了在一根相對(duì)較小的重復(fù)亞單元周圍的新的復(fù)制構(gòu)建中心的一部份與較短的DNA片段一起形成部分復(fù)制片段,。這些核心是人類基因/轉(zhuǎn)錄革新的焦點(diǎn)。
他們發(fā)現(xiàn),,人類基因組中不是所有的重復(fù)片段的重要性并不均等,。一些核心復(fù)制子似乎與人類基因組中的近期的遺傳變異有關(guān)。研究人員給出了14個(gè)這樣的復(fù)制子,。
重復(fù)序列的分類:
真核生物細(xì)胞基因組中重復(fù)出現(xiàn)的核苷酸序列,。大體可分成3大類。高度重復(fù)序列:一個(gè)基因組中有幾百甚至幾百萬份拷貝的高度重復(fù)序列中,,既有重復(fù)幾百萬份的基因,,如rRNA基因和某些tRNA基因,更多的則是很短的非編碼序列的重復(fù),,它又稱為衛(wèi)星DNA,,散在分布于整個(gè)基因組,它的重復(fù)序列單位長(zhǎng)度一般小于10bp,,重復(fù)次數(shù)在人群中是高度變異的,,成串成簇排列。這類序列是不能轉(zhuǎn)錄的,,一般多數(shù)分布在染色體的著絲粒區(qū)域和端粒區(qū)域,。由于高度重復(fù)序列在個(gè)體間呈高度變異性,,因而表現(xiàn)出人類基因組的遺傳多態(tài)性。
中度重復(fù)序列,,一般指10份到幾百份拷貝的DNA序列,,通常是非編碼序列。它包括一些蛋白質(zhì)基因和RNA基因,,如免疫球蛋白基因以及rRNA基因和tRNA基因,。中度重復(fù)序列可分為兩種類型:一種是短分散重復(fù)序列,長(zhǎng)度300~500bp,,例如Alu家族長(zhǎng)達(dá)300bp,,在一個(gè)基因組中重復(fù)30~50萬次,其作用可能與轉(zhuǎn)錄調(diào)節(jié),、DNA復(fù)制啟動(dòng)和hnRNA的加工有關(guān),;另一種是長(zhǎng)分散重復(fù)序列,長(zhǎng)度5.0~7.0kb,,例如 Kpn I家族,,長(zhǎng)度6.5kb,拷貝數(shù)3000~4800個(gè),,散在分布于人體基因組,,其功能不詳。單一序列:在整個(gè)基因組中只出現(xiàn)一次或少數(shù)幾次的序列,,在小鼠中約占基因組的70%,。如珠蛋白基因、卵清蛋白基因,、絲心蛋白基因等,。實(shí)驗(yàn)證明,所有真核生物染色體可能均含重復(fù)序列而原核生物一般只含單一序列,。高度和中度重復(fù)序列的含量隨真核生物物種的不同而變化,。
原始出處:
Nature Genetics
Published online: 7 October 2007 | doi:10.1038/ng.2007.9
Ancestral reconstruction of segmental duplications reveals punctuated cores of human genome evolution
Zhaoshi Jiang1, Haixu Tang2, Mario Ventura3, Maria Francesca Cardone3, Tomas Marques-Bonet1, Xinwei She1, Pavel A Pevzner4 & Evan E Eichler1
Human segmental duplications are hotspots for nonallelic homologous recombination leading to genomic disorders, copy-number polymorphisms and gene and transcript innovations. The complex structure and history of these regions have precluded a global evolutionary analysis. Combining a modified A-Bruijn graph algorithm with comparative genome sequence data, we identify the origin of 4,692 ancestral duplication loci and use these to cluster 437 complex duplication blocks into 24 distinct groups. The sequence-divergence data between ancestral-derivative pairs and a comparison with the chimpanzee and macaque genome support a 'punctuated' model of evolution. Our analysis reveals that human segmental duplications are frequently organized around 'core' duplicons, which are enriched for transcripts and, in some cases, encode primate-specific genes undergoing positive selection. We hypothesize that the rapid expansion and fixation of some intrachromosomal segmental duplications during great-ape evolution has been due to the selective advantage conferred by these genes and transcripts embedded within these core duplications.