通過破譯橫跨非洲、亞歐及美洲地區(qū)數國逾1000人的基因組圖譜,,科學家已成功匯編了目前最詳盡的有關人類基因變異的研究目錄,。這是一筆巨大的資源,它將有助于醫(yī)學研究人員從基因角度來追溯全人類罕見和常見疾病的根源,。
200名來自圣路易斯華盛頓大學醫(yī)學院及其他研究機構的科學家共同參與了這項“千人基因組計劃”,。研究的結果發(fā)布在世界權威的科學學術期刊《自然》上,詳述了14個不同人類種群個體的基因變異研究報告,。
華盛頓大學基因組研究所聯(lián)執(zhí)主任兼此次基因項目研究領導人伊萊恩·馬爾蒂斯博士表示:“有了這樣的資源,,醫(yī)學研究者們如獲至寶,因為它們可以指引研究者尋找出全球人類種群中疾病的基因根源,。同時,,研究還指出,每個人都攜帶著幾百個潛在致病的罕見基因變體,。”
從基因層面上看,,任何兩個人都有超過99%的基因相似度。然而,,盡管出現(xiàn)頻率極低(可能變異頻率僅為1%),,但那些罕見的基因變異體仍被認為是引起罕見疾病乃至癌癥、心臟病,、糖尿病等常見疾病的罪魁禍首,。藥物治療對某些病人不起效,或出現(xiàn)惡心,、嘔吐、失眠甚至一些心臟疾病或死亡等藥物副作用,,都有可能是基因發(fā)生罕見的變異在作祟,。此次科研小組研究的主要目標就是鑒定遍及不同人類種群間的罕見基因變異體。通過試點階段的研究發(fā)現(xiàn),,大多數罕見的基因變體在不同人類種群中的表現(xiàn)各不相同,。這一點至關重要,它將促進科研人員對每個個體基因組的解讀,。
最新的研究結果來自對以下種族的DNA測序:尼日利亞的約魯巴人,、北京的中國漢人、東京的日本人,、擁有北歐及西歐祖先血統(tǒng)的猶他人,、肯尼亞的盧西亞人、擁有非洲祖先血統(tǒng)的美國人,、意大利的托斯卡尼人,、擁有墨西哥祖先血統(tǒng)的洛杉磯人、中國南方的漢族人、西班牙的伊比利亞人,、英格蘭及蘇格蘭地區(qū)的英國人,、芬蘭人、哥倫比亞人,、波多黎各人,。所有參與研究的人全部提交了匿名的DNA樣本,并同意將他們自己的基因數據放入在線數據庫,。
為列出變異基因,,研究員首先測序了所有實驗研究對象在內的全部基因組,如此重復操作大約5次,,得到的結果是,,普通DNA發(fā)生了變異,卻無法以此方法鑒定罕見基因變體,。隨后,,為找到罕見基因變體和確保研究結果的準確性,研究人員反復測序了每個個體包含基因的部分基因組片段,,測序每人每段基因組片段的次數都多達大約80次,,同時他們還密切關注著DNA序列中核苷酸的變化情況。
科學家通過使用先進的特殊設備分析和整合測試數據,,發(fā)現(xiàn)了總共3800萬個SNP(單核苷酸),。其中包括試驗對象DNA樣本中超過99%且變異頻率大于等于1%的變異核苷酸。研究結果還發(fā)現(xiàn),,大量的人類基因組存在不同長度的結構變異,,包括140萬基因組短片段序列的插入或缺失,14000個大段DNA缺失,。
單核苷酸的多態(tài)性和基因組的結構變異提供了強有力的工具,,用于解釋個體在疾病易感性、藥物反應和對于如空氣污染,、壓力等環(huán)境因素上的問題,。另有研究證明,某些疾病可能與基因組短片段序列的插入和缺失有關,,自閉癥和精神分裂癥就是很好的例子,。
人類基因組計劃的科研成果,幫助人們了解到人類共同的基因特質和人類基因的地理多元化,。最終,,這筆巨大的資源財富將惠及更多相關領域的科學研究工作者和全世界的疾病患者。”(生物谷Bioon.com)
doi:10.1038/nature11632
PMC:
PMID:
An integrated map of genetic variation from 1,092 human genomes
The 1000 Genomes Project Consortium
By characterizing the geographic and functional spectrum of human genetic variation, the 1000 Genomes Project aims to build a resource to help to understand the genetic contribution to disease. Here we describe the genomes of 1,092 individuals from 14 populations, constructed using a combination of low-coverage whole-genome and exome sequencing. By developing methods to integrate information across several algorithms and diverse data sources, we provide a validated haplotype map of 38 million single nucleotide polymorphisms, 1.4 million short insertions and deletions, and more than 14,000 larger deletions. We show that individuals from different populations carry different profiles of rare and common variants, and that low-frequency variants show substantial geographic differentiation, which is further increased by the action of purifying selection. We show that evolutionary conservation and coding consequence are key determinants of the strength of purifying selection, that rare-variant load varies substantially across biological pathways, and that each individual contains hundreds of rare non-coding variants at conserved sites, such as motif-disrupting changes in transcription-factor-binding sites. This resource, which captures up to 98% of accessible single nucleotide polymorphisms at a frequency of 1% in related populations, enables analysis of common and low-frequency variants in individuals from diverse, including admixed, populations.