生物谷報道:美國科學家已標記出了白,、黑,、黃三個人種基因組中發(fā)生單一核苷酸變異的位點,并初步繪成不同人種基因組的差異圖。
佩爾金(Perlegen)公司科學家的這一成果不僅當天在華盛頓舉行的美國科學促進協(xié)會年會上發(fā)表,,也刊登在18日出版的《科學》雜志上,。科學家認為,,這一差異圖譜將有助于尋找不同種族人群易于發(fā)生病變的基因,,使得基因治療方法更具針對性?!犊茖W》雜志總編肯尼迪評論說,,它將“為增進人類健康的基因研究提供無價的資料。”
在這一研究中,,科學家從公開來源獲取了71人的基因組數(shù)據(jù),,這71人分別是歐洲裔美國人(白色人種)、非洲裔美國人(黑色人種)以及漢族華裔美國人(黃色人種),??茖W家們從中鑒別出了158萬個單一核苷酸變異的DNA位點,其中絕大部分是三組研究對象共有的,??茖W家們由此認為,它們可能是人類最普遍的遺傳差異,。
不同人的基因組至少有99.99%的堿基對是相同的,,但就是不到0.01%的差異,也就是被稱為“單核苷酸多態(tài)性”的DNA鏈上單一堿基對的變化,,不僅決定了他們是否易于得某些疾病,,也決定了他們在身高、膚色和體型等方面的差異,。此前科學家對其中的關系了解很少,,而新繪出的差異圖可能成為理解上述關系的“鑰匙”。
科學家們是依據(jù)基因“連鎖不平衡原理”來繪制差異圖的,。“連鎖不平衡原理”是指,,某些遺傳標記的基因重組發(fā)生在物種中的頻率,高于或低于從其距離推測的值,,這導致DNA鏈上的某些片段在上萬年之后仍然不變,而另一些片段在一代人之后就可能重組,??茖W家們?yōu)榇碎_發(fā)了一套特殊的計算方法,來計算分布在整個人類基因組上單一核苷酸變異點的分布,。
科學家們說,,人類基因組較常見的單一核苷酸變異點大約有1000萬個,而這次鑒別出的158萬個單一核苷酸變異點相當于道路上的“交通燈”,勾勒出了全部單一核苷酸變異點的結構,。佩爾金公司表示,,它將參加美國、中國,、加拿大,、日本、尼日利亞和英國共同資助和合作開展的“國際人類基因組單體型圖計劃”,,繪制出更詳細的人類基因組差異圖,。
科學家們表示,他們繪制的人類基因組差異圖將公開使用,,不過這一成果應該僅用于基因醫(yī)學方面的研究,,不應該引起與種族問題相關的爭議。(http://www.bioon.com)
Fig. 2. Distribution of SNP positions and LD structure across the genome. For each chromosome, the top track shows SNP density per kb, with a window size of 500 kb. The middle track shows, for each population, the fraction of common SNPs with MAF > 10% that are in high LD (r2 > 0.8) with at least one other common SNP, with a window size of 500 kb. The bottom track shows, for each population, the fraction of common SNPs that are in an LD bin extending over at least 50 kb, with a window size of 1000 kb.
Fig. 3. Extended LD bin and haplotype block structure around the CFTR gene. LD bins, where each bin has at least one SNP with r2 > 0.8 with every other SNP, are depicted as light horizontal bars, with the positions of constituent SNPs indicated by vertical tick marks as well as the extreme ends of the bars. Isolated SNPs are indicated by plain tick marks. Haplotype blocks, within which at least 80% of observed haplotypes could be grouped into common patterns with frequencies of at least 5%, are depicted as dark horizontal bars. Unlike haplotype blocks that are by design sequential and nonoverlapping, SNPs in one LD bin can be interdigitated with SNPs in multiple other overlapping bins.