生物谷報(bào)道:美國(guó)科學(xué)家已標(biāo)記出了白,、黑,、黃三個(gè)人種基因組中發(fā)生單一核苷酸變異的位點(diǎn),,并初步繪成不同人種基因組的差異圖,。
佩爾金(Perlegen)公司科學(xué)家的這一成果不僅當(dāng)天在華盛頓舉行的美國(guó)科學(xué)促進(jìn)協(xié)會(huì)年會(huì)上發(fā)表,,也刊登在18日出版的《科學(xué)》雜志上,。科學(xué)家認(rèn)為,,這一差異圖譜將有助于尋找不同種族人群易于發(fā)生病變的基因,,使得基因治療方法更具針對(duì)性?!犊茖W(xué)》雜志總編肯尼迪評(píng)論說(shuō),,它將“為增進(jìn)人類(lèi)健康的基因研究提供無(wú)價(jià)的資料,。”
在這一研究中,科學(xué)家從公開(kāi)來(lái)源獲取了71人的基因組數(shù)據(jù),,這71人分別是歐洲裔美國(guó)人(白色人種),、非洲裔美國(guó)人(黑色人種)以及漢族華裔美國(guó)人(黃色人種)??茖W(xué)家們從中鑒別出了158萬(wàn)個(gè)單一核苷酸變異的DNA位點(diǎn),,其中絕大部分是三組研究對(duì)象共有的??茖W(xué)家們由此認(rèn)為,,它們可能是人類(lèi)最普遍的遺傳差異。
不同人的基因組至少有99.99%的堿基對(duì)是相同的,,但就是不到0.01%的差異,,也就是被稱(chēng)為“單核苷酸多態(tài)性”的DNA鏈上單一堿基對(duì)的變化,不僅決定了他們是否易于得某些疾病,,也決定了他們?cè)谏砀?、膚色和體型等方面的差異。此前科學(xué)家對(duì)其中的關(guān)系了解很少,,而新繪出的差異圖可能成為理解上述關(guān)系的“鑰匙”,。
科學(xué)家們是依據(jù)基因“連鎖不平衡原理”來(lái)繪制差異圖的。“連鎖不平衡原理”是指,,某些遺傳標(biāo)記的基因重組發(fā)生在物種中的頻率,,高于或低于從其距離推測(cè)的值,這導(dǎo)致DNA鏈上的某些片段在上萬(wàn)年之后仍然不變,,而另一些片段在一代人之后就可能重組,。科學(xué)家們?yōu)榇碎_(kāi)發(fā)了一套特殊的計(jì)算方法,,來(lái)計(jì)算分布在整個(gè)人類(lèi)基因組上單一核苷酸變異點(diǎn)的分布,。
科學(xué)家們說(shuō),,人類(lèi)基因組較常見(jiàn)的單一核苷酸變異點(diǎn)大約有1000萬(wàn)個(gè),,而這次鑒別出的158萬(wàn)個(gè)單一核苷酸變異點(diǎn)相當(dāng)于道路上的“交通燈”,勾勒出了全部單一核苷酸變異點(diǎn)的結(jié)構(gòu),。佩爾金公司表示,,它將參加美國(guó)、中國(guó),、加拿大,、日本、尼日利亞和英國(guó)共同資助和合作開(kāi)展的“國(guó)際人類(lèi)基因組單體型圖計(jì)劃”,,繪制出更詳細(xì)的人類(lèi)基因組差異圖,。
科學(xué)家們表示,,他們繪制的人類(lèi)基因組差異圖將公開(kāi)使用,不過(guò)這一成果應(yīng)該僅用于基因醫(yī)學(xué)方面的研究,,不應(yīng)該引起與種族問(wèn)題相關(guān)的爭(zhēng)議,。(http://www.bioon.com)
Fig. 2. Distribution of SNP positions and LD structure across the genome. For each chromosome, the top track shows SNP density per kb, with a window size of 500 kb. The middle track shows, for each population, the fraction of common SNPs with MAF > 10% that are in high LD (r2 > 0.8) with at least one other common SNP, with a window size of 500 kb. The bottom track shows, for each population, the fraction of common SNPs that are in an LD bin extending over at least 50 kb, with a window size of 1000 kb.
Fig. 3. Extended LD bin and haplotype block structure around the CFTR gene. LD bins, where each bin has at least one SNP with r2 > 0.8 with every other SNP, are depicted as light horizontal bars, with the positions of constituent SNPs indicated by vertical tick marks as well as the extreme ends of the bars. Isolated SNPs are indicated by plain tick marks. Haplotype blocks, within which at least 80% of observed haplotypes could be grouped into common patterns with frequencies of at least 5%, are depicted as dark horizontal bars. Unlike haplotype blocks that are by design sequential and nonoverlapping, SNPs in one LD bin can be interdigitated with SNPs in multiple other overlapping bins.