全世界數(shù)十位科學(xué)精英聚集在一起,拍下了一張合影,。他們宣布:人類基因組國際單體型圖(HapMap)計(jì)劃完成了,。中國科學(xué)院,、中國工程院立即將其評(píng)選為2005年世界十大科技進(jìn)展之一,。為什么這張圖能引起中國科學(xué)家的高度關(guān)注?為什么全世界科學(xué)家要用3年時(shí)間繪制它,?負(fù)責(zé)該計(jì)劃“中國卷”的曾長青研究員說,,繪制HapMap就是為了注釋3年前完成的人類基因組框架圖這部人類遺傳學(xué)“天書”,找出常見變異位點(diǎn)的分布規(guī)律并為DNA序列的多態(tài)性貼上標(biāo)簽,,這對(duì)人類研究自身健康意義非凡,。
每個(gè)人身上都攜帶著祖先留下的基因。
2002年“國際人類基因組測序計(jì)劃”的完成及其相繼研究發(fā)現(xiàn),,人作為一個(gè)物種在DNA序列中僅有1‰不同,,但因此卻造成了黑、黃,、白不同人種及高矮胖瘦,、疾病易感等千差萬別。人類基因組測序圖繪制完成的同時(shí)還發(fā)現(xiàn)了基因組中的大量序列變異和多態(tài)性,,這些發(fā)現(xiàn)隨即成為生命科學(xué)新的研究熱點(diǎn),。
尋找人類起源和疾病的工具圖
當(dāng)記者在中國科學(xué)院北京基因研究所找到科研部長曾長青研究員時(shí),驚訝地發(fā)現(xiàn),,這位HapMap計(jì)劃“中國卷”的總協(xié)調(diào)竟然是位40多歲的女士,。一間不足十平方米的辦公室里,一張寫字臺(tái),、一臺(tái)電腦,、一張兼做床鋪的長沙發(fā),就是她馳騁基因王國,,與世界頂級(jí)大科學(xué)家對(duì)話的“司令部”,。
“其實(shí),這份人類基因組單體型圖就是后續(xù)研究的工具箱和數(shù)據(jù)庫,給尋找致病相關(guān)基因的人提供了一個(gè)群體遺傳學(xué)參照體系,。”曾長青簡潔概述全世界科學(xué)家3年的辛勤勞動(dòng),,“學(xué)過數(shù)學(xué)的人都知道,利用數(shù)學(xué)用表可以輕松地查出很多難以計(jì)算的數(shù)值,,比如開方,、正余切、正余弦值之類,。人類基因組單體型圖相當(dāng)于一份人類遺傳變異研究的‘遺傳用表’,,盡管不能直接確定疾病相關(guān)基因,但單核苷酸多態(tài)性(SNP)廣泛分布于人類全基因組,,最大限度地代表了不同個(gè)體之間的遺傳差異,,是研究復(fù)雜疾病、藥物敏感性及人類進(jìn)化的重要標(biāo)記,。研究人員通過SNP排列注明差異‘標(biāo)簽’,,就可以更高效地尋找與疾病相關(guān)的基因變異,例如將患者的單體型與健康人(對(duì)照)的單體型相比較,,某一種單體型在患者中經(jīng)常出現(xiàn),,影響該疾病的基因可能就存在于這個(gè)單體型內(nèi)部或附近。”
曾長青研究員告訴記者,,現(xiàn)代人群的大多數(shù)變異都來自于在祖先中就已經(jīng)存在的多態(tài)性,。隨著人類遷移至世界各地,由于隨機(jī)性,、自然選擇和其他的遺傳機(jī)制,,各個(gè)地區(qū)的單體型頻率甚至類型變得不同。只有闡明DNA序列的差異以及基因組的多態(tài)性,,才能深入準(zhǔn)確地了解人類起源,、進(jìn)化和遷徙過程中的DNA序列變化,也才能真正了解與疾病特別是多基因疾病有關(guān)的遺傳機(jī)制,。
上世紀(jì)末,,在國際人類基因組草圖尚未完成時(shí),許多科研機(jī)構(gòu)和制藥公司就已瞄準(zhǔn)這一領(lǐng)域,,斥巨資研究SNP,,以求發(fā)現(xiàn)基因中的變異位點(diǎn),更多地了解疾病的起因以及預(yù)防,、診斷和治療的方法,。但如果對(duì)每一個(gè)群體或個(gè)體的研究項(xiàng)目都要對(duì)每一個(gè)SNP位點(diǎn)進(jìn)行檢測、鑒定,,費(fèi)用將昂貴得驚人,。因此,,國際人類基因組計(jì)劃協(xié)作組在人類基因組圖繪制完成后,及時(shí)提出了人類基因組研究的第二個(gè)戰(zhàn)略任務(wù):再次以多國分擔(dān)合作的形式,,共同構(gòu)建整合人類全基因組遺傳與變異信息的單體型圖,,旨在惠及全球的生命科學(xué)基因組學(xué)研究,致力于克服人類常見疾病的醫(yī)學(xué)研究,。
最窮的團(tuán)隊(duì)擔(dān)起了“中國卷”繪制工作
HapMap計(jì)劃啟動(dòng)于2002年10月29日,,由加拿大、日本,、尼日利亞,、中國、英國和美國六國11個(gè)研究中心的科學(xué)家共同承擔(dān),。其中,,美國完成31%,日本完成25%,,英國完成24%,,加拿大完成10%,中國完成10%的任務(wù),。此外,,亞,、非,、歐裔各提供90份樣本。除了上世紀(jì)80年代在美國采集的歐裔樣本,,亞裔樣本由中國和日本各提供一半,,非裔樣本由尼日利亞提供。全部血樣品送到美國國立衛(wèi)生院下屬的人類遺傳細(xì)胞存儲(chǔ)中心,,轉(zhuǎn)化成細(xì)胞株后統(tǒng)一提取成DNA分送至各參加中心進(jìn)行SNP分型檢定,。
中國承擔(dān)的具體研究任務(wù)是3號(hào)、21號(hào)和8號(hào)染色體短臂單體型圖的繪制,,以及提供45份亞裔樣品,。該計(jì)劃“中國卷”的實(shí)施得到科技部、中國科學(xué)院,、香港創(chuàng)新科技署和香港大學(xué)教育資助委員會(huì)的高度重視,,2002年列入科技部“十五”國家重大科技攻關(guān)項(xiàng)目,撥款5000萬元,。同時(shí)香港特區(qū)政府對(duì)參與HapMap“中國卷”的三所香港大學(xué)給予資助,。2003年3月,中華單體型圖協(xié)作組在北京成立,。
中科院北京基因組研究所所長楊煥明博士任主席,。從美國得州大學(xué)休斯頓醫(yī)學(xué)院回國,,在基因組研究所擔(dān)任SNP研究項(xiàng)目的首席科學(xué)家及科研部部長的曾長青博士被委以重任,負(fù)責(zé)國際“人類基因組單體型圖”計(jì)劃的“中國卷”的實(shí)施與協(xié)調(diào),。中科院北京基因組研究所負(fù)責(zé)3號(hào)染色體的大部分及其8號(hào)染色體短臂,,約占整個(gè)基因組長度的6%。香港小組的港大平臺(tái)負(fù)責(zé)3號(hào)染色體短臂的70MB的一段區(qū)域,,約占整個(gè)基因組的2.5%,。國家人類基因組南方中心負(fù)責(zé)21號(hào)染色體的HapMap構(gòu)建,占整個(gè)基因組的1.1%,。
這是一個(gè)艱難的起步,,當(dāng)時(shí)國內(nèi)沒有建立可進(jìn)行高通量SNP分型,具有高精確度和敏感度的研究平臺(tái),。曾長青說,,中國團(tuán)隊(duì)在北京、香港和上海三地的SNP分型平臺(tái)都是從采購設(shè)備起步的,。不久北京遭遇了SARS,,采購的新設(shè)備不能及時(shí)到位安裝。與其他已經(jīng)具備的完善設(shè)施和豐富經(jīng)驗(yàn)的參與中心相比,,中國團(tuán)隊(duì)的SNP分型工作在時(shí)間上比國際伙伴們幾乎落后一年,。更嚴(yán)峻的還有資金不足問題,中國團(tuán)隊(duì)特別是北京中心在所有國際參加者中最窮,,他們面臨時(shí)間和資金短缺的巨大壓力,。
起步最晚的中國人后來居上
科學(xué)的舞臺(tái)是合作的舞臺(tái),更是競爭的舞臺(tái),。為了追回失去的時(shí)間,,中國團(tuán)隊(duì)開始了一場苦戰(zhàn)。一方面,,在科學(xué)策略上,,他們把握多態(tài)位點(diǎn)的選取和分型戰(zhàn)略,盡量減少對(duì)未經(jīng)驗(yàn)證的SNP位點(diǎn)的使用,,同時(shí)進(jìn)行高通量平臺(tái)的優(yōu)化條件摸索,,使成功率達(dá)到最高潛力,將反應(yīng)成本降低至最小,。另一方面,,科研人員放棄了兩年多的所有長短假期,讓儀器24小時(shí)運(yùn)轉(zhuǎn),。曾長青形容當(dāng)時(shí)的緊張程度,,“在購買設(shè)備時(shí)廠家代表曾自信地說他們質(zhì)譜儀中的激光管能用幾千萬次,夠我們用一輩子,。結(jié)果不到一年激光管‘爆’了,,廠家不好意思地給我們換了一個(gè)新的,。”
曾長青很感慨,在那段歲月,,北京基因組研究所與HapMap有關(guān)的所有實(shí)驗(yàn)室和辦公室都兼有宿舍的功能,,很多研究人員就吃住在辦公室,為了國家的利益,,有的很有才華的研究生放棄了去國外深造的優(yōu)厚獎(jiǎng)學(xué)金,。不知多少個(gè)夜晚,她就是在那張沙發(fā)上度過的,。至今令她無法釋懷的是,,正在工作最吃緊的時(shí)候,從小將她帶大的大姑在沈陽因病去世,。她說:“在美國期間每次回國尚能繞道前去探訪,,這次近在咫尺卻無法為她送終。”
在嚴(yán)格執(zhí)行捐獻(xiàn)者個(gè)人的知情與同意基礎(chǔ)上,,2003年9月,,中國科研人員三次在北京師范大學(xué)漢族大學(xué)生中收集了180份健康血樣標(biāo)本,率先完成了國際協(xié)作組要求的樣品采集工作,。隨后的進(jìn)展很順利,,中國送去國際HapMap計(jì)劃統(tǒng)一存儲(chǔ)處的樣品不但全部成功轉(zhuǎn)化,而且在遵守倫理學(xué)規(guī)范與法規(guī),,綜合國情特點(diǎn)和全程透明操作等方面,,贏得了國際同行的一致好評(píng)。
2004年夏天,,我國的研究趕上了國際合作中的基本進(jìn)度,,同年秋天超過中游,,整個(gè)2004年完成了近1600萬份反應(yīng)數(shù)據(jù),。2005年4個(gè)月內(nèi),則完成SNP分型數(shù)據(jù)1800多萬個(gè),。3年中,,中國團(tuán)隊(duì)就自己負(fù)責(zé)的染色體區(qū)域向國際數(shù)據(jù)協(xié)調(diào)中心遞交了通過國際數(shù)據(jù)質(zhì)量控制體系檢驗(yàn)的34,713,,312個(gè)分型數(shù)據(jù),,基因組分型密度達(dá)到3.65kb。國際方面的質(zhì)量控制實(shí)驗(yàn)結(jié)果表明,,中國上交的數(shù)據(jù)準(zhǔn)確率超過99.95%,,特別是在HapMap計(jì)劃后期,中國團(tuán)隊(duì)在所有分型中心中第一個(gè)完成全部補(bǔ)洞任務(wù),。在中國人樣本取樣分析中,,除了已經(jīng)使用的45份樣品,,其他提交的樣品也都轉(zhuǎn)化為永久細(xì)胞株,為HapMap計(jì)劃的后期研究和其他遺傳相關(guān)研究提供樣品,。為中華民族的遺傳多態(tài)研究,,特別是疾病相關(guān)的多態(tài)性研究提供了一筆無價(jià)的財(cái)富。
拿著“基因”就醫(yī)將不再遙遠(yuǎn)
2005年10月26日,,歷時(shí)3年,,總投資超過1.4億美元的人類基因組單體型圖在美國宣布繪制完畢??茖W(xué)家共搜集了269名志愿者的全基因組信息,,針對(duì)100多萬個(gè)常見SNP位點(diǎn)進(jìn)行了分型檢測,標(biāo)定了單體型“模塊”在DNA鏈上的“邊界”,,并推算出代表常見單體型的標(biāo)簽SNP位點(diǎn),,在群體規(guī)模上整合了人類遺傳多態(tài)信息。
國際HapMap計(jì)劃可以看做是人類基因組計(jì)劃的續(xù)集,。在全基因組規(guī)模上,,科學(xué)家通過對(duì)亞、歐,、非裔269個(gè)DNA樣品,,在全基因組范圍進(jìn)行高密度大規(guī)模的SNP分型鑒定,確立人類DNA序列上多態(tài)位點(diǎn)的主要群體分布模式和公共數(shù)據(jù)庫,,并且通過分析常見遺傳多態(tài)位點(diǎn)的相互關(guān)系,,在全基因組范圍揭示SNP位點(diǎn)的連鎖遺傳規(guī)律或相關(guān)性;繪制以單條染色體為單位的多態(tài)位點(diǎn)在人群中常見的遺傳圖譜,。
曾長青說,,盡管人類單基因病已經(jīng)發(fā)現(xiàn)上千種,但這些疾病在人群中發(fā)病頻率很低,。常見的癌癥,、中風(fēng)、心臟病,、糖尿病,、自體免疫疾病、憂郁癥和哮喘等疾病都是多個(gè)基因上的變異位點(diǎn)與環(huán)境因子共同作用的結(jié)果,。實(shí)際上,,單個(gè)基因上的變異對(duì)疾病的作用是微效的,導(dǎo)致疾病易感性的是多基因SNP的聯(lián)合作用,。根據(jù)“常見疾病——常見變異”的假說,,罹患常見疾病的風(fēng)險(xiǎn)受到人群中相對(duì)常見的遺傳變異的影響。目前越來越多與常見疾病相關(guān)的遺傳變異的多態(tài)位點(diǎn)正在被發(fā)現(xiàn),,對(duì)這些SNPs及其單體型的認(rèn)識(shí),,將使人類最終揭示復(fù)雜性疾病的遺傳基礎(chǔ),。
“這一重大國際項(xiàng)目的完成,將大大提高未來規(guī)?;蚪M分析的效率,,最終惠及醫(yī)學(xué)遺傳學(xué)研究。”曾長青說:“找到常見復(fù)雜性疾病的易感基因及其藥物敏感性的相關(guān)基因,,為群體遺傳多樣性研究提供設(shè)計(jì)及分析的基本數(shù)據(jù)和運(yùn)算方法,;提供分子遺傳的數(shù)據(jù)基礎(chǔ),就能夠幫助人們找到腫瘤,、高血壓,、精神性疾病等復(fù)雜性疾病的致病基因。在了解這些基因是如何導(dǎo)致疾病之后,,研究人員就能設(shè)計(jì)出更好的預(yù)防,、診斷和治療疾病的方法,同時(shí)研發(fā)出療效更好的藥物,。”
此外,,HapMap還將產(chǎn)生目前難以完全預(yù)料的影響,如改變現(xiàn)在的就醫(yī)模式,,將來患者可以手持裝著自己基因信息的光盤就醫(yī),,醫(yī)生可以據(jù)此對(duì)患者從遺傳構(gòu)成上實(shí)現(xiàn)個(gè)體化醫(yī)療,從而得到最好的效果并將副作用降至最低,;與長壽和抗病能力有關(guān)的遺傳變異被確定,,將產(chǎn)生具有廣泛益處的新療法;對(duì)于常見疾病和涉及多個(gè)基因,、與遺傳和環(huán)境都有關(guān)系的復(fù)雜疾病,,科學(xué)家可以根據(jù)HapMap排查出其可能存在差異的位點(diǎn),總結(jié)出其中的遺傳規(guī)律,,達(dá)到預(yù)測,、預(yù)警、診斷,、治療的目的,。
希望更多人看懂“天書”
HapMap計(jì)劃完成后,曾長青本該大大地放松一下了,,但是她依然沒有從緊張中解脫出來。集中整理已經(jīng)取得的結(jié)果,,完成文章發(fā)表和人才培養(yǎng),;分析、利用產(chǎn)生的數(shù)據(jù)進(jìn)行基因組結(jié)構(gòu)及各族裔與中華民族遺傳多樣性及其疾病相關(guān)研究等都是擺在她眼前的工作,。曾長青說,,眼下最令她興奮的是開會(huì),,聽同事們介紹工作進(jìn)展。“爭論問題比看外國大片還過癮,。”
“國際人類基因組單體型圖真是個(gè)金礦,。”曾長青有些激動(dòng)地說,“很多遺傳學(xué),、醫(yī)學(xué)都可以在這張遺傳基因用表上繼續(xù)深入,,獲得數(shù)據(jù)和思路。”
例如,,對(duì)同一人群間和不同人群間的遺傳多態(tài)和單體型的信息進(jìn)行比較,,探查基因的產(chǎn)物即RNA和蛋白質(zhì)的量和形態(tài)的不同;比如DNA的生物學(xué)特性,、新的遺傳多態(tài)性的產(chǎn)生,、人群的遺傳歷史以及世界上不同地區(qū)人群之間的聯(lián)系等。從研究理論到分析方法與分型技術(shù),,HapMap促進(jìn)了群體遺傳學(xué)在分子水平的研究和生物信息學(xué)的發(fā)展,,還推動(dòng)基因組、蛋白質(zhì)組,、轉(zhuǎn)錄組等各個(gè)“組學(xué)”多系統(tǒng)生物學(xué)的研究進(jìn)展,,從而涵蓋基礎(chǔ)科學(xué)和應(yīng)用科學(xué)的領(lǐng)域研究。
但目前令曾長青苦惱的是,,很多從事生物醫(yī)學(xué)研究的人還不知怎么進(jìn)入這座“金礦”尋寶,。她告訴記者,近日有專家問她:“這張圖怎么用???”所以,曾長青決定今年要開設(shè)相關(guān)學(xué)習(xí)班,,不但把人們帶到這座巨大的數(shù)據(jù)庫前,,還要為研究者架起步入“天書”的“云梯”,讓其他研究者熟悉HapMap,,讀懂并學(xué)會(huì)利用HapMap,,推動(dòng)中國的生命科學(xué)研究。
曾長青特別指出,,人類基因組的國際HapMap計(jì)劃因其巨大的公益性,,廣泛的合作性,學(xué)科的先進(jìn)性而舉世矚目,。其實(shí)打開這個(gè)金礦的“密碼”很簡單,,就是在電腦上點(diǎn)擊http://www.hapmap.org,就可以登錄這個(gè)海量的遺傳多態(tài)數(shù)據(jù)庫,免費(fèi)獲取所需數(shù)據(jù),。遺憾的是,,至今來自中國的點(diǎn)擊還不多,但中國的研究者已經(jīng)開始積極使用HapMap的數(shù)據(jù)庫和相關(guān)軟件算法,。
據(jù)悉,,自2003年11月此網(wǎng)站開通以來至2005年10月,HapMap數(shù)據(jù)庫已被來自100多個(gè)國家的研究者訪問,,次數(shù)高達(dá)50萬次以上,。目前此網(wǎng)站每月靜態(tài)網(wǎng)頁訪問次數(shù)超過3萬次,其中半數(shù)為大批量的數(shù)據(jù)下載,。此外,,每月利用HapMapbrowser進(jìn)行數(shù)據(jù)互動(dòng)訪問的次數(shù)超過10萬次。
從1%國際人類基因組測序項(xiàng)目到HapMap計(jì)劃的10%,,中國科學(xué)家在基因組學(xué)領(lǐng)域站到了世界科學(xué)前沿,。HapMap的“中國卷”從目標(biāo)到技術(shù)路線完成了與國際接軌,從遺傳統(tǒng)計(jì)和關(guān)聯(lián)分析研究原理,,到SNP分型反應(yīng)的設(shè)計(jì)與運(yùn)作構(gòu)成了可互為補(bǔ)充的大型高度低成本SNP分型平臺(tái),。
更重要的是,沒有中國的這一參與,,就談不上在這個(gè)全球范圍基因組研究計(jì)劃中使用漢族樣品,。中國通過10%的貢獻(xiàn),使這一巨大的遺傳多態(tài)數(shù)據(jù)庫中含有1/6的漢族信息,,這將為中華民族的遺傳多態(tài),,特別是重大疾病研究提供重要基本數(shù)據(jù),極大地促進(jìn)我國在這一領(lǐng)域的學(xué)科發(fā)展,。目前曾長青等人的課題組已經(jīng)開始與中國醫(yī)科院等多家單位開展臨床合作,,研究肺癌、心血管病等遺傳規(guī)律,。
曾長青欣慰地說:“HapMap數(shù)據(jù)無疑會(huì)為人們了解常見疾病和人類基因之間的關(guān)系作出貢獻(xiàn),。”(資料來源:中科院北京基因研究所)
相關(guān)鏈接
■什么是單核苷酸多態(tài)性(SNP)、等位位點(diǎn)(allele)和基因分型
在基因組中,,不同個(gè)體在DNA序列上同一位置的單個(gè)堿基的差異被稱作單核苷酸多態(tài)性(SNP),。例如,某些人的染色體上某個(gè)位置的堿基是A,,而另一些人的染色體相同位置上的堿基則是G,。同一位置上的每個(gè)堿基類型叫做一個(gè)等位位點(diǎn)。
除性染色體外,,每個(gè)人體內(nèi)的染色體都有兩份,。一個(gè)人所擁有的一對(duì)等位位點(diǎn)的類型被稱作基因型(genotype),?;蛐瓦@一名稱即可以指個(gè)體的某個(gè)SNP的等位位點(diǎn),,也可以指基因組中很多SNPs的等位位點(diǎn)。檢定一個(gè)人的基因型,,被稱作基因分型(genotyping)或SNP分型,。
■什么是單體型
人類的所有群體中大約存在1000萬個(gè)SNP位點(diǎn),其中稀有的SNP位點(diǎn)的頻率至少有1%,。相鄰SNPs的等位位點(diǎn)傾向于以一個(gè)整體遺傳給后代,。位于染色體上某一區(qū)域的一組相關(guān)聯(lián)的SNP位點(diǎn)被稱作單體型(haplotype)。大多數(shù)染色體區(qū)域只有少數(shù)幾個(gè)常見的單體型(每個(gè)具有至少5%的頻率),,它們代表了一個(gè)群體中人與人之間的大部分多態(tài)性,。一個(gè)染色體區(qū)域可以有很多SNP位點(diǎn),但是只用少數(shù)幾個(gè)標(biāo)簽SNPs,,就能夠提供該區(qū)域內(nèi)大多數(shù)的遺傳多態(tài)模式,。
單體型圖描述了人類常見的遺傳多態(tài)模式。它包括染色體上具有成組緊密關(guān)聯(lián)SNPs的區(qū)域,,這些區(qū)域中的單體型以及這些單體型的標(biāo)簽SNPs,。同時(shí),單體型圖還將標(biāo)示出那些SNP位點(diǎn)關(guān)聯(lián)不緊密的區(qū)域,。