全世界數(shù)十位科學(xué)精英聚集在一起,拍下了一張合影,。他們宣布:人類基因組國際單體型圖(HapMap)計劃完成了,。中國科學(xué)院、中國工程院立即將其評選為2005年世界十大科技進展之一,。為什么這張圖能引起中國科學(xué)家的高度關(guān)注,?為什么全世界科學(xué)家要用3年時間繪制它,?負責(zé)該計劃“中國卷”的曾長青研究員說,繪制HapMap就是為了注釋3年前完成的人類基因組框架圖這部人類遺傳學(xué)“天書”,,找出常見變異位點的分布規(guī)律并為DNA序列的多態(tài)性貼上標簽,,這對人類研究自身健康意義非凡。
每個人身上都攜帶著祖先留下的基因,。
2002年“國際人類基因組測序計劃”的完成及其相繼研究發(fā)現(xiàn),,人作為一個物種在DNA序列中僅有1‰不同,但因此卻造成了黑,、黃,、白不同人種及高矮胖瘦、疾病易感等千差萬別,。人類基因組測序圖繪制完成的同時還發(fā)現(xiàn)了基因組中的大量序列變異和多態(tài)性,,這些發(fā)現(xiàn)隨即成為生命科學(xué)新的研究熱點。
尋找人類起源和疾病的工具圖
當記者在中國科學(xué)院北京基因研究所找到科研部長曾長青研究員時,,驚訝地發(fā)現(xiàn),,這位HapMap計劃“中國卷”的總協(xié)調(diào)竟然是位40多歲的女士。一間不足十平方米的辦公室里,,一張寫字臺,、一臺電腦、一張兼做床鋪的長沙發(fā),,就是她馳騁基因王國,,與世界頂級大科學(xué)家對話的“司令部”。
“其實,,這份人類基因組單體型圖就是后續(xù)研究的工具箱和數(shù)據(jù)庫,,給尋找致病相關(guān)基因的人提供了一個群體遺傳學(xué)參照體系。”曾長青簡潔概述全世界科學(xué)家3年的辛勤勞動,,“學(xué)過數(shù)學(xué)的人都知道,,利用數(shù)學(xué)用表可以輕松地查出很多難以計算的數(shù)值,比如開方,、正余切,、正余弦值之類。人類基因組單體型圖相當于一份人類遺傳變異研究的‘遺傳用表’,,盡管不能直接確定疾病相關(guān)基因,,但單核苷酸多態(tài)性(SNP)廣泛分布于人類全基因組,最大限度地代表了不同個體之間的遺傳差異,,是研究復(fù)雜疾病,、藥物敏感性及人類進化的重要標記。研究人員通過SNP排列注明差異‘標簽’,,就可以更高效地尋找與疾病相關(guān)的基因變異,,例如將患者的單體型與健康人(對照)的單體型相比較,,某一種單體型在患者中經(jīng)常出現(xiàn),影響該疾病的基因可能就存在于這個單體型內(nèi)部或附近,。”
曾長青研究員告訴記者,,現(xiàn)代人群的大多數(shù)變異都來自于在祖先中就已經(jīng)存在的多態(tài)性。隨著人類遷移至世界各地,,由于隨機性,、自然選擇和其他的遺傳機制,各個地區(qū)的單體型頻率甚至類型變得不同,。只有闡明DNA序列的差異以及基因組的多態(tài)性,,才能深入準確地了解人類起源、進化和遷徙過程中的DNA序列變化,,也才能真正了解與疾病特別是多基因疾病有關(guān)的遺傳機制,。
上世紀末,在國際人類基因組草圖尚未完成時,,許多科研機構(gòu)和制藥公司就已瞄準這一領(lǐng)域,,斥巨資研究SNP,以求發(fā)現(xiàn)基因中的變異位點,,更多地了解疾病的起因以及預(yù)防,、診斷和治療的方法。但如果對每一個群體或個體的研究項目都要對每一個SNP位點進行檢測,、鑒定,,費用將昂貴得驚人。因此,,國際人類基因組計劃協(xié)作組在人類基因組圖繪制完成后,及時提出了人類基因組研究的第二個戰(zhàn)略任務(wù):再次以多國分擔(dān)合作的形式,,共同構(gòu)建整合人類全基因組遺傳與變異信息的單體型圖,,旨在惠及全球的生命科學(xué)基因組學(xué)研究,致力于克服人類常見疾病的醫(yī)學(xué)研究,。
最窮的團隊擔(dān)起了“中國卷”繪制工作
HapMap計劃啟動于2002年10月29日,,由加拿大、日本,、尼日利亞,、中國、英國和美國六國11個研究中心的科學(xué)家共同承擔(dān),。其中,,美國完成31%,日本完成25%,,英國完成24%,,加拿大完成10%,,中國完成10%的任務(wù)。此外,,亞,、非、歐裔各提供90份樣本,。除了上世紀80年代在美國采集的歐裔樣本,,亞裔樣本由中國和日本各提供一半,非裔樣本由尼日利亞提供,。全部血樣品送到美國國立衛(wèi)生院下屬的人類遺傳細胞存儲中心,,轉(zhuǎn)化成細胞株后統(tǒng)一提取成DNA分送至各參加中心進行SNP分型檢定。
中國承擔(dān)的具體研究任務(wù)是3號,、21號和8號染色體短臂單體型圖的繪制,,以及提供45份亞裔樣品。該計劃“中國卷”的實施得到科技部,、中國科學(xué)院,、香港創(chuàng)新科技署和香港大學(xué)教育資助委員會的高度重視,2002年列入科技部“十五”國家重大科技攻關(guān)項目,,撥款5000萬元,。同時香港特區(qū)政府對參與HapMap“中國卷”的三所香港大學(xué)給予資助。2003年3月,,中華單體型圖協(xié)作組在北京成立,。
中科院北京基因組研究所所長楊煥明博士任主席。從美國得州大學(xué)休斯頓醫(yī)學(xué)院回國,,在基因組研究所擔(dān)任SNP研究項目的首席科學(xué)家及科研部部長的曾長青博士被委以重任,,負責(zé)國際“人類基因組單體型圖”計劃的“中國卷”的實施與協(xié)調(diào)。中科院北京基因組研究所負責(zé)3號染色體的大部分及其8號染色體短臂,,約占整個基因組長度的6%,。香港小組的港大平臺負責(zé)3號染色體短臂的70MB的一段區(qū)域,約占整個基因組的2.5%,。國家人類基因組南方中心負責(zé)21號染色體的HapMap構(gòu)建,,占整個基因組的1.1%。
這是一個艱難的起步,,當時國內(nèi)沒有建立可進行高通量SNP分型,,具有高精確度和敏感度的研究平臺。曾長青說,,中國團隊在北京,、香港和上海三地的SNP分型平臺都是從采購設(shè)備起步的。不久北京遭遇了SARS,,采購的新設(shè)備不能及時到位安裝,。與其他已經(jīng)具備的完善設(shè)施和豐富經(jīng)驗的參與中心相比,,中國團隊的SNP分型工作在時間上比國際伙伴們幾乎落后一年。更嚴峻的還有資金不足問題,,中國團隊特別是北京中心在所有國際參加者中最窮,,他們面臨時間和資金短缺的巨大壓力。
起步最晚的中國人后來居上
科學(xué)的舞臺是合作的舞臺,,更是競爭的舞臺,。為了追回失去的時間,中國團隊開始了一場苦戰(zhàn),。一方面,,在科學(xué)策略上,他們把握多態(tài)位點的選取和分型戰(zhàn)略,,盡量減少對未經(jīng)驗證的SNP位點的使用,,同時進行高通量平臺的優(yōu)化條件摸索,使成功率達到最高潛力,,將反應(yīng)成本降低至最小,。另一方面,科研人員放棄了兩年多的所有長短假期,,讓儀器24小時運轉(zhuǎn),。曾長青形容當時的緊張程度,“在購買設(shè)備時廠家代表曾自信地說他們質(zhì)譜儀中的激光管能用幾千萬次,,夠我們用一輩子,。結(jié)果不到一年激光管‘爆’了,廠家不好意思地給我們換了一個新的,。”
曾長青很感慨,,在那段歲月,北京基因組研究所與HapMap有關(guān)的所有實驗室和辦公室都兼有宿舍的功能,,很多研究人員就吃住在辦公室,,為了國家的利益,有的很有才華的研究生放棄了去國外深造的優(yōu)厚獎學(xué)金,。不知多少個夜晚,她就是在那張沙發(fā)上度過的,。至今令她無法釋懷的是,,正在工作最吃緊的時候,從小將她帶大的大姑在沈陽因病去世,。她說:“在美國期間每次回國尚能繞道前去探訪,,這次近在咫尺卻無法為她送終。”
在嚴格執(zhí)行捐獻者個人的知情與同意基礎(chǔ)上,,2003年9月,,中國科研人員三次在北京師范大學(xué)漢族大學(xué)生中收集了180份健康血樣標本,,率先完成了國際協(xié)作組要求的樣品采集工作。隨后的進展很順利,,中國送去國際HapMap計劃統(tǒng)一存儲處的樣品不但全部成功轉(zhuǎn)化,,而且在遵守倫理學(xué)規(guī)范與法規(guī),綜合國情特點和全程透明操作等方面,,贏得了國際同行的一致好評,。
2004年夏天,我國的研究趕上了國際合作中的基本進度,,同年秋天超過中游,,整個2004年完成了近1600萬份反應(yīng)數(shù)據(jù)。2005年4個月內(nèi),,則完成SNP分型數(shù)據(jù)1800多萬個,。3年中,中國團隊就自己負責(zé)的染色體區(qū)域向國際數(shù)據(jù)協(xié)調(diào)中心遞交了通過國際數(shù)據(jù)質(zhì)量控制體系檢驗的34,,713,,312個分型數(shù)據(jù),基因組分型密度達到3.65kb,。國際方面的質(zhì)量控制實驗結(jié)果表明,,中國上交的數(shù)據(jù)準確率超過99.95%,特別是在HapMap計劃后期,,中國團隊在所有分型中心中第一個完成全部補洞任務(wù),。在中國人樣本取樣分析中,除了已經(jīng)使用的45份樣品,,其他提交的樣品也都轉(zhuǎn)化為永久細胞株,,為HapMap計劃的后期研究和其他遺傳相關(guān)研究提供樣品。為中華民族的遺傳多態(tài)研究,,特別是疾病相關(guān)的多態(tài)性研究提供了一筆無價的財富,。
拿著“基因”就醫(yī)將不再遙遠
2005年10月26日,歷時3年,,總投資超過1.4億美元的人類基因組單體型圖在美國宣布繪制完畢,。科學(xué)家共搜集了269名志愿者的全基因組信息,,針對100多萬個常見SNP位點進行了分型檢測,,標定了單體型“模塊”在DNA鏈上的“邊界”,并推算出代表常見單體型的標簽SNP位點,,在群體規(guī)模上整合了人類遺傳多態(tài)信息,。
國際HapMap計劃可以看做是人類基因組計劃的續(xù)集。在全基因組規(guī)模上,科學(xué)家通過對亞,、歐,、非裔269個DNA樣品,在全基因組范圍進行高密度大規(guī)模的SNP分型鑒定,,確立人類DNA序列上多態(tài)位點的主要群體分布模式和公共數(shù)據(jù)庫,,并且通過分析常見遺傳多態(tài)位點的相互關(guān)系,在全基因組范圍揭示SNP位點的連鎖遺傳規(guī)律或相關(guān)性,;繪制以單條染色體為單位的多態(tài)位點在人群中常見的遺傳圖譜,。
曾長青說,盡管人類單基因病已經(jīng)發(fā)現(xiàn)上千種,,但這些疾病在人群中發(fā)病頻率很低,。常見的癌癥、中風(fēng),、心臟病,、糖尿病、自體免疫疾病,、憂郁癥和哮喘等疾病都是多個基因上的變異位點與環(huán)境因子共同作用的結(jié)果,。實際上,單個基因上的變異對疾病的作用是微效的,,導(dǎo)致疾病易感性的是多基因SNP的聯(lián)合作用,。根據(jù)“常見疾病——常見變異”的假說,罹患常見疾病的風(fēng)險受到人群中相對常見的遺傳變異的影響,。目前越來越多與常見疾病相關(guān)的遺傳變異的多態(tài)位點正在被發(fā)現(xiàn),,對這些SNPs及其單體型的認識,將使人類最終揭示復(fù)雜性疾病的遺傳基礎(chǔ),。
“這一重大國際項目的完成,,將大大提高未來規(guī)模化基因組分析的效率,,最終惠及醫(yī)學(xué)遺傳學(xué)研究,。”曾長青說:“找到常見復(fù)雜性疾病的易感基因及其藥物敏感性的相關(guān)基因,為群體遺傳多樣性研究提供設(shè)計及分析的基本數(shù)據(jù)和運算方法,;提供分子遺傳的數(shù)據(jù)基礎(chǔ),,就能夠幫助人們找到腫瘤、高血壓,、精神性疾病等復(fù)雜性疾病的致病基因,。在了解這些基因是如何導(dǎo)致疾病之后,研究人員就能設(shè)計出更好的預(yù)防,、診斷和治療疾病的方法,,同時研發(fā)出療效更好的藥物,。”
此外,,HapMap還將產(chǎn)生目前難以完全預(yù)料的影響,,如改變現(xiàn)在的就醫(yī)模式,將來患者可以手持裝著自己基因信息的光盤就醫(yī),,醫(yī)生可以據(jù)此對患者從遺傳構(gòu)成上實現(xiàn)個體化醫(yī)療,,從而得到最好的效果并將副作用降至最低;與長壽和抗病能力有關(guān)的遺傳變異被確定,,將產(chǎn)生具有廣泛益處的新療法,;對于常見疾病和涉及多個基因、與遺傳和環(huán)境都有關(guān)系的復(fù)雜疾病,,科學(xué)家可以根據(jù)HapMap排查出其可能存在差異的位點,,總結(jié)出其中的遺傳規(guī)律,達到預(yù)測,、預(yù)警,、診斷、治療的目的,。
希望更多人看懂“天書”
HapMap計劃完成后,,曾長青本該大大地放松一下了,但是她依然沒有從緊張中解脫出來,。集中整理已經(jīng)取得的結(jié)果,,完成文章發(fā)表和人才培養(yǎng);分析,、利用產(chǎn)生的數(shù)據(jù)進行基因組結(jié)構(gòu)及各族裔與中華民族遺傳多樣性及其疾病相關(guān)研究等都是擺在她眼前的工作,。曾長青說,眼下最令她興奮的是開會,,聽同事們介紹工作進展,。“爭論問題比看外國大片還過癮。”
“國際人類基因組單體型圖真是個金礦,。”曾長青有些激動地說,,“很多遺傳學(xué)、醫(yī)學(xué)都可以在這張遺傳基因用表上繼續(xù)深入,,獲得數(shù)據(jù)和思路,。”
例如,對同一人群間和不同人群間的遺傳多態(tài)和單體型的信息進行比較,,探查基因的產(chǎn)物即RNA和蛋白質(zhì)的量和形態(tài)的不同,;比如DNA的生物學(xué)特性、新的遺傳多態(tài)性的產(chǎn)生,、人群的遺傳歷史以及世界上不同地區(qū)人群之間的聯(lián)系等,。從研究理論到分析方法與分型技術(shù),HapMap促進了群體遺傳學(xué)在分子水平的研究和生物信息學(xué)的發(fā)展,還推動基因組,、蛋白質(zhì)組,、轉(zhuǎn)錄組等各個“組學(xué)”多系統(tǒng)生物學(xué)的研究進展,從而涵蓋基礎(chǔ)科學(xué)和應(yīng)用科學(xué)的領(lǐng)域研究,。
但目前令曾長青苦惱的是,,很多從事生物醫(yī)學(xué)研究的人還不知怎么進入這座“金礦”尋寶。她告訴記者,,近日有專家問她:“這張圖怎么用?。?rdquo;所以,,曾長青決定今年要開設(shè)相關(guān)學(xué)習(xí)班,,不但把人們帶到這座巨大的數(shù)據(jù)庫前,還要為研究者架起步入“天書”的“云梯”,,讓其他研究者熟悉HapMap,,讀懂并學(xué)會利用HapMap,推動中國的生命科學(xué)研究,。
曾長青特別指出,,人類基因組的國際HapMap計劃因其巨大的公益性,廣泛的合作性,,學(xué)科的先進性而舉世矚目,。其實打開這個金礦的“密碼”很簡單,就是在電腦上點擊http://www.hapmap.org,,就可以登錄這個海量的遺傳多態(tài)數(shù)據(jù)庫,,免費獲取所需數(shù)據(jù)。遺憾的是,,至今來自中國的點擊還不多,,但中國的研究者已經(jīng)開始積極使用HapMap的數(shù)據(jù)庫和相關(guān)軟件算法。
據(jù)悉,,自2003年11月此網(wǎng)站開通以來至2005年10月,,HapMap數(shù)據(jù)庫已被來自100多個國家的研究者訪問,次數(shù)高達50萬次以上,。目前此網(wǎng)站每月靜態(tài)網(wǎng)頁訪問次數(shù)超過3萬次,,其中半數(shù)為大批量的數(shù)據(jù)下載。此外,,每月利用HapMapbrowser進行數(shù)據(jù)互動訪問的次數(shù)超過10萬次,。
從1%國際人類基因組測序項目到HapMap計劃的10%,中國科學(xué)家在基因組學(xué)領(lǐng)域站到了世界科學(xué)前沿,。HapMap的“中國卷”從目標到技術(shù)路線完成了與國際接軌,,從遺傳統(tǒng)計和關(guān)聯(lián)分析研究原理,,到SNP分型反應(yīng)的設(shè)計與運作構(gòu)成了可互為補充的大型高度低成本SNP分型平臺。
更重要的是,,沒有中國的這一參與,,就談不上在這個全球范圍基因組研究計劃中使用漢族樣品。中國通過10%的貢獻,,使這一巨大的遺傳多態(tài)數(shù)據(jù)庫中含有1/6的漢族信息,這將為中華民族的遺傳多態(tài),,特別是重大疾病研究提供重要基本數(shù)據(jù),,極大地促進我國在這一領(lǐng)域的學(xué)科發(fā)展。目前曾長青等人的課題組已經(jīng)開始與中國醫(yī)科院等多家單位開展臨床合作,,研究肺癌,、心血管病等遺傳規(guī)律。
曾長青欣慰地說:“HapMap數(shù)據(jù)無疑會為人們了解常見疾病和人類基因之間的關(guān)系作出貢獻,。”(資料來源:中科院北京基因研究所)
相關(guān)鏈接
■什么是單核苷酸多態(tài)性(SNP),、等位位點(allele)和基因分型
在基因組中,不同個體在DNA序列上同一位置的單個堿基的差異被稱作單核苷酸多態(tài)性(SNP),。例如,,某些人的染色體上某個位置的堿基是A,而另一些人的染色體相同位置上的堿基則是G,。同一位置上的每個堿基類型叫做一個等位位點,。
除性染色體外,每個人體內(nèi)的染色體都有兩份,。一個人所擁有的一對等位位點的類型被稱作基因型(genotype),。基因型這一名稱即可以指個體的某個SNP的等位位點,,也可以指基因組中很多SNPs的等位位點,。檢定一個人的基因型,被稱作基因分型(genotyping)或SNP分型,。
■什么是單體型
人類的所有群體中大約存在1000萬個SNP位點,,其中稀有的SNP位點的頻率至少有1%。相鄰SNPs的等位位點傾向于以一個整體遺傳給后代,。位于染色體上某一區(qū)域的一組相關(guān)聯(lián)的SNP位點被稱作單體型(haplotype),。大多數(shù)染色體區(qū)域只有少數(shù)幾個常見的單體型(每個具有至少5%的頻率),它們代表了一個群體中人與人之間的大部分多態(tài)性,。一個染色體區(qū)域可以有很多SNP位點,,但是只用少數(shù)幾個標簽SNPs,就能夠提供該區(qū)域內(nèi)大多數(shù)的遺傳多態(tài)模式,。
單體型圖描述了人類常見的遺傳多態(tài)模式,。它包括染色體上具有成組緊密關(guān)聯(lián)SNPs的區(qū)域,,這些區(qū)域中的單體型以及這些單體型的標簽SNPs。同時,,單體型圖還將標示出那些SNP位點關(guān)聯(lián)不緊密的區(qū)域,。