最新研究顯示人類(lèi)基因數(shù)量比原先估計(jì)少得多,這是人類(lèi)與其他種類(lèi)基因數(shù)量的比較
美國(guó)國(guó)家人類(lèi)基因組研究所所長(zhǎng),、最新人類(lèi)基因數(shù)分析報(bào)告作者克林斯認(rèn)為,人類(lèi)的基因數(shù)實(shí)際僅有2萬(wàn)到2.5萬(wàn)。比國(guó)際人類(lèi)基因組計(jì)劃2001年公布的人類(lèi)擁有3萬(wàn)到4萬(wàn)基因數(shù)要低,。
科學(xué)家長(zhǎng)期以來(lái)對(duì)人類(lèi)有多少基因進(jìn)行了估測(cè),,10年前,,科學(xué)家還普遍認(rèn)為人類(lèi)大約有10萬(wàn)個(gè)基因,而“國(guó)際人類(lèi)基因組排序聯(lián)合體”最初的估計(jì)數(shù)字卻明顯低于上述數(shù)字,。2001年,,它估測(cè)的人類(lèi)基因數(shù)為約6.6萬(wàn)個(gè),以后又降到4萬(wàn)個(gè),。
科學(xué)家在研究報(bào)告中稱(chēng),于2001年報(bào)告其所估測(cè)的基因數(shù)目時(shí),,還有很多工作未完成,?;驍?shù)分析報(bào)告的另一個(gè)作者,、麻州廣闊研究所的蘭德解釋說(shuō):“人類(lèi)基因組的一些區(qū)域中隱藏著很多基因片段的復(fù)本,最終完成的工作顯示,,最初認(rèn)為是基因的,,實(shí)際上是一些基因片段的復(fù)本,,此前的估算曾將這些復(fù)本計(jì)算在內(nèi),。”科學(xué)家說(shuō),,新的估測(cè)值是確切的,,人體極可能有2萬(wàn)個(gè)基因,,因?yàn)榱硪患覍?shí)驗(yàn)室的工作也已獨(dú)立表明,,存在19599個(gè)基因,。
相比之下,,小線蟲(chóng)Celegans大約有1.95萬(wàn)個(gè)基因,,開(kāi)花植物—阿拉伯芥約有2.7萬(wàn)個(gè)基因。伯克利加州大學(xué)基因?qū)<音斮e說(shuō):“我們必須習(xí)慣于人類(lèi)擁有的基因數(shù),,不比蠕蟲(chóng)多的這樣一個(gè)事實(shí),。并且這個(gè)新的估測(cè)值,,將來(lái)不可能變化很多,。”
專(zhuān)家們認(rèn)為,,人體的復(fù)雜性不僅僅來(lái)源于基因,。蘭德稱(chēng):“人類(lèi)的復(fù)雜性不僅僅涉及到基因的數(shù)目,而更在于自然界如何采用這些基因。”但人類(lèi)如何擁有較少的基因,,而又是如此復(fù)雜呢?克林斯說(shuō):“這在于人有多種蛋白質(zhì),,即復(fù)雜的蛋白質(zhì)做更多的工作,。很多生物學(xué)上的復(fù)雜性,,不是基于單個(gè)蛋白質(zhì),而是基于多個(gè)蛋白質(zhì)的組合,。”
從事人類(lèi)基因研究的美國(guó)科學(xué)家們?nèi)涨氨硎荆c植物或小蠕蟲(chóng)相比,,人類(lèi)的基因數(shù)量并沒(méi)有明顯的優(yōu)勢(shì),。最新的估算認(rèn)為,,人類(lèi)的基因數(shù)量只在2萬(wàn)到2.5萬(wàn)個(gè)之間,而一些植物或小蠕蟲(chóng)的基因數(shù)量也在這個(gè)范圍,因此二者之間的差異并不是很大,。
科學(xué)家們同時(shí)表示,雖然從數(shù)量上相比,,人類(lèi)的基因并不占優(yōu)勢(shì),,但人類(lèi)的基因圖譜卻要復(fù)雜得多,。另一名美國(guó)科學(xué)家埃里克·蘭德?tīng)枺‥ric Lander)對(duì)此表示:“基因的數(shù)量多少并不是關(guān)鍵問(wèn)題,,最重要的因素是不同物種如何利用了這些基因。”長(zhǎng)期以來(lái),,科學(xué)家們一直在探究人類(lèi)的基因數(shù)量究竟有多少,。一些科學(xué)家甚至曾認(rèn)為,人類(lèi)的基因數(shù)量至少應(yīng)在10萬(wàn)個(gè)左右或以上。后來(lái)這個(gè)估算數(shù)字被降低到了6.6萬(wàn)個(gè),,2001年以來(lái),,該數(shù)字又被降到4.4萬(wàn)個(gè),。
人類(lèi)基因組序列測(cè)定的完成是一件具有歷史意義的大事件,。今天,國(guó)際人類(lèi)基因組測(cè)序委員會(huì)對(duì)已經(jīng)完成的人類(lèi)基因組序列給出了科學(xué)的陳述,,這個(gè)敘述將人類(lèi)蛋白質(zhì)編碼基因的估計(jì)數(shù)目由35000個(gè)縮減到了20000至25000個(gè),。這篇文章出現(xiàn)在2004年10月21日的Nature上。
十年前,,大多數(shù)研究人員認(rèn)為人類(lèi)有大約1000000個(gè)基因,。但是三年前,,在分析人類(lèi)基因組工作草圖前,,研究人員估計(jì)的基因數(shù)目為30000到350000個(gè)。
在Nature上的文章中,,研究人員敘述了人類(lèi)基因組計(jì)劃的最終結(jié)果,。新的分析進(jìn)一步減少了基因數(shù)目并且為我們提供了最為清晰的人類(lèi)基因組圖譜。這種高精確度的人類(lèi)基因組序列使全世界的研究人員能夠更精確地對(duì)遺傳信息以及它們對(duì)健康和疾病的影響進(jìn)行研究,。
分析人類(lèi)基因組的一個(gè)重要任務(wù)就是確定所有基因,。據(jù)最新的研究結(jié)果,研究人員已經(jīng)確定人類(lèi)基因組中存在19599個(gè)蛋白質(zhì)編碼基因,,并且還確定有另外的2188個(gè)DNA片斷可能是蛋白質(zhì)編碼基因,。
新分析發(fā)現(xiàn),較早的一些基因模型是錯(cuò)誤的,,這是由于當(dāng)時(shí)人類(lèi)基因組圖譜沒(méi)有徹底完成的緣故,。文章還敘述了圖譜的完成過(guò)程和對(duì)完成圖譜的質(zhì)量評(píng)估。這個(gè)評(píng)估確定完成的序列包括了99%的人類(lèi)基因組的常染色質(zhì)部分,,并且測(cè)序的精確度達(dá)99.999%,。而且,序列的連續(xù)性也大幅提高,。但是,,“完成”并不代表人類(lèi)基因組序列是完美的。在完成的人類(lèi)基因組序列中仍然有341個(gè)缺口,,而在2000年6月公布的工作草圖中則有多達(dá)150000個(gè)缺口,。
質(zhì)量提高的人類(lèi)基因組序列還提供了清楚的證據(jù)證明DNA片斷的復(fù)制以及基因的形成和死亡等現(xiàn)象。
完成的人類(lèi)基因組序列的精確性使研究人員對(duì)基因的產(chǎn)生和死亡有了一個(gè)初步的了解,。另外,,研究人員用完成的人類(lèi)基因組確定了33個(gè)幾乎完整的假基因,,這些基因是在近期才發(fā)生了一個(gè)或更多的突變并使它們的功能丟失,。
一項(xiàng)最新的研究結(jié)果顯示,人類(lèi)基因數(shù)量與微小的開(kāi)花植物和小蠕蟲(chóng)的基因數(shù)量基本相同,這無(wú)疑是對(duì)人類(lèi)虛榮心是一次打擊,。研究人員對(duì)人類(lèi)基因數(shù)量的最新估計(jì)與三年前相比有大幅下降。
此項(xiàng)研究的兩位作者之一的弗朗西斯.柯林斯博士表示:“我們?nèi)祟?lèi)在這場(chǎng)競(jìng)爭(zhēng)并沒(méi)有留下非常深刻的印象,。”科學(xué)家最新估計(jì),人類(lèi)基因數(shù)量在2萬(wàn)至2. 5萬(wàn)個(gè)之間,,而同一 批科學(xué)家在2001年公布的數(shù)字卻是3萬(wàn)至4萬(wàn)個(gè)。相比而言,,線蟲(chóng)的基因數(shù)量大約是1. 95萬(wàn)個(gè),。一種稱(chēng)為擬南芥的植物的基因數(shù)量在2.7萬(wàn)個(gè)左右,。線蟲(chóng)和擬南芥都是科學(xué)家最喜歡的研究體。
這項(xiàng)研究的另一位作者,、美國(guó)麻省劍橋博大研究院科學(xué)家的埃里克.蘭德表示:“這不僅是基因數(shù)量問(wèn)題,,事實(shí)上是人類(lèi)如何使用這些基因的問(wèn)題。”科學(xué)家長(zhǎng)期以來(lái)一直在推測(cè)人類(lèi)擁有的基因數(shù)量,。最初,,一些科學(xué)家甚至估計(jì)人類(lèi)基因數(shù)量達(dá)到10萬(wàn)個(gè),甚至更多,。目前,人類(lèi)基因組計(jì)劃對(duì)人類(lèi)基因數(shù)量的估計(jì)比該計(jì)劃最初公布的數(shù)字有大幅下降,。
在國(guó)際人類(lèi)基因定序聯(lián)盟2001年做出人類(lèi)基因數(shù)量的估計(jì)之前,,科學(xué)家一般估計(jì)人類(lèi)基因數(shù)量在6.6萬(wàn)個(gè)左右,甚至10萬(wàn)個(gè)以上,。后來(lái),,這一數(shù)據(jù)又下降至4.4萬(wàn)個(gè)左右。國(guó)家人類(lèi)基因研究所主任柯林斯最初也估計(jì)人類(lèi)基因數(shù)量大概為4.8萬(wàn)個(gè),,這大約是目前數(shù)據(jù)的兩倍,??铝炙贡硎荆?ldquo;當(dāng)然,學(xué)無(wú)止境,。”與此前科學(xué)家的估計(jì)一樣,,新的數(shù)據(jù)只涉及“告訴”細(xì)胞如何制造蛋白質(zhì)的基因。這項(xiàng)研究將由國(guó)際人類(lèi)基因定序聯(lián)盟發(fā)表在10月21日出版的《Nature》雜志上,。
國(guó)際人類(lèi)基因排序聯(lián)盟已確定了組成人類(lèi)DNA代碼的超過(guò)30億個(gè)化學(xué)模組幾乎全部的序列,。這些模組的某種序列構(gòu)成基因,就如同一定順序排列的字母組成單詞一樣,。在國(guó)際人類(lèi)基因排序聯(lián)盟2001年做出對(duì)人類(lèi)基因數(shù)量的估計(jì)時(shí),,該組織在其確定的DNA序列方面仍舊存在許多差距。現(xiàn)在,,科學(xué)家利用目前發(fā)達(dá)的科學(xué)技術(shù)已經(jīng)盡可能地縮小了這些差距,。蘭德表示,許多最初被計(jì)算成基因的DNA序列事實(shí)上只是真正基因沒(méi)有任何功能的“拷貝”,,而有時(shí)同一個(gè)基因被計(jì)算成了兩個(gè)基因,。
該組織公布了對(duì)包含人類(lèi)基因密碼部分的基因序列所作的分析。這一基因序列草圖是在2001年2月完成的,。研究人員說(shuō):“人類(lèi)的基因組似乎只包含2萬(wàn)到2.5萬(wàn)個(gè)蛋白質(zhì)編碼基因,。”
而在4年前,據(jù)認(rèn)為人類(lèi)基因組包含大約10萬(wàn)個(gè)基因,。在2001年公布的基因序列草圖把這一估計(jì)降低到3萬(wàn)至4萬(wàn)個(gè),。
相比之下,老鼠有大約3萬(wàn)個(gè)基因,,盡管這個(gè)數(shù)字也可能還會(huì)減少,。根據(jù)最新的估計(jì),另一種實(shí)驗(yàn)用動(dòng)物————對(duì)線蟲(chóng)(一種比較低等的蚯蚓)————擁有大約1.9萬(wàn)個(gè)基因,,果蠅則擁有大約1.3萬(wàn)個(gè)基因,。
國(guó)際人類(lèi)基因測(cè)序組織(IHGSC)和一家美國(guó)公司(塞萊拉基因組公司)率先完成了人類(lèi)基因組測(cè)序。
在21日出版的英國(guó)《自然》雜志上公布的一項(xiàng)研究報(bào)告中,,IHGSC說(shuō),,對(duì)富含基因的那一段基因組序列進(jìn)行的徹底認(rèn)真的檢查剔除了很多錯(cuò)誤和前后不一致的東西。現(xiàn)在,,基因組草圖在28.5億個(gè)堿基對(duì)的編碼中只剩下341個(gè)缺口,。
測(cè)序的失誤率已經(jīng)降至十萬(wàn)分之一。該組織說(shuō),,這種精確度意味著這一處理過(guò)的序列將成為今后幾十年的標(biāo)準(zhǔn),。他們希望這一序列將成為非常可靠的數(shù)據(jù)庫(kù),,能用來(lái)研究引起疾病的基因根源和治療這種疾病的藥物,。
下一步是給異染色質(zhì)————不富含基因但充滿(mǎn)“垃圾”或“不活動(dòng)”DNA的那一段基因序列————測(cè)序,。按照現(xiàn)在的想法,這一基因序列似乎是沒(méi)有用處的,。異染色質(zhì)在人類(lèi)基因組中占大約五分之一,,給這一基因序列測(cè)序和處理可能需要花6年多時(shí)間。