Physorg網(wǎng)8月22日?qǐng)?bào)道,世界三大公共DNA及RNA序列儲(chǔ)存庫(kù)的基因序列信息已經(jīng)達(dá)到了100吉對(duì)堿基(100,,000,,000,,000對(duì)堿基——基因編碼的“字符”,。“吉”是量詞,是“兆”的1000倍,。)
聯(lián)合數(shù)據(jù)庫(kù)的數(shù)據(jù)交換策略為多種生物信息的全球交流鋪平了道路,。正是依靠這樣的策略,國(guó)際核苷序列聯(lián)合數(shù)據(jù)庫(kù)(INSDC http://www.insdc.org,)的三大成員——EMBL銀行(核酸序列數(shù)據(jù)庫(kù))(位于英國(guó)的Hinxton),、GenBank(位于美國(guó)的Bethesda),、以及日本DNA數(shù)據(jù)銀行(位于日本的Mishima)全都達(dá)到了上述這一里程碑式的目標(biāo)。
EMBL的歐洲生物信息研究所副主任Graham Cameron稱(chēng),,“這是核苷序列數(shù)據(jù)庫(kù)歷史上的一個(gè)里程碑,。從1982年EMBL數(shù)據(jù)庫(kù)開(kāi)始錄入,到今天的能提供至少200,,000種不同生物的五千五百萬(wàn)個(gè)基因序列,,這些數(shù)據(jù)資源瞄準(zhǔn)了分子生物學(xué)的需要并滿(mǎn)足了它們——特別是在嚴(yán)重缺乏數(shù)據(jù)資源的時(shí)候。”
美國(guó)國(guó)家生物技術(shù)信息中心主任David Lipman補(bǔ)充說(shuō):“今天的核苷序列數(shù)據(jù)庫(kù)允許研究人員共享完整的基因組,、足以組成整個(gè)生態(tài)系統(tǒng)的基因組,、以及與病人相關(guān)的基因組。INSDC已經(jīng)認(rèn)識(shí)到基因序列數(shù)據(jù)庫(kù)工程初創(chuàng)者的遠(yuǎn)見(jiàn)卓識(shí),,通過(guò)全球共享基因組數(shù)據(jù),,大家都可以獲得所需的信息。”
信息生物和日本DNA數(shù)據(jù)銀行主任Takashi Gojobori說(shuō):“INSDC已經(jīng)建立了交流多種生物信息的基礎(chǔ),。當(dāng)我們進(jìn)入系統(tǒng)生物學(xué)時(shí)代,,研究人員開(kāi)始交流各種綜合信息,比如數(shù)以千計(jì)的基因活性測(cè)量結(jié)果,,或是整個(gè)進(jìn)程的計(jì)算機(jī)模型,。三大數(shù)據(jù)庫(kù)開(kāi)創(chuàng)了生物信息交流的平臺(tái),這一成就值得我們慶賀,。”
20世紀(jì)70年代末,,當(dāng)研究人員開(kāi)始在基因編碼的層次上研究各種生物體時(shí)。幾個(gè)小組開(kāi)始探索開(kāi)發(fā)公共基因序列儲(chǔ)存庫(kù)的可能性,。20世紀(jì)80年代初,,這一研究開(kāi)發(fā)出兩個(gè)數(shù)據(jù)庫(kù):第一個(gè)是EMBL數(shù)據(jù)庫(kù),設(shè)在位于德國(guó)海德堡的歐洲分子生物實(shí)驗(yàn)室(這一數(shù)據(jù)庫(kù)現(xiàn)名為EMBL銀行,,設(shè)在位于英國(guó)Hinxton的EMBL歐洲生物信息研究所),;緊跟其后的是GenBank,最初設(shè)在美國(guó)洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室(LANL),現(xiàn)位于美國(guó)馬里蘭州Bethesda的國(guó)家生物技術(shù)信息研究中心,。這兩個(gè)數(shù)據(jù)庫(kù)的初始數(shù)據(jù)均來(lái)自有遠(yuǎn)見(jiàn)者的個(gè)人收藏,。EMBL銀行是基于德國(guó)科隆大學(xué)Kurt Stuber的收藏,而 GenBank來(lái)自于洛斯阿拉莫斯國(guó)家實(shí)驗(yàn)室Walter Goad的搜集,。
這兩個(gè)初始數(shù)據(jù)庫(kù)很早便開(kāi)始了合作,,由EMBL數(shù)據(jù)庫(kù)的首位雇員Greg Hamm發(fā)起了交流互動(dòng)工作。兩個(gè)數(shù)據(jù)庫(kù)的雇員們自那時(shí)起便開(kāi)始從發(fā)表了的期刊論文上搜尋基因序列,,并把他們重新輸入到數(shù)據(jù)庫(kù)中,,同時(shí)把期刊分類(lèi)以避免重復(fù)勞動(dòng)。這些雇員也從此開(kāi)始了描繪從一個(gè)數(shù)據(jù)庫(kù)到另一個(gè)數(shù)據(jù)庫(kù)的路線(xiàn)圖的枯燥工作,,通過(guò)這項(xiàng)工作,,他們便可以交換信息。到了1987年2月,,國(guó)際核苷基因序列協(xié)會(huì)開(kāi)始正式組建,。第三個(gè)合作方,,日本DNA數(shù)據(jù)銀行,,在Mishima的國(guó)家基因研究所成立,而與歐洲和美國(guó)同伴的合作也隨即開(kāi)始,。
從論文中或從軟盤(pán)中摘錄基因序列,,再人工輸入,,并用9軌的磁盤(pán)分發(fā)給使用者的日子過(guò)去了,從那以來(lái)發(fā)生了很多的變化,。但數(shù)據(jù)庫(kù)的宗旨——公共領(lǐng)域的所有核苷序列信息能在科學(xué)界得以快速地共享——仍是一如既往,。
英文原文鏈接見(jiàn):http://www.physorg.com/news5942.html