Physorg網(wǎng)8月22日報(bào)道,,世界三大公共DNA及RNA序列儲存庫的基因序列信息已經(jīng)達(dá)到了100吉對堿基(100,,000,,000,000對堿基——基因編碼的“字符”,。“吉”是量詞,,是“兆”的1000倍。)
聯(lián)合數(shù)據(jù)庫的數(shù)據(jù)交換策略為多種生物信息的全球交流鋪平了道路,。正是依靠這樣的策略,,國際核苷序列聯(lián)合數(shù)據(jù)庫(INSDC http://www.insdc.org,)的三大成員——EMBL銀行(核酸序列數(shù)據(jù)庫)(位于英國的Hinxton)、GenBank(位于美國的Bethesda),、以及日本DNA數(shù)據(jù)銀行(位于日本的Mishima)全都達(dá)到了上述這一里程碑式的目標(biāo),。
EMBL的歐洲生物信息研究所副主任Graham Cameron稱,“這是核苷序列數(shù)據(jù)庫歷史上的一個里程碑,。從1982年EMBL數(shù)據(jù)庫開始錄入,,到今天的能提供至少200,000種不同生物的五千五百萬個基因序列,,這些數(shù)據(jù)資源瞄準(zhǔn)了分子生物學(xué)的需要并滿足了它們——特別是在嚴(yán)重缺乏數(shù)據(jù)資源的時候,。”
美國國家生物技術(shù)信息中心主任David Lipman補(bǔ)充說:“今天的核苷序列數(shù)據(jù)庫允許研究人員共享完整的基因組、足以組成整個生態(tài)系統(tǒng)的基因組,、以及與病人相關(guān)的基因組,。INSDC已經(jīng)認(rèn)識到基因序列數(shù)據(jù)庫工程初創(chuàng)者的遠(yuǎn)見卓識,通過全球共享基因組數(shù)據(jù),,大家都可以獲得所需的信息,。”
信息生物和日本DNA數(shù)據(jù)銀行主任Takashi Gojobori說:“INSDC已經(jīng)建立了交流多種生物信息的基礎(chǔ)。當(dāng)我們進(jìn)入系統(tǒng)生物學(xué)時代,,研究人員開始交流各種綜合信息,,比如數(shù)以千計(jì)的基因活性測量結(jié)果,或是整個進(jìn)程的計(jì)算機(jī)模型,。三大數(shù)據(jù)庫開創(chuàng)了生物信息交流的平臺,,這一成就值得我們慶賀。”
20世紀(jì)70年代末,,當(dāng)研究人員開始在基因編碼的層次上研究各種生物體時,。幾個小組開始探索開發(fā)公共基因序列儲存庫的可能性。20世紀(jì)80年代初,,這一研究開發(fā)出兩個數(shù)據(jù)庫:第一個是EMBL數(shù)據(jù)庫,,設(shè)在位于德國海德堡的歐洲分子生物實(shí)驗(yàn)室(這一數(shù)據(jù)庫現(xiàn)名為EMBL銀行,設(shè)在位于英國Hinxton的EMBL歐洲生物信息研究所),;緊跟其后的是GenBank,,最初設(shè)在美國洛斯阿拉莫斯國家實(shí)驗(yàn)室(LANL),現(xiàn)位于美國馬里蘭州Bethesda的國家生物技術(shù)信息研究中心。這兩個數(shù)據(jù)庫的初始數(shù)據(jù)均來自有遠(yuǎn)見者的個人收藏,。EMBL銀行是基于德國科隆大學(xué)Kurt Stuber的收藏,,而 GenBank來自于洛斯阿拉莫斯國家實(shí)驗(yàn)室Walter Goad的搜集。
這兩個初始數(shù)據(jù)庫很早便開始了合作,,由EMBL數(shù)據(jù)庫的首位雇員Greg Hamm發(fā)起了交流互動工作,。兩個數(shù)據(jù)庫的雇員們自那時起便開始從發(fā)表了的期刊論文上搜尋基因序列,并把他們重新輸入到數(shù)據(jù)庫中,,同時把期刊分類以避免重復(fù)勞動,。這些雇員也從此開始了描繪從一個數(shù)據(jù)庫到另一個數(shù)據(jù)庫的路線圖的枯燥工作,通過這項(xiàng)工作,,他們便可以交換信息,。到了1987年2月,國際核苷基因序列協(xié)會開始正式組建,。第三個合作方,日本DNA數(shù)據(jù)銀行,,在Mishima的國家基因研究所成立,,而與歐洲和美國同伴的合作也隨即開始。
從論文中或從軟盤中摘錄基因序列,,再人工輸入,,并用9軌的磁盤分發(fā)給使用者的日子過去了,從那以來發(fā)生了很多的變化,。但數(shù)據(jù)庫的宗旨——公共領(lǐng)域的所有核苷序列信息能在科學(xué)界得以快速地共享——仍是一如既往,。