關(guān)鍵詞: 生物信息
生物信息學(xué)(Bioinformatics)是當(dāng)今生命科學(xué)和自然科學(xué)的重大前沿領(lǐng)域之一,,同時(shí)也將是21世紀(jì)自然科學(xué)的核心領(lǐng)域之一。世界各國對生物信息研究領(lǐng)域均高度重視,,每年都會(huì)有大量資金投入,。這不僅僅是因?yàn)樯镄畔⒛軌驇砭薮蟮睦麧櫍医柚谒軌蚴贡緡谑澜绺偁幹刑幱谟欣恢?。我國雖然在生物信息研究方面取得了重要成績,,但在某些方面還是感受到了外界強(qiáng)大的壓力和挑戰(zhàn)。鑒于此,,曙光公司與華大基因日前聯(lián)合推出國內(nèi)首例生物信息專用計(jì)算機(jī),,期望以此來帶動(dòng)我國在生物信息研究進(jìn)入一個(gè)快速健康的發(fā)展軌道。
喜憂參半,,我國生物信息研究進(jìn)入分水嶺
生物信息學(xué)是一門新興的交叉學(xué)科,,是伴隨基因組研究而產(chǎn)生的,,它的研究內(nèi)容是緊隨基因組研究的逐步深入而發(fā)展的。廣義地講,,生物信息學(xué)是以計(jì)算機(jī)為工具從事對基因組研究相關(guān)生物信息的獲取,、加工、儲(chǔ)存,、分配,、分析和解釋。它包括了兩層含義,,一是對海量數(shù)據(jù)的收集,、整理與服務(wù),也就是管好這些數(shù)據(jù),;另一個(gè)是從中發(fā)現(xiàn)新的規(guī)律,,也就是用好這些數(shù)據(jù)。目前,,伴隨著基因組研究日新月異的快速發(fā)展,,相關(guān)信息出現(xiàn)了爆炸性增長,迫切需要對海量生物信息進(jìn)行處理,。以Genbank中的DNA堿基數(shù)為例,,其增長速度呈指數(shù)性增長,大約每14個(gè)月就會(huì)增長一倍,,這一增長速度只有計(jì)算機(jī)運(yùn)算能力的增長可以與之比擬,。所以在當(dāng)前基因組信息爆炸的時(shí)代,建立超大規(guī)模計(jì)算系統(tǒng),,發(fā)展全新的生物信息學(xué)的理論,、方法來分析這些數(shù)據(jù),從中獲得有用的信息是基因組研究取得成果的決定性步驟,。其次,,基因組研究最終是要把生物學(xué)問題轉(zhuǎn)化成對數(shù)字符號(hào)的處理問題。要解決這樣的問題就必須發(fā)展新的分析理論,、方法,、技術(shù)、工具,,就必須依賴計(jì)算機(jī)的信息處理,。
由于生物信息學(xué)科的特殊性加上整體發(fā)展時(shí)間較短,并且相比其他科研領(lǐng)域來說目前國內(nèi)在該方面的相關(guān)研究與國際上的水平差距比較小,,因此從政府的宏觀調(diào)控到各級(jí)科研院所以及大學(xué)院校等科研單位都對生物信息學(xué)的研究給予了足夠的重視,,力爭把握好這個(gè)在未來能夠趕超世界領(lǐng)先水平的有利時(shí)機(jī)。雖然我國在生物信息學(xué)方面研究,、DNA測序能力方面已處于世界前列,但與國際上相比,對基因組數(shù)據(jù)的分析處理和利用能力,,包括計(jì)算能力則存在較大差距,。國外分析這樣的海量數(shù)據(jù)都使用超級(jí)計(jì)算機(jī),而我們的許多研究工作還依賴于使用能力弱得多的工作站甚至個(gè)人電腦,。與國外相比,,國內(nèi)生物信息研究在使用高性能計(jì)算方面還比較薄弱,這必將嚴(yán)重影響我國生物信息學(xué)未來的發(fā)展水平,。與計(jì)算技術(shù)結(jié)合的瓶頸使我國的生物信息研究目前處于分水嶺:不是超過別人,,繼續(xù)做領(lǐng)跑者;就是被別人趕超,,從此一蹶不振,。因此,開發(fā)集硬件,、算法,、軟件和數(shù)據(jù)庫眾多功能于一身的生物信息專用機(jī)是我國生物信息服務(wù)領(lǐng)域迫切需要解決的問題。通過對生物信息專用機(jī)的開發(fā),,實(shí)現(xiàn)高性能計(jì)算和生物信息研究的結(jié)合,,實(shí)現(xiàn)基因序列分析軟件和基因組數(shù)據(jù)庫的結(jié)合,實(shí)現(xiàn)并行運(yùn)算算法的開發(fā),,實(shí)現(xiàn)生物信息研究系統(tǒng)平臺(tái)的搭建,。
柳暗花明,國內(nèi)首款生物信息專用機(jī)橫空出世
2003年8月18日,,“作為國內(nèi)服務(wù)器品牌三甲之一”的曙光信息產(chǎn)業(yè)(北京)有限公司(以下簡稱曙光公司)與國內(nèi)著名的基因組,、生物信息研究中心華大基因聯(lián)合推出國內(nèi)第一款完全擁有自主知識(shí)產(chǎn)權(quán)的生物信息專用計(jì)算機(jī),采用先進(jìn)的基因數(shù)據(jù)庫架構(gòu)技術(shù),、數(shù)據(jù)定制可視化技術(shù),、數(shù)據(jù)密集技術(shù)、網(wǎng)格使能技術(shù),、在線擴(kuò)展技術(shù)及機(jī)群系統(tǒng)等技術(shù),,為國內(nèi)用戶搭建了一套與國際生物信息研究主流趨勢相接軌的系統(tǒng)平臺(tái)。
該系統(tǒng)是建立在華大基因和曙光公司在生物信息研究領(lǐng)域長期合作成果的基礎(chǔ)之上,,通過運(yùn)用曙光公司的高性能計(jì)算機(jī)硬件平臺(tái),,為國內(nèi)大量致力于基因組研究的科研工作者們提供方便、快捷的服務(wù),。它為生物信息學(xué)研究提供了一個(gè)基于硬件,、軟件和數(shù)據(jù)庫集成環(huán)境下的統(tǒng)一運(yùn)行平臺(tái),為各個(gè)分析軟件,、子數(shù)據(jù)庫模塊提供一致的運(yùn)行和管理環(huán)境,。同時(shí)用戶可以根據(jù)需要選擇軟件和數(shù)據(jù)庫模塊,,無縫集成到平臺(tái)上。平臺(tái)提供ORACLE數(shù)據(jù)庫和軟件的集成接口和管理工具,。生物信息專用計(jì)算機(jī)以模塊化的方式提供大量基因組學(xué),、生物信息學(xué)研究的常用分析工具,并能實(shí)現(xiàn)分布式高性能計(jì)算,。用戶也可以根據(jù)需要定制分析軟件,,添加到該專用計(jì)算機(jī)應(yīng)用平臺(tái)中。生物信息專用計(jì)算機(jī)裝有一整套生物信息學(xué)解決方案,,裝有生物信息系統(tǒng)平臺(tái),、基因組數(shù)據(jù)庫、分析軟件以及管理軟件,。其中,,基因組數(shù)據(jù)庫中有人類基因組、疾病相關(guān)性基因,、中藥化合物,、病原微生物基因組、醫(yī)學(xué)模式基因組等門類數(shù)據(jù),,為醫(yī)藥開發(fā)提供了重要工具,。除人類基因組數(shù)據(jù)庫之外,該專用計(jì)算機(jī)還裝有農(nóng)業(yè)基因數(shù)據(jù)庫和微生物基因組數(shù)據(jù)庫,。
此款生物信息專用計(jì)算機(jī)具備以下優(yōu)勢:
軟硬件一體的解決方案,,方便使用:以往從事生物研究的科技工作者需要分別采購硬件和軟件組成研究平臺(tái)之后再開始科研工作。這些采購自不同廠家的硬件和軟件帶來的問題是:軟硬件存在一定的不兼容性,,需要對軟件進(jìn)行繁雜的移植工作以適應(yīng)硬件環(huán)境的運(yùn)行要求,,而這些計(jì)算平臺(tái)進(jìn)入穩(wěn)定期限一般需要1-2年的時(shí)間。而1-2年的調(diào)試時(shí)間將極有可能耽誤相關(guān)科研進(jìn)程,,以至許多優(yōu)秀的科研成果可能被國外同行捷足先登,。生物信息專用計(jì)算機(jī)是集軟硬件一體化的解決方案,用戶不需擔(dān)心軟硬件的相互兼容性,,也不需要分頭和多個(gè)供應(yīng)商聯(lián)系維護(hù),、培訓(xùn)等業(yè)務(wù)。
科研速度加快,,出成果快:鑒于該系統(tǒng)運(yùn)用的是一個(gè)成熟的軟硬件一體化的研究平臺(tái),,能夠大大加快科研的進(jìn)度,從而提高科研的效率,,縮短了出成果的時(shí)間周期,。
海量數(shù)據(jù),豐富龐大的數(shù)據(jù)庫:該系統(tǒng)在后臺(tái)無縫連接了豐富大量的數(shù)據(jù)庫資源,,能夠使用戶很方便對龐大的數(shù)據(jù)庫進(jìn)行管理和存儲(chǔ),。目前,華大基因研究中心在人類基因組,、水稻基因組、SARS病毒基因研究中積累的數(shù)據(jù)已經(jīng)固化在了數(shù)據(jù)庫中,,用戶可以直接使用,。這些數(shù)據(jù)對于進(jìn)行相關(guān)研究的科技人員來說將會(huì)是一筆寶貴的財(cái)富。
數(shù)據(jù)庫良好的擴(kuò)展性能:針對生物研究生成的數(shù)據(jù)庫結(jié)構(gòu)是華大基因研究中心多次優(yōu)化之后定型的,,對于用戶可能增加的數(shù)據(jù)庫提供了擴(kuò)展接口,保證了數(shù)據(jù)庫良好的擴(kuò)展性,。
無可比擬的高性價(jià)比:專用機(jī)性能價(jià)格比比較高,,能夠?yàn)橛脩艄?jié)約大量的科研成本費(fèi)用。
小試牛刀,,生物信息專用機(jī)不負(fù)眾望
此款生物信息專用計(jì)算機(jī)目前已在1%人類基因組計(jì)劃,、水稻基因組草圖和完整圖繪制、SARS病毒基因組研究中都承擔(dān)了大量關(guān)鍵的科研任務(wù),,且效果顯著,。其中包含的生物信息研究平臺(tái)系統(tǒng)在中國農(nóng)科院基因資源與基因改良科學(xué)工程項(xiàng)目中被采用,用來開展水稻,、小麥和棉花等重要農(nóng)作物數(shù)量遺傳性狀QTL功能基因方面的研究,,在DNA、RNA和EST序列的分析以及基因序列比對,、篩選新功能基因等實(shí)際研究中發(fā)揮重要的作用,。除此之外,本地化安裝的水稻與小麥基因組數(shù)據(jù)庫和功能強(qiáng)大的序列及數(shù)據(jù)庫管理軟件,,為用戶節(jié)約了大量的時(shí)間和精力,,使得科研效率大大提高,整體科研成本降低,。另外,,南京醫(yī)藥集團(tuán)采用本系統(tǒng)對癌癥調(diào)控轉(zhuǎn)錄因子功能基因進(jìn)行分析,并對疾病基因進(jìn)行功能注釋,,進(jìn)一步完成靶基因和藥物的篩選,,全部數(shù)據(jù)都源自后臺(tái)安裝有本地化的人類疾病相關(guān)調(diào)控因子數(shù)據(jù)庫,分析后得到的結(jié)果數(shù)據(jù)也被保存到該數(shù)據(jù)庫中,。
四年的實(shí)踐,,人類、水稻,、SARS基因的成功測序證明,,生物信息專用計(jì)算機(jī)是華大多年生物信息研究實(shí)踐與曙光的高性能計(jì)算能力的完美結(jié)晶。生物信息學(xué)承擔(dān)著生命科學(xué)研究的基礎(chǔ)重任,,不僅為醫(yī)學(xué)界里醫(yī)藥的開發(fā),、醫(yī)療保健設(shè)計(jì)提供精準(zhǔn)快速的數(shù)據(jù)依據(jù),,而且也將是國力的又一體現(xiàn),生物信息專用計(jì)算機(jī)加速了生物工程研究,,為我國的生命科學(xué)研究更快地趕超世界前列水平提供了有利的武器?。ㄊ锕庑畔⒓夹g(shù)(北京)有限公司高性能事業(yè)部總經(jīng)理趙青.華大基因研究中心信息服務(wù)部總經(jīng)理黃小兵)