關(guān)鍵詞: 生物信息
生物信息學(Bioinformatics)是當今生命科學和自然科學的重大前沿領(lǐng)域之一,,同時也將是21世紀自然科學的核心領(lǐng)域之一,。世界各國對生物信息研究領(lǐng)域均高度重視,,每年都會有大量資金投入。這不僅僅是因為生物信息能夠帶來巨大的利潤,,而且借助于它能夠使本國在世界競爭中處于有利位置,。我國雖然在生物信息研究方面取得了重要成績,,但在某些方面還是感受到了外界強大的壓力和挑戰(zhàn),。鑒于此,曙光公司與華大基因日前聯(lián)合推出國內(nèi)首例生物信息專用計算機,,期望以此來帶動我國在生物信息研究進入一個快速健康的發(fā)展軌道,。
喜憂參半,我國生物信息研究進入分水嶺
生物信息學是一門新興的交叉學科,,是伴隨基因組研究而產(chǎn)生的,,它的研究內(nèi)容是緊隨基因組研究的逐步深入而發(fā)展的。廣義地講,,生物信息學是以計算機為工具從事對基因組研究相關(guān)生物信息的獲取,、加工、儲存,、分配,、分析和解釋。它包括了兩層含義,,一是對海量數(shù)據(jù)的收集,、整理與服務(wù),也就是管好這些數(shù)據(jù),;另一個是從中發(fā)現(xiàn)新的規(guī)律,,也就是用好這些數(shù)據(jù)。目前,,伴隨著基因組研究日新月異的快速發(fā)展,,相關(guān)信息出現(xiàn)了爆炸性增長,迫切需要對海量生物信息進行處理,。以Genbank中的DNA堿基數(shù)為例,,其增長速度呈指數(shù)性增長,大約每14個月就會增長一倍,,這一增長速度只有計算機運算能力的增長可以與之比擬,。所以在當前基因組信息爆炸的時代,,建立超大規(guī)模計算系統(tǒng),發(fā)展全新的生物信息學的理論,、方法來分析這些數(shù)據(jù),,從中獲得有用的信息是基因組研究取得成果的決定性步驟。其次,,基因組研究最終是要把生物學問題轉(zhuǎn)化成對數(shù)字符號的處理問題,。要解決這樣的問題就必須發(fā)展新的分析理論、方法,、技術(shù),、工具,就必須依賴計算機的信息處理,。
由于生物信息學科的特殊性加上整體發(fā)展時間較短,,并且相比其他科研領(lǐng)域來說目前國內(nèi)在該方面的相關(guān)研究與國際上的水平差距比較小,因此從政府的宏觀調(diào)控到各級科研院所以及大學院校等科研單位都對生物信息學的研究給予了足夠的重視,,力爭把握好這個在未來能夠趕超世界領(lǐng)先水平的有利時機,。雖然我國在生物信息學方面研究、DNA測序能力方面已處于世界前列,,但與國際上相比,,對基因組數(shù)據(jù)的分析處理和利用能力,包括計算能力則存在較大差距,。國外分析這樣的海量數(shù)據(jù)都使用超級計算機,,而我們的許多研究工作還依賴于使用能力弱得多的工作站甚至個人電腦。與國外相比,,國內(nèi)生物信息研究在使用高性能計算方面還比較薄弱,,這必將嚴重影響我國生物信息學未來的發(fā)展水平。與計算技術(shù)結(jié)合的瓶頸使我國的生物信息研究目前處于分水嶺:不是超過別人,,繼續(xù)做領(lǐng)跑者,;就是被別人趕超,從此一蹶不振,。因此,,開發(fā)集硬件、算法,、軟件和數(shù)據(jù)庫眾多功能于一身的生物信息專用機是我國生物信息服務(wù)領(lǐng)域迫切需要解決的問題,。通過對生物信息專用機的開發(fā),實現(xiàn)高性能計算和生物信息研究的結(jié)合,,實現(xiàn)基因序列分析軟件和基因組數(shù)據(jù)庫的結(jié)合,,實現(xiàn)并行運算算法的開發(fā),實現(xiàn)生物信息研究系統(tǒng)平臺的搭建。
柳暗花明,,國內(nèi)首款生物信息專用機橫空出世
2003年8月18日,,“作為國內(nèi)服務(wù)器品牌三甲之一”的曙光信息產(chǎn)業(yè)(北京)有限公司(以下簡稱曙光公司)與國內(nèi)著名的基因組、生物信息研究中心華大基因聯(lián)合推出國內(nèi)第一款完全擁有自主知識產(chǎn)權(quán)的生物信息專用計算機,,采用先進的基因數(shù)據(jù)庫架構(gòu)技術(shù),、數(shù)據(jù)定制可視化技術(shù)、數(shù)據(jù)密集技術(shù),、網(wǎng)格使能技術(shù),、在線擴展技術(shù)及機群系統(tǒng)等技術(shù),為國內(nèi)用戶搭建了一套與國際生物信息研究主流趨勢相接軌的系統(tǒng)平臺,。
該系統(tǒng)是建立在華大基因和曙光公司在生物信息研究領(lǐng)域長期合作成果的基礎(chǔ)之上,,通過運用曙光公司的高性能計算機硬件平臺,為國內(nèi)大量致力于基因組研究的科研工作者們提供方便,、快捷的服務(wù),。它為生物信息學研究提供了一個基于硬件、軟件和數(shù)據(jù)庫集成環(huán)境下的統(tǒng)一運行平臺,,為各個分析軟件,、子數(shù)據(jù)庫模塊提供一致的運行和管理環(huán)境,。同時用戶可以根據(jù)需要選擇軟件和數(shù)據(jù)庫模塊,,無縫集成到平臺上。平臺提供ORACLE數(shù)據(jù)庫和軟件的集成接口和管理工具,。生物信息專用計算機以模塊化的方式提供大量基因組學,、生物信息學研究的常用分析工具,并能實現(xiàn)分布式高性能計算,。用戶也可以根據(jù)需要定制分析軟件,,添加到該專用計算機應(yīng)用平臺中。生物信息專用計算機裝有一整套生物信息學解決方案,,裝有生物信息系統(tǒng)平臺,、基因組數(shù)據(jù)庫、分析軟件以及管理軟件,。其中,,基因組數(shù)據(jù)庫中有人類基因組、疾病相關(guān)性基因,、中藥化合物,、病原微生物基因組、醫(yī)學模式基因組等門類數(shù)據(jù),,為醫(yī)藥開發(fā)提供了重要工具,。除人類基因組數(shù)據(jù)庫之外,該專用計算機還裝有農(nóng)業(yè)基因數(shù)據(jù)庫和微生物基因組數(shù)據(jù)庫,。
此款生物信息專用計算機具備以下優(yōu)勢:
軟硬件一體的解決方案,,方便使用:以往從事生物研究的科技工作者需要分別采購硬件和軟件組成研究平臺之后再開始科研工作,。這些采購自不同廠家的硬件和軟件帶來的問題是:軟硬件存在一定的不兼容性,需要對軟件進行繁雜的移植工作以適應(yīng)硬件環(huán)境的運行要求,,而這些計算平臺進入穩(wěn)定期限一般需要1-2年的時間,。而1-2年的調(diào)試時間將極有可能耽誤相關(guān)科研進程,以至許多優(yōu)秀的科研成果可能被國外同行捷足先登,。生物信息專用計算機是集軟硬件一體化的解決方案,,用戶不需擔心軟硬件的相互兼容性,也不需要分頭和多個供應(yīng)商聯(lián)系維護,、培訓(xùn)等業(yè)務(wù),。
科研速度加快,出成果快:鑒于該系統(tǒng)運用的是一個成熟的軟硬件一體化的研究平臺,,能夠大大加快科研的進度,,從而提高科研的效率,縮短了出成果的時間周期,。
海量數(shù)據(jù),,豐富龐大的數(shù)據(jù)庫:該系統(tǒng)在后臺無縫連接了豐富大量的數(shù)據(jù)庫資源,能夠使用戶很方便對龐大的數(shù)據(jù)庫進行管理和存儲,。目前,華大基因研究中心在人類基因組,、水稻基因組、SARS病毒基因研究中積累的數(shù)據(jù)已經(jīng)固化在了數(shù)據(jù)庫中,,用戶可以直接使用,。這些數(shù)據(jù)對于進行相關(guān)研究的科技人員來說將會是一筆寶貴的財富。
數(shù)據(jù)庫良好的擴展性能:針對生物研究生成的數(shù)據(jù)庫結(jié)構(gòu)是華大基因研究中心多次優(yōu)化之后定型的,,對于用戶可能增加的數(shù)據(jù)庫提供了擴展接口,,保證了數(shù)據(jù)庫良好的擴展性。
無可比擬的高性價比:專用機性能價格比比較高,,能夠為用戶節(jié)約大量的科研成本費用,。
小試牛刀,生物信息專用機不負眾望
此款生物信息專用計算機目前已在1%人類基因組計劃,、水稻基因組草圖和完整圖繪制,、SARS病毒基因組研究中都承擔了大量關(guān)鍵的科研任務(wù),且效果顯著,。其中包含的生物信息研究平臺系統(tǒng)在中國農(nóng)科院基因資源與基因改良科學工程項目中被采用,,用來開展水稻、小麥和棉花等重要農(nóng)作物數(shù)量遺傳性狀QTL功能基因方面的研究,,在DNA,、RNA和EST序列的分析以及基因序列比對、篩選新功能基因等實際研究中發(fā)揮重要的作用。除此之外,,本地化安裝的水稻與小麥基因組數(shù)據(jù)庫和功能強大的序列及數(shù)據(jù)庫管理軟件,,為用戶節(jié)約了大量的時間和精力,使得科研效率大大提高,,整體科研成本降低,。另外,南京醫(yī)藥集團采用本系統(tǒng)對癌癥調(diào)控轉(zhuǎn)錄因子功能基因進行分析,,并對疾病基因進行功能注釋,,進一步完成靶基因和藥物的篩選,全部數(shù)據(jù)都源自后臺安裝有本地化的人類疾病相關(guān)調(diào)控因子數(shù)據(jù)庫,,分析后得到的結(jié)果數(shù)據(jù)也被保存到該數(shù)據(jù)庫中,。
四年的實踐,人類,、水稻,、SARS基因的成功測序證明,生物信息專用計算機是華大多年生物信息研究實踐與曙光的高性能計算能力的完美結(jié)晶,。生物信息學承擔著生命科學研究的基礎(chǔ)重任,,不僅為醫(yī)學界里醫(yī)藥的開發(fā)、醫(yī)療保健設(shè)計提供精準快速的數(shù)據(jù)依據(jù),,而且也將是國力的又一體現(xiàn),,生物信息專用計算機加速了生物工程研究,為我國的生命科學研究更快地趕超世界前列水平提供了有利的武器?。ㄊ锕庑畔⒓夹g(shù)(北京)有限公司高性能事業(yè)部總經(jīng)理趙青.華大基因研究中心信息服務(wù)部總經(jīng)理黃小兵)