生命及其所處的環(huán)境構(gòu)成的系統(tǒng)是宇宙中最為復(fù)雜的系統(tǒng),,從微觀的DNA和蛋白質(zhì)分子系統(tǒng)到宏觀的大尺度生態(tài)系統(tǒng),其結(jié)構(gòu)變化和功能過程的實(shí)現(xiàn),,都蘊(yùn)含有大量的信息結(jié)構(gòu)和信息傳遞過程。解譯這些信息結(jié)構(gòu)和信息傳遞過程,,用以服務(wù)生命科學(xué)的研究,,是生命科學(xué)中的信息科學(xué)的重大課題。
如果說生物信息學(xué)是解釋人 類自身結(jié)構(gòu)信息的學(xué)科,,信息生態(tài)學(xué)則為人類生存環(huán)境問題指出了信息科學(xué)研究方向,。因此“生命科 學(xué)中的信息科學(xué)”就成為了國(guó)家自然科學(xué)基金委員會(huì)“21核心科學(xué) 問題論壇”的第一次會(huì)議的主題。 會(huì)議通過研究認(rèn)為90年代初期生物信息學(xué),、信息生態(tài)學(xué)等的提出為解決象基因組,、生態(tài)學(xué)研究中的重大問題提供了有效途徑。會(huì)議研討了以下關(guān)鍵問題,。
生物信息學(xué)
專家們一致認(rèn)為生物信息學(xué)的含義與內(nèi)容是明確,。具體的。它是80年代末隨著人類基因組計(jì)劃的啟動(dòng)而興起的一門新的交叉學(xué)科,。它是使用數(shù)學(xué),、物理學(xué)和信息科學(xué)的觀點(diǎn),、理論與方法從研究遺傳物質(zhì)的載體DNA出發(fā),分析其編碼的蛋白質(zhì)等的序列和空間結(jié)構(gòu),,以及它們的動(dòng)態(tài)變化和相互作用,,目的是認(rèn)識(shí)生命的起源、進(jìn)化,。 遺傳和發(fā)育的本質(zhì),,破譯隱藏在DNA序列中的遺傳語(yǔ)言。專家們指出當(dāng)前基因組相關(guān)信息的增長(zhǎng)速度只有計(jì)算機(jī)的增長(zhǎng)速度可以與之比擬,,因此要破譯生物遺傳密碼必須以計(jì)算機(jī)為工具,,發(fā)展信息學(xué)的理論、方法,。當(dāng)前生息學(xué)的主要研究領(lǐng)域應(yīng)集中下幾個(gè)方面:
1.建立國(guó)家生物醫(yī)學(xué)數(shù)與服務(wù)系統(tǒng)
國(guó)家生物醫(yī)學(xué)數(shù)據(jù)庫(kù)與系統(tǒng)應(yīng)具備如下職能:為全國(guó)教育,、科研人員免費(fèi)提供數(shù)據(jù)、整理我國(guó)科學(xué)家測(cè)定的相 據(jù)和資料,,構(gòu)建我國(guó)自己的數(shù)據(jù)庫(kù),。同時(shí)發(fā)展專門的二級(jí)數(shù)據(jù)庫(kù);發(fā)展若干算法及軟件,,包括數(shù)據(jù)庫(kù)存 質(zhì)量評(píng)估軟件,,可視化軟件等。建立若干重要服務(wù)器,;進(jìn)行相關(guān)的培訓(xùn),;實(shí)現(xiàn)重要文獻(xiàn)的檢索;過多成適量的基礎(chǔ)研究工作,。
2.人類基因組的信息結(jié)構(gòu)分析
A,、發(fā)現(xiàn)新基因。利用國(guó)際 數(shù)據(jù)庫(kù)和我國(guó)科學(xué)家測(cè)定的數(shù)據(jù),,經(jīng)過大規(guī)模并行計(jì)算發(fā)基因和新SNPs以及各種功能 是各國(guó)科學(xué)家當(dāng)前爭(zhēng)奪的熱點(diǎn)
B,、研究占人類基因組95非編碼區(qū)的信息結(jié)構(gòu),闡明該區(qū)的重要生物學(xué)功能,。普遍認(rèn)為,,非編碼區(qū)與基因在四維時(shí)空的調(diào)控有關(guān)。因此尋找這些區(qū)域碼特征,,信息調(diào)節(jié)與表達(dá)規(guī)律來(lái)相當(dāng)長(zhǎng)時(shí)間內(nèi)的熱點(diǎn)課題,,得重要成果的源泉。
C,、進(jìn)行模式生物完整基因的信息結(jié)構(gòu)分析和比較研究,。對(duì)伴隨人類基因組而完成的大量微生物完整基因的信息分析,不僅將直接幫助破譯人類遺傳密碼,,其導(dǎo)致的比較基因組學(xué)也必將為后基因組研究開辟新的領(lǐng)域,。
3.功能基因組相關(guān)信息分析
A,、獲得基因的功能表達(dá)譜,將存在于人類基因組上的靜的基因圖譜,,向時(shí)間,、空間維上展開是新一階段基因組研究的核心。為了得到基因表達(dá)的功能譜,,國(guó)際上在核酸和蛋白質(zhì)兩個(gè)層次上都發(fā)展了新技術(shù)。在核酸層次上主要是DNA芯片,,在蛋白質(zhì)層次上則是二維凝膠電泳和測(cè)序質(zhì)譜組成的蛋白質(zhì)組學(xué)技術(shù),。這些新技術(shù)的出現(xiàn)導(dǎo)致了大規(guī)模基因功能表達(dá)譜的分析問題,。因此需要發(fā)展新的信息分析方法,、工具與數(shù)據(jù)庫(kù)。
B,、與基因組信息相關(guān)的核酸,、蛋白質(zhì)空間結(jié)構(gòu)的預(yù)測(cè)以及蛋白質(zhì)功能預(yù)測(cè)。要了解蛋白質(zhì)的功能,、要找到某些蛋白質(zhì)致病的分子基礎(chǔ),,只有氨基酸順序的知識(shí)是不夠的,必須知道它們的三維結(jié)構(gòu),。與此同時(shí),,要設(shè)計(jì)藥物治療這些疾患也需要了解蛋白質(zhì)的三維結(jié)構(gòu)。這是擺在科學(xué)家面前的緊迫任務(wù),。
4.從生物信息數(shù)據(jù)出發(fā)開展遺傳密碼起源和生物進(jìn)化的研究
自 1859年Darwin的物種起源發(fā)表以來(lái),,生物進(jìn)化是對(duì)人類自然科學(xué)和自然哲學(xué)發(fā)展的最重大貢獻(xiàn)之一。現(xiàn)在隨著大量完整基因組的測(cè)序完成為開展分子研究和探索遺傳密碼的起源創(chuàng)造了極好時(shí)機(jī),。利用這些數(shù)據(jù)也有利于開展從數(shù)量遺傳學(xué),、群體遺傳學(xué)和分子生態(tài)學(xué)出發(fā)的信息研究。
信息生態(tài)學(xué)
信息生態(tài)學(xué)是以現(xiàn)代系統(tǒng)理論,、方法和現(xiàn)代計(jì)算機(jī)技術(shù)來(lái)分析,、處理整日趨膨脹的試驗(yàn)和觀測(cè)的生態(tài)學(xué)信息,尋求生態(tài)學(xué)系統(tǒng)整體水平的規(guī)律,。專家們認(rèn)為,,現(xiàn)今世界科學(xué)研究的發(fā)展趨勢(shì)的應(yīng)該是強(qiáng)調(diào)整合和系統(tǒng)的整體論,而強(qiáng)調(diào)解析的還原論的結(jié)果通常是導(dǎo)致科學(xué)家對(duì)越來(lái)越小局部和的片斷的越來(lái)越深的了解,。對(duì)于象生態(tài)系統(tǒng)這樣的復(fù)雜系統(tǒng)而言,,僅僅了解系統(tǒng)的內(nèi)部的局部環(huán)節(jié)遠(yuǎn)遠(yuǎn)不足以解釋系統(tǒng)的行為,因?yàn)橄到y(tǒng)各部分(子系統(tǒng))之間的相互作用在解釋系統(tǒng)行為方面同等重要,。專家們提出如下信息生態(tài)學(xué)優(yōu)先研究領(lǐng)域,。
1.生態(tài)學(xué)數(shù)據(jù)采集技術(shù)的規(guī)范化及數(shù)據(jù)庫(kù)的系統(tǒng)化
在生態(tài)學(xué)數(shù)據(jù)的采集方法,、技術(shù)、手段,、及數(shù)據(jù)精度等方面,,應(yīng)盡量實(shí)現(xiàn)規(guī)范化和標(biāo)準(zhǔn)化,盡可能利 用新的數(shù)據(jù)傳感技術(shù)(如近紅外技 術(shù)),,使之盡可能符合國(guó)際,、國(guó)家?;蛘咝袠I(yè)的標(biāo)準(zhǔn),,為后續(xù)的信息分析和處理打下良好的基礎(chǔ),為信息的交流傳播和共享創(chuàng)造條件,。鑒于數(shù)據(jù)生態(tài)學(xué)數(shù)據(jù)的形式,、時(shí)空范圍、獲取背景等諸多方面的多樣化,,有必要對(duì)現(xiàn)有的生態(tài)學(xué)數(shù)據(jù)進(jìn) 行系統(tǒng)化的整編,、改造,使之能夠 互相補(bǔ)充,,互相印證,。同時(shí),有必要就上述問題展開方法和技術(shù)方面的研究,。
2.生態(tài)系統(tǒng)信息分析與模型化以不同方法手段對(duì)生態(tài)學(xué)數(shù)據(jù)進(jìn)行分析和處理,,從中導(dǎo)出有關(guān)生態(tài)學(xué)規(guī)律
發(fā)展各種不同類型、不同尺度,、不同層次的生態(tài)系統(tǒng)模型,,通過對(duì)系統(tǒng)的模擬分析,從生態(tài)學(xué)數(shù)據(jù)中提取有關(guān)生態(tài)系統(tǒng)的行為和規(guī)律方面的信息,。主要包括如下方面:①.生物群落的綜合信息分析理論,。發(fā)展包括環(huán)境、空間因素,、生物要素在內(nèi)的群落學(xué)多元統(tǒng)計(jì)分析方法將是信息生態(tài)學(xué)在群落分析方面的重要的潛在突破曰,。②.基于過程的植物個(gè)體(包括農(nóng)作物、森林樹木)生長(zhǎng)發(fā)育動(dòng)態(tài)模擬模型,。模擬不同氣候,、土壤條件下,植物個(gè)體各部分的生長(zhǎng),。發(fā)育以及凈第一性生產(chǎn)力,、產(chǎn)量。材積形成的過程。③.森林群落結(jié)構(gòu)動(dòng)態(tài)模型,。建立適合于我國(guó)特殊情況的(災(zāi)害頻繁,、人為活動(dòng)干擾強(qiáng)度大等)森林群落物種演替動(dòng)態(tài)模擬模型。④.空間耦合動(dòng)態(tài)模擬模型理論,、空間模擬軟件系統(tǒng),。很有必要建立一個(gè)空間異質(zhì)生態(tài)系統(tǒng)模擬的計(jì)算機(jī)環(huán)境,專門用于各種不同的空間異質(zhì)生態(tài)系統(tǒng)的模擬模 型的建立,。⑤.空間異質(zhì)生態(tài)系統(tǒng)模擬模型,。針對(duì)景觀尺度和區(qū)域尺度的生態(tài)學(xué)問題,建立生態(tài)系統(tǒng)結(jié)構(gòu)和功能耦合,、空間格點(diǎn)耦合的雙重耦合生態(tài)系統(tǒng)模擬模型,。⑹.不同尺度生態(tài)系統(tǒng)模擬模型的尺度轉(zhuǎn)換。
3.生態(tài)系統(tǒng)管理的信息化咨詢與決策
結(jié)合理論模型和生態(tài)系統(tǒng)管理方面的定性的和定量的專家經(jīng)驗(yàn)性知識(shí),,建立生態(tài)系統(tǒng)管理咨詢與決策系統(tǒng)。關(guān)鍵問題包括:專家經(jīng)驗(yàn)和知識(shí)的規(guī)范化和知識(shí)庫(kù)建立,。理論模型與專家經(jīng)驗(yàn)的結(jié)合,。研究有關(guān)的方法和技術(shù),正確客觀地處理理論模型結(jié)果和專家經(jīng)驗(yàn)知識(shí)之間的矛盾,。
生命科學(xué)中的信息科學(xué)的新理論,、新方法、新技術(shù),、新軟件
盡管處理的科學(xué)問題不同,、時(shí)空尺度不同,但生物信息學(xué)和信息生態(tài)學(xué)所用的信息分析工具卻有許多是相同的或相近的,。研究和發(fā) 展一些通用的信息工具是共同的需要,。
生物信息學(xué)和信息生態(tài)學(xué)的研究需要發(fā)展有效的能支持大尺度作圖與測(cè)序需要的軟件和數(shù)據(jù)庫(kù)以及若干數(shù)據(jù)庫(kù)工具,包括互聯(lián)網(wǎng)絡(luò)上的遠(yuǎn)程通訊工具,,使之能容易地處理日益增長(zhǎng)的物理圖,、遺傳圖和序列信息、地理信息,。改進(jìn)現(xiàn)有的理論分析方法,,如統(tǒng)計(jì)方法,隱含馬爾科夫過程方法,,非線性動(dòng)力系統(tǒng)方法,,特別是混濁和分維方法,神經(jīng)網(wǎng)絡(luò)方法,,復(fù)雜性分析方法,,密碼學(xué)方法,多序列比較方法等;要研究系統(tǒng)自組織問題,、熵或其它信息的測(cè)度問題,,創(chuàng)建一切適用于基因組信息和信息生態(tài)學(xué)分析的新方法、新技術(shù),,包括引人復(fù)雜系統(tǒng)分析技術(shù),、信息系統(tǒng)分析技術(shù)等,例如,,發(fā)展離散數(shù)學(xué)和組合數(shù)學(xué)相結(jié)合的方法,;發(fā)展統(tǒng)計(jì)語(yǔ)言學(xué)和代數(shù)語(yǔ)言學(xué)相結(jié)合的方法;發(fā)展研究基因組完整信息結(jié)構(gòu)和信 息網(wǎng)絡(luò)的研究方法等,。如近紅外光譜技術(shù),、計(jì)算計(jì)視覺技術(shù)、圖像和圖形的識(shí)別技術(shù)的研究,,也是非常重要的,。這一切是我國(guó)生物信息學(xué)和信息生態(tài)學(xué)研究取得突破的技術(shù)保障。