關(guān)于蛋白家族分類和功能預(yù)測是長期以來生物信息學(xué)研究的重點課題,,本期編者向大家介紹與之兩篇文章,,這是第一篇,。隨著基因組數(shù)據(jù)的加速積累,,越來越迫切的需要發(fā)展生物信息學(xué)的算法和工具來進行可靠的,、大規(guī)模的蛋白功能預(yù)測和生物學(xué)知識發(fā)掘,。本文作者發(fā)展了PIR系統(tǒng)。PIR(Protein Information Resource)提供了一個集成的公共的蛋白信息源來支持基因組和蛋白質(zhì)組的研究,。PIR產(chǎn)生的蛋白質(zhì)數(shù)據(jù)庫中包含了經(jīng)過功能預(yù)測的蛋白信息,。關(guān)于功能預(yù)測問題,本文作者采用了數(shù)據(jù)發(fā)掘技術(shù),,發(fā)展了一種算法,,該算法有兩種特性:classification-driven和rule-based。該方法可以進行敏感的識別,,一致的,、信息量豐富的預(yù)測,對預(yù)測錯誤的系統(tǒng)糾正,,以及區(qū)分試驗驗證和計算預(yù)測的不同特性,。為了更好的說明問題,作者在這篇文章中舉了很多有說服力的例子,,相信這是一篇很值得一讀的文章,。