關(guān)于蛋白家族分類和功能預(yù)測是長期以來生物信息學研究的重點課題,,本期編者向大家介紹與之兩篇文章,,這是第一篇,。隨著基因組數(shù)據(jù)的加速積累,,越來越迫切的需要發(fā)展生物信息學的算法和工具來進行可靠的,、大規(guī)模的蛋白功能預(yù)測和生物學知識發(fā)掘,。本文作者發(fā)展了PIR系統(tǒng),。PIR(Protein Information Resource)提供了一個集成的公共的蛋白信息源來支持基因組和蛋白質(zhì)組的研究。PIR產(chǎn)生的蛋白質(zhì)數(shù)據(jù)庫中包含了經(jīng)過功能預(yù)測的蛋白信息,。關(guān)于功能預(yù)測問題,,本文作者采用了數(shù)據(jù)發(fā)掘技術(shù),發(fā)展了一種算法,,該算法有兩種特性:classification-driven和rule-based,。該方法可以進行敏感的識別,一致的,、信息量豐富的預(yù)測,,對預(yù)測錯誤的系統(tǒng)糾正,,以及區(qū)分試驗驗證和計算預(yù)測的不同特性。為了更好的說明問題,,作者在這篇文章中舉了很多有說服力的例子,,相信這是一篇很值得一讀的文章。