絕大多數(shù)經(jīng)過實驗證實的生物大分子相互作用和生物代謝路徑的數(shù)據(jù)都以一種非結(jié)構(gòu)化的方式在生物文獻中存儲著,,這種存儲方式是零散的,計算機不可直接處理的,。生物大分子相互作用網(wǎng)絡(luò)數(shù)據(jù)庫(BIND)的目標是以一種機器可讀的方式將這些數(shù)據(jù)整理起來,。作者認為大工作量的數(shù)據(jù)庫裝填工作可以借助支持矢量機技術(shù)(SVM)來完成,。SVM將別用來首先在文獻中定位那些大分子相互作用的數(shù)據(jù)信息,。作者發(fā)展了從定位數(shù)據(jù)到將數(shù)據(jù)提交給管理員或公眾評價然后入庫的一套信息提取系統(tǒng)
研究發(fā)現(xiàn)支持矢量機技術(shù)的精度和準確率都達到90%以上,。當作者把該系統(tǒng)應(yīng)用到實際工作中去時,證實它減少了大約70%的工作量,,節(jié)省了176天的時間,。應(yīng)該向大家解釋的是SVM是一種機器學(xué)習方法,在這一應(yīng)用中,,該方法被證明是有效的,。同時應(yīng)該注意到,SVM只能定位和提交數(shù)據(jù),,而數(shù)據(jù)評價工作還需要人工評價之后才能進入BIND,。在這只前SVM所形成的數(shù)據(jù)庫被命名為PreBind,該數(shù)據(jù)庫同樣向公眾開放,,使得大家都可以參與到評價工作中去,。