絕大多數(shù)經(jīng)過實驗證實的生物大分子相互作用和生物代謝路徑的數(shù)據(jù)都以一種非結(jié)構(gòu)化的方式在生物文獻(xiàn)中存儲著,這種存儲方式是零散的,,計算機(jī)不可直接處理的,。生物大分子相互作用網(wǎng)絡(luò)數(shù)據(jù)庫(BIND)的目標(biāo)是以一種機(jī)器可讀的方式將這些數(shù)據(jù)整理起來,。作者認(rèn)為大工作量的數(shù)據(jù)庫裝填工作可以借助支持矢量機(jī)技術(shù)(SVM)來完成,。SVM將別用來首先在文獻(xiàn)中定位那些大分子相互作用的數(shù)據(jù)信息,。作者發(fā)展了從定位數(shù)據(jù)到將數(shù)據(jù)提交給管理員或公眾評價然后入庫的一套信息提取系統(tǒng)
研究發(fā)現(xiàn)支持矢量機(jī)技術(shù)的精度和準(zhǔn)確率都達(dá)到90%以上,。當(dāng)作者把該系統(tǒng)應(yīng)用到實際工作中去時,,證實它減少了大約70%的工作量,,節(jié)省了176天的時間,。應(yīng)該向大家解釋的是SVM是一種機(jī)器學(xué)習(xí)方法,,在這一應(yīng)用中,,該方法被證明是有效的。同時應(yīng)該注意到,,SVM只能定位和提交數(shù)據(jù),,而數(shù)據(jù)評價工作還需要人工評價之后才能進(jìn)入BIND,。在這只前SVM所形成的數(shù)據(jù)庫被命名為PreBind,,該數(shù)據(jù)庫同樣向公眾開放,,使得大家都可以參與到評價工作中去,。