絕大多數(shù)經(jīng)過實(shí)驗(yàn)證實(shí)的生物大分子相互作用和生物代謝路徑的數(shù)據(jù)都以一種非結(jié)構(gòu)化的方式在生物文獻(xiàn)中存儲(chǔ)著,,這種存儲(chǔ)方式是零散的,,計(jì)算機(jī)不可直接處理的,。生物大分子相互作用網(wǎng)絡(luò)數(shù)據(jù)庫(BIND)的目標(biāo)是以一種機(jī)器可讀的方式將這些數(shù)據(jù)整理起來,。作者認(rèn)為大工作量的數(shù)據(jù)庫裝填工作可以借助支持矢量機(jī)技術(shù)(SVM)來完成,。SVM將別用來首先在文獻(xiàn)中定位那些大分子相互作用的數(shù)據(jù)信息,。作者發(fā)展了從定位數(shù)據(jù)到將數(shù)據(jù)提交給管理員或公眾評(píng)價(jià)然后入庫的一套信息提取系統(tǒng)
研究發(fā)現(xiàn)支持矢量機(jī)技術(shù)的精度和準(zhǔn)確率都達(dá)到90%以上,。當(dāng)作者把該系統(tǒng)應(yīng)用到實(shí)際工作中去時(shí),,證實(shí)它減少了大約70%的工作量,,節(jié)省了176天的時(shí)間。應(yīng)該向大家解釋的是SVM是一種機(jī)器學(xué)習(xí)方法,,在這一應(yīng)用中,,該方法被證明是有效的。同時(shí)應(yīng)該注意到,,SVM只能定位和提交數(shù)據(jù),,而數(shù)據(jù)評(píng)價(jià)工作還需要人工評(píng)價(jià)之后才能進(jìn)入BIND。在這只前SVM所形成的數(shù)據(jù)庫被命名為PreBind,,該數(shù)據(jù)庫同樣向公眾開放,,使得大家都可以參與到評(píng)價(jià)工作中去。