本文提出了一種新的識別原核生物轉(zhuǎn)錄起始位點(diǎn)的方法,。這種方法基于序列比對內(nèi)核函數(shù),,這種函數(shù)可以表示兩條序列進(jìn)行比對時(shí)的匹配程度。這種內(nèi)核函數(shù)還可用于雙支持變量機(jī)制(Dual SVM)來對起始位點(diǎn)進(jìn)行識別,。許多識別的方法僅僅使用正的數(shù)據(jù)包進(jìn)行訓(xùn)練和測試,,本文同時(shí)使用正的和負(fù)的數(shù)據(jù)包(包括編碼區(qū)和非編碼區(qū)的數(shù)據(jù))對該識別方法進(jìn)行訓(xùn)練和測試。結(jié)果顯示該方法十分有效,,在使用正的數(shù)據(jù)包和編碼區(qū)的負(fù)數(shù)據(jù)包時(shí),,平均錯誤率為16.5%,而使用正的數(shù)據(jù)包和非編碼區(qū)的負(fù)數(shù)據(jù)包時(shí),,平均錯誤率為18.6%,。