蛋白和核酸資料庫日益豐富,,伊利諾斯大學(xué)研究人員最近研制出一種新型軟件,,可以更有效地分析、比對序列和結(jié)構(gòu)數(shù)據(jù),。
Zaida Luthey-Schulten “MultiSeq(發(fā)音為Multi-seek)能夠幫助您對結(jié)構(gòu)和序列進(jìn)行分析,,并且能夠利用包含在結(jié)構(gòu)和序列中的全部信息,分析該基因或蛋白在不同物種進(jìn)化過程中出現(xiàn)的差異,,”
化學(xué)教授,、伊利諾斯大學(xué)Beckman Institute 研究所(主要負(fù)責(zé)尖端科技研究)研究人員Zaida Luthey-Schulten說,“通過將生物信息放在進(jìn)化背景中考慮,,我們可以對不同物種來源的蛋白進(jìn)行比較動態(tài)研究(comparative dynamics studies,,生物通編者譯)。”
目前蛋白和核酸,,序列數(shù)達(dá)3百萬以上,,結(jié)構(gòu)達(dá)3億5千萬種。MultiSeq軟件能夠結(jié)合環(huán)境因素對這些數(shù)據(jù)進(jìn)行分析,,有助于研究人員對于一些基礎(chǔ)科學(xué)問題能夠得到更有價(jià)值的資料,,比如生命起源現(xiàn)象,和抵抗抗生素(作用于核糖體)的抗性增強(qiáng)現(xiàn)象,。
VMD(Visual Molecular Dynamics,,可視分子動力學(xué))是一種觀察和分析分子動力學(xué)模擬(molecular dynamics simulations)的程序,由伊利諾斯大學(xué)研究人員研制并免費(fèi)向廣大用戶開放,。VMD能夠控制大型的包括1百多萬個原子的三維體系,。多重芯片(Multiple Alignment tool)是VMD一個重要組成部分。Luthey-Schulten和研究生Elijah Roberts,、John Eargle ,、Dan Wright在多重芯片的基礎(chǔ)上研制得到MultiSeq。MultiSeq通過在分析過程中結(jié)合已知的多樣的進(jìn)化數(shù)據(jù)擴(kuò)展了VMD的功能,。
比如,,科學(xué)家可以借助MultiSeq軟件研究核糖體的進(jìn)化過程。蛋白翻譯是生命活動的一個重要組成部分,,核糖體是蛋白的加工廠,。“要想弄清翻譯過程中DNA-RNA-蛋白途徑的變化,至少要將不同核糖體中的DNA序列,、RNA序列和蛋白序列分別比對,,”
Luthey-Schulten說:“去年,同時比對兩個核糖體中的三個序列都感到困難,,但是現(xiàn)在,,在MultiSeq的幫助下,我們可以對20多種核糖體中的序列信息同時進(jìn)行比對了,。”
MultiSeq就序列和結(jié)構(gòu)改變,,利用信息科學(xué)來組織與檢索數(shù)據(jù),、利用信息可視化來協(xié)助相關(guān)性識別、利用數(shù)學(xué)來闡明統(tǒng)計(jì)學(xué)推論,、利用生物學(xué)來分析理化性質(zhì),,在一個進(jìn)化框架里,整合了序列及結(jié)構(gòu)數(shù)據(jù),。
研究合作單位包括:Beckman 研究所Theoretical and Computational Biophysics小組和National Institutes of Health (NIH,,美國國立衛(wèi)生研究所) Resource for Macromolecular Modeling and Bioinformatics。MultiSeq軟件的具體內(nèi)容發(fā)表于《BMC Bioinformatics》,,并且出現(xiàn)在該雜志的網(wǎng)絡(luò)版首頁,。在秋季,MultiSeq將作為教學(xué)工具進(jìn)入課堂教學(xué),。
“我們認(rèn)為,,不以進(jìn)化為基礎(chǔ)理論框架的話就不能夠?qū)σ恍?fù)雜的生物學(xué)問題充分理解,”論文中寫到,,“MultiSeq可以預(yù)先剔除一些事倍功半的任務(wù),,或者通過引入看似親緣關(guān)系較遠(yuǎn)但是相關(guān)的數(shù)據(jù)摸索出一些新的研究方法,加速科學(xué)研究,。”
研究受到美國國家基因委員會(National Science Foundation),、美國能源部(U.S. Department of Energy)、美國國立衛(wèi)生研究院(National Institutes of Health)資助,。