賓夕法尼亞州立大學和紐約州大學聯(lián)合進行的一項研究證明一種識別基因表達模式的新方法比目前最受歡迎的方法還要有效。
用兩組已公布的基因表達數(shù)據(jù)作為測試實例,研究小組發(fā)現(xiàn)KL聚類方法比目前最常用的基因表達模式分析方法--層級聚類(hierarchical clustering)還要優(yōu)越。
聚類分析(clustering analysis)是大規(guī)模基因表達譜目前最廣泛使用的統(tǒng)計技術,,通過把用最緊密關聯(lián)的譜來放基因進行樣本聚類,例如用簡單的層級聚類方法。這種聚類亦可擴展到每個實驗樣本,,利用一組基因總的線性相關進行聚類。
在基因表達分析中 ,,識別出具有類似時間表達模式的基因“類”一般說來都是至為關鍵的一步,,因為它為了解基因間相互作用以及生物過程的基礎提供了線索,。實驗表明,功能類似的基因可能顯示出相似的共同調(diào)控的時間模式,。
賓夕法尼亞州立大學計算機科學與工程學系的教授Raj Acharya博士說,,雖然這次研究選取的是基因數(shù)據(jù),但KL聚類可用于更大樣本的時間數(shù)據(jù),。
研究小組將他們的發(fā)現(xiàn)--“基因表達時間模式分析的理論信息方法”發(fā)表在3月期的《生物信息學》雜志上,。文章作者為賓夕法尼亞大學的博士研究生Jyotsna Kasturi、Achary,、以及紐約州大學藥學系的Murali Ramanathan博士,。
Kasturi解釋說:“我們想把類似模式的基因表達數(shù)據(jù)放到變異度盡可能小的同一類中,這意味著密度更大的類,。