本文發(fā)表在最近一期的Bioinformatics上。將Bayesian方法應(yīng)用在系統(tǒng)發(fā)育樹(shù)的構(gòu)建上是最近的熱點(diǎn),。本文條理清晰,、語(yǔ)言流暢,大家可以將本文作為入門(mén)了解的學(xué)習(xí)資料,。
我們所采集到的生物數(shù)據(jù)是有限的,,但是真實(shí)的生物進(jìn)化歷程卻未知的,因此對(duì)進(jìn)化樹(shù)的人為估計(jì),、計(jì)算極易帶有不確定性,。這種不確定性不但體現(xiàn)在樹(shù)的枝長(zhǎng),而且主要體現(xiàn)在樹(shù)的拓?fù)浣Y(jié)構(gòu)上,。在最大似然性方法的框架內(nèi),,在兩個(gè)或多個(gè)可能的樹(shù)形中進(jìn)行判斷、選擇的方法已經(jīng)發(fā)展了大約二十年,。Felsenstein首次提出bootstrap(BP)方法作為評(píng)價(jià)標(biāo)準(zhǔn),之后Kishino和Hasegawa提出一種測(cè)試方法以評(píng)價(jià)兩個(gè)樹(shù)形之間的差異,。這種測(cè)試(一般稱之為KH)最近的應(yīng)用與發(fā)對(duì)這種差異的可能性取對(duì)數(shù),并假設(shè)該對(duì)數(shù)值服從于正態(tài)分布,在這種零假設(shè)下,,該差異對(duì)數(shù)值的期望值為零,。如果觀察到的差異超過(guò)某個(gè)置信范圍,則認(rèn)為這兩種樹(shù)形之間被認(rèn)為存在顯著差異,。然而,,BP方法有著許多已知的不足,而KH測(cè)試并不能保證無(wú)偏性,,盡管有些其他的改進(jìn)方法,,但依然不能讓人滿意。
Bayes方法可以避免一些在頻率學(xué)派方法中存在的問(wèn)題,。Bayes方法基本觀點(diǎn)是將樹(shù)的構(gòu)造和評(píng)測(cè)工作放在一起完成,。然而因?yàn)閎ayes方法要求先驗(yàn)分布的選擇,在進(jìn)化分析中還可能受到所選擇的進(jìn)化模型的影響,。但是Bayes方法與其他方法相比仍然存在著優(yōu)勢(shì),其發(fā)展受到熱切關(guān)注,。
在這篇文章里,,作者分析了兩種Bayes方法在樹(shù)形比較中的應(yīng)用。文章中的各種推導(dǎo)比較清晰,,有組于大家了解bayes技術(shù),。