最近,來自美國(guó)加利福尼亞大學(xué)圣地亞哥分校,、克雷格-文特爾研究院和Illumina公司的科學(xué)家對(duì)現(xiàn)代基因測(cè)序算法進(jìn)行了改良,,只需從一個(gè)細(xì)菌細(xì)胞中提取的DNA(脫氧核糖核酸)就可組裝成接近完整的基因組,,準(zhǔn)確率達(dá)到90%,,而傳統(tǒng)的測(cè)序方法至少需要10億個(gè)相同的細(xì)胞才能完成。這一突破為那些無法培養(yǎng)的細(xì)菌提供了測(cè)序方法,。研究發(fā)表在9月18日的《自然·生物技術(shù)》網(wǎng)絡(luò)版上,。
實(shí)驗(yàn)室無法培養(yǎng)的細(xì)菌范圍極廣,約占99.9%,,從產(chǎn)生抗體和生物燃料的微生物,,到人體內(nèi)的寄生菌。它們的生存條件特殊,,比如必須和其他菌種共生,,或只能生存在動(dòng)物皮膚上,因此很難進(jìn)行人工培養(yǎng),。
論文合著者,、文特爾研究院的羅杰·拉斯肯教授10年前曾開發(fā)出一種多重置換擴(kuò)增(MDA)技術(shù),可對(duì)實(shí)驗(yàn)室無法培養(yǎng)的細(xì)菌測(cè)序,,能恢復(fù)70%的基因,。其工作原理是對(duì)一個(gè)細(xì)胞的基因片斷多次復(fù)制,直到其數(shù)量相當(dāng)于10億個(gè)細(xì)胞那么多,。不過,,這種技術(shù)卻給測(cè)序軟件帶來很多麻煩,它在復(fù)制DNA時(shí)會(huì)出現(xiàn)各種錯(cuò)誤,,而且并非完全統(tǒng)一放大,,有些基因組被復(fù)制數(shù)千次,有一些卻只被復(fù)制一兩次,。但測(cè)序算法不能處理這些不一致,,而是傾向于舍棄那些只復(fù)制了少數(shù)次的基因,即使它們對(duì)整個(gè)基因組來說很關(guān)鍵,。
加州大學(xué)圣地亞哥分校雅各布工程學(xué)院計(jì)算機(jī)科學(xué)教授,、現(xiàn)代基因測(cè)序技術(shù)算法創(chuàng)建人帕維爾·帕夫納和同事改進(jìn)了這一方法,保留了那些少量復(fù)制的基因片斷,,并用新方法對(duì)一個(gè)大腸桿菌測(cè)序以檢驗(yàn)其精確性,,發(fā)現(xiàn)它能恢復(fù)91%的基因,接近傳統(tǒng)的培養(yǎng)細(xì)胞水平,。這已足夠解答許多重要的生物學(xué)問題,,比如該細(xì)菌能產(chǎn)生什么抗體。
人體細(xì)菌占體重的約10%,,它們有些會(huì)造成傳染病,,但也有的能幫助消化,最近研究還發(fā)現(xiàn),,它們能改變?nèi)说男袨榉绞?,比如引誘人吃更多的東西。新方法也有助于科學(xué)家理解細(xì)菌行為,,研究人體內(nèi)細(xì)菌能產(chǎn)生哪種蛋白質(zhì)和多肽,,這些蛋白質(zhì)和多肽是細(xì)菌之間、細(xì)菌和宿主之間互相溝通的工具,。
研究小組還用新方法對(duì)一種以前未曾測(cè)序過的海洋細(xì)菌進(jìn)行了測(cè)序,,獲得了相當(dāng)完整而且能解釋的基因組,掌握了它是如何生存和運(yùn)動(dòng)的,,該基因組將被存入美國(guó)國(guó)家衛(wèi)生研究院的基因銀行(GenBank),。研究人員表示還將對(duì)更多迄今未知的細(xì)菌進(jìn)行測(cè)序。(生物谷 Bioon.com)
doi:10.1038/nbt.1966
PMC:
PMID:
Efficient de novo assembly of single-cell bacterial genomes from short-read data sets
Hamidreza Chitsaz,Joyclyn L Yee-Greenbaum, Glenn Tesler,Mary-Jane Lombardo,Christopher L Dupont,Jonathan H Badger,Mark Novotny,Douglas B Rusch,Louise J Fraser,Niall A Gormley,Ole Schulz-Trieglaff,Geoffrey P Smith,Dirk J Evers,Pavel A Pevzner1 & Roger S Lasken
Whole genome amplification by the multiple displacement amplification (MDA) method allows sequencing of DNA from single cells of bacteria that cannot be cultured. Assembling a genome is challenging, however, because MDA generates highly nonuniform coverage of the genome. Here we describe an algorithm tailored for short-read data from single cells that improves assembly through the use of a progressively increasing coverage cutoff. Assembly of reads from single Escherichia coli and Staphylococcus aureus cells captures >91% of genes within contigs, approaching the 95% captured from an assembly based on many E. coli cells. We apply this method to assemble a genome from a single cell of an uncultivated SAR324 clade of Deltaproteobacteria, a cosmopolitan bacterial lineage in the global ocean. Metabolic reconstruction suggests that SAR324 is aerobic, motile and chemotaxic. Our approach enables acquisition of genome assemblies for individual uncultivated bacteria using only short reads, providing cell-specific genetic information absent from metagenomic studies.