谷類基因組的潛能
谷類作物包括水稻,、玉米、小麥,、大麥,、黑麥、高粱,、燕麥和小米,,自1萬年前被人類馴化以來,這些作物就是地球上的穩(wěn)定食物組成,。谷類作物也是食物產(chǎn)品和栽培面積中最重要的栽培作物,,在我們每天的日常飲食中,60%以上的卡路里和蛋白質(zhì)就是由谷類作物提供的,。過去,,相關的研究主要集中于細胞遺傳學方向,主要是從細胞學的角度,,特別是從染色體的結(jié)構和功能,,以及染色體和其他細胞器的關系來研究遺傳現(xiàn)象,闡明遺傳和變異的機制?,F(xiàn)在,,在基因組時代,,利用分子生物學強大的武器,已經(jīng)對其進行了更深入的研究,。近20年來,,對谷類基因組的結(jié)構和功能基因組學方面的研究,已經(jīng)包括了基礎和應用兩個方面,,通過分子圖譜,、基因組序列、表達序列標志(EST,,基因組中已得到體外表達的小段序列),、基因產(chǎn)物的相互作用、數(shù)量性狀基因座(QTLs)或者是與表型性狀持續(xù)變異有關的基因組區(qū)域信息,,我們對谷類發(fā)育和農(nóng)學方面的基因網(wǎng)絡有了更多的了解,。
此外,比較基因組學研究已經(jīng)將谷類轉(zhuǎn)變?yōu)橐粋€單一遺傳系統(tǒng),,因此,,一種谷類作物的信息,如線性相關性和基因功能的信息,,也可能為研究其他的谷類作物提供幫助,。讓人高興的是,通過標記輔助選擇(MAS)和定向誘變等方式,,基因組學正在改革育種方法,,這些方法對于改善農(nóng)學性狀的育種方法具有無比尋常的意義。通過鑒別天然基因的功能,,基因組學也增強了谷類的遺傳工程,。
目前,對于控制重要農(nóng)學性狀的許多基因,,可以根據(jù)它們在遺傳圖譜中的位置進行作圖和克隆,。克隆的基因包含它們自己的外顯子,、內(nèi)顯子和調(diào)節(jié)因子,,在條件合適的情況下,不需要額外的修飾,,可以轉(zhuǎn)化到同類作物其他品種或者是其他谷類作物中,。此外,對性狀相關基因進行克隆和定性,,可以用于尋找潛在等位基因和單倍體,,將其轉(zhuǎn)移進入農(nóng)民優(yōu)先選擇的高產(chǎn)量的品種中。本文將介紹近期的谷類基因組學進展,,以及相關信息對作物改良計劃產(chǎn)生的效應,。
分子標記和應用
基于分子遺傳學,,自動化設備的進展,目前已經(jīng)可以將密度分子遺傳圖譜用于主要的谷類物種的分析,。然而,,仍然需要在黑麥,、燕麥和小米的遺傳圖譜中整合更多的標記,。而且,在不同的分子標志中,,簡單重復序列(SSR或微隨體)標記,,已經(jīng)有許多的應用,尤其是在育種中的應用,。單核苷酸多態(tài)(SNPs)是另一個重要的分子標記,,在基因組中更為豐富,并且更適合于高通量基因分型的設備,。目前,,大多數(shù)全基因組關聯(lián)分析(仍然以單核苷酸多態(tài)性為主。此外,,多樣性芯片技術(DArT)代表了另外一種高通量標記系統(tǒng),,甚至不需要作物的序列數(shù)據(jù)就可用于全基因組圖譜的制備。這些全基因組圖譜將有助于性狀相關標記的建立,,不僅用適用于連鎖分析,,而且也可用于聯(lián)合圖譜。
通過基因組和EST測序計劃,,研究人員獲得了基因的序列數(shù)據(jù),,可以實現(xiàn)從基因組的轉(zhuǎn)錄區(qū)域開發(fā)分子標記,該區(qū)域通常指“基因的”或“功能的”標記(FMs),,采用這些標記,,通常能推導出一個假定的功能。因為與潛在的性狀位點等位基因完全連鎖,,功能標記要比隨機的DNA標記更好,。
雖然早期開發(fā)了cDNA–RFLP的功能標記,但當時不能預測它們的功能,。然而,,對這些早期的cDNA克隆進行測序,可以確定基因及其功能,。近年來,,ESTs和基因序列都已經(jīng)用于SSRs和SNPs的鑒定,并且在好幾種谷類作物中開發(fā)了基因分子標記,。除了用于“完美”或“理想”標記的鑒定,,通過比較作圖,,功能標記已經(jīng)成為估計天然種群,育種種群功能變化,,研究基因進化的一種重要資源,。
標記輔助選擇
分子標記輔助選擇(MAS)是一種強大的工具,它可以從分子水平上快速準確地分析個體的遺傳組成,,從而實現(xiàn)對基因型的直接選擇,,在下一代產(chǎn)品的早期生長階段對不同性狀進行間接選擇,因此加快了傳統(tǒng)作物育種的步伐,,并且促進了傳統(tǒng)方法無法做到的某些性狀的改良,。采用分子標記輔助選擇方法,已經(jīng)對谷類作物中許多控制農(nóng)學性狀,,對非生物和生物應激產(chǎn)生耐受的基因和數(shù)量性狀遺傳位點(QTLs)進行了鑒定,,并且進行了分子標記。
雖然標記輔助選擇(MAS)的潛在優(yōu)勢巨大,,但目前實際的應用卻很有限,,在水稻和其他作物的育種計劃中只有很少的應用。大規(guī)模的MAS應用主要是在玉米中,,其次是小麥,。大麥與小麥的育種系統(tǒng)類似,但前者發(fā)展更快,,可能是因為大麥的遺傳學內(nèi)容更為簡單的緣故,,大麥為非多倍體,即一個單獨性狀由兩個或三個單獨基因控制,。在眾多的谷類作物中,,水稻尤其重要,因為它不僅是全球的主要糧食作物之一,,也是遺傳學上的模式作物,。其他的谷物,如燕麥,、黑麥,、高梁和小米,因為處于次要地位而無法吸引人們的重視,,在標記發(fā)現(xiàn)和商業(yè)開發(fā)中,,幾乎沒有什么重大計劃。目前,,在大麥和小麥育種方面,,有許多計劃和新項目正在上馬,如澳大利亞的小麥和大麥分子育種計劃,以及MASWheat計劃,。
關聯(lián)作圖
另一種用于鑒定MAS分子標記的方法是關聯(lián)作圖,,該方法以連鎖不平衡(LD)為基礎。與傳統(tǒng)的兩系作圖種群如DH,、F2或RILs不同,,過去已經(jīng)采用這些方法鑒定性狀相關基因或QTLs,天然種群是重組的多次循環(huán)產(chǎn)物,,具有增強QTLs分辨率的可能性,。對于數(shù)量性狀變異基因的鑒定來說,關聯(lián)作圖要比連鎖分析功能更強大,。圍繞一個基因座位LD的范圍,,要測定關聯(lián)分析的分辨率和標記的數(shù)量,,需要對全基因組進行掃描,。因為大多數(shù)品種中的遺傳重組不是平均分布在全基因組中,所以標記和候選基因之間的連鎖距離變化很大,。
連鎖不平衡取決于進化或選擇歷史,,因此,只有那些緊密連鎖的基因或標記才可以被檢測到,。因為作物種群通常是可以被構建的,,所以Prichard等人提出了一個基于種群的方法,能夠?qū)Y(jié)構種群中的等位基因和性狀關系進行大規(guī)模的評估,。采用這種方法,,當一個QTL被標記緊密連鎖時,標記-性狀關聯(lián)是唯一可以被預期的內(nèi)容,,因為在發(fā)育期間,,累積的重組事件發(fā)生,將妨礙任何標記-性狀關聯(lián)的檢出,。
采用這種方法,,關聯(lián)作圖已經(jīng)被用于與玉米開花時間、黃色胚乳顏色和甜味有關的Dwarf8基因,,大麥的產(chǎn)量和產(chǎn)量穩(wěn)定性,,小麥的核形狀和碾磨品質(zhì)性狀有關的基因。這些針對個體基因水平的性狀或QTLs的高分辨作圖,,將為數(shù)量性狀變異的分子和生化基礎研究提供新的可能性,,并且為作物改良的特異性靶子的鑒定提供幫助。
圖位克隆法
目前,,圖位克隆法(map-basedcloning,,MBC)已逐漸成為分離表達產(chǎn)物和調(diào)控特性未知基因的重要方法之一。圖位克隆法是克隆農(nóng)業(yè)上重要基因的有效策略,,不需要預先知道基因的功能和表達產(chǎn)物等方面的信息,,其關鍵環(huán)節(jié)有2個:尋找與目的基因緊密連鎖的分子標記,;構建高質(zhì)量的大片段基因組文庫,如BAC和YAC文庫,。
實際上,,在1990年代中期就開始了幾個MBC計劃,已經(jīng)在部分谷類作物中分離了一些與疾病抗性或其他性狀有關的基因或QTLs,。許多例子與長期效應(高達10年)有關,,此外還涉及到資源的利用率,基因和QTL(s)在基因組中的定位等相關內(nèi)容,。得益于資源利用率和近期專家在谷物基因組學研究中的進展,,該技術可以更快更容易的對基因和QTLs進行分離。
例如,,研究人員采用粳稻品種Nipponbare和秈稻93-11的基因組序列數(shù)據(jù),,構建了一個水稻基因組的DNA多態(tài)性數(shù)據(jù)庫,包含1,703,176個SNPs和479,406個插入/缺失(InDels),,水稻基因組中,,大約每268bp有一個SNP,每953bp有一個InDel,。因此,,利用有效的基因組資源和新方法,如功能基因組學,,關聯(lián)作圖或者與傳統(tǒng)MBC方法相組合的方法,,將能促進水稻和其他谷類作物中的基因分離。
分離出來并且具有特性的候選基因可以用于等位基因的挖掘,,除了生產(chǎn)轉(zhuǎn)基因作物還可以鑒定優(yōu)良的單倍體,。因此,研究人員在定向誘導基因組局部突變技術(TILLING)策略的基礎上開發(fā)了EcoTILLING計劃,,以檢測種質(zhì)集合中的各種多態(tài)現(xiàn)象,。TILLING是功能基因組研究中應用的一種反向遺傳學技術,它能高通量低成本地在甲基磺酸乙酯(EMS)誘變?nèi)后w中鑒定出發(fā)生在特定基因上的點突變,。在其基礎上發(fā)展出的EcoTILLING技術則可發(fā)現(xiàn)種質(zhì)資源中的SNP位點及小插入或缺失多態(tài)性位點,。EcoTILLING適合于生物遺傳多樣性和系統(tǒng)進化的高通量研究。其原理是利用單核苷酸錯配堿基酶(CEL1)來識別并切斷錯配堿基,,之后通過電泳分離被剪切片段,,從而達到對突變體的檢測。
EcoTILLING可以對許多種質(zhì)中的一個基因座位上的天然等位基因定性,,也能進行SNP發(fā)現(xiàn)和單體型分析,。SNP和單體型分析方法都要求大規(guī)模測序,而EcoTILLING的成本要比前兩者低得多。EcoTILLED有望為那些作物中重要進程有關的基因提供一系列等位基因,,雖然在遺傳研究中,,這些基因的已知變種還沒有被觀察到。
例如,,Slade等人證明了TILLING對于作物實際的改良能力,,她們在六倍體小麥TILLING種群中篩選了1152個個體作物,鑒定了196種新的A和D基因組蠟質(zhì)基因(顆粒結(jié)合型淀粉合成酶,,GBSS1,,與直鏈淀粉的生產(chǎn)有關)的等位基因,在四倍體糊劑小麥TILLING種群中篩選768個個體,,有50種新的等位基因,。最終,在鑒別全部可能的等位基因之后,,必須對其相關價值進行評估,,以適應目標環(huán)境中的基因型。在設計優(yōu)于天然基因的人造等位基因時,,這種分析也可能會有用,。
序列數(shù)據(jù)和基因
全基因組和基因間隔測序
在谷類基因組中,水稻的基因組最小,,因此它被列位全基因組測序的首選目標。在國際公立和私立部門的共同努力下,,目前已經(jīng)獲得了水稻的四個草圖和全基因組的完整序列:一個用秈稻進行研究,,三個用粳稻進行研究。水稻基因組完整的序列,,來自于3,401個P1衍生的人工染色體(PAC)和細菌人工染色體(BAC)克隆,。12個虛擬疊聯(lián)群的總的核苷酸序列是370733456bp,因此,,除了模糊的核苷酸,,虛擬疊聯(lián)群涵蓋了95.3%的全基因組和常染色質(zhì)約98.9%的部分。
包括那些與轉(zhuǎn)座因子(TE)有關的基因,,完成的序列預計總數(shù)為55,296個基因,,如果不包括轉(zhuǎn)座因子(TE)有關基因,則為37,544個基因,。預測基因的范圍也得到了采用高密度寡核苷酸覆瓦式微陣列進行的秈稻亞種的全基因組轉(zhuǎn)錄分析證據(jù)的支持,。這種方法與自制的覆瓦式微陣列雜交作用有關:在水稻基因組的非重復序列中,包含13,078,888個體的36mer寡核苷酸探針,。它們是以改良的秈稻亞種全基因組鳥槍(WGS)序列為基礎,,并且含有一個衍生于四種主要組織的cDNA靶混合物,使對轉(zhuǎn)錄物的檢測達到最大化。
對35970個注釋基因模型以及經(jīng)鑒定的5,464個獨特的轉(zhuǎn)錄基因間區(qū)域支持的表達數(shù)據(jù),,與注釋外顯字具有類似的組成性質(zhì),,并且與其他作物蛋白質(zhì)有顯著的同源性。此外,,為了完整的闡述水稻基因組,,最近已經(jīng)制定了稻屬內(nèi)部的比較基因組學分析計劃,該計劃包括2種栽培種和22種野生物種,,代表10個不同的基因組類型,。而且,已經(jīng)獲得了代表全部10個稻屬基因組類型的12個BAC庫的綜合集合,。
與水稻不同,,其他的谷類基因組更大也更為復雜。雖然這些基因組的測序工作強度大得多,,但是在過去幾年間,,已經(jīng)對一些谷類的基因組序列或基因間隔區(qū)域進行了研究。例如,,正在對玉米和高梁進行全基因組測序,。除了采用傳統(tǒng)的方法獲得基因組序列數(shù)據(jù),也采用其他方法進行測試,,如甲基過濾和高Cot分析策略,,集中對基因組中基因豐富區(qū)域開展研究。最近,,國際小麥基因組測序協(xié)會(IWGSC)已經(jīng)制定了計劃,,對大的六倍體小麥基因組的基因間隔區(qū)域進行測序。
表達序列標簽
表達序列標簽(EST)是一種快速有效揭示基因組容量的方法,。在基因組測序計劃開始之前,,已經(jīng)在好幾個谷類作物中開展了大規(guī)模的表達序列標簽(EST)測序計劃,并且在幾乎所有的谷類作物中,,都獲得了大量的ESTs序列,。在一個給定的物種中,ESTs為了解基因組或者是轉(zhuǎn)錄子提供了一種可供選擇的方式,。例如,,對110,000個大麥ESTs的分析表明,約有41%的大麥基因?qū)儆诙嗷蚣易澹?%的大麥基因會遭遇剪接,。類似的,,在對來自于10個小麥組織的116,232個ESTs進行分析之后,Ogihara等人對這些基因在組織中的相互關系的表達模式進行了分析,,研究了小麥的發(fā)育過程,。
得益于發(fā)展中的cDNA陣列技術,,研究人員進一步開發(fā)了ESTs在分子標記和功能基因組學研究中的應用。例如,,ESTs已經(jīng)廣泛應用于EST–SSR,、SNP和COS標記的開發(fā),它們不僅用于性狀作圖和MAS,,也提供有關基因組進化的信息,。此外,ESTs已經(jīng)用于cDNA陣列的開發(fā),,并且用于種子發(fā)育過程有關基因的鑒定,。
功能基因組學
功能基因組學包括對基因自身功能的鑒定,或者是那些衍生自一個與改善表型不同的已知等位基因的鑒定,。對于后者而言,,研究的目標是去鑒定改良表型的序列變化,如一個序列變化可能成為分子標記(特異針對等位基因)的基礎,。因此,,真正意義上的功能基因組學可以被連鎖,或者與谷物改良幾乎的作物育種相聯(lián)合,。
目前,,已經(jīng)有一些技術或平臺可以同時用于大量基因中mRNA豐度的預測,如基因表達系列分析(SAGE),,大規(guī)模平行測序技術(MPSS),,微型排列(microarrays)和巨陣排列macroarrays)。然而,,相對于其他平臺的優(yōu)點,,如成本和高通量輸出信息,微型和巨陣排列已經(jīng)廣泛的用于谷類作物的分析,。最近,基于全基因組序列數(shù)據(jù)的覆瓦式微陣列已經(jīng)可以用于水稻全基因組轉(zhuǎn)錄分析,。因此,,對于水稻而言,可以采用GeneChip陣列,,全長cDNA陣列和全基因組覆瓦式微陣列進行分析,;對于大麥和小麥,昂飛公司已經(jīng)開發(fā)了GeneChip陣列,。
巨陣排列和微型排列已經(jīng)成功的用于許多谷類作物中,,包括玉米,水稻,,小麥,,大麥和高粱,例如,,為了研究這些作物的基礎生理學,,發(fā)育過程,環(huán)境應激反應,,突變鑒別和基因分型等內(nèi)容,近年來研究人員已經(jīng)采用這些技術開展了作物育種相關研究。例如,,Potokina等人采用具有6個麥芽制造品質(zhì)參數(shù)的10個大麥基因型以及具有1400個單一基因的cDNA陣列,為6個制麥參數(shù)分別鑒定了17~30的候選基因,。這些系列的候選基因含有那些與麥芽制造品質(zhì)有關的基因,,如半胱氨酸蛋白水解酶,與這種性狀有關的基因是未知的,,如70kDa熱休克蛋白,。
此外,采用功能基因組方法研究麥芽制造品質(zhì)性狀,,研究人員觀察到的結(jié)果是,,8個作圖候選基因中有5個與已知的QTLs相連鎖。因此,,功能基因組學方法與表達遺傳學或遺傳基因組學相組合,,為進一步研究生物學特性,提高性能(基因型預測表現(xiàn)型達到100%的有效性),,或者是開發(fā)將MAS應用于作物育種的診斷標記,,提供了一系列的候選基因。
用于稀有谷物的比較基因組學
除了玉米,,小麥和水稻等主要的谷類作物在全球廣泛栽培,,其他許多谷類作物如高粱,珍珠小米,,小米和衣索匹亞畫眉草(EragrostisTef/Teff)屬于地域性作物,,尤其在發(fā)展中國家,是當?shù)刂匾臓I養(yǎng)和收入來源,。因為在經(jīng)濟和福利方面的收入相對較低,,稀有谷物還沒有受到足夠的重視,開展的研究相對較少,。在谷類作物中,,重要基因組的線性相關性已有報道,因此,,采用生物信息學工具進行的比較基因組學研究,,可以為那些次要的谷類作物研究提供一個機會,從模式作物和主要的谷物到次要的,,稀少作物的信息傳遞,,可能會讓農(nóng)作物在產(chǎn)品,、產(chǎn)量穩(wěn)定性和食品安全性方面產(chǎn)生意想不到的效果。因此,,模式谷類作物品種(如水稻和玉米,,小麥)具有極大的潛能,可以為改善其他稀有和次要作物的性狀做出貢獻,。
利用模式作物,,主要作物對次要作物或者是稀有作物進行研究的轉(zhuǎn)化基因組學信息和技術有以下幾種形式:改善農(nóng)作物生物多樣性的分析以及對潛在有用變種的鑒定;預期的等位基因和等位基因組合的MAS,;預期的等位基因的克隆和轉(zhuǎn)化,。
此外,基于各自的遺傳學特性,,對次要和稀有農(nóng)作物的基因組學的研究也能促進主要農(nóng)作物的改良,。例如,耐旱的優(yōu)秀等位基因可能在珍珠小米中被發(fā)現(xiàn),,并且被用于主要作物中,,如小麥和水稻。所以,,應該對全體谷類作物開展廣泛的研究,。因此,基因組學研究能夠履行營養(yǎng)需求,,并且為貧困地區(qū)的收入和就業(yè)做出貢獻,。
改善作物的跨學科基因組學方法
許多谷類作物在基因組學領域研究中已經(jīng)獲得了重要進展。例如,,許多分子標記促進了高密度圖譜的制備,,在與許多經(jīng)濟特性有關的基因或QTLs有關聯(lián)的分子標記的鑒定方面,包括那些生物和非生物應激耐受的參數(shù),,高密度圖譜提供幫助,。開發(fā)功能分子標記作物序列數(shù)據(jù)的副產(chǎn)品,對標記-特性關聯(lián)的研究,,育種種質(zhì)集合或營養(yǎng)種群的功能多樣性的檢查方面,,都將提供幫助。
此外,,基因組、基因間隔或EST測序提供序列數(shù)據(jù),,對農(nóng)學性狀候選基因進行鑒定,;或者通過硅片方法,在生物信息學工具的協(xié)助下開展研究,;或者進行濕實驗室實驗,,如采用巨型陣列或微型陣列,。而且,聯(lián)合作圖方法和表達基因組學的開發(fā),,可能為一些有關性狀提供最好的分子標記,,在MAS中可以用于不同的遺傳背景分析。這些功能分子標記將與有關性狀在遺傳上共分離,。這樣的一個標記通常以一個SNP為基礎,。SNP能在高通量系統(tǒng)中檢測到,大量的作物可以以這種方式,,為一個特殊的等位基因進行分析測定,。
上述的遺傳和基因組學方法與轉(zhuǎn)錄組學、蛋白組學,、代謝組學和生物信息學整合在一起,,為育種基因組學提供了有效的工具,這種整體方法稱作基因組學輔助育種(GAB)技術,。然而,,該方法仍然面臨許多挑戰(zhàn)。其中包括,,精確的表型,、性狀的低遺傳性、實驗胚胎學,、調(diào)控變異,,技術困難和成本投資等問題。尤其是在育種計劃中采用功能基因組學和表達遺傳學方法去鑒定基因,,考慮基因網(wǎng)絡現(xiàn)象是很重要的,,如上位相互作用、基因沉默,、DNA甲基化,、RNA干擾和異染色質(zhì)DNA之間的關系,證明RNA調(diào)節(jié)是通過小的,、非編碼RNA進行調(diào)節(jié)的,。
我們相信,新開發(fā)的遺傳和基因組學工具將于傳統(tǒng)的育種技術一起,,為改良農(nóng)作物的農(nóng)學性狀提供方便,。