表達(dá)分析、分子生物學(xué)研究以及新的分析軟件工具將會(huì)推進(jìn)生物系統(tǒng)水平的研究,。
在基因表達(dá)研究中,,廣泛的基因分析可以對生理狀態(tài)或者是一個(gè)細(xì)胞表型有關(guān)的基因進(jìn)行系統(tǒng)監(jiān)測,??梢岳酶咄糠治鲈跀?shù)據(jù)輸出和獲取數(shù)據(jù)快捷兩方面的優(yōu)勢,對藥物發(fā)現(xiàn)過程中的藥靶候選基因進(jìn)行鑒定,,在假設(shè)驅(qū)動(dòng)的研究中,,該技術(shù)也提供了必須的系統(tǒng)背景知識。一旦微陣列技術(shù)成熟,,研究人員就能進(jìn)行轉(zhuǎn)錄組研究,,尋找感興趣的標(biāo)記基因。正如腫瘤基因表達(dá)對各種來源的組織和患者存活結(jié)果的相關(guān)性分析例子一樣,,通過微陣列技術(shù)進(jìn)行的基因表達(dá)分析研究將在生物標(biāo)記發(fā)現(xiàn)過程中繼續(xù)扮演重要作用,。
盡管微陣列的分析能力很強(qiáng)大,轉(zhuǎn)錄組學(xué)研究平臺只包括那些適應(yīng)生長條件變化細(xì)胞的轉(zhuǎn)錄物,。大多數(shù)細(xì)胞內(nèi)和細(xì)胞間的生物化學(xué)過程都會(huì)受到蛋白質(zhì)-蛋白質(zhì)或者其他蛋白質(zhì)-底物相互作用的影響,。蛋白質(zhì)組水平的基因表達(dá)分析提供了一個(gè)快速的可控制生物合成的快照過程,其中大部分是由轉(zhuǎn)錄組學(xué)平臺調(diào)控的,。同時(shí),,轉(zhuǎn)錄組本身通過表達(dá)的蛋白質(zhì)或者是細(xì)胞生化狀態(tài)下其他的變化,進(jìn)行反饋控制,。
換句話說,基因表達(dá)不僅僅是從轉(zhuǎn)錄組到蛋白質(zhì)組的單向流動(dòng),,而是兩者的相互連接,。對這種功能調(diào)控的了解通常只限于特殊的信號途徑,或者是新陳代謝途徑,。要了解轉(zhuǎn)錄組和蛋白質(zhì)組之間的相互調(diào)控作用,,需要對RNA和蛋白質(zhì)的表達(dá)進(jìn)行同步監(jiān)測,。
正如RNA可作為部分生物學(xué)功能的酶反應(yīng)的效益物一樣,蛋白質(zhì)也是大多數(shù)生物學(xué)功能的效益物,。因此,,蛋白質(zhì)水平廣泛的基因組分析是基因表達(dá)更直接的反映。而且,,根據(jù)基因組范圍設(shè)計(jì)的商業(yè)化微陣列靶標(biāo)集合很有限,,可能無法為近期哺乳動(dòng)物的發(fā)現(xiàn)提供足夠的轉(zhuǎn)錄物,因?yàn)檗D(zhuǎn)錄物的數(shù)量可能要比基因的數(shù)量多10倍或者更多,。
質(zhì)譜技術(shù)的進(jìn)展,,使得定量的蛋白組學(xué)研究成為可能。然而,,當(dāng)細(xì)胞適應(yīng)了轉(zhuǎn)錄水平(例如,,轉(zhuǎn)錄因子結(jié)合、染色質(zhì)結(jié)構(gòu)改變),、轉(zhuǎn)錄后(例如,,核與質(zhì)的輸出或者是信使RNA的剪接,特定的核糖體負(fù)荷),、翻譯后(蛋白降解和輸出)的精細(xì)調(diào)控機(jī)制后,,轉(zhuǎn)錄物和蛋白質(zhì)豐度測量結(jié)果可能會(huì)不一致。因此,,定量的轉(zhuǎn)錄物和蛋白質(zhì)豐度測量可作為相互的標(biāo)準(zhǔn),,為高通量分析得出的基因表達(dá)數(shù)據(jù)做出合理的解釋。正如蛋白質(zhì)和RNA之間類似點(diǎn)可以增加我們對新的生物標(biāo)記的信任度一樣,,差異也能暗示我們“其他的轉(zhuǎn)錄后調(diào)控結(jié)合點(diǎn)可作為治療的候選靶點(diǎn)”,。
研究現(xiàn)狀
通過分析細(xì)胞培養(yǎng)和細(xì)菌、酵母,、小鼠以及人類的整體動(dòng)物模型的mRNA和蛋白質(zhì)豐度情況,,可以實(shí)現(xiàn)轉(zhuǎn)錄物和蛋白質(zhì)表達(dá)的整體定量分析(如表1)。在蛋白組學(xué)分析過程中,,一些研究選擇了雙向凝膠電泳(2-DE)分析蛋白質(zhì)混合物,。要么是對不同的凝膠染色,要么是讓不同的細(xì)胞與不同的染料相結(jié)合,,通過斑點(diǎn)染色亮度可以看到蛋白質(zhì)的亮度,。隨后用質(zhì)譜儀對分離出的定量凝較斑點(diǎn)進(jìn)行鑒定,與轉(zhuǎn)錄組學(xué)分析不同的是,,雙向凝膠電泳分析的鑒定結(jié)果與定量分析是散耦合(de-coupled),。
雙向凝膠電泳的一大優(yōu)點(diǎn)是,它能將翻譯后已修改的蛋白質(zhì)分解為一連串的斑點(diǎn),,當(dāng)與單個(gè)的母本轉(zhuǎn)錄物相比較時(shí),,它提供的信息就會(huì)派上大用場,。依照這個(gè)步驟,就可以將化學(xué)誘導(dǎo)后的若干人類細(xì)胞培養(yǎng)模型的蛋白質(zhì)組和轉(zhuǎn)錄組信息區(qū)別開來,??傊鞍踪|(zhì)和轉(zhuǎn)錄物之間的相關(guān)性很弱――轉(zhuǎn)錄組學(xué)中的測量誤差被認(rèn)為是由微陣列(與TaqMan定量實(shí)時(shí)PCR有關(guān)),、2-DE本身的蛋白質(zhì)染料飽和染色,、共遷移造成的抑制作用,與低豐度蛋白質(zhì)隨后的顯像和定量,,鑒定一樣困難,。
液相色譜法(LC)是作為一種替代2-DE的蛋白質(zhì)分析方法而出現(xiàn)的。LC-MS分析是典型的“自下而上(Bottom-Up)”分析方法,,通常要用特異的蛋白酶(如胰島素)將蛋白質(zhì)裂解為肽段,。與2-DE不同,LC-MS對肽的定量和鑒定是同時(shí)進(jìn)行的,,例如,,根據(jù)離子阱質(zhì)譜儀碰撞誘導(dǎo)裂解CID)過程中產(chǎn)生的裂解譜,可以選擇定量的MS峰(m/z)用于鑒定,,通過肽片斷的信息推測對應(yīng)蛋白質(zhì)的定量信息,。
到目前為止,在已發(fā)表的整合分析文章中,,大多數(shù)LC-MS分析是與穩(wěn)定同位素標(biāo)記聯(lián)合使用的,,尤其是ICAT試劑。然而,,與非標(biāo)簽方法一樣,,18O/16O和15N/14N標(biāo)記近期有可能替代ICAT標(biāo)記法。目前,,在出版的ICAT標(biāo)記的LC-MS轉(zhuǎn)錄組學(xué)-蛋百組學(xué)整合分析的文章中,,已經(jīng)增加了與2-DE有關(guān)的蛋白質(zhì)組范圍。在最近的一次小鼠模型研究中,,在將150份mRNA-蛋白質(zhì)對進(jìn)行表達(dá)水平和轉(zhuǎn)錄水平的比較后,,發(fā)現(xiàn)蛋白水平的最佳預(yù)測力為41%(r=0.64)。通過相似分析,,與初期的整合分析相比較的相關(guān)度已經(jīng)很高了,,對此的解釋是――隨著技術(shù)的成熟,蛋白質(zhì)組和轉(zhuǎn)錄組的范圍都有所增加,。值得注意的是,,蛋白質(zhì)組范圍很可能會(huì)隨著最近的非標(biāo)記定量分析的進(jìn)展而增加,該技術(shù)利用了MS的微量級靈敏度,。
在將蛋白質(zhì)組和多核糖體轉(zhuǎn)錄組與預(yù)期的核糖體轉(zhuǎn)錄物相比較后,,研究人員發(fā)現(xiàn),原來預(yù)期的核糖體轉(zhuǎn)錄物翻譯很活躍,,并且與對應(yīng)蛋白質(zhì)組的關(guān)系要比總的轉(zhuǎn)錄組更接近,。在對JurkatT細(xì)胞的一項(xiàng)研究中,監(jiān)測的11個(gè)蛋白質(zhì)-轉(zhuǎn)錄物對,,只有一對蛋白質(zhì)和多聚核糖體mRNA變化呈現(xiàn)出一致性,。
蛋白質(zhì)與多核糖體,蛋白質(zhì)與總的mRNAs之間表現(xiàn)出的較高的一致性與酵母中觀察到的完全不同豐度的轉(zhuǎn)錄物,、ORF長度和在不同翻譯效率下的密碼子適應(yīng)指數(shù)相同,,因此影響了合成蛋白質(zhì)產(chǎn)物的豐度。核糖體裝載調(diào)控可能是機(jī)制之一,,能解釋“觀察到的轉(zhuǎn)錄物和蛋白水平不一致現(xiàn)象”,,其實(shí)是對分子生物學(xué)中心法則的挑釁。作為翻譯的一種抑制機(jī)制,,microRNAs也展示了另一種可能性,。
雖然采用的技術(shù)不同,迄今為止公開發(fā)表的整合分析都指出了轉(zhuǎn)錄組學(xué)和蛋白組學(xué)的重要性,。轉(zhuǎn)錄組學(xué)或蛋白組學(xué)通常只考慮調(diào)節(jié)系統(tǒng)和分解作用平衡態(tài)的凈效應(yīng),,實(shí)際上,出現(xiàn)的不一致性只是合成與降解兩種替換過程中的一種反映,??茖W(xué)家可能對變化過程中的機(jī)制更感興趣。
面臨的挑戰(zhàn)
其實(shí),,很難對蛋白組學(xué)和轉(zhuǎn)錄組學(xué)表達(dá)的差異性進(jìn)行細(xì)微的比較,。在基因組范圍,微陣列為目標(biāo)轉(zhuǎn)錄物提供了有限的豐度測量,,但是典型的質(zhì)譜分析可能與通常的2-DE操作一樣,,無法檢測出可溶蛋白,尤其是那些高豐度和非極限pI值的蛋白,;另一方面,,即使有多維的液相色譜分析,LC-MS仍然會(huì)遭遇肽段共洗脫(LC的局限性)和采樣過疏(掃描速度和靈敏度局限性)的限制,。
此外,,商業(yè)化基因組微陣列研究還沒有完成,很難對蛋白組學(xué)和轉(zhuǎn)錄組學(xué)進(jìn)行比較,,因?yàn)榉治霰旧頃?huì)偏向在蛋白水平上高豐度或者其他更容易檢測到的基因上,。
蛋白質(zhì)與轉(zhuǎn)錄物的相互參照是一個(gè)主要障礙。轉(zhuǎn)錄組學(xué)方面,,拼接亞型的存在會(huì)導(dǎo)致多重探針與同一個(gè)目標(biāo)雜交,,導(dǎo)致錯(cuò)誤的定量,。即使我們假設(shè)“在蛋白質(zhì)序列數(shù)據(jù)庫中,這些亞型已經(jīng)被正確的鑒定為單獨(dú)的路徑”,,拿轉(zhuǎn)錄組亞型與對應(yīng)的蛋白質(zhì)亞型比較,,仍是困難重重。異源序列數(shù)據(jù)庫的利用也是一個(gè)難題:微陣列靶子通常都是用NIH的基因序列數(shù)據(jù)庫(GenBank)和NCBI參考序列(RefSeq)標(biāo)示符進(jìn)行注解,,蛋白組學(xué)通常是用編輯更少的NCBI免費(fèi)數(shù)據(jù)庫蛋白質(zhì)搜索引擎EntrezProtein(NCBInr)或者是國際蛋白索引(IPI)數(shù)據(jù)庫注解,。雖然IPI數(shù)據(jù)庫為更多內(nèi)容的數(shù)據(jù)庫(例如RefSeq和Swiss-Prot)提供相關(guān)參照,但那些相關(guān)參照通常是不完善的,,并且IPI數(shù)據(jù)庫通常將較小的序列變異體排除在外,。
除了以上提到的與整合分析有關(guān)的技術(shù)難題之外,生物學(xué)研究系統(tǒng)也面臨挑戰(zhàn),。根據(jù)序列和亞細(xì)胞定位,,mRNA的半衰期壽命從幾分鐘到幾小時(shí);受N端殘基的影響,,蛋白質(zhì)部分壽命范圍從幾分鐘到幾天,。因?yàn)榈湫偷霓D(zhuǎn)錄組學(xué)和蛋白組學(xué)分析一次只分析一個(gè)點(diǎn),所以缺乏足夠的分辨力將新合成的轉(zhuǎn)錄物或蛋白質(zhì)與以往積累下來的部分區(qū)別開,。
另一方面,,蛋白質(zhì)和轉(zhuǎn)錄物表達(dá)之間的差異,可能會(huì)導(dǎo)致細(xì)胞的蛋白質(zhì)組與轉(zhuǎn)錄組不一致,。轉(zhuǎn)錄后,,特殊序列或者是次級折疊結(jié)構(gòu)可能會(huì)影響翻譯率,后者可能影響mRNA衰退,,與核糖體的裝載和加工一樣,,這些轉(zhuǎn)錄后機(jī)制都將證明蛋白質(zhì)合成中的變化??傊?,合成的蛋白質(zhì)也可能會(huì)遭受翻譯后修飾,這些修飾將管理蛋白質(zhì)的降解或分泌,。
正如中心法則預(yù)測的那樣,,在轉(zhuǎn)錄物和蛋白質(zhì)水平,如果只能通過嚴(yán)格的轉(zhuǎn)錄調(diào)控去控制蛋白質(zhì)的合成,,細(xì)胞是不太可能選擇精細(xì)調(diào)節(jié)機(jī)制的,。當(dāng)點(diǎn)對點(diǎn)進(jìn)行比較時(shí),蛋白質(zhì)和轉(zhuǎn)錄物之間的一致性通常很弱,,正如在酵母中顯示的那樣,,特定生物學(xué)路徑的組成基因的一致性或不一致性會(huì)更強(qiáng)。這些觀察說明了“從個(gè)體基因座的局部分析擴(kuò)展到功能途徑系統(tǒng)分析”的重要性。
轉(zhuǎn)錄組學(xué)和蛋白組學(xué)都是了解研究系統(tǒng)的生理化學(xué)狀態(tài)的有用工具,。當(dāng)然,,沒有一種工具可以為系統(tǒng)提供完全的覆蓋范圍及相應(yīng)的精確度。問題的核心,,不是用工具找出mRNA和蛋白質(zhì)之間一對一的相互關(guān)系,,而是要用它們區(qū)別出真陽性和假陽性,即區(qū)別出真正的mRNA-蛋白質(zhì)一致性或者是不一致性,。沒有這些整體分析,就無法觀察到真正的mRNA-蛋白質(zhì)不一致性,,并且這些不一致性要比一致性更吸引科學(xué)家,,因?yàn)樗鼈兺嘎冻龅母嗟霓D(zhuǎn)錄后干涉情況,可以進(jìn)一步去研發(fā)治療方法,。
哺乳動(dòng)物晝夜節(jié)律鐘的不一致就是時(shí)移不一致的一個(gè)例子,,調(diào)節(jié)蛋白如Period(mPER)在蛋白質(zhì)和轉(zhuǎn)錄物表達(dá)之間顯示了4~8小時(shí)的延遲??傮w不一致的一個(gè)例子是Ras/Akt信號在成膠質(zhì)細(xì)胞瘤中顯示出的不一致,,其中總mRNA變化很小。更多的變化發(fā)生在翻譯起始的核糖體裝載期間,,依次更改了蛋白質(zhì)性質(zhì),。
綜合數(shù)據(jù)
轉(zhuǎn)錄組學(xué)和蛋白組學(xué)分析要想整合成功,需要有效和精確的相互參考,。研究人員需要靈活的定義自己的基因圖譜,,但也可能需要選擇采用預(yù)定義的針對蛋白質(zhì)的目標(biāo)圖,當(dāng)新的基因組,、轉(zhuǎn)錄組和蛋白組序列出現(xiàn),,研究人員需要及時(shí)注冊更新,并且刪除錯(cuò)誤的信息,。
高通量轉(zhuǎn)錄組學(xué)和蛋白組學(xué)分析的數(shù)據(jù)量要求根據(jù)用戶定義的標(biāo)準(zhǔn)來過濾數(shù)據(jù),,例如測量性質(zhì)。在轉(zhuǎn)錄組學(xué)分析之后進(jìn)行定量的蛋白組學(xué)實(shí)驗(yàn),,廢棄不可靠的定量測量將會(huì)減少假性前導(dǎo)物的量,,尤其是在蛋白組學(xué)水平。誤差模型如那些建立在像RosettaResolver或RosettaElucidator系統(tǒng)的產(chǎn)物,,最適合這種處理,。實(shí)際上,過濾不是“萬能方法”,,還是應(yīng)該根據(jù)平臺(如微陣列或質(zhì)譜儀)和實(shí)驗(yàn)設(shè)計(jì)進(jìn)行具體的操作,。
可是,有時(shí)候會(huì)出現(xiàn)這種情況:應(yīng)用顯著性概率P值閾值作為轉(zhuǎn)錄組學(xué)或蛋白組學(xué)數(shù)據(jù)性質(zhì)典型標(biāo)準(zhǔn),真正沒有改變的基因表達(dá)數(shù)據(jù)將被忽略掉,。如果基因表達(dá)只在一個(gè)水平上有變化,,作為轉(zhuǎn)錄后調(diào)節(jié)的目標(biāo)就可能會(huì)增加假陰性率。從這個(gè)角度看,,對過濾的背景進(jìn)行指導(dǎo)對研究人員是有幫助的,。
蛋白質(zhì)數(shù)據(jù)面臨的另一個(gè)問題是,不能區(qū)別出蛋白質(zhì)剪接變體,,或是無法鑒定出肽序列,。只有獲得新的測序信息,才可能解決這些問題,,預(yù)定義分析過程或其他“一次點(diǎn)擊”方法能讓科學(xué)家對已有的MS/MS數(shù)據(jù)進(jìn)行重分析(如,,SEQUEST),并且能將任何有關(guān)定量蛋白質(zhì)更新信息(包括新添加的,、刪除或改動(dòng))告知研究人員,。
接下來,在轉(zhuǎn)錄組學(xué)和蛋白組學(xué)水平上對數(shù)據(jù)進(jìn)行處理,,需要對“轉(zhuǎn)錄物和蛋白質(zhì)注解和定量測量的數(shù)據(jù)”進(jìn)行比較分析,。典型的微陣列分析有一個(gè)有限的靶標(biāo)集――昂飛、安捷倫和美國應(yīng)用生物系統(tǒng)公司都將他們的靶標(biāo)與對應(yīng)的RefSeq序列標(biāo)識符直接進(jìn)行相互參照,。很多公司都提供預(yù)訂服務(wù),,例如Inpharmatica公司的Blu-Chip作為一種商業(yè)化解決方案,在最新的序列信息中有規(guī)則的查找靶序列,,對蛋白質(zhì)對應(yīng)的基因靶標(biāo)進(jìn)行定位作圖,。
一個(gè)使用更廣泛的工具是EBI的國際蛋白索引(IPI),該索引是蛋白組學(xué)分析的理想工具,,可以提供廣泛的基因組(具有最小冗余)范圍,。然而,EBI為其他的數(shù)據(jù)庫(如RefSeq和Swiss-Prot)提供的相互參照通常是不完整的,,在建立轉(zhuǎn)錄物-蛋白質(zhì)對的時(shí)候會(huì)產(chǎn)生數(shù)據(jù)流失,。目前,提出了一個(gè)兩次流程相互參照程序,,例如,,根據(jù)公開的數(shù)據(jù)庫,在第一流程中無法獲得從蛋白質(zhì)到基因的相互參照的高質(zhì)量MS/MS譜,,就可以在最新的基因組序列信息中進(jìn)行搜索,,去獲取蛋白質(zhì)序列數(shù)據(jù)庫中沒有的那部分拼接變體結(jié)果。
根據(jù)電荷態(tài)預(yù)測的一致性,,可以用算法去評定MS/MS譜,,離子流量和信噪比可能會(huì)有助于數(shù)據(jù)外存儲器的自動(dòng)選擇,,以便在基因組數(shù)據(jù)庫中進(jìn)行BLAST搜索。在兩個(gè)流程之間也能進(jìn)行肽段的翻譯后修飾研究,。人們是根據(jù)峰和同位素膜性質(zhì)來評定高質(zhì)量的MS譜,,但是如果得到的MS/MS譜不好,就有可能會(huì)被認(rèn)為是中性脫失,,例如,,磷酸鹽、甘露糖或其他的翻譯后改變,,用MS3碎片可以選擇這些峰去產(chǎn)生有用的肽裂解譜,。
分析過程中,應(yīng)該隨時(shí)對mRNA和蛋白質(zhì)半衰期的差異進(jìn)行比較,,如隨著療程的進(jìn)展,,在轉(zhuǎn)錄物和蛋白水平捕獲表達(dá)中出現(xiàn)的暫時(shí)變化。動(dòng)態(tài)分析工具能隨時(shí)監(jiān)測mRNA和蛋白水平中的動(dòng)態(tài)變化,,根據(jù)相互軌跡的良好適宜性,能對兩者之間的一致性進(jìn)行評估,。此外,,當(dāng)?shù)鞍踪|(zhì)表達(dá)軟件分析系統(tǒng)如RosettaElucidator系統(tǒng)能對定向的MS/MS信號肽峰進(jìn)行挑選,就能監(jiān)測到一列峰的MS,。
即使當(dāng)相互參照無法與mRNA-蛋白質(zhì)對相匹配時(shí),,功能分析也能獲得額外的信息。轉(zhuǎn)錄物和蛋白質(zhì)呈現(xiàn)出的差別表達(dá)特點(diǎn),,通過將具有GeneOntology(GO)分析工具的RosettaResolver和Elucidator系統(tǒng)直接整合,,可以把二者區(qū)別開。即使數(shù)據(jù)對兩個(gè)水平上的一些組成基因無效,,GO分析也能揭示出轉(zhuǎn)錄物或蛋白質(zhì)共同以及各自特有的生物學(xué)功能,。
表達(dá)分析具有揭示新基因的能力。更重要的是,,在轉(zhuǎn)錄物和蛋白質(zhì)水平上的整合表達(dá)分析,,能對整體的基因-基因相互作用網(wǎng)進(jìn)行描述,提供單個(gè)基因活性中的功能內(nèi)容,,正如傳統(tǒng)技術(shù)揭示的那樣,,這些內(nèi)容會(huì)影響到生物學(xué)功能。最后,,表達(dá)分析和分子生物學(xué)研究都有助于系統(tǒng)的了解宿主應(yīng)對環(huán)境挑戰(zhàn),、藥物質(zhì)量或疾病狀態(tài)的反應(yīng)。為了這個(gè)目標(biāo),,新的分析軟件工具將幫助研究者儲存在蛋白組學(xué)和轉(zhuǎn)錄組學(xué)中新出現(xiàn)的高通量技術(shù)的全部力量,。
表1:轉(zhuǎn)錄組學(xué)和蛋白組學(xué)的整合
參照系陣列平臺質(zhì)譜平臺研究系統(tǒng)mRNA- 蛋白質(zhì)對相關(guān)
5cDNA-
Cy3/Cy52DE-SYPRO
Ruby人THP-1細(xì)胞8低
6寡核苷酸-
Cy3/Cy52D-DIGE人NB4細(xì)胞6低
7cDNA-
Cy3/Cy52DE-
Comassie人主要的VSMC細(xì)胞5動(dòng)態(tài)相似,但是不同的變化交叉
8cDNA-
Cy3/Cy5LC-MS-ICAT鼠細(xì)胞系150
144R=0.59
R=0.54
9cDNA-
Cy3/Cy5LC-MS-ICAT鼠皮質(zhì)二乙基溴乙酰胺細(xì)胞4848%一致性
10cDNA-Cy3/Cy5LC-MS-ICAT酵母166變化不定
11寡核苷酸LC-MS-15N/14N酵母678R=0.45
(譯自《Genomics&Proteomics》)