1995年Velculescu等提出了基因表達(dá)系列分析(Serial Analysis of Gene Expression,SAGE)技術(shù),能同時(shí)對(duì)上千個(gè)轉(zhuǎn)錄物進(jìn)行研究,。
1. SAGE的原理和實(shí)驗(yàn)路線(xiàn),。
1.1 SAGE的原理
SAGE的主要依據(jù)有兩個(gè),。第一,一個(gè)9~10堿基的短核苷酸序列標(biāo)簽包含有足夠的信息,,能夠唯一確認(rèn)一種轉(zhuǎn)錄物,。例如,一個(gè)9堿基順序能夠分辨262144個(gè)不同的轉(zhuǎn)錄物(49),,而人類(lèi)基因組估計(jì)僅能編碼80000種轉(zhuǎn)錄物,,所以理論上每一個(gè)9堿基標(biāo)簽?zāi)軌虼硪环N轉(zhuǎn)錄物的特征序列。第二,,如果能將9堿基的標(biāo)簽集中于一個(gè)克隆中進(jìn)行測(cè)序,,并將得到的短序列核苷酸順序以連續(xù)的數(shù)據(jù)形式輸入計(jì)算機(jī)中進(jìn)行處理,就能對(duì)數(shù)以千計(jì)的mRNA轉(zhuǎn)錄物進(jìn)行分析,。
1.2 SAGE的實(shí)驗(yàn)路線(xiàn),。
如圖1所示:(1) 以biotinylated oligo(dT)為引物反轉(zhuǎn)錄合成cDNA,以一種限制性?xún)?nèi)切酶(錨定酶 Anchoring Enzyme,, AE)酶切,。錨定酶要求至少在每一種轉(zhuǎn)錄物上有一個(gè)酶切位點(diǎn),一般4堿基限制性?xún)?nèi)切酶能達(dá)到這種要求,,因?yàn)榇蠖鄶?shù)mRNA要長(zhǎng)于256堿基(44),。通過(guò)鏈霉抗生物素蛋白珠收集cDNA3′端部分。對(duì)每一個(gè)mRNA只收集其polyA尾與最近的酶切位點(diǎn)之間的片段,。(2) 將cDNA等分為A和B兩部分,,分別連接接頭A或接頭B,。每一種接頭都含有標(biāo)簽酶(Tagging Enzyme TE)酶切位點(diǎn)序列(標(biāo)簽酶是一種Ⅱ類(lèi)限制酶,它能在距識(shí)別位點(diǎn)約20堿基的位置切割DNA雙鏈),。接頭的結(jié)構(gòu)為引物A/B序列+標(biāo)簽酶識(shí)別位點(diǎn)+錨定酶識(shí)別位點(diǎn),。(3) 用標(biāo)簽酶酶切產(chǎn)生連有接頭的短cDNA片段(約9~10堿基),混合并連接兩個(gè)cDNA池的短cDNA片段,,構(gòu)成雙標(biāo)簽后,,以引物A和B擴(kuò)增。(4) 用錨定酶切割擴(kuò)增產(chǎn)物,,抽提雙標(biāo)簽(Ditga)片段并克隆,、測(cè)序。一般每一個(gè)克隆最少有10個(gè)標(biāo)簽序列,,克隆的標(biāo)簽數(shù)處于10~50之間,。(5) 對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行處理,。在所測(cè)序列中的每個(gè)標(biāo)簽間以錨定酶序列間隔,,如圖1中錨定酶采用Nia Ⅲ限制性?xún)?nèi)切酶,則以CATG/GTAC序列確定標(biāo)簽的起始位置和方向,。
圖1 基因表達(dá)系列分析(SAGE)示意
錨定酶(AE)和標(biāo)簽酶(TE)是NiaⅢ,、FokI
X和O分別表示不同標(biāo)簽的核苷酸順序
由于雙標(biāo)簽體的長(zhǎng)度基本相同,不會(huì)導(dǎo)致擴(kuò)增的偏態(tài)性,,同時(shí)數(shù)量和種類(lèi)極大的轉(zhuǎn)錄物使同一種標(biāo)簽連接成雙標(biāo)簽體的可能性極小,,這保證了克隆中的每一個(gè)標(biāo)簽代表一種轉(zhuǎn)錄物在當(dāng)前細(xì)胞狀態(tài)下的一個(gè)單位的轉(zhuǎn)錄產(chǎn)物,因此通過(guò)計(jì)算機(jī)軟件的分析能夠得到上千種基因表達(dá)產(chǎn)物的標(biāo)簽序列以及豐裕度,。
雖然SAGE技術(shù)能夠盡可能全面地收集生物組織的基因表達(dá)信息,,但也不能完全保證涵蓋所有的低豐度的mRNA。另外標(biāo)簽體的連接可能因接頭的干擾造成克隆所包含的標(biāo)簽體過(guò)少和克隆序列末端不能高效地連入載體,。Powell利用磁性生物素珠特異吸附引物,,避免了接頭的干擾(Powell 1998)。
2. SAGE的優(yōu)點(diǎn)和應(yīng)用
SAGE是一項(xiàng)快捷,、有效的基因表達(dá)研究技術(shù),任何具備PCR和手動(dòng)測(cè)序器具的實(shí)驗(yàn)室都能使用這項(xiàng)技術(shù),,結(jié)合自動(dòng)測(cè)序技術(shù)能夠在3個(gè)小時(shí)內(nèi)完成1000個(gè)轉(zhuǎn)錄物的分析,。另外使用不同的錨定酶(識(shí)別5~20堿基的Ⅱ類(lèi)核酸內(nèi)切酶),使這項(xiàng)技術(shù)更具靈活性,。
首先SAGE可應(yīng)用于人類(lèi)基因組研究,。1995年 Velculescu 等選擇Bsm F I和Nia Ⅲ分別作為標(biāo)簽酶和錨定酶,使用計(jì)算機(jī)對(duì)9堿基標(biāo)簽數(shù)據(jù)進(jìn)行分析并對(duì)GenBank檢索,。在分析的1000個(gè)標(biāo)簽中,,95%以上的標(biāo)簽?zāi)軌虼砦ㄒ坏霓D(zhuǎn)錄物。轉(zhuǎn)錄水平依標(biāo)簽出現(xiàn)頻率分為4類(lèi):① 超過(guò)三次 共380個(gè),,占45.2%,;② 出現(xiàn)三次 共45個(gè),占5.4%,;③ 出現(xiàn)兩次 共351個(gè),占7.6%,;④ 僅出現(xiàn)過(guò)一次 共840個(gè),,占41.8%。所以SAGE能夠快速,、全范圍提取生物體基因表達(dá)信息,,對(duì)已知基因進(jìn)行量化分析。SAGE也能應(yīng)用于尋找新基因,。雖然SAGE的標(biāo)簽僅包括9個(gè)堿基,,但加上錨定酶的位點(diǎn)序列(4個(gè)堿基)共可確認(rèn)13堿基序列,。如果一個(gè)標(biāo)簽檢索已知序列時(shí)沒(méi)有同源序列,13堿基片段就可作為探針篩選cDNA文庫(kù)得到cDNA克隆,。
其次,,SAGE可用于定量比較不同狀態(tài)下的組織細(xì)胞的特異基因表達(dá)。Stephen L等(1997)利用SAGE技術(shù)比較小鼠胚囊纖維細(xì)胞基因表達(dá),。小鼠胚囊纖維細(xì)胞能產(chǎn)生對(duì)溫度敏感的P53腫瘤抑制蛋白,就可通過(guò)SAGE分析,,比較兩種不同溫度下基因表達(dá)的差異,。從約15 000個(gè)分析的基因中,發(fā)現(xiàn)有14個(gè)基因的表達(dá)依賴(lài)于P53蛋白,,有3個(gè)基因的表達(dá)與P53蛋白的失活顯著相關(guān),。Zhang等(1997)比較正常細(xì)胞和腫瘤細(xì)胞基因表達(dá)的300000個(gè)轉(zhuǎn)錄物發(fā)現(xiàn):在分析的4500種轉(zhuǎn)錄物中,至少有500種在兩種細(xì)胞組織中的表達(dá)有顯著差異,。
第三,,由于SAGE能夠同時(shí)最大限度的收集一種基因組的基因表達(dá)信息,轉(zhuǎn)錄物的分析數(shù)據(jù)可用來(lái)構(gòu)建染色體表達(dá)圖譜(Chromosomal expression map),。Victor等分析了酵母基因組的基因表達(dá),,從60633個(gè)轉(zhuǎn)錄物中發(fā)現(xiàn)了4655個(gè)基因(表達(dá)水平分布在0.3~2.0/細(xì)胞),其中1981個(gè)基因已被確認(rèn)了功能,,2684個(gè)還未被報(bào)道過(guò),。利用基因的表達(dá)信息與基因組圖譜融合繪制的染色體表達(dá)圖譜,使基因表達(dá)與物理結(jié)構(gòu)連系起來(lái),,更利于基因表達(dá)模式的研究。(Velculescu,1997)
SAGE是基因表達(dá)定性和定量研究的一種有效工具,,非常適合于比較不同發(fā)育狀態(tài)或疾病狀態(tài)的生物基因表達(dá),。另外SAGE能夠接近完整地獲得基因組表達(dá)信息,,能夠直接讀出任何一種類(lèi)型細(xì)胞或組織的基因表達(dá)信息,。SAGE技術(shù)的應(yīng)用將大大加快基因組研究的進(jìn)展,但必須和其它技術(shù)相互融合,、互為補(bǔ)充,,才能最大可能地進(jìn)行基因組基因表達(dá)的全面研究。
作者單位:華南農(nóng)業(yè)大學(xué)遺傳工程室,,廣州 510642
參考文獻(xiàn)
1. Adams MD et al. Science, 1991,251:1651
2. Powell J. Nucleic Acids Res,, 1998,26:3445
3. Lisitsyn N et al. Science, 1995, 259:946
4. Pardee AB et al. Science, 1992, 257:967
5. Velculescu E et al. Science, 1995, 270:484
6. Velculescu E et al. Cell, 1997, 88: 243
7. Zhang L et al. Science, 1997, 276:1268
8. Madden S L et al.Oncogene, 1997, 15:1079