近日,刊登在國(guó)際著名評(píng)論雜志Nature Reviews Genetics上的研究指出,,基因組非編碼區(qū)域的變化越來(lái)越多地被涉及到復(fù)雜性狀間的個(gè)體差異,,包括疾病易感性,,然而闡釋非編碼變化的功能效應(yīng)卻是一項(xiàng)特殊的挑戰(zhàn)。最近發(fā)表的兩篇論文系統(tǒng)地研究了SNP對(duì)于轉(zhuǎn)錄因子結(jié)合的影響,從而表明盡管序列與結(jié)合之間的一些趨勢(shì)正如預(yù)期的那樣,,但預(yù)測(cè)特定SNP的效應(yīng)將是很困難的,。
通過(guò)對(duì)源自跨越3代人的一個(gè)家族的12位成員的淋巴母細(xì)胞系進(jìn)行測(cè)序(ChIP–seq),以及進(jìn)行染色質(zhì)免疫沉淀反應(yīng),,Maurano等人對(duì)轉(zhuǎn)錄調(diào)節(jié)因子CTCF的結(jié)合位點(diǎn)進(jìn)行了繪制,。他們隨后對(duì)間隔環(huán)繞每一個(gè)結(jié)合位點(diǎn)134bp的區(qū)域進(jìn)行了定向測(cè)序,從而使他們擁有了總數(shù)超過(guò)35,,000個(gè)CTCF結(jié)合位點(diǎn)的高分辨率的基因型和ChIP數(shù)據(jù),。在這些位點(diǎn)中,有21%至少與一個(gè)SNP重疊,,使得他們能夠探索SNP與位點(diǎn)占用之間的關(guān)系,。總的來(lái)說(shuō),,5.6%的多態(tài)性結(jié)合位點(diǎn)具有一個(gè)與CTCF占用有關(guān)的SNP基因型顯著相關(guān)性,,并且像預(yù)期的那樣,影響占用的SNP中有85%位于44bp區(qū)域的范圍之內(nèi),,在這里CTCF能夠在其結(jié)合位點(diǎn)與DNA進(jìn)行接觸,。
然而,應(yīng)當(dāng)指出,,蛋白質(zhì)—DNA交互區(qū)域的大部分SNP并不會(huì)影響占用,,甚至在CTCF結(jié)合主題的核心14bp中,也只有36%的SNP會(huì)影響占用,。此外,,在不同基因組結(jié)合位點(diǎn)位置中的單核苷酸變體在相同的結(jié)合位點(diǎn)位置對(duì)于蛋白質(zhì)占用具有不同的影響,這取決于它們環(huán)境,。這些發(fā)現(xiàn)表明了SNP效應(yīng)的一個(gè)緩沖作用,。緩沖作用的范圍似乎取決于結(jié)合位點(diǎn)的強(qiáng)度(更強(qiáng)的主題會(huì)緩沖除了非常具有破壞性的變化之外的所有變化)以及序列的前后關(guān)系。例如,,核心CTCF主題中位置1上的SNP對(duì)占用具有的影響均在位置5的一個(gè)腺嘌呤的背景下,。
在第二項(xiàng)研究中,Reddy等人利用了來(lái)自一個(gè)個(gè)體(對(duì)他們而言,,父母的基因組也可用)的一個(gè)淋巴母細(xì)胞系的ChIP–seq和重新測(cè)序數(shù)據(jù),,并且他們著眼于一個(gè)24個(gè)轉(zhuǎn)錄因子組,。觀察到的模式與CTCF相類(lèi)似:13%的轉(zhuǎn)錄因子占用區(qū)域是多態(tài)性的,,并且5.5%的雜合多態(tài)性位點(diǎn)在轉(zhuǎn)錄因子占用上表現(xiàn)出了等位基因差異。然而,,在已知轉(zhuǎn)錄因子結(jié)合主題中的變體只能解釋12%的等位基因占用差別案例,。這些作者還分析了等位基因表達(dá)數(shù)據(jù)周邊的占用數(shù)據(jù),進(jìn)而發(fā)現(xiàn)一個(gè)轉(zhuǎn)錄起始位點(diǎn)的100bp之內(nèi)的占用的表達(dá)可以高度預(yù)測(cè),;與表達(dá)有關(guān)的一些占用在一些更遙遠(yuǎn)的位點(diǎn)中被發(fā)現(xiàn),,但是長(zhǎng)距離效應(yīng)更弱且更難預(yù)測(cè),。
總之,這些研究表明,,為了了解非編碼SNP的功能,,功能研究需要與信息學(xué)預(yù)測(cè)一道進(jìn)行。(生物谷Bioon.com)
doi:10.1038/nrg3219
PMC:
PMID:
Functional genomics: Complexities of occupancy and sequence
Mary Muers
Variation in non-coding regions of the genome is increasingly being implicated in inter-individual variation in complex traits, including disease susceptibility, but interpreting the functional effects of non-coding variation is particularly challenging. Two recent papers that have systematically studied the effects of SNPs on transcription factor binding show that although some trends in the relationship between sequence and binding are as expected, predicting the effects of specific SNPs will be difficult.