近日,,刊登在國際著名評論雜志Nature Reviews Genetics上的研究指出,,基因組非編碼區(qū)域的變化越來越多地被涉及到復雜性狀間的個體差異,,包括疾病易感性,,然而闡釋非編碼變化的功能效應卻是一項特殊的挑戰(zhàn),。最近發(fā)表的兩篇論文系統(tǒng)地研究了SNP對于轉錄因子結合的影響,,從而表明盡管序列與結合之間的一些趨勢正如預期的那樣,,但預測特定SNP的效應將是很困難的,。
通過對源自跨越3代人的一個家族的12位成員的淋巴母細胞系進行測序(ChIP–seq),以及進行染色質免疫沉淀反應,,Maurano等人對轉錄調節(jié)因子CTCF的結合位點進行了繪制,。他們隨后對間隔環(huán)繞每一個結合位點134bp的區(qū)域進行了定向測序,從而使他們擁有了總數(shù)超過35,,000個CTCF結合位點的高分辨率的基因型和ChIP數(shù)據(jù),。在這些位點中,有21%至少與一個SNP重疊,,使得他們能夠探索SNP與位點占用之間的關系,。總的來說,,5.6%的多態(tài)性結合位點具有一個與CTCF占用有關的SNP基因型顯著相關性,,并且像預期的那樣,影響占用的SNP中有85%位于44bp區(qū)域的范圍之內,,在這里CTCF能夠在其結合位點與DNA進行接觸,。
然而,,應當指出,蛋白質—DNA交互區(qū)域的大部分SNP并不會影響占用,,甚至在CTCF結合主題的核心14bp中,,也只有36%的SNP會影響占用。此外,,在不同基因組結合位點位置中的單核苷酸變體在相同的結合位點位置對于蛋白質占用具有不同的影響,,這取決于它們環(huán)境。這些發(fā)現(xiàn)表明了SNP效應的一個緩沖作用,。緩沖作用的范圍似乎取決于結合位點的強度(更強的主題會緩沖除了非常具有破壞性的變化之外的所有變化)以及序列的前后關系,。例如,核心CTCF主題中位置1上的SNP對占用具有的影響均在位置5的一個腺嘌呤的背景下,。
在第二項研究中,,Reddy等人利用了來自一個個體(對他們而言,,父母的基因組也可用)的一個淋巴母細胞系的ChIP–seq和重新測序數(shù)據(jù),,并且他們著眼于一個24個轉錄因子組。觀察到的模式與CTCF相類似:13%的轉錄因子占用區(qū)域是多態(tài)性的,,并且5.5%的雜合多態(tài)性位點在轉錄因子占用上表現(xiàn)出了等位基因差異,。然而,在已知轉錄因子結合主題中的變體只能解釋12%的等位基因占用差別案例,。這些作者還分析了等位基因表達數(shù)據(jù)周邊的占用數(shù)據(jù),,進而發(fā)現(xiàn)一個轉錄起始位點的100bp之內的占用的表達可以高度預測;與表達有關的一些占用在一些更遙遠的位點中被發(fā)現(xiàn),,但是長距離效應更弱且更難預測,。
總之,這些研究表明,,為了了解非編碼SNP的功能,,功能研究需要與信息學預測一道進行。(生物谷Bioon.com)
doi:10.1038/nrg3219
PMC:
PMID:
Functional genomics: Complexities of occupancy and sequence
Mary Muers
Variation in non-coding regions of the genome is increasingly being implicated in inter-individual variation in complex traits, including disease susceptibility, but interpreting the functional effects of non-coding variation is particularly challenging. Two recent papers that have systematically studied the effects of SNPs on transcription factor binding show that although some trends in the relationship between sequence and binding are as expected, predicting the effects of specific SNPs will be difficult.